Identificacion, Estimacion y Validacion de Modelos

Estadstica III
Unidad 2. Identificacin, estimacin y validacin de modelos
Universidad Abierta y a Distancia de Mxico
Licenciatura en Matemticas
6 Semestre
Estadstica III
Unidad 2. Identificacin, estimacin y validacin de

modelos
Clave:
05143633/06143633
Ciencias Exactas, Ingenieras y Tecnologas |Licenciatura en Matemticas

1
Estadstica III
ndice
Unidad 2. Identificacin, estimacin y validacin de modelos .............................................. 3
Presentacin de la unidad ........................................................................................................ 3
Propsitos de la unidad ........................................................................................................... 3
Competencia especfica ........................................................................................................... 3
2.1. Estimacin de la media y momentos de 2o orden............................................................ 3
2.1.1. Estimacin del valor esperado ................................................................................... 4
2.1.2. Estimacin de la sucesin de autocorrelacin ......................................................... 5
2.1.3. Estimacin de la sucesin de autocorrelacin parcial ............................................. 9
2.2. Uso de las sucesiones de autocorrelacin para identificar modelos .......................... 11
2.2.1. Identificar el modelo MA(q) usando la ACF ............................................................. 11
2.2.2. Identificar el modelo AR(p) usando la PACF ........................................................... 13
Actividad 1. Autocorrelacin muestral y estimacin mximo verosmil ............................. 15
2.3. Estimacin de parmetros autorregresivos y de promedios mviles .......................... 15
2.3.1. Mtodo de mxima verosimilitud ............................................................................. 15
2.3.2. Otros estimadores ..................................................................................................... 22
2.4. El problema de prediccin .............................................................................................. 34
2.4.1. Teorema de Proyeccin ortogonal ........................................................................... 35
Actividad 2. Uso de software. ................................................................................................ 36
2.4.2. Las ecuaciones de prediccin .................................................................................. 36
2.5 Validacin de modelos ..................................................................................................... 40
2.5.1. Anlisis de residuales ............................................................................................... 40
2.5.2. Pruebas de normalidad, no correlacin y heterocedasticidad ............................... 44
Actividad 3. Identificacin y estimacin de modelos ........................................................... 45
Autoevaluacin ....................................................................................................................... 45
Evidencia de Aprendizaje. Reporte de modelacin .............................................................. 46
Cierre de la unidad.................................................................................................................. 46
Referencias bibliogrficas ..................................................................................................... 47

2
Estadstica III
Presentacin de la unidad
En esta unidad estudiars mtodos para identificar modelos posibles para un conjunto de
observaciones 1 , 2 , , . Para ello, se comienza por estudiar cmo estimar la media y la
sucesin de autocorrelacin de un proceso estocstico estacionario de segundo orden. Una vez
propuestos estos estimadores, se revisarn propiedades estadsticas de los mismos; en
particular se notar que para tamaos de muestra grandes, estos estimadores estn
cercanos a los valores de los parmetros del proceso.
Los estimadores de la sucesin de autocorrelacin servirn para identificar modelos dentro de
la clase de procesos (, ) estudiada en la unidad anterior, los cuales podran ser tiles
en la descripcin de las observaciones.
Una vez identificados estos modelos, aprenders a estimar los parmetros que los caracterizan
usando los datos.
Por ltimo, estudiars cmo validar el modelo propuesto para los datos analizando sus
residuales.
Propsitos de la unidad
Al trmino de esta unidad logrars:
Establecer mtodos para estimar la media y la sucesin de autocorrelacin de un

proceso estacionario de segundo orden.
Utilizar el estimador de la sucesin de autocorrelacin para identificar modelos dentro
de la clase ARMA(, ) que podran describir los datos.
Establecer mtodos para validar los modelos identificados.
Competencia especfica
Estimar los parmetros autorregresivos y de promedios mviles para llevar a cabo pruebas
estadsticas y validar el modelo mediante herramientas computacionales estadsticas.
2.1. Estimacin de la media y momentos de 2o orden

3
Estadstica III
Un proceso estacionario de segundo orden { } se caracteriza, de acuerdo con sus momentos
de segundo orden, por su media y su funcin de autocovarianza (). La estimacin de , y la
sucesin de autocorrelacin = a partir de observaciones 1 , , , desempea un papel

0
crucial en problemas de inferencia y, en particular, en el problema de la construccin de un

modelo apropiado para los datos. En este tema se examinan las propiedades de la media y de
la sucesin de autocorrelacin, y () respectivamente.
2.1.1. Estimacin del valor esperado

El estimador de momentos de la media de un proceso estacionario es la media de la muestra.
=
1 + +
,
(1 )
ste es un estimador insesgado de , ya que:

1
1
1
( ) = ( (1 + + )) = ((1 ) + + ( )) = =
El error cuadrtico medio de es:

( ) = [( )2 ] =
1
= 2 ( , )
=1 =1
= 2 ( | |) ( )
=
= 1 (1
=
( 2)
||
) ()
Ahora bien, si () 0 cuando , el lado derecho de (2) converge a cero cuando ,

as que converge a en medida cuadratica. Si
= |()| < , de (1) se tiene que
lim ( ) = || < (). De lo anterior se tiene la siguiente proposicin.
Proposicin 2.1.1. Si { } es una serie de tiempo estacionaria con media y funcin de

autocovarianza (), entonces cuando ,
( ) = [( )2 ] 0,
2 (
) () ,
| |<
() 0
|()| <
=

4
Estadstica III
Para hacer inferencias acerca de se utiliza la media muestral ; en ocasiones es necesario
conocer la distribucin o una aproximacin a la distribucin de . Si la serie de tiempo es
Gaussiana, entonces:
1/2 ( )~ (0, (1
| |<
||
) ())
(Vase: Brockwell, J. y Davis. (2009). Time series: Theory and Methods. New York: SpringerVerlag, p. 220.)
No es difcil construir intervalos de confianza exactos para utilizando este resultado si () es
conocido. Los intervalos de confianza aproximados requieren estimar () usando las
observaciones.
Para muchas series de tiempo, en particular para los modelos lineales y los modelos ,
es aproximadamente normal con media y varianza 1 || < () para grande. Un
intervalo de confianza aproximado del 95% de es:
( 1.96 1/2 / )
(3)
donde = ||< (). Por supuesto, generalmente no es conocido, por lo que debe ser
estimado a partir de los datos. Para los procesos sta es una buena aproximacin a la
para grande.
2.1.2. Estimacin de la sucesin de autocorrelacin

Aunque la autocorrelacin terica es til para describir las propiedades de modelos hipotticos,
desde un punto de vista prctico los anlisis deben realizarse con los datos de la muestra. Esta
limitacin significa que la muestra 1 , , , se usar para la estimacin de la media,
autocovarianza y funciones de autocorrelacin.
La funcin de autocovarianza terica se estima por la funcin de autocovarianza muestral que
ser estudiada en las siguientes secciones.
Definicin 2.1.2.1. [Autocovarianza]
La funcin de autocovarianza se define como el segundo momento.
(, ) = ( , ) = [( )( )],

5
(4)
Estadstica III
Para todo y , cuando no exista una posible confusin sobre a qu serie se refiere, se va a
omitir el subndice y escribir (, ) como (, ).
Ntese que (, ) = (, ) para todos los puntos en el tiempo y . La autocovarianza mide
la dependencia lineal entre dos puntos en la misma serie observada en diferentes tiempos.
Recuerda que en la estadstica clsica, cuando (, ) = 0, y no estn relacionadas
linealmente, pero todava puede existir alguna estructura de dependencia entre ellas. Sin
embargo, si y tienen distribucin normal bivariada y (, ) = 0, esto garantiza su
independencia. Es claro que, para = , la autocovarianza se reduce a la varianza (que se
supone finita), ya que
(, ) = [( )2 ] = ( )
Definicin 2.1.2.2. [Funcin de autocorrelacin]
La funcin de autocorrelacin (ACF) se define como
(, ) =
(, )
(, )(, )
(5)
El ACF mide la previsibilidad lineal de la serie en el tiempo , es decir , utilizando solamente el

valor de . Se puede demostrar fcilmente que 1 (, ) 1 utilizando la desigualdad de
Cauchy-Schwarz. Si es posible predecir perfectamente usando los a travs de una
relacin lineal = 0 + 1 , entonces la correlacin ser 1 cuando 1 > 0, y -1 cuando 1 < 0.
Por lo tanto, se tiene una medida aproximada de la capacidad para pronosticar la serie en el
tiempo del valor en tiempo .
Recordando las ecuaciones (9) y (10) de la unidad 1, que para un proceso estacionario de
segundo orden
(, ) = [ , ]
= [0 , ]
= [ , 0 ]
y la covarianza entre y depende de y slo a travs de ( ). Como consecuencia,
para un proceso estacionario de segundo orden es posible definir la sucesin de
autocorrelacin:
= [ , + ],
, tales que +
donde es el ndice de tiempo del proceso. Asimismo, se define la sucesin de autocorrelacin

(ACF) del proceso como

6
Estadstica III

,
0
= 0, 1, 2,
La ACF { } es tal que 0 = 1 y por la desigualdad de Cauchy-Schwarz | | 1, .

Definicin 2.1.2.3. [Sucesin de autocovarianza muestral]
La sucesin de autocovarianza muestral para las observaciones 1 , est definida como
||
(+|| )( ),
< < .
=1
Se observa que = para < < .

Del mismo modo, para cualquier conjunto de observaciones x1 , , , la ACF muestral se
calcula de la siguiente manera:
=
.
0
Como ya se discuti la estimacin de la media ( ) para un proceso estacionario de segundo

orden, se tiene la convencin de asumir que en adelante los procesos con los que se trabajan
tienen media cero, es decir
= ( ) = 0.
Lo anterior se puede hacer, ya que de no ser sta la situacin (es decir 0), entonces se
hace:
= ( ) ,
y se tiene que ( ) = 0.
En particular, al nivel de las observaciones 1 , , , se suele considerar las observaciones
centradas 1 = 1 , 2 = 2 , , = y se trabaja con stas para calcular
la ACF muestral y la sucesin de autocorrelacin parcial muestral, as como los estimadores de
los parmetros del modelo propuestos.
Un ejercicio comn en los textos es probar que = ; es decir, que es invariante ante el
hecho de centrar las observaciones. Cuando realices la Actividad 1, observars esta propiedad.
La teora de distribuciones asintticas para la sucesin { } dice cmo determinar cuando un
coeficiente no es estadsticamente significativo.

7
Estadstica III
En libros como Shumway, R. y Stoffer, D. (2010). Time Series Analysis and Its Applications: with
R examples y Brockwell, J. y Davis, A. (2009). Time series: Theory and Methods, se demuestra
que si 50, entonces:

~(0,1),
1
donde (0,1) es la distribucin normal estndar. Usando este resultado, se puede graficar
primeramente los valores { } contra las . En la misma grfica se trazan dos lneas paralelas
al eje de las abscisas y tales que pasen por los puntos (0,1.961) y (0, 1.961).
Aquellos valores de { } que caen dentro de la banda delimitada por estas lneas no resultan
significativos; es decir, se tiene que realizar la prueba de hiptesis estadstica:

0 : = 0
1 : 0
y sucede que la estimacin est dentro de la banda mencionada, entonces no se rechaza 0

(al 95% de confianza ).
Ejemplo.
Considera el siguiente correlograma muestral
Fig 1.Correlograma Muestral
Para las correlaciones { } calculadas de las observaciones 1 , , , el grfico de la figura 1

estara indicando en el sentido estadstico que = 0 3. Mientras 1 y 2 son diferentes
de cero.
Supn que la figura 1 fue obtenida al calcular { }, para unas observaciones 1 , , . En tal
caso se estar identificando que dentro de la clase de procesos MA, el modelo que ayudara a
describir los datos es un MA(2).

8
Estadstica III
2.1.3. Estimacin de la sucesin de autocorrelacin parcial
Para los modelos MA(q), el ACF ser cero para las mayores que en valor absoluto.
Adems, dado que 0, el ACF no se anula para = . Por lo tanto, como se explic en el
ejemplo de la seccin 1.4. de la unidad 1, el ACF proporciona una considerable cantidad de
informacin acerca del orden de la dependencia cuando el proceso es de medias mviles. Si el
proceso, por otro lado, es ARMA o AR, el ACF dice poco acerca de los rdenes de la
dependencia. Por lo tanto, vale la pena estudiar una funcin de correlacin que se comporte
como el ACF de modelos MA, pero que sea adecuada para los modelos AR, a saber, la
sucesin de autocorrelacin parcial (PACF).
Para motivar esta idea, se propone un modelo casual AR (1), = 1 + . En la seccin
1.4. de la unidad 1 se vio que ,
( , + ) = 2 ( || 1 2 ), = 0, 1, 2,
La covarianza entre y 1 no es cero, sta vale ( , 1 ) = 2 1 2, adems
[1 , 2 ] = [ , 1 ]. De esta forma, en un proceso AR(1) depende de 1 y 1
depende de 2 . Por lo tanto depende de 2, esto no sucede en un proceso MA(1).
Suponga que se rompe la cadena de dependencia mediante la eliminacin (o la salida parcial)
del efecto 1 . Es decir, se puede calcular la correlacin entre 1 y 2 1 , ya
que se tiene la correlacin entre y 2 con la dependencia lineal de cada uno sobre 1
eliminada. De este modo se ha roto la cadena de dependencia entre y 2 . En efecto,
( 1 , 2 1 ) = ( , 2 1 )
= [ , 2 + 3 + 2 4 + ]
[ , 1 + 2 + 2 3 + ]
=0+0=0
Para el clculo se us la casualidad del proceso { } . Por lo tanto, la herramienta que se
necesita es autocorrelacin parcial, que es la correlacin entre y , donde fue eliminado el
efecto lineal de las variables del proceso, tales que
<<
En la ecuacin (43) de la seccin 1.5. en la unidad 1 se defini la sucesin de autocorrelacin
parcial { } . La ecuacin (41) de esta unidad plantea esta correlacin como: la correlacin
entre +1 y 1 , habiendo eliminado el efecto lineal de las variables 2 , , sobre +1 y
sobre 1 .
Dadas observaciones 1 ,. . . , , se puede estimar { } como sigue:

9
Estadstica III
Definicin 2.1.3.1. [Sucesin de autocorrelacin parcial muestral]
La sucesin = 1,2, de auto-correlacin parcial (PACF) muestral de una serie estacionaria,
{ } denotada , para = 1,2, es
11 = 1
22
33
1
|
1
=
1
|
1
1
|1
= 2
1
|1
2
1
1
1
1
1
1
1
|
2
,
1
|
1
1
2 |
3
, , .
2
1 |
1
donde 2 es la sucesin de auto correlacin muestral y || denota el determinante de la matriz

.
Otra forma de definir el PACF muestral es la siguiente.
Para cualquier conjunto de observaciones 1 , 2 , , , la PACF () viene dada por
(0) = 1
y
() = ,
1,
donde es el ltimo componente del vector

,
= 1
(5)
donde
0
= ( 1
1
0
2
1
1
2
)

10
Estadstica III
1
2
= (
)
_
Compara esta definicin de con la ecuacin (42) de la unidad 1.
2.2. Uso de las sucesiones de autocorrelacin para identificar modelos

En este tema revisars el uso de las sucesiones { } y { } para identificar qu modelos
ARMA podran servir para los datos.
2.2.1. Identificar el modelo MA(q) usando la ACF

Para un proceso MA(), = () , donde () = 1 + 1 + + , el proceso es
estacionario con media; en la unidad 1 se vio que
( ) = ( ) = 0,
=0
donde se escribi 0 = 1, la sucesin autocovarianza de { } es:

= [+ , ]
= [( ) ( + )]
=0
=0
9[]
2 +||
=0
{0
|| >
Recuerda que = , por lo que slo se trabaja con valores de > 0. Adems, de la unidad 1
se sabe que se anula si || > es una caracterstica de los modelos MA(q). Dividiendo por
0 ajustado a la ACF de un MA(q):
=0 +
= {1 + 12 + + 2
0
. . .

11
Estadstica III
Observacin: usando la informacin recabada 1 , 2 , , x de una serie de tiempo, una forma
de identificar un modelo para los datos es que su ACF muestral se comporte como la ACF
terica de un modelo conocido. En particular, si la ACF muestral h es significativamente
diferente de cero para 0 y despreciable para > . Entonces un modelo MA(q) sera
adecuado para los datos. Para ilustrar lo anterior, la figura A) muestra una realizacin de un
proceso MA(2) simulado usando el paquete R.
Figura 2. A) Grafica. B) ACF de MA(2)
La figura muestra la ACF muestral { } calculada a partir de estas observaciones.

12
Estadstica III
2.2.2. Identificar el modelo AR(p) usando la PACF
El modelo implica + = =1 + + + , donde las races de () estn fuera del crculo

unitario. Cuando > , la regresin de + en +1 , +2 , , +1 es:
+ = +.
=1
Por lo tanto, cuando > ,

= (+ + , ) = (+ , ) = 0
ya que, por causalidad, slo depende de +1 , +2 , recuerda la ecuacin
(2.1.3.2). Cuando , se puede probar que pp no es cero. Cuando 1 ,. . . , , son
observaciones de un proceso AR(p) causal, el comportamiento asinttico { }; es tal que
(0,1)
(Vase Shumway y Stoffer, 3a ed., p. 122.)
Adems utilizando las propiedades de la sucesin { } revisadas en el tema anterior, un
procedimiento para utilizar la PACF muestral { } de (5) sera calcular y graficar la sucesin
{ } . Para determinar qu valores no son estadsticamente significativos, se trazan dos
lneas rectas paralelas al eje de las abscisas y tales que pasen por los puntos (0,1.96/) y
(1.96/, 0). Aquellos valores de la sucesin { } delimitados por tales lneas resultan no
significativos; es decir, si se tiene que realizar la prueba de hiptesis estadstico
0 = = 0
vs
1 = 0
y la estimacin est dentro de la banda mencionada, entonces no se rechaza 0 (al 95% de

confianza), esto se puede observar en la figura 3, donde se muestra la grfica y su PASF para
un proceso AR(2).

13
Estadstica III
Figura 3. A) Grafica B)PACF para un proceso AR(2)
La razn por la cual el valor distribucional asinttico para tamaos de muestra grandes de
estimador . Para tamaos de muestra tales que 0, se sabe que los estimadores
{ } de { } , se distribuyen de forma independiente, con media ( ) = 0 y con
( ) 1 ,
cuando
> ,
En libros como Shumway, R. y Stoffer, D. (2010). Time Series Analysis and Its Applications: with
R examples y Brockwell, J. y Davis, A. (2009). Time series: Theory and Methods se puede
profundizar ms en el tema.

14
Estadstica III
Actividad 1. Autocorrelacin muestral y estimacin mximo verosmil
El propsito de esta actividad es que relaciones los modelos de ARMA y resuelvas problemas
de procesos estacionarios utilizando la autocorrelacin muestra y estimacin de mximo
verosmil, para ello:
2.3. Estimacin de parmetros autorregresivos y de promedios mviles

Habiendo seleccionado un modelo en la clase ARMA(p,q) para las observaciones 1 ,
usando los mtodos vistos en los temas anteriores, en este tema se estimarn los parmetros
autorregresivos = (1 , , ), de promedios moviles = (1 , ) y de varianza 2 .
2.3.1. Mtodo de mxima verosimilitud

La determinacin de un modelo apropiado ARMA(p,q) para representar un modelo para la serie
de tiempo estacionaria para las observaciones, implica una serie de problemas
interrelacionados incluyen la eleccin de y (seleccin de orden ) y estimacin de la media,
los coeficientes = (1 ) , = (1 ) , y la varianza de ruido blanco 2 . La validacin

final del modelo depende de una variedad de pruebas de bondad de ajuste.
Este captulo se dedica principalmente al problema de la estimacin de los parmetros de
= (1 ) , = (1 ) y 2 , donde y se suponen conocidos.

Como se explic en el tema 2.1.2., se asume que los modelos de ARMA propuestos para los
datos tienen media ( ) = 0. Para que las observaciones 1 , sean coherentes con este
supuesto, se usarn las observaciones centradas 1 , , donde = y =
1
=1( ). Los estimadores { } y { } son invariantes ante esta transformacin, y por
ende los valores de y propuestos (los modelos ARMA(p,q) propuestos) para los datos
tampoco cambian para las observaciones centradas. De lo anterior, se asumir que se trabaja
con procesos ARMA(p,q) con ( ) = 0; Si el modelo ajustado a los datos de media corregida
es :
() = () , { }~(0, 2 ),
entonces el modelo correspondiente para la serie estacionaria original { } se encuentra
sustituyendo para cada t por , donde = 1 =1 es la media muestral de los datos
originales, tratados como una constante fija.
Cuando se conocen p y q, los estimadores de y se pueden encontrar, imaginando que los
datos son observaciones de una serie de tiempo estacionaria Guassiana y maximizando el

15
Estadstica III
verosmil con respecto a los + + 1 parmetros 1 , , , 1 , , y 2 . Los estimadores
obtenidos por estos procedimientos son conocidos como estimadores de mxima verosimilitud
(o de mxima verosimilitud Gaussiana).
Supn que { } es un proceso de ruido blanco con distribucin normal media cero y varianza 2 ,
se obtiene la funcin densidad conjunta de los errores aleatorios:
(++1 , ++2 , . . . , ) =
( )
2
(2)
++
exp {
=++1
2
}
22
(6)
por lo tanto, si se considera a la variable

= ( ),
la expresin
() ( ) = 0 + () ,
implica que
= 1 1 0 + 1 1 + + ,
esto permite obtener la funcin de densidad conjunta de ++1 , ++2 , , a partir de (6)
(++1 , ++2 , , ) = (++1 , ++2 , . . . , )
=+++1
= (++1 , ++2 , . . . , ) =
(2)( )/2 ++
exp {
(1 1 0 +1
1 ++
=++1
(7)
/22 }
La funcin de densidad (6) permite calcular la probabilidad de la distribucin normal multivariada
una vez que se conocen los parmetros = (1 , , ) , 0 , = (1 , . . . ) y 2 ; ahora bien, lo

~
~
16
Estadstica III
= (++1 , ++2 ,. . . , ) y lo que se desconoce es , 0 ,

~
~
y 2 , por ello se considera que (7) es una funcin de verosimilitud de los parmetros, la cual
depende del vector de observaciones , esto es

~
que se conoce en realidad es
++
( , 0 , , 2 | ) = (2)()/2
exp{ ( , 0 , ) /22 }
~
~
~
~
~
(8)
con
( , 0 , ) =
~
~
2 =
=++1
(9)
( 1 1 . . . 0 + 0 + 11 + + )
=++1
dicha funcin de verosimilitud ( , 0 , , 2 | ) debe maximizarse con respecto a los

~
~
~
parmetros para obtener la representacin () ( ) = 0 + () ms apropiada de la
serie { } en estudio.
Para maximizar ( , 0 , , 2 | ), en primer lugar se eligen los valores , 0 y que minimicen

~
~
~
~
~
2
( , 0 , ) y posteriormente se determina el estimador de . Supngase en principio, que ya
~
~
se encontr el valor mnimo (, 0 , ), entonces se procede a maximizar la funcin de

~
~
verosimilitud con respecto a 2 o, equivalentemente, se maximiza al algoritmo de la funcin de
verosimilitud.

(2 , | ; , 0 , ) = log [ (2 , | ; , 0 , )]
~ ~
~ ~
~
~
( , 0 , )
( )
=
~ 2 ~ .
2[log(2) log(2 )]
2
(10)
Para lograr dicha verosimilitud, considera la ecuacin de mximo verosmil

+ + (~, 0 , ~)
| 2 2=
+
,
2 =
22
que produce

17
(11)
Estadstica III
( , 0 , )
~
~
2 =
,
(12)

y que, como puede verificarse, produce un mximo de (2 , | ; , 0 , ); de esta manera
~ ~
~
puede usarse (2.3.1.5) como el estimador de 2 , pero en la prctica se suele usar el estimador
insesgado (2.3.1.7), que se denota igualmente por 2 , y se considera la correlacin por grados
de libertad usados en estimar a todos los parmetros del modelo
( , 0 , )
~
~
2 =
.
1
(13)
El problema de maximizar (, 0 , , 2 | ), se reduce entonces a maximizar ( , 0 , ).

~
~
~
~
~
Como ejemplo de las dificultades que se encuentran al tratar de minimizar ( , 0 , ),

~
~
considera el caso ms simple de un proceso ARMA, que corresponde al del modelo MA(1): =
1 con = ( ) y [( )] = 0. Nota que puede ser expresado como:
= + 1
= + 1 + 2 2
=
= + 1 + 2 2 + + 1 1 + 0 .
aqu se desconoce 0 , pero se supone que su distribucin es (0, 2 ), resulta razonable
entonces tomar 0 = 0 para obtener
() = ( + 1 + 2 2 + + 1 1 )2 ,
=1
con esta expresin, se pude pensar en maximizar () al encontrar el valor que fue solucin
de
()
| =0
=
pero esta ecuacin no resulta ser lineal en y no tiene solucin analtica. Por consiguiente,
deber utilizarse algn procedimiento numrico para encontrar el mnimo de (); dicho
procedimiento podra consistir en evaluar () en diversos puntos de dentro de la regin

18
Estadstica III
admisible 1 < < 1, de esta manera se obtendra una grfica como la de la figura 4. De una
grfica como sta sera posible estimar a con la exactitud deseada.
Figura 4. Grfica hipottica de () para determinar
, 0 y basado en el
~
~
algoritmo Marquardt (1963), que es utilizado por varios paquetes de cmputo estadsticos y que
permiten obtener no slo estimaciones puntuales de los parmetros, sino tambin intervalos de
confianza. Dicho mtodo tiene como fundamento un desarrollo en series de Taylor que linealiza
a (obtenida de (2.3.1.2) condicionada en que se conocen los valores muestrales

y los
~
valores iniciales de los parmetros , 0 y . Los valores iniciales sern recogidos con el
~
objetivo final de maximizar ( , 0 , ); el proceso iterativo termina cuando se logra

~
~
convergencia, lo cual sucede, por ejemplo, si el cambio iterativo en cada parmetro no es
mayor que un cierto valor pequeo, fijado de antemano. Debe tenerse en consideracin; sin
embargo, que el proceso de estimacin puede ser sensible a los valores iniciales de los
parmetros, de forma tal que si dichos valores no son cercanos a los valores definidos, puede
que no sea la convergencia, o bien, a que el proceso iterativo no pone restricciones sobre los
valores de los parmetros estimados que se encuentran fuera de la regin admisible.
Box y Jenkins (1970) sugieren un mtodo de estimacin no lineal para
La maximizacin es no lineal en el sentido de que la funcin a maximizar no es una funcin

cuadrtica de parmetros desconocidos, por lo que los estimadores no pueden encontrarse por
medio de resolver un sistema lineal de ecuaciones, sino que son encontrados a travs de la
bsqueda numrica para el mximo de las verosimilitudes superiores.
Supn que { } es una serie de tiempo Gaussiana con media cero y covarianza en funcin de
(, ) = ( , ). Permite n = (1 , , ) y n = (1 , , ) donde 1 = 0 y
= ( |1 , , 1 ) = 1 , 2. Permite que n denote a la matriz de covarianzas como
n = ( ) y asume que n es no singular.
La verosimilitud de n es

19
Estadstica III
n
1
1
L(n ) = (2)2 (det n )2 exp ( n n 1 n )
2
(14)
Como se puede mostrar, el clculo directo de los determinantes de n y n 1 puede evitarse

expresando stos en trminos de los errores de prediccin paso a paso X j j y sus varianzas
1 , = 1, , , ambos son fcilmente calculables recursivamente del algoritmo de
innovaciones.
Permite que , = 1, , ; = 1,2, , denote los coeficientes obtenidos cuando el algoritmo de
innovaciones es aplicado para la funcin de autocovarianza de { }, y permite que C sea una
matriz triangular inferior . De esto se obtiene la identidad
= C ( )
(15)
Tambin se conoce que los componentes de son no correlacionados. Por

consecuencia, por la definicin de , se tiene la diagonal de la matriz de covarianzas
D = {0 , , 1 }.
que concluye
= C D C
(16)
de (2) y (3) se ve que

X n1 X
)Dn (X X
) =
= (X X
)2
=1(X X
1
(17)
y
= ( C )2 ( D ) = 0 1 1
(18)
La verosimilitud (1) del vector , por esto se reduce a

( ) =
1
(2) 0 1
)2
1 =1(X X
}
2
1
(19)
Si es expresada en trminos de un nmero finito de parmetros desconocidos 1 , ,

(como es el caso cuando { } es un proceso ARMA(p,q)), el estimador por mxima verosimilitud
de los parmetros son esos valores que maximizan para el conjunto de datos dados. Cuando
1 , 2 , , son iid, esto es conocido bajo las hiptesis y para grande, esos estimadores de
mxima verosimilitud son aproximadamente normalmente distribuidos con varianzas que son
por lo menos tan pequeas como aquellos otros estimadores asintticamente distribuidos
normalmente.

20
Estadstica III
Incluso si { } no es Gaussiana, esto an tiene sentido para considerar la ecuacin (6) como
una medida de bondad de ajuste del modelo de los datos y para escoger los parmetros
1 , , , en un camino tal como la maximizacin (6). Debe hacer referencia siempre a los
estimadores 1 , , obtenidos como estimadores de mxima verosimilitud, incluso cuando { }
no es Gaussiana. Sin tomar en cuenta la distribucin conjunta de 1 , , , se debe hacer
referencia a (6) y a sus equivalencias algebraicas (6) como la verosimilitud (o verosimilitud
Gaussiana) de 1 , , . Una justificacin para usar estimadores de mxima verosimilitud
Gaussiana de los coeficientes de ARMA es que la distribucin muestral grande de los
estimadores es la misma para {Z }~(0, 2 ), sin tener en cuenta si {Z } es o no Gaussiana.
La verosimilitud para los datos de un proceso ARMA(p,q) es fcilmente calculada de las
innovaciones formadas de la verosimilitud de la ecuacin (6) evaluando los predictores paso a
paso +1 y la correspondiente media cuadrada del error .
(+1 +1 ), 1 n < ,
=1
(20)
1 + + +1 + (+1 +1 ),
{
=1
y
+1 )2 = 2
(+1 +1 )2 = 2 (+1
(21)
donde y son determinados por el algoritmo de innovaciones con = max(, ).

Sustituyendo en la expresin general (18), se obtiene la verosimilitud Gaussiana para un
proceso ARMA como sigue:
(, , 2 ) =
1
(2 2 ) 0 1
)2
1 =1(X X
}
2 2
1
(22)
Diferenciando parcialmente (, , 2 ) con respecto a 2 y notando que y son

independientes de 2 , se encuentra que los estimadores de mxima verosimilitud , y 2
satisfacen las siguientes ecuaciones:
2 = 1 (, )
(23)
donde
(, ) =
)2
=1(X X
1
y , son los valores de , que minimizan

21
(24)
Estadstica III
(, ) = ln(
(, ) +
(25)
=1
La minimizacin de (, ) debe hacerse numricamente.

Las estimaciones por mnimos cuadrados y de y obtenidas por la minimizacin de la
funcin , como se define en (11), en lugar de cmo se defini en (12), lleva a que el modelo
sea causal e invertible. La estimacin por mnimos cuadrados de 2 es
2 =
(, )
El criterio AICC selecciona , , y para minimizar

= 2 ( , ,
( , )
2( + + 1)
)+
Para cualesquiera y es claro que la AICC se minimiza cuando y son vectores que
minimizan 2 ( , ,
( , )
); es decir, los estimadores de mxima verosimilitud. Las
decisiones finales con respecto a la seleccin de orden deben hacerse por consiguiente con
base en los estimadores de mxima verosimilitud.
Para una muestra de tamao grande el estimador de mxima verosimilitud de
(1 , , , 1 , , ) es aproximadamente distribuida normalmente con media y matriz de
covarianza [1 ()], la cual puede ser aproximada por 2 1 (), donde es la matriz Hessian
+
[ 2 ()/ ],=1 .
2.3.2. Otros estimadores

En esta seccin se considerarn cuatro tcnicas para la estimacin preliminar de los
parmetros = (1 , , ) , = (1 , , ) y 2 para 1 , , observaciones del proceso
causal ARMA(p, q) definido por
() = () , { }~(0, 2 )

22
(26)
Estadstica III
Los mtodos Yule-Walker y Burg aplicados para el ajuste de modelos autorregresivos puros.
(Aunque lo anterior puede adaptarse a modelos con > 0, esto es menos eficiente que cuando
= 0).
Para el algoritmo de Burg de modelos de autorregresin pura, usualmente da verosimilitudes
ms altas que las ecuaciones de Yule-Walker. Para modelos puros de promedios mviles, el
algoritmo de innovaciones frecuentemente da verosimilitudes ligeramente mayores que el de
Hannan-Rissanen. Para modelos mixtos (es decir aquellos con > 0 y > 0), el algoritmo de
Hannan-Rissanen es usualmente muy exitoso encontrando modelos causales (los cuales son
requeridos para inicializar la maximizacin de verosimilitud).
Estimacin Yule-Walker
Supn que { } es un proceso AR(p) casual, y tal que ( ) = 0, donde { } es ruido blanco
con ( ) = 0 para todo t:
1 1 = ,
(27)
para un entero 0, se multiplica (27) de ambos lados por y se calcula el valor esperado
[ ] 1 [ 1 ] [ ] = ( ).
Es decir
1 1 = (( ) ),
(28)
=0
donde en el lado derecho de la ecuacin se us el supuesto de que { } es causal (Definicin 6

de la unidad 1). Nota que para la definicin de la causalidad 0 0. La esperanza en el lado
derecho de (28) es vlida
( ) = [ ],
=0
=0
y usando { } es un proceso de ruido blanco con = 0 y ( ) = 2

0
[ ] = { 2
si
si 0.
= = 0.
Concretamente

23
Estadstica III
2
[ ] = {0
0
=0
si = 0
en otro caso.
Considerando = 0,1, , en (28) se obtienen ecuaciones con incognitas

0 1 1 . . .
1 1 0 . . . 1
1 1 . . . 0
= 2
=0
=
= 0,
(29)
asumiendo condiciones de los teoremas que lo permiten

2 = 0 [1 1 + 2 2 +. . . + ]
1 = 1 0 + 2 1 + . . . + 1
2 = 1 1 + 2 0 + . . . + 2
=
1 = 1 0 + 2 1 + . . . + 1 .
(30)
Con la notacin matricial

1
1
= ( ) ; = ( )
y p la matriz dimensional con entrada dada por , el sistema se escribe como:

= p ,
(31)
y
2 = 0 .
Estas ecuaciones pueden ser usadas para determinar (0), , () de 2 y . O bien para
determinar como sigue: si se reemplazan las covarianzas (), = 0, , que aparecen en
(30) y (31) por la correspondiente covarianza muestral (), se obtiene un conjunto de
ecuaciones para los llamados estimadores Yule-Walker y 2 de y 2 , especficamente,
=
p
(32)

24
Estadstica III
y
=
p
(33)
donde
p = [( )],=1 y = ((1), , ())
Si (0) > 0, entonces m es no singular para toda = 1,2, , por lo que se puede reescribir las
ecuaciones (32) y (33) como las ecuaciones de Yule-Walker de la siguiente manera:
= (1 , , ) = 1
(34)
2 = (0)[1 1 ]
(35)
donde
= ((1), , ()) =
(0)
.
(0)
Con definida como (34), sta puede mostrarse como 1 1 0 para || 1, y

por consiguiente el modelo ajustado 1 1 = , { }~(0, 2 ) es causal.
Las autocovarianzas (), = 0, , del modelo ajustado por tanto satisfacen la ecuacin
lineal + 1
0, = 1, ,
() 1 ( 1) ( ) = { 2
,
=0
Sin embargo, de las expresiones (22) y (23) se observa que la solucin de estas ecuaciones es
() = (), = 0, , ,
dado que las autocovarianzas del modelo ajustado en los residuos 0,1, , coinciden con las
correspondientes autocovarianzas muestrales.
El argumento del prrafo anterior muestra que para toda matriz de covarianza no singular de la
+1
forma p+1 = [( )],=1 hay una AR(p) de la cual las autocovarianzas en los residuos
0,1, , son (0), , (). (Los coeficientes requeridos y la varianza del ruido blanco se
()
encuentran en la expresiones (19) y (20) de remplazar () por (0) , = 0, , , y de (0) =

(0).) Sin embargo, no podra ser un proceso MA(p) con esta propiedad.
Esto es frecuentemente el caso de los estimadores de momentos; es decir, estimadores que
(como ) son obtenidos igualando momentos tericos con momentos muestrales, teniendo
varianzas mucho ms altas que los estimadores obtenidos por mtodos alternativos como

25
Estadstica III
mxima verosimilitud. Sin embargo, los estimadores de Yule-Walker de los coeficientes
1 , , de un proceso AR(p) tienen aproximadamente la misma distribucin que las muestras
grandes, como la correspondiente de la estimacin por mxima verosimilitud.
Para una muestra suficientemente grande de un proceso AR(p), (, 1 2 p1 ).
Si se remplaza 2 y p por sus estimaciones 2 y p , se puede usar este resultado para
encontrar regiones de confianza para y cada componente como en las expresiones (24) y
(25).
En la prctica no se sabe el verdadero fin del modelo de la generacin de los datos. De hecho,
por lo general ser el caso de que no existe un modelo AR cierto, en cuyo caso nuestro objetivo
es simplemente encontrar uno que represente los datos de forma ptima en algn sentido. Dos
tcnicas tiles para la seleccin adecuada de un modelo AR son las siguientes. La segunda es
ms sistemtica y se extiende ms all de la clase limitada de modelos autorregresivos puros.
Definicin 1. [El modelo ajustado Yule-Walker AR(m) ]
Es:
1 1 = , { }~(0, )
donde
1
= (1 , , ) =
y
1
= (0)[1
]
(36)
(37)
(38)
En ambos enfoques para ordenar la seleccin se tiene que ajustar los modelos AR de
incrementos graduales con el fin de obtener los datos. Aqu es posible utilizar exactamente el
mismo esquema del algoritmo de Levinson-Durbin para resolver las ecuaciones de Yule-Walker
(22) y (23), con la nica diferencia de que las covarianzas en (20) y (21) se sustituyen por sus
equivalentes de la muestra.
Bajo el supuesto de que el orden del modelo ajustado es el valor correcto, se puede utilizar la
distribucin asinttica de para obtener regiones de confianza aproximadas con muestras
grandes para el verdadero coeficiente del vector y para sus componentes individuales .
2 ()
Por lo tanto, si 1
denota el cuantil (1 ) de la distribucin chi-cuadrada con grados de
libertad, entonces para un tamao grande de la muestra , la regin
2 ()}
{ : ( )p n1 1
(39)
contiene con probabilidad cercana a (1 ). De igual modo, si (1) denota el cuantil (1

) de la distribucin normal estndar, y es el j-simo elemento diagonal de p1 , entonces
para n grande el intervalo limitado por
1 1
2
1 n2
2

26
(40)
Estadstica III
contiene con probabilidad cercana (1 ).
Los coeficientes de Yule-Walker 1 , , son precisamente los coeficientes del mejor
predictor lineal de +1 en trminos de { , . , 1 } bajo la hiptesis de que la ACF de { }
coincide con la muestra ACF en los residuos 1, , .
El algoritmo de Burg estima la PACF{11 , 22 , } por medio de minimizar sucesivamente sumas
de cuadrados de los errores de prediccin hacia delante y hacia atrs de un solo paso con
respecto a los coeficientes . Dadas las observaciones {1 , . , } de una serie de tiempo
estacionaria de media cero, { } se define (), = + 1, , , 0 < , que es la diferencia
entre +1+1 y la mejor estimacin lineal de ++1 en trminos de las observaciones
anteriores. Esto puede mostrar que las predicciones de errores hacia atrs y hacia delante
{ ()} y { ()} satisface las recursiones
0 () = 0 () = ++1 , () = 1 ( 1) 1 ()
(41)
() = 1 () 1 ( 1)
(42)
()
La estimacin de Burg 11 de 11 se encuentra a travs de minimizar
1
12
[12 () + 12 ()]
2( 1)
=2
con respecto a 11. Esto da la correspondencia numrica de los valores para 1 () y 1 () y 12 ,

que entonces pueden ser sustituidos por (41) y (42) con = 2. Entonces se minimiza
22
[22 () + 22 ()]
2( 2)
=3
()
con respecto a 22 para obtener la estimacin de Burg 22 de 22 y valores correspondientes

de 2 () y 2 () y 22 . Este proceso claramente puede continuarse para obtener las
()
()2
estimaciones y los valores mnimos correspondientes,
, 1. La estimacin de
los coeficientes , 1 1, en el mejor predictor lineal

+1 = 1 + + 1
Propiedades asintticas de los estimadores de mxima verosimilitud.
Sea { } un proceso ARMA(p,q) casual e invertible

27
Estadstica III
1 1 . . . =
= + 1 1 +. . . + ,
donde { } variables aleatorias idnticamente distribuidas con
[ ] = 0 y [ ] = 2
y los polinomios () y () no tienen ceros en comn.
Sea el estimador de mxima verosimilitud
= (1 ,. . . , , 1 , . .. , )
= ( , )
Si es casual e invertible entonces:
Los estimadores de mnimos cuadrados , son los valores causales e invertibles de y que
minimizan ln(1 (, )) = (, ) 1 1 ln 1 . Debido a la invariabilidad del trmino
1 1 ln 1 , es asintticamente pequeo cuando y los estimadores y tienen la
misma propiedad asinttica como y . Se sigue que { }~(0, 2 ) y () y () son causales
e invertibles sin ceros en comn, entonces
( ) (0, ()),
(43)
donde la matriz de covarianza asinttica () puede calcularse explcitamente como la

siguiente matriz, especficamente para 1 y 1,

() = [

] ,

(44)
donde = ( , 1 ) , = ( , 1 ) y { }, { } son procesos autorregresivos,

() = ,
(45)
() = .
(46)
Para = 0, () = 2 [ ] , para = 0, () = [ ] . Los estimadores de mnimos

cuadrados y tienen el mismo comportamiento asinttico.

28
Estadstica III
Ejemplos.
Si (AR(q)) y = 0, de (44) se tiene que

1
() = 2 [ ] ,
donde () = . Por lo tanto
() = 2 1 ,
donde = ( ) = [ ]
,=1
es (, 1 2 1 ).
En este caso especial = 1 y = 2, esto se puede expresar como 1 en trminos de
, dando los resultados:
AR(1): es asintticamente (, 1 (1 2 )),
AR(2): [
1 22
(1 + 2 )
1
] es asintticamente N ([ 1 ] , 1 [
]).
1 (1 + 2 )
1 22
2
2
La varianza asinttica resulta ser la misma que en Yule-Walker; es decir, = es

asintticamente (, 1 2 1 ). Vase Shumway y Stoffer.
Ahora sea MA(q); si = 0, entonces
1
() = 2 [ ] ,
donde () = . Entonces,
() = 2 [ ],
donde es la matriz de covarianza [ ]
,=1
de procesos autorregresivos
+ 1 1 + + = .
Para el caso de MA(1) y MA(2).
MA(1): es autoresivo (, 1 (1 )),
1 22
1 (1 2 )
MA(2): [ 1 ] es autorregresivo ([ 1 ] , 1 [
]).
1 (1 2 )
1 22
2
2
En el caso de ARMA(1,1) se tiene
29
Estadstica III
2
(, ) = [

]
2
donde 1 = y + 1 = . Calculando, se obtiene

(, ) = [
(1 2 )2
(1 2 )2
(1 )2
] ,
(1 2 )2
donde
1 (1 2 )(1 + )
1
[ ] es autorregresivo ([ ] ,
[
( + )2 (1 2 )(1 2 )
(1 2 )(1 2 )
(1 2 )(1 + )
].)
Estas distribuciones asintticas proporcionan una tcnica general para el clculo de las
regiones de confianza asintticas para y de mxima verosimilitud o estimaciones
de mnimos cuadrados. Esta discusin se puede seguir con detalle en el libro de
Brockwell y Davis.
()
Son encontrados al sustituir las estimaciones , = 1, , para en las recursiones. Las

estimaciones resultantes de , = 1, , son coeficientes estimados del modelo AR(p) de
Burg para los datos {1 , . , }. La estimacin de Burg de la varianza de ruido blanco es el valor
()2
mnimo de
()
encontrado en la determinacin de . El clculo de la estimacin de y
2 descritos son equivalentes a resolver las siguientes recursiones:

Algoritmo de Burg:
(1) = ( 02 ( 1) + 02 ()),
=2
()
2
=
1 ( )1 ( 1),
()
( + 1) =
=+1
()2
(1 ) ()
()2
()2
[(1
) ()]
[2( )]
2 ( + 1) + 12 (),
La distribucin de una muestra grande de los coeficientes estimados para los estimadores de
Burg de los coeficientes de un proceso AR(p) son lo mismo que para los estimadores de YuleWalker, llamado (, 1 2 p1 ).

30
Estadstica III
As como se pueden ajustar modelos autorregresivos de orden 1,2,, para los datos {1 , . , }
a travs de aplicar el algoritmo de Durbin-Levinson para las autocovarianzas muestrales,
tambin se pueden ajustar modelos de promedios mviles:
= + 1 1 + + , { }~(0, )
(46)
para el orden = 1,2, por medio del algoritmo de innovacin. Los vectores de coeficientes
estimados : = (1 , , ) y varianzas de ruido blanco , = 1,2, , se especifican en la
siguiente definicin.
Definicin 2. [El modelo MA(m) de ajuste de innovaciones]
Es
= + 1 1 + + , { }~(0, ),
donde y son obtenidos del algoritmo de innovaciones con ACF remplazada por la PACF
muestral.
Nota 1. Este puede mostrar que si { } es un proceso MA(q) invertible
= + 1 1 + + , { }~(0, 2 )
con (4 ) < , si se define 0 = 1 y = 0 para > , entonces la estimacin de innovacin
tiene las siguientes propiedades de una muestra grande. Si y () es cualquier
1
secuencia de enteros positiva, tal que () , pero 3 () 0, entonces para cada entero
positivo la funcin de distribucin conjunta de
1
2 (1 1 , 2 2 , , )
converge a una distribucin normal multivariada con media 0 y matriz de covarianza =
[ ],=1 , donde
min(,)
(47)
=1
Este resultado permite encontrar los intervalos de confianza aproximados de una muestra
grande para los coeficientes de promedios mviles de la estimacin de innovacin. Por tanto, el
estimador es consistente para 2 en el sentido de que para cada > 0, (| 2 | > )
0 como .

31
Estadstica III
Nota 2. Aunque el ajuste de recursin del modelo de promedios mviles usando el algoritmo de
innovacin es cercano al ajuste de recursin de los modelos autorregresivos usando el
algoritmo Durbin-Levinson, hay una distincin importante. Para un proceso AR(p) los
estimadores de Yule-Walker y Burg son estimadores consistentes de (1 , , ) de tamao
muestral . Sin embargo, para un proceso MA(q) el estimador = (1 , , ) no es
consistente para (1 , , ). Para la consistencia es necesario usar los estimadores
(1 , , ) con () satisfaciendo la Nota 1. La opcin de m para cualquier tamao de la
muestra fija puede hacerse incrementando m hasta el vector (1 , , ) estabilizado. Se
encuentra en la prctica que hay un rango grande de valores de para los cuales las
1
1 2
fluctuaciones en son pequeas comparadas con las estimadas con 2 (=0
)2 , como se
encontr en la expresin (29) cuando los coeficientes fueron reemplazados por cada uno de
sus valores estimados .
Existen tres tcnicas tiles para seleccionar un apropiado modelo MA como se muestra a
continuacin. La tercera es ms sistemtica y se extiende ms all de la clase de modelos
puros de promedios mviles.
Se sabe que para un proceso MA(q) la autocorrelacin (), > , son cero. Adems, se
conoce que la autocorrelacin muestra que (), > se distribuye de forma normal
aproximadamente con media () = 0 y varianza 1 [1 + 22 (1) + + 22 (1)]. Este resultado
habilita el uso de la grfica de (), = 1,2, , para decidir si un conjunto de datos dados se
puede modelar como un proceso de promedios mviles y obtener una estimacin preliminar de
orden q como el valor ms pequeo de tal que () no es significativamente diferente de
cero para todo > . Para propsitos prcticos significativamente diferente de cero es
interpretado como no tan grande como el valor absoluto de
1.96
.
Si adicionalmente, para examinar (), = 1,2, , se examinan los vectores de coeficientes

, = 1,2, , no slo se podr evaluar las adecuaciones al modelo de promedios mviles y
estimar el orden de ste, sino que al mismo tiempo se pueden obtener las estimaciones
preliminares 1 , , de los coeficientes. Inspeccionando los coeficientes estimados
1 , , para = 1,2, y el radio de cada coeficiente estimado a 1.96 veces su
1
1 2
desviacin normal aproximada = 2 (=0
)2 , se puede observar cul de los coeficientes
estimados es el ms significativamente diferente de cero. Estimando el orden del modelo se
puede ajustar como un residuo para el cual el radio es tan largo como 1, y al mismo tiempo
leer los valores estimados para cada uno de los coeficientes. Como est incrementando los
valores 1 , , , se estabiliza en el sentido de que las fluctuaciones en cada uno de los
1
componentes son de orden 2 , la desviacin estndar asinttica de 1 .

32
Estadstica III
Como para modelos autorregresivos, una mayor aproximacin sistemtica de orden de
seleccin para modelos de promedios mviles es encontrar los valores de y =
(1 , , ) que minimiza la estadstica como:
= 2 ( ,
( )
2( + 1)
,
)+
donde es la verosimilitud Gaussiana definida en (2.3.2.1) y es definida en la expresin (29).

Las ecuaciones definidas para un modelo causal AR(p) tienen la forma de un modelo de
regresin lineal con vector de coeficientes = (1 , , ). Esto sugiere el uso de regresin
simple por mnimos cuadrados para obtener parmetros estimados preliminares cuando = 0.
La aplicacin de esta tcnica cuando > 0 es complicada por el hecho de que en general
ARMA(p,q) en sus ecuaciones es regresado no slo en 1 , , , sino tambin en los
cuantiles inobservados 1 , , . No obstante, todava es posible aplicar regresin por
mnimos cuadrados para la estimacin de y remplazando primero los cuantiles
inobservados 1 , , en (30) para estimar los valores 1 , , . Los parmetros y
son entonces estimados por regresin de sobre 1 , , , 1 , , . stos son los
principales pasos en el procedimiento de estimacin de Hannan-Rissanen:
Paso 1. El orden superior del modelo AR(m) (con > max(, )) es ajustado para los datos
usando la estimacin Yule-Walker. Si (1 , , ) es el vector de coeficientes estimados,
entonces los residuales estimados son calculados de las ecuaciones
= 1 1 , = + 1, , .
Paso 2. Una vez estimados los residuales , = + 1, , , como en el paso anterior, el
vector de parmetros = (, ) es estimado por regresin lineal de mnimos cuadrados de
sobre (1 , , , 1 , , ), = + 1 + , , ; es decir, por mnimos cuadrados de la
suma
() =
( 1 1 1 1 )2
=+1+
con respecto a . Da el estimador de Hannan-Rissanen

= ()1 ,
donde = (+1+ , , ) y es el ( )( + ) matriz

33
Estadstica III
+
++1
+1
+
+ +1
++1 +
++1
++2
+1
+2

]
(Si = 0, contiene slo las ltimas columnas). La estimacin de Hannan-Rissanen de la

varianza de ruido blanco es
()
= .
Paso 3. Usando la estimacin = (1 , , , 1 , , ) del paso 2, fija

0,
max(, ) ,
= {
,
=1
> max(, )
=1
Ahora para = 1, , se pone

0
, max(, ) ,
= {
+ ,
> max(, )
=1
y
0, max(, ) ,
= {
+ , > max(, )
=1
(Observa que para y satisface las recursiones AR () = y () = para =

1, , .) Si es la regresin estimada de encontrada aplicando regresin sobre
(1 , , , 1 , , ); es decir, si minimizamos .
()
( + )2
=max(,)+1
=1
=1
Entonces, la mejor estimacin de es = + . El nuevo estimador entonces tiene la

misma eficiencia asinttica como el estimador de mxima verosimilitud.
2.4. El problema de prediccin

34
Estadstica III
En este momento la incertidumbre es algo que atrae la atencin de la mayora de la poblacin;
tomando en cuenta que las cosas a futuro no son seguras y menos en este tiempo, es
imprescindible contar con el conocimiento adecuado para hacer frente a este tipo de
situaciones. Es ah donde entra en juego la prediccin, la cual se usa en muchas reas para
determinar un futuro lo ms preciso posible. En este apartado se utilizar para la parte
estadstica como se ha estado viendo a lo largo del tema, como lo son las series de tiempo. Un
claro ejemplo ya aplicado se puede ver en las empresas que hacen sus proyecciones a futuro
para ver cmo es que actan stas y poder prevenir los malos escenarios que la perjudicaran.
2.4.1. Teorema de Proyeccin ortogonal

Expresin de las coordenadas de una combinacin lineal de vectores ortogonales. Sea
(1 , , ) una lista ortogonal de vectores de y sea una combinacin lineal de los vectores
(1 , , ):
= .
=1
Entonces los coeficientes (1 , , ) de esta combinacin lineal se pueden calcular de la

siguiente manera:
=
< , >
.
< , >
Teorema (proyeccin ortogonal de un vector sobre el subespacio generado por una lista
ortogonal). Sea un espacio vectorial con producto interno, sean (1 , , ) vectores
ortogonales no nulos y sea . Si se coloca al subespacio generado por (1 , , ):
: = (1 , , ).
Entonces existe un nico par de vectores (, ), tal que
= + , ,
Los vectores y se calculan mediante las siguientes frmulas:
=
=1
< , >
, = .
< , >
Demostracin. Unicidad. Supn que , cumplen con (1). Entonces para todo {1, , }, se
tiene < , >= 0 y
< , >=< , + >=< , > +< , >=< , >

35
Estadstica III
La condicin significa que es una combinacin lineal de (1 , , ):
= .
=1
Los coeficientes se calculan por la Proposicin de los coeficientes de una combinacin lineal
de vectores no nulos:
=
< , >
< , >
=
.
< , > < , >
Luego de la igualdad = + sigue que = . Se demuestra que y cumplen con (2)

y por lo tanto se determinan de manera nica.
Existencia. Se definen y por las frmulas (2). Entonces para todo {1, , }
< , >=
=1
< , >
< , >=< , >.
< , >
Por lo tanto, para todo {1, , }

< , >=< , >=< , > < , >= 0,
as que .
Actividad 2. Uso de software.

Por medio de esta actividad, comprobars por medio de un programa informtico diferentes
modelos ARMA.
2.4.2. Las ecuaciones de prediccin

Cuando varias observaciones pasadas , , 0 , 1 , , ( < 0) son ciertas, la evaluacin de
la mejor prediccin lineal de + en trminos de 1, , , 0 , , ., Esta prediccin se denota
por , + . Si || es grande, esta prediccin puede ser aproximada algunas veces ms
fcilmente calculada en la media cuadrada del lmite.
+ = lim , +

36
(48)
Estadstica III
se refiere a la prediccin del operador basada en el infinito prximo { , < }.
Anlogamente se refiere a la prediccin del operador basada en el infinito prximo
{1 , , }.
Determinacin de +
Como + , la mejor prediccin lineal + donde { } es una media cero del proceso
estacionario con funcin autocovarianza (. ), es caracterizada por la ecuacin
[(+ + )+1 ] = 0, = 1,2,
(49)
Si se puede encontrar una solucin a esta ecuacin, sera necesario en la nica prediccin
definida + . Una aproximacin a este problema es casi siempre efectiva asumiendo que
+ puede ser expresada de esta forma
+ = +1 ,
(50)
=1
en el cual la ecuacin anterior se reduce a
[(+ +1 ) +1 ] = 0, = 1,2,
=1
(51)
o equivalentemente,
( ) = ( + 1),
= 1,2,
=1
(52)
ste es un conjunto infinito de ecuaciones lineales para coeficientes desconocidos que

determina + , prediciendo que el resultado de las series converge.
:
Propiedades de
Suponiendo que 2 < , 2 < , , y son constantes y = (, ).
1. [( ()) ] = 0, .
2. ( + + ) = () + () + .
3. () = si es un lmite de combinaciones lineales de ,
4. () = si (, ) = 0

37
Estadstica III
Estas propiedades algunas veces pueden ser usadas para simplificar el clculo de + ,
cuando el proceso { } es un proceso ARMA.
Sea { = (1 , , ) } donde la variable de las series de tiempo con media = y la
funcin de covarianza dado por la matriz ,
(, ) = ( ) .
(53)
Si = (1 , , ) es un vector aleatorio con segundos momentos finitos y = , definido

() = ( 1 . . ) ,
(54)
donde es la mejor proyeccin lineal del componente de en trminos de los

componentes de los vectores , = 1, , , y de la constante 1. Esto seguido inmediatamente
de las propiedades del operador de prediccin anterior que
() = + 1 ( ) + + (1 1 ),
(55)
para algunas matrices 1 , , , y que

() +1 , = 1, , ,
(56)
cuando dos vectores aleatorios dimensionales y son ortogonales (escrito ) si ()

es una matriz de ceros. El vector de la mejor prediccin de la expresin (9) es determinado de
forma nica por las expresiones (10) y (11), aunque esto podra ser posible para 1 , , .
Como un caso especial de lo anterior, si { } es una media cero en una serie de tiempo, la
mejor prediccin lineal +1 de {+1 } en trminos de 1 , , est obtenida en sustitucin
por +1 en (54). Por eso
0, = 0
+1 = {
(+1 ), 1
De otra manera, se escribe
+1 = 1 + + 1 , = 1,2,

38
(57)
Estadstica III
Cuando de (56) el coeficiente , = 1, , es tal que
), = 1, , ,
(+1 +1 ) = (+1 +1
(58)
esto quiere decir que
( + 1 ) = ( + 1, + 1 ), = 1, , .
(59)
=1
En este caso cuando { } es estacionario con (, ) = ( ), la ecuacin de prediccin

simplificada para -dimensional anloga a
( ) = (), = 1, , .
(60)
=1
Mantiene que las covarianzas de la matriz de de componentes de 1 , , es no singular

para cada 1; los coeficientes { } pueden ser determinados recursivamente usando una
versin multivariada del algoritmo de Durbin-Levison dado por Whittle (1963). La recursin de
Whittle tambin determina la covarianza de las matrices de un paso de la prediccin de los
errores, nombrados 0 = (0) y para 1,
= (+1 +1 )(+1 +1 )
= (0) 1 (1) ().
(61)
La Recursin De Kalman
Se van a considerar tres problemas fundamentales asociados con el estado del modelo
definido. Se trata de lo relacionado con encontrar el mejor estimador lineal (en el sentido del
error medio cuadrado) del estado del vector en trminos de las observaciones 1 , 2 , y un
vector aleatorio 0 , esto es ortogonal a y para todo 1. En muchos casos 0 ser la
constante del vector(1,1, ,1) Estimado de en trminos de:
a. 0 , , 1 define la prediccin del problema.
b. 0 , , define las filtraciones del problema.
c. 0 , , ( > ) define los problemas suavizados.
Cada uno de los problemas puede ser resuelto recursivamente usando una propiedad de
recursin del conjunto de Kalman.

39
Estadstica III
En definiciones siguientes de la mejor prediccin lineal, se notar que no se incluye
automticamente la constante 1 entre las variables de prediccin, como se vio anteriormente;
sin embargo, se puede escoger 0 = (1,1, ,1).
2.5 Validacin de modelos

En la siguiente seccin se examinarn algunas tcnicas para decidir si procede o no la
secuencia de ruido, as genera diferentes significados de ruido. Si la secuencia de ruido
no tiene muestras autocorrelaciones significativamente diferentes de cero, entonces se puede
tomar ventaja para pronosticar valores de ruido de futuro en trminos de valores pasados para
modelar el ruido como una serie de tiempo estacionaria.
2.5.1. Anlisis de residuales

Una de las formas ms claras y simples para detectar violaciones a los supuestos de los
modelos es a travs del anlisis de residuales, en donde como residual se considera aquella
parte de las observaciones que no es explicada por el modelo. Los residuales para el modelo
() = () , se definen mediante
1
= [()] ()
= ()
De esta relacin se sigue que

= + 1 1 + 2 2 +
Ahora bien, la estimacin de que se puede hacer con base en el polinomio estimado () y
las observaciones hasta el tiempo 1 , es
= 1 1 + 2 2 +
Por lo tanto, de estas dos ltimas expresiones se obtiene que
=
Es decir, los residuales miden la discrepancia entre los valores observados y los valores
estimados por el modelo. Adems, cuando el tamao de la muestra es grande, los errores
aleatorios y los residuales (que tambin son variables aleatorias) son esencialmente iguales;
por esta razn, al analizar los residuales observados { } se analiza bsicamente lo que debera
ser una relacin del proceso de ruido blanco { }.

40
Estadstica III
Por lo anterior, los supuestos acerca del proceso { } pueden verificarse y posiblemente
corregirse de la siguiente manera:
Supuesto 1. { } Tiene Media Cero
Verificacin. Calcula la media aritmtica y la desviacin estndar muestral de los residuales.
() = /( )
=
[ ()]2
=
=
Con = + + 1 para construir el cociente ()/ . Si el valor absoluto de dicho

cociente es menor que dos, se dira que no hay evidencia de que la media del proceso de ruido
blanco sea distinta de cero, y por lo mismo, no se rechaza el supuesto; por el contrario, si |
()/ | 2, entonces la media de los residuales es significativamente distinta a
cero, lo cual implica que el supuesto se ha violado.
Correlacin. Que la media de los residuales sea significativamente distinta a cero implica que
existe una parte determinista o semideterminista en { } que no ha sido considerada por el
modelo, por lo tanto, se requerira la inclusin de una tendencia determinista o semideterminista
en { } que no ha sido considerada por el modelo, por tanto, se requerira la inclusin de una
tendencia determinista 0 en el modelo que sea estimada junto con el resto de los parmetros.
El valor inicial para 0 vendra a considerar la posibilidad de que un trmino autorregresivo o
una diferencia ms sean necesarios en el modelo, en lugar de 0 . Esto surge del hecho de que
la diferencia o el parmetro autorregresivo podran representar una posible tendencia adaptiva,
presente aun en los residuales, mientras que 0 representara una tendencia estrictamente
determinista.
} tiene varianza constante
Supuesto 2. {
Verificacin. Haz una grfica de los residuales contra el tiempo para observar, visualmente, si
la varianza parece o no ser constante. Podra pensarse que esta verificacin visual es muy
burda, pero la idea es que solamente las violaciones muy notorias de este supuesto son las que
realmente llegan a causar problemas.
Correccin. Slo en caso de que la varianza parezca seguir algn patrn de crecimiento o de
decrecimiento podra ser posible aplicar una trasformacin potencial para que estabilizar la
varianza de la serie sea fructfero.

41
Estadstica III
Supuesto 3 . Las variables aleatorias { } son mutuamente independientes.
Verificacin. Debido a que independencia implica no autocorrelacion, se debe requerir que
() = 0 para toda 0. Esto ultimo puede verificarse calculando, primero, FAC muestral de
los residuales { ()}, que en el supuesto de que su media es cero est dada por
() =
+
=
, = 1,2,
= 2
Con = + + 1, y posteriormente:
Estimndose la desviacin estndar de () como
[ ()]=1/ .
Para determinar la significacin estadstica individual de las autocorrelaciones de los residuales,

o sea, si | ()| 2/ , se dir que la autocorrelacin -sima es significativamente
distinta de cero. No obstante, esta prueba de significacin no es del todo vlida para
autocorrelaciones correspondientes a retrasos pequeos ( 3), y conviene por ello realizar
una prueba conjunta (simultnea) de la significacin de las primaras autocorrelaciones
simultneamente, con el estadstico
= ( ) 2 ().
=1
En donde, si es grande ( > 20), sigue aproximadamente una distribucin ji-cuadrada con
grados de libertad; de aqu que el valor de deba ser comparado con los valores de
tablas de ji-cuadrada, con los correspondientes grados de libertad, para efectuar la prueba de
significancion. Sin embargo, conviene hacer notar que en ocasiones la aproximacin lograda
con no es del todo apropiada. Por esta razn Ljung y Box modifiacaron la expresin para
obtener el estadstico
2
= ( )( + 2)
)/( ),
=1 (
que resulta ser ms adecuado para realizar la prueba.

Correccin. Cuando la verificacin indica que las autocorrelaciones no son las
correspondientes a un proceso de ruido blanco, es de suponer entoces que corresponden a
cierto proceso ARMA; por esta razn se recomienda graficar algunos valores de { ()} y tratar
de identificar algn proceso ARMA para los residuales, lo cual sugerira modificaciones al
}. La idea es que si el proceso real es
modelo originalmente identificado para {

42
Estadstica III
() = () con ( ) = 0 y { } ruido blanco. Pero el modelo identificado errneamente
fue () = () , donde { } no es ruido blanco. Entonces { } seguir el comportamiento
dictado por el siguiente proceso ARMA
()() = ()() .
Por ejemplo, si el proceso verdadero es = (1 1 2 2 ) , pero el modelo identificado
fue = (1 ) ,entonces { } seguir el proceso ARMA(1,2): (1-) =(1-1 2 2 ) .
Esto indica, en particular, que faltaron componentes del tipo ARMA (1,2) en el modelo
originalmente identificado y que se debera estimar ahora un modelo del tipo (1-) = (1
1 2 2 )(1 ) , en donde los resultados esperados son = 1 = 1 2 = 2 y =
, lo cual conducira a un modelo adecuado para representar al proceso real.
Supuesto 4. { } tiene una distribucin normal,para toda .
Verificacin. Se sabe que para una distribucin normal aproximadamente el 95% de las
observaciones debe estar dentro de un intervalo que se extienda dos desviaciones estndar por
debajo y por arriba de la media; entonces, si se cumple que la media de los residuales sea cero,
se esperara, mximo, que un total de ( )/20 observaciones estarn fuera del intervalo
(2 , 2 ). Para verificar esto se sugiere utilizar la misma grfica de los residuales contra el
tiempo que se recomend emplear en la verificacin del supuesto de varianza constante.
Tambin se puede trazar un histograma de los residuales mediante el cual se vizualice la forma
de su distribucin, con esto se detectara en particular si la distribucin contiene asimetra.
Correccin. Es importante advertir que el supuesto de normalidad se debe cumplir para los
errores aleatorios { }, pero no tiene por qu ser satisfecho exactamente por los residuales { };
por esta razn cabe esperar pequeas violaciones a este supuesto que no causen problemas
en lo absoluto. Por otro lado, si las violaciones son muy notorias, podra pensarse en aplicar
una trasformacin nomalizante.
Supuesto 5. Implcitamente se ha supuesto que no existen observaciones aberrantes
(posiblemente ajenas a la serie de estudio).
Verificacin. De nuevo, la grfica de residuales contra el tiempo permitir visualizar si existe
este tipo de observaciones anmalas, Por ejemplo, un residuo que se encuentra fuera de
(3, 3 ) implicar que, o bien sucedi un evento cuya probabilidad de ocurrencia era de
aproximadamente 0.2% (lo cual sera muy extrao), o el residuo en cuestin corresponde a una
observacin que no fue generada por el mismo proceso generado del resto de la serie. De esta
manera, como una regla emprica de trabajo, podran considerarse como sospechosas las
observaciones cuyos residuales estn fuera del intervalo (3, 3 ).
Correccin. Conviene recordar que toda observacin puede contener informacin muy valiosa
para los fines del estudio que se est realizando, es por esto que no hay que descartar la
43
Estadstica III
posibilidad de que realmente haya ocurrido un evento altamente improbable y que, al desechar
la observacin (o ajustarla de alguna manera) se perjudique el anlisis. Por ello antes de llevar
a cabo cualquier accin, debe investigarse la causa de que tal observacin sea sospechosa, ya
que esto podra deberse a un cambio estructural en el comportamiento del fenmeno, causado
quiz por una intervencin exgena a la serie en estudio, lo cual ameritara un anlisis
especfico de tal intervencin (dicho anlisis podra realizarse con la metodologa expuesta).
Asimismo, podra ocurrir tambin que la causa de que una observacin resulte sospechosa sea
un error de copiado de datos, y en este caso corregir la informacin es la solucin obvia.
2.5.2. Pruebas de normalidad, no correlacin y heterocedasticidad

Una vez encontrados los estimadores , y 2 se procede a verificar los supuestos del
modelo, lo cual se hace con los residuales del modelo 1 , 2 ,. . . , . stos deben cumplir con
lo siguiente:
1. Tener distribucion normal.
2. Ser no correlacionados.
3. Ser homocedsticos.
Para ver a (1) se puede graficar un histograma de 1 , 2 ,. . . , o hacer una grfica de estos
residuales en papel normal. Se suelen aplicar pruebas de normalidad, por ejemplo; AndersonDarling, Kolmogrov-Smirnov y Cramr-von Mises. Para ver (2) se suele graficar la ACF
muestral de 1 , 2 ,. . . , , y sta debe corresponder con la ACF muestral de un proceso de
ruido blanco; para ver (3) se suele graficar contra .
Figura 5.Histograma de residulales

44
Estadstica III
Figura 6. Grfica homocelstica
Figura 7. Grafica homocelastica
Actividad 3. Identificacin y estimacin de modelos

A traves de esta actividad, reflexionars sobre lo estudiado en la unidad, sobre los diferentes
mtodos para identificar los modelos de la clase ARMA. Para ello:
Autoevaluacin
Para reforzar los conocimientos relacionados con los temas que se abordaron en esta unidad
del curso, es necesario que resuelvas la autoevaluacin.

45
Estadstica III
Evidencia de Aprendizaje. Reporte de modelacin
A travs de esta actividad podrs resolver modelos autorregresivos, y basndote en los
resultados realizars un reporte de los procesos realizados. Para ello:
Cierre de la unidad
En esta unidad has aprendido cmo utilizar los correlogramas muestrales de datos para
determinar un modelo dentro de la clase ARMA(p,q) que sea potencialmente adecuado para los
mismos. Tambin has visto que una vez estimados los parmetros de los modelos con los
mtodos estudiados a lo largo de la unidad, la forma de juzgar si en realidad el modelo
propuesto es adecuado a travs del anlisis de sus residuales, los cuales deben ser
homocedsticos, no correlacionados y deben tener distribucin normal. Entonces, si las pruebas
de hiptesis estadsticas aplicadas a los residuales no rechazan estos supuestos, estaremos
autorizados a utilizar el modelo con fines de descripcin, prediccin y otras formas de inferencia
estadstica que se requieran para sacar conclusiones sobre el fenmeno al cual corresponden
los datos. Dentro de los aspectos estadsticos revisados est la distribucin para tamao de
muestra grande de los estimadores mximo verosmiles de los parmetros, esto es til para
juzgar si un parmetro es estadsticamente significativo (es decir, que su valor no es cero). El
teorema de proyeccin ortogonal ilustra la idea de que la forma de hacer prediccin, en
procesos estacionarios de segundo orden, es usando una combinacin lineal de observaciones
de la historia del proceso. Si para unos datos se obtienen varios modelos con residuales que se
comportan en forma satisfactoria, una forma de seleccionar un modelo es usando el criterio de
informacin de Akaike. El modelo ms adecuado es aquel cuya estadstica de Akaike sea
mnima.
Para saber ms
Se puede profundizar en la propiedades de los estimadores de mxima verosimilutud en el libro
de Brockwell, J. y Davis, A. (2009). Time series: Theory and Methods. New York: SpringerVerlag.
El ACF y PACF no son informativos para determinar el orden de un modelo ARMA (p,q). Tsay y
Tiao (1984) proponen un nuevo enfoque que utiliza la autocorrelacin extendida
funcin (EACF) para especificar el orden de un proceso ARMA(p,q). La idea basica de EACF es
relativamente simple. Si se puede obtener una estimacin consistente de la AR
componente de un modelo ARMA, entonces se puede derivar el componente MA. Desde
derivada serie MA, puede utilizar ACF para identificar el orden del componente MA. Esto se
desarrolla con todo detalle en Tsay, R.(2010). Analysis of Financial Time Series. Chicago:
WILEY. El captulo dos del libro habla acerca de los modelos univariantes, dando una
introduccin al tema; tambin ayuda a reforzar el tema de los procesos estocsticos
estacionarios con apoyo de las Funciones de Autocorrelacin ACF y de Autocorrelacin Parcial
46
Estadstica III
PACF. Por su parte, el captulo tres trata el tema de la Funcin de Autocorrelacin ACF y la
Funcin de Autocorrelacin Parcial PACF. En cuanto a las unidades uno y dos, explican los
temas bsicos de las series de tiempo y de los procesos estacionarios.
http://www.masys.url.tw/Download/2002-BrockwellIntroduction%20Time%20Series%20and%20Forecasting.pdf
Tambin puedes ver el siguiente enlace para revisar sobre modelos univariantes y procesos
estocsticos estacionarios.
http://pendientedemigracion.ucm.es/info/ecocuan/jam/JAM-IAST-Libro.pdf
Referencias bibliogrficas
Brockwell, J. y Davis, A. (2009). Time series: Theory and Methods. New York:
Springer-Verlag.
Cowpertwait, P. (2010). Introductory Time Series with R. New York: Springer-Verlag.
Guerrero, V. (2009). Anlisis Estadstico de Series de Tiempo Econmicas.

Mxico: Just in Time Press.
Shumway, R. y Stoffer, D. (2010). Time Series Analysis and Its Applications: with
R examples. New York: Springer-Verlag.

47

Identificacion, Estimacion y Validacion de Modelos

Uploaded by

Document Information

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Identificacion, Estimacion y Validacion de Modelos

Uploaded by

Copyright:

Available Formats

Estadstica III

Unidad 2. Identificacin, estimacin y validacin de modelos

Universidad Abierta y a Distancia de Mxico

Unidad 2. Identificacin, estimacin y validacin de

Ciencias Exactas, Ingenieras y Tecnologas |Licenciatura en Matemticas

Ciencias Exactas, Ingenieras y Tecnologas |Licenciatura en Matemticas

Establecer mtodos para estimar la media y la sucesin de autocorrelacin de un

2.1. Estimacin de la media y momentos de 2o orden

Ciencias Exactas, Ingenieras y Tecnologas |Licenciatura en Matemticas

sucesin de autocorrelacin = a partir de observaciones 1 , , , desempea un papel

crucial en problemas de inferencia y, en particular, en el problema de la construccin de un

2.1.1. Estimacin del valor esperado

ste es un estimador insesgado de , ya que:

El error cuadrtico medio de es:

Ahora bien, si () 0 cuando , el lado derecho de (2) converge a cero cuando ,

Proposicin 2.1.1. Si { } es una serie de tiempo estacionaria con media y funcin de

Ciencias Exactas, Ingenieras y Tecnologas |Licenciatura en Matemticas

2.1.2. Estimacin de la sucesin de autocorrelacin

Ciencias Exactas, Ingenieras y Tecnologas |Licenciatura en Matemticas

El ACF mide la previsibilidad lineal de la serie en el tiempo , es decir , utilizando solamente el

donde es el ndice de tiempo del proceso. Asimismo, se define la sucesin de autocorrelacin

Ciencias Exactas, Ingenieras y Tecnologas |Licenciatura en Matemticas

La ACF { } es tal que 0 = 1 y por la desigualdad de Cauchy-Schwarz | | 1, .

Se observa que = para < < .

Como ya se discuti la estimacin de la media ( ) para un proceso estacionario de segundo

coeficiente no es estadsticamente significativo.

Ciencias Exactas, Ingenieras y Tecnologas |Licenciatura en Matemticas

significativos; es decir, se tiene que realizar la prueba de hiptesis estadstica:

y sucede que la estimacin est dentro de la banda mencionada, entonces no se rechaza 0

Considera el siguiente correlograma muestral

Fig 1.Correlograma Muestral

Para las correlaciones { } calculadas de las observaciones 1 , , , el grfico de la figura 1

Ciencias Exactas, Ingenieras y Tecnologas |Licenciatura en Matemticas

Ciencias Exactas, Ingenieras y Tecnologas |Licenciatura en Matemticas

donde 2 es la sucesin de auto correlacin muestral y || denota el determinante de la matriz

donde es el ltimo componente del vector

Ciencias Exactas, Ingenieras y Tecnologas |Licenciatura en Matemticas

2.2. Uso de las sucesiones de autocorrelacin para identificar modelos

2.2.1. Identificar el modelo MA(q) usando la ACF

donde se escribi 0 = 1, la sucesin autocovarianza de { } es:

Ciencias Exactas, Ingenieras y Tecnologas |Licenciatura en Matemticas

Figura 2. A) Grafica. B) ACF de MA(2)

La figura muestra la ACF muestral { } calculada a partir de estas observaciones.

Ciencias Exactas, Ingenieras y Tecnologas |Licenciatura en Matemticas

El modelo implica + = =1 + + + , donde las races de () estn fuera del crculo

Por lo tanto, cuando > ,

y la estimacin est dentro de la banda mencionada, entonces no se rechaza 0 (al 95% de

Ciencias Exactas, Ingenieras y Tecnologas |Licenciatura en Matemticas

Figura 3. A) Grafica B)PACF para un proceso AR(2)

Ciencias Exactas, Ingenieras y Tecnologas |Licenciatura en Matemticas

2.3. Estimacin de parmetros autorregresivos y de promedios mviles

2.3.1. Mtodo de mxima verosimilitud

los coeficientes = (1 ) , = (1 ) , y la varianza de ruido blanco 2 . La validacin

= (1 ) , = (1 ) y 2 , donde y se suponen conocidos.

Ciencias Exactas, Ingenieras y Tecnologas |Licenciatura en Matemticas

por lo tanto, si se considera a la variable

(++1 , ++2 , , ) = (++1 , ++2 , . . . , )

La funcin de densidad (6) permite calcular la probabilidad de la distribucin normal multivariada

una vez que se conocen los parmetros = (1 , , ) , 0 , = (1 , . . . ) y 2 ; ahora bien, lo

= (++1 , ++2 ,. . . , ) y lo que se desconoce es , 0 ,

depende del vector de observaciones , esto es

dicha funcin de verosimilitud ( , 0 , , 2 | ) debe maximizarse con respecto a los

Para maximizar ( , 0 , , 2 | ), en primer lugar se eligen los valores , 0 y que minimicen

se encontr el valor mnimo (, 0 , ), entonces se procede a maximizar la funcin de