You are on page 1of 167
CAPITULO 2 Los procesos estacionarios de pardmetro discreto 125 “El tiempo es como un circulo que girara infinitamente El arco que desciende es el pasado, el que asciende es ef ‘porvenir; arriba hay un punto indivisible que toca la tangente ‘yesel ahora”. (Borges, J.L.: “Nueva refutacién del tiempo”) 2. Definiciones ‘Como se mencioné en Ja Sec. 1.3, se define como serie cronoldgica {¥;} a todo proceso estocistico discreto en el dominio del tiempo, continuo en el dominio de las variables, con la tnica restriccién -Ia cual no significa pérdida de generalidad- de que sus variables aleatorias se generen a intervalos regulares de tiempo. Asimismo, de acuerdo a lo expresado en la misma seccién, también se denomina serie cronolégica a Ja sucesién finita y ordenada en el tiempo de las realizaciones de las variables aleatorias que integran el proceso', En general, el proceso estocéstico definido por la serie cronologica se denota por {1;}_ en tanto que la realizacién de dicho proceso (que define su trayectoria en el tiempo) se denota por {y,}". A partir de la condicién de ergodicidad, cualquier andlisis sobre {¥;} se desarrollara asimilando el conjunto (- 2,0) del proceso al conjunto [in] de su realizacién, de modo que la relacién entre proceso y realizacién puede ser considerada como similar a la relacién entre poblacién y muestra, en la inferencia clasica, En el texto, dado que no existe posibilidad de confusién, se utilizaré {%) para denotar tanto al proceso como a su realizacién’, En el GRAFICO 2.1 figura , a modo de ejemplo, Ja trayectoria del proceso {%} , que representa la evolucién de la demanda monetaria real expresada en periodos mensuales en el intervalo [ENE-1983;DIC- 1988}. 2 Debe tenerseen cuenta que ls observaciones sobre las realizaciones de un proceso estocdstico siempre son discretas en el tiempo. Es devi que, como se verd en Ia Ser. 44, los procesos de series eronol6gicas pueden ser consideradas como necesaras discretizaciones y,(¥)w! , donde w es un escalar complejo. Sean dos procesos estocésticos lineales unidimensionales, {¥,} e {¥%,}, estacionarios en las covarianzas e incorrelacionados entre si y sea el proceso bidimensional {¥} = {X,}+{¥,} . Dado que ryt) = 2,{F + %) = 7,(¥) + 7)(04) sdeacuerdo con a definicién de la fun on generatrizde autocovarianzas, se puede concluir en forma inmediata que )7y,(¥)w! = Sy fal Sy lose! Es decir, que i i & Teloe)= 1,64) + 72 () 2.3. La estimacién del valor medio Sea {¥%} (= 1,2,..7) la serie cronolégica formada por una realizacién del proceso {¥) estacionario en las covarianzas. De acuerdo con los teoremas de ergodicidad comentados en la Sec.1.5, si {¥/} ¢s asintéticamente incorrelacionado, entonces se puede asegurar que el estimador Yj, insesgado y consistente, con varianza definida como un promedio ponderado de las primeras n-1 rol¥)+23°7,(¥)= Dov, (¥)-Entonces, de acuerdo con los postulados del teorema central del limite se puede concluir que, cuando n aumenta indefinidamente, vali whoa autocovarianzas. Demodoque lin | fio - nf} sy, i . En particular, si el proceso {1} fuera ademas Normal, entonces para 128 Los procesos estacionarios de pardmetro discreto todo n finito, se verificaré que’: [ eh - 0) li mp endo ZA) 2.4.- La estimacién de la funcién de autocovarianzas Sea {¥} un proceso estocéstico estacionario en las covarianzas, con momento de primer orden B(Y,) = m(¥) (r= 1,2,..) conocido. Un estimador de las autocovarianzas es: Fr y= AS mr 1 adi)] (i= 12,501) Teniendoen cuentaque £(77*(¥)} (uv) 4y,(¥) ,sepuede concluir que este estimador es asintoticamente insesgado y que, para n finito, posee un sesgo de magnitud directamente proporcional al valor de j de orden -2n(v). ‘Suponiendo conocido el valor medio del proceso, un estimador alternativo de las autocovarianzas que satisface la condicién de ser insesgado, es: F)= Sp; - morf., ~ m(y)] (y= O12. 1) cuyos momentos de segundo orden son de la forma: AFOAM> A OFO]= Taylor rMWrice + Ynce Mv iAD+ Relist hye h+ )] (Os i< 05 fen) donde «,(.,.,.) denota el cumulante de cuarto orden: a(n d) = EL = mI) an 2) hr MD) his — A) Or) Orn + 7, On] (= 012.) En particular, su varianza puede ser expresada como: 5, sta aproximacion se basa en el teorema de Cesiro segin el cual si Sa, <2, enfonces se verifice que oy La estimacién de la funcién de autocovarianzas 129 | Shon sv) nein hs af ref) Por lo tanto, dado que )"7?(r)< = y que ee DeUek i= 4 < © , se verificara que: lime im tin(n Jo*(F300)) = D780) sal Sali Aas~h) ae ms ‘Sea, ahora, un proceso {¥;} estacionario de segundo orden con momento de primer orden m(¥) desconocido, un estimador de las autocovarianzas es de la forma: r)= (i= 012, -1) su valor esperado esté definido por: AiO) GATES nem Eo Snle) 29 ‘ai tnt A partir de esta expresién se obtiene que: & 6-H, Zine lncnaie AB(Fi0)- 1) = mi pA neato fae -2 So ante? S (rane EEr.0] De modo que lim [2(7,0))- Yr sW)]= DXiu(*). De to que se puede concluir que este estimador esta afectudo por un sesgo de orden + Un estimador alternativo (més general) de la funcién de autocovarianzas, para el caso en que el valor medio sea desconocido, es: Donde 4; - El valor esperado de este estimador es de la forma TPE Ln temoto ae sie rf (F309) 1400] zn Es decir que, 27,0) = 10)- igual que en el caso precedente, este estimador esté afectado por un sesgo de orden i Sus momentos de 130 Los procesos estacionarios de pardmetro discreto segundo orden son de la forma: fre70)|= “wae we Parl rr s0* reclaim hol J eyed To EU OMe rs Mra Rl le= hs— he A (n- J) Sat tat oh meee OM ers) Meese HeEFt hs hse j- A+ -y od tata ea Popeater Tye Lea Oren we sQ1)* Mrs Meare(P)e ny C40 r= rst jar] Ce Otro estimador asintéticamente insesgado de las autocovarianzas para el caso de valor medio desconocide es: (= 012.4n-1) Este es el estimador considerado al tratar las condiciones de ergodicidad de segundo orden (ver See. 1.5)y el que sera utilizado en los sucesivo en las aplicaciones que figuran en el texto. La utilizacién del denominador n (en vez de » - j ) garantiza que la matriz de varianzas y covarianzas del estimador sea definida-positiva Sea un proceso {¥;} estacionario de segundo orden y ergddico, que admite una representacién de la forma ¥,= m(¥)+ Y7,(V)e,.y » donde el proceso {¢,}:171V- (0,02), con momentos de cuarto me orden finitos, £(c#)=3of+x, <= . Se demuestra, entonces, que, sim aumenta indefinidamente, los estimadores: {Wn(7')- 7). {Ne(50)-7,(P))J = 042.4} {vn(Fs00) - x,(7))u = 0312. {al {a MDa} (307)-7 0%). 002 fa? (#)-7) = 012m} convergen en-distribucién a una funcién Normal con valor medio nulo y momentos de segundo orden de La funcién de densidad espectral 131 la format tinny (flr.7,(0))= Dhwtrnuie rj rrolt En 2) 2.5.~ La funci6n de densidad espectral Sea {¥} un proceso estacionario de segundo orden. Su funcién de autocovarianzas (que, como ya se demostré, es acotada) de acuerdo con los postulados de los teoremas Wiener-Khinchine y de Herglotz admite una representacién espectral de la forma r= for(aleda = fevanla) (j= 02182, .i-2< ae) que permite la descomposicién de {};} en sus componentes de distintas fecuencias’ y donde oy(a) denota la Hamada funcién de densi jad espectral (0, simplemente, el espectro) de {¥;} y: Wy(a) = fooy(u)au que es mondtona no-decreciente, acotada® y tal que 1;(- 2)= 0 y Wy(z)= o°(¥), denota la funcién de distribucién espectral (0 espectro integrado) asociada al proceso {1;} . En particular, se puede escribir yo(¥) foy(a)da , de modo que wy(a)d2 puede ser © Ver Anderson, T.W. (1964). 7 -etteorema de Herglotz, que demuestra que las cases de las funciones definidasno-negativasy de las funciones caractersticas son coincidentes (ver Brockwell, PJ ;Davis, R.A, (1987), permite eocluir que laexstencia de esta forma derepresentaciGnespectral es condicion necesara y suficiente para que une funcion ,(F) sea definids no-negativa ® como se verd en Ia Sec. 4.2.3, si se verifice que la funcidn de densidad espectral es no-acotada en ls frecuencas bas, limo, (a) =o ,entonces se dice que {J;} es un proceso de memoria larga (de acuerdo con la nomenclature de Robinson, P.M, (1964 y Bailie, RL. (1996), Sea 2} am rosso formado por varibles centres y sen {i} el proceso ques btn de st int, (2e") existe yes no-nula yi) que, de acuerdo scumulacion progresiva Y=, , ise verifie:) que la vaianza of. = lim cone! prineiplode invariancta, es posible aller porlomenos un valor de a {0} tal quese cumple siguiente convergencia déhil r Hj = oreB(a) (donde [an] denotale paneentera dean y B(2) denotaun proceso movimiento Brownians), entones se dice que el proceso {2} es de memoria corta (estas condiciones se conocen como condiciones de Lee, D.; Schmidt, P. (1996), ver ‘See, 4.1). Obsérvese que ls condicion de que un proceso sea estacionario de segundo orden no es necesaria para que sea de memoria ‘corta, Muchos autores consideran como condiciones necesarias para la memoria corta: i) Iaexistencia de os tmomentos absolutos de ‘orden s>2 ;i)elcumplimientode condiciones a-mixing con coefiientes a, tales que <2 (conocidas como condiciones 6e Philips, P.C.B. (1987). 132 Los procesos estacionarios de pardimetro discreto considerada como la contribucién a la variacién total de {¥;} de las frecuencias comprendidas en el intervalo (a,a + da) (ver Jenkins, G.M.; Watts, D.G. (1969), Dhrymes, P.J. (1971)(1974), Chatfield, C. (1975), Bloomfield, P. (1976), Granger, C.W.J.; Newbold, P. (1977), Priestley, B. (1981)). Teniendo en cuenta que e'*/ = cosa j) + isen(a j) , se puede escribir Jer alfooda) 1 sofa] Jovefoote) = sear) r= y, dado que y,(¥) es una funcién par, se obtiene (debe tenerse en cuenta que, si {y} es no-estacionario, ‘su funcién de densidad espectral no puede ser expresada como una suma de senos y cosenos): i) que y= Jovteode j)dar (j= 0,£1,42,..)) y Hi) que la funcién o,(a) también es par (por analogia con Ja funcién de autocorrelaciones, es posible definir una funcién de la forma of(a) = 2. de +2) p,(Veosa. | la cual, obviamente, posee muchas de las propiedades de la funcién de densidad it spectral ox( Eye than Sys0ess ony] |. =p fo 2D 7, Weofer/} i] 2.6.- La estimacién de la funcién de densidad espectral Si en la definicién dada en la seccién precedente se sustituyen las autocovarianzas por sus estimadores, por ejemplo, por: 70)-25.¢- se obtiene el siguiente estimador autorregresivo de la funcién de densidad espectral: ay(a)= 5) Ln (ota que no es consistente®, A fin de resolver este inconveniente se han propuesto modificaciones no- 8. Ver Akaike, H. (1969), Parzen, E. (1974), La funcién de densidad espectral 133 paramétricas de este estimador, cuya expresién general es de la forma: 6,(a)= =| dl aeoreade, iy (r)eos(ai) Donde el conjunto 4,4 ..-v4y, define la Hamada ventana del estimador y N, 4, las definiciones anteriores asumen la forma ”: shee] Usa) o(4@)= 1 re See] a) 50)u0)=2 Lal aue) (9) si {%}:7W- (0,02) (condicién suficiente para que q= 0), se verifica que EI; yla 5) wet) varianza anterior puede ser aproximada de fa siguiente forma: o*(A,(¥)) = i : Sustituyendo los p,(¥*) por sus estimadores muestrales se obtiene el siguiente estimador de la 22. Ver Mann, H.B.; Wald, A. (1943), Anderson, T-W.; Walker, A.M (1964), Anderson, T.W. (1971). 23. es deci, si 0f} admite una represntacion MA(g) (que serh ttada en Ia See 2.11) de te forma Yo 6,~O,6,-1"O fing (onde: 1) ¥, denote una variable entrada y spf }:17¥”~ (0,02) ),formado por variables con ‘momentos de cuarto orden proporcionales a of y momentos de sexto orden finitos. 136 Los procesos estacionarios de pardimetro discreto varianza de los estimadores de los coeficientes de autocorrelaci a= thao] ura Bajo el supuesto de que la hipétesis nula Hy:p,(Y)=0 es verdadera, de la misma forma (y en condiciones menos estrictas) que en el caso de los estimadores de las autocovarianzas, se demuestra que ndj(¥)—* N(Oi) * ‘Obviamente, apartir de una serie cronolégica {¥,%,...%,) nose pueden estimar autocovarianzas ni autocorrelaciones para 6rdenes mayores o iguales a 7, y es de suponer que para érdenes inferiores, pero préximos a 77, las estimaciones resultarén muy poco confiables, debido a lo reducido del conjunto de observaciones utilizado (habra muy pocos pares de valores (¥,.¥,.,) disponibles para realizar la estimacién). Algunos autores sugieren que las estimaciones "confiables" serdn las de orden menor o igual que ra para 2 50, otros indican que el test resultara mas confiable si_j< In(n) "6 A fin de decidir cudindo, en un proceso {¥;} con funcién de autocorrelaciones que se anula para todo j> q ,uncoeficiente ,(¥) puede ser considerado nulo y cuando significativamente distinto de cero, | 2s), Se podria construir un a partir de la informacién que proporciona la serie cronolégica {¥,} test en el que Hy:p,(¥)= 0 (para j>q ). Bajo el supuesto que la hipétesis nula es verdadera, utilizando Jn distibucionasinttica Normal conjunta y Ins aproximaciones mencionadas més arriba yconsiderando unnivel de confiabilidad del 95%, los limites de la zona critica estardn dados, aproximadamente, por los valores: (para js 4) Ys (Ia representacién gréfica de los estimadores ,(¥) y de los limites de las zonas de aceptacién de las hipétesis nulas de este test forman el correlograma”). ‘No obstante estas consideraciones, debe tenerse en cuenta que, para 6rdenes préximos a cero, los. +4, Ver Anderson, T.W. (1971), Brockwell, Pl; Davis, R.A. (1991). 15. Ver Box, GEP.; Jenkins, G.M, Reinsel, G.C. (1994), *€. Dobe tenerseen cuenta que estas condiciones son vilidas si el proceso no esté afectado por factors estacionales. 37 Denominacion debida a Wold, H. (1949). La estimacién de la funcién de autocorrelaciones 137 i ainy a i . 1 estimadores ,(Y) y £,.,(Y) son altamente correlacionados y con varianza apreciablemente menor que — Yy que, por lo tanto, el andlisis de la significatividad individual de los coeficientes p,(¥) no tiene sentido, dado que el test esté afectado por un sesgo hacia Ia aceptacién de la hipétesis nula, En consecuencia, la linica consideracién que se puede hacer sobre Ia funcién de autocorrelaciones se refiere @ su comportamiento global y se basa en un test "port manteau" que considera las primeras uf autocorrelaciones en conjunto, contrastando la hipétesis mula: Heal) = A(t) =.= ail) = 0 ‘con respecto a la alternativa: Hy:que por lo menos un p,(¥)(j = 1,2...) sea significative Bajo el supuesto de que la hipotesis mula sea verdadera, Box, G.E.P.; Pierce, D.A. 1(970) 2 propusieron el estadistico O”)(J) = n° Ai(Y)—*+ x3, . Ahora bien, las experiencias obtenidas de la utilizacién de métodos de simulacién’* demostraron que, bajo el supuesto de que la hipétesis nula que {u}9™N- (0,07) es verdadera, la distribucién z* no constituye una buena aproximacién de la distribucién del estimador de Of*”) , cuyos valores tienden a ser menores que los esperados a partir de la distribucién 77. Con el fin de superar esta falencia (y, en consecuencia, de aumentar la potencia del test), Ljung, G.M.; Box, G.E.P. (1978), basandose en la consideracién de que las varianzas de los estimadores n-J ay avener 1 . propusieron una modificacién del estadistico £)(¥) resultan mejor aproximadas por de Box-Pierce de la forma: - (18) AY) @ 2 A) = ns AO 2, (debe tenerse en cuenta que esta convergencia en-distribucién se verifica bajo el supuesto que 1a hipétesis nula que {¥;}:}7N- (0,07) es verdadera)". Una cuestién importante que surge de la aplicacién de este test radica en la seleccién del valor J :isetoma un valor muy bajo se corre el riesgo de dejar de considerar autocorrelaciones significativas de orden superior, si se toma un valor demasiado alto el test puede perder potencia debido a la inclusi6n de autocorrelaciones despreciables de orden alto”. 38 Ver Davies, N. Triggs, CM, Newbold, P. (1977). +5. Obsérvese que éste pertenece a la familia de las denominados tests de diagnéstico, ya que no requiere de le definicién de una hipotessalternativa especifica (la hipdtesis nula se contrasta con respecto a un conjunto de alternativas posibles). 20_Debe tenerse en cuenta que, en presencia de heterocedasticidad condicionada, se modifican las propiedades asintticas de tas covvianzas muestralesy,en consecuenci, los limites dela zona critica, Por ejemplo laipétesisnula H;p(V)=0 serdaceptada con 0 35% con, sven ut [0

0) y il) » definiendo por R(B) al conjunto de todas las combinaciones lineales finitas de elementos B’ (j=0,12,...),se demaestra que el digebra de operadores R(B) es isomérfica con respecto al algebra de funciones polinomiales R(X) ,en el dominio de los nimeros reales. Las expresiones MA.y AR de orden infinito como dos formas equivalentes de vrepresentacién lineal de un proceso estocdstico GRAFICO 2.2: Trayectoria del proceso {¥,} , | LAN 3 2004 2002 2003 1999 2000 CUADRO 2.1: Correlograma correspondiente al proceso {Y,}, cuya trayectoria figura en el GRAFICO 2.2 ‘Sample: 1999:01 2003:12 Included observations: 60 Autocorrelation Q-Stat Prob Partial Correlation AC PAC 1; 162 0.150 101 -0.079 135 0.118 80.026 0.017 10 -0.172 -0.199 11 -0.012 0.098 12 -0.018 -0.056 130.141 0.078 14 0.070 0.011 15 0.104 0.014 ig 0.0110 1.0783 1.2070 1.4088 2.5388 43434 5.0638 8.3708 6.4220 8.6358 2.6485 8.6728 10.257 10.857 11.548 0.917 0.583 0.751 0.843 o77t 0.630 0.652 0.606 0.697 0.567 0.854 0.731 0.873 0713 0.713 139 140 Los proceso estacionarios de parémetro discreto respuesta del sistema a un impulso) sea de cuadrado sumable, )y} < # ®. Como se vio en la Sec.1.5, en términos de la condicién de ergodicidad, resultan de particular interés aquellos procesos en los cuales la condicién anterior puede ser sustituida por la mas fuerte de ser absolutamente sumable, Ylwl< ao Con un razonamiento inverso, a partir del teorema de Wold, se dice que un proceso {¥} es estacionario si puede ser representado, a partir de un proceso {¢,}:WN - debi! , mediante la aplicacién del filtro lineal ¥(8)= Dov,B! (vo=)) donde cada y, representa la medida del impacto que ejerce sobre J; , un "shock" aleatorio ocurrido en elperfodo r~ j,y la suma de las ponderaciones (¥(1)= )'y, ) define la medida de la persistencia de rs la influencia de un "shock" aleatorio sobre el nivel del proceso. Teniendo en cuenta que”: 72. Le forma de decrecimiento de las ponderaciones v, permite concluir que todo proceso estacionariotiende a retornar asu valor ‘medio ya fluctuar asu alrededor en un rango mis 0 menos constant (propiedad conocida como de retorno al valor medio). Como se verd inmediatamente, la velocidad de este retomo estérelacionada con el comportamiento de las autocovarianzas (si los coeficlentesy,(Y) son todos nulos, el proceso es WN y el retomo al valor medio es instantneo, st sume valores significativos ero #) Sede, entonces, que {1} €sun proceso eausal oautorregresivo o independiente del futuro (ver Brockwell, PJ; Davis, R.A. (1987), Las expresiones MA y AR de orden infinito como dos formas equivalentes de 141 ‘representacién lineal de un proceso estocdstico y)(P)= BQ) = ASS veneatra) = av (vo=1) fas ¥, por lo tanto, que yo(¥)= of = 2) v7? (vo = 1), se puede concluir que, si el proceso es estable, su oe varianza es finita, es decir que la condicién o} < « esnecesariay suficiente para poder asegurar que {1;} es estacionario en las covarianzas. Se demuestra, ademés, que si la sucesién de ponderaciones {y,} es absolutamente sumable, entonces 7) |v,s|= D-|vi[Qo\va] < ys por lo tanto, las autocovarianzas ,(¥’) son absolutamente es we sumables, >)|y,(¥)|< = y viceversa (de acuerdo a lo demostrado en fa Sec. 1.5, si se cumple esta = condicién, se puede asegurar que {%} es un proceso ergédico)*. Como se menicioné en laSec.2.2, en general las autocovarianzas de un proceso lineal estacionario de segundo orden pueden ser obtenidas utilizando la funcién generatriz de autocovarianzas, re(B)= Diy,(7)8/ (donde BY = F/, denotando F un operador “forward” tal que FY; « ¥,.) ‘Reemplazando en esta definicién 7,(¥) por la expresion obtenida en la pagina precedente resulta: ro) Sete. 20 SS yvin8! y,teniendoen cuenta que, para 1< 0 sepuedeescribir yy(B)= 0)” > y,vi.)B/ ,aplicando lasustitucién =i, se verificard que, cuando j=-i, entonces h=0 y cuando h, de modo que J=@,h= © . Es decir, seré: (a= 8 SS ys = a Seo" Eve’ : a Sus! Eur] = 24(a)r(8) iOhe0 Asimismo, si el proceso {¥;} es estacionaris con funcién de densidad espectral continua, entonces, admite una representaciGn bilateral convergente dela forma ¥, = )>y,4,., ,donde {¢,}:W/N ~ i (0,02) (en realidad, la condicién de Normalidad no es esencial, las variables ¢, podrian ser, por ejemplo, uniformemente distribuidas), 28. como se vert en la Se. 5.2.2, de acuerdo con Ia definicién de McLeod, A.L; Hive), K.W. (1978) (ver Resnick, S.. (1987), Robinson, P.M; Baillie, RT. (1996)), sila funcin de autocovarianzas no es sbsolutamente tumable,entonces el proceso es puede ser considerado como de memoria larga. 142 Los procesos estacionarios de partimetro discreto Se dice que el proceso {¥} admite una representacién polinomial bilateral si puede ser expresado por un desarrollo convergente casi con certeza, de Ja forma: Pixniee ip U Luego, se puede concluir que: i) si_p=1, la representacién anterior es lineal e {%} es una serie cronolégica lineat (lo que demuestra que todo proceso Normal estacionario admite una representacién bilateral) y ii) si p> 1, {¥} es un proceso no-lineal, Sil proceso {17} es no-Normal, estacionario y su funcién de densidad espectral es positiva en casi todo su dominio, entonees se puede asegurar que también admite una representacién lineal bilateral. Si a la condicién de no-negatividad de la funcién de densidad espectral se agrega la condicion ‘ote eae > -« , entonces, se puede asegurar que existe una funciér g(a) tal que: x(a) = lor(@)} = er(a)o5(@) a cual puede ser desarrollada de acuerdo con una serie de Fourier de la forma @»(a)= )°w,e""*! y, por Jo tanto, que el proceso {¥} no-Normal estacionario admite una representacién lineal de la forma uo Sees (vor) Como se vio en la Sec.1.4.1, un proceso {¥} lineal estacionario es reversible en el dominio del tiempo, si admite las representaciones altemnativas ¥;= 7 v,6.. = Y1vjé;-, - Esta expresion permite im = deducir las siguientes propiedades sobre los coeficientes y, de esta representacién lineal bilateral: i) €s posible hallar un valor & <= yun se (0zl) tal que ¥s,.,=(-1)' vas, Y ii) sise verifica que yo =1 Y wj=0, para j<0 6 J>g, entonces, serd yy = Yyag = Vy (F= LDreeeg I) 29, Ly Wysrvy (J=1Qng-l) 0 veal y 2.9.26 La representacién AR Haciendo ahora ,j-> ¢ en la expresion: Ye Mest Yacpey ED t tig # Ayliegs t Opalenj at correspondiente al teorema de descomposicién, queda definida una representacién del proceso {¥} como ‘una combinacién lineal de sus realizaciones pasadas, mas un "shock" aleatorio que representa la capacidad 25 Opservese que éste es un proceso no-previsible a partir de su filtracién nataral porque requiere informacin sobre st ccomportamiento en instante posteriores @ £ Los procesos autorregresivos de orden p 143 de innovacién del proceso (representacién autorregresiva o representacién AR): y Ya Mago 6 (a mpenB dies (a), 5 donde: i) ¥, denota una variable centrada; i autorregresivo de orden infinito™. {a}:#W- v(0.02) y iii) 1(B) denota el operador Se denomina estructura temporal o esqueleto de una representacién AR a la expresion que se obtiene de considerar a las innovaciones, ¢, ,como constantes (o, lo que es equivalente, iguales a cero), para todo 1, es decir, a la parte del comportamiento de {¥} debida exclusivamente a su autorregresividad”, Silla sucesién de ponderaciones {x,} es tal que )°|x,|< = ; es decir, si el operador (2) es a ‘convergente para |B|< 1 , se dice que el proceso {¥,) es invertible. Aplicando m.a m. el operador ¥(8) en la representacién AR , se obtiene que: v(Byn(B)y, = ¥(B)e, = ¥, De lo que se concluye que ¥(B)N(B)= 1 . Es decir, que 11(8) = [¥(B)J' . De acuerdo con esta igualdad, se puede concluir que la estacionariedad resume el conjunto de condiciones necesarias para transformar una representacién AR en una representacién MA y, viceversa, la invertibilidad define el conjunto de condiciones necesarias para transfomar una representacién MA en una representacion AR estacionaria™, °°. Fue recén a partir de 1925 que E.Slutzsky (ver Slutzsky, E.(1925)(1927X1929)(1934)(1937) y G.U. Yule (ver Yule, G.U. (1927), mediante el uso de ecuaciones estocésticas en-ferencis lineal, introdujeron las (sin ninguna connotacién econémica) ociones de sistema lineal y esquemas autorregresivos aplicables a procesos pseudo-periddicas estacionarios con innovaciones aleatorias, logrando una interpretacion de la vinculacion entre los esquemas autorregresivos y sus correspondientesrepresentaciones MA (en sistemas lineales) propuesta en el tcorema de Wold (ver Wold, H. (1949)(1953)(1954) (1956), Abril, J.C. (2004)) Debe tenerse en cuenta que la metodologia expuesta aqui sobre procesos estocdsticos estacionarios, fils y componentes periédicos Variables son posteriores se deben fundamentalmente @ A, Khinchin, AIN. Kolmogorov y N. Wiener, 3), Ver Tong, H. (237). 52. La condicion de invertibilidad (que es atribuible alin a procesos lineales no-estacionarios) es independiente de la de «stacionaredad, Igual que laestacionariedad, a inveribiliad noes une propiedad de {2} exclusivamente.sino de la relacign entre los procesos{Y;} y {e} -Granger,C.W.J; Andersen, A. (1978 inrodujeron una efiniiGngenerlizada de invertbildadapicable ‘acualquier proceso de series cronologicas (iin aquellos no-ineales):Sea {Y,} un proceso que admite una representacién dela forma ¥, = = MMe Meron eFnpSitenr8ing) +6, A partir de una ealizacion {¥,¢=12,...} de este proceso, es posible obtener una cestimacién delasinnovaciones ¢, delaforma é =~ f(6.%1. Yoav Yap tmnbi-g) Sedicequeel proceso {Y;} esinvertible ‘en el sentido de Granger-Andersen, si se verifica que limo"(é, ~ ¢,)= 0 , para cualquier conjunto de estimaciones iniciales abs 144 Los procesos estacionarios de pardmetro discreto 2.10.- Los procesos autorregresivos de orden p 2.10.1.- Las condiciones de estacionariedad e invertibilidad Dado que las representaciones autorregresivas y en promedios méviles presentadas en la seccion precedente, involucran un nimero infinito de coeficientes (obviamente) no resultan utiles en las aplicaciones. En consecuencia, es necesario aproximar las representaciones de orden infinito mediante representaciones que incluyan un conjunto finito de coeficientes significativos. ‘Supéngase, por ejemplo, un proceso {¥,} que admita una representacién autorregresiva en la cual s6lo los p primeros coeficientes sean significativos, de la forma: Ye Mat hlatntt hap t (donde: i) ¥; denota una variable centrada y ii) {¢,}:#7N'- (0,03) ), se dice entonces que {%} es un proceso autorregresivo de orden p ( {¥;}:AR(p) ). Utilizando el operador "backward" definido en la Sec.2.9.1, se puede escribir: (1-4 B- 5? 52°), = 0(8)% = (1-Gr'ai-G2).(1- 6,8) = 4 donde ©(8) denotael operador autorregresivo de orden p” ylas G-" (i= 12, de las raices de la ecuacién caracteristica del AR(p): .p) denotan las inversas (8) = 1- 6B~ HBP. 6,8" = 0 La correspondiente representacién en promedios méviles del proceso AR(p) seri, entonces, de la forma: Como se vio en e! apartado precedente, la condicién de estacionariedad esta relacionada con la convergencia del operador ¥() para |B| < 1 ,y para que esa convergencia se cumpla, debe verificarse que lor|<1G ‘condicién de estacionariedad de un AR(p) es que todas las rafces de su ecuacién caracteristica sean, en ‘médulo, mayores que la unidad™*, |2,05p). ES decir, que la condicién necesaria y suficiente para el cumplimiento de la 35, seaun proceso {2} estacionario de segundo orden, con valor medio m(’*),surepresentacion 472) ser del forma (97 -nf?*)) = (1-8 #17 nf") =, sds seputecsei {BY —(I— A=) eslomismo O{B)%" = O(1}m{¥") +6, = % +6, 6, o,loque 34 Bneste caso, cuando 1—»<0, {Y;} tiendea una constant finita inica e independiente del valor inicial -que define su atractor puntua. ise erie que la eouaia earacteristea ene un rien mul, menor qe launidd,entonces, cuando 1», {i} tiende a infnit,geneando una situacén inestable i se verifica que la ecuacin carateritc iene algunas rics gules af Los procesos autorregresivos de orden p 145 Una condicién necesaria para que se verifique que |G|>1(/=1,2,..,p) es que g+ Ate + dy <1. Como los ¢, pueden ser positivos o negativos, una condicién suficiente para esta propiedad . Se puede asegurar que la ecuacién en- Oph es que |4|+|¢s[+..-¢,| <1. Si se verifica que 4+ A+..t¢, diferencias que rige el comportamiento de la estructura temporal de {2}, ¥,~ 4.1 al menos una raiz unitaria’*. 0, posee Por otra parte, dado que la representacién 4R(p) del proceso {¥} involucra sélo un mimero finito de coeficientes, se puede asegurar que la condicién de invertibilidad se cumple en todos los casos. 2.10.2. La funcién de autocorrelaciones Dado que se supuso que las variables ¥, son entradas, multiplicandom. am. larepresentacién 4R(p) del proceso {¥} por ¥..,,y aplicando m. am. el operador esperanza matemitica, se obtiene el siguiente sistema de ecuaciones en diferencias para la funcién de autocovarianzas™: 130) #000) 7a) tpg (P= (I~ 6B 4B? ..-dpB” Wy (Y= 0(B)r,(Y)= 0 (F= 12.) Para j= 0, se obtiene que £(¥45) = 3°y,6(«.,6)= 22 por lo tant, ser i rot) = oF = A (V)+ daralYPent dl t)+ 02 Para la funcién de autocorrelaciones se obtiene, a su vez, el siguiente sistema de ecuaciones en- diferencias: PAY) = AP )(8) + #02 1) bp. (P) (i= 12.) Estas ecuaciones en diferencias son del mismo orden y con los mismos coeficientes que las. correspondientes a la estructura temporal del proceso {¥,} , por lo tanto, si el proceso es estacionario y las raices de la ecuacién caracteristica son todas distintas entre si, la funcién de autocorrelaciones””: unidad, se genera una situaci6n neutralmente estable, cracterizad por un comportamiento de {2;} eventualmenteoscilnte en junto de puntos euyos valores dependen del valor iniial (debe tenese en eventa que las ecuaciones en-iferencias lneales no Smith soluciones peiSdicasestables independientes del valor ical) 25, Como se mencioné en la seecin precedents, esa represntacién de proceso {1} como una ecuacion en-ifrencis (en io desprovista de cualquier interpretacion probabilistca) se debe a G.U. Yule (ver Yule, G.U. (19111927), Yule, GU Kendal, MG: (1950), 26,Debe tenerseen cuenta que EY.) = Sv, E(6-,8)=0(2 1,06 =!) 3? Latnia diferencia entre a cstructra temporal del proceso {Y} su funcin de autocorelaciones es qu, mientras a primera ‘puede asumir cualquier valor real, la segunda esta restringida a limites muy precisos. No obstante, dado que los verdaderos valores eos coefcientes p,(P) son desconosids para el observador y que, por lo tant, sus propiedades deben ser analizadas a patr de sus estimadores, debe tenerse en cuenta que la observacin de un cierto comportamiento en la sere eronogicano necesariamente 146 Los procesos estacionarias de pardimetro discreto (donde 8, et (riginadas por las raices reales de la ecuacién caracteristica @(B) = 0) y por una suma de funciones sinusoidales amortiguadas (originadas en las raices complejas de dicha ecuacién). Se puede concluir, entonces, que la funcién de autocorrelaciones de un proceso AR(p) queda univocamente determinada por os P primeros valores de /(¥)**, A partir de la definicién obtenida para yo(Y) resulta que: Opp (¥)+ e Ts da()+ del). y,por lo tanto, que o? = I[- 07)- b.a0)---4,0,(0)] .€5 decir, que oe AA?) é0(¥) peg lt) ‘Como se vera més adelante, esta expresién conduce a una descomposicién de la varianza de acuerdo con las “contribuciones” correspondiente a las distintas autorregresividades que afectan el comportamiento de {x) 2.10.3.- La estimacién de los coeficientes Tomando las p primeras ecuaciones del sistema obtenido en la Sec. 2.10.2 para la funcién de autocorrelaciones, suponiendo que p sea conocido o, en caso contrario, que haya sido estimado en forma. consistente (ver Sec. 2.10.5), se obtiene el denominado sistema de Yule-Walker, cuya solucién, a partir de la sustitucién de los coeficientes ,(¥) por sus estimadores: Ali) = 6+ BA(H)+ + bBp-Al?) BQ) = HA(1)+ htt pb pal) By(1)= AB pi(t)+ HBp-alPe ot bp ‘debe conducir a una Unica representaci6n dptima del mecanismo generados de dichos datos. Puede haber otras representaciones ‘compatibles con la misma serie eronologica. 3®. En general, se verifica que, para aquellos érdenes para los cuales la funcidn de autocorrelaciones es marcadamente signficativa, el comportamiento dl proceso puede ser aproximado mediante modelos linales. Para ls érdenes mis alejados de cero on bajas autocorrelaciones es mis apropiada una aproximacién no-lineal Los procesos autorregresivos de orden p 147 proporciona los estimadores de Yule-Walker de los coeficientes (4(”"",40”....6("") que permiten construir el modelo”: FAY AY 4A WY En forma matricial este sistema puede ser expresado de la siguiente forma: B01) F,(0)0, donde 4,0) =[A0) AQ) A). & # ¢] y, como se vio en la Sec. 2.7: 1 AR) AG)» Balt) pp am Ba Brat) Bpalt) BpslY) 1 es una matriz no-singular. De modo que 60) = 8;(¥)A,() ¥s fal \(1- 82", (0)) = FP AR (2}82™) = Fe(II AF 092,0)] Estos estimadores (dado que se obtienen de igualar las autocovarianzas a sus correspondientes estimaciones) son asimilables a aquellos obtenidos por el método de los momentos y, suponiendo que el orden p sea conocido, son asintdticamente eficientes y convergen en-distribucién a la funcién Normal cuando » aumenta indefinidamente. Los estimadores minimo-cuadriticos de los coeficientes se obtienen de aplicar el criterio de optimizacién de los cuadrados minimos ordinarios (CMO): f= Se = min om L(A OM ood (donde {é} denota el proceso residual, que constituye la estimacién del proceso representativo de las innovaciones, {«,}, y representa la parte de {¥} no explicada por el modelo 4R(p)) como aquellos valores que anulan las derivadas parciales de primer orden: (f= 12,.5p) Estos estimadores -que son asintéticamente equivalentes a los de Yule-Walker- s6lo son formalmente anélogos a los obtenidos en el modelo lineal general, ya que en los modelos dinémicos no se verifican algunos de los supuestos clasicos (por ejemplo, no se puede concebir a Y,.,%-sy.-Y-p COMO variables deterministicas exégenas, y a ¥, como una variable aleatoria). Si se verifica que ii) de {«) snv - (0,02) . se demuestra que: i os estimadores 4) son asintdticamente eficientes; 35. peste tipo de modelos se los califica como estoctsticos para distinguirlos de aquellos modelos deexistencia puramente ideal en el émbito de los fendmenos ficticos-llamados deterministieos- que proporcionan predicciones ciertas. 148 Los procesos estacionarias de pardimetro discreto acuerdo con los postulados del teorema de Mann-Wald (ver Mann, H.B.; Wald, A. (1943)), la variable a(i—a}vlGe"—a).: aa(Ge"-4,)) converme endistibucién a una variable Normal. p- dimensional con valor esperado nulo y varianzas y covarianzas finitas y iit) los estimadores g(° son consistentes. En el caso en que {¥;} sea un proceso Normal, se puede obtener una estimacién maximo- vverosimil condicionada por los valores de las realizaciones ¥j¥jy.uJ, . A partir de la distribucion de probabilidades conjunta de la variable {61,6 ,.a>-6} se obtiene la funcién de probabilidades conjunta de la variable {1.1.2.2 art Los estimadores méximo-verosimiles se obtienen, entonces, de minimizar la funcién: Xbi- opt (amo? Oe ope a epee a be Sian, por lo que se puede concluir que, en las condiciones mencionadas, los estimadores méximo-verosimiles son equivalentes a los minimo-cuadraticos"" En las aplicaciones econémicas, en las cuales las series cronolégicas no suelen ser suficientemente largas, los més convenientes son los estimadores méximo-verosimiles, tomando los estimadores de Yule-Walker como valores iniciales en los algoritmos de optimizacién". La matriz de varianzas y covarianzas de los estimadores es de la forma: #°. si tahipotesis {4)}:17N ~ N(0,02) no se verifica y, ademés {J,) presenta “outliers”, es preferible utilizar métodos de cstimacin robusta (ver Martin, R.D. (1981), Martin, R.D; Samorov, A.; Vandaele, W.(1981),Birch, JB.: Martin, RD. (1981)). Para tps constderacones nee das metodo de esac dln unas minis, de mania vrs y eos momentos, vet Cap. #2 Ver Newbold, P, (1974), Granger, C.W.1. Newbold, . (1977). 42 Ver Ansley, C.F; Newbold, P. (1980). Los procesos autorregresivos de orden p 149 De acuerdo a lo demostrado en las paginas precedentes, sera: 1,(8)= ZrolA(t- ep (90, )F5'0 Sustituyendo en esta ecuaci6n los coeficientes por sus estimadores, se obtiene el estimador de la 20 90%,)r7'0) matriz de varianzas y covarianzas de los estimadores, 7,(3)-20 - 7}, (7) . Luego, a partir del supuesto que {¢,}:N(0,c2), se verificaré que: 2300), P70) donde 6222. A fin de decidir acerca de la significatividad individual de los coeficientes 4,, lo habitual es utilizar la misma metodologia que en los. modelos clisicos de regresién lineal mediante la construccién de un test" Yutilizando un estadistico de la forma 7{¢,) = ayn (i= 1.2,...p) (siel modelo posee término independiente, la distribucién del estadistico T serd 4,_,..) ). Ahora bien, dado que, obviamente, estos estadisticos, bajo el supuesto que Ta hipétesis nula 14, = 0 en verdadera, no tienen distribucién "teste test es iil s6lo si los mismos resultan “marcadamente significativos”. Si su significatividad es débil no se debe confiar demasiado en el test, dado que las variables ¥, pueden muy bien no ser Normales. Debe tenerse en cuenta, ademés, que en las proximidades de la no-estacionariedad, los estadisticos T son muy sesgados. 2.10.4.- La funcién de autocorrelaciones parciales La funcién de autocorrelaciones parciales, ¢,(¥)(j=12....), es una funcién de los coeficientes de autocorrelacién p,() que contribuye a seleccionar “a priori” el orden p adecuado en una representacién autorregresiva, a partir de las p< 12,..) primeras ecuaciones del sistema de infinitas ‘ecuaciones en diferencias que, como se vio en la Sec. 2.10.2, define el comportamiento de la funcién de autocorrelaciones. La autocorretacién parcial de orden j (4,(¥”)) puede ser definida como el grado de relacién lineal entre las variables ¥,., e ¥; depurada de las influencias que sobre ambas ejercen las variables intermedias, ¥1,Yays¥,-(. + Como se vio en la Sec.2.10.1, de la aplicacién a las variables ¥, e ¥,_, de representaciones AR(j~1) de la forma: Y= yrs yaar Bay le(yay #2 (ya) Bs 150 Los procesos estacionarios de pardmetro discreto se obtienen las perturbaciones ¢,_, y ¢,. La autocorrelacién parcial de orden j puede ser definida, entonces, como la correlacién entre las perturbaciones ¢,., ¥ ¢,: rant) Ao Si, como en los casos que se han tratado hasta ahora, el proceso {¥;} no es reversible, la relacién causal entre la variable ¥,_, y las variables posteriores ("futuras” para la variable ¥,.,) ¥.s.%2.34y.) Hl = AX Bal seré nula, de modo que ¥.., = ¢,.; y, por lo tanto, el coeficiente ¢,(¥) puede ser definido como la correlacién entre la variable ¥,_, y laperturbacién obtenida de aplicar al proceso {¥,} una representacion 4RG-1), 450) = Aes) A partir de las ecuaciones: als Sonn 1) | (12) Dope (donde 4, denota el j-ésimo coeficiente de un proceso-autorregresivo de orden p), se obtiene el siguiente sistema de ecuaciones de Yule-Walker: PAL) = bPiaCt)+ GyaPp-2(¥} ot bp,p-Prpeill)+ SpPjnp(F) (FBP) cuya solucién, para p= 1, proporciona el coeficiente de autocorrelacién parcial de primer orden, 4,(Y)= a(¥) -Delamisma forma, para p = 2, el sistema de ecuaciones de Yule-Walker asume la forma: an nl?) ta al?) = b+ baal?) ©, utilizando notacién matricial, [28 i]. 0% el donde P,(Y)= io De la solucién de este sistema de ecuaciones se obtiene el coeficiente de autocorrelacién parcial de segundo orden: aw) at . De modo que: (¥) tal)= Atos) = BORO Para p=3, sera: $3. 4 partir de la interpretacién que figura en el texto, se obtiene que —¢aa(¥)= Aa ~ Aliasti~ A ral?) -2a(P)r(F)~ oF (P)ro() _ al) = 2i(2) “Aes ARMac AM Trae -au PT AD) Los procesos autorregresivos de orden p 151 aC) = bal?) + baal¥)+ bs L(Y) = bAi()+ bn + bsei(¥) PAY) = bi + bA(¥)+ bsen(¥) ‘A partir de las dos iiltimas ecuaciones de este sistema se puede obtener una expresién para los. coeficientes ¢, y 44, en funcién de gy : buPF)= AMA) [A(Y)- #- daesQ)]- nei) baPi()= 0F(Y)-[Ax()- da ~ bra()]- bse (Y) Es decir, al)o(?)- bsof Oe A?)+ 6:00) ala) ba] [al)- ue()] 1 p(t) 1 p(¥) fp = At éa()+ 20)- daa) __-[a0)- ¢:a0)]+ aMal)-s00)) 1 AQ) 1-2) sy ©, utilizando notacién matricial: 1 fae) -1 Ya.0)- #200), pag aQ)- ¢9a0)] er selena) ORG ee ole awelaeal al ale] Es decir, se puede escribir: Reemplazando estos resultados en la primera ecuacién del sistema que figura en la pagina precedente, p(¥)= #0,(V)+ de\(¥)+ ds » Se obtiene el coeficiente de autocorrelacién parcial de tercer orden: PAY) be,(¥)- 620,(¥) 10) = alt) baa) __ En general, la funcién de autocorrelaciones parciales puede ser expresada de la siguiente forma reoursiva: t)- So weil) $,(1)= 2} ——_ (i= 283) - oe Pl?) (donde $y = $1, ~ $)(7)4)a,-1 (7= 1.2...) )- Expresion conocida como algoritmo de Durbin-Levinson 152 Los procesos estacionarios de pardmetro discreto (ver Durbin, J. (1970), Brockwell, P.J.; Davis, R.A. (1987) Utilizando notacién matricial se puede escribir: ) i) (i= 12,..)) 6”) don: 1 AQ) AQ)» e.2lt) alr) AY) 1 A)» al) a) pal) ual?) al) 1 0,0) Py(P)= y P(¥) es la matriz de Laurent definida en la Sec. 2.7. Para un proceso autorregresivo de orden p, la funcién de autocorrelaciones parciales asume valores significativos hasta el orden p , y después se anula. Lo cual implica que, obviamente, para j > p no existe relacién lineal directa entre las variables ¥,_, © J, la tnica relacién existente se debe a que las variables estén vinculadas secuencialmente a través de las variables intermedias. Esta propiedad, como se mencioné al comienzo de esta seccién, convierte a la funcién de autocorrelaciones parciales en una herramienta esencial en una seleccién “a priori” del orden mas adecuado de la representacién autorregresiva de un proceso estocéstico. En los cuadros 2.2 y 2.3 figuran las funciones de autocorrelaciones y de autocorrelaciones parciales tipicas de los procesos R{(1) estacionarios y, en los cuadros 2.4, 2.5 y 2.6 figuran las funciones de autocorrelaciones y de autocorrelaciones parciales tipicas de los procesos 4R(2) estacionarios (los procesos AR(I) ¥ AR(2) serdn tratados en particular, en las secciones 2.10.7 y2.10.8). Si en las expresiones anteriores se sustituyen los coeficientes ,(¥) por sus estimadores, se obtienen los estimadores minimo-cuadraticos de los coeficientes ¢,(¥) de un modelo AR(j): i) - F(7) (J= 12...) Quenouille, M. H. (1949) demostré que, bajo el supuesto que la hipotesis mula Hy:4R(p) es verdadera (€s decir, bajo el supuesto que la hipétesis nula Hy:¢,(¥)= 0(j= p+1,p+2,..) es verdadera), los estimadores 4,(¥) (j= p+ 1,p+ 2.) sonaproximadamente independientes, con varianzas o*(9,(¥)) = + y asintéticamente Normales “ . Es decir, que: 40)—n(0:4) (i= petp+ don) Debe tenerse en cuenta que cuando una o mas rafces de la ecuacién caracteristica sean préximas “4 Vertambién Jenkins, G.M. (1954)(19S6), Jenkins, G.M.; Watts, .G. (1968), Kendall, MG. (1973), Box, G.E.P, Jenkins, GM; Reinsel, 6.C. (1994), Los procesos autorregresivos de orden p 153 CUADRO 2.2: Correlograma correspondiente a un proceso {¥,} que admite una representacion AR(1) con @,=0.7 ‘Sample: 2000:01 2004:12 Inchided observations: 60 Autocorrelation Partial Correlation AC PAC Q-Stat Prob 0.898 0,898 0.487 -0.002 0.338 -0.002 0.233 -0.003 0.158 -0.003 0.107 -0.003 0.070 -0.004 0.044 -0.004 0.025 -0.004 10 0.011 -0.005, 11 0.001 0.005, 12 0.007 -0.005 13 -0.013 -0.005 14 -0.018 -0.008, 15 -0.021 -0.008 30.42 45.923 53.370 56.081 58.600 59.491 50.837 59.973 80.018 80.027 80.027 60.031 60.044 60.068 80.108 0.000 0.000, 0.000 9.000 0.000 0.000 0.000, 0.000 0.000 90.000, 0.000 0.000, 0.000 0.000, 0.000 CUADRO 2.3: Correlograma correspondiente a un proceso {¥,) que admite una representacién AR(1) con 9,=-0.7 Sample: 2000:01 2004:12 Inchided observations: 60, Autocorrelation Partial Correlation = AC PAC Q-Stat Prob 1 -9.700 -0.700 2 0.490 0.000 3 0.343 -0.001 4 0.240 -0.001 5 0.188 -0.001 0.117 -0.001 -0.083 -0.002 0.057 -0.002 0.041 -0.002 0.028 -0.003, 0.020 -0.003 42 0.013 -0.003 13 0.010 -9.003 14 0.006 -0.004 15 -0.005 -0.004 30.808 48.203 53.977 57.801 50.717 60.665 61.145 81.380 61.501 61.550 81.500 61.804 81.612 84.615 81.818 0.000 0.000 9.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 154 Los procesos estacionarias de pardmetro discreto CUADRO 2.4: Correlograma correspondiente a un proceso {Y,} que admite una representacin ARQ) con @.=0.45 y 9370.35 ‘Sample: 2000:01 2004:12 Included observations: 60 10.721 0.721 2 0/888 0.300 3. 0.548 -0.022 4, 0471 0.004 5° 0.304 -0.008, 8 0.333 0.008, 7 0.277 0.008, 8 0.230 -0.007 8 0.188 -0.007 10 0.152 -0.008 14.124 9.008 0% 13 00 1 2 1 083 -0.008 88 0.009, (047 0.008, 128 -0.008 0: 9: 9: 0. 0. 0. 0. 0, ‘Autocorrelation Paral Corelation AC PAC OSiat Prob | 32.742 81.352 80.776 95.525 108.03 113.65 118.04 122.82 12540 127.12 128.22 128.80 129.28 12044 120.54 0.000 0:00 0.000 0.000 0.000 0.000 0.000, 0:00 0,000, 0.000 0.000 0.000 0.000 0.000 0/000 CUADRO 2.5: Correlograma correspondiente a un proceso {¥,} que admite una representacién AR(2) con @,=1.18 y 9,=-0.35 Sample: 2000:01 2004:12 Inckided observations: 60 Autocorrelation Partial Correlation AC PAC. Q-Stat_ Prob 18 0.878 0.878 0.684 0.377 0.498 0.010 0.345 -0.003 .230 -0.003 0.147 -0.006 0,080 -0.004 0.050 -0.004 0.023 -0.005 10 0.005 -0.005 14 -0.008 -0,005 12 -0.016 -0.006 .023 -0.008. 14 -0.028 -0.008 15 -0.031 -0.007 48.582 0,000 78.584 0.000 94.742 0.000 102.88 0.000 108.24 0.000 107.73 0.000 108.30 0.000 108.47 0.000 108.51 0.000 108.51 0.000 108.52 0.000 108.54 0.000 108.58 0.000 108.64 0.000 108.73 0.000 Los procesos autorregresivos de orden p 185 CUADRO 24 : Correlograma correspondiente a un proceso {¥,} que admite una representacién ARQ) con 9;=-0.45 y @5=-0.30 ‘Sample: 2000:01 2004:12 Included observations: 60 11.488 0,001 12.249 0.002 14.251 0.003 14/398 0.008 14.488 0.013 141523. 0.024 14.524 0.043 14.528 0.060 14528 0.105 10 0.000 0.002 14.520 0.150 11 0.002 -0.003 14.528 0.205 12 0.000 -0.003 14.520 0.268 13 0.000 -0.003 14.529 0.395 14 -0.001 -0.003 14.529 0. 15 -0.001 -0.004 14.528 0. a la unidad, estas propiedades de los estimadores ¢,(¥) se debilitan Ejemplo 2.2: Sea un proceso {J;} expresado en términos mensuales, cuya trayectoria para el periodo [ENE- 1997;Dic-2003) figura en el GRAFICO 2.3 y cuyos estimadores de las funciones de autocorrelaciones y autocorrelaciones parciales estén representadas en el correlograma que figura en el CUADRO 2.7. De la observacién de los estadisticas Q, (j= 1,2,..20) se puede concluir que existen razones suficientes para rechazar la hipétesis nula Hy:(¥}:AR(0) @ partir de j La consecuente observacién de los estimadores individuales de la funcién de autocorrelaciones parciales permite concluir que el coeficiente 4,(¥) puede ser considerado significativo con una confiabilidad del 95% y que, a partir de j= 2 y con el mismo nivel de confiabilidad, no existen razones suficientes para rechazar ls hipétesis de nulidad individual de los ¢,(¥) (para a = 0.05 , los limites de la 2 zona critica estan dados por + #0218). Luego, considerando Ja forma de decrecimiento de las funciones de autocorrelaciones y de autocorrelaciones parciales, se puede concluir que, en principio, el proceso {¥;} admite una representacién ARQ). 2.10.5.- La seleccién del orden de autorregresividad Elproblema de la seleccién del orden de autorregresividad en los modelos AR constituye un caso particular de la cuestién relacionada con la seleccién de modelos en general (estaticos con multiples variables explicativas, de funciones de transferencia, vectores autorregresivos, autorregresivos con 156 GRAFiCO 2. CUADRO 2.7: Correlograma correspondiente al proceso {¥,} euya trayect Las procesos estacionarios de pardmetro discreto Trayectoria del proceso {Y,} para el perfodo ENE-2001;DIC-2007) 18 1.0. os GRAFICO 2.3 ‘Sample: 1997:01 2003:12 Inchided observations: 84 Autocorrelation Partial Correlation AC PAC Q-Stat_ Prob 0.739 0.739 47.583. 0.000 0.542 -0.011 73.458 0.000 369 0.062 85.614 0.000 195 -0.120 88.047 0.000 055 0.087 80.327 0.000 0.072 0.100 89.810 0.000 0.101 0.087 80.769 0.000 8 -0.126 -0.034 92.278 0.000 9 G.104 -0.052 93.310 0.000 10 0.084 0.09 93.715 0.000 11 -0,046 -0.177 93.922 0.000 12 0.030 -0.211 94.010 0.000 13 0,009 0.068 94.018 9.000 14 0.002 0.047 04.019 0.000 15 0.031 0.037 84.119 0.000 16 -0.032 0.036 94.230 0.000 17 0.014 0.108 94.253 0.000 18 0.078 0.158 94.912 0.000 49 0.148 0.052 97.348 0.000 20 0.184 -0.004 101.18 0.000 0. 0. figura en el Los procesos autorregresivas de orden p 157 heterocedasticidad condicionada)**. El criterio habitualmente aceptado es que cuantas més variables explicativas se incorporen al modelo (es decir, cudnto més complejo sea el modelo), mayor seré su grado de representatividad del comportamiento del proceso, Los métodos de seleccién intentan, precisamente, optimizar la relacién entre la complejidad y el grado de explicabilidad del modelo mediante la combinacién de funciones de distancia al modelo 6ptimo y funciones de penalizaci6n por e] aumento de la complejidad del modelo“. Historicamente. el primer criterio de seleccién de modelos fue el coeficiente de determinacién ajustado: Le nl Sh "PSG -¥ cuyas limitaciones en los modelos dindmicos seran comentadas en las secciones 2.10.7 y 2.10.8 y analizadas con més detalle en la Sec. 6.1.7. Debe recordarse que el criterio de determinacién: aumenta su valor siempre que se agrega al modelo una variable explicativa, sin tomar en consideracién su contribucién a la representacién de {¥) . Un segundo método de seleccién que no pertenece a la familia de los criterios con término de penalizacién, debido a Quenouille, M.H. (1947), se basa en los tests de significatividad conjunta de los coeficientes de una representacién. Por iiltimo, a fines de la década de 1960 y comienzos de la década de 1970 surge una nueva metodologia basada inicialmente en los trabajos de Akaike, H. (1969) y Mallows, C-L. (1973) y continuada (en forma acorde con el desarrollo de la teoria de la informacién y en funcién de la medida de distancia dirigida de Kullbac-Leibler) en los trabajos de Akaike, H. (1973)(1974), Estas propuestas fueron completadas por las publicaciones de Bhansali, R.J.; Downham, DY. (1977), Akaike, H. (1978), Schwarz, G. (1978), Hannan, E.J.: Quinn, B.G. (1979). Geweke, J.; Meese, R. (1981), Shibata, R. (1981), Hurvich, CM; Tsai, C.L. (1989). 2.10.5.1.- Criterios eficientes y criterios consistentes La clasificacién de los criterios de seleccién del orden de autorregresividad en consistentes y efieentes se basa, respectivamenteenel supuesto de que a verdadera representacion de proceso pueda ser considerada o no como perteneciente al conjunto de los modelos candidatos” Estos modelos ser tratados en las partes segunda y tercera de este trabajo, 46. Con respecto al significado de la condicion de optimo, debe tenerseen cuenta la opinion de G. Box seginel cual All models ‘are wrong, some models are useful” 47. Obsérvese que la clasificacién de un crterio como consistente implica suponer que el proceso es anticipatorio (de acuerdo con la nomenctatura de Rosen, R, (1985)), en otros términos que, con respecto este proceso, la tesis de Turing-Church es false Esta tesis, desarrlads por el logico Alonzo Church a partir del trabajo de Alan Turing, supone que la complejidad de la estructura causal de un proceso (uni o multidimensional) involuera més vinculos que cualquier expresién sintictica (modelo) de su 158 Los procesos estacionarios de pardmetro discreto ‘Sea un proceso {1} (t= 1,2...) estacionario de segundo orden y tal que las variables ¥; sean centradas. Si se supone que su verdadera representacién AR es de orden infinito, entonces se puede concluir que el conjunto de las representaciones AR candidatas de orden finito no contiene a la verdadera, En este caso el método de seleccién consiste en elegir aquella representacién de orden finito que se aproxime més a la verdadera. Obviamente esta idea de mejor aproximacién implica la minimizacién de una funcién de distancia (0 diserepancia“ o informacién) entre la verdadera representacion y cada una de las representaciones candidatas. Se dice que un criterio de seleccién del orden p es asintéticamente eficiente” si, para una serie cronolégica suficientemente larga, la funcién a minimizar es la distribucién del error medio cuadratico que se genera al aplicar un modelo distinto del verdadero o, alternativamente, el error medio cuadratico de la prediccién que proporciona el modelo candidato®., ‘SupOngase que la verdadera representacion del proceso {¥;} sea de orden finito y que, por lo tanto, esté incluida en el conjunto de las representaciones candidatas, entonces el método de seleccién consiste en identificar, en este conjunto, la verdadera representacién'". Este criterio de seleccién, que identifica asintSticamente el verdadero modelo con probabilidad igual a uno, se dice que es consistente® (obsérvese que, mientras en los criterios eficientes existe una probabilidad no-nula de estimacién errénea del orden p , en los eriterios consistentes, esta probabilidad es asint6ticamente nula). La estimacién errénea implica una subestimacién o una sobre-estimacién del orden p . Se dice ‘que una representacién esté subsestimada (sobre-estimada) si su orden de autorregresividad es menor (mayor) que el de la verdadera representacién. problema que e presenta habtulmenteen las aplicaciones se reduce a seleccionar el mejor dde un conjunto de modelos candidatos. La regla en estos casos es que el mejor modelo es aquél al que le corresponde el menor valor del criterio de seleccién, Sean CSM(p,) y CSM(p,) los valores asumidos por un criterio de seleccién para dos modelos AR(p,) y AR(p2) , respectivamente, siendo p,> entonces, si se verifica que CSM(p,) < CSM(p,) , se considerara que el primer modelo es preferible al segundo. La esperanza matemética de Ja variable que representa la diferencia entre ambos valores, £[csM(p.)- CSM(p)] define una medida denominada sefial del criterio deseleccién, S{CSM(p,,P2)] (que, en series cortas, depende fundamentalmente de la importancia relativa de la funcién de penalizacién del criterio), y su desvio esténdar, of CSM(p;)- CSM(p))}, define otra medida denominada ruido det ‘comportamiento (ver Davis, M, (1958), Kolmogorov, AN. (1965), Rosen, R.(1962)(en Day, D.H.; Groves, T. (eds. (1975), (@ ‘Mints, S.L,; Perlmutter, A. eds.) (1985)}(1988), Davis, M.; Weymuker, E. (i983), hatin, G,(1987)(1988)(1990), Wang, H.(1987), Cast, L (1991), Cast, Li; Karqvist, A: (1991), 48 De acuerdo con la denominacion de Haldane, 1B.S. (191) 4° Denominacion debida a Shibata, R. (1980). 5°. Como se veri en las seeciones siguiente, entre estos criteros cabe mencionar el PRESS de Allen, D.M. (1974) y el FPE de ‘sig H. (196). Paroun ns dearer los critros epreiecin ya propiedad de fini asin, ver Shibata R.(1980), 51. E| gupuesto de la existenci, en todo caso, de una verdadera representacién que pertenece al conjunto de ls representaciones candiatas es, obviamente, una restrccién muy fuerte y justficable inieamente en aquellos imbitos que poseen slidas estucturas feérieas como justificacion del comportamiento de los procesos. Se puede conclu, entonces, que ia preferencia enre estas dos clases Ge terion lesion, bien puede ves condone por factors ales como le compeidad del representa, se asa co razones fundamentalmente subjtivas. 5. Opsérvese que ests criteios consstentes, en virtud de su definicién, no utilizan ninguna medida de diserepa Los procesos autorregresives de orden p 159 criterio de seleceién, #(p,,p;) (que depende de las distribuciones de probabilidades de las sumas de los cuadrados de los residuos y de sus diferencias). A partir de estos momentos de la variable diferencia es posible calcular el cociente seflal-ruido del criterio de seleccién como: esu(nun)]_ sfesule)- cout svfesdn, ne Hesecel feel eda (a Si se verifica que la funcién de penalizacién por el aumento de la complejidad de un modelo es ‘més débil que el ruido correspondiente, entonces al criterio de seleccién le correspondera una seftal débil, uncociente SW débil (decir que un coeficiente SW es débil significa decir que asumira valores positivos proximos a cero 0 negativos ( SW” < 05)) y estar afectado por un sesgo hacia la sobre-estimacién. Por el contrario, cuando la funcién de penalizacién es més fuerte que el ruido, el cociente SW” asume valores positivos marcadamente significativos ( SW > 2 ). No obstante, debe tenerse en cuenta que en este caso, si la funcién de penalizacién es demasiado fuerte, el cociente SW se volverd débil y el criterio de seleccién estard afectado por un sesgo hacia la subestimacién. Para series cronologicas de dimensién < 100,, se puede asegurar, en general, que cuanto més fuerte sea el cociente SW menor seré la probabilidad de seleccién de un orden de autorregresividad equivocado y, viceversa, siel cociente SW’ es poco significativo, en particular, si es negativo, 2,10.5.2.- Las medidas de distan Como se mencion6 en la seccién precedente: i) si la verdadera representacién pertenece al ‘conjunto de las representaciones candidatas, la forma natural de comparar los métodos de seleccién cconsistentes es a partir de Ia comparacién de sus probabilidades de elegir la verdadera representacion ¥ ii) sila verdadera representacion no pertenece al conjunto de las representaciones candidatas, el método de seleccién consiste en minimizar la distancia entre cada una de las representaciones candidatas y aquélla que més se aproxime a la verdadera, Esta distancia est definida por una funcién (0 métrica) D(u,») (donde uy v pueden denotar escalares 0 vectores) que debe satisfacer las siguientes condiciones: i) ‘D(u,x)> 0 (para uv )y D(w.v)=0 (para u=v);ii)desimetria, D(u,x) = D(v.u) yili) de desigualdad triangular, D(u,w)< D(4»)+ D(v,w) . En lo sucesivo, a los efectos de la aplicacién de los eriterios de seleccin, se considerard solamente la primera de estas condiciones. Del conjunto de funciones de distancia que satisfacen esta condicién® se tomarén en consideracién solamente las siguientes: 1) la distancia dirigida de Kullback-Leibler (KL) basada en el cociente de verosimilitudes, y definids como: saft.f) afnd 28) co 5° Para un andlisis de las propiedades que debe reunir te familia de funciones que cumple la condicién i, ver Linhart, H.; Zucchini, W. (1986). 5 sta ncn, conocida también como coeficente de informacion de Kullbakaibero discrepanca de Kullback: Ltbler esa medida de dstancia ms mportanten a metodloia esleceion de moda. Oignalnent fe defini pera meir Ye (2) eS (verKulac, Leiber, R.A (1951) continue un cso parila fail de os pincpios deste de optinizacion de Ar Envtopin concep de copia es relctonado sur Con el concep de nceriunors cn patil con i incertae ‘Socata pobaites dels posts reasons de un enciene de eel eventual Obvircae ncaa de Ipridumbe comenidacn una distbueon Se provbilgades es fneon dla anid fora con qu cara lebocvado, incementoenel Conjunto de informacion pods une dsminucon eso meriGambe, ladistancia entre dos dstribuciones de probabilidades, p= {p.,Py...2,} ¥ 9= 160 Los procesos estacionarios de pardimetro discreto (donde: i) % denota el verdadero modelo, con funcién de densidad f;(*) y if) f denota el modelo candidato, con funcién de densidad f,(+)); 2) la distancia L, definida como: 1 Sy be LS fi oll pe (donde: i) ¥; denota el valor de ¥, estimado a partir de la aplicacién del modelo candidato y ii) nf¥7) (t= 1,2,..4n) denota Ja estructura temporal del verdadero modelo, ¥,= m{1*)+¢, ), siendo {e,}:WN - N(0,02) (debe tenerse en cuenta que, a fin de permitir la comparacién de distintos modelos candidatos que pueden haber sido estimados a partir de series de tamafios diferentes, la medida 1, esta normalizada por n- p, valor determinado por el modelo candidato). La distancia Z, es particularmente apropiada para aplicar a procesos autorregresivos, ademas posee la ventaja de depender exclusivamente de los valores medios de las dos distribuciones y no de sus funciones de densidad, por lo cual puede ser aplicada atin cuando las perturbaciones ¢, no estén Normalmente distribuidas. ‘Supéngase: i) que i? sea el modelo AR(p) més aproximado al verdadero en términos de Z, ¥ ii) que, aplicado un criterio de seleccién de modelos, el modelo elegido seaun 4R(p,), Z2" . Obviamente severificaré que 1,(P") 2 1,(P?) .Demodo que se puede definir una medida de la eficiencia observada de un criterio de seleccién en términos de L, de la siguiente forma: Li EQ(L;)= 7) (0< EQ{L,) <1). Por su parte, Shibata, R. (1980) propuso utilizar como medida alternativa de eficiencia el valor ‘esperadode 1, , condicionado por el supuesto que J esel verdadero modelo con funcién de densidad f(y) (£,,(J,) ). Supéngase: i) que 7 sea el modelo 4R(p) més aproximado al verdadero en términos de la ‘esperanza matemética condicionada de L; ( £,.| [-(")] )y ii) que, aplicado un criterio de seleccién de modelos, el modelo elegido sea un AR(p,), ¥2' . Obviamente se verificaré que: eat)? = Lal)] De modo que se puede definir una medida de la eficiencia esperada de un criterio de seleceién en términos de 1, de la siguiente forma: eal) #5(L) (7) (0< Ez.) $1). Los procesos autorregresivos de orden p 161 Como corolario de esta definicin, se dice que un criterio de seleccién es asintéticamente eficiente en términos de 1, si se verifica que el cociente de esperanzas matematicas cumple con la ley E,,L(F*)] fuerte de los grandes niimeros, es decir, sip tim) 1“ rH LL De la misma forma, se pueden definir: i) una medida de eficiencia observada en términos de la distancia de Kullback-Leibler de la forma: EO(KL) (donde ¥? denota el modelo AR mas aproximado al verdadero en términos de la distancia de Kullback- iblere #2 denotaun modelo AR(p;) , elegido a partir de la aplicacién de un criterio de seleccién dado) yi) una medida de eficiencia esperada en términos de la distancia de Kullback-Leibler de la forma: eal) “Epa (donde £, [KL] denota el valor esperado de la distancia de Kullback-Leibler, condicionado por el EE(L1) supuesto que Fes el verdadero modelo con funcién de densidad J,(y)). Con un criterio similar al anterior, se dice que un criterio de seleccién es asintéticamente eficiente en términos de la distancia de Kullback-Leibler si se verifica que: me [a 2.10.5.3,- Criterios de seleccién eficientes basados en la medida de Kullback-Leibler Bajo el supuesto de Normalidad del verdadero modelo, su funcién de densidad asume la forma: (czvan)" y la funcién de verosimilitud del modelo candidato (7?) seré de la forma: 1) ere (obsérvese que el tamafio de la muestra esta determinado por el orden, p , del modelo candidato) , por lo tanto, la distancia de Kullback-Leibler asumird la forma: 162 Los procesos estacionarios de pardimetro discreto ae Du as be Spa apa Ltt) oe oP De modo que, sustituyendo en esta expresi6n los coeficientes ¢,, 0? y 03, por sus estimadores méximo- verosimiles, se obtiene que: KL sen) gsr é é L M Se) Sore afar A partir de esta definicién se consideran los siguientes criterios de seleccién: 1) alc El primer criterio de seleccién de modelos basado en la funcién de informacion de Kullback- Leiter te BA1C propuesto por Akaike H C1973) AIC p) = ~21n{verosimiitud{)} + 2(rumero de coefcientes del modelo 8) (donde #* denota el modelo candidato). Suponiendo la Normalidad de 7”, se obtiene que: -2 tn{verosimiiua( #?)) = ( (n= p)In(22)+ (n= p) al ofa Me) et de modo que se puede escribir: AIC(p) = (n= p)in(2n)+ (n~ p)in( se”) + (n~ p)+ 2(p+ 1) = =(n- pl ite)+ fae?) | +2(p+1) Dado que el término In(2z)+1 no cumple ningiin papel en la seleccién de los modelos, la expresién anterior puede ser resumida de la siguiente forma: Atc{p) = (n~ p)ia( shut”) 2(0+ 1) © expresada en forma normalizada: 5. Abreviatura correspondiente a la denominacién “Akaike information criterion”. Los procesos autorregresivos de orden p 163 AIC(p) = inf?) = e+) np donde Hou denota la funcién de penalizacién por el aumento del orden de autorregresividad. Debe tenerae en cuents,curiosamente, que est eritero, que es asintticamenteinsesgado con respecto a la distancia de Kullback-Leibler fue desarrollado a partir de la hipétesis que el verdadero modelo pertenece al conjunto de modelos candidatos®, Sean dos modelos candidatos AR(p,) (considerado el més proximo al verdadero modelo) y AR(p2) (p> ps) y sean {&,} y {éy) las comespondientes series residuales. Se demuestra que: {) re San acpi Btn) (donde a7? denota la varianza de las perturbaciones del verdadero be modelo); »( Sa- yd, = ey) 2 Ze ye Trap, + Ban) 4 teniendo en cuenta que las distribuciones del numerador y del denominador son independiente, ova 2-28, Pa ») (donde B(+,e) denotauna dstribucién Beta)y vi) log(Q):log- of 2222 - a) (donde log- B(+,*) denota una distribucién log-Beta). Por otra parte, se verifica que: ao :8-» $2) er] -tae-an)-uo-anier ime tee (donde a y b son constantes) y que: ol ya Sa). Pret of = 4a*(p,~ p)ott +2(a-b)'(n- 2p)oz* Varese Sa] vo al tapped tp tpg 56 Este criterio se basa en una generalizacién del principio de mAxima verosimilitud y consiste en aplicarel principio de entropia cruzada minima de Kullback (conocido como el principio minx-ent), para obtener una estimacién de la medida de Kullback-Leibler (para una andlisis detallado de la derivacién de este crterio, ver Linhart, H.; Zucchini, W. (1986)) 164 Los procesos estacionarios de pardmetro discreto Asimismo, se demuestra que": i Sa] va = In(o2?) + in(2) + (228) pe A partir del desarrollo de Taylor de Hf Se] en el entorno de: 4 3) se obtiene una aproximacién de la forma: asl Sal | = info!) + n(n 294) — whe oa Es decir, resulta que: false ae De modo que la seffal correspondiente al criterio 4/C(p) queda definida de la siguiente forma: 84100.) = £{[-41C(p.)- At0(p)]/ 02} = “ise Ae) (een) 2 hea) qbgy te 9) DL a)- =n p))+ 22D. n-2p, ene Py 57. Se demuestra que Jerre te)ae= Lr (ofete)—ng] > 0.»>0) (donde: i) y(u)=-e~ iG 7a) Mee = 1 (u>1) ita fin dae) y{Z) =—e~2i(2) 8 I)=-e 919) ¢= 0577215664901 es ta constante de Euler), Para una variable Z:Z/m), se verifica que Wr 2 2 Joe e dato) Some steaks Los procesos autorregresivos de orden p 165 Am-p) n+ Nm-n) = 2p)(n= 2p2) ° (n= (n= ps) de modo que 0°] Inj “2*1—| La - v (24) ¥y utilizando el desarrollo de Taylor, esta s \] 28 expresién puede ser aproximada de la siguiente forma: o°} In| “2*—| | « pods A -Es decir S| in 2p2\in= mits 5 » que el ruido del criterio AIC queda definido de la siguiente forma**: . 2 P.- (n- 2p,)(n- 2p, +2) De modo que el cociente SW correspondiente al criterio AIC, con respecto a la sobre-estimacién, puede ser expresado de la siguiente forma: 58. se demuestra que free wdolace eal wa [2 -o(2+ J] yaque +n) {2 -o2+ i} +v'6)- ven} (onde ve) an 1 reno Enparticuar,parauna variable o.0(4.4), se veicn que: 1) Efin(Q)]= Jaoo(Ba)e H()— a) ar o2)- Aros fers (EBay ae -(()- sa) por fo tanto, que #[slo)- “etway-w(2)-r G5) 248) erty, 18:8 166 Los procesos estacionarios de pardmetro discreto sel.) 3 [Ota 2e af esa PPL [n- 2p,)(n= 2p») ain ol gapicay oa al Para valores pequefios de (p:- 7) eh coeficiente sW(AIC) crece, pero cuando p+», SW(AIC) > ~« . Estacirounstancia pone en evidencia el sesgo del crterio AIC hacia la sobre-estimacién, para series cortas. Este es un defecto que afecta, no sélo al AIC, sino a todos los criterios de la forma n(a2, je (donde @ es una constante), debido a que poseen una funcién de penalizacién poco signifcativa Cue genera un cociegte ‘SW’ muy débil lo cual, como ya se mencion6, implica una alta probabilidad de sobre-estimacién )”. Sugiura, N. (1978) y Hurvich, C.M.; Tsai, C.L. (1989) demostraron ‘que, para evitar esta falencia, la funcion de penalizacion debe ser de orden mayor que el lineal con respecto a p,, de modo que su primera derivada sea positiva y la funcién de penalizacién sea no-acotada para Sn Esta condicién asegura que la sefal del criterio crecers répidamente cuando aumente la medida de la sobre-estimacién, p,- p,. Por otra parte, se verifica que: pop e:-»)|_ Jar ” ” 2 vim SIV(AIC(, = Ii a Beso (A1e(0,022))= fim Bajo el supuesto que el modelo més aproximado al verdadero sea AR) , la probabilidad de que el criterio AIC sobre-estime Ia seleccién, es decir, la probabilidad de que se vetifique que AIC(AR(p,)) < AIC(AR(»,)) (Px > A) . Queda definida de la siguiente forma: s{ac(p2) < AlC(»,)] = _ ihe) een rh n-P +202) + hay i) 2b +1) 4 = In( &, | ~ log(n - p,) +4 — ya = oi 2 cio 228) 10.2) est ye n-p,) (np) m-p, 52 por el contari, un valor de SW mareadamentepasitivo permite suponer una probablidad de sobre-stimacién proxi cero. Los procesos autorregresivos de orden p 167 J. Ap. alla) | (epi Pl 7 seal satel no 2» >i Beaf talent | =f mee alla) [ "Parnes? eee \ {obsérvese que 1a probabilidad de sobre-estimacién en criterios como éste, que poseen fun penalizacién débil, disminuye a medida que n crece). A partir de esta expresién se puede escril senlea[ieatial)- “ani atest) te pier). | py De modo que: smite eRe FHT Peo B, Ars Aa-al) Is va 22(m-n) Pa Por lo tanto, se puede concluir que la probabilidad asintética de que, utilizanda el eriterio AIC, el Asimismo, de acuerdo con el teorema de Slutsky, se verifica que lim 33, )n-2n, 168 Los procesos estacionarios de parémetro discreto verdadero modelo AR(p,) resulte sobre-estimado por un modelo AR(p2) ( p: > p: ), Sera: lim of A1C( pn) < Aten] = ol ain)? APs P)] 2) AlC-corregido A fin de resolver el problema del sesgo hacia la sobre-estimacién del criterio AIC en series cortas, Sugiura, N. (1978) y Hurvich, C.M.; Tsai, C.L. (1989), basdndose (como en el caso anterior) en el ‘supuesto que el verdadero modelo AR(p*) pertenece al conjunto de los modelos candidatos y en la esperanza matematica condicionada de la distancia de Kullback-Leibler propusieron el criterio conocido como AICe®, gure [See \ = 2{[in(ele”)]1{F)} (oz?) epee (donde p denota el orden de autorregresividad del modelo candidato y es tal que p> p*). AICe(p) = alas (? J a6 Teniendo encuentaque in(d{"”") es unestimadorinsesgado de a{fino3.))/ s(e")} ssepuede escribir: Atca(p) = EIKLIS(7*)]= wfohtt”®) + +4] 2) +1] no influye en la seleccién del modelo, se obtiene la siguiente n= 2p y, dado que el término - definici = ar)’ atc) = Wd) + ay Como se vera inmediatamente, Hurvich, C.M.; Tsai, C.L. (1989) demostraron que AICc mejora la estimacién de AIC en series cortas, pero que es asintéticamente equivalente AICc en series suficientemente largas. ‘Sean dos modelos candidatos R(p,) (considerado el mas préximo al verdadero modelo) y AR(p:) (r2> wm) y sean {4,} y {é,} las correspondientes series residuales. Utilizando un razonamiento similar al empleado en el criterio AIC se obtiene que: 8(41Cd(0ysp2)) = B[41Ce(p,)- ACen) oF 6°. Et agregado de a letra ala deno funciones de penalizacién, acion de los citerios indica que en las respectivas definiciones fueron corregidas las, Los procesos autorregresivos de orden p 169 =n Gln 2r)|__ arma-v) 2(p.- ) n= 2p,\in= ps) | (n= p)n-2p,) ” (2p, - 2) 2-2-2) La os — . ran aay iyo y que: De modo que el cociente Si’ con respecto a la sobre-estimacién, queda definido de Ia siguiente forma: sw (atc, p)) = 2 C= 22* Ahem 220) 2 Pa PL iq (r= edle=202)|_ (>= a) 2(m-m) (n= 2p,u- Po) | (n—p,n- 2p.) (n- 2—4 - 2\(n- 2p» - 2) Deesta expresién se puede conchviren forma inmediata que, cuando p,~ p, erece,elcociente SW también crece, de modo que su comportamiento con respecto a la sobre-estimacién es mejor que el del AIC. Por otra parte, igual que para el criterio AIC, se verifica que: VPs= lim Sw(AICe( ps) Bajo el supuesto que el modelo ins aproximado al verdadero es AR(p,} ,1a probabilidad de que, en series cortas, el criterio AICe sobre-estime la seleccién, es decir, la probabilidad de que se verifique que AICe(AR(p,))< AlCe(4R(p,)) (P: > A) queda definida de la siguiente forma: parcel) < AtCe(p)] = : rule) ses infor?) 170 Los procesos estacionarios de parémetro discreto = pls, _——Am-rn dy Avene” 2 toil I (las probabilidades de sobre-estimacién en criterios como éste, con funciones de penalizacién fuertes, aumentan a medida que n crece). A partir de la expresiOn anterior, se puede escribir: aia ox re ee |: | ° a aa ta) De modo que: Es decir, se puede concluir que la probabilidad asintética de sobre-estimacién para el criterio AIC, igual que para el AIC, sera: dim plaice.) < A1Ce(n)]= P| 2p-p)? Xer~ P)] 3) AIC-insesgado tra forma de corregir el sesgo del criterio AIC hacia la sebroetimacnen series cortas consiste cen sustituir:j) 1a estimacién maximo-verosimil de o3, (64 = —— -y Piepa )por suestimacién insesgada 2 Tp. ye )y ii) Ia funeidn de penalizacién e+) 2, por fet . De modo que, eliminadas las congtantes que no influyen en la seleccién y sumanda 1 (por ‘comodidad), se obtiene el siguiente criterio": AIC p) = tn 53,)+ debido a Akaike, H. (1969)*. Obsérvese que los criterios AICe y AICu son asintéticamente equivalentes, ©. Bl agregado de la letra w ala denominacién de los criterios indica, que las correspondientes definiciones fueron obtenidas utlizando ct extimadorisesgado de 03, 2. Como se mencioné al comienzo de la See. 2.10.5, éste fue cronolégicamente,el primero de los criterias de seleccion basados cn la distancia de Kullback-Leibler. Los procesos autorregresivos de orden p im ‘Sean dos modelos candidatos 4R(p,) (considerado el mas préximo al verdadero modelo) y AR(p2) (p> p ). Utilizando un razonamiento similar al de los casos anteriores, se obtiene que: SAIC p..p2)) = E{[ alc p,)- Alc )]/ 3} Ap-m) (p2- pi)n (2 2p,)(n= 2p.) ” (n= 27, - 2ln- 2p, - 2) y que: [ (Se jg epe||_ l=) on $a * [a=2p,+ n-2e ‘De modo que el cociente SW , con respecto a la sobre-estimacién, queda definido de la siguiente forma’: (n= 2+ BMr= 2) Pr- Py _Ar-p) Pa pin ‘| (#-2p)(n- 2p.) ° (n= 2p, - 2Yn- 2p, - 2) Se demuestra que, para n2 5, 0< p)~ p, > p,) queda definida de la siguiente forma: PLAIcidp,) < arcu p,)] = ©. Ver MeQuarrie, AD.R.; Shumway, RH. Tsai, CL. (1997). 172 Los procesos estacionarios de pardmetro discreto J «Sen nan eg Se GI) (obsérvese que, igual queen el AICe, la probabilidad de sobre~ A partir de la expresién anterior se puede escribi eh etn a) én aumentaamedida que n crece). De modo que: vn sfata Stal aaa). 2p»), an-al). li wep Bi 5 J ‘es decir, se puede concluir que la probabilidad asintética de sobre-estimacién para el criterio ATCu, sera: sim ofater( ra) < A1C(a)]= 223-9)? MPs P)] 2.10.5.4.- Criterios de seleccién eficientes basados en la medida L, 1) FPE* Este criterio propuesto por Akaike, H. (1969)(1970)(1973)* fue el primero en basarse en la © Abreviatura correspondiente ala denominacion “final prediction error”. 5 Em realidad este criterio fue propuesto originalmente por Davisson, L.D. (1965) para el anlisis de datos del tipo sefel-més- ruido, La atribuoidn de este resultado a Akaike probablemente se debs a que sus publicaciones,realizadas en el émbito de la teoria ‘de as series cronoldgicas, fueron mAs conocidas. Los procesos autorregresivos de orden p 173 minimizacién de la varianza del error de prediccion®, Sean: i) un proceso {¥} estacionarioy tal que m() = 0 , respecto del cual se cuenta con una serie cronolégica {¥,%,....%} que permite construir un modelo 4R(p) de la forma: Sa dil t baliatatrghop (donde los gy, (j= 1,2,...,p) denotan los estimadores maximo-verosimiles de los correspondientes coeficientes); ii) una serie cronolégica {X,,Xz,..X,} obtenida como una nueva realizacién, independiente de la anterior, del mismo proceso {1} y iii) ,,, el estimador de la variable X,,., obtenido de la aplicacién del modelo calculado a partir de la serie {3,1 = 12...) : Ean = Xn t aXe stot tipXnnp Akaike, H. (1969) demostré que el error medio cuadratico de esta prediccién, para nm suficientemente grande, es de la forma: (a = by Xy = G2 Xpa- or mal = 1+ B\[(61- én) wo von] w- Paky (nt) = 02+ E(- a) -4)] Expresando el segundo término como la esperanza matemética del valor esperado condicionado por {F,¥,.%) y teniendo en cuenta que {¥;}1{X,} , se puede escr Alaa Seal] AL ae = Bate bakin Bye) |= = 03+ 4[(6- H)t,(4-4)] Bajo el supuesto que vn(¢, - ¢)—*-+N(0,027;'), para n suficientemente grande, se obtiene lanproximacion A(X - Sa) ] . oa(t+ 4] Suponiendoqueel verdaderomodeloseaun 4R(p*) y que p> p*, la esperanza matemitica del estimador méximo-verosimil del error es de la forma: 26”) =(1- 202 © Originalmente este criterio fue disetado por Akaike para ser aplicado exclusivamente & modelos autorregresivos 174 Los procesos estacionarios de parémetrodisereto eure De modo que ~£#—— es un estimador insesgado de 02. Susituyendo en la expresién original ¢; por 1 este estimador, se obtiene un estimador insesgado del error medio cuadratico de ia prediccién: wr pe FPE(p) = n= 2p Como ya se mencioné, se concluye en forma inmediata que el mejor modelo en términos de prediccién es el que minimiza esta expresién. Obsérvese que In[FPE(p)}- AIC() = Et 1 » por lo que se puede concluir que ambos criterios son asintéticamente equivalentes. Sean dos modelos candidatos AR(p,) (considerado el mas proximo al verdadero modelo) y AR(p;) (py > p,)- Entonces, se obtiene que: 3 FPE(p..p2))= E{[#Pe(p2)- FPe()]’ 02?} = . (Se he ap ef. . = om 28-8)" | +l peathcaayt 29 oan - tern on (donde o;? denota la varianza de las perturbaciones del verdadero modelo) y que: (m=) oe, nn bn 2pJo a Gen2a wi n= Pa 2s a eal 2a) _ Mea alin 2ealor~ ra) + 202 a) [3-4 + 2a = i) (n= 2pa)(r~ ra) (n- 2a)" (nw)? De modo queel cociente SH” , con respecto a la sobre-estimacién, queda definido de la siguiente forma: Los procesos autorregresivos de orden p 175 rin- 2p \(p.— pr) n= 22 Jr a) + 2(ea~ al fd? Ane, +20, = 2)"] 4(p2 = De esta expresién se puede concluir: #) que, para valores pequefios de p, ~ peste cociente tiende a cero; fi) que, en general, para series cortas, SW(FPE) es débil y iii) que 1 lien. Jim FPE( 21.2 z Suponiendo que AR(p,) sea el que més se aproxima al verdadero modelo, la probabilidad de que, en series cortas, el criterio FPE sobre-estime ta seleccién, es decir, la probabilidad de que se verifique que FPE(AR(p,)) < FPE(AR(p)) (22 > p)) queda definida de la siguiente forma: eatin aie * n-2p, “7 peal. a en ie pane este n= 2p, = apn ee) (obsérvese que, en este caso, la probabilidad de sobre-estimacién decrece a medida que n crece). A partir de 1a expresién anterior se puede concluir que sal asintotica de sobre-estimacién sera de la forma‘: n= 2p) n= p)) |: 15. Es decir que la probabilidad sim pl FPE(p2) < FPE(D)]= A239)? X02- Pd] 2) FPE-insesgado Sien la definicién del FPE se reemplaza la estimacién maximo-verosimil de o? por su estimacién 7 Bhansali, RJ; Downham, D.Y. (197) analizaron ia funciGn de penalizacion del criterio FPE con respecto a su probabilidad 1y basindose en métodos de simulacién, propusieron come mas adecuado el de sobre-estimacién, Denotando por FPE., = caiterio FPE,. Otros autores demastraron que para 15 p, ). Se obtiene, entonces, que la correspondiente sefial es de la forma: (FEU n,p,)) = £{[FPEW p,)- FPEMp)]/027} -s[zteei-ctcalr -2e-peoa (n= 2pn- 2p5) nde (naps) sets (n- 2p) (onde 7? denota la varianza de las perturbaciones de la verdadera representacién). También se obtiene que: “leer wore (n- ony — Apa pir?(n= 2p,) + 3207(pa~ ps) (nas pa) (n- 2a)" (n-2p2)° De modo que el cociente SW , con respecto a la sobre-estimacién, queda definido de la siguiente forma: (n-2n)Vla.- allo p2) Se PPed eel = TF aac alinsn-a) De esta expresién se puede concluir que, contrariamente a lo que ocurre con el criterio AICu, cuando p,~ p, crece, SH(FPEu p,,p;)) no es estrictamente creciente. Se verifica que: _(o-2a) lla alemn) «0 tnalBhen| (een 2p.) +8(p, - p\(n- p- pa) > 0 Los procesos autorregresivos de orden p 177 De modo que (lim, Sm Fred, p;))= 0. Lo cual, si bien implica que existe un sesgo hacia la a-ribote-a sobre-estimacién, permite demostrar* que, para n2 Sy O< p- p< n- p-2,yparael caso de sobre- estimaciénenelcual 0< p* SW(FPE) .Se obtiene, ademas, que: Jim PPE D,.») = Vm Suponiendo que AR(p,) seael que mas se aproxima al verdadero modelo, la probabilidad de que, para series cortas, el criterio FPEu sobre-estime la seleccién, es decir, la probabilidad de que se verifique que FPEu(AR(p,)) < FPE:{AR(p)))(p, > 7)) , queda definida de la siguiente forma: APE) < Feed p)|= Ac ah Mam »)] Se puede coneluir, entonces, que, en series largas, se debe esperar que FPEu produzea menos sobre-estimaciones que FPE®. 3)Cp Mallows, C.L. (1973) adopté una aproximacién diferente a los criterios basados en la distancia 8, Ver MoQuartie, A.D.R.; Tsai, C.L. (2007), ©. Ver Howrey, EP. (en Zarembka, P(e.) (1974). 178 Los process estacionarias de pardmetro discreto 1”. Sea la funcién: Laer r¥pte)-(arntphall =a 3 =a = et op (donde o;? denota la varianza de la verdadera representacién). Se demuestra que E(J,) = (donde ¥, = p denota la varianza y 8, denota el sesgo)". fo Teniendo en cuenta que a Dal = (n-2p)0? +B, sepa 5, 3, 1¢ = p+ 2b ev,4 b= 4 * Dt ett ee (Jp), 8e puede concluir que em E(J,). Sustituyendo en esta expresién o? por su estimador insesgado (calculado a partir del modelo candidato de mayor orden de autorregresividad), se obtiene el criterio de seleccién™: Sean dos modelos candidatos 4R(p,) (considerado el més préximo al verdadero modelo) y AR(p;) (p> myn modelo AR(P) , que es el de mayor orden de autorregresividad entre los posibles modelos candidatos, se obtiene, entonces, que la correspondiente sefial es de la forma: S(ColPP2))= £{[r(e2)- cola)! 22} = = E)) | (n-2P) 224-4 3p, |-|(n- 29), ya ye- ya = Bi\(n-2P) SHR 4 ap, - p) 37} = 79_Ver también Mallows, C.L, (1995) 71, Ver Mallows, C.L. (1973). 72 Oto criterio de selescidn basado en este concepto es el conocido como de Ia function de transferencia autorregresiva, + debido a Parzen, E, (1974), Los procesos autorregrestvas de orden p 179 Bi Pa -to-anes ae a. +3(p, pr) = faa = 2m - pi(n-2?) = pr) (donde oj? denota la varianza de las perturbaciones de la verdadera representacién) y se obtiene que: (n- 27) 0" | #a-nt 2 splat a @°{[cen,)- claro = lea pn= 22) | Ap.~ p) n= 2P-2 De modo que el cociente SW, con respecto a la sobre-estimacién, queda definido de la siguiente forma: SW(CA Pps) = lex-a)=(-n) | (2° GaP 2)n=3P 4) De las correspondientes expresiones se puede concluir que, cuando p,~ p aumenta: i) el signo crece en forma lineal; fl) el ruido rece en forma aproximadamente lineal y tii} el cociente SW” crece. Si bien el cociente S#(Cp) habitualmente es débil (lo cual implica la posibilidad de sobre- estimacién), como su ruido es superior, se debe esperar que el riesgo de sobre-estimacién sea menor que en el criterio FPE. ‘Debe tenerse en cuenta que, dado que Si¥(Cp) depende del orden P, correspondiente al modelo de mayor orden entre el conjunto de posibles modelos candidatos, ante una variacion de P el criterio Cp debe ser recalculado para todos los modelos candidatos. ‘Ademids, se obtiene en forma inmediata que: jim sw(Co(oup,))= {=P De Ia observacién de los resultados anteriores se puede concluir que los cocientes SW” correspondientes a todos los criterios eficientes, son asint6ticamente equivalentes. ‘Suponiendo que el 4R(p,) sea el que mas se aproxima al verdadero modelo, la probabilidad de ‘que, en series cortas, el cfiterio Cp sobre-estime la seleccién, es decir, a probabilidad de que se verifique que Go(AR(p)) < Co(4R(A))(p, > »)) (teniendo en cuenta que 4R(P) denotael modelo de mayor orden de autorregresividad entre los modelos candidatos), queda definida de la siguiente forma: Hore.) < cola]= 180 Los procesos estacionarios de parémetro discreto = p\(n-2P)=B4— nt 3p, < (n- 2P)=B- n4 3p, |= da- ya = p\(n-2P)=AAL ett > Ap, ~ p,) |= va, | Pa = do ap)Ziecal., 3(p,- a = Yr2P - A an-ne > 15] Teniendo en cuenta que lim Sy, p),.2¢ = Ansa) Hipyon)> 86 la expresion amerior se obtiene que la probabilidad asintética de sobre-estimacién seré de la forma: tin rlcolos) < Clo] Athan)? ea A) Delas definiciones anteriores se puede concluir que, para series suficiemtemente largas, el criterio FPEu tiene menos probabilidad de sobre-estimacién que FPE y Cp. 2.40.5.5,- Criterios de seleccién consistentes 1) sic Como se mencioné en la Sec. 2.10.5.2, el fundamento sobre el que se basan estos criterios es la hipétesis de que el verdadero modelo pertenece al conjunto de los modelos candidatos. Definir un criterio consistente implica, entonces, en identificar al verdadero modelo con una probabilidad asintdtica igual a Jaunidad. Akaike, H. (1978) y Schwarz, G. (1978) propusieroncriterios de seleccién aproximadamente ‘equivalents, basados en una interpretacion Bayesiana” Akaike propuso el criterio conocido como BIC”, aplicable a modelos lineales de regresién (modelos estéticos). La propuesta de Schwarz es més general, supone que las observaciones provienen de un proceso de la familia de Koopman-Darmois, con disiribucion de prababilidades de la forma Frl.6) = exp[éy- 6(6)] (donde: i) #20 , siendo @ un subconjunto convexo en Ry ii) Y es wn 75. La abreviatura SIC corresponte ala denominacién “Schwarz information criterion”. 74. Ver también Risanen, J, (1978), Stone, MB, (1979), Priestley, MB, (1981), 7°, abreviatura que corresponde la denominacién “Bayesian information criterion”. ©, Estos modelos seri tratados en Ia segunda parte de este trabajo, Los procesos autorregresivos de orden p 181 estadistico p-dimensional suficiente de @ ). Schwarz propuso un criterio de la forma a4, (donde: i) a, denota laprobabilidad “a priori” del modelo 4R(p) yi) 4, denota la distribucién de 6 , dado el modelo AR(p) ) y establecié una penalizacién fija para la seleccién del modelo equivocado. La solucién Bayesiana al problema de la seleccién consiste en elegir aquel modelo con la mayor probabilidad “a posteriori” de ser el correcto. En series suficientemente largas, esta probabilidad “a posterior” puede ser aproximada por un desarolio de Taylor cuyos dos primeros terminos son de la forma: (n- p)inf 0") + pir 2) (donde {i denota el estimador maximo-verosimil de la varianza de las perturbaciones del modelo AR(p) )y los términos restantes son acotados, de modo que no ejercen ninguna influencia en series suficientemente largas”, De modo que, normalizando la expresién de Schwarz, se obtiene el criterio™: s1c(an(p) = (ol) « Bin) nop ‘Sean dos modelos candidatos 4R(») (Considerado el mas préximo al verdadero modelo) y AR(p2) (p> > p)) « Aplicando un razonamiento similar al utitizado en el AIC, se obtiene que: (SIC(P,.P2)) = Bf[sio(p.) - s1c(m))/ 7 wallotozen)-2ecal) lop ntecal n-Pr em (rPln=2m)]___%r2=rr) __, Prin(n= pr) _ pIn(n— ea) (tale 2p) ma A y que. | ~—_ Mama 2 (n= 2p, +2)(n- 2p, De modo que el cociente SW , con respecto a la sobre-estimacién, queda definido de la siguiente forma: Ver Schwarz, G. (1978). 7, Debe tenerse en cuenta que las propiedades asinbticas de los estimadores de los coeficientes #, de una representacién AR(p) se mantienen, ain cuando el valor dep sa desconocido, si su estimador es consistente. 182 Los procesos estacionarios de parémetro discreto 1 [(n=2p,+2)(n- 2p.) | J (n-piln- 2p, (Ps ~ ps) SW(SIC(2,,3)) = =. tal - meer (siclo.e:))= 5 PPh n= 2p n= p») | (n= 2m) n~ 2p -, Balolrn= ps) _ pill py mR n-P A partir de esta expresién se puede conciuir que este cociente adolece de los mismos defectos que el S#7(AIC) , en la medida que esta afectado por un sesgo hacia la sobre-cstimecién, para series cortas (ver Shibata, R. (1976), Jones, R.H. (1975)). Por otra parte, se obtiene en forma inmediata que: Jim sm{S1C{ 94.02) = psp) , a p_ 2Apr~p) | (Pe Pitot) | n a w n “ tim ——L—In(n) ipa Debe tenerse en cuenta que, como se veré en las péginas siguientes, esta caracteristica de poseer un cociente SW asintéticamente igual a infinito, se verifica para todos los criterios consistentes. La probabilidad de que, para series cortas, el criterio SIC sobre-estime la seleccién, es decir, la probabilidad de que se verifique que S1C(4R(p,)) < SIC( 4R(p))) (p2 > 4) , queda definida de la siguiente forma: asic(»,) < sic{a)]= 7 r= 2p, | 7 Hansen ae a P De esta expresién se obtiene en forma inmediata que: on Bt _ Bialn~ p) n> Pa nF, nme al- nae atts dal Los procesas autorregresivas de orden p 183, tim | a=, (Pa Ps a} e2(r-A)L ” Este resultado demuestra formalmente la propiedad comentada en la Sec. 2.10.5.2, que para el ctiterio SIC (como para todos los criterios consistentes) la probabilidad de sobre-estimacion es asintéticamente nula”. 2)HQ Hannan, E.J.; Quinn, B.G. (1979) propusieron un criterio basado en las condiciones asintéticas de los procesos AR del tipo: = ANAM abt bling + (= pth p+ 2onan) (donde: i) E(s, /4)-158)-a0--s81) = 0 ti) (6? / )-156-2008) = oF yill) B64 I 6,4. un modelo verdadero 4R(p*)y un modelo candidato 4R(p) (p> p*) , Hannan-Quinn demostraron que, para valores de n suficientemente grandes, se verifica que: 6) < )-Suponiendo > Patnfin(n— 8, = 60 pp elole nm? (onde 4,(n- p) € [Oil] ). A partir de este resultado propusieron un criterio de la forma In(é2,)+ PC,») y demostraron que la propiedad de consistencia se verifica para G,_,) = apie p)(c2 1). Lo cual condujo a un criterio fuertemente consistente de la forma’®: . Iafin(n— = nfl) 2_titile= ll (21) De modo que, para c= 1, el criterio de seleccién queda definido por: 2plain(n- oly) = ( ”™) Zell] ‘Sean dos modelos candidatos, 4R(p,) (considerado el més proximo al verdadero modelo) y AR(p;) (p; > p)) - La sefial correspondiente al criterio HQ seré de Ia forma: $H#0(p..2,))= £{[#0\p2)- Holm] 02" “| afer) 20a) (. wf fasted | n= Pe » PI 78, Ver Hannan, E.J. (1980). °°. Ver Hannan, eJ. (1980), 184 Los procesos estacionarios de parémetro discreto if Pil(n- 2a} 2, - rece __ 2Balo(infn ps) 2prtalin(e- 2) n= 2p,)(n— P| (n= 2p)(n- 2m) np n= Py, Por otra parte, se obticne que: Sel A(pa= Py | (n= 27+ 2)in-2p,) De modo que el cociente SW’ , con respecto a la sobre-estimacién, queda definido de la siguiente forma: oh. = ena J (2 p(n 2 I: Pav P n= 2p,)(n= Pa] 2p, tn(tn(n~ p,)) 2p, oe -pitelg etica cete al A partir de este resultado se puede concluir que este cociente, como el correspondiente al AIC, rece con p, ~ p, para valores pequefios de p,~ p, y luego tiende a infinito. Es decir que, para series cortas, presenta un sesgo hacia la sobte-estimacién. Por otra parte, se obtiene en forma inmediata que: 7. z|- anal, a) =A dos pa), Am- ale) = lim wep =P Laprobabilidad de que el criterio HQ sobre-estime la seleccién, es decir, a probabilidad de que se verifique que HO(AR(p2))< HO(4R(p,)) (22 > »1) , queda definida de la siguiente forma: AHO p2) < HO(p)]= : dol) Zeta (gg) _ 200d ol) |. n~ Pr - Py | 2acrfinie- n)]2ernfn(r a) np np inn a aire nfo sai Los procesos autorregresivos de orden p 185 De esta expresién se obtiene en forma inmediata que: = lim

p)) - La sefial correspondiente a este criterio sera de la forma: (#10¢(,.p2)) = £|[ #02) - Od 2? = : oleae aa il } -{alste) __2avfialn a ] ; =n Goals |: tn _, 2ealalin(npx)] 2ovefin(n pr) n= 2m) (n= 2n)r= a pod Pad Por otra parte, se obtiene que: Le . 186 Los procesos estacionarios de pardmetro discreto De modo que el cociente SW, con respecto a la sobre-estimacién, queda definido de la siguiente forma: Jim s1¥(##0¢(2..P3)) = [- App), p= p_Am-n) , Ap- eye . A partir de este resultado se demuestra que, para: i) 26; ii) p.-p = 2 np? La probabilidad de que, para series cortas, el criterio HQc sobre-estime la seleccién, es d probabilidad de que se verifique que HOc( AR(p.)) < HOe(4R()) (p> > 4) queda definida de la siguiente forma: Aton.) < rel 2ein(infr m)) _2p2ta(in(n ps)) m=2p-2 n= 2py-2 conan” Hales CeaiaeceD) canes, mp n= 2-2 n= 2p-2 De esta expresién se obtiene en forma inmediata que: ‘im = i Ee wo sale) n= Dy 2 n= 2p,-2 7 2p, Los procesos autorregresivos de orden p 187 him ——2—| B= pa, 2(2= px)Infin(n)) re%p.-p)| ” ‘Cabe destacar que, si bien el HQc es asintéticamente consistente, puede considerarse un criterio de seleccién adecuado tanto bajo el supuesto que el verdadero modelo pertenece al conjunto de los modelos candidatos, como bajo e} supuesto contrario. De los resultados anteriores se puede concluir que HQ y HQc son asintoticamente equivalentes. Con un razonamiento similar al empleado para tratar la sobre-estimavién, se pueden analizar las, propiedades de los criterios de seleccién para series cortas con respecto a subestimacién del orden de Lea (donde {e"} "+ Inuyn) denota la sucesion de residuos obtenidos de aplicar a la serie {¥} (1=12,....n) el autorregresividad. A este respecto, debe tenerse en cuenta que, en este caso: ( verdadero modelo ARP’) 3 i) ve top ta-p(4*) (p< pt) (donde 2* denota el pardmetro a 2 a "Ep (debe tenerse en tert pny Da oro) ope cuenta que, contrariamente a Jo que ocurre en el andlisis de la sobre-estimacién, en este caso las distribuciones son no-centradas).. representativo de la no-centralidad de la distribucion) y iii) + Por otra parte, se demuestra que: Jone) tea] er E(KL) = in(2)~ In(n) 1+ oH A partir de estos resultados se obtiene que la esperanza matematica de la distancia de Kullback- Leibler entre un modelo subestimado y el verdadero modelo, tiende a ser menor que el valor esperado de la norma 1,, lo cual implica que 108 criterios de seleccién basados en la distancia KL penalizan la subestimacién en forma menos fuerte que los que se basan en la medida J, (la medida KL es Pitigularmente recomendable en aquellos criterios con funciones de penalizacién fuertes, en las cuales la subestimacién es insignificant). Se demuestra, ademas, que para modelos autorregresivos de orden mayor que 5, la eficiencia cesperada de los criterios de seleocién en términos de KL es menor que la de los criterios en términos de Ly y viceversa, para modelos autorregresivos de orden menor que 5, la eficiencia esperada de los criterios de seleccién en términos de KL es mayor que la de los criterios que se basan en la medida > . A los eriterios ccon las funciones de penalizacién més fuertes y con mayores probabilidades de subestimacién les corresponde la mayor eficiencia observada en términos de KL. Asimismo, los criterios con un marcado sesgo hacia la sobre-estimacion poseen una menor eficiencia observada en series cortas que aquéllos con sesgo hacia la subestimacién. Por otra parte cabe recordar que, como se mencioné en la Sec, 2.10.5.1, a los criterios con

You might also like