AMPLIACIÓ Permanència Estructural

TEORIA.
Permanència Estructural
L’objectiu és analitzar si es mantenen constants les β del model en compliment de la
hipòtesis bàsica del model, és a dir, si existeix permanència estructural. Si s’incompleix
hi ha CANVI ESTRUCTURAL (en cas d’una mostra temporal analitzar si existeix més
d’un cicle econòmic i en cas d’una mostra transversal si existeix més d’una estructura
social). Per contrastar-ho s’utilitza el TEST DE CHOW.
SQE T −( SQE 1+ SQE 2) / K
TCH= F*= ֊ Fk, n-k (es consideren dos subperíodes en aquesta
( SQE1 + SQE 2)/ T −2∗K
fórmula general)
On k és el número de β del model que es contrasten en els subperíodes o subestructures.
Si F* < Fk, n-k (α) es considera que s’accepta PERMANÈNCIA ESTRUCTURAL (que
les β siguin iguals en els períodes o estructures considerades).
Si F* > Fk, n-k (α) es considera que s’accepta CANVI ESTRUCTURAL (que les β siguin
diferents en els períodes o estructures considerades).
En cas d’acceptar canvi estructural es considera que no és vàlida l’estimació. Més
endavant veurem què fem.
Anem a veure l’exemple 2 de l’activitat 5.
Es considera la possibilitat que el model d’estalvi no sigui vàlid per a una sola
estructura, sinó per a tres, segons el tipus d’hàbitat, rural (1), semi urbà (2) i urbà (3).
En aquest cas cal aplicar el TCH i cal estimar el model amb totes les dades i després
estimar tres models segons les dades que representen diferents hàbitats. Amb el Gretl
per tal de modificar la mostra anem a MUESTRA—ESTABLECER RANGO i anem
modificant el rang.
TOTA LA MOSTRA
Model 1: OLS, using observations 1-25
Dependent variable: Estalvi
Coefficient Std. Error t-ratio p-value
const -14707.7 11783.2 -1.2482 0.22452
Renda 0.215948 0.0276462 7.8111 <0.00001 ***
Mean dependent var 65878.60 S.D. dependent var 53253.59

Sum squared resid 1.86e+10 S.E. of regression 28462.89
R-squared 0.726236 Adjusted R-squared 0.714333
F(1, 23) 61.01386 P-value(F) 6.45e-08
Log-likelihood -290.8401 Akaike criterion 585.6802
Schwarz criterion 588.1180 Hannan-Quinn 586.3563
Una primera anàlisi de l’estimació ens porta a afirmar que el signe del paràmetre estimat
és positiu i d’acord amb la realitat econòmica i que la variable renda és explicativa (atès
que el p-value de l’estadístic t-ratio associat és menor que α = 0,05 i per tant es rebutja
1
la H0: β=0). També que la bondat de l’ajustament és millorable amb un 0,72 (la
regressió explica el 72% de les variacions de l’estalvi).
RURAL
Dependent variable: Estalvi rural
const -14825.8 65.1732 -227.4831 <0.00001 ***
Renda 0.319947 0.000174824 1830.1095 <0.00001 ***

Sum squared resid 31417.68 S.E. of regression 79.26876
F(1, 5) 3349301 P-value(F) 9.25e-16
SEMI URBÀ
const -14743.8 190.122 -77.5488 <0.00001 ***
Renda 0.209713 0.000401197 522.7171 <0.00001 ***

Sum squared resid 1208086 S.E. of regression 347.5754
F(1, 10) 273233.1 P-value(F) 1.62e-23
URBÀ
const -14887.8 42.6802 -348.8219 <0.00001 ***
Renda 0.120354 0.000111842 1076.1068 <0.00001 ***

F(1, 4) 1158006 P-value(F) 4.47e-12
Aplicant el TEST DE CHOW
2
F*= 1.86e+10−(31417+1208086+ 4028,4)/2 = 142.338 > Fk, n-k (α) (es consideren tres
¿¿
estructures). Per tant es rebutja la permanència estructural (es rebutja la hipòtesis nul.la
que els paràmetres siguin iguals), no hi ha una única estructura.
Si succeeix que la mida d’una de les submostres és < K, generalment si t2 < k, el

contrast que s’utilitza és:
SQE T −SQE 1 / t 2
TCH= F*= ֊ Ft2, t1-k
SQE 1 / t 1−K
Vegem l’exemple 3 de l’activitat 5

Es creu que un model vàlid per explicar l’evolució del consum de carn de vedella seria
aquell que incorporés com a variables explicatives el preu de la carn de primera i el
temps (temps = anys – 1982). Per aquest motiu s’efectua una regressió amb totes les
dades:

Dependent variable: CP
const 906.29 276.171 3.2816 0.00656 ***
PC1 1.47157 0.240013 6.1312 0.00005 ***
Any -0.48073 0.148127 -3.2454 0.00702 ***

F(2, 12) 20.94874 P-value(F) 0.000122
Malgrat la bondat dels resultats aconseguits es pensa que l’afer de les “vaques boges”
esdevingut a principis de l’any 1985 pot haver alterat la relació funcional entre les
variables i per tant produir un canvi estructural. És a dir, es pot pensar que a partir de
1985 el comportament del consum de carn és diferent. Així es realitza la regressió pel
període 1982 –1994 i aplicar el test de Chow :
Model 3: OLS, using observations 1982 –1994
Dependent variable: CP
const -1272.88 347.506 -3.6629 0.00437 ***
PC1 -0.0176233 0.245317 -0.0718 0.94415
Any 0.694178 0.187154 3.7091 0.00405 ***

3
F(2, 10) 77.74320 P-value(F) 8.06e-07
Com s’observa NO es fa la regressió pel període 1985-1986, atès que són dos dades i <
a K. En aquest cas l’estadístic que s’utilitza és:
SQE T −SQE 1 / t 2 32.000−5.43/2
TCH= F*= = = 24,45 > F2,10 Per tant, es rebutja la
SQE 1 / t 1−K 5.43 /13−3
permanència estructural, no és vàlid el model restringit (el que manté constants les β en
tot el període). El model presenta un canvi estructural en 1985.
Amb Gretl: F(2, 10); Valor crítico = 4.10282
IMPORTANT: en considerar els períodes, el canvi estructural es considera l’any de

l’extrem inferior del segon període, és a dir 1995:
- Primer: [1982-1994]
- Segon: [1995-1996]
L’exercici 5 de l’activitat 5 planteja obertament la prova de la permanència estructural,

donat que ofereix l’estimació de tot un període i l’estimació de dos subperíodes.
S’aplica el TCH. IMPORTANT, calcular bé els anys:
- [1964-1995]: 32 anys
- [1964-1974]: 11 anys
- [1975-1995]: 21 anys
- POSSIBLE CANVI ESTRUCTURAL A L’ANY 1975.
0,044−( 0,017+0,018 ) 3
F*= = 6,68 > F3, 26 (α) (es consideren dos períodes). Per tant es
(0,017+ 0,018)/32−2∗3
rebutja la permanència estructural (es rebutja la hipòtesis nul.la que els paràmetres
siguin iguals en els dos períodes), no hi ha una única estructura, hi ha canvi estructural
al 1975.
Amb Gretl o amb taules: F(3, 26); Valor crítico = 2.97515
L’exercici 6 de l’activitat 5, vol analitzar si les importacions en funció del PIB en el

període [1971-1997] presenten una única estructural. Com s’observa en el gràfic de
l’evolució de les importacions es podria INTUIR un canvi al voltant de l’any 1985.
Mirant la informació que dona l’exercici tenim tres estimacions, donant a entendre que
el canvi estructural és al 1985;
- [1971-1997]
- [1971-1984]
- [1985-1997]
4
Novament apliquen el TCH:
2.96e+13−(3.95e+11−4.50e+12)/2
F*= = 57,9 > F2, 23 (α) (es consideren dos
(3.95e+11+ 4.50e+12) /27−2∗2
períodes). Per tant es rebutja la permanència estructural (es rebutja la hipòtesis nul.la
que els paràmetres siguin iguals en ambdós períodes), no hi ha una única estructura, hi
ha canvi estructural al 1985.
Amb Gretl o taules: F(2, 23); Valor crítico = 3.42213
D’altra banda l’exercici dona el següent resultat de Gretl directament:
Regresión aumentada para el contraste de Chow

MCO, usando las observaciones 1971-1997 (T = 27)
Variable dependiente: IM
Coeficiente Desv. Típica Estadístico t valor p

--------------------------------------------------------------
const −2.20250e+06 1.33908e+06 −1.645 0.1136
PIB 0.231731 0.0486443 4.764 8.39e-05 ***
splitdum −2.00679e+07 1.86643e+06 −10.75 1.91e-010 ***
sd_PIB 0.618280 0.0591672 10.45 3.31e-010 ***
Media de la vble. dep. 7150030 D.T. de la vble. dep. 3957467

Suma de cuad. residuos 4.90e+12 D.T. de la regresión 461552.8
R-cuadrado 0.987967 R-cuadrado corregido 0.986398
F(3, 23) 629.4867 Valor p (de F) 3.30e-22
Log-verosimilitud −388.2902 Criterio de Akaike 784.5804
Criterio de Schwarz 789.7638 Crit. de Hannan-Quinn 786.1217
rho 0.736017 Durbin-Watson 0.627850
Contraste de Chow de cambio estructural en la observación 1985

F(2, 23) = 57.9676 con valor p 0.0000
Per a la seva interpretació, ens fixem en el contrast que ja ens diu a l’any 1985 i amb el
valor p= 0,0000. És a dir, el p-valor associat a l’estadístic de CH és inferior al α = 0,05 i
per tant es rebutja igualtat de β en ambdós períodes considerats. Per tant, hi ha canvi
estructural l’any 1985.
L’exercici 5 de l’activitat 5 planteja diverses qüestions. Però abans vaig a reproduir la

taula amb els resultats que ens donen resultat d’estimar el model per al període 1928-
1941 i 1945-1950 amb la qual cosa es consideren 20 observacions de mostra total:
Ct =β1 + β 2 W t + β3 NW t + β 4 A t +ut
Coeficient Desv.Est. Estadístic t Interval

Constant 8,133 8,92 0,91 (-10,78, 27,04)
W 1,059 0,17 6,10 (0,69, 1,43)
NW 0,452 0,66 0,69 (-0,94, 1,84)
A 0,122 1,09 0,11 (-2,18, 2,43)
R2 = 0,95 Estadístic F = 107,37 SQE = 327,9304
5
La informació que ens subministren no és tota la sortida de Gretl i no tenim p-value
associats als estadístics t, però si donen intervals de confiança dels paràmetres β.
A més donen les dades d’una taula de correlació Rx que de moment deixem ja que
correspon al que estudiarem més endavant en el dia d’avui.
1. Interpretació dels resultats, destacant els aspectes més importants del model estima.
Quina problemàtica presenta el model ? i quines conseqüències tindrà sobre
l’estimació dels paràmetres ? (no ho podem respondre de moment).
La interpretació seria davant de l’increment d’una unitat de W de mitjana C
s’incrementa en 1,059. Així per la resta.
La significació econòmica, els signes dels paràmetres estimats, són positius i per
tant d’acord amb la realitat econòmica. A més rendes més consum.
Pel que fa a la significació estadística individual, tenim dues vies:
a) mirant l’interval de confiança si conté el 0. Així per β1 l’interval conté el 0 i per
tant vol dir que no es pot rebutjar que β1 sigui zero i per tant el terme independent no
és explicatiu. El mateix succeeix amb NW i A. Tot el contrari amb W que no conté
el zero.
b) comparant el valor de l’estadístic t* amb el valor de taules t20-4 = 2,1199. Només
W presenta un estadístic major que el valor de taules i per tant es rebutja que β2 sigui
zero i, en conseqüència, es considera que la variable W és explicativa
Pel que fa a la significació conjunta només es pot fer comparant l’estadístic F * amb
el valor de taules F4,16 = 3,0069, essent major i per tant rebutjant que conjuntament
β2, β3 i β4 siguin zero.
TENIM UN PROBLEMA, només una exògena individualment és explicativa però,
en canvi, en conjunt ho són.
2. Suposem que l’efecte de W sobre C és més gran que el de NW o el de A, de forma

específica: β 3=0 ,75 β 2 i β 4 =0 , 625 β 2 , els resultats imposant les restriccions són:
Restricció Restricció
Restriccions (1) i (2)
( β 3=0 ,75 β 2 ) ( β 4 =0 , 625 β 2 )
Constant 4,6 8,846 5,605
(4,75) (8,68) (3,68)
W 1,01 0,989 0,966
(0,14) (0,08) (0,05)
NW 0,758 0,491 0,725
(0,1) (0,63) (0,04)
A 0,245 0,618 0,604
(1,03) (0,05) (0,03)
SQE 332,4394 332,2345 334,8989
Només calcularé la tercera de les restriccions, és a dir:

H0 : β 3=0,75∗β 2
β 4 =0,625∗β 2
6
SQR R−SQE G /q 334,8−327,9/2
Apliquem l’estadístic F*= = = 0,17 < F2, 16 (α) La
SQEG / n−k 327,9 /16
conclusió és que s’accepta el Model restringit. Cal incorporar la restricció en el model:
C t=β 1 + β 2 ( W t +0,75∗NW t +0,625∗A t )+ ut
3. Determinar estadísticament la validesa de les restriccions imposades. Quins efectes

tindrien sobre la problemàtica abans plantejada ? Després ho podem respondre.
4. Amb la següent informació, contrastar la hipòtesis bàsica d’estabilitat mostral dels

paràmetres:
- Període 1928 – 41: SQE = 8,4007
- Període 1945 – 50: SQE = 93,8940
Està clar que ens demanen mirar si existeix la permanència estructural o bé un canvi
estructural l’any 1945. Aplicant el TCH:
327,9−(8,4+ 93,8)/ 2
F*= = 12,13 > F4, 12 (α) (es consideren dos períodes). Per tant es
(8,4 +93,8)/ 20−2∗4
rebutja la permanència estructural (es rebutja la hipòtesis nul.la que els paràmetres
siguin iguals en ambdós períodes), no hi ha una única estructura, hi ha canvi estructural
al 1945.
Quines implicacions tindria el resultat del contrast sobre la problemàtica esmentada ?
L’estimació no és vàlida. Més endavant veurem què apliquem.
Validació del model

Un cop s’ha estimat el model cal validar-lo, és a dir, establir que compleix amb totes les
hipòtesis bàsiques i que s’adequa a la realitat econòmica. Alguns passos ja els hem
donat. Però recordem i ampliem els passos que cal seguir.
1. Significació dels paràmetres
 Significació estadística del paràmetres individualment (prova t*) i conjuntament
(prova F*).
 Significació econòmica dels paràmetres (coherència dels resultats, especialment
dels signes dels paràmetres estimats, amb els que cal esperar des d’un punt de
vista econòmic).
2. Una bondat d’ajustament adequada. El coeficient de determinació és prou elevat (cal
tenir en compte el coeficient corregit per comparar amb altres models alternatius).
3. Realitzar les restriccions plantejades (en especial la prova F* de comparació d’un
model general amb el restringit).
4. Anàlisi d’observacions influents. Mitjançant l’estadístic (DFFITS).
5. Anàlisi dels residus (dels errors). NOVETAT
En primer lloc observem els gràfics per INTUIR si hi ha problemes:

- Dels residus versus els valors ajustats
7
- Dels residus versus cada exògena
Per exemple observant el gràfic dels residus (eix y) amb els valors ajustats (eix x)
s’observa que hi ha aleatorietat en els valors, no hi ha cap patró. Per tant, s’intueix que
es compleixen les hipòtesis de linealitat i d’homocedasticitat (variància del terme de
pertorbació constant).
En canvi, en el següent, s’observa la formació d’un con i, per tant, es pot intuir que
compleix la hipòtesis de linealitat però en canvi s’intueix l’existència
d’heteroscedasticitat (variància del terme de pertorbació no constant).
En el proper gràfic s’observa una forma parabòlica de les dades, per tant, s’intueix
l’incompliment de la hipòtesis de linealitat.
1
RESE1
-1
0 20 40 60 80 100 120 140 160 180

AJUS1
8
En segon lloc, s’analitza la normalitat dels residus atés que la HB del terme de
pertorbació indica que ui N ( μ , σ 2u ). Per aquesta anàlisi utilitzarem la prova Chi-quadrat,
considerant que es contrasta que Ho: normalitat dels residus, treballarem amb la
sortida directa del Gretl:
Distribución de frecuencias para uhat1, observaciones 1-27
número de cajas = 7, media = 2.75947e-010, desv.típ.=1.08807e+006
intervalo punto medio frecuencia rel acum.
< -1.012e+006 -1.328e+006 5 18.52% 18.52% ******

-1.012e+006 - -3.804e+005 -6.963e+005 7 25.93% 44.44% *********
-3.804e+005 - 2.515e+005 -6.444e+004 5 18.52% 62.96% ******
2.515e+005 - 8.833e+005 5.674e+005 4 14.81% 77.78% *****
8.833e+005 - 1.515e+006 1.199e+006 2 7.41% 85.19% **
1.515e+006 - 2.147e+006 1.831e+006 3 11.11% 96.30% ***
>= 2.147e+006 2.463e+006 1 3.70% 100.00% *
Contraste de la hipótesis nula de distribución normal: Chi-cuadrado(2) = 6.113 con valor p 0.04705
En aquest exemple, el valor p associat a l’estadístic Chi-quadrat és inferior 0,05 i, per

tant, rebutgem la normalitat dels residus.
Es pot considerar que la manca de normalitat és degut a:
- Omissió de variables rellevants
- No linealitat en l’especificació del model
- Existència d’observacions influents.
- Existència de canvi estructural
6. Errors d’especificació
En l’especificació del model a estimar es poden cometre errors d’entrada que poden
invalidad la seva estimació. Els errors que considerarem són:
a) en la selecció de les variables exògenes es poden excloure variables que són
rellevants (EN AQUEST CAS S’INVALIDA L’ESTIMACIÓ)
b) en la selecció de les variables exògenes incloure’n d’irrellevants (ESTIMACÓ
VÀLIDA PERÒ MENYS EFICIENT).
c) errors en la forma funcional (com hem vist ho INTUIM amb els gràfics anteriors), és
a dir, incompliment de la hipòtesis de linealitat
Per contrastar la forma funcional incorrecte tenim dues proves que contrasten la H0 : es
compleix la linealitat:
Primera: prova de nolinealitat (F*)
Suposem un model inicial:
9
y i=β 1 + β 2∗x 2 i+ β 3∗x3 i +ui
Al qual s’afegeix un bloc de variables:
y i=β 1 + β 2∗x 2 i+ β 3∗x3 i + β 4∗x 22i + β 5∗x 23 i +ui
Si es vol comparar els dos models, és a dir, contrastar si H0 : β 4 =0 i β 5=0 (observem

que són dos restriccions), cal utilitzar l’estadístic F* :
SQR R−SQE G /q
F*= ~ Fq, n-k
SQEG /n−k
Segona: Test Reset

Suposem un model inicial:
y i=β 1 + β 2∗x 2 i+ β 3∗x3 i +ui
Al qual s’afegeix com exògena els valors ajustats al quadrat:

2
y i=β 1 + β 2∗x 2 i+ β 3∗x3 i +α∗ ^y i +ui
Llavors el que es contrasta és si Ho : α = 0

α^
I al prova és t* = ⌊ ^ ⌋ ~ tn-k-1 Vigileu és n-k-1
S^ ^α
7. Anàlisi de la MULTICOLIENALITAT (NOVETAT)
En el procés de validació de l’estimació del model, cal analitzar l’existència de relacions

lineals entre les variables explicatives del model, és a dir, existència de
multicolinealitat. Recordar que per mesurar si entre dues variables hi ha relació lineal
cal obtenir el coeficient de correlació.
Entre les variables económiques existeix sempre cert grau de relació lineal i, per tant,
tenir-ne no és dolent. El que invalida l’estimació és que aquest grau de relació lineal o
dependència lineal sigui molt elevada. Per exemple si partim del model:
y i=β 1 + β 2∗x 2 i+ β 3∗x3 i +ui
I es compleix que x 2+ 2∗x 3=2 s’observa una dependència lineal entre les exògenes del
model que fan invalidar l’estimació.
Per INTUIR si el grau de multicolinealitat pot invalidar l’estimació es segueixen els
següents criteris:
1. Estabilitat dels paràmetres
Si al variar la mostra canvien notablement els estimadors és símptoma de
multicolinealitat.
2. Signe dels estimadors
10
Quan el signe dels estimadors no coincideix amb allò que s’espera d’acord amb la
lògica econòmica és característic de models amb multicolinealitat.
3. Contrastos de significació
Quan les variables no resisteixen les proves individuals i el model és explicatiu en el
seu conjunt pot ser culpa de multicolinealitat.
4. Coeficients de correlació: existeix correlacions altes entre les variables explicatives.
5. Matriu de correlacions entre les variables exògenes:
( )
1 r 12 ⋯ r 1k
1 ⋯ r2 k
R x=
⋱ ⋮
1 de manera que si
|R x|=0 total multicol·linealitat

|R x|=1 absència de multicolinealitat.
6. Per CONTRASTAR l’existència d’elevada multicol·linealitat, s’utilitza el Factor

d’inflació de la variància:
1
= 2
VIF 1−Ri On R 2 és el coeficient de determinació de la regressió de x respecte
i i i
a les altres variables explicatives xi = f(x1,.....xk).
Si el VIFi > 10 es considera que hi ha un excés de multicol·linealitat i s’invalida
l’estimació.
Les solucions per reduir la multicol·linealitat poden ser diverses:

- Augmentar la mostra (a vegades és impossible).
- Incorporar restriccions, si s’accepten.
- Excloure la variable que provoca la multicol·linealitat si l’estadístic ⌈ t ¿ ⌉ <¿ 1.
- Transformar les exògenes amb ratis (cal una altra variable que permeti obtenir
un rati, com població...).
**********************************************************************
L’exercici 1 de l’activitat 6, planteja l’anàlisi de la linealitat del model especificat.
S’estima el model y i=β 0 + β 1∗x 1 i+ β2∗x 2i +ui i s’observa que la variable x1 és
explicativa i que la x2 no ho és i per tant es podria eliminar. Però s’analitzen els residus:
11
15
10
5
uhat1
-5
-10
20 40 60 80 100 120 140 160
yhat1
Es detecta clarament un error d’especificació, doncs els residus presenten una forma
parabòlica. Per aquest motiu es calculen els dos estadístics que s’han analitzat. Si els
dos estadístics entressin en contradicció llavors només es considera la prova RESET.
Primer: prova de nolinealitat (F*)

Directament amb el Gretl, veiem que aquesta estimació suma dos noves exògenes sq_x1
i sq_x2, que són el bloc que s’incorpora amb aquesta prova: β 4∗x 22i + β 5∗x 23 i. S’observa
com la prova t* de sq_x1 té associat un p-value inferior al 0,05 i per tant fa que es
rebutgi que β 4 = 0. Per tant, la x 21 i és explicativa i, en conseqüència el model no és
lineal, a causa de la variable x 1 i .
Però també ho veiem amb el p-value de la prova = 0.00867918 que és menor que 0,05 i,
per tant, es rebutja la linealitat.
Auxiliary regression for non-linearity test (squared terms)

OLS, using observations 1-11
Dependent variable: uhat
coefficient std. error t-ratio p-value

-------------------------------------------------------
const 86.5542 18.7305 4.621 0.0036 ***
x1 -8.75307 1.53184 -5.714 0.0012 ***
x2 -5.25969 5.26974 -0.9981 0.3568
sq_x1 0.219583 0.0373071 5.886 0.0011 ***
sq_x2 0.693907 0.875549 0.7925 0.4582
Unadjusted R-squared = 0.863060
Test statistic: TR^2 = 9.49366,

with p-value = P(Chi-square(2) > 9.49366) = 0.00867918
Segona: prova Reset

Directament amb el Grel veiem que suma la variable valors ajustats al quadrat yhat^2 ,
que es correspon ambα∗ ^y 2i .
12
D’una banda s’observa com la prova t* de yhat^2 té associat un p-value inferior al 0,05 i
per tant fa que es rebutgi que α = 0. Per tant, la yhat^2 és explicativa i, en conseqüència
el model no és lineal.
Però també ho veiem amb el p-value de la prova = 0.000413 que és menor que 0,05 i,
per tant, es rebutja la linealitat.
Auxiliary regression for RESET specification test

Dependent variable: y

---------------------------------------------------------
const -5.50879 10.5173 -0.5238 0.6166
x1 3.24590 0.776510 4.180 0.0041 ***
x2 -1.17146 0.930517 -1.259 0.2484
yhat^2 0.00328213 0.000522839 6.278 0.0004 ***
Test statistic: F = 39.407294,

with p-value = P(F(1,7) > 39.4073) = 0.000413
Per resoldre el tema de la no linealitat, en aquest exercici atès que es coneix que la x 1 i
pot ser la causant s’opta per transformar aquesta variable. Així es prova intuïtivament,
però s’observa com x 2 i deixa de ser explicativa:

const 6.96679 2.68524 2.5945 0.03189 **
x2 -1.19239 0.86711 -1.3751 0.20637
x1x1 0.201616 0.00468017 43.0788 <0.00001 ***

F(2, 8) 1116.998 P-value(F) 1.62e-10
L’exercici 2 de l’activitat 6 planteja el mateix, analitzar la linealitat del model

especificat:
y t =β 0 +β 1 x 1t +β 2 x 2t +ut

const 16.8424 3.32805 5.0607 0.00002 ***
x1 -1.29511 0.371856 -3.4828 0.00165 ***
x2 -21.213 2.51706 -8.4277 <0.00001 ***
Mean dependent var -6.702519 S.D. dependent var 12.15089
13
F(2, 28) 36.42513 P-value(F) 1.62e-08
Els gràfics dels errors amb els valors ajustats i amb els valors de la primera exògena
insinuen no linealitat i que és aquesta exògena la causant:
15
10
5
Residuals
-5
-10
-25 -20 -15 -10 -5 0 5 10
Fitted
15
10
5
Residuals
-5
-10
0 2 4 6 8 10
x1
15
10
5
Residuals
-5
-10
0 0.2 0.4 0.6 0.8 1 1.2 1.4 1.6
x2
En canvi, la prova de la normalitat dels residus conclou que sí segueixen una distribució
normal
Frequency distribution for uhat1, obs 1-31
number of bins = 7, mean = -1.28929e-015, sd = 6.6272
interval midpt frequency rel. cum.
< -7.3211 -9.0104 5 16.13% 16.13% *****

-7.3211 - -3.9426 -5.6319 5 16.13% 32.26% *****
-3.9426 - -0.56406 -2.2533 5 16.13% 48.39% *****
-0.56406 - 2.8145 1.1252 6 19.35% 67.74% ******
2.8145 - 6.1930 4.5037 4 12.90% 80.65% ****
14
6.1930 - 9.5715 7.8823 2 6.45% 87.10% **
>= 9.5715 11.261 4 12.90% 100.00% ****
Test for null hypothesis of normal distribution:

Chi-square(2) = 2.771 with p-value 0.25015
Les proves de la linealitat amb resultats directes de Gretl indiquen que s’ha
especificat incorrectament i que és la x 1 i la causant.
Auxiliary regression for non-linearity test (squared terms)

Dependent variable: uhat

-------------------------------------------------------
const 9.05322 3.94441 2.295 0.0300 **
x1 -4.22197 1.10404 -3.824 0.0007 ***
x2 -8.80752 8.28957 -1.062 0.2978
sq_x1 0.396328 0.0993968 3.987 0.0005 ***
sq_x2 5.54007 4.91229 1.128 0.2697
Unadjusted R-squared = 0.379708
Test statistic: TR^2 = 11.7709,

with p-value = P(Chi-square(2) > 11.7709) = 0.00277954
Auxiliary regression for RESET specification test


-------------------------------------------------------
const 13.3926 3.22407 4.154 0.0003 ***
x1 -0.992732 0.350049 -2.836 0.0086 ***
x2 -13.5298 3.54407 -3.818 0.0007 ***
yhat^2 -0.0284839 0.0101371 -2.810 0.0091 ***
Test statistic: F = 7.895379,

with p-value = P(F(1,27) > 7.89538) = 0.00911
L’exercici 3 de l’activitat 6 demana de calcular els valors dels factors d’inflació. És a

dir, demana analitzar si hi ha un excés de multicol·linealitat, és a dir, si existeix un
elevat grau de dependència lineal entre les variables exògenes del model. De la
informació que ens donen és possible calcular els VIF i ja que faciliten els valors dels
coeficients de correlació. El model que s’estima és: i 1 y =β + β x + β x + β x +u
2 2i 3 3i 4 4i i
i les combinacions de coeficients de correlació entre les variables explicatives són
r23=0,55, r24=0,85 i r34=0,60.
D’aquí es pot obtenir la matriu Rx que és simètrica:
15
( )
1 0,55 0,85
R x = 0,55 1 0,60
0,85 0,60 1
A partir de la qual es pot obtenir la seva inversa:
( )
3,63 −0,22 −2,95
−1 1 '
Rx = ∗Ad j = −0,22 1,57 −0,75
⌈ Rx ⌉
−2,95 −0,75 3,96
D’aquí s’obté que:

VIF1 = 3,63
VIF2 = 1,57
VIF3 = 3,96
Cap supera el valor 10. Es considera que no hi ha excés de multicol·linealitat.
L’exercici 4 de l’activitat 6 també té per objectiu analitzar si hi ha excés de

multicol·linealitat. Amb les dades facilitades s’analitza que:
 La variables x1 no és explicativa mentre que la lògica financera li atorga rellevància.
 La correlació que presenten x1 i x2 és molt alta = 0,992.
 La matriu ⌈ R x ⌉ = 0,015 amb un valor molt baix.
 Amb el Gretl s’obtenen: VIF1 = 63,0; VIF2 = 60,7; VIF3 = 1,1. Els dos primers
superen el valor 10.
 La regressió de x1 sobre la resta, s’observa com x2 és explicativa.
Predictor Coef DesvEst t p
Constant 0,004840 0,006140 0,79 0,436
X2 0,48277 0,01109 43,54 0,000
X3 0,0000772 0,0001232 0,63 0,535
s = 0,003944 R-qdt = 98,4% R-qdt(corr) = 98,3%
1 1
= 2
D’aquí es calcula VIF1 1−Ri = 1−0,984 = 62,5
L’exercici 5 de l’activitat 6 planteja diverses qüestions.

S’estima INEX =β 1+ β2 CONS+ β 3 GPER + β 4 GEX +u, i el resultat és:

Dependent variable: INEX
const 3729.61 3240.87 1.1508 0.27054
GEX 0.648393 0.218018 2.9740 0.01076 **
16
GPER 0.663397 0.415687 1.5959 0.13452
CONS 0.392848 0.276641 1.4201 0.17912

F(3, 13) 4207.203 P-value(F) 1.16e-19
Els diferents anàlisi ens porten a intuir excés de multicol·linealitat, però només els VIF
conclouen que en hi ha.
 Només GEX és explicativa, tot i que en conjunt són explicatives.
 Del gràfic de residus versus valors ajustats, s’intueix un con.
20000
15000
10000
5000
Residuals
-5000
-10000
-15000
-20000
0 200000 400000 600000 800000 1e+006
Fitted
 La matriu de correlacions entre les variables exògenes (NOMÉS) indica que la

correlació entre les exògenes és molt elevat. I el determinant de la matriu de
correlacions |R_x |=0,000033924 és molt baix.
Correlation coefficients, using the observations 1 - 17
5% critical value (two-tailed) = 0.4821 for n = 17
CONS GEX GPER

1.0000 0.9978 0.9904 CONS
1.0000 0.9953 GEX
1.0000 GPER
 Amb el Gret s’obtenen directament els VIF que són molt elevats: GEX 564.571;
GPER 131.395; CONS 274.101.
 Aquests valors també s’obtenen fen les REGRESSIONS AUXILIARS (UNA
REGRESSIÓ AUXILIAR NO S’EXPLICA NOMÉS ES FA PER OBTERNIR
UN VALOR CONCRET).

Dependent variable: CONS
const 2079.21 3081.28 0.6748 0.51080
GEX 0.709049 0.0919378 7.7123 <0.00001 ***
GPER -0.639877 0.36336 -1.7610 0.10005

17
F(2, 14) 1911.709 P-value(F) 8.60e-18
1 1
= 2
VIFCONS 1−Ri = 1−0,9963 = 274,1

Dependent variable: GEX
const -1270.81 3958.33 -0.3210 0.75292
GPER 1.48001 0.321261 4.6069 0.00041 ***
CONS 1.14163 0.148027 7.7123 <0.00001 ***

F(2, 14) 3945.000 P-value(F) 5.47e-20
1 1
=
VIFGEX 1−R2i = 1−0,9982 = 564,5

Dependent variable: GPER
const -182.041 2083.11 -0.0874 0.93160
CONS -0.283398 0.16093 -1.7610 0.10005
GEX 0.407116 0.0883711 4.6069 0.00041 ***

F(2, 14) 912.7659 P-value(F) 1.48e-15
1 1
=
VIFGPER 1−R2i = 1−0,9923 = 131,3
I l’exercici 7 de l’activitat 6 és també per analitzar la multicol·linealitat.

El valor dels VIF són inferiors a 10. S’obtenen directament amb el Gretl o bé es
calculen a partir de les regressions auxiliars entre les variables exògenes.
Dependent variable: cc
18
const -138.129 513.266 -0.2691 0.79108
cv 6.07684 4.18225 1.4530 0.16443
velocitatmax 6.46948 4.70513 1.3750 0.18699

F(2, 17) 29.97120 P-value(F) 2.67e-06

Dependent variable: cv
const -89.6043 17.865 -5.0156 0.00011 ***
velocitatmax 0.816371 0.185441 4.4023 0.00039 ***
cc 0.0181789 0.0125113 1.4530 0.16443

F(2, 17) 65.58981 P-value(F) 1.02e-08

Dependent variable: velocitatmax
const 98.2716 8.03388 12.2321 <0.00001 ***
cc 0.0154697 0.0112508 1.3750 0.18699
cv 0.652542 0.148227 4.4023 0.00039 ***

F(2, 17) 64.73442 P-value(F) 1.12e-08
Per últim, de l’exercici 6 de l’activitat 5 faltaven dos aspectes.

Quina problemàtica presenta el model ? i quines conseqüències tindrà sobre l’estimació
dels paràmetres ? Doncs que una variable explicativa individualment i explicatives totes
en conjunt és símptoma de multicol·linealitat excessiva. Però cal obtenir els VIF per
afirmar-ho.
Determinar estadísticament la validesa de les restriccions imposades. Quins efectes
tindrien sobre la problemàtica abans plantejada ? Acceptar les restriccions redueix el
nombre de variables exògenes i millora la multicol·linealitat.
19
20

AMPLIACIÓ Permanència Estructural

Uploaded by

Document Information

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

AMPLIACIÓ Permanència Estructural

Uploaded by

Copyright:

Available Formats

TEORIA.

Mean dependent var 65878.60 S.D. dependent var 53253.59

Mean dependent var 91097.86 S.D. dependent var 59224.83

Mean dependent var 69669.92 S.D. dependent var 54780.66

Mean dependent var 28873.50 S.D. dependent var 15272.46

Aplicant el TEST DE CHOW

Si succeeix que la mida d’una de les submostres és < K, generalment si t2 < k, el

Vegem l’exemple 3 de l’activitat 5

Model 2: OLS, using observations 1-15

Mean dependent var 104.5933 S.D. dependent var 3.204119

Mean dependent var 105.3000 S.D. dependent var 2.737395

IMPORTANT: en considerar els períodes, el canvi estructural es considera l’any de

L’exercici 5 de l’activitat 5 planteja obertament la prova de la permanència estructural,

L’exercici 6 de l’activitat 5, vol analitzar si les importacions en funció del PIB en el

D’altra banda l’exercici dona el següent resultat de Gretl directament:

Regresión aumentada para el contraste de Chow

Coeficiente Desv. Típica Estadístico t valor p

Media de la vble. dep. 7150030 D.T. de la vble. dep. 3957467

Contraste de Chow de cambio estructural en la observación 1985

L’exercici 5 de l’activitat 5 planteja diverses qüestions. Però abans vaig a reproduir la

Coeficient Desv.Est. Estadístic t Interval

2. Suposem que l’efecte de W sobre C és més gran que el de NW o el de A, de forma

Només calcularé la tercera de les restriccions, és a dir:

3. Determinar estadísticament la validesa de les restriccions imposades. Quins efectes

4. Amb la següent informació, contrastar la hipòtesis bàsica d’estabilitat mostral dels

Validació del model

5. Anàlisi dels residus (dels errors). NOVETAT

En primer lloc observem els gràfics per INTUIR si hi ha problemes:

0 20 40 60 80 100 120 140 160 180

intervalo punto medio frecuencia rel acum.

< -1.012e+006 -1.328e+006 5 18.52% 18.52% ******

En aquest exemple, el valor p associat a l’estadístic Chi-quadrat és inferior 0,05 i, per

Al qual s’afegeix un bloc de variables:

y i=β 1 + β 2∗x 2 i+ β 3∗x3 i + β 4∗x 22i + β 5∗x 23 i +ui

Si es vol comparar els dos models, és a dir, contrastar si H0 : β 4 =0 i β 5=0 (observem

Segona: Test Reset

Al qual s’afegeix com exògena els valors ajustats al quadrat:

Llavors el que es contrasta és si Ho : α = 0

7. Anàlisi de la MULTICOLIENALITAT (NOVETAT)

En el procés de validació de l’estimació del model, cal analitzar l’existència de relacions

|R x|=0 total multicol·linealitat

6. Per CONTRASTAR l’existència d’elevada multicol·linealitat, s’utilitza el Factor

Les solucions per reduir la multicol·linealitat poden ser diverses:

Primer: prova de nolinealitat (F*)

Auxiliary regression for non-linearity test (squared terms)

coefficient std. error t-ratio p-value

Unadjusted R-squared = 0.863060

Test statistic: TR^2 = 9.49366,

Segona: prova Reset

Auxiliary regression for RESET specification test

coefficient std. error t-ratio p-value

Test statistic: F = 39.407294,

Model 1: OLS, using observations 1-11

Mean dependent var 92.20909 S.D. dependent var 53.37686

L’exercici 2 de l’activitat 6 planteja el mateix, analitzar la linealitat del model

Model 1: OLS, using observations 1-31

Mean dependent var -6.702519 S.D. dependent var 12.15089

number of bins = 7, mean = -1.28929e-015, sd = 6.6272

interval midpt frequency rel. cum.

< -7.3211 -9.0104 5 16.13% 16.13% *****

Test for null hypothesis of normal distribution:

Auxiliary regression for non-linearity test (squared terms)

coefficient std. error t-ratio p-value