Professional Documents
Culture Documents
AMPLIACIÓ Permanència Estructural
AMPLIACIÓ Permanència Estructural
Permanència Estructural
L’objectiu és analitzar si es mantenen constants les β del model en compliment de la
hipòtesis bàsica del model, és a dir, si existeix permanència estructural. Si s’incompleix
hi ha CANVI ESTRUCTURAL (en cas d’una mostra temporal analitzar si existeix més
d’un cicle econòmic i en cas d’una mostra transversal si existeix més d’una estructura
social). Per contrastar-ho s’utilitza el TEST DE CHOW.
SQE T −( SQE 1+ SQE 2) / K
TCH= F*= ֊ Fk, n-k (es consideren dos subperíodes en aquesta
( SQE1 + SQE 2)/ T −2∗K
fórmula general)
On k és el número de β del model que es contrasten en els subperíodes o subestructures.
Si F* < Fk, n-k (α) es considera que s’accepta PERMANÈNCIA ESTRUCTURAL (que
les β siguin iguals en els períodes o estructures considerades).
Si F* > Fk, n-k (α) es considera que s’accepta CANVI ESTRUCTURAL (que les β siguin
diferents en els períodes o estructures considerades).
En cas d’acceptar canvi estructural es considera que no és vàlida l’estimació. Més
endavant veurem què fem.
Anem a veure l’exemple 2 de l’activitat 5.
Es considera la possibilitat que el model d’estalvi no sigui vàlid per a una sola
estructura, sinó per a tres, segons el tipus d’hàbitat, rural (1), semi urbà (2) i urbà (3).
En aquest cas cal aplicar el TCH i cal estimar el model amb totes les dades i després
estimar tres models segons les dades que representen diferents hàbitats. Amb el Gretl
per tal de modificar la mostra anem a MUESTRA—ESTABLECER RANGO i anem
modificant el rang.
TOTA LA MOSTRA
Model 1: OLS, using observations 1-25
Dependent variable: Estalvi
Coefficient Std. Error t-ratio p-value
const -14707.7 11783.2 -1.2482 0.22452
Renda 0.215948 0.0276462 7.8111 <0.00001 ***
Una primera anàlisi de l’estimació ens porta a afirmar que el signe del paràmetre estimat
és positiu i d’acord amb la realitat econòmica i que la variable renda és explicativa (atès
que el p-value de l’estadístic t-ratio associat és menor que α = 0,05 i per tant es rebutja
1
la H0: β=0). També que la bondat de l’ajustament és millorable amb un 0,72 (la
regressió explica el 72% de les variacions de l’estalvi).
RURAL
Model 2: OLS, using observations 1-7
Dependent variable: Estalvi rural
Coefficient Std. Error t-ratio p-value
const -14825.8 65.1732 -227.4831 <0.00001 ***
Renda 0.319947 0.000174824 1830.1095 <0.00001 ***
SEMI URBÀ
Model 6: OLS, using observations 8-19
Dependent variable: Estalvi
Coefficient Std. Error t-ratio p-value
const -14743.8 190.122 -77.5488 <0.00001 ***
Renda 0.209713 0.000401197 522.7171 <0.00001 ***
URBÀ
Model 7: OLS, using observations 20-25
Dependent variable: Estalvi
Coefficient Std. Error t-ratio p-value
const -14887.8 42.6802 -348.8219 <0.00001 ***
Renda 0.120354 0.000111842 1076.1068 <0.00001 ***
2
F*= 1.86e+10−(31417+1208086+ 4028,4)/2 = 142.338 > Fk, n-k (α) (es consideren tres
¿¿
estructures). Per tant es rebutja la permanència estructural (es rebutja la hipòtesis nul.la
que els paràmetres siguin iguals), no hi ha una única estructura.
Malgrat la bondat dels resultats aconseguits es pensa que l’afer de les “vaques boges”
esdevingut a principis de l’any 1985 pot haver alterat la relació funcional entre les
variables i per tant produir un canvi estructural. És a dir, es pot pensar que a partir de
1985 el comportament del consum de carn és diferent. Així es realitza la regressió pel
període 1982 –1994 i aplicar el test de Chow :
Model 3: OLS, using observations 1982 –1994
Dependent variable: CP
Coefficient Std. Error t-ratio p-value
const -1272.88 347.506 -3.6629 0.00437 ***
PC1 -0.0176233 0.245317 -0.0718 0.94415
Any 0.694178 0.187154 3.7091 0.00405 ***
3
R-squared 0.939572 Adjusted R-squared 0.927486
F(2, 10) 77.74320 P-value(F) 8.06e-07
Log-likelihood -12.77604 Akaike criterion 31.55207
Schwarz criterion 33.24692 Hannan-Quinn 31.20371
Com s’observa NO es fa la regressió pel període 1985-1986, atès que són dos dades i <
a K. En aquest cas l’estadístic que s’utilitza és:
SQE T −SQE 1 / t 2 32.000−5.43/2
TCH= F*= = = 24,45 > F2,10 Per tant, es rebutja la
SQE 1 / t 1−K 5.43 /13−3
permanència estructural, no és vàlid el model restringit (el que manté constants les β en
tot el període). El model presenta un canvi estructural en 1985.
Amb Gretl: F(2, 10); Valor crítico = 4.10282
- [1964-1995]: 32 anys
- [1964-1974]: 11 anys
- [1975-1995]: 21 anys
- POSSIBLE CANVI ESTRUCTURAL A L’ANY 1975.
0,044−( 0,017+0,018 ) 3
F*= = 6,68 > F3, 26 (α) (es consideren dos períodes). Per tant es
(0,017+ 0,018)/32−2∗3
rebutja la permanència estructural (es rebutja la hipòtesis nul.la que els paràmetres
siguin iguals en els dos períodes), no hi ha una única estructura, hi ha canvi estructural
al 1975.
Amb Gretl o amb taules: F(3, 26); Valor crítico = 2.97515
- [1971-1997]
- [1971-1984]
- [1985-1997]
4
Novament apliquen el TCH:
2.96e+13−(3.95e+11−4.50e+12)/2
F*= = 57,9 > F2, 23 (α) (es consideren dos
(3.95e+11+ 4.50e+12) /27−2∗2
períodes). Per tant es rebutja la permanència estructural (es rebutja la hipòtesis nul.la
que els paràmetres siguin iguals en ambdós períodes), no hi ha una única estructura, hi
ha canvi estructural al 1985.
Amb Gretl o taules: F(2, 23); Valor crítico = 3.42213
Per a la seva interpretació, ens fixem en el contrast que ja ens diu a l’any 1985 i amb el
valor p= 0,0000. És a dir, el p-valor associat a l’estadístic de CH és inferior al α = 0,05 i
per tant es rebutja igualtat de β en ambdós períodes considerats. Per tant, hi ha canvi
estructural l’any 1985.
5
La informació que ens subministren no és tota la sortida de Gretl i no tenim p-value
associats als estadístics t, però si donen intervals de confiança dels paràmetres β.
A més donen les dades d’una taula de correlació Rx que de moment deixem ja que
correspon al que estudiarem més endavant en el dia d’avui.
1. Interpretació dels resultats, destacant els aspectes més importants del model estima.
Quina problemàtica presenta el model ? i quines conseqüències tindrà sobre
l’estimació dels paràmetres ? (no ho podem respondre de moment).
La interpretació seria davant de l’increment d’una unitat de W de mitjana C
s’incrementa en 1,059. Així per la resta.
La significació econòmica, els signes dels paràmetres estimats, són positius i per
tant d’acord amb la realitat econòmica. A més rendes més consum.
Pel que fa a la significació estadística individual, tenim dues vies:
a) mirant l’interval de confiança si conté el 0. Així per β1 l’interval conté el 0 i per
tant vol dir que no es pot rebutjar que β1 sigui zero i per tant el terme independent no
és explicatiu. El mateix succeeix amb NW i A. Tot el contrari amb W que no conté
el zero.
b) comparant el valor de l’estadístic t* amb el valor de taules t20-4 = 2,1199. Només
W presenta un estadístic major que el valor de taules i per tant es rebutja que β2 sigui
zero i, en conseqüència, es considera que la variable W és explicativa
Pel que fa a la significació conjunta només es pot fer comparant l’estadístic F * amb
el valor de taules F4,16 = 3,0069, essent major i per tant rebutjant que conjuntament
β2, β3 i β4 siguin zero.
TENIM UN PROBLEMA, només una exògena individualment és explicativa però,
en canvi, en conjunt ho són.
Restricció Restricció
Restriccions (1) i (2)
( β 3=0 ,75 β 2 ) ( β 4 =0 , 625 β 2 )
Constant 4,6 8,846 5,605
(4,75) (8,68) (3,68)
W 1,01 0,989 0,966
(0,14) (0,08) (0,05)
NW 0,758 0,491 0,725
(0,1) (0,63) (0,04)
A 0,245 0,618 0,604
(1,03) (0,05) (0,03)
SQE 332,4394 332,2345 334,8989
6
SQR R−SQE G /q 334,8−327,9/2
Apliquem l’estadístic F*= = = 0,17 < F2, 16 (α) La
SQEG / n−k 327,9 /16
conclusió és que s’accepta el Model restringit. Cal incorporar la restricció en el model:
C t=β 1 + β 2 ( W t +0,75∗NW t +0,625∗A t )+ ut
7
- Dels residus versus cada exògena
Per exemple observant el gràfic dels residus (eix y) amb els valors ajustats (eix x)
s’observa que hi ha aleatorietat en els valors, no hi ha cap patró. Per tant, s’intueix que
es compleixen les hipòtesis de linealitat i d’homocedasticitat (variància del terme de
pertorbació constant).
En canvi, en el següent, s’observa la formació d’un con i, per tant, es pot intuir que
compleix la hipòtesis de linealitat però en canvi s’intueix l’existència
d’heteroscedasticitat (variància del terme de pertorbació no constant).
En el proper gràfic s’observa una forma parabòlica de les dades, per tant, s’intueix
l’incompliment de la hipòtesis de linealitat.
1
RESE1
-1
8
En segon lloc, s’analitza la normalitat dels residus atés que la HB del terme de
pertorbació indica que ui N ( μ , σ 2u ). Per aquesta anàlisi utilitzarem la prova Chi-quadrat,
considerant que es contrasta que Ho: normalitat dels residus, treballarem amb la
sortida directa del Gretl:
Distribución de frecuencias para uhat1, observaciones 1-27
número de cajas = 7, media = 2.75947e-010, desv.típ.=1.08807e+006
Contraste de la hipótesis nula de distribución normal: Chi-cuadrado(2) = 6.113 con valor p 0.04705
6. Errors d’especificació
En l’especificació del model a estimar es poden cometre errors d’entrada que poden
invalidad la seva estimació. Els errors que considerarem són:
a) en la selecció de les variables exògenes es poden excloure variables que són
rellevants (EN AQUEST CAS S’INVALIDA L’ESTIMACIÓ)
b) en la selecció de les variables exògenes incloure’n d’irrellevants (ESTIMACÓ
VÀLIDA PERÒ MENYS EFICIENT).
c) errors en la forma funcional (com hem vist ho INTUIM amb els gràfics anteriors), és
a dir, incompliment de la hipòtesis de linealitat
Per contrastar la forma funcional incorrecte tenim dues proves que contrasten la H0 : es
compleix la linealitat:
Primera: prova de nolinealitat (F*)
Suposem un model inicial:
9
y i=β 1 + β 2∗x 2 i+ β 3∗x3 i +ui
I es compleix que x 2+ 2∗x 3=2 s’observa una dependència lineal entre les exògenes del
model que fan invalidar l’estimació.
Per INTUIR si el grau de multicolinealitat pot invalidar l’estimació es segueixen els
següents criteris:
1. Estabilitat dels paràmetres
Si al variar la mostra canvien notablement els estimadors és símptoma de
multicolinealitat.
2. Signe dels estimadors
10
Quan el signe dels estimadors no coincideix amb allò que s’espera d’acord amb la
lògica econòmica és característic de models amb multicolinealitat.
3. Contrastos de significació
Quan les variables no resisteixen les proves individuals i el model és explicatiu en el
seu conjunt pot ser culpa de multicolinealitat.
4. Coeficients de correlació: existeix correlacions altes entre les variables explicatives.
5. Matriu de correlacions entre les variables exògenes:
( )
1 r 12 ⋯ r 1k
1 ⋯ r2 k
R x=
⋱ ⋮
1 de manera que si
11
15
10
5
uhat1
-5
-10
20 40 60 80 100 120 140 160
yhat1
Es detecta clarament un error d’especificació, doncs els residus presenten una forma
parabòlica. Per aquest motiu es calculen els dos estadístics que s’han analitzat. Si els
dos estadístics entressin en contradicció llavors només es considera la prova RESET.
12
D’una banda s’observa com la prova t* de yhat^2 té associat un p-value inferior al 0,05 i
per tant fa que es rebutgi que α = 0. Per tant, la yhat^2 és explicativa i, en conseqüència
el model no és lineal.
Però també ho veiem amb el p-value de la prova = 0.000413 que és menor que 0,05 i,
per tant, es rebutja la linealitat.
Per resoldre el tema de la no linealitat, en aquest exercici atès que es coneix que la x 1 i
pot ser la causant s’opta per transformar aquesta variable. Així es prova intuïtivament,
però s’observa com x 2 i deixa de ser explicativa:
13
Sum squared resid 1229.754 S.E. of regression 6.627200
R-squared 0.722361 Adjusted R-squared 0.702529
F(2, 28) 36.42513 P-value(F) 1.62e-08
Log-likelihood -101.0361 Akaike criterion 208.0722
Schwarz criterion 212.3742 Hannan-Quinn 209.4746
Els gràfics dels errors amb els valors ajustats i amb els valors de la primera exògena
insinuen no linealitat i que és aquesta exògena la causant:
15
10
5
Residuals
-5
-10
-25 -20 -15 -10 -5 0 5 10
Fitted
15
10
5
Residuals
-5
-10
0 2 4 6 8 10
x1
15
10
5
Residuals
-5
-10
0 0.2 0.4 0.6 0.8 1 1.2 1.4 1.6
x2
En canvi, la prova de la normalitat dels residus conclou que sí segueixen una distribució
normal
Frequency distribution for uhat1, obs 1-31
14
6.1930 - 9.5715 7.8823 2 6.45% 87.10% **
>= 9.5715 11.261 4 12.90% 100.00% ****
Les proves de la linealitat amb resultats directes de Gretl indiquen que s’ha
especificat incorrectament i que és la x 1 i la causant.
15
( )
1 0,55 0,85
R x = 0,55 1 0,60
0,85 0,60 1
( )
3,63 −0,22 −2,95
−1 1 '
Rx = ∗Ad j = −0,22 1,57 −0,75
⌈ Rx ⌉
−2,95 −0,75 3,96
1 1
= 2
D’aquí es calcula VIF1 1−Ri = 1−0,984 = 62,5
16
GPER 0.663397 0.415687 1.5959 0.13452
CONS 0.392848 0.276641 1.4201 0.17912
Els diferents anàlisi ens porten a intuir excés de multicol·linealitat, però només els VIF
conclouen que en hi ha.
Només GEX és explicativa, tot i que en conjunt són explicatives.
Del gràfic de residus versus valors ajustats, s’intueix un con.
20000
15000
10000
5000
Residuals
-5000
-10000
-15000
-20000
0 200000 400000 600000 800000 1e+006
Fitted
Amb el Gret s’obtenen directament els VIF que són molt elevats: GEX 564.571;
GPER 131.395; CONS 274.101.
Aquests valors també s’obtenen fen les REGRESSIONS AUXILIARS (UNA
REGRESSIÓ AUXILIAR NO S’EXPLICA NOMÉS ES FA PER OBTERNIR
UN VALOR CONCRET).
17
F(2, 14) 1911.709 P-value(F) 8.60e-18
Log-likelihood -178.3751 Akaike criterion 362.7502
Schwarz criterion 365.2498 Hannan-Quinn 362.9986
1 1
= 2
VIFCONS 1−Ri = 1−0,9963 = 274,1
1 1
=
VIFGEX 1−R2i = 1−0,9982 = 564,5
1 1
=
VIFGPER 1−R2i = 1−0,9923 = 131,3
18
const -138.129 513.266 -0.2691 0.79108
cv 6.07684 4.18225 1.4530 0.16443
velocitatmax 6.46948 4.70513 1.3750 0.18699
19
20