You are on page 1of 20

TEORIA.

Permanència Estructural
L’objectiu és analitzar si es mantenen constants les β del model en compliment de la
hipòtesis bàsica del model, és a dir, si existeix permanència estructural. Si s’incompleix
hi ha CANVI ESTRUCTURAL (en cas d’una mostra temporal analitzar si existeix més
d’un cicle econòmic i en cas d’una mostra transversal si existeix més d’una estructura
social). Per contrastar-ho s’utilitza el TEST DE CHOW.
SQE T −( SQE 1+ SQE 2) / K
TCH= F*= ֊ Fk, n-k (es consideren dos subperíodes en aquesta
( SQE1 + SQE 2)/ T −2∗K
fórmula general)
On k és el número de β del model que es contrasten en els subperíodes o subestructures.
Si F* < Fk, n-k (α) es considera que s’accepta PERMANÈNCIA ESTRUCTURAL (que
les β siguin iguals en els períodes o estructures considerades).
Si F* > Fk, n-k (α) es considera que s’accepta CANVI ESTRUCTURAL (que les β siguin
diferents en els períodes o estructures considerades).
En cas d’acceptar canvi estructural es considera que no és vàlida l’estimació. Més
endavant veurem què fem.
Anem a veure l’exemple 2 de l’activitat 5.
Es considera la possibilitat que el model d’estalvi no sigui vàlid per a una sola
estructura, sinó per a tres, segons el tipus d’hàbitat, rural (1), semi urbà (2) i urbà (3).
En aquest cas cal aplicar el TCH i cal estimar el model amb totes les dades i després
estimar tres models segons les dades que representen diferents hàbitats. Amb el Gretl
per tal de modificar la mostra anem a MUESTRA—ESTABLECER RANGO i anem
modificant el rang.
TOTA LA MOSTRA
Model 1: OLS, using observations 1-25
Dependent variable: Estalvi
Coefficient Std. Error t-ratio p-value
const -14707.7 11783.2 -1.2482 0.22452
Renda 0.215948 0.0276462 7.8111 <0.00001 ***

Mean dependent var 65878.60 S.D. dependent var 53253.59


Sum squared resid 1.86e+10 S.E. of regression 28462.89
R-squared 0.726236 Adjusted R-squared 0.714333
F(1, 23) 61.01386 P-value(F) 6.45e-08
Log-likelihood -290.8401 Akaike criterion 585.6802
Schwarz criterion 588.1180 Hannan-Quinn 586.3563

Una primera anàlisi de l’estimació ens porta a afirmar que el signe del paràmetre estimat
és positiu i d’acord amb la realitat econòmica i que la variable renda és explicativa (atès
que el p-value de l’estadístic t-ratio associat és menor que α = 0,05 i per tant es rebutja

1
la H0: β=0). També que la bondat de l’ajustament és millorable amb un 0,72 (la
regressió explica el 72% de les variacions de l’estalvi).

RURAL
Model 2: OLS, using observations 1-7
Dependent variable: Estalvi rural
Coefficient Std. Error t-ratio p-value
const -14825.8 65.1732 -227.4831 <0.00001 ***
Renda 0.319947 0.000174824 1830.1095 <0.00001 ***

Mean dependent var 91097.86 S.D. dependent var 59224.83


Sum squared resid 31417.68 S.E. of regression 79.26876
R-squared 0.999999 Adjusted R-squared 0.999998
F(1, 5) 3349301 P-value(F) 9.25e-16
Log-likelihood -39.36483 Akaike criterion 82.72965
Schwarz criterion 82.62147 Hannan-Quinn 81.39257

SEMI URBÀ
Model 6: OLS, using observations 8-19
Dependent variable: Estalvi
Coefficient Std. Error t-ratio p-value
const -14743.8 190.122 -77.5488 <0.00001 ***
Renda 0.209713 0.000401197 522.7171 <0.00001 ***

Mean dependent var 69669.92 S.D. dependent var 54780.66


Sum squared resid 1208086 S.E. of regression 347.5754
R-squared 0.999963 Adjusted R-squared 0.999960
F(1, 10) 273233.1 P-value(F) 1.62e-23
Log-likelihood -86.14511 Akaike criterion 176.2902
Schwarz criterion 177.2600 Hannan-Quinn 175.9312

URBÀ
Model 7: OLS, using observations 20-25
Dependent variable: Estalvi
Coefficient Std. Error t-ratio p-value
const -14887.8 42.6802 -348.8219 <0.00001 ***
Renda 0.120354 0.000111842 1076.1068 <0.00001 ***

Mean dependent var 28873.50 S.D. dependent var 15272.46


Sum squared resid 4028.429 S.E. of regression 31.73495
R-squared 0.999997 Adjusted R-squared 0.999996
F(1, 4) 1158006 P-value(F) 4.47e-12
Log-likelihood -28.04175 Akaike criterion 60.08350
Schwarz criterion 59.66702 Hannan-Quinn 58.41629

Aplicant el TEST DE CHOW

2
F*= 1.86e+10−(31417+1208086+ 4028,4)/2 = 142.338 > Fk, n-k (α) (es consideren tres
¿¿
estructures). Per tant es rebutja la permanència estructural (es rebutja la hipòtesis nul.la
que els paràmetres siguin iguals), no hi ha una única estructura.

Si succeeix que la mida d’una de les submostres és < K, generalment si t2 < k, el


contrast que s’utilitza és:
SQE T −SQE 1 / t 2
TCH= F*= ֊ Ft2, t1-k
SQE 1 / t 1−K

Vegem l’exemple 3 de l’activitat 5


Es creu que un model vàlid per explicar l’evolució del consum de carn de vedella seria
aquell que incorporés com a variables explicatives el preu de la carn de primera i el
temps (temps = anys – 1982). Per aquest motiu s’efectua una regressió amb totes les
dades:

Model 2: OLS, using observations 1-15


Dependent variable: CP
Coefficient Std. Error t-ratio p-value
const 906.29 276.171 3.2816 0.00656 ***
PC1 1.47157 0.240013 6.1312 0.00005 ***
Any -0.48073 0.148127 -3.2454 0.00702 ***

Mean dependent var 104.5933 S.D. dependent var 3.204119


Sum squared resid 32.00060 S.E. of regression 1.633009
R-squared 0.777355 Adjusted R-squared 0.740248
F(2, 12) 20.94874 P-value(F) 0.000122
Log-likelihood -26.96686 Akaike criterion 59.93372
Schwarz criterion 62.05787 Hannan-Quinn 59.91110

Malgrat la bondat dels resultats aconseguits es pensa que l’afer de les “vaques boges”
esdevingut a principis de l’any 1985 pot haver alterat la relació funcional entre les
variables i per tant produir un canvi estructural. És a dir, es pot pensar que a partir de
1985 el comportament del consum de carn és diferent. Així es realitza la regressió pel
període 1982 –1994 i aplicar el test de Chow :
Model 3: OLS, using observations 1982 –1994
Dependent variable: CP
Coefficient Std. Error t-ratio p-value
const -1272.88 347.506 -3.6629 0.00437 ***
PC1 -0.0176233 0.245317 -0.0718 0.94415
Any 0.694178 0.187154 3.7091 0.00405 ***

Mean dependent var 105.3000 S.D. dependent var 2.737395


Sum squared resid 5.433679 S.E. of regression 0.737135

3
R-squared 0.939572 Adjusted R-squared 0.927486
F(2, 10) 77.74320 P-value(F) 8.06e-07
Log-likelihood -12.77604 Akaike criterion 31.55207
Schwarz criterion 33.24692 Hannan-Quinn 31.20371

Com s’observa NO es fa la regressió pel període 1985-1986, atès que són dos dades i <
a K. En aquest cas l’estadístic que s’utilitza és:
SQE T −SQE 1 / t 2 32.000−5.43/2
TCH= F*= = = 24,45 > F2,10 Per tant, es rebutja la
SQE 1 / t 1−K 5.43 /13−3
permanència estructural, no és vàlid el model restringit (el que manté constants les β en
tot el període). El model presenta un canvi estructural en 1985.
Amb Gretl: F(2, 10); Valor crítico = 4.10282

IMPORTANT: en considerar els períodes, el canvi estructural es considera l’any de


l’extrem inferior del segon període, és a dir 1995:
- Primer: [1982-1994]
- Segon: [1995-1996]

L’exercici 5 de l’activitat 5 planteja obertament la prova de la permanència estructural,


donat que ofereix l’estimació de tot un període i l’estimació de dos subperíodes.
S’aplica el TCH. IMPORTANT, calcular bé els anys:

- [1964-1995]: 32 anys
- [1964-1974]: 11 anys
- [1975-1995]: 21 anys
- POSSIBLE CANVI ESTRUCTURAL A L’ANY 1975.

0,044−( 0,017+0,018 ) 3
F*= = 6,68 > F3, 26 (α) (es consideren dos períodes). Per tant es
(0,017+ 0,018)/32−2∗3
rebutja la permanència estructural (es rebutja la hipòtesis nul.la que els paràmetres
siguin iguals en els dos períodes), no hi ha una única estructura, hi ha canvi estructural
al 1975.
Amb Gretl o amb taules: F(3, 26); Valor crítico = 2.97515

L’exercici 6 de l’activitat 5, vol analitzar si les importacions en funció del PIB en el


període [1971-1997] presenten una única estructural. Com s’observa en el gràfic de
l’evolució de les importacions es podria INTUIR un canvi al voltant de l’any 1985.
Mirant la informació que dona l’exercici tenim tres estimacions, donant a entendre que
el canvi estructural és al 1985;

- [1971-1997]
- [1971-1984]
- [1985-1997]

4
Novament apliquen el TCH:

2.96e+13−(3.95e+11−4.50e+12)/2
F*= = 57,9 > F2, 23 (α) (es consideren dos
(3.95e+11+ 4.50e+12) /27−2∗2
períodes). Per tant es rebutja la permanència estructural (es rebutja la hipòtesis nul.la
que els paràmetres siguin iguals en ambdós períodes), no hi ha una única estructura, hi
ha canvi estructural al 1985.
Amb Gretl o taules: F(2, 23); Valor crítico = 3.42213

D’altra banda l’exercici dona el següent resultat de Gretl directament:

Regresión aumentada para el contraste de Chow


MCO, usando las observaciones 1971-1997 (T = 27)
Variable dependiente: IM

Coeficiente Desv. Típica Estadístico t valor p


--------------------------------------------------------------
const −2.20250e+06 1.33908e+06 −1.645 0.1136
PIB 0.231731 0.0486443 4.764 8.39e-05 ***
splitdum −2.00679e+07 1.86643e+06 −10.75 1.91e-010 ***
sd_PIB 0.618280 0.0591672 10.45 3.31e-010 ***

Media de la vble. dep. 7150030 D.T. de la vble. dep. 3957467


Suma de cuad. residuos 4.90e+12 D.T. de la regresión 461552.8
R-cuadrado 0.987967 R-cuadrado corregido 0.986398
F(3, 23) 629.4867 Valor p (de F) 3.30e-22
Log-verosimilitud −388.2902 Criterio de Akaike 784.5804
Criterio de Schwarz 789.7638 Crit. de Hannan-Quinn 786.1217
rho 0.736017 Durbin-Watson 0.627850

Contraste de Chow de cambio estructural en la observación 1985


F(2, 23) = 57.9676 con valor p 0.0000

Per a la seva interpretació, ens fixem en el contrast que ja ens diu a l’any 1985 i amb el
valor p= 0,0000. És a dir, el p-valor associat a l’estadístic de CH és inferior al α = 0,05 i
per tant es rebutja igualtat de β en ambdós períodes considerats. Per tant, hi ha canvi
estructural l’any 1985.

L’exercici 5 de l’activitat 5 planteja diverses qüestions. Però abans vaig a reproduir la


taula amb els resultats que ens donen resultat d’estimar el model per al període 1928-
1941 i 1945-1950 amb la qual cosa es consideren 20 observacions de mostra total:
Ct =β1 + β 2 W t + β3 NW t + β 4 A t +ut

Coeficient Desv.Est. Estadístic t Interval


Constant 8,133 8,92 0,91 (-10,78, 27,04)
W 1,059 0,17 6,10 (0,69, 1,43)
NW 0,452 0,66 0,69 (-0,94, 1,84)
A 0,122 1,09 0,11 (-2,18, 2,43)
R2 = 0,95 Estadístic F = 107,37 SQE = 327,9304

5
La informació que ens subministren no és tota la sortida de Gretl i no tenim p-value
associats als estadístics t, però si donen intervals de confiança dels paràmetres β.

A més donen les dades d’una taula de correlació Rx que de moment deixem ja que
correspon al que estudiarem més endavant en el dia d’avui.

1. Interpretació dels resultats, destacant els aspectes més importants del model estima.
Quina problemàtica presenta el model ? i quines conseqüències tindrà sobre
l’estimació dels paràmetres ? (no ho podem respondre de moment).
La interpretació seria davant de l’increment d’una unitat de W de mitjana C
s’incrementa en 1,059. Així per la resta.
La significació econòmica, els signes dels paràmetres estimats, són positius i per
tant d’acord amb la realitat econòmica. A més rendes més consum.
Pel que fa a la significació estadística individual, tenim dues vies:
a) mirant l’interval de confiança si conté el 0. Així per β1 l’interval conté el 0 i per
tant vol dir que no es pot rebutjar que β1 sigui zero i per tant el terme independent no
és explicatiu. El mateix succeeix amb NW i A. Tot el contrari amb W que no conté
el zero.
b) comparant el valor de l’estadístic t* amb el valor de taules t20-4 = 2,1199. Només
W presenta un estadístic major que el valor de taules i per tant es rebutja que β2 sigui
zero i, en conseqüència, es considera que la variable W és explicativa
Pel que fa a la significació conjunta només es pot fer comparant l’estadístic F * amb
el valor de taules F4,16 = 3,0069, essent major i per tant rebutjant que conjuntament
β2, β3 i β4 siguin zero.
TENIM UN PROBLEMA, només una exògena individualment és explicativa però,
en canvi, en conjunt ho són.

2. Suposem que l’efecte de W sobre C és més gran que el de NW o el de A, de forma


específica: β 3=0 ,75 β 2 i β 4 =0 , 625 β 2 , els resultats imposant les restriccions són:

Restricció Restricció
Restriccions (1) i (2)
( β 3=0 ,75 β 2 ) ( β 4 =0 , 625 β 2 )
Constant 4,6 8,846 5,605
(4,75) (8,68) (3,68)
W 1,01 0,989 0,966
(0,14) (0,08) (0,05)
NW 0,758 0,491 0,725
(0,1) (0,63) (0,04)
A 0,245 0,618 0,604
(1,03) (0,05) (0,03)
SQE 332,4394 332,2345 334,8989

Només calcularé la tercera de les restriccions, és a dir:


H0 : β 3=0,75∗β 2
β 4 =0,625∗β 2

6
SQR R−SQE G /q 334,8−327,9/2
Apliquem l’estadístic F*= = = 0,17 < F2, 16 (α) La
SQEG / n−k 327,9 /16
conclusió és que s’accepta el Model restringit. Cal incorporar la restricció en el model:
C t=β 1 + β 2 ( W t +0,75∗NW t +0,625∗A t )+ ut

3. Determinar estadísticament la validesa de les restriccions imposades. Quins efectes


tindrien sobre la problemàtica abans plantejada ? Després ho podem respondre.

4. Amb la següent informació, contrastar la hipòtesis bàsica d’estabilitat mostral dels


paràmetres:
- Període 1928 – 41: SQE = 8,4007
- Període 1945 – 50: SQE = 93,8940
Està clar que ens demanen mirar si existeix la permanència estructural o bé un canvi
estructural l’any 1945. Aplicant el TCH:
327,9−(8,4+ 93,8)/ 2
F*= = 12,13 > F4, 12 (α) (es consideren dos períodes). Per tant es
(8,4 +93,8)/ 20−2∗4
rebutja la permanència estructural (es rebutja la hipòtesis nul.la que els paràmetres
siguin iguals en ambdós períodes), no hi ha una única estructura, hi ha canvi estructural
al 1945.
Quines implicacions tindria el resultat del contrast sobre la problemàtica esmentada ?
L’estimació no és vàlida. Més endavant veurem què apliquem.

Validació del model


Un cop s’ha estimat el model cal validar-lo, és a dir, establir que compleix amb totes les
hipòtesis bàsiques i que s’adequa a la realitat econòmica. Alguns passos ja els hem
donat. Però recordem i ampliem els passos que cal seguir.
1. Significació dels paràmetres
 Significació estadística del paràmetres individualment (prova t*) i conjuntament
(prova F*).
 Significació econòmica dels paràmetres (coherència dels resultats, especialment
dels signes dels paràmetres estimats, amb els que cal esperar des d’un punt de
vista econòmic).
2. Una bondat d’ajustament adequada. El coeficient de determinació és prou elevat (cal
tenir en compte el coeficient corregit per comparar amb altres models alternatius).
3. Realitzar les restriccions plantejades (en especial la prova F* de comparació d’un
model general amb el restringit).
4. Anàlisi d’observacions influents. Mitjançant l’estadístic (DFFITS).

5. Anàlisi dels residus (dels errors). NOVETAT

En primer lloc observem els gràfics per INTUIR si hi ha problemes:


- Dels residus versus els valors ajustats

7
- Dels residus versus cada exògena

Per exemple observant el gràfic dels residus (eix y) amb els valors ajustats (eix x)
s’observa que hi ha aleatorietat en els valors, no hi ha cap patró. Per tant, s’intueix que
es compleixen les hipòtesis de linealitat i d’homocedasticitat (variància del terme de
pertorbació constant).

En canvi, en el següent, s’observa la formació d’un con i, per tant, es pot intuir que
compleix la hipòtesis de linealitat però en canvi s’intueix l’existència
d’heteroscedasticitat (variància del terme de pertorbació no constant).

En el proper gràfic s’observa una forma parabòlica de les dades, per tant, s’intueix
l’incompliment de la hipòtesis de linealitat.

1
RESE1

-1

0 20 40 60 80 100 120 140 160 180


AJUS1

8
En segon lloc, s’analitza la normalitat dels residus atés que la HB del terme de
pertorbació indica que ui N ( μ , σ 2u ). Per aquesta anàlisi utilitzarem la prova Chi-quadrat,
considerant que es contrasta que Ho: normalitat dels residus, treballarem amb la
sortida directa del Gretl:
Distribución de frecuencias para uhat1, observaciones 1-27
número de cajas = 7, media = 2.75947e-010, desv.típ.=1.08807e+006

intervalo punto medio frecuencia rel acum.

< -1.012e+006 -1.328e+006 5 18.52% 18.52% ******


-1.012e+006 - -3.804e+005 -6.963e+005 7 25.93% 44.44% *********
-3.804e+005 - 2.515e+005 -6.444e+004 5 18.52% 62.96% ******
2.515e+005 - 8.833e+005 5.674e+005 4 14.81% 77.78% *****
8.833e+005 - 1.515e+006 1.199e+006 2 7.41% 85.19% **
1.515e+006 - 2.147e+006 1.831e+006 3 11.11% 96.30% ***
>= 2.147e+006 2.463e+006 1 3.70% 100.00% *

Contraste de la hipótesis nula de distribución normal: Chi-cuadrado(2) = 6.113 con valor p 0.04705

En aquest exemple, el valor p associat a l’estadístic Chi-quadrat és inferior 0,05 i, per


tant, rebutgem la normalitat dels residus.
Es pot considerar que la manca de normalitat és degut a:
- Omissió de variables rellevants
- No linealitat en l’especificació del model
- Existència d’observacions influents.
- Existència de canvi estructural

6. Errors d’especificació

En l’especificació del model a estimar es poden cometre errors d’entrada que poden
invalidad la seva estimació. Els errors que considerarem són:
a) en la selecció de les variables exògenes es poden excloure variables que són
rellevants (EN AQUEST CAS S’INVALIDA L’ESTIMACIÓ)
b) en la selecció de les variables exògenes incloure’n d’irrellevants (ESTIMACÓ
VÀLIDA PERÒ MENYS EFICIENT).
c) errors en la forma funcional (com hem vist ho INTUIM amb els gràfics anteriors), és
a dir, incompliment de la hipòtesis de linealitat
Per contrastar la forma funcional incorrecte tenim dues proves que contrasten la H0 : es
compleix la linealitat:
Primera: prova de nolinealitat (F*)
Suposem un model inicial:

9
y i=β 1 + β 2∗x 2 i+ β 3∗x3 i +ui

Al qual s’afegeix un bloc de variables:

y i=β 1 + β 2∗x 2 i+ β 3∗x3 i + β 4∗x 22i + β 5∗x 23 i +ui

Si es vol comparar els dos models, és a dir, contrastar si H0 : β 4 =0 i β 5=0 (observem


que són dos restriccions), cal utilitzar l’estadístic F* :
SQR R−SQE G /q
F*= ~ Fq, n-k
SQEG /n−k

Segona: Test Reset


Suposem un model inicial:
y i=β 1 + β 2∗x 2 i+ β 3∗x3 i +ui

Al qual s’afegeix com exògena els valors ajustats al quadrat:


2
y i=β 1 + β 2∗x 2 i+ β 3∗x3 i +α∗ ^y i +ui

Llavors el que es contrasta és si Ho : α = 0


α^
I al prova és t* = ⌊ ^ ⌋ ~ tn-k-1 Vigileu és n-k-1
S^ ^α

7. Anàlisi de la MULTICOLIENALITAT (NOVETAT)

En el procés de validació de l’estimació del model, cal analitzar l’existència de relacions


lineals entre les variables explicatives del model, és a dir, existència de
multicolinealitat. Recordar que per mesurar si entre dues variables hi ha relació lineal
cal obtenir el coeficient de correlació.
Entre les variables económiques existeix sempre cert grau de relació lineal i, per tant,
tenir-ne no és dolent. El que invalida l’estimació és que aquest grau de relació lineal o
dependència lineal sigui molt elevada. Per exemple si partim del model:
y i=β 1 + β 2∗x 2 i+ β 3∗x3 i +ui

I es compleix que x 2+ 2∗x 3=2 s’observa una dependència lineal entre les exògenes del
model que fan invalidar l’estimació.
Per INTUIR si el grau de multicolinealitat pot invalidar l’estimació es segueixen els
següents criteris:
1. Estabilitat dels paràmetres
Si al variar la mostra canvien notablement els estimadors és símptoma de
multicolinealitat.
2. Signe dels estimadors

10
Quan el signe dels estimadors no coincideix amb allò que s’espera d’acord amb la
lògica econòmica és característic de models amb multicolinealitat.
3. Contrastos de significació
Quan les variables no resisteixen les proves individuals i el model és explicatiu en el
seu conjunt pot ser culpa de multicolinealitat.
4. Coeficients de correlació: existeix correlacions altes entre les variables explicatives.
5. Matriu de correlacions entre les variables exògenes:

( )
1 r 12 ⋯ r 1k
1 ⋯ r2 k
R x=
⋱ ⋮
1 de manera que si

|R x|=0 total multicol·linealitat


|R x|=1 absència de multicolinealitat.

6. Per CONTRASTAR l’existència d’elevada multicol·linealitat, s’utilitza el Factor


d’inflació de la variància:
1
= 2
VIF 1−Ri On R 2 és el coeficient de determinació de la regressió de x respecte
i i i
a les altres variables explicatives xi = f(x1,.....xk).
Si el VIFi > 10 es considera que hi ha un excés de multicol·linealitat i s’invalida
l’estimació.

Les solucions per reduir la multicol·linealitat poden ser diverses:


- Augmentar la mostra (a vegades és impossible).
- Incorporar restriccions, si s’accepten.
- Excloure la variable que provoca la multicol·linealitat si l’estadístic ⌈ t ¿ ⌉ <¿ 1.
- Transformar les exògenes amb ratis (cal una altra variable que permeti obtenir
un rati, com població...).
**********************************************************************
L’exercici 1 de l’activitat 6, planteja l’anàlisi de la linealitat del model especificat.
S’estima el model y i=β 0 + β 1∗x 1 i+ β2∗x 2i +ui i s’observa que la variable x1 és
explicativa i que la x2 no ho és i per tant es podria eliminar. Però s’analitzen els residus:

11
15

10

5
uhat1

-5

-10
20 40 60 80 100 120 140 160
yhat1

Es detecta clarament un error d’especificació, doncs els residus presenten una forma
parabòlica. Per aquest motiu es calculen els dos estadístics que s’han analitzat. Si els
dos estadístics entressin en contradicció llavors només es considera la prova RESET.

Primer: prova de nolinealitat (F*)


Directament amb el Gretl, veiem que aquesta estimació suma dos noves exògenes sq_x1
i sq_x2, que són el bloc que s’incorpora amb aquesta prova: β 4∗x 22i + β 5∗x 23 i. S’observa
com la prova t* de sq_x1 té associat un p-value inferior al 0,05 i per tant fa que es
rebutgi que β 4 = 0. Per tant, la x 21 i és explicativa i, en conseqüència el model no és
lineal, a causa de la variable x 1 i .
Però també ho veiem amb el p-value de la prova = 0.00867918 que és menor que 0,05 i,
per tant, es rebutja la linealitat.

Auxiliary regression for non-linearity test (squared terms)


OLS, using observations 1-11
Dependent variable: uhat

coefficient std. error t-ratio p-value


-------------------------------------------------------
const 86.5542 18.7305 4.621 0.0036 ***
x1 -8.75307 1.53184 -5.714 0.0012 ***
x2 -5.25969 5.26974 -0.9981 0.3568
sq_x1 0.219583 0.0373071 5.886 0.0011 ***
sq_x2 0.693907 0.875549 0.7925 0.4582

Unadjusted R-squared = 0.863060

Test statistic: TR^2 = 9.49366,


with p-value = P(Chi-square(2) > 9.49366) = 0.00867918

Segona: prova Reset


Directament amb el Grel veiem que suma la variable valors ajustats al quadrat yhat^2 ,
que es correspon ambα∗ ^y 2i .

12
D’una banda s’observa com la prova t* de yhat^2 té associat un p-value inferior al 0,05 i
per tant fa que es rebutgi que α = 0. Per tant, la yhat^2 és explicativa i, en conseqüència
el model no és lineal.
Però també ho veiem amb el p-value de la prova = 0.000413 que és menor que 0,05 i,
per tant, es rebutja la linealitat.

Auxiliary regression for RESET specification test


OLS, using observations 1-11
Dependent variable: y

coefficient std. error t-ratio p-value


---------------------------------------------------------
const -5.50879 10.5173 -0.5238 0.6166
x1 3.24590 0.776510 4.180 0.0041 ***
x2 -1.17146 0.930517 -1.259 0.2484
yhat^2 0.00328213 0.000522839 6.278 0.0004 ***

Test statistic: F = 39.407294,


with p-value = P(F(1,7) > 39.4073) = 0.000413

Per resoldre el tema de la no linealitat, en aquest exercici atès que es coneix que la x 1 i
pot ser la causant s’opta per transformar aquesta variable. Així es prova intuïtivament,
però s’observa com x 2 i deixa de ser explicativa:

Model 1: OLS, using observations 1-11


Dependent variable: y
Coefficient Std. Error t-ratio p-value
const 6.96679 2.68524 2.5945 0.03189 **
x2 -1.19239 0.86711 -1.3751 0.20637
x1x1 0.201616 0.00468017 43.0788 <0.00001 ***

Mean dependent var 92.20909 S.D. dependent var 53.37686


Sum squared resid 101.6626 S.E. of regression 3.564804
R-squared 0.996432 Adjusted R-squared 0.995540
F(2, 8) 1116.998 P-value(F) 1.62e-10
Log-likelihood -27.83903 Akaike criterion 61.67806
Schwarz criterion 62.87174 Hannan-Quinn 60.92560

L’exercici 2 de l’activitat 6 planteja el mateix, analitzar la linealitat del model


especificat:
y t =β 0 +β 1 x 1t +β 2 x 2t +ut

Model 1: OLS, using observations 1-31


Dependent variable: y
Coefficient Std. Error t-ratio p-value
const 16.8424 3.32805 5.0607 0.00002 ***
x1 -1.29511 0.371856 -3.4828 0.00165 ***
x2 -21.213 2.51706 -8.4277 <0.00001 ***

Mean dependent var -6.702519 S.D. dependent var 12.15089

13
Sum squared resid 1229.754 S.E. of regression 6.627200
R-squared 0.722361 Adjusted R-squared 0.702529
F(2, 28) 36.42513 P-value(F) 1.62e-08
Log-likelihood -101.0361 Akaike criterion 208.0722
Schwarz criterion 212.3742 Hannan-Quinn 209.4746

Els gràfics dels errors amb els valors ajustats i amb els valors de la primera exògena
insinuen no linealitat i que és aquesta exògena la causant:
15

10

5
Residuals

-5

-10
-25 -20 -15 -10 -5 0 5 10
Fitted

15

10

5
Residuals

-5

-10
0 2 4 6 8 10
x1

15

10

5
Residuals

-5

-10
0 0.2 0.4 0.6 0.8 1 1.2 1.4 1.6
x2

En canvi, la prova de la normalitat dels residus conclou que sí segueixen una distribució
normal
Frequency distribution for uhat1, obs 1-31

number of bins = 7, mean = -1.28929e-015, sd = 6.6272

interval midpt frequency rel. cum.

< -7.3211 -9.0104 5 16.13% 16.13% *****


-7.3211 - -3.9426 -5.6319 5 16.13% 32.26% *****
-3.9426 - -0.56406 -2.2533 5 16.13% 48.39% *****
-0.56406 - 2.8145 1.1252 6 19.35% 67.74% ******
2.8145 - 6.1930 4.5037 4 12.90% 80.65% ****

14
6.1930 - 9.5715 7.8823 2 6.45% 87.10% **
>= 9.5715 11.261 4 12.90% 100.00% ****

Test for null hypothesis of normal distribution:


Chi-square(2) = 2.771 with p-value 0.25015

Les proves de la linealitat amb resultats directes de Gretl indiquen que s’ha
especificat incorrectament i que és la x 1 i la causant.

Auxiliary regression for non-linearity test (squared terms)


OLS, using observations 1-31
Dependent variable: uhat

coefficient std. error t-ratio p-value


-------------------------------------------------------
const 9.05322 3.94441 2.295 0.0300 **
x1 -4.22197 1.10404 -3.824 0.0007 ***
x2 -8.80752 8.28957 -1.062 0.2978
sq_x1 0.396328 0.0993968 3.987 0.0005 ***
sq_x2 5.54007 4.91229 1.128 0.2697

Unadjusted R-squared = 0.379708

Test statistic: TR^2 = 11.7709,


with p-value = P(Chi-square(2) > 11.7709) = 0.00277954

Auxiliary regression for RESET specification test


OLS, using observations 1-31
Dependent variable: y

coefficient std. error t-ratio p-value


-------------------------------------------------------
const 13.3926 3.22407 4.154 0.0003 ***
x1 -0.992732 0.350049 -2.836 0.0086 ***
x2 -13.5298 3.54407 -3.818 0.0007 ***
yhat^2 -0.0284839 0.0101371 -2.810 0.0091 ***

Test statistic: F = 7.895379,


with p-value = P(F(1,27) > 7.89538) = 0.00911

L’exercici 3 de l’activitat 6 demana de calcular els valors dels factors d’inflació. És a


dir, demana analitzar si hi ha un excés de multicol·linealitat, és a dir, si existeix un
elevat grau de dependència lineal entre les variables exògenes del model. De la
informació que ens donen és possible calcular els VIF i ja que faciliten els valors dels
coeficients de correlació. El model que s’estima és: i 1 y =β + β x + β x + β x +u
2 2i 3 3i 4 4i i
i les combinacions de coeficients de correlació entre les variables explicatives són
r23=0,55, r24=0,85 i r34=0,60.
D’aquí es pot obtenir la matriu Rx que és simètrica:

15
( )
1 0,55 0,85
R x = 0,55 1 0,60
0,85 0,60 1

A partir de la qual es pot obtenir la seva inversa:

( )
3,63 −0,22 −2,95
−1 1 '
Rx = ∗Ad j = −0,22 1,57 −0,75
⌈ Rx ⌉
−2,95 −0,75 3,96

D’aquí s’obté que:


VIF1 = 3,63
VIF2 = 1,57
VIF3 = 3,96
Cap supera el valor 10. Es considera que no hi ha excés de multicol·linealitat.

L’exercici 4 de l’activitat 6 també té per objectiu analitzar si hi ha excés de


multicol·linealitat. Amb les dades facilitades s’analitza que:
 La variables x1 no és explicativa mentre que la lògica financera li atorga rellevància.
 La correlació que presenten x1 i x2 és molt alta = 0,992.
 La matriu ⌈ R x ⌉ = 0,015 amb un valor molt baix.
 Amb el Gretl s’obtenen: VIF1 = 63,0; VIF2 = 60,7; VIF3 = 1,1. Els dos primers
superen el valor 10.
 La regressió de x1 sobre la resta, s’observa com x2 és explicativa.
Predictor Coef DesvEst t p

Constant 0,004840 0,006140 0,79 0,436

X2 0,48277 0,01109 43,54 0,000

X3 0,0000772 0,0001232 0,63 0,535

s = 0,003944 R-qdt = 98,4% R-qdt(corr) = 98,3%

1 1
= 2
D’aquí es calcula VIF1 1−Ri = 1−0,984 = 62,5

L’exercici 5 de l’activitat 6 planteja diverses qüestions.


S’estima INEX =β 1+ β2 CONS+ β 3 GPER + β 4 GEX +u, i el resultat és:

Model 1: OLS, using observations 1-17


Dependent variable: INEX
Coefficient Std. Error t-ratio p-value
const 3729.61 3240.87 1.1508 0.27054
GEX 0.648393 0.218018 2.9740 0.01076 **

16
GPER 0.663397 0.415687 1.5959 0.13452
CONS 0.392848 0.276641 1.4201 0.17912

Mean dependent var 235017.0 S.D. dependent var 279592.1


Sum squared resid 1.29e+09 S.E. of regression 9949.564
R-squared 0.998971 Adjusted R-squared 0.998734
F(3, 13) 4207.203 P-value(F) 1.16e-19
Log-likelihood -178.3315 Akaike criterion 364.6631
Schwarz criterion 367.9959 Hannan-Quinn 364.9944

Els diferents anàlisi ens porten a intuir excés de multicol·linealitat, però només els VIF
conclouen que en hi ha.
 Només GEX és explicativa, tot i que en conjunt són explicatives.
 Del gràfic de residus versus valors ajustats, s’intueix un con.
20000

15000

10000

5000
Residuals

-5000

-10000

-15000

-20000
0 200000 400000 600000 800000 1e+006
Fitted

 La matriu de correlacions entre les variables exògenes (NOMÉS) indica que la


correlació entre les exògenes és molt elevat. I el determinant de la matriu de
correlacions |R_x |=0,000033924 és molt baix.
Correlation coefficients, using the observations 1 - 17
5% critical value (two-tailed) = 0.4821 for n = 17

CONS GEX GPER


1.0000 0.9978 0.9904 CONS
1.0000 0.9953 GEX
1.0000 GPER

 Amb el Gret s’obtenen directament els VIF que són molt elevats: GEX 564.571;
GPER 131.395; CONS 274.101.
 Aquests valors també s’obtenen fen les REGRESSIONS AUXILIARS (UNA
REGRESSIÓ AUXILIAR NO S’EXPLICA NOMÉS ES FA PER OBTERNIR
UN VALOR CONCRET).

Model 2: OLS, using observations 1-17


Dependent variable: CONS
Coefficient Std. Error t-ratio p-value
const 2079.21 3081.28 0.6748 0.51080
GEX 0.709049 0.0919378 7.7123 <0.00001 ***
GPER -0.639877 0.36336 -1.7610 0.10005

Mean dependent var 125401.6 S.D. dependent var 148861.9


Sum squared resid 1.29e+09 S.E. of regression 9612.225
R-squared 0.996352 Adjusted R-squared 0.995831

17
F(2, 14) 1911.709 P-value(F) 8.60e-18
Log-likelihood -178.3751 Akaike criterion 362.7502
Schwarz criterion 365.2498 Hannan-Quinn 362.9986

1 1
= 2
VIFCONS 1−Ri = 1−0,9963 = 274,1

Model 3: OLS, using observations 1-17


Dependent variable: GEX
Coefficient Std. Error t-ratio p-value
const -1270.81 3958.33 -0.3210 0.75292
GPER 1.48001 0.321261 4.6069 0.00041 ***
CONS 1.14163 0.148027 7.7123 <0.00001 ***

Mean dependent var 223981.2 S.D. dependent var 271088.6


Sum squared resid 2.08e+09 S.E. of regression 12196.85
R-squared 0.998229 Adjusted R-squared 0.997976
F(2, 14) 3945.000 P-value(F) 5.47e-20
Log-likelihood -182.4235 Akaike criterion 370.8470
Schwarz criterion 373.3466 Hannan-Quinn 371.0955

1 1
=
VIFGEX 1−R2i = 1−0,9982 = 564,5

Model 4: OLS, using observations 1-17


Dependent variable: GPER
Coefficient Std. Error t-ratio p-value
const -182.041 2083.11 -0.0874 0.93160
CONS -0.283398 0.16093 -1.7610 0.10005
GEX 0.407116 0.0883711 4.6069 0.00041 ***

Mean dependent var 55465.76 S.D. dependent var 68591.10


Sum squared resid 5.73e+08 S.E. of regression 6396.967
R-squared 0.992389 Adjusted R-squared 0.991302
F(2, 14) 912.7659 P-value(F) 1.48e-15
Log-likelihood -171.4525 Akaike criterion 348.9050
Schwarz criterion 351.4046 Hannan-Quinn 349.1534

1 1
=
VIFGPER 1−R2i = 1−0,9923 = 131,3

I l’exercici 7 de l’activitat 6 és també per analitzar la multicol·linealitat.


El valor dels VIF són inferiors a 10. S’obtenen directament amb el Gretl o bé es
calculen a partir de les regressions auxiliars entre les variables exògenes.
Model 2: OLS, using observations 1-20
Dependent variable: cc
Coefficient Std. Error t-ratio p-value

18
const -138.129 513.266 -0.2691 0.79108
cv 6.07684 4.18225 1.4530 0.16443
velocitatmax 6.46948 4.70513 1.3750 0.18699

Mean dependent var 1316.850 S.D. dependent var 247.0651


Sum squared resid 256247.6 S.E. of regression 122.7737
R-squared 0.779055 Adjusted R-squared 0.753062
F(2, 17) 29.97120 P-value(F) 2.67e-06
Log-likelihood -122.9604 Akaike criterion 251.9209
Schwarz criterion 254.9081 Hannan-Quinn 252.5040

Model 3: OLS, using observations 1-20


Dependent variable: cv
Coefficient Std. Error t-ratio p-value
const -89.6043 17.865 -5.0156 0.00011 ***
velocitatmax 0.816371 0.185441 4.4023 0.00039 ***
cc 0.0181789 0.0125113 1.4530 0.16443

Mean dependent var 66.75000 S.D. dependent var 18.75289


Sum squared resid 766.5680 S.E. of regression 6.715075
R-squared 0.885274 Adjusted R-squared 0.871777
F(2, 17) 65.58981 P-value(F) 1.02e-08
Log-likelihood -64.84068 Akaike criterion 135.6814
Schwarz criterion 138.6686 Hannan-Quinn 136.2645

Model 4: OLS, using observations 1-20


Dependent variable: velocitatmax
Coefficient Std. Error t-ratio p-value
const 98.2716 8.03388 12.2321 <0.00001 ***
cc 0.0154697 0.0112508 1.3750 0.18699
cv 0.652542 0.148227 4.4023 0.00039 ***

Mean dependent var 162.2000 S.D. dependent var 16.66891


Sum squared resid 612.7337 S.E. of regression 6.003596
R-squared 0.883934 Adjusted R-squared 0.870280
F(2, 17) 64.73442 P-value(F) 1.12e-08
Log-likelihood -62.60075 Akaike criterion 131.2015
Schwarz criterion 134.1887 Hannan-Quinn 131.7846

Per últim, de l’exercici 6 de l’activitat 5 faltaven dos aspectes.


Quina problemàtica presenta el model ? i quines conseqüències tindrà sobre l’estimació
dels paràmetres ? Doncs que una variable explicativa individualment i explicatives totes
en conjunt és símptoma de multicol·linealitat excessiva. Però cal obtenir els VIF per
afirmar-ho.
Determinar estadísticament la validesa de les restriccions imposades. Quins efectes
tindrien sobre la problemàtica abans plantejada ? Acceptar les restriccions redueix el
nombre de variables exògenes i millora la multicol·linealitat.

19
20

You might also like