You are on page 1of 19

Exerccios em Computador

Lista 6: Heterocedasticidade

CAPTULO 8
1) Utilize os dados contidos no arquivo VOTE1.RAW para fazer este exerccio.
(i)

Estime um modelo com voteA como a varivel dependente e prtystrA, democA,


log(expendA) e log(expendB) como as variveis independentes. Obtenha os resduos
MQO, i, e faa a regresso desses resduos sobre todas as variveis independentes.
2
Explique por que voc obtm R = 0.

Rodar o modelo inicial com base nas variveis explicadas: votea c prtystra democa lexpenda
lexpendb

Dependent Variable: VOTEA


Method: Least Squares
Date: 10/01/16 Time: 09:38
Sample: 1 173
Included observations: 173
Variable

Coefficient

Std. Error

t-Statistic

Prob.

C
PRTYSTRA
DEMOCA
LEXPENDA
LEXPENDB

37.66141
0.251918
3.792943
5.779294
-6.237836

4.736036
0.071293
1.406520
0.391820
0.397460

7.952097
3.533575
2.696687
14.74988
-15.69427

0.0000
0.0005
0.0077
0.0000
0.0000

R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
F-statistic
Prob(F-statistic)

0.801163
0.796429
7.573085
9635.072
-593.1954
169.2288
0.000000

Mean dependent var


S.D. dependent var
Akaike info criterion
Schwarz criterion
Hannan-Quinn criter.
Durbin-Watson stat

Cria srie de resduos: Proc > Make residual series.


Rodar um modelo com a srie de resduos

Dependent Variable: RESID01


Method: Least Squares
Date: 10/01/16 Time: 09:39

50.50289
16.78476
6.915554
7.006690
6.952527
1.524816

Sample: 1 173
Included observations: 173
Variable

Coefficient

Std. Error

t-Statistic

Prob.

C
PRTYSTRA
DEMOCA
LEXPENDA
LEXPENDB

4.04E-13
-1.14E-15
-7.16E-14
-4.93E-15
-5.43E-14

4.736036
0.071293
1.406520
0.391820
0.397460

8.54E-14
-1.60E-14
-5.09E-14
-1.26E-14
-1.37E-13

1.0000
1.0000
1.0000
1.0000
1.0000

R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
Durbin-Watson stat

0.000000
-0.023810
7.573085
9635.072
-593.1954
1.524816

Mean dependent var


S.D. dependent var
Akaike info criterion
Schwarz criterion
Hannan-Quinn criter.

1.40E-14
7.484508
6.915554
7.006690
6.952527

O R2 igual a zero porque os resduos so a parte no explicada pelas variveis adotadas no modelo
inicial. Portanto, uma regresso entre os resduos e as variveis independentes do modelo inicial,
necessariamente tem que apresentar R2 zero, porque essas variveis no explicariam essa variao
que se pretende explicar.

(ii)

Agora, compute o teste de heteroscedasticidade de Breusch-Pagan. Use a verso da


estatstica F e escreva o p-valor.

Para fazer o teste de Breuch-Pagan s rodar os resduos ao quadrado contra as variveis


independentes, sendo o teste F apresentando necessrio testar a homocedasticidade do modelo. H0:
modelo homocedastico, coeficientes igual a zero contra a varincia dos erros do modelo original; h1:
modelo heterocedastico, pelo menos 1 dos coeficientes diferente de zero e portanto correlacionado
com o erros.
Pode ser feito tambm: View> residual diagnostics > heteroskedasticity tests > breusch-pagan-godfrey
Dependent Variable: RESID01^2
Method: Least Squares
Date: 10/01/16 Time: 13:33
Sample: 1 173
Included observations: 173
Variable

Coefficient

Std. Error

t-Statistic

Prob.

C
PRTYSTRA
DEMOCA
LEXPENDA
LEXPENDB

113.9635
-0.299264
15.61921
-10.30573
-0.051404

50.81503
0.764929
15.09117
4.204008
4.264520

2.242712
-0.391231
1.034990
-2.451405
-0.012054

0.0262
0.6961
0.3022
0.0153
0.9904

R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
F-statistic
Prob(F-statistic)

0.052563
0.030005
81.25499
1109199.
-1003.723
2.330112
0.058058

Mean dependent var


S.D. dependent var
Akaike info criterion
Schwarz criterion
Hannan-Quinn criter.
Durbin-Watson stat

55.69406
82.50214
11.66154
11.75267
11.69851
1.912911

O p-valor calculado foi de 5,8%, existindo evidncia estatstica de heterocedasticidade do modelo a


esse nvel de confiana.

(iii)

Compute o caso especial do teste de White de heteroscedasticidade, usando novamente


a forma da estatstica F. Qual a fora da evidncia de heteroscedasticidade agora?

Rodar o modelo normalmente, na tela de resultados, criar sries dos resduos (item i) e do modelo
estimado (Proc > Forecast> ok) o eviews vai criar uma srie com a seu y estimado. Isso porque o teste
de White necessrio estimar um modelo dos resduos contra os valores y estimados e ele ao quadrado.
Para fazer o teste de White, possvel olhar diretamente o resultado da estatstica F do modelo, para
testar que todos os coeficientes so iguais a zero.

Dependent Variable: RESID01^2


Method: Least Squares
Date: 10/01/16 Time: 09:47
Sample: 1 173
Included observations: 173
Variable

Coefficient

Std. Error

t-Statistic

Prob.

C
VOTEAF
VOTEAF^2

171.8584
-4.263681
0.035735

53.14213
2.166534
0.021242

3.233939
-1.967974
1.682310

0.0015
0.0507
0.0943

R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
F-statistic
Prob(F-statistic)

0.031734
0.020343
81.65866
1133583.
-1005.604
2.785828
0.064496

Mean dependent var


S.D. dependent var
Akaike info criterion
Schwarz criterion
Hannan-Quinn criter.
Durbin-Watson stat

55.69406
82.50214
11.66016
11.71484
11.68235
1.957083

Como existe evidncia estatstica para rejeitar H0 at ao nvel de 6,4%, h evidencia de que o modelo
apresenta heterocedasticidade.
Para confirmar o resultado, rodar o teste automtico do White.
Para rodar o teste de White automaticamente.
Roda modele e na tela de resultados> View> residual diagnostics> heteroskedaciticity tests> White

Heteroskedasticity Test: White


F-statistic
Obs*R-squared
Scaled explained SS

2.680758
31.10152
31.99433

Test Equation:
Dependent Variable: RESID^2

Prob. F(13,159)
Prob. Chi-Square(13)
Prob. Chi-Square(13)

0.0020
0.0033
0.0024

Method: Least Squares


Date: 10/01/16 Time: 09:51
Sample: 1 173
Included observations: 173
Collinear test regressors dropped from specification
Variable

Coefficient

Std. Error

t-Statistic

Prob.

C
PRTYSTRA^2
PRTYSTRA*DEMOCA
PRTYSTRA*LEXPENDA
PRTYSTRA*LEXPENDB
PRTYSTRA
DEMOCA^2
DEMOCA*LEXPENDA
DEMOCA*LEXPENDB
LEXPENDA^2
LEXPENDA*LEXPENDB
LEXPENDA
LEXPENDB^2
LEXPENDB

55.74236
-0.054980
1.029412
-0.458714
-0.104149
6.761675
65.80657
-31.23212
8.778460
6.656256
5.071447
-51.87069
-4.480707
4.518940

284.6372
0.060446
2.156386
0.555609
0.581220
6.942492
130.9924
11.47446
12.56600
1.971641
4.881279
39.47324
2.427131
49.35734

0.195837
-0.909564
0.477378
-0.825605
-0.179189
0.973955
0.502369
-2.721881
0.698588
3.375997
1.038959
-1.314072
-1.846092
0.091556

0.8450
0.3644
0.6337
0.4103
0.8580
0.3316
0.6161
0.0072
0.4858
0.0009
0.3004
0.1907
0.0667
0.9272

R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
F-statistic
Prob(F-statistic)

0.179778
0.112715
77.71354
960263.7
-991.2510
2.680758
0.001973

Mean dependent var


S.D. dependent var
Akaike info criterion
Schwarz criterion
Hannan-Quinn criter.
Durbin-Watson stat

55.69406
82.50214
11.62140
11.87658
11.72492
1.996983

Para corrigir um modelo com heterocedasticidade, na tela de modelagem> options> huber-white


Dependent Variable: VOTEA
Method: Least Squares
Date: 10/01/16 Time: 09:52
Sample: 1 173
Included observations: 173
White heteroskedasticity-consistent standard errors & covariance
Variable

Coefficient

Std. Error

t-Statistic

Prob.

C
PRTYSTRA
DEMOCA
LEXPENDA
LEXPENDB

37.66141
0.251918
3.792943
5.779294
-6.237836

4.418940
0.066063
1.452168
0.533142
0.356158

8.522725
3.813289
2.611918
10.84007
-17.51423

0.0000
0.0002
0.0098
0.0000
0.0000

R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
F-statistic
Prob(F-statistic)
Prob(Wald F-statistic)

0.801163
0.796429
7.573085
9635.072
-593.1954
169.2288
0.000000
0.000000

Mean dependent var


S.D. dependent var
Akaike info criterion
Schwarz criterion
Hannan-Quinn criter.
Durbin-Watson stat
Wald F-statistic

50.50289
16.78476
6.915554
7.006690
6.952527
1.524816
164.1960

Diferena entre os testes de Breusch-Pagan e White est na questo do segundo considerar o efeito de
correlao entre as variveis, por adotar elas na sua forma quadrtica.
2) Com os dados em SLEEP75.RAW, estime o seguinte modelo:

sleep= 0+ 1 totwrk +u
onde sleep corresponde a minutos gastos dormindo noite por semana e totwrk o total de minutos
trabalhados durante a semana.
i.

Reporte seus resultados na forma de equao, juntamente com o nmero de observaes e


2
R . O que o intercepto significa nessa equao?

Rodar o modelo normalmente.


Dependent Variable: SLEEP
Method: Least Squares
Date: 10/01/16 Time: 13:48
Sample: 1 706
Included observations: 706
Variable

Coefficient

Std. Error

t-Statistic

Prob.

C
TOTWRK

3586.377
-0.150746

38.91243
0.016740

92.16534
-9.004992

0.0000
0.0000

R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
F-statistic
Prob(F-statistic)

0.103287
0.102014
421.1357
1.25E+08
-5267.096
81.08987
0.000000

Mean dependent var


S.D. dependent var
Akaike info criterion
Schwarz criterion
Hannan-Quinn criter.
Durbin-Watson stat

3266.356
444.4134
14.92662
14.93953
14.93161
1.954559

o intercepto significa o nmero de minutos que uma pessoa dormiria quando o total de trabalho igual
a zero.
ii.

Agora adicione a varivel educao (educ) ao modelo. Qual o aumento mdio nos minutos
gastos dormindo de um aumento de 100 em totwrk de um indvuduo no primeiro modelo? E no
segundo?

Dependent Variable: SLEEP


Method: Least Squares
Date: 10/01/16 Time: 13:49
Sample: 1 706
Included observations: 706
Variable

Coefficient

Std. Error

t-Statistic

Prob.

C
TOTWRK
EDUC

3756.215
-0.149452
-13.50385

R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
F-statistic
Prob(F-statistic)

0.110440
0.107909
419.7511
1.24E+08
-5264.269
43.63896
0.000000

81.28699
0.016694
5.680014

46.20930
-8.952378
-2.377432

Mean dependent var


S.D. dependent var
Akaike info criterion
Schwarz criterion
Hannan-Quinn criter.
Durbin-Watson stat

0.0000
0.0000
0.0177
3266.356
444.4134
14.92144
14.94082
14.92893
1.949583

Primeiro modelo = -150,7


Segundo modelo = -149,4
Mantendo nveis de educao constantes.

iii.

Com o modelo estimado em ii, avalie a significncia da varivel educ. Ela significante ao
nvel de 5%? E a 1%?
Ao nvel de 5% a varivel educ significante, uma vez que o seu p-valor de 1,7%, todavia, ao nvel
de 1% a varivel deixa de ser estatisticamente significante.

iv.

Utilizando o modelo estimado em ii, responda qual o aumento esperado nas horas dormidas
para 2 anos a mais de educao de uma pessoa com 2500 minutos trabalhados na semana.
Sleep = 0,149*2500 13,5*2 =

v.

Estime agora um outro modelo, retirando a varivel educ e incluindo a varivel idade (age) e
idade ao quadrado (age^2). Qual o melhor modelo i, ii ou iii?

Dependent Variable: SLEEP


Method: Least Squares
Date: 10/01/16 Time: 14:02
Sample: 1 706
Included observations: 706
Variable

Coefficient

Std. Error

t-Statistic

Prob.

C
TOTWRK
AGE
AGE^2

3674.950
-0.146609
-8.102043
0.132791

219.4839
0.016898
11.26802
0.134660

16.74359
-8.676366
-0.719030
0.986120

0.0000
0.0000
0.4724
0.3244

R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
F-statistic
Prob(F-statistic)

0.110075
0.106272
420.1359
1.24E+08
-5264.413
28.94362
0.000000

Mean dependent var


S.D. dependent var
Akaike info criterion
Schwarz criterion
Hannan-Quinn criter.
Durbin-Watson stat

3266.356
444.4134
14.92468
14.95052
14.93467
1.939702

r-squared ajudado:
Modelo 1: 0,1020
Modelo 2: 0,1079 (melhor modelo)
Modelo3:

vi.

0,1062

Adicione a varivel exper ao modelo estimado em ii. Proponha um teste que avalie
conjuntamente a significncia das variveis educ e exper. Voc tiraria elas do modelo?

Dependent Variable: SLEEP


Method: Least Squares
Date: 10/01/16 Time: 14:17
Sample: 1 706
Included observations: 706
Variable

Coefficient

Std. Error

t-Statistic

Prob.

C
TOTWRK
EDUC
EXPER

3651.445
-0.148373
-8.933928
2.199885

106.4704
0.016694
6.420423
1.445717

34.29538
-8.888075
-1.391486
1.521657

0.0000
0.0000
0.1645
0.1285

R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
F-statistic
Prob(F-statistic)

0.113364
0.109575
419.3589
1.23E+08
-5263.106
29.91889
0.000000

Mean dependent var


S.D. dependent var
Akaike info criterion
Schwarz criterion
Hannan-Quinn criter.
Durbin-Watson stat

3266.356
444.4134
14.92098
14.94681
14.93096
1.942609

Para testar a significncia conjunta dos modelos, foi feito o teste wald
Wald Test:
Equation: Untitled
Test Statistic
F-statistic
Chi-square

Value

df

Probability

3.989100
7.978200

(2, 702)
2

0.0189
0.0185

Value

Std. Err.

-8.933928
2.199885

6.420423
1.445717

Null Hypothesis: C(3)=C(4)=0


Null Hypothesis Summary:
Normalized Restriction (= 0)
C(3)
C(4)
Restrictions are linear in coefficients.

O p-valor estimado foi de 1,89%, por isso existe evidncia estatstica at ao nvel de significncia de
98,1%.

vii.

Agora, utillizando a equao abaixo, estime esse modelo separadamente para homens e
mulheres e descreva os resultados na forma habitual. Existem diferenas notveis nas
estimativas das duas equaes?

Para criar grupos especficos para homens e mulheres: na tela inicial, object> generate series> sleepm =
sleep/male. Sleepf = sleep/(1-male).
Dependent Variable: SLEEPM
Method: Least Squares
Date: 10/01/16 Time: 14:26
Sample (adjusted): 1 703
Included observations: 400 after adjustments
Variable

Coefficient

Std. Error

t-Statistic

Prob.

C
TOTWRK
EDUC
AGE
AGESQ
YNGKID

3648.208
-0.182123
-13.05238
7.156591
-0.044767
60.38021

310.0393
0.024486
7.414218
14.32037
0.168405
59.02278

11.76692
-7.437990
-1.760453
0.499749
-0.265831
1.022998

0.0000
0.0000
0.0791
0.6175
0.7905
0.3069

R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
F-statistic
Prob(F-statistic)

0.156228
0.145520
402.2903
63763979
-2963.422
14.59014
0.000000

Mean dependent var


S.D. dependent var
Akaike info criterion
Schwarz criterion
Hannan-Quinn criter.
Durbin-Watson stat

3252.408
435.1998
14.84711
14.90698
14.87082
1.877356

Dependent Variable: SLEEPF


Method: Least Squares
Date: 10/01/16 Time: 14:27
Sample (adjusted): 4 706
Included observations: 306 after adjustments
Variable

Coefficient

Std. Error

t-Statistic

Prob.

C
TOTWRK
EDUC
AGE
AGESQ
YNGKID

4238.729
-0.139950
-10.20514
-30.35657
0.367941
-118.2826

384.8923
0.027659
9.588848
18.53091
0.223340
93.18757

11.01277
-5.059738
-1.064271
-1.638159
1.647447
-1.269295

0.0000
0.0000
0.2881
0.1024
0.1005
0.2053

R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
F-statistic

0.097678
0.082639
436.9919
57288576
-2291.619
6.495092

Mean dependent var


S.D. dependent var
Akaike info criterion
Schwarz criterion
Hannan-Quinn criter.
Durbin-Watson stat

3284.588
456.2504
15.01712
15.09013
15.04632
1.768141

Prob(F-statistic)

viii.

0.000009

Agora, permita um intercepto diferente para homens e mulheres e determine se os termos de


interao que envolvem male so conjuntamente significativos. Qual seria seu modelo final?

Para fazer o intercepto variar entre homens e mulheres necessrio rodar um modelo com todas as
variveis, incluindo a dummy de gnero, alm de corrigir as inclinaes das variveis.
Dependent Variable: SLEEP
Method: Least Squares
Date: 10/01/16 Time: 14:36
Sample: 1 706
Included observations: 706
Variable

Coefficient

Std. Error

t-Statistic

Prob.

C
MALE
TOTWRK
EDUC
AGE
AGESQ
YNGKID
TOTWRK*MALE
EDUC*MALE
AGE*MALE
AGESQ*MALE
YNGKID*MALE

4238.729
-590.5211
-0.139950
-10.20514
-30.35657
0.367941
-118.2826
-0.042174
-2.847243
37.51316
-0.412708
178.6628

367.8519
488.7916
0.026435
9.164321
17.71049
0.213452
89.06187
0.036674
11.96795
23.12332
0.275914
108.1051

11.52292
-1.208124
-5.294125
-1.113573
-1.714044
1.723764
-1.328094
-1.149960
-0.237906
1.622309
-1.495787
1.652677

0.0000
0.2274
0.0000
0.2658
0.0870
0.0852
0.1846
0.2506
0.8120
0.1052
0.1352
0.0988

R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
F-statistic
Prob(F-statistic)

0.130618
0.116839
417.6450
1.21E+08
-5256.169
9.478958
0.000000

Mean dependent var


S.D. dependent var
Akaike info criterion
Schwarz criterion
Hannan-Quinn criter.
Durbin-Watson stat

Para testar a significncia estatstica, teste wald.


Wald Test:
Equation: Untitled
Test Statistic
F-statistic
Chi-square

Value

df

Probability

1.255792
6.278961

(5, 694)
5

0.2814
0.2800

Null Hypothesis: C(8)=C(9)=C(10)=C(11)=C(12)=0


Null Hypothesis Summary:
Normalized Restriction (= 0)
C(8)
C(9)

Value

Std. Err.

-0.042174
-2.847243

0.036674
11.96795

3266.356
444.4134
14.92399
15.00149
14.95394
1.930086

C(10)
C(11)
C(12)

37.51316
-0.412708
178.6628

23.12332
0.275914
108.1051

Restrictions are linear in coefficients.


Existe evidncia estatstica para afirmar que as variveis dos termos de interao so conjuntamente
diferentes zero at o nvel de 28,1%, desta forma, escolheria o modelo que no inclui essas variveis ao
nvel de significncia de 10%.

ix.

Mostre que varincia de u difere entre homens (male) e mulheres. A varincia estimada de u
maior para homens ou para mulheres? Esta diferena significativa?

Para testar a varincia entre homens e mulheres, rodar o modelo e salvar serie de resduos. Rodar a
serie de resduos ao quadrado contra a varivel male, testar se existe significncia estatisitica no
coeficiente estimado.
Dependent Variable: RESID01^2
Method: Least Squares
Date: 10/01/16 Time: 14:51
Sample: 1 706
Included observations: 706
Variable

Coefficient

Std. Error

t-Statistic

Prob.

C
MALE

187217.6
-27807.62

21052.97
27969.56

8.892693
-0.994210

0.0000
0.3205

R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
F-statistic
Prob(F-statistic)

0.001402
-0.000016
368276.5
9.55E+13
-10049.28
0.988454
0.320462

Mean dependent var


S.D. dependent var
Akaike info criterion
Schwarz criterion
Hannan-Quinn criter.
Durbin-Watson stat

171462.5
368273.5
28.47388
28.48680
28.47888
2.035745

O coeficiente estimado para male possui o-valor de 32%, desta forma, no existe significncia
estatstica ao nvel de 10% para afirmar diferena entre a varincia de u entre homens e mulheres.

3)

(i)

Utilize os dados contidos no arquivo HPRICE1.RAW para obter os erros-padro


robus- tos em relao heteroscedasticidade da equao (8.17). Discorra sobre
quaisquer dife- renas importantes em relao aos erros padro habituais.

(ii)

Repita a parte (i) para a equao (8.18).

(iii)

O que este exemplo sugere sobre a heteroscedasticidade e a transformao usada na


varivel dependente?

Erro padro robusto aquele estimado com base no modelo ajustado pelo White, para corrigir o
problema de heterocedasticidade.

i)
Modelo sem ajuste
Dependent Variable: PRICE
Method: Least Squares
Date: 10/01/16 Time: 14:57
Sample: 1 88
Included observations: 88
Variable

Coefficient

Std. Error

t-Statistic

Prob.

C
LOTSIZE
SQRFT
BDRMS

-21.77031
0.002068
0.122778
13.85252

29.47504
0.000642
0.013237
9.010145

-0.738601
3.220096
9.275093
1.537436

0.4622
0.0018
0.0000
0.1279

R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
F-statistic
Prob(F-statistic)

Erro-padro sem ajuste

0.672362
0.660661
59.83348
300723.8
-482.8775
57.46023
0.000000

Mean dependent var


S.D. dependent var
Akaike info criterion
Schwarz criterion
Hannan-Quinn criter.
Durbin-Watson stat

293.5460
102.7134
11.06540
11.17800
11.11076
2.109796

800
600
400
300
200

200

100
0
-100
-200
10

20

30

40

Residual

50

60

Actual

70

80

Fitted

Modelo com ajuste White Robusto


[para ajustar por White> options> ajuste White]
Dependent Variable: PRICE
Method: Least Squares
Date: 10/01/16 Time: 14:58
Sample: 1 88
Included observations: 88
White heteroskedasticity-consistent standard errors & covariance
Variable

Coefficient

Std. Error

t-Statistic

Prob.

C
LOTSIZE
SQRFT
BDRMS

-21.77031
0.002068
0.122778
13.85252

37.13821
0.001251
0.017725
8.478625

-0.586197
1.652283
6.926707
1.633817

0.5593
0.1022
0.0000
0.1060

R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
F-statistic
Prob(F-statistic)
Prob(Wald F-statistic)

0.672362
0.660661
59.83348
300723.8
-482.8775
57.46023
0.000000
0.000000

Mean dependent var


S.D. dependent var
Akaike info criterion
Schwarz criterion
Hannan-Quinn criter.
Durbin-Watson stat
Wald F-statistic

293.5460
102.7134
11.06540
11.17800
11.11076
2.109796
23.71809

800
600
400
300
200

200

100
0
-100
-200
10

20

30

40

Residual

50

60

Actual

70

80

Fitted

Os erros padres estimados quando robusto para heterocedasticidade so mais prximos do


verdadeiro, uma vez que no est incorrendo em erros de varincia, desta forma, so melhores do
que sem o erro robusto.
Heterocedasticidade no gera vis no estimados (alterar o valor do coeficiente) mas altera a varincia
dos erros estimados, levando a interpretao errada das estatsticas de validao. Desta forma, o
ajuste contribui para uma avaliao mais adequada da significncia estatstica dos coeficientes, uma
vez que aproxima da varincia correta/real.

ii)
Modelo sem ajuste
Dependent Variable: LPRICE
Method: Least Squares
Date: 10/01/16 Time: 15:09
Sample: 1 88
Included observations: 88
Variable

Coefficient

Std. Error

t-Statistic

Prob.

C
LLOTSIZE
LSQRFT
BDRMS

-1.297041
0.167967
0.700232
0.036958

0.651284
0.038281
0.092865
0.027531

-1.991515
4.387712
7.540306
1.342411

0.0497
0.0000
0.0000
0.1831

R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
F-statistic
Prob(F-statistic)

0.642965
0.630214
0.184603
2.862563
25.86066
50.42372
0.000000

Mean dependent var


S.D. dependent var
Akaike info criterion
Schwarz criterion
Hannan-Quinn criter.
Durbin-Watson stat

5.633180
0.303573
-0.496833
-0.384227
-0.451467
2.088995

Erro do modelo sem ajuste


7.0
6.5
6.0
5.5

.8

5.0

.4

4.5
.0
-.4
-.8
10

20

30

40

Residual

50

60

Actual

70

Fitted

Modelo com ajuste white


Dependent Variable: LPRICE
Method: Least Squares
Date: 10/01/16 Time: 15:10
Sample: 1 88
Included observations: 88
White heteroskedasticity-consistent standard errors & covariance
Variable

Coefficient

Std. Error

t-Statistic

Prob.

C
LLOTSIZE
LSQRFT
BDRMS

-1.297041
0.167967
0.700232
0.036958

0.781314
0.041473
0.103829
0.030601

-1.660076
4.049981
6.744105
1.207743

0.1006
0.0001
0.0000
0.2305

R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
F-statistic
Prob(F-statistic)
Prob(Wald F-statistic)

Erros com ajuste White

0.642965
0.630214
0.184603
2.862563
25.86066
50.42372
0.000000
0.000000

Mean dependent var


S.D. dependent var
Akaike info criterion
Schwarz criterion
Hannan-Quinn criter.
Durbin-Watson stat
Wald F-statistic

5.633180
0.303573
-0.496833
-0.384227
-0.451467
2.088995
49.32120

80

7.0
6.5
6.0
5.5

.8

5.0

.4

4.5
.0
-.4
-.8
10

20

30
Residual

40

50
Actual

60

70

80

Fitted

Heterocedasticidade no gera vis no estimados (alterar o valor do coeficiente) mas altera a varincia
dos erros estimados, levando a interpretao errada das estatsticas de validao. Desta forma, o
ajuste contribui para uma avaliao mais adequada da significncia estatstica dos coeficientes, uma
vez que aproxima da varincia correta/real.

iii) o uso da varivel dependente na forma de log colabora para a suavizao da sua trajetria,
reduzindo a probabilidade de problemas como a heterocedasticidade. Gabarito: o ponto mais
importante a ser destacado que no modelo em log, os desvio-padro normal e o robusto so
similares. No caso sem log, isto no ocorria. Por exemplo, a variavel llotsize significante se NAO
usamos o mtodo robusto mas no se usamos o mtodo robusto. Com o modelo em log, isto s
ocorre na constante. No ocorre com as variveis explicativas.

5)
Aplique o teste completo de White de heteroscedasticidade [veja equao (8.19)] na equao
(8.18). Usando a forma qui-quadrada da estatstica, obtenha o p-valor. Qual sua concluso?

Criar uma srie de resduos e salvar. Rodar um modelo como o apresentado acima substituindo x1 =
llotsize; x2 = lsqrft; x3 = bdrms.
Dependent Variable: RESID01^2
Method: Least Squares
Date: 10/01/16 Time: 15:28
Sample: 1 88
Included observations: 88
Variable

Coefficient

Std. Error

t-Statistic

Prob.

C
LLOTSIZE
LSQRFT
BDRMS
LLOTSIZE^2
LSQRFT^2
BDRMS^2
LLOTSIZE*LSQRFT
LLOTSIZE*BDRMS
LSQRFT*BDRMS

12.20696
-1.272830
-1.756780
0.287872
0.023520
0.040274
-0.005091
0.120860
-0.025276
-0.001095

R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
F-statistic
Prob(F-statistic)

0.108516
0.005653
0.073396
0.420189
110.2864
1.054955
0.405313

6.692660
0.708255
1.664947
0.284522
0.016296
0.123073
0.009056
0.072130
0.032063
0.048247

1.823932
-1.797134
-1.055156
1.011775
1.443346
0.327235
-0.562167
1.675594
-0.788311
-0.022696

Mean dependent var


S.D. dependent var
Akaike info criterion
Schwarz criterion
Hannan-Quinn criter.
Durbin-Watson stat

0.0720
0.0762
0.2946
0.3148
0.1529
0.7444
0.5756
0.0978
0.4329
0.9820
0.032529
0.073605
-2.279237
-1.997721
-2.165821
2.100418

Wald Test:
Equation: Untitled
Test Statistic
F-statistic
Chi-square

Value

df

Probability

2.677991
26.77991

(10, 78)
10

0.0072
0.0028

Null Hypothesis: C(1)=C(2)=C(3)=C(4)=C(5)=C(6)=C(7)=C(


8)=C(9)=C(10)=0
Null Hypothesis Summary:
Normalized Restriction (= 0)
C(1)
C(2)
C(3)
C(4)
C(5)
C(6)
C(7)
C(8)
C(9)
C(10)

Value

Std. Err.

12.20696
-1.272830
-1.756780
0.287872
0.023520
0.040274
-0.005091
0.120860
-0.025276
-0.001095

6.692660
0.708255
1.664947
0.284522
0.016296
0.123073
0.009056
0.072130
0.032063
0.048247

Restrictions are linear in coefficients.


O modelo retorna valor da estatstica F de 1,0549 e p-valor de 0,40, existindo evidncia estatstica de
que os coeficientes so conjuntamente iguais a 0, desta forma, no existe evidncia para afirmarmos
que as variveis so correlacionadas com os erros estimados para a regresso, ou seja, o modelo no
apresenta heterocedasticidade.

Dvidas sobre o uso do chi quadrado.


5)

Utilize os dados contidos no arquivo GPA1.RAW para fazer este exerccio.

(i)

Use o mtodo MQO para estimar um modelo relacionando colGPA com hsGPA, ACT,
skipped e PC. Obtenha os resduos MQO.

Rodar o modelo da maneira tradicional.


Dependent Variable: COLGPA
Method: Least Squares
Date: 10/01/16 Time: 09:58
Sample: 1 141
Included observations: 141
Variable

Coefficient

Std. Error

t-Statistic

Prob.

C
HSGPA
ACT
SKIPPED
PC

1.356509
0.412952
0.013344
-0.071034
0.124439

0.327502
0.092431
0.010444
0.026249
0.057312

4.141986
4.467678
1.277706
-2.706104
2.171276

0.0001
0.0000
0.2035
0.0077
0.0316

R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
F-statistic
Prob(F-statistic)

0.259271
0.237484
0.325109
14.37467
-39.09822
11.90070
0.000000

Mean dependent var


S.D. dependent var
Akaike info criterion
Schwarz criterion
Hannan-Quinn criter.
Durbin-Watson stat

3.056738
0.372310
0.625507
0.730073
0.667999
1.875252

Cria a srie de resduos (Proc> make residual series [resid01])


Criar srie de varincia com [object> generate series> VAR = RESID01^2]

(ii)

Calcule o caso especial do teste de White de heteroscedasticidade. Na regresso de 2i


sobre clgpa, clgpa^2, obtenha os valores estimados, digamos, h i.

Para aplicar o caso especial de White necessrio criar uma srie do valor estimado para no perder
graus de liberdade, na tela do resultado> Proc>Forecast (colgpaf)

Dependent Variable: VAR


Method: Least Squares
Date: 10/01/16 Time: 10:00
Sample: 1 141
Included observations: 141
Variable

Coefficient

Std. Error

t-Statistic

Prob.

C
COLGPAF
COLGPAF^2

-0.321837
0.129599
0.002946

2.005841
1.316763
0.215660

-0.160450
0.098422
0.013662

0.8728
0.9217
0.9891

R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
F-statistic

0.049344
0.035567
0.123683
2.111055
96.14050
3.581496

Mean dependent var


S.D. dependent var
Akaike info criterion
Schwarz criterion
Hannan-Quinn criter.
Durbin-Watson stat

0.101948
0.125943
-1.321142
-1.258402
-1.295647
2.061535

Prob(F-statistic)

0.030451

Para criar o hhat s utilizar a funo Proc>estimate

hhat -> a varincia dos erros estimados srie criada com base na regresso acima.

(iii) Verifique se os valores estimados da parte (ii) so todos estritamente positivos. Em


segui- da, obtenha as estimativas dos mnimos quadrados ponderados utilizando
pesos 1/ h i. Compare as estimativas dos mnimos quadrados ponderados para o
efeito das faltas s
aulas e da propriedade de computadores pessoais com as estimativas MQO
correspondentes. O que possvel concluir de suas significncias estatsticas?
Necessariamente todos os valores da varincia precisam ser positivos e so.
20

Series: VARF
Sample 1 141
Observations 141

16

12

0
0.04

0.06

0.08

0.10

0.12

0.14

Mean
Median
Maximum
Minimum
Std. Dev.
Skewness
Kurtosis

0.101948
0.105215
0.164804
0.027381
0.027977
-0.048637
2.833284

Jarque-Bera
Probability

0.218882
0.896335

0.16

Rodar o modelo com a ponderao do 1/hhat dar maior peso para as


observaes com maior varincia.
Desta forma, necessrio corrigir todas as variveis do modelo original
pelo ajuste do hhat, incluindo a constante que 1/hhat.
Criar sries de todas as variveis divindo os valores por hhat criado no exerccio anterior.
Dependent Variable: COLGPAC
Method: Least Squares
Date: 10/01/16 Time: 10:21
Sample: 1 141
Included observations: 141
Variable

Coefficient

Std. Error

t-Statistic

Prob.

CONS
HSGPAC
ACTC
SKIPPEDC
PCC

1.384471
0.404836
0.013707
-0.080774
0.132310

0.272397
0.073124
0.009185
0.017423
0.055205

5.082556
5.536270
1.492301
-4.636110
2.396707

0.0000
0.0000
0.1379
0.0000
0.0179

R-squared

0.901025

Mean dependent var

32.32961

Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
Durbin-Watson stat

0.898114
3.264792
1449.606
-364.3556
1.853789

S.D. dependent var


Akaike info criterion
Schwarz criterion
Hannan-Quinn criter.

10.22816
5.239086
5.343652
5.281578

O ajuste aumentou marginalmente o valor dos coeficientes das variveis de faltas as aulas e uso de
computados, aumentando tambm a significncia estatsticas delas, reduzindo o p-valor, quando
comparado os valores do modelo MQP contra o MQO.

(iv)

Na estimao MQP da parte (iii), obtenha os erros-padro robustos em relao


heteroscedasticidade. Em outras palavras, leve em conta o fato de que a funo da
varincia estimada na parte (ii) pode ter sido mal especificada. (Veja Questo 8.4.) Os
erros- padro da parte (iii) mudam muito?

Erros-padres robustos: necessidade de ajuste White = Estimate> options> correo White


Dependent Variable: COLGPAC
Method: Least Squares
Date: 10/01/16 Time: 10:23
Sample: 1 141
Included observations: 141
White heteroskedasticity-consistent standard errors & covariance
Variable

Coefficient

Std. Error

t-Statistic

Prob.

CONS
HSGPAC
ACTC
SKIPPEDC
PCC

1.384471
0.404836
0.013707
-0.080774
0.132310

0.295512
0.071290
0.010537
0.014981
0.059981

4.684990
5.678745
1.300869
-5.391634
2.205871

0.0000
0.0000
0.1955
0.0000
0.0291

R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
Durbin-Watson stat

0.901025
0.898114
3.264792
1449.606
-364.3556
1.853789

Mean dependent var


S.D. dependent var
Akaike info criterion
Schwarz criterion
Hannan-Quinn criter.

32.32961
10.22816
5.239086
5.343652
5.281578

dois mtodos diferentes de estimao, com o MQP, assumo que sei a distribuio da varincia.
Achei que o modelo tinha problema de heterocedasticidade, testei um primeiro mtodo de correo,
teste de White, dai no satisfeito, resolvi testar outro modelo de correo, atravs da ponderao das
variveis pelos resduos do modelo, dai o resultado novo no apresenta muita diferena nos
estimadores, dessa forma, valida o modelo. Todavia, a correo da varincia dos estimadores eleva de
maneira significativa o nvel de R2.

You might also like