You are on page 1of 21

Revisão de Regressão Linear

Múltipla – Parte II
CE 731 - Econometria II
Prof. Alexandre Gori Maia
Instituto de Economia - UNICAMP
Ementa
Normalidade dos Erros
Heterocedasticidade
Linearidade por Anamorfose
Variáveis Binárias

Bibliografia
MAIA, A. G. Apostila de Econometria. Instituto de Economia, 2013. 1
Normalidade dos Erros
• Seja o modelo de regressão dado por : Y    X  e
• Pressupõe-se que o erro seja a soma de inúmeros fatores com
efeito mínimo sobre a variável dependente, e que esteja
aleatoria e normalmente distribuídos em torno da reta de
regressão;

Y
e3 O teste F para o modelo e os
e2 testes t para os coeficientes
e1 angulares baseiam-se no
E(Y1) pressuposto da normalidade dos
erros. Caso esses não estejam
normalmente distribuídos os
testes serão inválidos.
2
X1 X2 X3
X
Histograma e Gráfico Q-Q
• O histograma permite visualizar a forma de distribuição dos dados;
• O gráfico Q-Q (quantile-quantile) , ou gráfico de quantis, compara os
valores ordenados de uma variável (eixo das ordenadas) com os
respectivos quantis teóricos de uma distribuição de probabilidade
(eixos das abcissas). Quando a distribuição teórica é uma normal, o
gráfico é chamado de gráfico normal-quantílico e o eixo das abcissas
refere-se aos valores normais padronizados (Z). Se a distribuição dos
dados equivaler à distribuição teórica (normal), os valores estarão
dispostos em forma de uma linha reta ;

Neste exemplo, a
distribuição se aproxima de
uma normal, embora,
sobretudo a distribuição
dos valores extremos, 3
sugira cautela nas análises;
Normalidade dos Resíduos
• Histogramas e gráficos normais-quantílicos para os resíduos
de um ajuste de regressão são automaticamente elaborados
pelo SAS com a opção ODS GRAPHICS no procedimento REG ;
Ajustará o modelo para CO2
em função linear de GDP e
Setor2. O histograma e o
gráfico normal-quantílico para
os resíduos serão gerados no
arquivo reg_poluição.rtf.
Embora algumas observações
afastam-se da linearidade
esperada para o gráfico normal-
quantílico, não há fortes
evidências gráficas para afirmar
que os resíduos não estejam 4
normalmente distribuídos. Um
teste de significância seria bem
vindo....
Testes de Normalidade - Univariate
• Testes formais de normalidade dos resíduos podem ser
obtidos a opção NORMAL do procedimento UNIVARIATE;
• Neste caso, os resíduos obtidos pelo procedimento REG
devem ser previamente salvos em um dataset (comando
OUTPUT) para serem posteriomente lidos pelo procedimento
UNIVARIATE;
O comando OUTPUT gera um arquivo de saída
(com nome especificado na opção OUT)
contendo todas as variáveis originais do
arquivo de entrada mais resultados do ajuste.
O comando RESIDUAL, por exemplo,
incorporará os resíduos do ajuste no arquivo de
saída, atribuindo-lhes o nome e.
5
Testes de Normalidade - Definição
• A hipótese nula de todos os testes apresentados pelo
comando NORMAL é a de normalidade dos valores. Os testes
apresentados são:
• Shapiro-Wilk: baseia-se na estatística W, positiva e menor que 1.
Valores próximos de 1 indicam normalidade. É recomendado para
amostras entre 3 e 2000 observações.
• Kolmogorov-Smirnov: a estatística de teste K-S D é uma medida
da distância entre a distribuição observada e a teórica (EDF). É
mais sensível ao comportamento observado no centro da
distribuição. O teste só se aplica a variáveis contínuas e é
recomendado para amostras grandes (> 2000).
• Cramer-von Mises: baseia-se no quadrado da EDF. Possui a
vantagem de levar mais em consideração o comportamento de
toda a amostra, ao invés de observações extremas.
• Arderson-Darling: também se baseia no quadrado da EDF. Em
6
comparação ao K-S, é mais sensível ao comportamento
observado nos extremos da distribuição.
Testes de Normalidade - Exemplo
• Os testes de normalidade são usualmente poderosos
(sensíveis) à detecção de não-normalidade, ou seja, tendem a
identificar não normalidade mesmo para pequenas diferenças;
• As conclusões não devem se basear unicamente nos testes
estatísticos de normalidade. A análise gráfica é também
fundamental.

Os 4 testes de normalidade para os resíduos do modelo de CO2 em função de


GDP e Setor2 sugerem a não normalidade dos resíduos. Em outras palavras, se
afirmássemos que os erros são não-normais, estaríamos sujeitos a uma chance
de erro inferior a 1%. Deve-se considerar que, pelo fato de a amostra ser 7
relativamente grande (169 observações), os testes tendem ser muito sensíveis a
pequenos desvios em relação à normalidade.
Heterocedasticidade – Definição
• Homocedasticidade: ocorre quando a variância dos erros e,
condicionada aos valores das variáveis explanatórias, é
constante: Var (ei / X 1i , X 2i ,..., X ki )  
2

• Heterocedasticidade: ocorre quando a dispersão em torno


da regressão se altera em função dos valors de uma variável
explanatória: Var (ei / X1i , X 2i ,..., X ki )   i2

Homocedasticidade Heterocedasticidade
Y Y

E(Yi) E(Yi)
Var(ei)=2
E(Yj) E(Yj) Var(ei)=2i
Var(ej)=2 Var(ej)=2j 8

Xj Xi X Xj Xi X
Heterocedasticidade – Consequências
• Na presença de heterocedasticidade, os parâmetros () do
modelo de MQO continuam sendo não viesados mas deixam
de ser eficientes (ou seja, não possuem mais variância
mínima) e consistentes. Isso ocorre porque na presença de
heterocedasticidade os estimadores da variâncias desses
coeficientes serão viesadas.

Homocedasticidade Heterocedasticidade
Intervalo de Intervalo de
Y Y Intervalo de
Variação das Variação das Variação das
estimativas de estimativas de estimativas de
outro método MQO MQO

Intervalo de
Variação das 9
estimativas de
um método
X mais eficiente X
Heterocedasticidade – Análise Gráfica
• Graficos para a dispersão entre os resíduos do ajuste e cada
uma das variáveis explanatórias permitem visualizar padrões
mais evidentes de heterocedasticidade e são
automaticmante elaborados com o comando ODS GRAPHICS
para o procedimento REG;

A dispersão dos resíduos tende a


aumentar, sobretudo, para valores
mais elevados da variável Setor2. 10
Exercícios
1) A partir de informações sobre a taxa de mortalidade nas UF
brasileiras em 2000, pede-se
a) Ajuste um modelo por MQO para a taxa de mortalidade como
função dos anos de estudo, percentual de pobres e índice de
desigualdade;
b) Analise a normalidade dos resíduos. Quais seriam suas
conclusões?
c) A partir de análises gráficas, identifique eventuais valores
extremos, pontos discordantes e influentes;
d) Identifique e analise eventuais observações influentes;
e) Verifique se, graficamente, há evidências para suspeitar de
heterocedasticidade nos dados. O que isso significaria?

11
Linearidade por Anamorfose
• Relações não lineares nas variáveis podem ser transformadas em
relações lineares por anamorfose, ou seja, por transformações de
suas variáveis originais;
• A escolha da forma funcional (tipo de transformação das variáveis)
dependerá da análise da distribuição dos valores e, principalmente,
do conhecimento prévio das relações por parte do pesquisador;

Yi   0  1Xi2  ei
Y Y Yi   0  1Zi  ei

é o mesmo
que... 12

X Z=X2
Formas Funcionais - Exemplos
1) Modelo linear: Y Y

Yi  β0  β1 X i  ei
β0 β1  0
β1  0 ou
β0
X X
Y β1  1
2) Modelo log-log: Y 0  β1  1
ln(Yi )  β0  β1ln(X i )  ei  1  β1  0 ou
X X
Y Y
3) Modelo log-lin: β1  0
β1  0 ou
ln(Yi )  β0  β1 X i  ei
X X

Y Y β1  0
4) Modelo lin-log: β1  0
Yi  β0  β1ln(X i )  ei ou
X X
Y Y 13
5) Modelo inverso: β0
β1  0 ou β1  0
1
Yi  β0  β1  ei β0
Xi X X
Modelo Linear - Interpretação
• Um modelo linear pressupõe que Y apresente variações absolutas
constantes para variações absolutas constantes em X;
• A variação marginal no valor esperado de Y é a mesma para
qualquer valor de X;

Y E[Y / 0]     (0)  
 é o valor esperado de Y para valores
Yi+1 nulos de X
Yi Y=
X=1 Y Y (  X )
  
X X X

 é a variação marginal absoluta no
valor esperado de Y (Y) dada uma
0 Xi Xi+1 variação unitária em X (X=1).
X 14
Modelo Log-Lin - Interpretação
• Um modelo log-lin pressupõe que Y apresente variações relativas
constantes em função de variações absolutas constantes de X;
• A variação absoluta no valor esperado de Y será diferente para cada
valor de X;
• Por exemplo, uma variação de 0,01 no ln(Y) significa uma variação
de 1% no valor de Y;
Y ln(Y)
Yi+1=e+Xi+1
ln(Yi+1)
ln(Yi) ln(Y)=
Y=Yi X=1
Yi=e+Xi
e X=1 

0 Xi Xi+1 0 Xi Xi+1 15
X X
 ln(Y )  ln(Y ) (  X ) Y / Yi  ln(Y ) 1 Y
     pois    ln(Y ) 
X X X X Y Yi Yi
Modelo Log-Log - Interpretação
• Um modelo log-log pressupõe que Y apresente variações relativas
constantes em função de variações relativas constantes de X;
• O coeficiente angular será uma medida constante da elasticidade de
Y em relação a X, ou seja, qual será a variação percentual em Y ()
para uma variação de 1% em X.
Y ln(Y)

Yi+1=e+ln(Xi+1) ln(Yi+1)
Y=Yi ln(Yi) ln(Y)=
Yi=e+ln(Xi)
X=Xi ln(X)=1

Xi Xi+1 ln(Xi) ln(Xi+1)


X ln(X) 16
X Y  ln(Y ) Y / Yi
Se  ln( X )  e  ln(Y )  então  
Xi Yi  ln( X ) X / X i
Modelo Log-Log - Exemplo
• O primeiro passo é criar as variáveis transformadas;

• Posteriormente, os procedimentos são análogos àqueles do modelo


linear;

Não há necessidade de utilizar o logaritmo natural para a variável Setor2, já que esta 17
já considera variações relativas (percentuais) na participação do setor secundário.
Modelo Log-Log - Exemplo
• Além de o modelo log-log facilitar a interpretação das variações nas
variáveis, a qualidade de seu ajuste é sensivelmente melhor que a
do modelo linear;

Espera-se, para cada acréscimo de 1% no PIB per capita, um acréscimo de 0,83% nas
emissões per capita de CO2, tudo mais constante. E, para cada variação de 1 ponto
percentual na participação do setor secundário, espera-se um acréscimo de 0,02% 18
nas emissões per capita de CO2, ceteris paribus.
Todas as estimativas são significativas e o R2 sugere que 76% da variabilidade do ln
da variável CO2 sejam explicados pelas variáveis independentes.
Binárias em Modelos Log-Lin
• Algebricamente, a relação ln(Y)=Y/Y só é válida para variações
infinitesimais;
• Por exemplo, em modelos log-lin com independente binária, pode não fazer
sentido pressupor que a variação de X de 0 (0%) para 1 (100%) leve a
variações infinitesimais de Y .
• Nesse sentido, devemos corrigir o coeficiente  associado à variável binária
pela expressão e1;
Yi  e β0  β1Di  ei

ln(Y)
ln (Yi )  β0  β1Di  ei
Y

é a mesma
coisa que...

0 1 D 0 1 D
Para X=0: Para X=1: Então: 19
ln(Y0 )   0 ln(Y1 )  0  1 Y1  Y0 e 0 e  1  e 0 Y1  Y0
  e 1  1
Y0  e 0 Y1  e 0  1 Y0 e 0 Y0
Log-Lin com Binária - Exemplo
• Incorporando a variável binária Poluido (1 para CO2 > 5; 0 c.c.) no
modelo log-lin:

• Teremos os resultados:

Tudo mais constante, os países mais poluídos emitem, em média, 127%


(e0,820891=1,2725) mais CO2 per capita que os países menos poluídos.
20
Exercícios
2) A partir de informações sobre a taxa de mortalidade nas UF
brasileiras em 2000, pede-se
a) Ajuste um modelo por MQO para a taxa de mortalidade como
função dos anos de estudo, percentual de pobres e índice de
desigualdade;
b) Incorpore a binária muitodesigual e analise o resultado?
c) Incorpore binárias para representar as 5 regiões e analise os
resultados;
d) Aplique transformações logarítmicas na variável dependente e
nas variáveis independentes. Analise a qualidade dos ajustes e
selecione aquele que achar mais apropriado;

21