You are on page 1of 5

Correlação entre a variável independente e o termo

aleatório no modelo de regressão simples


(notas de aula)
Rogério Silva de Matttos, 26 de Maio de 2000

1. Introdução

Seja Yi  a  bX i   i um modelo linear. Considere que as seguintes hipóteses são


válidas para este modelo:

i) A relação funcional entre Yi e X i é linear nos parâmetros a e b;


ii) X i é uma variável não estocástica; logo Cov ( X i  i )  E ( xi  i )  0 ;
iii) a) E ( i )  0 , E ( i )   ;
2 2

b) E ( i  j )  0 para i  j ;

onde xi  X i  X . Sendo válidas as hipóteses acima, então os estimadores de MQO são


eficientes e consistentes.

Demonstração:

Iremos fazê–lo apenas para o parâmetro b (experimente fazê–lo para o parâmetro a).

Seja um amostra aleatória Y1 ,  , Yn para a variável Yi . Então temos:

Y  a  bX   (1)
xi  X i  X (2)
y i  Yi  Y (3)

Segue que:

y i  bxi   i   (4)

Agora, vamos desenvolver a expressão para o estimador de MQO para o parâmetro b,


como segue:

bˆ 
 x y   x (bx     )   (bx  x   x  )
i i i i i
2
i i i i

x 2
i x x 2
i
2
i
(5)
b x   x     x )
2
i i x  x i i i
 b i i

x 2
i x 2
i

De onde concluímos que:


ˆ
b b
 xi  i    xi (6)
x 2
i

a) Não enviesamento dos MQO:


Provar que o estimador de MQO b̂ para b é não enviesado significa
mostra que E (bˆ)  b .

Então, aplicando o operador esperança E(,) a ambos os lados da equação acima temos:

E (bˆ)  b 

E  xi  i    xi   b  E   x    E   x 
i i i

x 2
i x 2
i

 x E  
 E(x  ) 
i

b
i i
N
i
b
 E(x  )  x  E 
i i i

x 2
i x i
2

Como, pela hipótese ii), temos que E ( xi  i )  0 , e pela hipótese iii) a) que E ( i )  0 ,
segue que:

E (bˆ)  b  (7)

b) Consistência

Provar que o estimador de MQO b̂ para b é consistente significa


mostrar que p lim(bˆ)  b .

Então, aplicando o operador ‘plim’ a ambos os lados da equação acima, temos:


p lim(bˆ)  p lim b 
 xi  i    xi   b  p lim  xi  i    xi  
  xi2  p lim  xi2
(8)
b
 
p lim  xi  i  p lim    xi 
p lim  xi2
Agora, dividindo o numerador e o denominador do segundo termo do lado direito da
equação (5), temos:
  xi  i 
p lim    p lim   p lim x 
 N 
p lim(bˆ)  b   
(9)
  xi2 
p lim 
 N 
 
mas, é fato que:

a) p lim  i i  E ( xi  i )  Cov ( X i  i )  0 (lembre–se da hipótese ii));


x
N

b) p lim 
x i2
 s X2 (variância de X i , conhecida pois esta é determinística);
N
 p lim   p lim x   p lim  i  p lim x  E( i )x  0;
 
c)
 N 
Assim:
Cov( X i  i )
p lim(bˆ)  b  b (10)
s X2
e logo:

p lim(bˆ)  b 

2. Violação da hipótese ii)

A violação da hipótese ii) implica em que X i é estocástica, ou seja, ela agora é uma
variável aleatória. As situações em que isso pode ocorrer são basicamente as seguintes:

 Erro de medida nas variáveis independentes;


 Quando as variáveis independentes dependem da dependente;
 Presença de variável dependente defasada entre as independentes;

Neste casos, existe a possibilidade de que Cov( X i  i )  0 . Se isto ocorre, então os


estimadores de MQO podem ser enviesados e certamente são inconsistentes.

Demonstração:

a) Possível enviesamento dos MQO:

  x i  i    xi 
E (bˆ)  b  E   bC (11)
  xi 

Note–se que não é possível aplicar aqui o operador esperança ao numerador e ao


denominador do segundo termo do lado direito desta equação. Isto acontece porque
E (V1 / V2 )  E (V1 ) / E (V2 ) , onde V1 e V2 são duas variáveis aleatórias quaisquer.
Podemos, então, ter as seguintes situações:

 C  0  E (bˆ)  b  bˆ superestima b;
 C  0  E (bˆ)  b  bˆ é não enviesado;
 C  0  E (bˆ)  b  bˆ subestima b.

Como não podemos determinar o valor ou o sinal de C, segue que não podemos
determinar se b̂ é ou não enviesado.

b) Inconsistência dos MQO:

Sendo X i uma variável aleatória, segue que p lim  xi / N  Var ( X i ) . Então, podemos
re–escrever a equação (10) como:
Cov( X i  i )
p lim(bˆ)  b  (12)
Var ( X i )

Se Cov( X i  i )  0 , segue que necessariamente p lim(bˆ)  b e b̂ é inconsistente para


b. Note, porém, que isso não irá acontecer se Cov( X i  i )  0 , ou seja, se a variável
indendente X i for não correlacionada com o termo aleatório  i .

3. Correção através de variáveis instrumentais

Seja Yi  a  bX i   i um modelo linear, tal que:

 X i é uma variável aleatória e


 Cov( X i  i )  0 .

Então os estimadores de MQO para a e b são inconsistentes, como acabamos de ver .


Mas, como posso então estimar a e b de modo consistente? Novamente, iremos analisar
o caso de estimação do parâmetro b (Tente depois, fazer o mesmo para o parâmetro a)).

Solução: Estimador de Variáveis Instrumentais (EVI).

Definição de instrumento (ou variável instrumental): Uma variável aleatória Z i é


instrumento para a variável X i do modelo linear quando Z i satisfaz:

a) p lim  i i  Cov ( X i Z i )  0 ;
xz
N

b) p lim  i i  Cov ( Z i  i )  0 ;
z
N

onde xi  X i  E ( X i ) e z i  Z i  E ( Z i ) .

Passos para aplicar o EVI.:

1. Encontrar uma variável Z i que seja instrumento para X i ;


2. Usar a seguinte fórmula do EVI:

b 
 z i yi (e não o estimador de MQO bˆ   z i yi ) (13)
 xi z i  zi2
~
Proposição: O EVI b é consistente para b.

Demonstração
~
Provar que o EVI b para b é consistente significa mostrar que
~
p lim(b )  b .

Seguindo procedimentos similares aos adotados para desenvolver a expressão (5):


~
b
 z y   z (bx     )   (bx z  z   z  )
i i i i i i i i i i

x z i i x z x z i i i i
(14)
b x z   z     z )
i i iz   z i i i
 b i i

x z i i x z i i

Logo:

~
b b
 zi  i    zi (15)
 xi z i
Agora, dividindo por N o numerador e o denominador do segundo termo do lado direito
da equação (15), obtemos:

~
b b
 zi  i N    zi N (16)
 xi z i N
e aplicando o operador plim a ambos os lados da equação (16):

  zi i 
p lim    p lim   p lim x 
~  N 
p lim(b )  b   
  xi z i 
  (17)
 N 
 
Cov(Z i ,  i )
b
Cov( X i Z i )

Como Z i é um instrumento para X i , logo valem as propriedades a) Cov( Z i ,  i )  0 e


b) Cov ( X i Z i )  0 da definição de instrumento apresentada acima. Portanto:
~
p lim(b )  b 

Em suma, o estimador de variáveis instrumentais EVI é um estimador consistente dos


parâmetros de um modelo linear, quando a variável independente é estocástica e
correlacionada com o termo aleatório.