Professional Documents
Culture Documents
Lista4 ERU 626
Lista4 ERU 626
Questões Teóricas
b) O que significa dizer que a multicolinearidade é uma questão de grau, e não de tipo?
Quando se diz que a multicolinearidade é uma questão de grau e não de tipo, significa que não existe um
tipo específico de relação entre as variáveis independentes que causa multicolinearidade. Em vez disso, a
multicolinearidade ocorre em um espectro de diferentes graus de correlação entre as variáveis
independentes. Por exemplo, a multicolinearidade pode ocorrer tanto quando duas variáveis independentes
têm uma correlação quase perfeita quanto quando elas têm uma correlação moderada, mas há outras
variáveis independentes no modelo que estão altamente correlacionadas com elas.
Assim, a multicolinearidade não está ligada a um tipo específico de relação entre variáveis independentes,
mas sim a um grau de correlação entre elas. Isso significa que os métodos para detectar e lidar com a
multicolinearidade devem ser aplicados independentemente da natureza da relação entre as variáveis
independentes e não dependem de um tipo específico de relação
2
e) A multicolinearidade é essencialmente um fenômeno amostral. Explique!
A multicolinearidade é essencialmente um fenômeno amostral porque se refere a uma relação entre variáveis
independentes que é observada em uma amostra específica de dados, em vez de ser uma propriedade
inerente das variáveis em si. Isso significa que a multicolinearidade pode surgir ou desaparecer em
diferentes amostras de dados, dependendo da forma como as variáveis independentes estão distribuídas
nessa amostra. Além disso, o nível de multicolinearidade em uma amostra específica pode ser influenciado
pelo tamanho da amostra, pelo número de variáveis independentes incluídas no modelo e pela forma como
essas variáveis são medidas ou codificadas.
Portanto, é possível que uma relação de multicolinearidade não seja evidente em um conjunto de dados
populacionais, mas surja em uma amostra específica devido a variações aleatórias na amostragem. Da
mesma forma, a multicolinearidade pode não ser evidente em uma amostra maior ou menor, dependendo da
distribuição das variáveis independentes nessa amostra. Em resumo, a multicolinearidade é um fenômeno
amostral, que pode surgir em uma amostra específica devido a variações aleatórias na distribuição das
variáveis independentes nessa amostra. É importante estar ciente disso ao interpretar os resultados de
análises que envolvem a multicolinearidade e ao tomar decisões com base nesses resultados
3
5. Dificuldade em aplicar o modelo a novos dados: se o modelo for afetado pela multicolinearidade, ele
pode não ser facilmente aplicável a novos dados fora da amostra. Isso pode reduzir a utilidade do
modelo em situações práticas.
Em resumo, a multicolinearidade pode ter consequências práticas significativas para a qualidade e
interpretação dos resultados de uma regressão. É importante estar ciente dessas consequências e usar
técnicas apropriadas para lidar com a multicolinearidade, como o uso de métodos de estimação alternativos
ou a exclusão de variáveis correlacionadas do model
h) O que significa o fator de inflação da variância (FIV)? Quais os procedimentos devem ser seguidos
para que o FIV possa ser calculado?
O fator de inflação da variância (FIV) é uma medida estatística utilizada para avaliar a presença de
multicolinearidade em um modelo de regressão múltipla. Ele indica o quanto a variância de um coeficiente
de regressão é inflada devido à presença de correlação entre as variáveis independentes do modelo.
O cálculo do FIV envolve três etapas:
1. Estimar um modelo de regressão múltipla completo, incluindo todas as variáveis independentes
relevantes.
2. Calcular o inverso da matriz de correlação das variáveis independentes. Essa matriz é conhecida
como matriz de correlação de variáveis independentes.
3. Para cada variável independente no modelo, calcular o FIV como o inverso da diagonal da matriz de
correlação de variáveis independentes. O FIV para cada variável independente representa a
proporção da variação desse coeficiente de regressão que é devida à multicolinearidade.
4
Um FIV igual a 1 indica ausência de multicolinearidade, enquanto um FIV maior que 1 indica que a
variância do coeficiente de regressão está inflada devido à presença de multicolinearidade. Geralmente, um
valor de FIV maior que 10 é considerado como um indicador de multicolinearidade problemática.
Se o FIV indicar a presença de multicolinearidade, é necessário tomar medidas para lidar com o problema.
Isso pode incluir a exclusão de variáveis correlacionadas do modelo, a coleta de dados adicionais para
incluir novas variáveis independentes ou a transformação das variáveis independentes para reduzir a
correlação entre elas
5
j) Explique cada um dos principais procedimentos práticos para cuidar do problema da
multicolinearidade.
Quando a multicolinearidade é detectada em um modelo de regressão, existem alguns procedimentos
práticos que podem ser adotados para lidar com o problema. As principais abordagens são:
1. Remover variáveis independentes: Se houver variáveis independentes altamente correlacionadas,
uma abordagem simples é remover uma ou mais delas do modelo. No entanto, é importante escolher
quais variáveis remover com base na relevância teórica e empírica para o problema em questão.
2. Combinar variáveis independentes: Em alguns casos, é possível combinar duas ou mais variáveis
independentes altamente correlacionadas em uma única variável, por meio de uma transformação
linear. Essa abordagem pode ajudar a reduzir a multicolinearidade, mas é importante lembrar que a
nova variável combinada deve ser teoricamente e empiricamente relevante para o problema em
questão.
3. Coletar mais dados: Em alguns casos, a coleta de dados adicionais pode ajudar a reduzir a
multicolinearidade. Isso pode ser feito por meio da inclusão de novas variáveis independentes no
modelo ou por meio do aumento da amostra.
4. Regularização: A regularização é uma abordagem estatística que pode ajudar a reduzir a
multicolinearidade. Os métodos de regularização, como a regressão Ridge e a regressão Lasso,
adicionam um termo de penalização aos coeficientes de regressão, forçando-os a serem menores e,
portanto, reduzindo a multicolinearidade.
5. Análise de componentes principais (PCA): A análise de componentes principais pode ser usada para
reduzir a dimensionalidade do conjunto de variáveis independentes. Isso pode ajudar a reduzir a
multicolinearidade, pois os novos componentes principais são ortogonais e, portanto, não estão
correlacionados entre si.
6. Ignorar o problema: Em alguns casos, a multicolinearidade pode ser tolerada, desde que os efeitos na
inferência do modelo sejam cuidadosamente avaliados. No entanto, essa abordagem só deve ser
adotada se os efeitos da multicolinearidade não forem significativos o suficiente para afetar a
validade das inferências.
É importante lembrar que a escolha do procedimento a ser adotado para lidar com a multicolinearidade
depende das características específicas do conjunto de dados e do modelo de regressão. Além disso, a
interpretação dos resultados deve ser cuidadosa, levando em consideração as limitações e suposições do
procedimento escolhido.
6
2. Sobre a heterocedasticidade, responda:
7
c) A presença de heterocedasticidade é mais comum em dados de seção-cruzada do que nos dados de
séries temporais. A afirmativa é verdadeira? Explique!
A afirmativa não é necessariamente verdadeira, pois a presença de heterocedasticidade pode ocorrer tanto
em dados de seção-cruzada quanto em dados de séries temporais. A heterocedasticidade está relacionada à
variabilidade dos erros em um modelo e pode ocorrer em qualquer tipo de dados, independentemente de
serem de seção-cruzada ou de séries temporais.
Em dados de seção-cruzada, a heterocedasticidade pode ocorrer quando a variabilidade dos erros é diferente
em diferentes subgrupos ou em diferentes valores da variável independente. Por exemplo, em um modelo de
regressão que explique o salário de indivíduos em função de suas características, pode haver uma maior
variabilidade dos erros nos indivíduos com salários mais altos do que nos indivíduos com salários mais
baixos. Já em dados de séries temporais, a heterocedasticidade pode ocorrer quando há mudanças na
variabilidade dos erros ao longo do tempo. Por exemplo, em um modelo que explique o preço de um ativo
financeiro em função de variáveis econômicas, pode haver uma maior variabilidade dos erros durante
períodos de turbulência econômica do que em períodos de estabilidade.
Em ambos os casos, a presença de heterocedasticidade pode levar a estimativas imprecisas ou viesadas dos
parâmetros do modelo e pode ser necessário corrigi-la para obter resultados mais confiáveis. Portanto, é
importante avaliar a presença de heterocedasticidade em qualquer tipo de dados e aplicar as técnicas
adequadas para lidar com ela, independentemente de serem de seção-cruzada ou de séries temporais.
9
g) Explique a diferença entre os estimadores de MQO e os de MQG.
Os estimadores de Mínimos Quadrados Ordinários (MQO) e os estimadores de Mínimos Quadrados
Generalizados (MQG) são duas abordagens diferentes para estimar os parâmetros de um modelo linear. A
principal diferença entre esses dois métodos é que o MQO assume que a variância dos erros é constante,
enquanto o MQG permite que a variância dos erros varie de acordo com algumas variáveis explicativas. O
MQO é um método de estimação padrão que é usado quando os erros têm distribuição normal e a variância
dos erros é constante. O MQO é fácil de calcular e fornece estimativas eficientes dos parâmetros do modelo
se as suposições do modelo linear clássico forem satisfeitas. No entanto, quando as premissas do modelo são
violadas, o MQO pode produzir estimativas imprecisas e enviesadas.
O MQG, por outro lado, é um método de estimação mais geral que pode ser usado quando as suposições do
MQO são violadas. Em particular, o MQG pode ser usado para lidar com a heterocedasticidade, ou seja,
quando a variância dos erros não é constante. O MQG leva em conta a estrutura da variância dos erros e usa
matrizes de ponderação para ajustar a estimação dos parâmetros do modelo de acordo com essa estrutura. O
MQG pode ser mais preciso do que o MQO em presença de heterocedasticidade, mas pode ser
computacionalmente mais exigente. Em resumo, a principal diferença entre os estimadores de MQO e MQG
é que o primeiro assume que a variância dos erros é constante e normalmente distribuída, enquanto o
segundo permite que a variância dos erros varie de acordo com algumas variáveis explicativas. O MQG é
mais geral e pode ser usado para lidar com violações de algumas das premissas do modelo linear clássico,
como a heterocedasticidade e a correlação dos erros
h) Explique por que os estimadores de MQG, no contexto de heterocedasticidade, são conhecidos como
estimadores de Mínimos Quadrados Ponderados (MQP). (MQP é um caso específico dos MQG).
Os estimadores de Mínimos Quadrados Ponderados (MQP) são um caso específico dos estimadores de
Mínimos Quadrados Generalizados (MQG), usados para lidar com a heterocedasticidade no modelo de
regressão linear. Em presença de heterocedasticidade, os erros não têm a mesma variância em todas as
observações, e a influência das observações com maior variância é maior na estimação dos parâmetros do
modelo. Para corrigir esse problema, o método de MQG utiliza matrizes de ponderação que refletem a
relação entre as variáveis explicativas e a variância dos erros. No caso específico em que a matriz de
ponderação é diagonal (ou seja, as ponderações são diferentes para cada observação, mas não dependem das
outras observações), o estimador de MQG é conhecido como estimador de MQP. Nesse caso, os pesos são
proporcionais ao inverso da variância dos erros, ou seja, as observações com menor variância dos erros
recebem mais peso na estimação dos parâmetros do modelo.
Os estimadores de MQP são obtidos por meio da minimização da soma ponderada dos resíduos ao quadrado,
em que os pesos são as inversas da variância dos erros. Isso significa que as observações com menor
variância têm um peso maior na estimação dos parâmetros do modelo, o que reduz a influência das
observações com maior variância. Em resumo, os estimadores de MQP são um caso específico dos
10
estimadores de MQG usados para lidar com a heterocedasticidade no modelo de regressão linear. Eles são
chamados de ponderados porque usam matrizes de ponderação que refletem a relação entre as variáveis
explicativas e a variância dos erros, dando mais peso às observações com menor variância
A variância consistente de White é calculada usando a matriz de covariância dos erros, mas com um peso
para cada observação que leva em conta a variância do erro da observação. Essa matriz de peso é a inversa
da matriz de covariância dos erros. A matriz resultante é usada para calcular a variância dos coeficientes de
regressão, que é usada para estimar os erros padrão consistentes para a heterocedasticidade de White. Os
erros-padrão consistentes para a heterocedasticidade de White são importantes porque fornecem estimativas
de incerteza mais precisas e robustas, em relação aos erros padrão comuns, aos coeficientes de regressão em
13
modelos com heterocedasticidade. Isso pode ajudar a evitar resultados enganosos e garantir que as
inferências sejam mais precisas.
n) Caso não seja conhecido, é possível adotar algumas hipóteses sobre o padrão da
heterocedasticidade, o que permite a transformação dos dados e a eliminação da heterocedasticidade.
Explique!
n.1) Mostre como os dados devem ser transformados caso se assuma a hipótese de que a variância do
erro é proporcional a .
n.2) Mostre como os dados devem ser transformados caso se assuma a hipótese de que a variância do
erro é proporcional a .
Questões Práticas
1. Considere o seguinte resultado de um estudo da relação entre consumo (Y) renda (X2) e riqueza (X3).
Dependent Variable: Y
Method: Least Squares
Date: 03/27/23 Time: 11:52
Sample: 1 14
Included observations: 14
14
2. Um pesquisador definiu com base na teoria econômica que X1, X2 e X3 são regressores determinantes
da demanda de automóveis no Brasil. Ao analisar os coeficientes de correlação entre os pares de
regressores, ele obteve os seguintes resultados:
X1 X2 X3
X1 1.00 0.94 0.81
X2 0.94 1.00 0.74
X3 0.81 0.74 1.00
Supondo que você foi convidado (a) a dar parecer sobre este estudo, o que você diria em relação aos
resultados acima. Você iria invalidar os resultados do estudo? (Considere a questão da
multicolinearidade)
15
4. Um estudante de econometria interessado em saber qual a velocidade em que as variâncias e
covariâncias aumentam em caso de presença da multicolinearidade, calculou os seguintes coeficientes de
correlação entre X2 e X3.
𝑌𝑖 = β0 + β1𝑋2𝑖 + β2𝑋3𝑖 + X2 X3
X2 1.00 0.94
X3 0.94 1.00
c) Qual a diferença, se ela existe, entre o teste adotado pelo pesquisado e o proposto por Gleyser?
d) Existem críticas que recaem sobre o teste adotado pelo pesquisador e sobre o teste de Gleyser. Quais
são elas?
Dado que existem críticas sobre estes testes, você adotaria o teste Goldfeld – Quandt como alternativa
para a detecção da heterocedasticidade? Justifique a resposta.
16
6. Um pesquisador procurou analisar a relação entre o consumo das famílias (Y) e o nível de renda das
famílias (X2). Para tanto, ele utilizou dados da POF e da PNAD (dados de corte transversal), neste caso,
ele suspeitou que seu modelo estaria sujeito aos problemas de heterocedasticidade. Com base nisso, ele
adotou os seguintes procedimentos econométricos:
a) Procedimento 1:
Test Equation:
Dependent Variable: RESID^2
Method: Least Squares
Date: 03/27/23 Time: 11:17
Sample: 1960 2000
Included observations: 41
Explique o procedimento adotado pelo pesquisador e qual foi o objetivo de tê-lo adotado? Quais
conclusões puderam ser retiradas dos resultados obtidos pelo procedimento?
b) Procedimento 2:
17
Explique o procedimento 2 e diga qual foi o objetivo de o pesquisador tê-lo adotado? Esta técnica
apresenta limitações?
18