You are on page 1of 26

MÉTODOS

QUANTITATIVOS

Prof. Miguel Isoni Filho


UNIDADE 7

ANÁLISE DE REGRESSÃO
Estudo da relação entre variáveis

 Investigar a presença ou ausência de


relação linear sob dois pontos de vista
 Quantificando a força dessa relação: correlação
 Explicitando a forma dessa relação: regressão

 Diagrama de dispersão: representação


gráfica das duas variáveis quantitativas
Análise de regressão

 Sempre que duas variáveis x e y tem coeficiente de correlação


diferente de 0, ela são dependentes ( sentido probabilístico).

Nem sempre essa correlação representa uma


interdependência causal direta.

• Exemplo 1: altura e peso→ interdependência direta


• Exemplo 2: salário e criminalidade → Interdependência indireta.
Análise de regressão

É um modelo estatístico que permite o equacionamento da


relação existente entre duas Variáveis Quantitativas (VD)
e (VI) a partir de uma amostra aleatória com n elementos,
visando a projeção e a estimação de outras ocorrências na
população de origem

yˆ  a  bx Y    x   0
Análise de regressão

Y    x   0
 Y é a variável resposta (dependente - VD);
 x é a variável independente (VI);
  representa o erro;
  é o intercepto em Y;
  é a inclinação da linha
Análise de regressão

 A relação de causalidade entre uma variável e outra


determina se a variável é caracterizada como sendo:
Análise de regressão

O dados emparelhados quando representados num diagrama


de dispersão deverão apresentar uma tendência linear
Análise de regressão

Aqui os erros estão apresentando certa dependência e a variância não segue o


mesmo padrão, indicando que o modelo viola o pressuposto de
Homocedasticidade, logo, a regressão linear não está adequada para os dados.
Análise de regressão

O erro  e a variável y são variáveis


aleatórias normalmente distribuídas
Análise de regressão

Questão de sala 1:
O professor Miguel gostaria de analisar o
desempenho de sua turma de Estatística.

Para isso, o professor decidiu analisar o efeito


de causalidade da presença de seus alunos
em suas aulas – mensurada de 0% a 100%
de presença – na nota final em sua disciplina
– mensurada de 0 a 100% de nota.

Analise o modelo de regressão, usando


sempre um nível de 5% de significância.
Os dados estão listados na tabela a seguir:
Análise de regressão

Passo 1:
 Para iniciar, analisamos o BoxPlot.
 Para fins de melhor compreender o grau de
normalidade entre os dados exploratórios e as
possibilidade de existência de outliers.
Análise de regressão

Passo 2:
 Agora faremos o teste de correlação.
 Assinale o coeficiente “Pearson”

 Assinale teste de significância


 Com duas extreminades.

 Assinale, ao final, o comando que segue:


“Sinalizar correlações significantes”
Análise de regressão

Passo 3:
 O que nos interessa é o
quadro a seguir, que
apresenta tanto o valor do
coeficiente, quanto o p-
valor para analisarmos.

• O valor “Sig” (2-tailed) o qual representa p-valor = 0,000.

Comparando 0,000 com o nível de significância de 0,05 (α = 5%)


concluímos que 0,016 < 0,05. Portanto, rejeitamos a hipótese nula,
concluindo que a correlação não é nula, ou seja, existe correlação .
Análise de regressão

Passo 3:
 O que nos interessa é o
quadro a seguir, que
apresenta tanto o valor do
coeficiente, quanto o p-
valor para analisarmos.

• Além do mais, notamos o r = 0,963. Ou seja, correlação positiva e muito forte.


Análise de regressão

Passo 4:
 Agora, queremos extrair o diagrama de
dispersão em relação às variáveis que
estamos analisando nesse exercício.

 Na barra de comandos, clique em 


Gráficos  criador de gráficos.

 Aloque o gráfico “Dispersão de Pontos” no


painel de visualização prévia (...)

 Aloque a variável “Nota Final (%)” no eixo


Y e “Presença (%)” no eixo X.
Análise de regressão

Passo 5:
 O que nos interessa é
o gráfico a seguir:

• Notamos mediante a visualização do


gráfico, que as variáveis segue uma
correlação (ou associação) linear
diretamente proporcional. Ou seja,
quando uma cresce a outra também
cresce em proporções lineares.
Análise de regressão

Passo 6:
 Agora, queremos analisar
o modelo de regressão
linear e seus pontos de
validação explicativa
Análise de regressão

Passo 7:
 Aloque atentamente a variável
“Nota Final (%)” no eixo das
variáveis dependentes e
“Presença (%)” no eixo das
variáveis independentes.

 Não será preciso alterar


nenhuma configuração.
Análise de regressão

Passo 8:
 Apresentamos a seguir a
proposta de modelo de
regressão linear. Nesse caso,
mostramos que a variável
dependente é “Nota Final (%)”
e a variável independente é
“Presença (%)”. Vale lembrar:

Y    x   0
Análise de regressão

Passo 8:

 Mostramos a estimação
do modelo de regressão.

O coeficiente de determinação (R2) mostra que percentual as variações


de Y são “explicadas” pelas variações da variável independente (X), ou
seja, o R2 representa uma medida de intensidade da relação linear
entre as variáveis escolhidas para comporem o modelo de regressão.
Assim, pode-se dizer que, neste caso, as variações ocorridas nas
variáveis estão explicando 92,8% das variações ocorridas.
Análise de regressão

Passo 8:

O teste F tem por finalidade testar o efeito conjunto da variável X sobre a variável Y.
Isso significa verificar se a variável X do modelo exerce efetivamente influência sobre
a variável Y. Ou seja, testar a significância do efeito de X sobre o Y. Assim, tem-se
que o p-valor é igual a 0,000, ou seja, menor que nível de significância de 5%.

H0: as variáveis são homogêneas – não causam efeito uma na outra.


H1: as variáveis são heterogêneas – causam efeito uma na outra.
Análise de regressão

Passo 8:

O teste “t”-Student é usado para determinar se os parâmetros da amostra são significativamente


diferentes dos parâmetros hipotéticos da população sendo desconhecido o desvio padrão da
população, assim ele mede a significância individual dos parâmetros estimados.

H0: o parâmetros causa efeito nulo – não sendo significativo para o modelo.
H1: o parâmetro causa efeito não-nulo – sendo significativo para o modelo.

You might also like