You are on page 1of 22

Regresso Linear Mltipla

Construo de um modelo de regresso linear mltipla

Ilka Afonso Reis DEST - UFMG

Alternativa 1: Entrada uma-a-uma


1) Estudar a correlao linear entre a resposta (Y) e cada uma das candidatas a explicativas
Grficos de Disperso e Matriz de Correlao

2) Incluir no primeiro modelo aquela candidata que apresenta a maior correlao com a resposta. 3) Se a varivel adicionada ao modelo tem coeficiente de regresso estatisticamente diferente de zero (testes t-Student), estudar a relao dos resduos deste modelo com as outras candidatas a explicativas.
Grficos de Disperso e Matriz de Correlao

Alternativa 1: Entrada uma-a-uma


4) Adicionar ao modelo anterior aquela candidata que apresenta a maior correlao com os resduos desse modelo. 5) Repetir passos 3 e 4 at que o coeficiente de regresso da varivel adicionada ao modelo no seja estatisticamente diferente de zero (testes t-Student) ou caso no haja mais variveis a serem adicionadas ao modelo. 6) Fazer a anlise de resduos do modelo final.
Grfico de Probabilidade Normal Resduos x Preditos Resduos x Variveis Explicativas no modelo Inspeo de Observaes Influentes

Exemplo: fabricao de cimento do tipo Portland


Em um artigo* de 1932, pesquisadores analisaram dados sobre a fabricao de cimento Portland. A varivel resposta a quantidade de calor (em calorias), por grama de cimento, evolved during hardening (Y), e as candidatas a explicativas so: a quantidade de tricalcium aluminate, 3CaO Al2O3 (X1), a quantidade de tricalcium silicate, 3CaO SiO2 (X2), a quantidade de tetracalcium alumino ferrite 4CaO Al2O2 Fe2O3 (X3), a quantidade de dicalcium silicate, 2CaO SiO2 (X4). As quantidades X1, X2, X3 e X4 foram medidas como percentagens do peso dos clinkers (cimento bruto) dos quais foram feitos o cimento.
of composition of Portland cement on heat evolved during hardening, Industrial and Engineering Chemistry, 24, 1932, 1207 1214.
*Effect

X1 tricalcium aluminate

X2 tricalcium silicate

110

100

dados$Y

dados$Y 5 10 dados$X1 15 20

90

80

Passo 1

80

90

100

110

30

40

50 dados$X2

60

70

X3 tetracalcium alumino ferrite

X4 dicalcium silicate

110

100

dados$Y

dados$Y 5 10 15 dados$X3 20

90

80

80

90

100

110

10

20

30

40

50

60

dados$X4

Passo 2

X1 tricalcium aluminate ,Correl= 0.93


15 15

X2 tricalcium silicate ,Correl= 0.03

10

residuos1

residuos1 5 10 dados$X1 15 20

-5

-10

-10

-5

10

30

40

50 dados$X2

60

70

Passo 3

X3 tetracalcium alumino ferrite ,Correl= -0.89


15 residuos1 -10 -5 0 5 10

10

15 dados$X3

20

Passo 4

X2 tricalcium silicate ,Correl= 0.14


4

X3 tetracalcium alumino ferrite ,Correl= -0.3


4 residuos2

Passo 5 (repetio do Passo 3)

residuos2

-2

-4

30

40

50 dados$X2

60

70

-4 5

-2

10

15 dados$X3

20

Passo 5 (repetio do Passo 4)

Modelo Final

Normal Q-Q Plot


4

Passo 6

Sample Quantiles

-2

Shapiro-Wilk, valor-p= 0.947

-4

-1.5

-1.0

-0.5

0.0

0.5

1.0

1.5

Theoretical Quantiles

Verificando problemas de falta de ajuste


4

Passo 6

residuos2

-4

-2

80

90 preditos2

100

110

Verificando problemas de varincia no-constante


4 4 residuos2 10 20 30 40 50 60 -4 -2 0 2

Passo 6

residuos2

-4

-2

10

15

20

dados$X4

dados$X1

Verificando observaes Influentes

Passo 6

Observaes Influentes
110 110 dados$Y 90 80 Alavanca Influencia 10 20 30 40 50 60 5 10 dados$X1 15 80 90 100

Passo 6

dados$Y

100

Alavanca Influencia 20

dados$X4

Retirando possvel ponto de influncia

Idnticos aos valores do ajuste com a obs. 8

O mesmo ocorre quando tiramos o possvel ponto de alavanca

Idnticos aos valores do ajuste com a obs. 10

Alternativa 2: Sada uma-a-uma


1) Ajustar o modelo com todas as candidatas a explicativas (modelo cheio) 2) Procurar indcios de multicolinearidade no modelo.
Clculo dos VIFs Conflito entre testes t-Student e F

3) Se houver indcios de multicolinearidade, retirar do modelo aquela varivel que pode estar causando este problema. 4) Repetir passos 2 e 3 at que no haja mais indcios de multicolinearidade

Alternativa 2: Sada uma-a-uma


5) Fazer a anlise de resduos do modelo encontrado no passo 4 6) Se no houver problemas com as suposies para os erros do modelo, verificar a significncia estatstica das estimativas dos coeficientes de regresso
Testes F e t-Student

7) Se houver coeficientes estatisticamente nulos, retir-los do modelo e fazer novo ajuste. 8) Repetir passos 6 e 7.

Exerccio

Usar a Alternativa 2 para construir o modelo de regresso para os dados da produo do cimento do tipo Portland.

Leitura
Aula de hoje: Regresso Linear Mltipla (seleo
de modelos)
Montgomery, DC e Runger, GC (Estatstica Aplicada e Probabilidade para Engenheiros) Captulo 12

Prxima aula:
Prova (sala 1094/BL. EENG, de 07:30h s 09:00h)
Levar calculadora, lpis, borracha, caneta.