Professional Documents
Culture Documents
=
O coeficiente de correlao linear de Pearson dado por:
sendo que,
so as mdias amostrais de X e Y, respectivamente,
S
X
e S
Y
so os desvios padro amostrais de X e Y, respectivamente.
Y X e
Frmula alternativa:
Y X
n
i
i i
S S n
Y X n Y X
r
) 1 (
1
=
No exemplo:
Tempo (X) Nota (Y)
3,0 4,5
7,0 6,5
2,0 3,7
1,5 4,0
12,0 9,3
25,5 28,0 41,2
25,53
5,76
5,89
1,71
2,31
)
-
X - (X )
-
Y - (Y
6 5 1 5 ,
-
Y ,
-
X = =
2,34 S 5,47
4
21,9
4
(3,7) ... (-1,1)
S
4,42 S 19,55
4
78,2
4
(6,9) ... (-2,1)
S
y
2 2
2
y
x
2 2
2
x
= = =
+ +
=
= = =
+ +
=
0,9959
2,34 . 4,42 . 4
41,2
r
Ento,
= =
0 0
3,7 6,9
-1,6 -3,6
-1,9 -3,1
0,9 1,9
-1,1 -2,1
)
-
X - (X )
-
Y - (Y
No MINITAB temos:
MTB > corr C1 C2
Pearson correlation of Tempo and Nota = 0,996
Propriedade: -1 s r s 1
Casos particulares:
r = 1 correlao linear positiva e perfeita
r = -1 correlao linear negativa e perfeita
r = 0 inexistncia de correlao linear
r = 1, correlao linear positiva e perfeita
r = -1, correlao linear negativa e perfeita
r 0
~
50 40 30 20 10
40
30
20
10
X
Y
r 1
~
r -1
~
Exemplo 2: criminalidade e analfabetismo
Considere as duas variveis observadas em 50
estados norte-americanos.
Y: taxa de criminalidade
X: taxa de analfabetismo
Diagrama de disperso
Podemos notar que, conforme aumenta a taxa de
analfabetismo (X), a taxa de criminalidade (Y) tende
a aumentar. Nota-se tambm uma tendncia linear.
Clculo da correlao
Correlao entre X e Y:
702 , 0
17 , 110
39 , 77
609 , 0 692 , 3 49
17 , 1 38 , 7 50 12 , 509
) 1 (
1
= =
=
=
=
r
S S n
Y X n Y X
r
Y X
n
i
i i
(mdia de X) e S
X
= 0,609 (desvio padro de X)
X =1,17
_
E X
i
Y
i
= 509,12
Y = 7,38
(mdia de Y) e S
Y
= 3,692 (desvio padro de Y)
_
Exemplo 3: Expectativa de vida e analfabetismo
Considere as duas variveis observadas em 50
estados norte-americanos.
Y: expectativa de vida
X: taxa de analfabetismo
Diagrama de disperso
Podemos notar que, conforme aumenta a taxa de
analfabetismo (X), a expectativa de vida (Y) tende
a diminuir. Nota-se tambm uma tendncia linear.
Clculo da correlao
Y = 70,88
_
(mdia de Y) e S
Y
= 1,342 (desvio padro de Y)
(mdia de X) e S
X
= 0,609 (desvio padro de X)
X = 1,17
_
E X
i
Y
i
= 4122,8
Correlao entre X e Y:
59 , 0
047 , 40
68 , 23
609 , 0 342 , 1 49
17 , 1 88 , 70 50 8 , 4122
) 1 (
1
=
=
=
=
=
r
S S n
Y X n Y X
r
Y X
n
i
i i
Regresso Linear
OBJETIVO: Encontrar uma reta que represente bem a
tendncia observada nos dados.
Por exemplo:
Reta ajustada:
O que so a e b?
Interpretao de b:
a: intercepto
b: inclinao
Para cada aumento de uma unidade em X, temos
um aumento mdio de b unidades em Y.
bX a Y
Reta ajustada
(mtodo de mnimos quadrados)
Os coeficientes a e b so calculados da seguinte maneira:
2
1
) 1 (
X
n
i
i i
S n
Y X n Y X
b
=
=
X b Y a =
Pelo MINITAB,
em que C1: varivel Y
C2: varivel X
utilizando comando:
MTB > regress C1 1 C2
ou pelo menu:
<stat> <regression> <regression>
e escolher <response> e <predictors> da planilha.
No Exemplo 2,
a reta ajustada :
Para um aumento de uma unidade na taxa do
analfabetismo (X), a taxa de criminalidade (Y)
aumenta, em mdia, 4,257 unidades.
Interpretao de b:
X Y 257 , 4 397 , 2
+ =
Y : valor predito para a taxa de criminalidade
X : taxa de analfabetismo
^
Graficamente, temos
Como desenhar a reta no grfico?
Escolha dois pontos:
X = 0,5:
y = 2,397+4,257x0,5 = 4,5255 (0,5;4,53)
X = 1,5:
y = 2,397+4,257x1,5 = 8,7825 (1,5;8,78)
^
^
No Exemplo 3,
a reta ajustada :
Interpretao de b:
Para um aumento de uma unidade na taxa do
analfabetismo (X), a expectativa de vida (Y)
diminui, em mdia, 1,296 anos.
X Y 296 , 1 395 , 72
=
Y : valor predito para a expectativa de vida
X : taxa de analfabetismo
^
Graficamente, temos
Exemplo 4: Consumo de cerveja e temperatura
Y: consumo de cerveja dirio por mil habitantes, em litros.
X: temperatura mxima (em C).
As variveis foram observadas em nove localidades
com as mesmas caractersticas demogrficas e scio-
econmicas.
Dados:
Localidade Temperatura Consumo
(X) (Y)
1 16 290
2 31 374
3 38 393
4 39 425
5 37 406
6 36 370
7 36 365
8 22 320
9 10 269
40 30 20 10
400
350
300
Temperatura
C
o
n
s
u
m
o
Diagrama de disperso
A correlao amostral entre X e Y r = 0,962.
A reta ajustada :
Qual o consumo previsto para uma temperatura de 25C?
Qual a interpretao de b?
Aumentando-se um grau de
temperatura (X), o consumo
de cerveja (Y) aumenta, em
mdia, 4,74 litros por mil
habitantes.
litros 335,87 4,7425 217,37 Y
^
= + =
X Y 74 , 4 37 , 217
+ =