Professional Documents
Culture Documents
Revisão 2 Bimestre
Revisão 2 Bimestre
2
CORRELAÇÃO = Grau de associação entre duas variáveis.
4
5
Dizer que a correlação é positiva implica afirmar que, quando
X aumenta, Y também aumenta; quando X diminui, Y também
diminui. Se a correlação é negativa ocorre o contrário: se X
aumenta, Y diminui; se X diminui, Y aumenta.
6
Uma vez identificada uma correlação linear entre duas variáveis X e Y, como
quantificá-la? ATRAVÉS DA COVARIÂNCIA
7
8
9
A covariância é influenciada pela escala, logo, quanto maiores os
valores de um conjunto de dados, maiores as chances de a
covariância assumir valores mais elevados. Uma maneira de
corrigir isso é utilizar variáveis padronizadas e definir uma nova
medida, o coeficiente de correlação. 10
11
12
13
VAMOS RELEMBRAR ALGUNS CONCEITOS DA SEÇÃO 2.3 E 2.4
DESVIO: diferença
de um valor do
conjunto com
relação à média.
14
15
SEÇÃO 4.2
TESTE DE SIGNIFICÂNCIA
16
17
18
LINK TABELAS DE DISTRIBUIÇÃO
https://professorguru.com.br/formularios-e-tabelas-estatistica.html
19
Exemplo do livro
20
21
SEÇÃO 4.3
REGRESSÃO LINEAR
22
23
COMPREENDENDO CORRELAÇÃO E REGRESSÃO
24
CORRELAÇÃO
• Caso os pontos das variáveis, representados num plano cartesiano (X, Y) ou gráfico de
dispersão, apresentem uma dispersão ao longo de uma reta imaginária, dizemos que
os dados apresentam uma correlação linear.
• Uma medida do grau e do sinal da correlação linear entre duas variáveis (X,Y) é dado
pelo Coeficiente de Correlação Linear de Pearson (SEÇÃO 4.1)
• Este coeficiente é adimensional, logo não é afetado pelas unidades de medidas das
variáveis X e Y.
• O sinal positivo indica que as variáveis são diretamente proporcionais, enquanto que o
sinal negativo indica que a relação entre as variáveis é inversamente proporcional.
25
REGRESSÃO
26
27
28
Que valor você espera obter para y, dado que x= 57, isto é, qual seria a estatura de uma criança com
idade de 57 meses?
29
30
Além da reta da equação, também é necessário calcular os erros cometidos ao realizar a
aproximação dos pontos através da reta. Como calculamos o erro total na aproximação pela
reta de regressão?
Vamos elevar ao quadrado cada desvio. (Lembra da estratégia usada no calculo da variância?)
Essa mesma estratégia pode ser utilizada para calcular o erro de aproximação da reta de
regressão, e, assim, definimos a soma dos quadrados dos erros como:
http://www.de.ufpb.br/~luiz/AED/Aula9.pdf
https://www.ime.usp.br/~hbolfar/aula_2013/Aula%203%20-%20Descritiva%20III%20-%20A12012
34
SEÇÃO 4.4
ESTUDANDO RESÍDUOS
35
Apesar de a análise de significância ser feita com base em r (coeficiente de correlação), seu valor não
auxilia a interpretar o quanto da variação de Y é devido a sua correlação com X e o quanto é devido ao
acaso. Essa interpretação é possível por meio de um estudo dos resíduos de uma regressão linear, ou
seja, dos erros ocorridos na geração de estimativas pelo processo de regressão. O estudo de resíduos
também auxilia na construção de intervalos de confiança para os valores de regressão.
36
37
38
PODEMOS AINDA DEFINIR:
39
40
41
42
43
44
45