You are on page 1of 32

Probabilidade e Estatística

Correlação e Regressão Linear


Variáveis

Variável: características ou itens de


interesse de cada elemento de uma
população ou amostra
Também chamada parâmetro,
posicionamento, condição...
Duas variáveis estão relacionadas se a
mudança de uma provoca a mudança na
outra.
Exemplo: velocidade x consumo combustível
Correlação

Correlação entre duas variáveis


Quando uma delas está, de alguma forma,
relacionada com a outra.
Quando a alteração no valor de uma
varíavel (dita independente) provoca
alterações no valor da outra variável
(dita dependente)
Diagramas de Dispersão

Um diagrama de dispersão mostra a relação


entre duas variáveis quantitativas, medidas
sobre os mesmos indivíduos.
Os valores de uma variável aparecem no
eixo horizontal, e os da outra, no eixo
vertical.
Comumente, coloca-se no eixo x um parâmetro
Cada indivíduo aparece como o ponto do
gráfico definido pelos valores de ambas as
variáveis para aquele indivíduo
Exemplos

Fabricação
Número de peças produzidas e número de peças defeituosas
Construção
Número de falhas em uma obra e a satisfação média dos
construtores
Dias de atraso de entrega x número de dias chuvosos
Financeiro
Média de tempo de atraso de pagamento e número de erros de
fatura
Vendas
% de imóveis vendidos na data de entrega da obra x satisfação
média dos clientes nos últimos 10 empreendimentos.
Exemplo - Peso x altura
Peso Altura Peso x Altura
(kg) (m)
80 1,80 1,95
1,9
85 1,83 1,85
50 1,65 1,8

Altura
70 1,90 1,75
1,7
55 1,60
1,65
77 1,80 1,6
85 1,78 1,55
40 50 60 70 80 90 100
93 1,86
Peso
65 1,70
60 1,65
Exemplo – Peso x Altura
Estratificando...
Altura Altura Homens
Peso (kg) homens Mulheres Peso x Altura (por sexo)
(m) (m)
Mulheres
80 1,80 --- 110
85 1,83 --- 90
50 --- 1,65 70

Pesos
70 --- 1,90 50
55 --- 1,60 30
77 1,80 --- 10
85 --- 1,78 1,5 1,6 1,7 1,8 1,9 2
93 1,86 ---
Alturas
65 1,70 ---
60 --- 1,65
Dicas

Eixo ´x´
Variável que é alterada por uma modificação no
processo (variável independente)
Geralmente uma possível causa de um problema
Eixo ´y´
Variável que pode mudar de acordo com a
mudança da variável em ´x´ (variável
dependente)
Geralmente um indicador de qualidade ou efeito
gerado por uma causa.
Analisando Diagramas de
Dispersão
Os aspectos abaixo são relevantes na
análise dos Diagramas:
DIREÇÃO (crescente, decrescente)
FORMA (linear, não-linear, aglomerados)
PONTOS DISCREPANTES
Interpretando

Padrões de Dispersão

Quanto maior a correlação, mais próxima de


uma reta a 45o ou 135o será a distribuição.
Interpretando

Grau de Relacionamento

Escala?...
Problemas da Análise Gráfica

A análise gráfica da relação entre


variáveis é importante, mas os olhos
nem sempre são um bom juiz da
intensidade de uma relação linear.
Os diagramas a seguir ilustram
precisamente os mesmos dados, mas o
gráfico inferior é menor em um campo
mais amplo (escala diferente).
Problemas da Análise Gráfica

Nossos olhos podem ser enganados


por uma mudança de escalas, ou pela
quantidade de espaço em branco em
torno do aglomerado dos pontos.
Deve-se, então, utilizar uma medida
numérica para suplementar o gráfico.
Coeficiente de Correlação Linear (r)
Coeficiente de Correlação Linear

r Æ mede o grau de relacionamento linear


entre valores emparelhados x e y em uma
amostra.
Mede a intensidade e a direção da relação
linear entre duas variáveis quantitativas.
Chamado também de Coeficiente de
Correlação de Pearson (Karl Pearson, 1857-
1936).
Coeficiente de Correção Linear
ou Coeficiente de Pearson
n
S xx = ∑ ( xi − x ) 2 S xx = n(∑ xi2 ) − (∑ xi ) 2
i =1
n
S yy = ∑ ( yi − y ) 2 S yy = n(∑ y ) − (∑ yi )
2
i
2

i =1
n
S xy = ∑ ( xi − x )( yi − y ) S xy = n∑ xi . yi − (∑ xi )(∑ yi )
i =1

Sxy
r = -1 ≤ r ≤ 1
S xx . S yy
Coeficiente de Correção Linear
ou Coeficiente de Pearson

n∑ ( xi ⋅ yi ) − (∑ xi )(∑ yi )
r=
n∑ x − (∑ xi ) ⋅ n∑ y − (∑ yi )
2 2 2 2
i i

−1 ≤ r ≤ 1
Interpretando o
Coeficiente de Correlação Linear
‘r’ sempre será um valor entre
-1 ≤ r ≤ 1
¾ Quanto mais próximo de –1: maior correlação
negativa
¾ Quanto mais próximo de 1: maior correlação
positiva
¾ Quanto mais próximo de 0: menor a correlação
linear
Interpretação do Valor de r

valor de r

-1 0 +1

correlação correlação correlação correlação


negativa negativa positiva positiva
forte fraca fraca forte
ausência
de
correlação
Propriedades do Coeficiente de
Correlação de Pearson
-1 ≤ r ≤ +1
O valor de r não varia se todos os valores
de qualquer uma das variáveis são
convertidos para uma escala diferente.
O valor de r não é afetado pela escolha de
x ou y. Permutando x e y, r permanece
inalterado.
r: só mede a intensidade ou grau de
relacionamentos lineares. Não serve para
medir intensidade de relacionamentos não-
lineares.
Ex.: Alturas e Pesos de Ursos
Siberianos
C om pr i m ent o ( pol .) Peso ( l b.)
x y x.y x2 y2
53,0 80 4.240 2.809,00 6.400
67,5 344 23.220 4.556,25 118.336
72,0 416 29.952 5.184,00 173.056
72,0 348 25.056 5.184,00 121.104
73,5 262 19.257 5.402,25 68.644
68,5 360 24.660 4.692,25 129.600
73,0 332 24.236 5.329,00 110.224
37,0 34 1.258 1.369,00 1.156

Tot ai s 517 2.176 151.879 34.525,75 728.520


Ex.: Alturas e Pesos de Ursos
Siberianos

n∑ ( xi ⋅ yi ) − (∑ xi )(∑ yi )
r= ∴
n∑ x − (∑ xi ) ⋅ n∑ y − (∑ yi )
2 2 2 2
i i

8(151.879) − (516,5)(2.176)
r= =
8(34.525,75) − (516,5) 2 8(728.520) − (2.176) 2
91.128
= = 0,897
9433,75 ⋅1.093.184
Reta de Regressão Linear

Diferentes retas podem ser traçadas, a


olho nu, e um diagrama de dispersão
Cada pessoa terá uma tendência diferente
Nenhuma reta passará exatamente por
todos os pontos (se a correlação não for
máxima)
Precisamos encontrar uma reta que esteja
tão próxima dos pontos quanto possível
Os erros de predição para a reta são erros
em y (direção vertical)
Reta de Regressão Linear

Se um diagrama de dispersão sugere uma


relação linear, é de interesse representar
este padrão através de uma reta
Usa-se o método dos mínimos quadrados
para ajustar uma reta de regressão ao
conjunto de pontos do diagrama
A reta de regressão descreve como uma
variável resposta (dependente) y varia em
relação a uma variável explanatória
(independente) x
Variáveis

Variável resposta (y) (dependente)


Mede um resultado em um estudo
Variável explanatória (x) (independente)
Procura explicar os resultados observados
Variável independente (x) Variável dependente (y)
Temperatura do forno (oC) Resistência mecânica da cerâmica
(MPa)
Quantidade de aditivo (%) Octanagem da gasolina
Renda (R$) Consumo (R$)

Memória RAM (GB) Tempo de resposta do sistema (s)


Definição

Dada uma coleção de dados amostrais


emparelhados, a seguinte equação de
regressão descreve a relação entre as duas
variáveis
ŷ = α + β x
O gráfico da equação é chamado reta de
regressão (ou reta de melhor ajuste, ou
reta de mínimos quadrados)
Definição

ŷ = α + β x β: coeficiente
angular
n ( ∑ xi yi ) − ( ∑ xi )( ∑ yi ) α: ponto onde a
β=
n ( ∑ x ) − ( ∑ xi )
2 2
reta intercepta
eixo y
i

α=
( ∑ i ) ( ∑ i ) − ( ∑ xi )( ∑ xi yi )
y x 2

n ( ∑ x ) − ( ∑ xi )
2 2
i

α= ∑ y −β∑x
i i

n
Exemplo

Considere um experimento em que se


analisa a octanagem da gasolina (Y) em
função da adição de um aditivo (X).
Para isto, foram realizados ensaios
com os percentuais de 1, 2, 3, 4, 5 e
6% de aditivo. Os resultados seguem.
Exemplo

85,5
X Y 85,0
84,5
Índice de Octanagem

1 80,5
84,0
2 81,6 83,5
3 82,1 83,0
4 83,7 82,5
82,0
5 83,9 81,5
6 85,0 81,0
80,5
80,0
0 1 2 3 4 5 6 7
Quantidade de Aditivo (%)
Exemplo

Calculando a equação de regressão...


2
xi yi xi xiyi
1 80,5 1 80,5
2 81,6 4 163,2
3 82,1 9 246,3
4 83,7 16 334,8
5 83,9 25 419,5
6 85,0 36 510,0
Soma 21 496,8 91 1.754,3
6(1754,3) − (21)(496,8) 93
β= = = 0,886
6(91) − (21) 2
105
496,8 − (0,886)(21)
α= = 79, 7
6
∴ yˆ = 79, 7 + 0,886 x
Exemplo

yˆ = 79,7 + 0,886 x
85,5
85,0
84,5
Índice de Octanagem

84,0
83,5
83,0
82,5
82,0
81,5
81,0
80,5
80,0
0 1 2 3 4 5 6 7
Quantidade de Aditivo (%)

You might also like

  • Introducao POO
    Introducao POO
    Document13 pages
    Introducao POO
    Tiago André Arena da Silva
    No ratings yet
  • Tap Aula02
    Tap Aula02
    Document7 pages
    Tap Aula02
    Tiago André Arena da Silva
    No ratings yet
  • Geocities Probabilidades e Estatística 2006
    Geocities Probabilidades e Estatística 2006
    Document5 pages
    Geocities Probabilidades e Estatística 2006
    Tiago André Arena da Silva
    100% (1)
  • Tap Exe1
    Tap Exe1
    Document1 page
    Tap Exe1
    Tiago André Arena da Silva
    No ratings yet
  • Data Simples
    Data Simples
    Document4 pages
    Data Simples
    Tiago André Arena da Silva
    No ratings yet
  • Tap Aula01
    Tap Aula01
    Document3 pages
    Tap Aula01
    Tiago André Arena da Silva
    No ratings yet
  • Terminologia
    Terminologia
    Document2 pages
    Terminologia
    Tiago André Arena da Silva
    100% (1)
  • Vetores Completo P 01 p72
    Vetores Completo P 01 p72
    Document71 pages
    Vetores Completo P 01 p72
    Tiago André Arena da Silva
    88% (25)
  • Classes Objetos Aula 2
    Classes Objetos Aula 2
    Document25 pages
    Classes Objetos Aula 2
    Tiago André Arena da Silva
    No ratings yet
  • WTR 2002
    WTR 2002
    Document8 pages
    WTR 2002
    Tiago André Arena da Silva
    100% (1)
  • Terminologia
    Terminologia
    Document2 pages
    Terminologia
    Tiago André Arena da Silva
    100% (1)
  • Grafos Isomorfos
    Grafos Isomorfos
    Document2 pages
    Grafos Isomorfos
    Tiago André Arena da Silva
    No ratings yet
  • Classes Objetos
    Classes Objetos
    Document12 pages
    Classes Objetos
    Tiago André Arena da Silva
    No ratings yet
  • Algoritimos de Programaçao Linear
    Algoritimos de Programaçao Linear
    Document215 pages
    Algoritimos de Programaçao Linear
    Diego Silva
    No ratings yet
  • Aplicação Do Teorema de Euler
    Aplicação Do Teorema de Euler
    Document5 pages
    Aplicação Do Teorema de Euler
    kprbass
    No ratings yet
  • PCV
    PCV
    Document5 pages
    PCV
    Tiago André Arena da Silva
    100% (1)
  • TeoGraf2 2005
    TeoGraf2 2005
    Document6 pages
    TeoGraf2 2005
    Tiago André Arena da Silva
    No ratings yet
  • Intro Duca o
    Intro Duca o
    Document2 pages
    Intro Duca o
    Tiago André Arena da Silva
    No ratings yet
  • Mapas Grafos
    Mapas Grafos
    Document2 pages
    Mapas Grafos
    Tiago André Arena da Silva
    No ratings yet
  • Introduc Ao 'A Teoria Dos Grafos: Roblema Da Tribuic Ao de Arefas
    Introduc Ao 'A Teoria Dos Grafos: Roblema Da Tribuic Ao de Arefas
    Document7 pages
    Introduc Ao 'A Teoria Dos Grafos: Roblema Da Tribuic Ao de Arefas
    Tiago André Arena da Silva
    No ratings yet
  • Grafos Orientados
    Grafos Orientados
    Document5 pages
    Grafos Orientados
    Tiago André Arena da Silva
    No ratings yet
  • Grafos
    Grafos
    Document23 pages
    Grafos
    Tiago André Arena da Silva
    100% (1)
  • Grafos
    Grafos
    Document5 pages
    Grafos
    Tiago André Arena da Silva
    No ratings yet
  • PCC
    PCC
    Document6 pages
    PCC
    Tiago André Arena da Silva
    No ratings yet
  • Hamiltonianos
    Hamiltonianos
    Document1 page
    Hamiltonianos
    Tiago André Arena da Silva
    No ratings yet
  • Gaplicacoes
    Gaplicacoes
    Document1 page
    Gaplicacoes
    Tiago André Arena da Silva
    No ratings yet
  • Gaplicacoes
    Gaplicacoes
    Document1 page
    Gaplicacoes
    Tiago André Arena da Silva
    No ratings yet
  • Emparelhamentos
    Emparelhamentos
    Document1 page
    Emparelhamentos
    Tiago André Arena da Silva
    No ratings yet
  • Eulerianos
    Eulerianos
    Document1 page
    Eulerianos
    Tiago André Arena da Silva
    No ratings yet
  • ETG
    ETG
    Document126 pages
    ETG
    Tiago André Arena da Silva
    No ratings yet