You are on page 1of 75

Disciplina de Estatstica

Introduo

Prof. Sandra Denisen do Rocio Marcelino


sandra.marcelino@pucpr.br

Copyright2017 Marcelino, Sandra D. R. Todos os direitos reservados. Nenhum texto pode ser reproduzido sem prvia autorizao.
Introduo Estatstica

A Estatstica pode ser considerada


como uma metodologia quantitativa que
se preocupa em coletar, organizar,
analisar e interpretar um conjunto de
observaes, visando a tomada de
decises.

Copyright2017 Marcelino, Sandra D. R. Todos os direitos reservados. Nenhum texto pode ser reproduzido sem prvia autorizao.
Objetivos

O objetivo dos estudos estatsticos reside naqueles


fenmenos que se referem principalmente a um
conjunto muito numeroso de indivduos
semelhantes quanto a pelo menos uma
caracterstica especfica.

Pode-se dizer que toda cincia que trabalha com


dados experimentais necessita da Estatstica como
mtodo de anlise desses dados, para que o
pesquisador possa tirar concluses que tenham
validade cientfica.

Copyright2017 Marcelino, Sandra D. R. Todos os direitos reservados. Nenhum texto pode ser reproduzido sem prvia autorizao.
Conceitos Fundamentais

Populao: entende-se por populao a


totalidade dos indivduos que se deseja investigar
quanto a pelo menos uma caracterstica
especfica, ou seja, a totalidade dos elementos
que esto sob discusso e dos quais se deseja
informao.

As medidas populacionais, denominadas


parmetros, so, em geral desconhecidas, e
representadas, geralmente, por letras gregas.

Copyright2017 Marcelino, Sandra D. R. Todos os direitos reservados. Nenhum texto pode ser reproduzido sem prvia autorizao.
Conceitos Fundamentais

Amostra: a parte selecionada da totalidade de


observaes abrangidas pela populao, atravs
da qual se faz inferncia sobre as caractersticas da
populao.
Ressalta-se que tal parcela deve ser selecionada
mediante tcnicas de amostragem, de tal forma que
a amostra seja representativa, ou seja, preserve as
caractersticas da populao.
As medidas amostrais so denominadas
estimativas e geralmente representadas por
caracteres arbicos.

Copyright2017 Marcelino, Sandra D. R. Todos os direitos reservados. Nenhum texto pode ser reproduzido sem prvia autorizao.
Medidas Estatsticas

Populacionais Amostrais
Medidas
(Parmetros) (Estimadores)

Mdia
x
Varincia 2 s2

Desvio padro s

Tamanho N n

Proporo P p

Copyright2017 Marcelino, Sandra D. R. Todos os direitos reservados. Nenhum texto pode ser reproduzido sem prvia autorizao.
Amostragem
Casual Simples
os casos so retirados ao acaso de um determinado
universo para compor a amostra
Sistemtica
os casos so retirados no por acaso, mas sim por um
sistema. Ex..: 2% dos pronturios de um determinado
registro para checagem
Estratificada
os casos so obtidos de diferentes subgrupos
existentes em uma populao
Dentre outras ...

Copyright2017 Marcelino, Sandra D. R. Todos os direitos reservados. Nenhum texto pode ser reproduzido sem prvia autorizao.
Tamanho da amostra x Significncia

Pouca Significncia
Amostras Pequenas Restries em Testes (testes
(< de 30 casos ou no paramtricos)
observaes) Concluses menos precisas

Significncia positiva
Amostras Grandes Vrias opes de Testes (no
(> de 30 casos ou paramtrico e os paramtricos)
observaes)
Concluses mais precisas

Copyright2017 Marcelino, Sandra D. R. Todos os direitos reservados. Nenhum texto pode ser reproduzido sem prvia autorizao.
Conceitos Fundamentais
Os dados estatsticos so obtidos mediante um
processo que envolve a observao ou
mensurao de caractersticas de um conjunto,
tais como renda anual numa comunidade, escores
de testes, quantidade de caf por xcara servida por
uma mquina automtica, temperatura de uma
cmera fria, resistncia ruptura de fibras de
nilon, entre outros.

Tais caractersticas so denominadas variveis,


pois originam valores que tendem a apresentar
certa variabilidade quando so efetuadas
sucessivas medidas.

Copyright2017 Marcelino, Sandra D. R. Todos os direitos reservados. Nenhum texto pode ser reproduzido sem prvia autorizao.
Tipos de variveis

A definio das variveis avaliadas deve ser


estabelecida antes da coleta de dados.
As variveis podem ser qualitativas ou
quantitativas.

Variveis qualitativas: corresponde s


caractersticas no numricas.

Variveis quantitativas: corresponde s


caractersticas numricas: valores inteiros ou
definidos em um intervalo.

Copyright2017 Marcelino, Sandra D. R. Todos os direitos reservados. Nenhum texto pode ser reproduzido sem prvia autorizao.
Exemplos de variveis
qualitativas
Categrica ou Nominal
categorias no ordenadas
Tipo de transporte
Estado civil
Ordinal
Categorias ordenadas com intervalos no quantificveis
Grau de satisfao
Grau de instruo
Estatura

Copyright2017 Marcelino, Sandra D. R. Todos os direitos reservados. Nenhum texto pode ser reproduzido sem prvia autorizao.
Tipos de variveis
As variveis quantitativas podem ser discretas
ou contnuas, de acordo com a natureza dos
dados.

Variveis discretas: so caractersticas numricas


que assumem valores inteiros e geralmente
referem-se a dados de contagem.

Variveis contnuas: so caractersticas numricas


que assumem valores dentro de um intervalo dos
nmeros reais.

Copyright2017 Marcelino, Sandra D. R. Todos os direitos reservados. Nenhum texto pode ser reproduzido sem prvia autorizao.
Exemplos de variveis
quantitativas
Discretas
Geralmente dados de contagem
N de alunos, de cursos, de pacientes, de livros, ...

Contnuas
Ordenadas em intervalos conhecidos
Presso arterial,
Peso, altura
Tempo, dimetro, volume
Temperatura, vazo

Copyright2017 Marcelino, Sandra D. R. Todos os direitos reservados. Nenhum texto pode ser reproduzido sem prvia autorizao.
Conceitos Fundamentais

Entende-se por observao cada valor coletado (ou


observado), seja na amostra ou na populao.

Exemplo: Suponha que se tenha interesse em


avaliar o teor alcolico de dez tipos de vinho. Para
tanto considerou-se 50 garrafas de cada marca.
Tem-se aqui 500 observaes, pois ser coletado o
teor alcolico de 500 garrafas de vinho.

Copyright2017 Marcelino, Sandra D. R. Todos os direitos reservados. Nenhum texto pode ser reproduzido sem prvia autorizao.
Escolha do Teste Estatstico
Escalas das Variveis Discreta Ordinal
(por postos)
Contnua
Nominal

Testes Paramtricos Testes No-Paramtricos


Testes indicados

Teste Qui-quadrado
Teste t Teste Exato de Fisher
Teste t para Teste de Wilcoxon
Teste de Mann Whitney
amostras pareadas
Teste de McNemar
Teste F Teste de Kruskal Wallis

Copyright2017 Marcelino, Sandra D. R. Todos os direitos reservados. Nenhum texto pode ser reproduzido sem prvia autorizao.
Disciplina de Estatstica

Estatstica Descritiva

Prof. Sandra Denisen do Rocio Marcelino


sandra.marcelino@pucpr.br

Copyright2017 Marcelino, Sandra D. R. Todos os direitos reservados. Nenhum texto pode ser reproduzido sem prvia autorizao.
Estatstica Descritiva

Tabelas:
Distribuio de Frequncias
Dupla entrada ou cruzamento de variveis

Grficos:
Barras, colunas, histograma
Pontos, disperso, box plot
Setores, radar

Copyright2017 Marcelino, Sandra D. R. Todos os direitos reservados. Nenhum texto pode ser reproduzido sem prvia autorizao.
Estatstica Descritiva

Medidas resumo:
Tendncia central

Posio

Disperso

Assimetria

Curtose

Copyright2017 Marcelino, Sandra D. R. Todos os direitos reservados. Nenhum texto pode ser reproduzido sem prvia autorizao.
Tabelas: variveis qualitativas

Variveis qualitativas: corresponde s


caractersticas no numricas.

possvel resumir as categorias ou atributos


assumidos pela varivel em uma tabela de
distribuio de frequncias, listando as realizaes
da varivel e as respectivas vezes (frequncias) que
tais realizaes ocorrem.

Copyright2017 Marcelino, Sandra D. R. Todos os direitos reservados. Nenhum texto pode ser reproduzido sem prvia autorizao.
Anlise Exploratria: Exemplo de
Tabelas de Distribuio de Frequncias

Vendas de bebidas leves em um dia


Frequncias Simples
Tipo
Vendas Absolutas Vendas Relativas

Cola 600 60%


Limo 200 20%
Laranja 100 10%
Uva 50 5%
Cereja 40 4%
Outros 10 1%
Total 1000 100%

Copyright2017 Marcelino, Sandra D. R. Todos os direitos reservados. Nenhum texto pode ser reproduzido sem prvia autorizao.
Anlise Exploratria: Exemplo de
Grficos de Frequncias

Copyright2017 Marcelino, Sandra D. R. Todos os direitos reservados. Nenhum texto pode ser reproduzido sem prvia autorizao.
Tabelas: variveis quantitativas

Variveis discretas: Se a varivel de interesse


discreta, possvel construir uma tabela de
frequncias de valores no agrupados em
classes, ou seja, os valores que a varivel
assumiu so listados e a cada ocorrncia
associado o nmero de observaes referentes
quela realizao.

Uma distribuio de frequncias em classe tambm


pode ser construda para variveis discretas, quando
esta apresentar muitas realizaes distintas.

Copyright2017 Marcelino, Sandra D. R. Todos os direitos reservados. Nenhum texto pode ser reproduzido sem prvia autorizao.
Anlise Exploratria: Exemplo de
Tabela de Distribuio de Frequncias

N. de livros lidos por semana


N. de livros (xi) Frequncia (fi)

0 16
1 2
2 3
3 2
4 2
Total 25

Copyright2017 Marcelino, Sandra D. R. Todos os direitos reservados. Nenhum texto pode ser reproduzido sem prvia autorizao.
Anlise Exploratria:
Exemplos de grfico para varivel discreta

Copyright2017 Marcelino, Sandra D. R. Todos os direitos reservados. Nenhum texto pode ser reproduzido sem prvia autorizao.
Tabelas: variveis quantitativas

Variveis contnuas: so caractersticas


numricas que assumem valores dentro de um
intervalo dos nmeros reais.

possvel construir uma tabela de frequncias de


valores agrupados em classes, onde a frequncia
de uma classe o nmero de observaes que se
enquadram entre os limites daquela classe.

Copyright2017 Marcelino, Sandra D. R. Todos os direitos reservados. Nenhum texto pode ser reproduzido sem prvia autorizao.
Anlise Exploratria: Grficos e
Tabelas de Distribuio de Frequncias
Alturas N de
pessoas
1,60 |- 1,66 2
1,66 |- 1,72 6
1,72 |- 1,78 7
1,78 |- 1,84 7
1,84 |- 1,90 5
1,90 |- 1,96 1
Total 28

Copyright2017 Marcelino, Sandra D. R. Todos os direitos reservados. Nenhum texto pode ser reproduzido sem prvia autorizao.
Definio do Nmero de Classes

Valores Recomendados para n de classes (k)

N de dados (n) N de classes (k)

Menos de 50 5a7

De 50 a 100 6 a 10

De 100 a 250 7 a 12
Acima de 250 10 a 20

O nmero de classes pode ainda ser calculado pelo critrio de Sturges, que
consiste em calcular k como segue:

k = 1 + 3,32 log (n), onde n o nmero de observaes.

Copyright2017 Marcelino, Sandra D. R. Todos os direitos reservados. Nenhum texto pode ser reproduzido sem prvia autorizao.
Exemplo

Considere, como exemplo, um conjunto de


dados fictcios referente ao tempo (em minutos)
para realizao de certa atividade acadmica,
em um grupo de 35 alunos, de ambos os
gneros.

Copyright2017 Marcelino, Sandra D. R. Todos os direitos reservados. Nenhum texto pode ser reproduzido sem prvia autorizao.
Exemplo

Tempo (minutos) para a realizao de certo


exerccio.
4 4 6 12 24 35 24
6 5 26 15 26 21 26
11 6 29 16 28 26 26
12 8 45 18 29 37 37
18 15 46 20 36 38 38

Copyright2017 Marcelino, Sandra D. R. Todos os direitos reservados. Nenhum texto pode ser reproduzido sem prvia autorizao.
Exemplo ( dados ordenados)

Tempo (minutos) para a realizao de certo


exerccio.
4 4 5 6 6 6 8
11 12 12 15 15 16 18
18 20 21 24 24 26 26
26 26 26 28 29 29 35
36 37 37 38 38 45 46

Copyright2017 Marcelino, Sandra D. R. Todos os direitos reservados. Nenhum texto pode ser reproduzido sem prvia autorizao.
Distribuio de frequncias
No exemplo em questo, tem-se n = 35.
Da: k = 1 + 3,32 log (35)=6,13
Considere k = 6 classes.

Os valores extremos so dados por:


Valor mnimo = 4 mx mn 46 4
h 7
Valor mximo = 46 k 6
Onde h representa a amplitude (tamanho) de cada classe

Considere ento a tabela de distribuio de frequncia, com 6


classes de 7 minutos de intervalo, como segue:

Copyright2017 Marcelino, Sandra D. R. Todos os direitos reservados. Nenhum texto pode ser reproduzido sem prvia autorizao.
Tabela de distribuio de
frequncias

Tempo (min) para a realizao de certa atividade acadmica

Tempo n de alunos
4 |__ 11 7
11 |__ 18 6
18 |__ 25 6
25 |__ 32 8
32 |__ 39 6
39 |__| 46 2
Total 35

Copyright2017 Marcelino, Sandra D. R. Todos os direitos reservados. Nenhum texto pode ser reproduzido sem prvia autorizao.
Cruzando Informaes
Se considerado o fato que foram avaliados alunos de ambos os
gneros, pode-se ter interesse em averiguar qual realiza mais
rapidamente o exerccio. Uma diviso da tabela pode ser, ento,
conveniente. (Vermelho=homens, preto=mulheres)

Tempo Homens Mulheres N de


alunos
4 |__ 11 2 5 7
11 |__ 18 2 4 6
18 |__ 25 3 3 6
25 |__ 32 5 3 8
32 |__ 39 4 2 6
39 |__| 46 2 0 2
Total 18 17 35

Copyright2017 Marcelino, Sandra D. R. Todos os direitos reservados. Nenhum texto pode ser reproduzido sem prvia autorizao.
Anlise Exploratria:
Variveis Discretas ou Contnuas

Medidas de tendncia central


Mdia

Mediana

Medidas de posio
Quartil

Decil

Percentil

Copyright2017 Marcelino, Sandra D. R. Todos os direitos reservados. Nenhum texto pode ser reproduzido sem prvia autorizao.
Mdia
A mdia aritmtica simples de um conjunto de n
valores x1, x2, ... ,xn definida pelo quociente entre a
soma dos valores do conjunto e o nmero total de
valores, ou seja:
n

x i
x i 1
n

onde n o total de observaes, ou seja, o


tamanho da amostra, e
xi cada valor observado.

Copyright2017 Marcelino, Sandra D. R. Todos os direitos reservados. Nenhum texto pode ser reproduzido sem prvia autorizao.
Mdia
Se o conjunto de dados corresponde populao,
ento a mdia deve ser representada por . No
entanto, mantm-se o procedimento de clculo,
substituindo n por N, ou seja:
n

X i
i 1
N

onde N o tamanho da populao e


Xi cada valor observado.

Copyright2017 Marcelino, Sandra D. R. Todos os direitos reservados. Nenhum texto pode ser reproduzido sem prvia autorizao.
Mediana
Mediana: geometricamente, o valor que divide a
distribuio em duas partes iguais.

valor central do conjunto de dados

50% 50%

Me

Importante ressaltar que, para a obteno da mediana, os


dados devem estar ordenados.

Copyright2017 Marcelino, Sandra D. R. Todos os direitos reservados. Nenhum texto pode ser reproduzido sem prvia autorizao.
Exemplo

Considere, como exemplo, um conjunto de


dados fictcios referente ao tempo (em
minutos) para realizao de certa atividade
acadmica, em um grupo de 35 alunos, de
ambos os gneros.

Copyright2017 Marcelino, Sandra D. R. Todos os direitos reservados. Nenhum texto pode ser reproduzido sem prvia autorizao.
Exemplo ( dados ordenados)

Tempo (minutos) para a realizao de certo exerccio.

4 4 5 6 6 6 8
11 12 12 15 15 16 18
18 20 21 24 24 26 26
26 26 26 28 29 29 35
36 37 37 38 38 45 46

Valor que ocupa a


posio central
Copyright2017 Marcelino, Sandra D. R. Todos os direitos reservados. Nenhum texto pode ser reproduzido sem prvia autorizao.
Tempo para a realizao
de certa atividade

Mdia

4 6 11 ...37 773
x 22,0857 min
35 35

Mediana: 35 valores, logo o 18 o valor central.


Med = 24 min

Copyright2017 Marcelino, Sandra D. R. Todos os direitos reservados. Nenhum texto pode ser reproduzido sem prvia autorizao.
Quantis
A mediana, geometricamente, divide a rea do histograma
em duas partes iguais. Por extenso do conceito da
mediana, se o interesse for dividir a rea do histograma em
quatro, dez ou cem partes iguais, tem-se interesse em
encontrar os valores dos quartis, decis e percentis,
respectivamente.

Copyright2017 Marcelino, Sandra D. R. Todos os direitos reservados. Nenhum texto pode ser reproduzido sem prvia autorizao.
Quartil

Os quartis, Qi, de um conjunto de n valores x1, x2, ... ,xn ,


ordenados, so representados pelos valores de posio
in
do 4 conjunto, onde i a ordem do quartil e n a
quantidade de observaes no conjunto de valores.

25% 25%

25% 25%

Q1 Q2 Q3

Copyright2017 Marcelino, Sandra D. R. Todos os direitos reservados. Nenhum texto pode ser reproduzido sem prvia autorizao.
Exemplo ( dados ordenados)

Tempo (minutos) para a realizao de certo exerccio.

4 4 5 6 6 6 8
11 12 12 15 15 16 18
18 20 21 24 24 26 26
26 26 26 28 29 29 35
36 37 37 38 38 45 46

Q1 Q3
Valor que ocupa a
posio central: Q2
Copyright2017 Marcelino, Sandra D. R. Todos os direitos reservados. Nenhum texto pode ser reproduzido sem prvia autorizao.
Diagrama Box Plot

Limite superior
(Ls) ou valor
mximo

Q3
Q2 dq (Q3 Q1 )
Q1

Limite inferior
(Li) ou valor
mnimo

Copyright2017 Marcelino, Sandra D. R. Todos os direitos reservados. Nenhum texto pode ser reproduzido sem prvia autorizao.
Pontos discrepantes

So os pontos que se localizam fora dos limites calculados por:

Limite superior:
Ls Q3 1,5(Q3 Q1 )

Limite inferior:

Li Q1 1,5(Q3 Q1 )

Copyright2017 Marcelino, Sandra D. R. Todos os direitos reservados. Nenhum texto pode ser reproduzido sem prvia autorizao.
Exemplo
Posio Tempo Posio Tempo
Q1 12
1 4 18 24
2 4 19 24 Q2 24
3 5 20 26 Q3 29
4 6 21 26
5 6 22 26
6 6 23 26 Limites :
7 8 24 26
8 11 25 28 Li 12 1,5(29 12) 13,5
9 12 26 29
10 12 27 29 Ls 29 1,5( 29 12) 54,5
11 15 28 35
12 15 29 36
13 16 30 37
14 18 31 37
15 18 32 38
16 20 33 38 No h, no conjunto,
17 21 34 45 pontos discrepantes.
35 46

Copyright2017 Marcelino, Sandra D. R. Todos os direitos reservados. Nenhum texto pode ser reproduzido sem prvia autorizao.
Exemplo
Medidas

Q1 12

Q2 24

Q3 29

Min 4
Max 46

Copyright2017 Marcelino, Sandra D. R. Todos os direitos reservados. Nenhum texto pode ser reproduzido sem prvia autorizao.
Pontos discrepantes?

Para o conjunto em questo no so observados


pontos discrepantes, uma vez que no so
observados pontos excedendo os limites: o
menor de 4 e o maior valor de 46 minutos esto
dentro dos limites Li = -13,5 e Ls = 54,5.

Copyright2017 Marcelino, Sandra D. R. Todos os direitos reservados. Nenhum texto pode ser reproduzido sem prvia autorizao.
Anlise Exploratria:
Variveis Discretas ou Contnuas

Medidas de disperso

Amplitude total

Varincia

Desvio padro

Coeficiente de variao

Copyright2017 Marcelino, Sandra D. R. Todos os direitos reservados. Nenhum texto pode ser reproduzido sem prvia autorizao.
Amplitude total

A amplitude total, (At), de um conjunto de n valores, a


diferena entre os valores extremos assumidos pela varivel
no conjunto, em estudo, e dada por:

At mximo mnimo

A unidade da amplitude corresponde unidade dos dados,


mas apresenta pouca preciso, uma vez que no detecta o
comportamento dos dados.

Copyright2017 Marcelino, Sandra D. R. Todos os direitos reservados. Nenhum texto pode ser reproduzido sem prvia autorizao.
Varincia
A varincia amostral s2 de um conjunto de valores
x1, x2, ..., xn, a mdia aritmtica dos quadrados dos
desvios desses valores em relao sua mdia
aritmtica.

x x
n n
2
i x 2
i nx 2
s2 i 1
i 1
n 1 n 1
Avalia a variabilidade de um conjunto de dados, mas
tem sua escala ao quadrado da escala considerada,
dificultando a interpretao.
A varincia populacional representada por 2, e no
clculo, deve ser considerado n como denominador .

Copyright2017 Marcelino, Sandra D. R. Todos os direitos reservados. Nenhum texto pode ser reproduzido sem prvia autorizao.
Varincia
A varincia amostral s2 de um conjunto de valores
x1, x2, ..., xn, a mdia aritmtica dos quadrados dos
desvios desses valores em relao sua mdia
aritmtica.

x x
n n
2
i x 2
i nx 2
s2 i 1
i 1
n 1 n 1
Avalia a variabilidade de um conjunto de dados, mas
tem sua escala ao quadrado da escala considerada,
dificultando a interpretao.
A varincia populacional representada por 2, e no
clculo, deve ser considerado n como denominador .

Copyright2017 Marcelino, Sandra D. R. Todos os direitos reservados. Nenhum texto pode ser reproduzido sem prvia autorizao.
Desvio Padro
O desvio padro a raiz quadrada positiva da varincia:

A unidade do desvio padro corresponde unidade dos


dados, da sua importncia prtica.

Desvio padro populacional: 2

Desvio padro amostral:


s s 2

Copyright2017 Marcelino, Sandra D. R. Todos os direitos reservados. Nenhum texto pode ser reproduzido sem prvia autorizao.
Interpretao do Desvio Padro
Quando uma curva de frequncia representativa da srie
simtrica, pode-se considerar:

34% 34%

13,5% 13,5%

2% 2%
0,5% 0,5%

3 2 2 3

Copyright2017 Marcelino, Sandra D. R. Todos os direitos reservados. Nenhum texto pode ser reproduzido sem prvia autorizao.
Desvio Padro
Curvas com diferentes desvios

Copyright2017 Marcelino, Sandra D. R. Todos os direitos reservados. Nenhum texto pode ser reproduzido sem prvia autorizao.
Coeficiente de Variao
O coeficiente de variao avalia a representatividade do
desvio padro em relao mdia:

s
cv
x
uma medida adimensional e, portanto, pode ser
interpretada como percentual, possibilitando a
comparao da variabilidade de conjuntos em diferentes
unidades de medida.

Copyright2017 Marcelino, Sandra D. R. Todos os direitos reservados. Nenhum texto pode ser reproduzido sem prvia autorizao.
Exemplo

Tempo (minutos) para a realizao de certo exerccio.

4 4 6 12 24 35 24
6 5 26 15 26 21 26
11 6 29 16 28 26 26
12 8 45 18 29 37 37
18 15 46 20 36 38 38

Copyright2017 Marcelino, Sandra D. R. Todos os direitos reservados. Nenhum texto pode ser reproduzido sem prvia autorizao.
Tempo (em minutos) para a realizao
de certa atividade acadmica

Varincia:

s
2 4 2
6 2
... 37 2
35 * 22,0857 2
35 1
22.119 17.072,24
s2 148,4341 min 2
34

Desvio Padro:

s 148,4341 12,1834 min

Copyright2017 Marcelino, Sandra D. R. Todos os direitos reservados. Nenhum texto pode ser reproduzido sem prvia autorizao.
Interpretao do desvio
padro do exemplo

34% 34%

13,5% 13,5%

2% 2%
0,5% 0,5%

-14 -2 10 22 34 46 58

22 12 10

Copyright2017 Marcelino, Sandra D. R. Todos os direitos reservados. Nenhum texto pode ser reproduzido sem prvia autorizao.
Interpretao do exemplo

Aproximadamente 68% dos alunos necessita de


10 a 34 minutos para a realizao da atividade;

Um percentual de 0,5% precisa de mais de 58


minutos;

Coeficiente de variao de 0,5516, indicando alta


variabilidade.
12,1834
cv 0,5516
22,0857
Copyright2017 Marcelino, Sandra D. R. Todos os direitos reservados. Nenhum texto pode ser reproduzido sem prvia autorizao.
Anlise Exploratria:
Variveis Discretas ou Contnuas

Medidas de assimetria

Coeficiente de assimetria de Pearson

Coeficiente momento de assimetria

Medidas de curtose

Coeficiente momento de curtose

Copyright2017 Marcelino, Sandra D. R. Todos os direitos reservados. Nenhum texto pode ser reproduzido sem prvia autorizao.
Assimetria

A assimetria definida como o grau de desvio,


distoro ou afastamento da simetria, de uma
distribuio. Quantitativamente, o grau de desvio
ou afastamento pode ser determinado pelas
medidas denominadas de coeficientes de
assimetria.

Copyright2017 Marcelino, Sandra D. R. Todos os direitos reservados. Nenhum texto pode ser reproduzido sem prvia autorizao.
Assimetria
Mtodo de Comparao entre as Medidas de Tendncia Central:
permite a identificao do tipo de assimetria, mas no permite
estabelecer at que ponto a curva analisada se desvia da simetria.

x Me Assimetria positiva
x Me Curva simtrica
x Me Assimetria negativa

No exemplo: x 22,0857 me 24 indicando


assimetria negativa.

Ressalta-se, porm, que uma maneira imprecisa de avaliar a


assimetria

Copyright2017 Marcelino, Sandra D. R. Todos os direitos reservados. Nenhum texto pode ser reproduzido sem prvia autorizao.
Tipos de Assimetria
Assimetria negativa

Assimetria nula

Assimetria positiva
a3<0

a3=0

a3>0

Copyright2017 Marcelino, Sandra D. R. Todos os direitos reservados. Nenhum texto pode ser reproduzido sem prvia autorizao.
Assimetria

O 2 coeficiente de assimetria de Pearson (e2), uma


medida adimensional de assimetria, definida por:

3x Me
e2
s
onde :
x a mdia aritmtica do conjunto;
Me a mediana do conjunto e
s o desvio padro.

Copyright2017 Marcelino, Sandra D. R. Todos os direitos reservados. Nenhum texto pode ser reproduzido sem prvia autorizao.
Assimetria

Quanto mais distante o coeficiente e2 estiver do valor


de referncia, mais acentuada a assimetria.

Se e 0 Assimetria positiva
2
e2 0 Curva simtrica
e 0 Assimetria negativa
2

Copyright2017 Marcelino, Sandra D. R. Todos os direitos reservados. Nenhum texto pode ser reproduzido sem prvia autorizao.
Assimetria

Considerando o exemplo anterior:

3x Me 3(22,0857 24)
e2
s 12,1834

e2 0,4714

Assimetria negativa fraca a moderada

Copyright2017 Marcelino, Sandra D. R. Todos os direitos reservados. Nenhum texto pode ser reproduzido sem prvia autorizao.
Exemplo
Analisando as
medidas, tem-se a
mdia menor que a
mediana, portanto,
assimetria negativa.

J o box plot indica


assimetria positiva
muito fraca.

Necessita-se de um
coeficiente mais
preciso

Copyright2017 Marcelino, Sandra D. R. Todos os direitos reservados. Nenhum texto pode ser reproduzido sem prvia autorizao.
Assimetria
Desejando avaliar a assimetria com maior preciso,
pode-se calcular o coeficiente momento de assimetria
(a3), outra medida adimensional de assimetria, definida
por:
m
3 3
3
a
s
onde :
s o desvio padro
m3 o terceiro momento centrado na mdia, dado
por: n 3

x x i
m3 i 1
n
Copyright2017 Marcelino, Sandra D. R. Todos os direitos reservados. Nenhum texto pode ser reproduzido sem prvia autorizao.
Assimetria
A interpretao do coeficiente

Se a 0 Assimetria positiva
3
a3 0 Curva simtrica
a 0
3 Assimetria negativa

Copyright2017 Marcelino, Sandra D. R. Todos os direitos reservados. Nenhum texto pode ser reproduzido sem prvia autorizao.
Exemplo
Tempo xi x
3
Tempo xi x
3
Para o conjunto em
questo tem-se:
4 -5915,7117 24 7,0149
4 -5915,7117 26 59,9732
x 22,0857; s 12,1834
5 -4987,6896 26 59,9732
6 -4162,1819 26 59,9732
3
n
6 26
xi x
-4162,1819 59,9732
6 -4162,1819 26 59,9732 9835,2441
8 -2794,7092 28 206,8745 m3 i 1
11 -1362,3574 29 330,5537
n 35
12
12
-1025,9353
-1025,9353
29
35
330,5537
2153,8288
m3 281,0070
15 -355,7549 36 2693,9079
15 -355,7549 37 3317,4728
m3 281,0070
16 -225,3900 37 3317,4728 a3 3 3
0,1554
18 -68,2031 38 4030,5235 s 12,1834
18 -68,2031 38 4030,5235
20 45
-9,0733 12031,4777
Indicando assimetria
21 -1,2798 46 13676,4141
levemente positiva
24 7,0149

Copyright2017 Marcelino, Sandra D. R. Todos os direitos reservados. Nenhum texto pode ser reproduzido sem prvia autorizao.
Curtose
Desejando avaliar a curtose, ou achatamento da
curva em relao distribuio normal, pode
calcular o coeficiente momento de curtose (a4),
definido por:
m4
a4 4
onde : s
s o desvio padro.
m4 o quarto momento centrado na mdia, dado por:
n 4

x x i
m4 i 1
n
Copyright2017 Marcelino, Sandra D. R. Todos os direitos reservados. Nenhum texto pode ser reproduzido sem prvia autorizao.
Curtose
A interpretao do coeficiente

a 3 Distribuio platicrtica
Se 4
a 4 3 Distribuio mesocrtica
a 3 Distribuio leptocrtica
4
Distribuio platicrtica
Distribuio mesocrtica
Distribuio leptocrtica

a4 < 3
a4 = 3
a4 > 3

Copyright2017 Marcelino, Sandra D. R. Todos os direitos reservados. Nenhum texto pode ser reproduzido sem prvia autorizao.
Exemplo
Tempo xi x 4 Tempo xi x 4 Para o conjunto em questo
tem-se:
4 106989,87 24 13,43
4 106989,87 26 234,75
x 22,0857; s 12,1834
5 85218,24 26 234,75
6 66951,67 26 234,75 4
n
6 66951,67 26 234,75
xi x
6 26 i 1 1484496,45
m4
66951,67 234,75
8 39365,48 28 1223,51
n 35
11 15102,70 29 2285,54
12 10347,29 29 2285,54 m4 42414,18
12 10347,29 35 27815,16
15 2520,78 36 37483,80
m4 42414,18
15 2520,78 37 49477,74
a4 4
4
1,9250
16 1371,66 37 49477,74 s 12,1834
18 278,66 38 64142,90
18 278,66 38 64142,90 Indicando que a distribuio
20 18,92 45 275692,72
platicrtica, portanto, a curva
mais achatada que a curva
21 1,39 46 327061,67
normal
24 13,43

Copyright2017 Marcelino, Sandra D. R. Todos os direitos reservados. Nenhum texto pode ser reproduzido sem prvia autorizao.
Referncias Bibliogrficas

BUSSAB, Wilton de Oliveira; MORETTIN, Pedro A. Estatstica


bsica. 6. Ed. So Paulo: Saraiva 2010.

DOWNING, Douglas; CLARK, Jeff. Estatstica aplicada. So


Paulo: Saraiva, 1998.

MORETTIN, Pedro A.; BUSSAB, Wilton de Oliveira. Estatstica


bsica. 6. ed., rev. e atual. So Paulo: Saraiva, 2010.

Copyright2017 Marcelino, Sandra D. R. Todos os direitos reservados. Nenhum texto pode ser reproduzido sem prvia autorizao.