Professional Documents
Culture Documents
o conjunto de mtodos para organizao, apresentao e descrio de dados representativos do comportamento de uma varivel, onde se utilizam tabelas, grficos e medidas que resumem a distribuio desta varivel.
VARIVEL
As variveis so caractersticas que podem ser observadas ou medidas em cada elemento pesquisado (seja por censo ou amostragem, levantamento ou experimento), sob as mesmas condies. Para cada varivel, para cada elemento pesquisado, em um dado momento, h um e apenas um resultado possvel.
POPULAO
A coleo de todas as medidas oriundas de uma varivel chamada de POPULAO. As medidas utilizadas para descrever ou caracterizar estatisticamente uma populao so chamadas de PARMETROS, representados por letras gregas ( , )
AMOSTRA
Como em geral as populaes so muito grandes, se faz necessrio o uso de amostras para represent-las. Estas so formadas por uma frao da populao em estudo. As estimativas dos parmetros calculados a partir das amostras so chamadas genericamente de ESTATSTICAS e so representadas por letras latinas (x, s ...)
O conjunto de dados que descreve o comportamento de uma varivel pode ser estudado e representado na forma de distribuio de freqncias
DADOS BRUTOS 17,9 17,9 20,0 18,0 17,9 18,9 17,6 18,5 18,8 17,7 23,0 19,4 23,4 22,6 20,2 22,1 25,0 22,0 24,0 20,2 16,1 16,2 16,8 16,7 16,2 17,2 15,7 15,7 24,7 28,0 18,1 19,8 26,3 18,4 21,0 20,1 18,2 17,5 18,6 17,1 18,0 20,5 18,5 19,2 18,5 20,9 23,5 19,2 25,0 21,1
Intervalo Freqncia
15 17 19 21 23 25 27
17 19 21 23 25 27 29
7 19 11 5 6 1 1
DISTRIBUIO NORMAL
CURVA DE GAUSS OU DE LAPLACE a distribuio terica de probabilidade de variveis contnuas mais utilizada
IMPORTNCIA
1. 2. Inmeros fenmenos contnuos podem ser representados atravs dela Vrios mtodos estatsticos se ajustam melhor a esta distribuio que as demais. Pode-se utiliz-la, por exemplo, para calcular a probabilidade de ocorrncia de uma srie de eventos naturais Ela a base para a inferncia estatstica clssica
3.
1 Yi = e 2
( X i )2
2 2
PROPRIEDADES
Independentemente dos valores da mdia e do desvio padro, a rea total entre a curva e o eixo das abscissas igual a 1, permitindo identificar probabilidades de eventos
Existem trs medidas bsicas que refletem a tendncia central de uma distribuio de freqncias: Mdia Moda Mediana
MDIA
a soma de todos os resultados dividida pelo nmero total de casos.
x=
xi
i =1
x ifi x= i =1 N ou x = x i pi
i =1 N
Um dos problemas da utilizao da mdia que, por levar em conta TODOS os valores do conjunto, ela pode ser distorcida por valores discrepantes (outliers) que nele existam. importante ento interpretar corretamente o valor da mdia.
MODA
o evento ou categoria de eventos que ocorre com maior freqncia, indicando o valor ou categoria mais provvel.
Exemplo: 2 4 7 12 23 8 11 4 12 22 7 12 9 10
7 6 5 4 3 2 1 0 12 13 14
Moda
15
16
17
18
Mais
Classe modal
Li= 7
Classe de freqncia 0-1 1-2 2-3 3-4 4-5 5-6 6-7 7-8 8-9 9 -10
m0
d1 h = Li + d1 + d 2
m0
2 = 7+ 1 = 7 , 66 2 +1
MEDIANA
o valor da varivel a partir do qual metade dos casos se encontra acima dele e metade se encontra abaixo. Se o n de observaes for impar, a mediana ser o valor central da distribuio; se o n for par, a mediana ser a mdia dos dois valores centrais. Pouco afetada por eventuais valores discrepantes existentes no conjunto (que costumam distorcer substancialmente o valor da mdia).
Exemplo
Mantendo o mesmo exemplo anterior, mas com as notas ordenadas: 1,0 2,0 3,0 3,0 4,0 4,0 5,0 5,0 5,0 5,0 6,0 6,5 7,0 7,0 7,0 7,5 8,0 8,0 9,5 9,5 O dcimo valor da varivel : 5,0 O dcimo primeiro valor : 6,0 A mediana um valor situado entre 5,0 e 6,0
n Fa = Li + 2 h md f md
Exemplo
Classe de freqncia 0-1 1-2 2-3 3-4 4-5 5-6 6-7 7-8 8-9 9 -10 Freqncia Absoluta 0 1 1 2 2 fmd 3 2 4 3 2 Freqncia Acumulada 0 1 2 Fa 4 6 9 11 15 18 20
Classe da mediana
n Fa 2 h md = Li + f md
md
Li= 6
hmd= 7-6 = 1
md
20 9 2 =6+ 1 = 6 ,5 2
MEDIDAS DE DISPERSO
So medidas da disperso de um conjunto de dados em torno da mdia, ou seja, da maior ou menor variabilidade dos resultados obtidos. Elas permitem identificar at que ponto os resultados se concentram ou no ao redor da tendncia central de um conjunto de observaes.
Existem vrias medidas para avaliar a disperso de um conjunto de dados. As principais so: 1. 2. 3. 4. Amplitude ou Intervalo Varincia Desvio Padro Coeficiente de Variao
Amplitude
a diferena entre o maior e o menor valor que foi observado para a varivel, servindo para caracterizar a abrangncia do estudo.
Varincia
a soma dos quadrados dos desvios de cada ponto em torno da mdia aritmtica. Caracteriza a disperso dos pontos de uma amostra potencializando as diferenas.
= ( xi xm ) i =1
2
s = ( xi xm )
2 i =1
N
Varincia Populacional ou
n 1
Varincia Amostral
Exemplo:
Calcular a varincia amostral do conjunto 1, 2, 3, 4, 5 n=5 xm = 3
OBS: a unidade da varincia igual a unidade de medida das observaes elevada ao quadrado.
Desvio Padro
O desvio padro a raiz quadrada da varincia.
Desvio-padro =
( Xi Xm) 2 n 1
Coeficiente de Variao
uma medida de disperso relativa que indica a variabilidade da amostra em relao mdia. Resultado do desvio padro dividido pela mdia, transformado em percentual.
s CV = .100 xm
No exemplo anterior equivale a CV = 53,3%
Permite comparar a disperso de diferentes distribuies (com diferentes mdias e desvios padres).
PROPRIEDADES DA CURVA
SIMTRICA
0.4 0.3 0.2 p 0.1 0 -5 -3 -1 1 3 5 y
ASSIMTRICA POSITIVA
Xm > Md
ASSIMTRICA A DIREITA
ASSIMTRICA NEGATIVA
ASSIMTRICA A ESQUERDA
Xm < Md
MESOCURTICA LEPTOCURTICA
PLATICURTICA
Trs curvas normal com a mesma MDIA mas com diferentes DESVIOS PADRO
=5
= 10 = 16
= 50
Trs curvas normal com o mesmo DESVIO PADRO mas com diferentes MDIAS
=5 =5 =5
= 20
= 30
= 40
TESTES DE HIPOTESES
No tratamento estatstico de um conjunto de dados deve-se distinguir diferenas amostrais decorrentes do acaso (variabilidade natural) daquelas diferenas induzidas por fatores externos.
TESTES DE HIPOTESES
HIPTESE DE NULIDADE, denominada Ho expressa o conceito de no diferena (igualdade). Essa a hiptese que efetivamente testada Se chega-se a concluso de que Ho deve ser rejeitada, devemos aceitar ento a HIPTESE ALTERNATIVA ( H1 )
Tipos de Erros
Tipo I = a Ho rejeitada quando ela deveria ser aceita Tipo II = a Ho aceita quando ela deveria ser rejeitada
Uma das formas de se testar a hiptese de uma pesquisa aplicando-se um teste de significncia ao conjunto de dados disponveis. Estes testes auxiliam na verificao da existncia de evidncias estatisticamente significativas para se aceitar ou rejeitar as hipteses previamente estabelecidas (H0 e H1)
Existem vrios testes que se aplicam a este procedimento e a escolha funo dos dados existentes (dados quantitativos ou categorizados; dados pareados ou independentes)
= 3.16 Regio de Rejeio Rejei Regio de No Rejeio Rejei Regio de Rejeio Rejei
C1
C2
A rea ombreada = 12 Regio de Rejeio Rejei C Valor Crtico Cr Valor Crtico Cr Regio de No Rejeio Rejei
X