You are on page 1of 7

CET Controlo Estatstico de Qualidade Pg 1

ESTATSTICA DESCRITIVA


O principal objectivo da ESTATSTICA DESCRITIVA a reduo de dados.

A importncia de que se revestem os mtodos que visam exprimir a informao
relevante contida numa grande massa de dados atravs de um nmero muito menor de
valores ou medidas caractersticas ou atravs de grficos simples, tal que a estatstica
descritiva se debrua a estudar os mtodos que o permitam.

Pelo progresso da cincia que exige que se atenda mais profundamente aquisio,
qualidade e tratamento de dados, J. Tuckey introduziu um conjunto de tcnicas
estatsticas a que chamou Data Analisys. Na anlise de dados reconhecem-se duas
componentes: uma mais prxima da estatstica descritiva e outra da estatstica indutiva.
A estatstica descritiva anlise exploratria de dados pretende isolar as estructuras e
padres mais relevantes e estveis patenteados pelo conjunto de
dados objectos do estudo.
A estatstica indutiva anlise confirmatria de dados pretende avaliar,
nomeadamente, atravs da recolha e anlise de novas
observaes, a reprodutividade ou permanncia das estruturas e
padres detectados.

A anlise de dados, fortalecida pela quantidade e variedade dos dados disponveis e pelo
poder de computao acessvel, que no se pode dissociar das grandes capacidade
grficas, contribui para estabelecer uma maior ligao entre os aspectos descritivos e
inferncias da estatstica.

Os dados estatsticos resultam de experincias ou inquritos conduzidos sobre um
conjunto restrito a amostra e as concluses procuram alargar-se a um conjunto mais
vasto a populao.

O principal objectivo da anlise estatstica consiste em determinar que generalizaes
sobre a populao podem fazer-se a partir da amostra que da mesma foi recolhida. A
designao de amostra tomada correntemente num sentido mais amplo como
sinnimo de dados ou observaes enquanto a populao a totalidade; ou seja, o
conjunto de todas as possveis observaes feitas em condies semelhantes.

O processo de amostragem o processo seguido para escolher os elementos da
populao a incluir na amostra, condicionada, logicamente, a inferncias ou concluses
permitidas pela amostra.
Diz-se que se trata de amostragem casual quando as N variveis aleatrias observadas
X
i
(i=1,2,3,..N) so independentes e identicamente distribudas.

Nos estudos por amostragem convm sempre distinguir entre populao objectivo e
populao inquirida.
A populao objectivo a totalidade dos elementos que esto sobre estudo e em relao
aos quais e se deseja obter certo tipo de informao. Muitas vezes no se consegue uma
amostra da populao objectivo, podendo-se efectuar a amostragem a partir de outra
populao relacionada de algum modo com a primeira e que constitui a populao
inquirida.
CET Controlo Estatstico de Qualidade Pg 2

MEDIDAS DE LOCALIZAO

Mdia

A mdia amostral ou simplesmente mdia, que se representa por uma medida de
localizao do centro da amostra, e obtm-se a partir da seguinte expresso:

onde x
1
, x
2
, ..., x
n
representam os elementos da amostra e n a sua dimenso.

Moda
Para um conjunto de dados, define-se moda como sendo: o valor que surge com mais
frequncia se os dados so discretos, ou, o intervalo de classe com maior frequncia
se os dados so contnuos.
Assim, da representao grfica dos dados, obtm-se imediatamente o valor que
representa a moda ou a classe modal

Esta medida especialmente til para reduzir a informao de um conjunto de dados
qualitativos, apresentados sob a forma de nomes ou categorias, para os quais no se
pode calcular a mdia e por vezes a mediana (se no forem susceptveis de ordenao).
Mediana
A mediana, m, uma medida de localizao do centro da distribuio dos dados,
definida do seguinte modo: Ordenados os elementos da amostra, a mediana o valor
(pertencente ou no amostra) que a divide ao meio, isto , 50% dos elementos da
amostra so menores ou iguais mediana e os outros 50% so maiores ou iguais
mediana
Para a sua determinao utiliza-se a seguinte regra, depois de ordenada a amostra de n
elementos:
Se n mpar, a mediana o elemento mdio.
Se n par, a mediana a semi-soma dos dois elementos mdios.
CET Controlo Estatstico de Qualidade Pg 3
Se se representarem os elementos da amostra ordenada com a seguinte notao:
X
1:n
, X
2:n
, ... , X
n:n
ento uma expresso para o clculo da mediana ser:

Como medida de localizao, a mediana mais robusta do que a mdia, pois no to
sensvel aos dados!
Quantis

Quantis de ordem p

Generalizando a noo de mediana m, que como vimos anteriormente a medida de
localizao, tal que 50% dos elementos da amostra so menores ou iguais a m, e os
outros 50% so maiores ou iguais a m, temos a noo de quantil de ordem p, com
0<p<1, como sendo o valor Q
p
tal que 100p% dos elementos da amostra so menores
ou iguais a Q
p
e os restantes 100 (1-p)% dos elementos da amostra so maiores ou
iguais a Q
p
.
Tal como a mediana, uma medida que se calcula a partir da amostra ordenada.
Quartis
Os quartis inferior e superior, Q1 e Q3, so definidos como os valores abaixo dos
quais esto um quarto e trs quartos, respectivamente, dos dados. Estes dois valores so
frequentemente usados para resumir os dados juntamente com o mnimo e o mximo.
Eles so obtidos ordenando os dados do menor para o maior, e ento conta-se o nmero
apropriado de observaes: ou seja e para o quartil inferior e
quartil superior, respectivamente.
A medidade de disperso a amplitude inter-quartis, IQR Q3 Q1, i.e. a
diferena entre o quartil superior e o inferior.
MEDIDAS DE DISPERSO
Permitem medir a variabilidade presente num conjunto de dados.
Varincia
Define-se a varincia, e representa-se por s
2
, como sendo a medida que se obtm
somando os quadrados dos desvios das observaes da amostra, relativamente sua
mdia, e dividindo pelo nmero de observaes da amostra menos um:
CET Controlo Estatstico de Qualidade Pg 4

Desvio Padro

Uma vez que a varincia envolve a soma de quadrados, a unidade em que se exprime
no a mesma que a dos dados. Assim, para obter uma medida da variabilidade ou
disperso com as mesmas unidades que os dados, tomamos a raiz quadrada da varincia
e obtemos o desvio padro:

O desvio padro uma medida que s pode assumir valores no negativos e quanto
maior for, maior ser a disperso dos dados.
Algumas propriedades do desvio padro, que resultam imediatamente da definio, so:
o desvio padro sempre no negativo e ser tanto maior, quanta mais
variabilidade houver entre os dados.
se s = 0, ento no existe variabilidade, isto , os dados so todos iguais.

Amplitude

Uma medida de disperso que se utiliza por vezes, a amplitude amostral r, definida
como sendo a diferena entre a maior e a menor das observaes:r = x
n:n
- x
1:n

onde representamos por x
1:n
e x
n:n
, respectivamente o menor e o maior valor da amostra
(x
1
, x
2
, ..., x
n
), de acordo com a notao introduzida anteriormente, para a amostra
ordenada.
Amplitude Inter-Quartil
A medida anterior tem a grande desvantagem de ser muito sensvel existncia, na
amostra, de uma observao muito grande ou muito pequena. Assim, define-se uma
outra medida, a amplitude inter-quartil, que , em certa medida, uma soluo de
compromisso, pois no afectada, de um modo geral, pela existncia de um nmero
pequeno de observaes demasiado grandes ou demasiado pequenas. Esta medida
definida como sendo a diferena entre os 1 e 3 quartis
Amplitude inter-quartil = Q
3/4
- Q
1/4

Do modo como se define a amplitude inter-quartil, conclumos que 50% dos elementos
do meio da amostra, esto contidos num intervalo com aquela amplitude.
Esta medida no negativa e ser tanto maior quanto maior for a variabilidade nos
dados.
CET Controlo Estatstico de Qualidade Pg 5
( 100%)
s
cv
x
=
Ateno: Mas, ao contrrio do que acontece com o desvio padro, uma amplitude inter-
quartil nula, no significa necessariamente, que os dados no apresentem variabilidade.
Coeficiente de variao
O coeficiente de variao uma medida de disperso que se presta para a comparao
de distribuies diferentes. O desvio-padro, uma medida de disperso, relativo
mdia e como duas distribuies podem ter mdias diferentes, o desvio dessas duas
distribuies no comparvel. A soluo usar o coeficiente de variao, que igual
ao desvio-padro dividido pela mdia:


DADOS, TABELAS E GRFICOS

Representao Grfica de Dados

HISTOGRAMA

Um HISTOGRAMA uma de duas representaes grficas de distribuio de
frequncias.
Consiste num conjunto de rectngulos que tm:
a base num eixo horizontal (eixo dos xx) com centro no ponto mdio e a
largura igual amplitude dos intervalos das classes.
as reas proporcionais s frequncias das classes.

Se todos os intervalos tiverem a mesma amplitude, as alturas dos rectngulos sero
proporcionais s frequncias das classes; costuma-se tomar as alturas numricas iguais a
essas frequncias.

Um POLGONO de frequncia um grfico de linha em que as frequncias so
colocadas sobre perpendiculares, levantadas nos pontos mdios. Pode-se tambm obt-
los ligando-se os pontos mdios dos topos dos rectngulos de um histograma.


Diagrama de caule-e-folhas

um tipo de representao que se pode considerar entre a tabela e o grfico, uma vez
que so apresentados os verdadeiros valores da amostra, mas numa apresentao
sugestiva, que faz lembrar um histograma.
Consiste em escrever do lado esquerdo de uma linha vertical o dgito (ou dgitos) da
classe de maior grandeza, seguidos dos restantes. A representao obtida ter o seguinte
aspecto:
CET Controlo Estatstico de Qualidade Pg 6

Diagrama de extremos e quartis e Caixa dos bigodes
um tipo de representao grfica, em que se realam algumas caractersticas da
amostra. O conjunto dos valores da amostra compreendidos entre o 1 e o 3 QUARTIS,
que vamos representar por Q
1
e Q
3
representado por um rectngulo (caixa) com a
MEDIANA indicada por uma barra. A largura do rectngulo no d qualquer
informao, pelo que pode ser qualquer. Consideram-se seguidamente duas linhas que
unem os meios dos lados do rectngulo com os extremos da amostra. Para obter esta
representao, comea por se recolher da amostra, informao sobre 5 nmeros, que
so: os 2 extremos (mnimo e mximo), a mediana e o 1 e 3 quartis. A representao
do diagrama de extremos e quartis tem o seguinte aspecto:

O extremo inferior o mnimo da amostra, enquanto que o extremo superior o
mximo da amostra.

MEDIDAS DA FORMA DA DISTRIBUIO

Simetria
Uma distribuio diz-se simtrica se a mdia divide o histograma em duas metades
iguais, uma constituindo uma imagem em espelho da outra.
Se a distribuio no simtrica, diz-se assimtrica. O que quer dizer que umdos lados
do grfico da distribuio mais alongado do que o outro. Adistribuio assimtrica
positiva se o alongamento tende a ocorrer no lado direito e assimtrica negativa se o
alongamento ocorrer predominantemente do lado esquerdo.

A curva normal, por exemplo, tem uma assimetria de 0. Se a assimetria maior do que
1, a forma da distribuio comea a afastar-se significativamente da curva normal.

Curtose

Esta uma medida do grau de achatamento e afunilamento da curva que descreve a
distribuio. O seu valor diz-nos se a curva tende a ser muito afunilada, com uma
CET Controlo Estatstico de Qualidade Pg 7
elevada proporo dos dados aglomerados junto do centro, ou achatada, com os dados
espalhando-se ao longo de uma grande amplitude.

A distribuio normal tem uma curtose igual a 0. Um valor positivo indica que os dados
esto concentrados no centro e que a distribuio apresenta um forte pico/elevao
nesse lugar (neste caso, diz-se que a distribuio leptocrtica). Um valor negativo
indica que os dados esto dispersos e que a distribuio mais achatada do que a curva
normal (diz-se que a distribuio platicrtica). A curva normal diz-se mesocrtica.

Valores de curtose superiores a 1 indicam que a curva no mesocrtica.

You might also like