valores de uma varivel em torno de um valor de tendncia central (mdia ou mediana) tomando como ponto de comparao.
A mdia ainda que considera como
um nmero que tem a faculdade de representar uma srie de valores no pode, por si mesma, destacar o grau de homogeneidade ou heterogeneidade que existe entre os valores que compem o conjunto.
Consideremos os seguintes conjuntos de
valores das variveis X, Y e Z. X = 70,70,70,70,70 Y = 68, 69, 70,71, 72 Z = 5, 15, 50, 120, 160
Os trs conjuntos apresentam a mesma
mdia aritmtica = 350/5 = 70.
Observamos que o conjunto X mais
homogneo que os conjuntos Y e Z, j que todos os valores so iguais mdia
O conjunto Y, por sua vez, mais
homogneo que o conjunto Z, pois h menor diversificao entre cada um de seus valores e a mdia representativa.
Conclumos ento que o conjunto X
apresenta disperso nula e que o conjunto Y apresenta uma disperso menor que o conjunto Z.
Dar uma das medidas de posio para
caracterizar perfeitamente um conjunto de valores, pois, mesmo sabendo, por exemplo, que a temperatura mdia de duas cidades a mesma, ainda assim somos levados a pensar a respeito do clima dessas cidades. Em uma delas poder a temperatura variar entre limites de muito calor e de muito frio. A outra poder ter uma variao pequena de temperatura e possuir, portanto, no que se refere temperatura, um clima mais favorvel.
Portanto, para qualificar os valores de uma
dada varivel, ressaltando a maior ou menor disperso ou variabilidade entre esses valores e a sua medida de posio, a Estatstica recorre s medidas de disperso ou variabilidade. Dessas medidas, estudaremos a amplitude total, a varincia, o desvio padro e o coeficiente de variao.
a diferena entre o maior e o menor valor
observado. Quanto maior a amplitude total, maior a disperso ou variabilidade dos valores da varivel.
Amplitude total (At): a nica medida de
disperso que no tem na mdia o ponto de referncia. Quando os dados no esto agrupados a amplitude total a diferena entre o maior e o menor valor observado:
At = x mximo x mnimo
Exemplo: Para os valores 40, 45, 48, 62 e 70
a amplitude total ser: |At = 70 -40 = 30
A amplitude total tem o inconveniente de
s levar em conta os dois valores extremos da srie, descuidando do conjunto de valores intermedirios, o que quase sempre invalida a idoneidade do resultado. Ela apenas uma indicao aproximada da disperso ou variabilidade.
A amplitude total instvel, por se deixar
influenciar pelos valores extremos, que so, na sua maioria, devidos ao acaso. A varincia e o desvio padro so medidas que fogem a essa falha, pois levam em considerao a totalidade dos valores da varivel em estudo, o que faz delas ndices de variabilidade bastante estveis e, por isso mesmo, os mais geralmente empregados.
A varincia baseia-se nos desvios em torno
da mdia aritmtica, porm determinando a mdia aritmtica dos quadrados dos desvios. Assim, representando a varincia por s2, temos:
( x x)
f i
Sendo a varincia calculada a partir dos
quadrado dos desvios, ela um nmero em unidade quadrada em relao varivel em questo, o que, sob o ponto de vista prtico, um inconveniente. Por isso mesmo, imaginou-se uma nova medida que tem utilidade e interpretao prticas, denominada desvio padro, definida como a raiz quadrada da varincia e representada por s.
Assim:
( x x)
Tanto o desvio padro quanto a varincia so
usados como medidas de disperso ou variabilidade. O uso de uma ou de outra depender da finalidade que se tenha em vista.
A varincia uma medida que tem pouca
utilidade como estatstica descritiva, porm extremamente importante na inferncia estatstica e em combinaes de amostras. Se bem que a frmula dada para o clculo do desvio seja a que torna mais fcil a sua compreenso, ela no uma boa frmula para fins de computao, pois, em geral, a mdia aritmtica um nmero fracionrio.
Podemos, ento, simplificar os clculos:
2 i
xi
No apenas este mtodo usualmente
mais prtico, como tambm mais preciso.
O desvio padro por si s no nos diz muita coisa.
Assim, um desvio padro de duas unidades pode ser considerado pequeno para uma srie de valores cujo valor mdio 200; no entanto, se a mdia for igual a 20, o mesmo no pode ser dito. Alm disso, o fato de o desvio padro ser expresso na mesma unidade dos dados limita o seu emprego quando desejamos comparar duas ou mais sries de valores, relativamente sua disperso ou variabilidade, quando expressas em unidades diferentes.
Para contornar essas dificuldades e
limitaes, podemos caracterizar a disperso ou variabilidade dos dados em termos relativos a seu valor mdio, medida essa denominada coeficiente de variao (CV):