You are on page 1of 9

TRABALHO DE ESTATISTICA ADMINISTRAÇÃO Profa.

Ivonete Melo de Carvalho

INTEGRANTES: Nome: Moises RodasYbias.......................................R.A:2330417711 Nome: Daniela Oliveira Silva ...................................R.A:2306315929 Nome: Rafael Ribeiro da Costa.................................R.A:2605482756 Nome: Roberto Alves Ribeiro....................................R.A:2330431594 Nome: Jamile Cibele de Andrade Moreno................R.A:2327421359 Nome: Ana Caroline Sassine Henrique .................R.A:260348282

TABOÃO DA SERRA 2012

ETAPA4 Passo 1 1. MEDIDAS DE TENDENCIA CENTRAL E MEDIDAS DE DISPERSÃO a) MEDIDAS DE TENDÊNCIA CENTRAL. E um valor que representa o centro de um conjunto de dados. As três medidas de tendência central mais usados são a media, a mediana e a moda.  A media e a soma de entradas de dados dividida pelo numero de entradas. Para calcular se usa o seguinte formula:
x x Media população: µ = ∑ medida da mostra: X = ∑ N n

Exemplo: Os preços em dólares para uma amostra de aparelhos de ar acondicionado estão abaixo. Qual e o preço médio do aparelho de ar acondicionado? 500 840 470 480 420 440 440 SOLUÇÃO A soma dos pre4ços dos aparelhos de ar acondicionado é

∑ χ = 500+840+470+480+420+440+440= 3.590,00
Para encontrar o preço médio, divida a soma dos preços pelo numero de preços da amostra. X=

∑ χ = 3.590 =512,86
n 7

Assim o preço médio para um aparelho de ar acondicionado de cerca de US$513.00  A mediana e dado que fica no meio quando as entradas são colocadas em ordem crescente ou decrescente. Se o conjunto de dados tiver um numero par de entradas, mediana será a media entre os dois pontos em meio do conjunto. É o valor do meio de uma série de dados em ordem (ROL). Quando n for ímpar, a mediana fica locada no item do meio. Quando n for par, a mediana é a média aritmética dos dois valores centrais. Exemplo1 • Rol: 3, 5, 6, 9 e 10: med = 6 • Rol: 3, 5, 6, 10, 12 e 14:

Med= 6+10/2=16/2=8 Exemplo:2 A produção do aparelho de ar acondicionado cujo preço e US$480.00 e suspensa. Qual o preço mediano dos aparelhos restantes. SOLUÇÃO: Os preços restante, ordenados, são. 420, 440, 440, 470, 500, e 840. Mediana=440+470/2=455 Assim, o preço mediano dos aparelhos remanescentes ES de US$455.00  A moda A moda de um conjunto de dados é o valor que aparece com maior freqüência. Nos conjuntos de dados onde não acontece repetição de valores, usa-se denominar série amodal. É comum ainda, encontrar séries de valores com dois ou mais valores, cujas freqüências são iguais. Denomina-se, então, série bimodal, trimodal e assim sucessivamente. Em alguns casos, a moda explica melhor a situação da amostra ou da população do que a média. Isto ocorre, por exemplo, quando determinados valores de um conjunto de dados em estudo são muito grandes, ou então muito menor que a maioria. Exemplo: O conjunto de números 2, 2, 5, 7, 9, 9, 9, 10, 11, 12, 18 tem moda 9. As medidas de posição (média, mediana, moda…) descrevem apenas uma das características dos valores numéricos de um conjunto de observações, o da tendência central. Porém, nenhuma delas informa sobre o grau de variação ou dispersão dos valores observados. Em qualquer grupo de dados os valores numéricos não são semelhantes e apresentam desvios variáveis em relação a tendência geral de média. b) MEDIDAS DE DISPERSÃO (Medidas de variabilidade) São medidas que avaliam o quanto uma distribuição de pontos se afasta ou se aproxima do valor da média. Essas medidas indicam a confiabilidade que podemos ter na média da distribuição. Quanto menor a dispersão, mais confiável é o valor médio. As medidas mais comuns são: As medidas de dispersão medem a variabilidade dos dados em estudo. As medidas de dispersão como amplitude, variância, desvio padrão e coeficiente de variação, permitem verificar se o conjunto de dados é homogêneo ou heterogêneo.  Amplitude

Amplitude total ou máxima é a diferença entre o maior e o menor valor de um conjunto de dados. Para estudar a dispersão dos dados, a amplitude não é um dos melhores meios, pois, este cálculo é efetuado apenas com os valores extremos do conjunto. Por exemplo, as idades em anos de um grupo de pessoas, são: Um segundo grupo, possui as idades: 2, 5, 8, 10, 14, 18 e 22. 2, 14, 15, 15, 16,16 e 22.

Nos dois grupos de pessoas, a amplitude máxima é de 20 anos, porém, a dispersão no primeiro é bem maior que no segundo. Para medir a dispersão de um grupo de dados, o pesquisador poderá fazer uso do desvio padrão, de procedimento matemático igualmente fácil, mas muito mais elaborado e que contempla todos os valores do conjunto de dados em estudo.  Variância A variância da amostra é aproximadamente a média das diferenças ao quadrado entre cada uma das observações de um conjunto de dados. Assim sendo, para uma amostra contendo n observações x1, x2, ..., xn, a variância da amostra pode ser escrita como
2 2 2 ( x1 − x ) + ( x 2 − x ) + ... + ( x n − x ) =

S ou como sendo

2

n−1

S2 =

∑( x

i

− x)

2

n −1

Em que:

x é a média aritmética da amostra;

_

x i iésima observação da variável aleatória;

n é o número de elementos da amostra.

 Desvio Padrão O desvio padrão de uma amostra (representado pela letra S) é definido como sendo a raiz quadrada da variância da amostra.

Ao iniciar as análises de um agrupamento de dados, a média permite que se estabeleça um juízo sobre tal conjunto. Porém, não permite avaliar a dispersão, principalmente para conjunto de dados mais numerosos. Um dos modos mais simples de se medir a dispersão, é calcular a amplitude total, entretanto, tal amplitude pode se deixar influenciar pelos valores extremos. O desvio padrão foge a essa falha por levar em conta todos os valores em questão. Portanto, o desvio padrão é muito mais conveniente no cálculo da dispersão. O desvio padrão é definido como a raiz quadrada da média dos quadrados dos desvios (variância):

Desvio padrão populacional

σ=

∑(X
i =1

N

i

− µ)2

N

σ é desvio padrão populacional µ é a média populacional X i os valores da amostra N é o número de elementos da população

O desvio padrão populacional ou amostral mede a variabilidade dos dados, com respeito à média. Conjunto de dados com maior dispersão implica em desvios padrões elevados. A diferença entre o desvio padrão populacional e o desvio padrão amostral, está no significado do conjunto e no denominador da expressão matemática que o determina. Enquanto o desvio padrão amostral é calculado com a média de uma amostra da população, portanto, expresso a partir de um valor estimado da verdadeira média, o desvio padrão populacional é obtido com a média verdadeira, ou seja, a média da população. Então, o denominador n do desvio estimado, é subtraído de uma unidade como forma de correção, uma vez que essa subtração implica em um aumento de seu valor e, portanto, o uso do desvio padrão amostral tem diminuído a possibilidade de erro quando for usado para verificar a variabilidade dos dados. Para exemplificar a análise de variabilidade de dados, analisar-se-á 4 amostras de massas de alunos iniciantes em um curso de graduação. Os dados com as estaturas destes alunos, constam abaixo.

Amostras com massas de alunos de graduação AMOSTRAS Amostra 1 Amostra 2 Amostra 3 Amostra 4 MASSAS (kg) 62 63 42 38

58 63 55 46

70 63 65 85

65 63 78 90

60 63 75 56

Em ambas as amostras da tabela acima, a média das massas dos alunos é 63 kg. Entretanto, a dispersão observada não é a mesma. Para a amostra 1, o desvio padrão amostral é de 4,69 kg, a segunda amostra não possui variabilidade, na terceira o desvio padrão é de 14,82 e, para a quarta, este valor sobe para 23,32. Comparando os resultados dos desvios padrões calculados, se observa que, quanto maior for a dispersão dos dados, maior será o valor numérico do desvio padrão. Ressalta-se que o desvio padrão somente tem sentido enquanto informação se for comparado com a média. O que a Variância e o desvio padrão indicam? A variância e o desvio padrão medem a dispersão “média” em torno da média aritmética, ou seja, como as observações maiores flutuam acima dela e as observações menores se distribuem abaixo dela.

 Coeficiente de variação O coeficiente de variação dá uma idéia da precisão de um experimento ou da dispersão de um conjunto de dados. É definido como o quociente entre desvio padrão e a média, multiplicado por 100. Logo, o coeficiente de variação nada mais é do que o desvio padrão em porcentagem da média.
S CV =  100% X

Organizando uma nova tabela, a partir da tabela anterior e agora incluindo a amplitude máxima, o desvio padrão e o coeficiente de variação, pode-se perceber que o desvio padrão realmente é um medidor da dispersão de um conjunto de dados numéricos. Dados das massas dos alunos do ensino médio AMOSTRA Amostra 1 Amostra 2 Amostra 3 MASSAS (kg) 62 63 42 58 63 55 70 63 65 65 63 78 90 60 63 75 56 AM (kg) S (kg) 12 0 36 52 4,69 0 14,82 23,32 CV (%) 7,44% 0 23,52% 37,02%

Amostra 4 38 46 85 AM = Amplitude Máxima S = desvio padrão CV=Coeficiente de variação

Um indicativo de grande variabilidade dos dados acontece quando o desvio padrão é maior que a média, o que faz com que o coeficiente de variação supere 100%. PIMENTEL GOMES (1987, p. 24) afirma que “Tendo em vista os coeficientes de variação comumente obtidos nos experimentos de campo ...” pode-se considerar:

VARIABILIDADE Baixa Média Alta Muito alta

CONDIÇÃO

INTERVALO

se se se se

CV < 10% 10%<CV <20%; 20%<CV <30%; CV >30%;

O pesquisador pode, também, adotar como parâmetro de análise que um CV superior a 50%, possui grande variabilidade e, abaixo deste, baixa ou pequena variabilidade. Entretanto, não há consenso entre os autores, uma vez que depende muito do tipo de conjunto de dados ou experimento que se está estudando. No caso da amostra 1, constante da tabela acima, a variabilidade dos dados é baixa, e de forma subjetiva, um gráfico de dispersão permite ao pesquisador visualizar tal situação, conforme o Gráfico 1, onde a linha pontilhada representa a média do conjunto.

GRÁFICO 1 – DISPERSÃO DAS MASSAS DOS ALUNOS – AMOSTRA 1
80 70 70 62 65 58 60

massas (kg)

60 50 40 30 20 10 0 0 1

2

3 alunos

4

5

6

Amostra 1

Já no caso da amostra 2, onde todos os alunos possuem a mesma massa, não existe variabilidade, conforme mostra o Gráfico 2. GRÁFICO 2 – DISPERSÃO DAS MASSAS DOS ALUNOS – AMOSTRA 2
70 60 50 40 30 20 10 0 0 1 2 3 alunos 4 5 6 63 63 63 63 63

Amostra 2 GRÁFICO 3 – DISPERSÃO DAS MASSAS DOS ALUNOS – AMOSTRA 3

massas (kg)

90 80 70 78 65 55 42 75

massas (kg)

60 50 40 30 20 10 0 0 1 2

100 90 80

3 alunos

4

5

6

85 Amostra 3

90

massas (kg)

GRÁFICO 70 4 – DISPERSÃO DAS MASSAS DOS ALUNOS – AMOSTRA 4
60 50 40 30 20 10 0 0 1 2 3 alunos 4 5 6 38 46 56

Amostra 4

Os gráficos 1, 2, 3 e 4 indicam a variabilidade dos dados subjetivamente. Entretanto, o gráfico 4 é o que possui maior distanciamento dos dados da amostra, com respeito à média, simbolizada por uma linha pontilhada horizontal. As medidas de dispersão servem para avaliar o quanto os dados são semelhantes, descreve então o quanto os dados distam do valor central. Desse jeito, as medidas de dispersão servem também para avaliar qual o grau de representação da média. 2. CALCULAR A VARIAVEL “PESO”

CACULO DA VARIAVEL "PESO" MEDIA 1000,47 MODA 999,98 MEDIANA 1000,14 VARIENCIA 2,21 DESVIO PADRÃO 1,49

Vamos supor que o peso estabelecido e de 1000kg, se o padrão de peso e de 1000kg com uma tolerância de ±5 gms, então segundo o análise anterior estaria dentro do padrão de pesos e medidas normais. Ademas se a desvição do peso e de 2,21 grs entoa esta dentro da tolerância exigida, pelo será aprovada esta prudução de café.