You are on page 1of 37

FACULDADES INTEGRADAS JACAREPAGUÁ

APOSTILA DE ESTATÍSTICA
Curso: Administração

Prof. Rodney Dieguez

Apostila de Estatística

2

SUMÁRIO
1. Estatística 1.1 Definição de Estatística 1.2 Definição de Estatística 1.3 Fase do Método Estatístico 1.3.1 Coleta de Dados 1.3.2 Crítica dos Dados 1.3.3 Apresentação dos Dados 1.3.4 Análise dos Resultados 2. Amostragem 2.1 Tipos de Variáveis 2.2 População 2.3 Amostra 2.4 Técnicas de Amostragem 2.4.1. Amostragem Probabilística 2.4.2. Amostragem Não Probabilística 3. Estatística Descritiva: Gráficos Estatísticos 3.1 Gráficos Estatísticos 3.2 Dicas para a Apresentação dos Dados 4. Estatística Descritiva: Distribuição de Freqüências 4.1 Freqüência Absoluta 4.2 Freqüência Acumulada 4.3 Freqüência Relativa 4.4 Freqüência Acumulada Relativa 4.5 Distribuição de Freqüências e Histograma para Dados sem Intervalos de Classe 4.5.1 Histograma 4.5.2 Ogiva 4.6 Distribuição de Freqüências e Histograma para Dados com Intervalos de Classe 4.6.1 Histograma 4.6.2 Polígono de Freqüência 5. Estatística Descritiva: Medidas de Tendência Central 5.1 Média 5.1.1 Dados Brutos ou Rol 5.1.2 Dados Agrupados sem Intervalos de Classe 5.1.3 Dados Agrupados com Intervalos de Classe 5.2 Mediana 5.2.1 Dados Brutos ou Rol 5.2.2 Dados Agrupados sem Intervalos de Classe 5.2.3 Dados Agrupados com Intervalos de Classe 5.3 Moda 5.3.1 Dados Brutos ou Rol 5.3.2 Dados Agrupados sem Intervalos de Classe 5.3.3 Dados Agrupados com Intervalos de Classe 5.4 Utilização das Medidas de Tendência Central 6. Estatística Descritiva: Medidas de Dispersão 6.1 Variância e Desvio Padrão 6.1.1 Dados Brutos ou Rol 6.1.2 Dados Agrupados sem Intervalos de Classe 04 04 04 05 05 06 06 06 07 07 08 08 09 09 10 11 11 13 14 14 14 14 15 15 15 16 16 19 19 20 20 20 20 21 22 22 23 24 25 25 26 26 27 28 28 28 29
Prof. Rodney Dieguez

Apostila de Estatística

3

6.1.3 Dados Agrupados com Intervalos de Classe 6.2 Coeficiente de Variação 7. Exercícios 7.1 Capítulo 3 7.2 Capítulo 4 7.3 Capítulo 5 7.4 Capítulo 6 8. Referências Bibliográficas

30 31 32 32 33 35 36 38

Prof. Rodney Dieguez

Apostila de Estatística

4

1. Estatística
1.1. Introdução Os métodos estatísticos são usados hoje em quase todos os campos de investigação científica, já que eles capacitam-nos a responder a um vasto número de questões, tais como as listadas abaixo:
1) 2) 3)

Como os cientistas avaliam a validade de novas teorias? Como os pesquisadores médicos testam a eficiência de novas drogas? Como os demógrafos prevêem o tamanho da população do mundo em qualquer tempo futuro? Como pode um economista verificar se a mudança atual no Índice de Preços ao Consumidor é a continuação de uma tendência secular, ou simplesmente um desvio aleatório?

4)

5)

Como é possível para alguém predizer o resultado de uma eleição entrevistando apenas algumas centenas de eleitores? Estes são poucos exemplos nos quais a aplicação da estatística é necessária.

Por isso, a estatística tornou-se uma ferramenta cotidiana para todos os tipos de profissionais que entram em contato com dados quantitativos ou tiram conclusões a partir destes.

1.2. Definição de Estatística “Estatística” é uma parte da Matemática Aplicada que fornece métodos para a coleta, organização, descrição, análise e interpretação de dados. Ela é dividida em: Estatística Descritiva: parte da Estatística que apenas coleta, descreve, organiza e apresenta os dados. Nela não são tiradas conclusões.

Prof. Rodney Dieguez

Apostila de Estatística

5

Estatística Indutiva ou Inferência: analisa os dados e obtêm-se as conclusões. 1.3. Fases do Método Estatístico

Tabelas Coleta de dados Crítica dos dados Apresentação dos dados Gráficos Análises

1.3.1. Coleta de Dados Após a definição do problema a ser estudado e o estabelecimento do planejamento da pesquisa (forma pela qual os dados serão coletados; cronograma das atividades, custos envolvidos; exame das informações disponíveis; delineamento da amostra etc.), o passo seguinte é a coleta de dados, que consiste na busca ou compilação dos dados das variáveis, componentes do fenômeno a ser estudado. A coleta de dados pode ser direta ou indireta. - coleta direta: quando os dados são obtidos na fonte originária. Os valores assim compilados são chamados de dados primários, como, por exemplo, nascimentos, casamentos e óbitos, registrados no Cartório de Registro Civil; opiniões obtidas em pesquisas de opinião pública; ou ainda, quando os dados são coletados pelo próprio pesquisador. A coleta direta pode ser classificada relativamente ao fator tempo em: • • • contínua – quando feita continuamente, como por exemplo, nascimentos e óbitos, freqüência dos alunos às aulas; periódica – quando feita em intervalos constantes de tempo, como os censos (de 10 em 10 anos); ocasional – quando feita sem época preestabelecida.

- coleta indireta: quando os dados obtidos provêm da coleta direta. Os valores assim compilados são denominados de dados secundários, como, por exemplo, o cálculo do tempo de vida média, obtido pela pesquisa, nas tabelas demográficas publicadas pela Fundação Instituto Brasileiro de Geografia e Estatística, se constitui em uma coleta indireta.
Prof. Rodney Dieguez

Apostila de Estatística

6

1.3.2. Crítica dos Dados Obtidos os dados, eles devem ser cuidadosamente criticados, à procura de possíveis falhas e imperfeições, eliminando os erros capazes de provocar futuros enganos de apresentação e análise. 1.3.3. Apresentação dos Dados Após a crítica, os dados devem ser apresentados sob forma adequada (tabelas ou gráficos), para o melhor entendimento do fenômeno que está sendo estudado. 1.3.4. Análise dos Resultados Realizadas as fases anteriores, faz-se uma análise dos resultados obtidos, através dos métodos da Estatística Indutiva ou Inferência, e tiram-se as conclusões e previsões.

Prof. Rodney Dieguez

Apostila de Estatística

7

2. Amostragem
2.1. Tipos de Variáveis Variável é o conjunto de resultados possíveis de um fenômeno. Por exemplo: Para o fenômeno “sexo” são dois os resultados possíveis: sexo masculino e sexo feminino; Para o fenômeno “número de filhos” há um número de resultados possíveis expressos através dos números naturais: 0, 1, 2, 3, ... n; Para o fenômeno “estatura” temos uma situação diferente, pois os resultados podem tomar um número infinito de valores numéricos dentro de um determinado intervalo. As variáveis podem ser: Variáveis quantitativas - refere-se a quantidades e pode ser medidas em uma escala numérica. Exemplos: idade de pessoas, preço de produtos, peso de recém nascidos. Elas subdividem-se em dois grupos: - Variáveis quantitativas discretas: são aquelas que assumem apenas valores inteiros. Normalmente refere-se a contagens. Por exemplo: número de vendas diárias em uma empresa, número de pessoas por família, quantidade de doentes por hospital. - Variáveis quantitativas contínuas: são aquelas que assumem valores dentro de um intervalo real. Normalmente refere-se a medidas. Exemplos dessas variáveis são: o “peso” das pessoas, a renda familiar, o consumo mensal de energia elétrica, o preço de um produto agrícola. Variáveis Qualitativas - refere-se a dados não numéricos. Exemplos dessas variáveis são o sexo das pessoas, a cor, o grau de instrução. Elas subdividem-se também em dois grupos:

Prof. Rodney Dieguez

Apostila de Estatística

8

-

Variáveis qualitativas ordinais: são aquelas que definem um ordenamento ou uma hierarquia. Exemplos são o grau de instrução, a classificação de um estudante no curso de estatística, as posições das 100 empresas mais lucrativas, etc.

-

Variáveis qualitativas nominais: por sua vez não definem qualquer ordenamento ou hierarquia. São exemplos destas a cor, o sexo, o local de nascimento, etc.

Exercício: Classifique as variáveis em qualitativas (nominal ou ordinal) ou quantitativas (contínuas ou discretas): a) Universo: alunos de uma escola Variável: cor dos cabelos Variável: número de filhos c) Universo: as jogadas de um dado Variável: o ponto obtido em cada jogada Variável: nº de peças produzidas/hora Variável: diâmetro externo f) Universo: funcionários de uma empresa Variável: grau de instrução ________________________ Classificação: Classificação: ___________________ Classificação: ___________________ Classificação: ___________________ d) Universo: peças produzidas por uma máquina e) Universo: peças produzidas por uma máquina Classificação: ________________________ Classificação: ________________________ b) Universo: casais residentes em uma cidade

2.2. População É um conjunto de indivíduos ou de objetos que tem pelo menos uma característica comum. A população pode ser finita ou infinita. Na prática, quando uma população é finita, com um número grande de elementos, considera-se como população infinita. Exemplo: alunos de uma escola.

Prof. Rodney Dieguez

Apostila de Estatística

9

2.3. Amostra É uma pequena parte selecionada de uma população que se pretende estudar. Fazemos uma amostragem quando: O número de elementos da população é muito grande; Quando queremos economizar tempo e dinheiro.

A amostra é escolhida através de técnicas adequadas que garantam o acaso na escolha. 2.4. Técnicas de Amostragem Amostragem é o processo de obtenção de amostras de uma população. Existem dois tipos de amostragem: probabilística e não probabilística. 2.4.1. Amostragem Probabilística: É uma amostra selecionada de tal forma que cada item ou pessoa na população estudada têm uma probabilidade (não nula) conhecida de ser incluída na amostra. Pode-se destacar três: Amostragem Casual Simples ou Aleatória Definição: É aquela em que todo elemento da população tem igual probabilidade de pertencer à amostra e todas as amostras possíveis têm igual probabilidade de ocorrer. Exemplo: Os elementos da amostra são sorteados entre todos os elementos da população por algum dispositivo adequado (Tabela de números aleatórios). Amostragem Sistemática Definição: É aquela em que os elementos da população se apresentam ordenados e a retirada é realizada através de um sistema preestabelecido. Exemplo: Numa lista telefônica, sorteia-se um entre os 100 primeiros assinantes e a partir deste retira-se outro a cada 100.

Prof. Rodney Dieguez

Apostila de Estatística

10

Amostragem Estratificada Definição: É um processo de amostragem usado quando as populações são heterogêneas. Divide-se a população em sub-populações denominados estratos. Após a determinação dos estratos, seleciona-se uma amostra aleatória de cada um dos estratos. Tipos de variáveis que podem ser usadas em estratificação: idade, classes sociais, sexo, profissão, salário, procedência, etc. Exemplo: Numa pesquisa de renda média familiar podemos dividir uma cidade nos seguintes estratos: bairros de classe A, bairros de classe B, bairros de classe C, etc. e em seguida retirar um número proporcional de elementos de cada estrato para formar a amostra estratificada. 2.4.2. Amostragem não-probabilística: É uma amostra selecionada onde cada item ou pessoa na população estudada tem probabilidade desconhecida de pertencer à amostra. Amostragem com inacessibilidade a toda a população. Definição: É aquela na qual a população não se encontra toda disponível para formar a amostragem. Exemplo: A população de peças fabricadas por uma máquina. Uma parte das peças dessa população, ainda não foram fabricadas, portanto, não estão disponíveis para serem retiradas no processo de amostragem. Amostragem a esmo ou sem norma Definição: É aquela na qual o pesquisador, para simplificar o processo, procura ser aleatório sem, no entanto, realizar propriamente o sorteio usando algum dispositivo aleatório confiável. Exemplo: A extração de uma amostra de 100 parafusos de uma caixa contendo10000, evidentemente não se faz através de sorteio por ser extremamente trabalhoso, faz-se então através de retiradas a esmo.

Prof. Rodney Dieguez

Apostila de Estatística

11

Amostragem intencional Definição: É aquela em que o pesquisador deliberadamente escolhe certos elementos para pertencer à amostra, por julgar tais elementos bem representativos da população. Exemplo: Muitas amostragens de pesquisa de opinião são obtidas dessa maneira, por motivo de tempo e custo.

3. Estatística Descritiva: Gráficos Estatísticos
3.1. Gráficos Estatísticos A representação gráfica das séries estatísticas tem por finalidade dar uma idéia, a mais imediata possível, dos resultados obtidos, permitindo chegar a conclusões sobre a evolução do fenômeno ou sobre como se relacionam os valores da série. A escolha do gráfico mais apropriado ficará a critério do analista. Contudo, os elementos simplicidade, clareza e veracidade devem ser considerados quando da elaboração de um gráfico. Os principais tipos de gráficos. a) Gráfico em Colunas ou em Barras: esses dois tipos de gráficos são geralmente utilizados para comparar diferentes valores da mesma variável.

Prof. Rodney Dieguez

Apostila de Estatística

12

b)

Gráficos em Setores: É a representação gráfica de uma série estatística, em um círculo, por meio de setores. É utilizado principalmente quando se pretende comparar cada valor da série com o total. Para construí-lo, divide-se o círculo em setores, cujas áreas serão proporcionais aos valores da série. Essa divisão poderá ser obtida pela solução da regra de três. Total _____ 360 o Parte _____ x o

Prof. Rodney Dieguez

Apostila de Estatística

13

c)

Gráfico em Curvas ou Linear: é utilizado para representar o crescimento ou o decrescimento da variável. Exemplo:
Gráfico Linear 500

400

300 VENDAS

200

100

0

1991

1992

1993

1994 Anos

1995

1996

1997

3.2. Dicas para a Apresentação dos Dados Dados

Dados Qualitativos

Dados Quantitativos

Métodos Tabulares

Métodos Gráficos

Métodos Tabulares

Métodos Gráficos

Distribuições de freqüências

Gráficos de barras e pizza

Distribuições de freqüências

Histograma

Prof. Rodney Dieguez

Apostila de Estatística

14

4. Estatística Descritiva: Distribuição de Freqüências
Um estudo completo das distribuições de freqüências é imprescindível devido que este é o tipo de tabela mais importante para a Estatística Descritiva. A seguir são descritos os procedimentos usuais na construção dessas tabelas. Primeiramente vamos ver alguns conceitos fundamentais. a) Dados brutos: O conjunto dos dados numéricos obtidos após a crítica dos valores coletados. Os seguintes valores poderiam ser os dados brutos: 24, 23, 22, 28, 35, 21, 23, 33. b) Rol: É o arranjo dos dados brutos em ordem de freqüência crescente ou decrescente. Os dados brutos anteriores ficariam assim: 21, 22, 23, 23, 24, 28, 33, 35. c) Amplitude Total ou "range" (R). É a diferença entre o maior e o menor valor observado. No exemplo, R = 35 - 21 = 14.

4.1 Freqüência Absoluta (fi) É o número de vezes que o elemento aparece na amostra, ou o número de elementos pertencentes a uma classe.

4.2 Freqüência Acumulada (fac) É a soma da freqüência absoluta da classe com a freqüência absoluta das classes anteriores. 4.3 Freqüência Relativa (fr)

Prof. Rodney Dieguez

Apostila de Estatística

15

A freqüência relativa é o valor da freqüência absoluta dividido pelo número total de observações: fr = fi . n

4.4 Freqüência Acumulada Relativa (far) A freqüência acumulada relativa é o valor da freqüência acumulada dividido pelo número total de observações: far = f ac . n

4.5 Distribuição de Freqüências e Histograma para Dados sem Intervalo de Classe Utilizamos esse tipo de distribuição quando o número de elementos distintos da amostra for pequeno. Exemplo: Considere o seguinte conjunto de dados: 21, 21, 21, 22, 22, 23, 23, 24, 25, 25, 25, 25, 26, 26, 26, 28, 30. Construa uma distribuição com todas as freqüências. X 21 22 23 24 25 26 28 30 ∑ fi fac fr far

4.5.1 Histograma Histograma é uma representação gráfica de uma tabela de distribuição de freqüências. Desenhamos um par de eixos cartesianos e no eixo horizontal (abcissas) colocamos os valores da variável em estudo e no eixo vertical (ordenadas) colocamos os valores das freqüências. O histograma tanto pode ser representado para as freqüências absolutas como para as freqüências relativas.

Prof. Rodney Dieguez

Apostila de Estatística

16

4.5.2. Ogiva Ogiva é uma representação gráfica de uma tabela de distribuição de freqüências acumuladas.

4.6. Distribuição de Freqüência e Histograma para Dados com Intervalo de Classe Quando o número de elementos distintos da amostra for grande, os dados devem ser tabulados em intervalos de classes. Exemplo: Dado o conjunto de dados abaixo, construa sua distribuição de freqüências. 47 51 43 48 51 43 48 43 45 40 50 48 45 45 52 50 44 47 57 47 50 41 43 47 52 46 45 42 45 46 45 44 45 46 53 48 46 44 43 49

Alguns passos devem ser seguidos para a tabulação de freqüências de dados. 1. Definir o número de classes. O número de classes não deve ser muito baixo nem muito alto. Um número de classes pequeno gera amplitudes de classes grandes o que pode causar distorções na visualização do histograma. Um número de classes grande gera amplitude de classes muito reduzidas. Foram definidas regras práticas para a determinação do número de classes, sendo que este deve variar entre 5 e 20 (5 para um número muito reduzido de observações e 20 para um número muito elevado). Se n representa o número de observações (na amostra ou na população, conforme for o caso) o número aproximado de classes pode ser calculado por Número de Classes(k), k = exemplo temos n = 40 e k= n arredondando os resultados. No caso do nosso então o número de classes será 6.

40 = 6,32

Prof. Rodney Dieguez

Apostila de Estatística

17

2. Calcular a amplitude das classes(h). A amplitude será obtida conhecendo-se o número de classes(k) e amplitude total(AT) dos dados. A amplitude total dos dados é o resultado da subtração valor máximo - valor mínimo da série de dados. A amplitude de classe será: h= AT k

Em geral, o valor do resultado é também arredondado para um número inteiro mais adequado. No nosso exemplo temos:

h=

57 - 40 = 2,8 ≅ 3 6

3. Preparar a tabela com os limites de cada classe. Na tabela abaixo apresentamos para os dados do nosso exemplo os limites inferior(L inf) e superior (Lsup) de cada uma das 6 classes de freqüência. Classe 1 2 3 4 5 6 Limite inferior Limite Superior

Para a construção da distribuição de freqüências usamos a simbologia de intervalos abertos e fechados. Exemplo: 40 |------ 43 significa que pertencem ao intervalo todos os valores de 40 a 42.

Prof. Rodney Dieguez

Apostila de Estatística

18

4. Tabular os dados por classe de freqüência. De acordo com nosso exemplo, teremos: Classe 40 |--- 43 43 |--- 46 46 |--- 49 49 |--- 52 52 |--- 55 55 |--- 58 Total 4.6.1 Histograma fi fac fr far

4.6.2. Polígono de Freqüência

Prof. Rodney Dieguez

Apostila de Estatística

19

5. Estatística Descritiva: Medidas de Tendência Central (ou de Posição)
No estudo de uma série estatística é conveniente o cálculo de algumas medidas que a caracterizem. Essas medidas, quando bem interpretadas, podem fornecer informações muito valiosas com respeito a séries estatísticas. Elas são chamadas de medidas de tendência central e são usadas para indicar um valor que tende a representar melhor um conjunto de dados. Geralmente localiza-se no centro ou em torno do centro de uma série, onde maior parte dos dados tende a se concentrar. Quando o cálculo dessas medidas é feito a partir de uma amostra, elas recebem o nome de estimativas e quando é feito a partir de uma população, recebem o nome de parâmetros. As principais medidas de tendência central são: média, mediana e moda.

5.1. Média: 5.1.1. Dados Brutos ou Rol A média é definida como a soma das observações dividida pelo número de observações. Ela é dada por:
n N

X=

i =1

∑ xi
n

para amostra
n

µ=

i =1

∑ xi
N

para população

Para facilitar, usaremos

i =1

∑ xi = ∑ xi

Exemplo: Calcule a média da variável x: 2,4,6,8.

X=

5

Prof. Rodney Dieguez

Apostila de Estatística

20

5.1.2. Dados Agrupados sem Intervalos de Classe A média para dados agrupados sem intervalo de classe é obtida por:

X=

∑ x i f i para amostra ∑ fi

xf µ=∑ i i ∑f i

para população

onde

∑ f i = n ou N
Exemplo: Determinar a média da distribuição: xi 2 5 6 8 ∑ fi 1 4 3 2 10 56 = 5,6 10 xifi 2 20 18 16 56

Então:

X=

∑x f ∑f
i

i i

= X=

5.1.3. Dados Agrupados com Intervalos de Classe Para o cálculo da média para dados agrupados com intervalos de classe, é necessário calcular o ponto médio de cada classe. A média é obtida por:

X=

∑ Pm f i ∑ fi

para amostra

P f µ=∑ m i ∑ fi

para população

onde: Pm é o ponto médio de cada classe.

Prof. Rodney Dieguez

Apostila de Estatística

21

O ponto médio de cada classe é definido por: L inf + L sup 2

Pm =

Exemplo: Calcular a média da distribuição: classes 0 |------ 2 2 |------ 4 4 |------ 6 6 |------ 8 ∑ fi 1 10 8 1 20 Pm 1 3 5 7 58 Pmfi 1 10 40 7

Então:

X=

∑ Pm f i = X = 58 = 2,9 20 ∑ fi

5.2. Mediana (Md): A mediana é um valor real que separa o rol em duas partes deixando à sua esquerda o mesmo número de elementos que a sua direita. Portanto, a mediana é um valor que ocupa a posição central em uma série. Ela é denotada por: Md. 5.2.1 Dados Brutos ou Rol Inicialmente devemos ordenar os elementos, em seguida determinarmos o número n de elementos. Se n é ímpar: a mediana é o termo central, ou seja, o termo que ocupa a posição  n +1 o   = posição .  2  Exemplo: Determinar a mediana do conjunto: x: 2, 20, 12, 23, 20, 8, 12. Ordenando os termos: 2, 8, 12, 12, 20, 20 ,23. Como n=7 (ímpar), então a posição do termo central é

 7 + 1 o  =4 .  2 
.
Prof. Rodney Dieguez

Portanto, a mediana é o quarto elemento do Rol: Md = 12

Apostila de Estatística

22

Se n é par: a mediana será a média aritmética dos dois termos centrais, ou seja, os

termos que ocupam as posições

n   2

o

e

n   + 1 2 

o

Exemplo: Determinar a mediana da série: x: 7, 21, 13, 15, 10, 8, 9, 13. Ordenando os termos: 7, 8, 9, 10, 13, 13, 15, 21. Como n=8 (par), então a posição dos dois termos centrais são

8 o  =4 e  2

8  o  + 1 = 5 2 
Então, a mediana será a média do terceiro e quarto elemento do Rol.

A mediana será: Md = 11,5

5.2.2. Dados Agrupados sem Intervalos de Classe Basta verificar se o número de elementos é par ou ímpar e aplicar o mesmo raciocínio do caso anterior. Para facilitar a localização dos termos centrais calcula-se a freqüência acumulada da série. Exemplo: Determinar a mediana da distribuição: xi 2 5 6 8 fi 1 4 3 1

Solução: O número de elementos é: n=∑fi=9 (ímpar). Então, o termo central será

aquele que ocupará a posição

 n + 1    2 

o

 9 + 1 =   2 

o

= 5º. Para encontrar o quinto

elemento da distribuição, construímos uma nova coluna na tabela e determinamos as freqüências acumuladas.
Prof. Rodney Dieguez

Apostila de Estatística

23

xi 2 5 6 8 ∑

fi 1 4 3 1 9

fac 1 5 8 9

Observando a freqüência acumulada, nós temos o nº 2 que ocupa a 1ª posição, o nº 5 que ocupa as posições 2ª, 3ª, 4ª e 5ª. Então, a mediana será: Md = 5.2.3. Dados Agrupados com Intervalos de classe Neste caso, o cálculo da mediana é feito através da fórmula:

 n / 2 − fant   .h Md = l md +   f   md 
onde: lmd = limite inferior da classe mediana. A classe mediana é obtida através de n/2; fant = freqüência acumulada da classe anterior a classe mediana; fmd = freqüência absoluta da classe mediana; h = amplitude da classe (h=Lsup – linf) Exemplo: Determinar a mediana da distribuição: classes 2 |------ 4 4 |------ 6 6 |------ 8 8 |------ 10 fi 2 9 8 1

Solução: O número de elementos é 20, então a classe mediana será: n/2 = 20/2=10º. Identifica-se a classe mediana através da freqüência acumulada, ou seja, qual classe está o 10º elemento. Observando a freqüência acumulada, temos o 10º elemento na 2ª classe.

classes 2 |------ 4 4 |------ 6 6 |------ 8 8 |------ 10

fi 2 9 8 1

fac 2 11 19 20
Prof. Rodney Dieguez

Apostila de Estatística

24

∑ lmd = 4 fant= 2

20 fmd = 5,78 9 h= 2

Aplicando a fórmula, temos:

Md =
5.3. Moda (Mo)

É o valor de maior freqüência em um conjunto de dados. Ela é denotada por Mo. 5.3.1. Dados Brutos ou Rol Verifica-se qual o elemento que tem maior freqüência. Exemplos: Determinar a moda dos conjuntos de dados: a) x: 2, 8, 3, 5, 4, 5, 3, 5, 5, 1. O elemento de maior freqüência é 5. Portanto, Mo = unimodal, pois só temos uma moda. b) X: 6, 10, 5, 6, 10, 2. Este conjunto de dados apresenta o elemento 6 e 10 como elementos de maior freqüência. Portanto, Mo = e Mo = . Por isso é chamada de bimodal. . É uma seqüência

Quando não houver elementos que se destaque pela maior freqüência, dizemos que a série é amodal. Exemplo: x: 3, 3, 3, 4, 4, 4. Não há moda, pois os elementos têm a mesma freqüência.

5.3.2. Dados Agrupados sem intervalos de classe Neste caso, verificamos o elemento de maior freqüência absoluta. Exemplo: Determinar a moda da distribuição abaixo: xi 2 fi 1
Prof. Rodney Dieguez

Apostila de Estatística

25

5 6 8 ∑

4 3 1 9

Observamos que a maior freqüência absoluta é o número 4, que corresponde ao elemento 5 da distribuição. Portanto, a moda é Mo = 5 5.3.3. Dados Agrupados com intervalos de classe Neste caso, verificamos a classe que tem maior freqüência absoluta e aplicamos a fórmula.

M O = l mo +

∆1 ⋅h ∆1 + ∆ 2

onde: lmo = limite inferior da classe modal ∆1 = diferença entre a freqüência absoluta da classe modal e a da classe anterior ∆2 = diferença entre a freqüência absoluta da classe modal e a da classe posterior h = amplitude da classe Exemplo: Determinar a moda da distribuição abaixo: classes 0 |------ 2 2 |------ 4 4 |------ 6 6 |------ 8 ∑ fi 2 2 4 2 10

Solução: A classe modal é aquela que tem maior freqüência absoluta, então a classe modal é a 3ª classe. Encontrando os valores, temos: lmo = 4 ∆1 = 4 – 2= 2 ∆2 = 4 – 2 = 2 h= 2

Aplicando a fórmula, temos:

M O = l mo +

∆1 ⋅h ∆1 + ∆ 2

MO = 5
5.4. Utilização das Medidas de Tendência Central
Prof. Rodney Dieguez

Apostila de Estatística

26

Na maioria das situações, não necessitamos calcular as três medidas de tendência central. Normalmente precisamos de apenas uma das medidas para caracterizar o centro da série. A medida ideal em cada caso é aquela que melhor representa a maioria dos dados da série. Quando houver forte concentração de dados na área central da série, devemos optar pela Média. Quando houver forte concentração de dados no início e no final da série, devemos optar pela Mediana. A Moda deve ser a opção como medida de tendência central apenas em séries que apresentam um elemento típico, isto é, um valor cuja freqüência é muito superior à freqüência dos outros elementos da série.

Prof. Rodney Dieguez

Apostila de Estatística

27

6. Estatística Descritiva: Medidas de Dispersão
As medidas de dispersão são medidas que mostram o grau de dispersão ou de concentração em torno da média. As medidas de dispersão mais utilizadas são: variância, desvio padrão e coeficiente de variação.

6.1 Variância e Desvio Padrão A variância é uma média aritmética calculada a partir dos quadrados dos desvios obtidos entre os elementos da série e a sua média. Quando o conjunto de dados representa uma população a variância é denotada por σ2(x) e o desvio padrão correspondente por σ(x). Quando o conjunto de dados representa uma amostra a variância é denotada por s2(x) e o desvio padrão correspondente por s(x). 6.1.1 Dados Brutos ou Rol A variância é dada por:

∑ ( x i − X )2 , para a amostra; s =
2

n −1

∑ ( x i − µ )2 , para a população. σ =
2

N

O desvio padrão é a raiz quadrada positiva da variância.

s = s 2 , para a amostra;

σ = σ 2 , para a população.
Exemplo: Determine a variância e o desvio padrão da série: X: 2, 4, 6, 8, representativa de uma amostra.

Prof. Rodney Dieguez

Apostila de Estatística

28

Solução: Primeiro, calculamos a média: X =

∑ xifi = ∑ fi
(xi - µ)2 9 1 1 9 fi(xi - µ)2 9 1 1 9 20

xi 2 4 6 8 ∑

fi 1 1 1 1 4 20 =5 4

xifi 2 4 6 8 20

σ

2

∑(x =

i

− µ ) 2 . fi N

=

6.1.2. Dados Agrupados sem Intervalos de Classe Neste caso, a variância é dada por:

∑ f i ( x i − X ) 2 , para a amostra; s =
2

n −1

∑ f i ( x i − µ ) 2 , para a população. σ =
2

N

O desvio padrão é a raiz quadrada positiva da variância.

s = s 2 , para a amostra;

σ = σ 2 , para a população.

Prof. Rodney Dieguez

Apostila de Estatística

29

Exemplo: Calcule a variância e o desvio padrão da série abaixo, representativa de uma população. xi 2 3 4 5 ∑ fi 3 5 8 4 20 xifi (xi - µ)2 fi(xi - µ)2

Primeiro, calculamos a média:

xf µ=∑ i i = ∑ fi

Como estamos trabalhando com uma população a variância é dada por:

∑ fi (xi − µ )2 = σ =
2

N

O desvio padrão será:

σ=

=

6.1.3. Dados Agrupados com Intervalos de Classe A variância para dados agrupados com intervalos de classe é dada por:

∑ f i ( Pm − X )2 , para a amostra; s =
2

n −1

∑ f i ( Pm − µ )2 , para a população. σ =
2

N

O desvio padrão é dado por:

s = s 2 , para a amostra;

σ = σ 2 , para a população.

Prof. Rodney Dieguez

Apostila de Estatística

30

Exemplo: Calcule a variância e o desvio padrão da série abaixo, representativa de uma população: classes 0 |------ 2 2 |------ 4 4 |------ 6 6 |------ 8 ∑ fi 1 10 8 1 20 Pm Pmfi

( Pm − µ ) 2 f i ( Pm − µ ) 2

Primeiramente calculamos o ponto médio de cada classe e em seguida a média:

X=

∑ Pm f i = ∑ fi

Como estamos trabalhando com uma população a variância é dada por:

∑ f i ( Pm − µ ) 2 = σ =
2

N

O desvio padrão será:

σ=
6.2. Coeficiente de Variação (CV)

=

É uma medida relativa de dispersão, útil para a comparação em termos relativos do grau de concentração em torno da média. Ele é expresso em porcentagem.

CV =

σ ⋅ 100 µ
s .100 X

para população

CV =
Se: CV ≤ 15% 15% < CV< 30% CV ≥ 30%

para amostra

⇒ Baixa dispersão – Homogênea, estável, regular. ⇒ Média dispersão. ⇒ Alta dispersão – Heterogênea.

7. Exercícios:
Prof. Rodney Dieguez

Apostila de Estatística

31

7.1. Capítulo 3
1. Um estudo sobre o problema do desemprego na Grande São Paulo, no período 1985-1996, realizado pelo SEADE-DIEESE, apresentou o seguinte gráfico sobre a taxa de desemprego:
Médias anuais da taxa de desemprego total Grande São Paulo 1985-1996
16% 15%

Taxa de de se mpre go

14% 13% 12% 11% 10% 9% 8% 7% 6% 85 86 87 88 89 90 91 92 93 94 95 96 97

Ano

Pela análise do gráfico, é correto afirmar que, no período considerado: a) a maior taxa de desemprego foi de 14%; b) a taxa de desemprego no ano de 1995 foi a menor do período; c) a partir de 1992, a taxa de desemprego foi decrescente; d) no período 1985-1996, a taxa de desemprego esteve entre 8% e 16%. 2. Uma pesquisa de opinião foi realizada para avaliar os níveis de audiência de alguns canais de televisão, entre 20h e 21h, durante determinada noite. Os resultados obtidos estão representados no gráfico de barras a seguir:

Prof. Rodney Dieguez

Apostila de Estatística

32

120 100 80 60 40 20 0 TvA TvB TvC TvD Nenhum Canal

I. O número de residências pesquisadas foi, aproximadamente de: a) 100 aproximadamente igual a: a) 30 pessoas b) 20 pessoas d) 18 pessoas d) 22 pessoas b) 135 c) 200 d) 220 II. O número de entrevistados que declararam estar assistindo a TvB é

7.2. Capítulo 4
1. Considere os resultados finais, numa determinada disciplina, obtidos por 20 estudantes de uma dada Universidade: 9, 14, 12, 8, 14, 12, 16, 16, 8, 14,11, 12, 14, 11, 11, 18, 14, 18, 15, 15. Construa uma distribuição de freqüências para esses dados. 2. Admita que foi realizado um inquérito a um grupo de compradores de 30 carros novos para determinar quantas reparações ou substituições de peças foram feitas durante o primeiro ano de utilização dos carros, tendo-se obtido os seguintes resultados: 1, 4, 1, 2, 2, 3, 3, 2, 1, 2, 3, 2, 3, 1, 0, 1, 2, 0, 4, 3, 2, 1, 2, 4, 2, 1, 3, 1, 0, 1. Apresente os dados numa tabela de distribuição de freqüências. 3. Os seguintes dados representam as contribuições fiscais, durante um ano, de 40 pessoas escolhidas aleatoriamente:

Prof. Rodney Dieguez

Apostila de Estatística

33

Agrupe os dados numa distribuição de freqüências. 4. A listagem seguinte refere-se aos montantes de 40 empréstimos pessoais de uma companhia financeira, em milhares de reais. 900 500 450 1900 1200 1250 2500 550 1650 1200 1000 550 950 600 750 1300 850 350 1400 700 300 1100 300 1600 1500 1000 1800 900 500 650 2000 1000 2000 450 750 850 600 3000 350 1500

Construa a distribuição de freqüências para os dados da tabela começando a primeira classe no limite inferior de 300 mil reais e usando a amplitude de 400 mil reais para os intervalos de classe. 5. A distribuição abaixo se refere a uma amostra da taxa de juros praticadas em 25 países: Taxa de juros (%) 1,0 |----- 2,4 2,4 |----- 3,8 3,8 |----- 5,2 5,2 |----- 6,6 6,6 |----- 8,0 Pede-se: a) Determine as freqüências acumuladas, relativas (em %) e acumuladas relativas (em %); b) Complete as seguintes frases: b1) O limite inferior da classe 2 é _________; b2) O limite superior da classe 5 é ________; b3) O ponto médio da classe 3 é __________; b4) O ponto médio da classe 4 é __________;
Prof. Rodney Dieguez

Nº de países 4 3 6 10 2

Apostila de Estatística

34

b5) Em 92% dos países a taxa de juros é inferior a _________. b6) Em _______% dos países a taxa de juros é superior ou igual a 3,8%. b7) Em _______% dos paises a taxa de juros é ≥ 5,2% e < 6,6%. b8) O número de países que possuem taxa juros ≥ 6,6% e < 8,0% são _____.

7.3. Capítulo 5
1. O Serviço de Recursos Humanos da Roth Young fez uma pesquisa sobre os salários anuais para gerentes assistentes de lojas de departamentos Os dados são mostrados na tabela abaixo (dados em mil dólares): (amostra) Salário (US$) 1000 | 1200 1200 | 1400 1400 | 1600 1600 | 1800 1800 | 2000 Pede-se: a) Calcule as freqüências acumuladas, relativas e as acumuladas relativas; b) O limite superior da classe1?(R: 1200) c) O limite inferior da classe 3? (R:1400) d) O ponto médio da classe 2/(R:1300) e) Qual a porcentagem de salários anuais menor que US$ 1200? (R: 8%) f) Qual a porcentagem de salários anuais maior que US$ 1600? (R: 28%) g) Qual o salário anual médio? (R: US$ 1492) h) Qual o salário mediano? (R: US$ 1490) i) Qual o salário modal? (R: US$ 1488,89) fi 2 6 10 5 2

2. A tabela abaixo representa o número de faltas anuais dos funcionários de uma empresa: (população)
Nº faltas Nº empregados 0 20 1 42 2 53 3 125 4 84 5 40 6 14 7 3 8 2

Determine: a) a distribuição de freqüências; b) a porcentagem de empregados que tiveram um número de faltas anuais ≤ 2? (R: 30%)
Prof. Rodney Dieguez

Apostila de Estatística

35

c) a porcentagem de empregados que tiveram um número de faltas anuais ≤ 3?(R: 62,5%) d) a porcentagem de empregados que tiveram um número de faltas anuais ≥ 5? (R: 15%) e) a porcentagem de empregados que tiveram um número de faltas anuais ≥ 4? (R: 37,3%) f) a média (R: 3,1) g) a mediana e a moda (R: Md= 3; Mo= 3) 3. Uma companhia afirma que o índice médio de nicotina dos cigarros que fabrica está dentro do limite estabelecido pelas organizações mundiais de combate ao câncer. Um laboratório que estuda os males do cigarro à saúde realiza uma análise, utilizando uma amostra de 7 cigarros dessa companhia e obtém as seguintes quantidades de nicotina (em mg): 25 24 23 22 29 23 23

Sabendo que o índice médio de nicotina recomendado por essas organizações deve variar entre 21mg/cigarro e 22mg/cigarro, responda: a) Qual é o índice médio de nicotina encontrado na amostra; (R: 24 mg/cig) b) Qual é o índice modal de nicotina encontrado na amostra; (R: Mo=23mg/cig) c) Qual é o índice mediano de nicotina encontrado na amostra; (R: Md=23 mg/cig) d) Na sua opinião, o fabricante está obedecendo ao índice médio de nicotina recomendado pelas organizações internacionais? Justifique a sua resposta!

7.4. Capítulo 6
1. Amostras de solo resultaram na seguinte distribuição para os valores de pH de um solo latossol vermelho-amarelo.

Classe de pH 4,5 |------ 5,5 5,5 |------ 6,5 6,5 |------ 7,5 7,5 |------ 8,5

Freqüência 6 3 4 7
Prof. Rodney Dieguez

Apostila de Estatística

36

8,5 |------ 9,5 Pede-se: a) O pH médio; (R.7) b) O pH mediano; (7,25) c) O pH modal; (R. 8)

4

d) A variância, o desvio padrão e o coeficiente de variação. 2. O transporte público e o automóvel são dois meios de transportes que uma pessoa pode usar para ir ao trabalho diariamente. Amostras de tempo para cada meio de transporte estão registradas a seguir. Os tempos estão em minutos.
Transporte público Automóvel 28 29 29 31 32 33 37 32 33 34 25 30 29 31 32 32 41 35 34 33

Qual o meio de transporte deve ser o preferido pelas pessoas? Justifique. (R: o automóvel, pois tem a menor variabilidade) 3. Abaixo se tem o peso (kg) e altura (cm) de uma amostra de 6 pessoas. Peso (kg) Altura (cm) Pede-se: a) Calcule o peso médio e a altura média; (69kg; 169 cm) b) Quem é mais variável, o peso ou a altura? Justifique sua resposta.( o peso, pois seu CV é maior) 79 170 83 179 57 165 58 156 67 165 70 179

Prof. Rodney Dieguez

Apostila de Estatística

37

8. Referências Bibliográficas
ANDERSON, D. R., SWEENEY, D. J., WILLIAMS, T. A. Estatística Aplicada à Administração e Economia. 1. ed. São Paulo: Thomson Learning, 2002. LARSON, R; FARBER, B. Estatística Aplicada. 2 ed. São Paulo: Prentice Hall, 2004. SILVA, E. M. et al. Estatística para os cursos de Economia, Administração e Ciências Contábeis. v. 1e 2; 3. ed. São Paulo: Atlas, 1999. VIEIRA, S. Princípios de Estatística. São Paulo: Thomson Learning, 2000.

Prof. Rodney Dieguez