You are on page 1of 64

ESTATÍSTICA DESCRITIVA CAPÍTULO 1 - DISTRIBUIÇÃO DE FREQÜÊNCIAS

BIBLIOGRAFIA CONSULTADA: 1. ANDERSON, D.R.; SWEENEY, D.J. & WILLIAMS, T.A. Estatística Aplicada à Administração e Economia. 2.ed. São Paulo: Pioneira Thomson Learning, 2002. 2. BUSSAB, W. O. & MORETIN, P. Métodos Quantitativos: Estatística Básica. 5.ed. São Paulo: Saraiva, 2002. 3. MARTINS, G. A. Estatística Geral e Aplicada. 2.ed. São Paulo: Atlas, 2002. 4. MARTINS, G. A. & DONAIRE, D. Princípios de Estatística. 4.ed. São Paulo: Atlas, 1995. 5. MEDEIROS, E. S. e colaboradores. Estatística para os Cursos de Economia, Administração e Ciências Contábeis. vol. 1 e 2. 3.ed. São Paulo: Atlas, 1999. 6. STEVENSON, W. J. Estatística Aplicada à Administração. 3.ed. São Paulo: Harbra Harper How do Brasil, 2001. 7. TRIOLA, M.F. Introdução à Estatística. 10.ed. Rio de Janeiro: LTC, 2008.

1. INTRODUÇÃO
DEFINIÇÃO: O QUE É ESTATÍSTICA? É a ciência que fornece métodos e processos quantitativos para planejamento, coleta, organização, descrição, análise e interpretação de dados. Particularmente em administração, economia e ciências contábeis, uma grande razão para entender estatística é dar aos tomadores de decisão um melhor entendimento/controle do ambiente administrativo, possibilitando decisões objetivas, previsões precisas e transmissão da mensagem desejada de forma eficaz. PARTE DA NOMENCLATURA UTILIZADA EM ESTATÍSTICA: • • • • • • • • • Dados estatísticos são fatos ou números que são coletados, organizados em tabelas e/ou gráficos, analisados e interpretados. Dados brutos são uma seqüência de fatos ou valores numéricos não organizados, obtidos diretamente da observação de um fenômeno. Rol é uma seqüência ordenada (crescente ou decrescente) de dados brutos. Elementos são as entidades sobre as quais os dados são coletados. Variável é a característica de interesse para os elementos. Dados qualitativos consistem em rótulos ou nomes para uma característica de um elemento, podendo ser não-numéricos ou numéricos. Dados quantitativos consistem em números que representam contagens ou medidas. População ou universo é o conjunto de todos os elementos de interesse em um determinado estudo. Amostra é um subconjunto da população.
1

Exemplos:

População: dados estatísticos da população brasileira levantados pelo IBGE no censo demográfico realizado a cada 10 anos. Amostra: dados obtidos em testes após a fabricação de um pequeno número de peças antes de se iniciar sua fabricação em grande escala.

Quando a população é muito grande, a Estatística recorre a uma amostra. Entretanto, a AMOSTRA DEVE REPRESENTAR EFETIVAMENTE A POPULAÇÃO. ESTUDOS ESTATÍSTICOS Muitas vezes, os dados necessários para uma aplicação particular não estão disponíveis através de fontes existentes. Em tais casos, os dados freqüentemente podem ser obtidos realizando-se um estudo estatístico. Os estudos estatísticos podem ser experimentais ou observacionais. Em um estudo experimental, identifica-se inicialmente o elemento de interesse. Então, variáveis relacionadas a esse elemento são identificadas e controladas de modo que os dados que influenciam a variável possam ser obtidos. Por exemplo, uma empresa farmacêutica quer entender como uma nova droga afeta a pressão sangüínea. A pressão sangüínea é a variável de interesse no estudo. O nível de dosagem da nova droga é outra variável que se sabe ter efeito causal sobre a pressão sangüínea. Para obter os dados sobre o efeito da nova droga, seleciona-se uma amostra de indivíduos. O nível de dosagem é controlado com diferentes grupos de indivíduos recebendo diferentes dosagens. Os dados sobre a pressão sangüínea são coletados para cada grupo. A análise estatística dos dados experimentais pode ajudar a determinar como a nova droga afeta a pressão sangüínea. Nos estudos observacionais, não existe qualquer tentativa de controlar as variáveis de interesse. Por exemplo, em um levantamento de entrevista pessoal, primeiro identificam-se as questões de pesquisa. Então um questionário é concebido e ministrado à amostra de indivíduos. Alguns restaurantes usam estudos observacionais para obter dados sobre a opinião de seus clientes sobre a qualidade dos alimentos, do serviço, do ambiente, da higiene, etc. As categorias de respostas como excelente, bom, satisfatório e insatisfatório, fornecem os dados que torna possível aos analisadores avaliar a qualidade do restaurante. HÁ DUAS ÁREAS PRINCIPAIS NA ESTATÍSTICA Estatística Descritiva: é uma das etapas que tem por objetivos o planejamento, a coleta, a organização e descrição de dados. Utiliza números, tabelas ou gráficos para descrever fatos (análise exploratória de dados). Exemplo: pesquisa sobre a votação em cada candidato em época de eleição - planejamento, coleta, organização e descrição de somente 2% dos votos (amostra). Inferência Estatística: é a etapa em que os dados amostrais são analisados e interpretados para se fazer estimativas e testar hipóteses sobre as características da população. Portanto, através da análise de uma amostra da população procura-se medir, inferir ou estimaras leis de comportamento da população da qual a amostra foi retirada. Exemplo: a partir da organização de 2% das intenções de voto da população, infere-se a porcentagem de votos em cada candidato para toda a população. A coleta, organização e descrição dos dados estão a cargo da Estatística Descritiva. A análise e interpretação desses dados ficam a cargo da Estatística Inferencial.

2

FASES DO MÉTODO ESTATÍSTICO 1.1 A coleta, a organização e a descrição de dados Após o planejamento e a devida determinação de características notáveis ou mensuráveis, ou seja, da variável de interesse do elemento que se quer pesquisar, dá-se início à coleta dos dados numéricos necessária à sua descrição. Por mais diversa que seja a finalidade, os dados devem ser apresentados sob a forma adequada de tabelas chamadas de tabelas de distribuições de freqüências ou por gráficos, tornando mais fácil o exame daquilo que está sendo objeto de tratamento estatístico. 1.2 A análise e a interpretação de dados O objetivo da análise e a interpretação de dados é tirar conclusões sobre a população, a partir de informações fornecidas por parte representativa dessa população (amostra), ou seja, consiste em obter-se e generalizar-se conclusões, a partir de resultados particulares. VARIÁVEIS A análise estatística apropriada de uma determinada variável depende de sua natureza. É importante conhecer a natureza da variável, pois para cada tipo de variável, há uma técnica mais apropriada para se resumir as informações e otimizar a análise. As variáveis são classificadas como Variáveis Qualitativas e Variáveis Quantitativas. • Variáveis Qualitativas: apresentam uma qualidade ou atributo da variável. Ex.: sexo (masculino, feminino), estado civil (solteiro, casado, viúvo, divorciado), grau de escolaridade (1o grau, 2ograu, superior, etc). Dentre as variáveis qualitativas existe uma segunda classificação: nominais ⇒ variáveis sem ordenação (sexo: masculino, feminino) e ordinais ⇒ variáveis que devem respeitar ordem estabelecida (grau de escolaridade: 1o grau, 2o grau, superior, etc). Variáveis Quantitativas: apresentam números resultantes de uma contagem ou de uma medida. Ex.: número de filhos, nível salarial, idade, etc. As variáveis quantitativas podem ser: discretas ⇒ quando os possíveis valores são provenientes de uma contagem, portanto, seus valores são expressos por números inteiros (número de filhos, número de empregados de uma empresa, etc) e contínuas ⇒ quando os possíveis valores são provenientes de uma medição, portanto, essa variável pode assumir qualquer valor em certo intervalo da reta real, ou seja, números inteiros e decimais (peso, altura, idade, nota de alunos, lucro de empresas, etc).

Referindo-se ao conjunto de dados na Tabela 1, abaixo, como mais um exemplo, cada empresa é um elemento. Como são 25 empresas, existem 25 elementos no conjunto de dados. Os dados relativos à variável Bolsa de Valores (NYSE, AMEX e OTC) são rótulos usados para identificar onde as ações são comercializadas. Assim, os dados são qualitativos e a Bolsa de Valores é uma variável qualitativa. O Símbolo no Painel Eletrônico é também uma variável qualitativa e os valores de dados AWRD, CHK, CRG, etc são os rótulos usados para identificar a empresa correspondente. A variável Número de Negócios Realizados Anualmente é uma variável quantitativa discreta, pois essa variável só pode assumir valores inteiros. As variáveis Vendas Anuais, Preço da Ação e Relação Preço/Ganhos são variáveis quantitativas contínuas já que podem assumir quaisquer valores do conjunto dos números reais ℜ . Para propósitos de análise estatística, a diferença importante e relevante entre dados qualitativos e quantitativos é que as operações aritméticas comuns só tem significado com dados quantitativos. Por exemplo, com dados quantitativos, os valores de dados podem ser adicionados e divididos pelo número total de dados para calcular seu valor médio. Essa média tem significado e, em geral, é facilmente interpretada. No entanto, quando dados qualitativos são registrados como valores numéricos, tais operações aritméticas fornecem resultados sem nenhum significado.
3

384 689.432 499.2 26.3 16.3 30.0 18.334 1.6 88.250 Empresa Relação Preço/Ganhos Award Software Chesapeak Energy Craig Corporation Edisto Resources Franklin Elect.5 71.5 90.4 254.500 10.6 60.125 7.250 5.Tabela 1 – Conjunto de dados contendo informações financeiras referentes a 25 empresas.500 10. 4 .123.375 5.489 o Vendas Anuais (US$ milhões) 15.5 Preço da Ação (US$) 11.750 39.9 78.875 9.981 261.998 109. American Association of Individual Investors.688 15.5 6.890 229.688 12.7 27.877 115.1 27.000 9.4 Fonte: Stock Investor Pro.7 17.500 44.2 11.1 23.130 10.1 15.7 7.8 66.401 121.563 15.750 6.2 34.8 17.2 26.9 164.004 256.7 7. Lumisys.750 8.786 64.1 52.456 246.5 12.500 7. 31 de agosto de 1997.678 378. TABELA DE DISTRIBUIÇÃO DE FREQÜÊNCIAS Uma distribuição de freqüência é um sumário tabular de dados que mostra a freqüência (ou o número) de observações em cada uma das diversas classes não sobrepostas.375 10.115.0 13.7 7. Inc.7 255.990 118.4 24. 2. O objetivo da distribuição de freqüências é reduzir a quantidade de dados.156 545.367 310.000 7.2 15.7 38.211 147.2 4.5 28.1 21.870 345.7 32.7 27. Bolsa de Valores Símbolo do Painel Eletrônico AWRD CHK CRG EDT FEP GNTIY GPO HOTT HGC ICUI J KNTK LARS LUMI MOIL MDII MKA NHHC TEAM OCAD OROA OVRL PIAM PLEN PRWW N de Negócios Realizados Anualmente 63.875 11.3 29. Pbls Gentia Software Giant Group Hot Topic Hudson General ICU Medical Jackpot Enterprises Kentek Information Larscom.313 7.934 130.6 14.000 8.0 11.365 30.5 16.458 123.7 28.2 48.5 123.954 114. Inc.002 200.237 1.880 5.750 6.880 17.0 67.698 85.4 2.8 10. Maynard Oil Mechanical Dynamics Metrika Systems National Home Health National Tech Team OrCad OroAmerica Overland Data PIA Merchandising Plenum Publishing Premier Research OTC NYSE NYSE AMEX NYSE OTC NYSE OTC AMEX OTC NYSE OTC OTC OTC OTC OTC AMEX OTC OTC OTC OTC OTC OTC OTC OTC 22.0 15.

metade dos funcionários. segundo o grau de escolaridade.00 Fonte: Dados fictícios Tabela 3 – Freqüência absoluta e freqüência relativa percentual dos 2000 funcionários da empresa GAMA.50 2o grau 1020 51. segundo o grau de escolaridade. f ri = fi n É mais usual exprimir a freqüência relativa em porcentagem (freqüência relativa percentual): f ri = fi × 100 n A freqüência absoluta não é comparativa.50 Total 2000 100. o significado desse número é bem diferente.2.00 Fonte: Dados fictícios Não podemos comparar diretamente as colunas das freqüências absolutas das tabelas 2 e 3. a totalidade de seus 20 funcionários tem o 1o grau. pois um mesmo valor pode apresentar diferentes significados dependendo do número total de observações. Grau de Freqüência Freqüência relativa escolaridade Absoluta fi percentual fri (%) 1o grau 650 32. A DISTRIBUIÇÃO DE FREQÜÊNCIAS • • Freqüência Absoluta (fi) ⇒ número de vezes em que cada resultado aparece no conjunto de dados. Na empresa BETA. as colunas de porcentagens são comparáveis. Exemplo para a variável qualitativa grau de escolaridade: Na empresa ALFA.00 3o grau 330 16. pois reduzimos as freqüências a um mesmo total (no caso 100). pois os totais de empregados são diferentes nos dois casos.33 2o grau 18 50. possui o 1o grau. Mas.00 o 3 grau 6 16. Total de observações (n) ⇒ a soma das freqüências absolutas. ou seja 20. n = ∑ fi i • Freqüência Relativa (ou proporção) (fri) ⇒ proporção de cada realização em relação ao total.1. Exemplos: Tabela 2 – Freqüência absoluta e freqüência relativa percentual de 36 funcionários do departamento de recursos humanos da empresa GAMA. Grau de Freqüência Freqüência relativa escolaridade Absoluta fi percentual fri (%) 1o grau 12 33. Apesar de a freqüência absoluta ser a mesma nas duas empresas. 5 .67 Total 36 100. Para tornar os dados comparativos utiliza-se a proporção (freqüência relativa) ou a freqüência relativa percentual.

DISTRIBUIÇÃO DE FREQÜÊNCIAS – VARIÁVEL QUANTITATIVA DISCRETA Um conjunto de dados. + f i • Freqüência acumulada relativa (FRi) ⇒ divisão da freqüência acumulada de um elemento pelo número total de elementos da série.00% dos funcionários possuem 2o grau. Para sintetizar dados.33 2o grau 18 50.00 Total 36 100.33% dos funcionários não possuem 3o grau.Além das freqüências absoluta e relativa pode-se tabular a freqüência acumulada.67% dos funcionários possuem 3o grau. freqüentemente. abaixo.. 50.00 30 83. 33.. pois fornece meios de organizar e resumir os dados de modo que padrões sejam revelados e os dados sejam mais facilmente interpretados. freqüência acumulada e freqüência acumulada percentual dos 36 funcionários do departamento de recursos humanos da empresa GAMA. Fi = Com esses dados a Tabela 2 se torna: Fi n Tabela 4 – Freqüência absoluta. 2. na qual além de outras informações. 83. Fi = f1 + f 2 + . 6 .33% dos funcionários possuem somente o 1o grau. é apresentada a variável quantitativa discreta Número de Filhos de 36 funcionários do departamento de recursos humanos da empresa GAMA.2.33 o 3 grau 6 16. freqüência relativa percentual. utiliza-se a distribuição de freqüências.33 12 33. 30 funcionários possuem até 2o grau.00 --------Fonte: Dados fictícios Análise de alguns valores provenientes da distribuição de frequências. a representação em tabelas é muito útil. como exemplo: 12 funcionários não possuem 2o e 3o graus. Observe na Tabela 5. Grau de Freqüência Freqüência relativa Freqüência Freqüência Acumulada escolaridade Absoluta fi percentual fri (%) Acumulada Fi = Fac Relativa .67 36 100. • Freqüência acumulada (Fi ou Fac) ⇒ soma da freqüência absoluta de um elemento com as freqüências absolutas dos elementos que o antecedem. 16. No caso das variáveis quantitativas discretas. é difícil de interpretar diretamente na forma em que é reunido.FRi (%) 1o grau 12 33. segundo a variável qualitativa Grau de Escolaridade. apresentados na Tabela 4.

12 8.95 9.00 4. 7 . localizada na cidade de São Paulo. no de filhos.56 5.86 7.69 14.25 5.74 8.39 7.61 17.35 9.79 13. Min.71 15.26 18.85 14.53 10.73 6.13 9.44 8.75 19. salário.) 4.Tabela 5 – Informações sobre estado civil. No 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 Estado Civil Solteiro Casado Casado Solteiro Solteiro Casado Solteiro Solteiro Casado Solteiro Casado Solteiro Solteiro Casado Casado Solteiro Casado Casado Solteiro Solteiro Casado Solteiro Solteiro Casado Casado Casado Solteiro Casado Casado Casado Solteiro Casado Casado Solteiro Casado Casado Grau de escolaridade 1º Grau 1º Grau 1º Grau 2º Grau 1º Grau 1º Grau 1º Grau 1º Grau 2º Grau 2º Grau 2º Grau 1º Grau 2º Grau 1º Grau 2º Grau 2º Grau 2º Grau 1º Grau Superior 2º Grau 2º Grau 2º Grau 1º Grau Superior 2º Grau 2º Grau 1º Grau 2º Grau 2º Grau 2º Grau Superior 2º Grau Superior Superior 2º Grau Superior No de filhos 0 1 2 0 0 0 0 0 1 0 2 0 0 3 0 0 1 2 0 0 0 2 2 0 2 2 0 0 5 2 0 1 3 0 2 3 Salário (x Sal.76 11.59 7.90 Idade (anos) 26 32 36 20 40 28 41 43 34 23 33 27 37 44 30 38 31 39 25 37 30 34 41 26 32 35 46 29 40 35 31 36 43 33 48 42 Região de Procedência Interior Capital Capital Outro Estado Outro Estado Interior Interior Capital Capital Outro Estado Interior Capital Outro Estado Outro Estado Interior Outro Estado Capital Outro Estado Interior Interior Outro Estado Capital Outro Estado Outro Estado Interior Outro Estado Outro Estado Interior Interior Capital Outro Estado Interior Capital Capital Capital Interior Fonte: Dados fictícios Para agrupar os dados da variável quantitativa discreta Número de Filhos basta proceder à contagem para cada um dos valores diferentes da variável em estudo e construir a tabela de distribuição de freqüências.99 16.00 12.06 11.23 13.60 13.59 12.46 8.66 6.77 9.26 6. grau de escolaridade.80 10.22 16. idade e procedência de 36 funcionários do departamento de recursos humanos da empresa GAMA.40 21.

Tabela 6 – Freqüência absoluta, freqüência relativa percentual, freqüência acumulada e freqüência acumulada percentual dos 36 funcionários do departamento de recursos humanos da empresa GAMA, segundo a variável quantitativa discreta Número de Filhos. No de Freqüência Freqüência relativa Freqüência Freqüência Acumulada filhos Absoluta fi percentual fri (%) Acumulada Fi = Fac Relativa - FRi (%) 0 19 52,78 19 52,78 1 4 11,11 23 63,89 2 9 25,00 32 88,89 3 3 8,33 35 97,22 5 1 2,78 36 100,00 Total 36 100,00 ---------

2.3. DISTRIBUIÇÃO DE FREQÜÊNCIAS – VARIÁVEL CONTÍNUA (COM INTERVALOS DE CLASSE) Um dos objetivos de se construir a distribuição de freqüências é resumir o conjunto de dados. No caso de variáveis contínuas, não se pode construir a distribuição de freqüências listando os resultados um a um, pois não havendo observações iguais, não há redução dos dados em uma tabela. Desta forma, é interessante agrupar os resultados em classes não sobrepostas, calculadas de forma mais elaborada. Para agrupar os dados de uma variável contínua em classes, é necessário adotar classes de mesma amplitude, sempre que possível, e: 1. Determinar a extensão (amplitude) total dos dados a tabelar; 2. Determinar o número de classes não sobrepostas; 3. Determinar a extensão (amplitude) de cada classe; 4. Determinar os limites de classe. • Amplitude total de uma seqüência (At) ⇒ diferença entre o maior e o menor elemento de uma seqüência. Representa o comprimento total da seqüência.

A t = x max − x min
• Número de Classes (k) ⇒ existem vários critérios para se calcular o número de classes k. O mais utilizado é a fórmula empírica:

k = n , onde n é o número de elementos observados.
• Amplitude de classe (h) ⇒ é determinada por:

h=

At k

Neste ponto, é importante observar que o número de classes deve ser determinado adequadamente. Quando se adota um grande número de classes não há redução dos dados, enquanto que para um número pequeno de classes as informações podem ser perdidas. Sugere-se o uso de 5 a 15 classes com a mesma amplitude. Exemplo: A partir da Tabela 5, computando as freqüências absolutas de cada classe para a variável quantitativa contínua salários, é possível construir a tabela de freqüências. Pode-se observar que estão tabelados 36 salários que vão de 4,00 até 21,90 salários mínimos. Portanto, calcula-se: Número de classes: Amplitude total:

k = n = 36 = 6 A t = x max − x min = 21,90 – 4,00 = 17,90
8

Amplitude de cada classe:

h=

At k

=

17,90 = 2,98 ≅ 3 6

Tabela 7 – Freqüência absoluta, freqüência relativa percentual, freqüência acumulada e freqüência acumulada percentual dos 36 funcionários do departamento de recursos humanos da empresa GAMA, segundo a variável quantitativa contínua Salário. Classes de salário Freqüência Freqüência relativa Freqüência Freqüência Acumulada (x salário mínimo) Absoluta fi percentual fri (%) Acumulada Fi = Fac Relativa - FRi (%) 4,00 a 7,00 7 19,44 7 19,44 7,00 a 10,00 11 30,56 18 50,00 10,00 a 13,00 6 16,67 24 66,67 13,00 a 16,00 6 16,67 30 83,34 16,00 a 19,00 4 11,11 34 94,45 19,00 a 22,00 2 5,55 36 100,00 Total 36 100,00

Análise de alguns valores oriundos da distribuição de freqüências, apresentados na Tabela 7, como exemplo: 11 funcionários recebem salários entre 7,00 e 10,00 s.m. 16,67% dos funcionários, o que equivale a 6 funcionários, recebem salários entre 10,00 e 13,00 s.m. 5,55% dos funcionários, o que equivale a 2 funcionários apenas, recebem os maiores salários, que situam-se entre 19,00 e 22,00 s.m. 11,11% dos funcionários recebem salários entre 16,00 e 19,00 s.m. 30 funcionários recebem menos que 16,00 s.m. ou salários entre 4,00 e 16,00 s.m. 6 funcionários recebem pelo menos 16,00 s.m. 66,67% dos funcionários recebem menos que 13,00 s.m. 33,33% dos funcionários recebem pelo menos 13,00 s.m..

9

LISTA 1 - Exercícios para fixação
1. Declare se cada uma das seguintes variáveis é qualitativa (nominal ou ordinal) ou quantitativa (discreta ou contínua): a) Idade b) Gênero c) Marca de Automóveis d) Número de pessoas favoráveis à pena de morte e) Vendas anuais (em milhões de reais) de uma empresa brasileira f) Tamanho de camisetas (PP, P, M, G, GG) g) Lucro por ação de uma empresa h) Método de pagamento (à vista, com cheque, com cartão de crédito, etc) i) Vida útil de lâmpadas j) Sexo dos filhos de um casal k) Produção anual de automóveis marca FORD em uma capital l) Número de ações negociadas na BOVESPA m) Salário dos funcionários de uma empresa pública n) Índice de liquidez das indústrias da cidade de Bauru o) Classe social dos habitantes de um município p) Produção anual de café do Estado de São Paulo q) Grau de escolaridade dos funcionários de uma empresa privada r) Peso de lutadores de boxe na categoria “Peso Pena” s) Número de livros existentes na biblioteca de uma universidade t) Altura de jovens selecionados para se tornarem jogadores de vôlei u) Consumo mensal de energia elétrica (em kWh) em um condomínio v) Patente militar w) Ocupação profissional x) Cargos hierárquicos em uma empresa y) Espessura de folhas de papel z) Número de acidentes de trânsito 2. Na tabela abaixo, é mostrada a remuneração dos altos executivos CEOS (Chief Executive Officer), a classificação por setor, as vendas anuais e os dados de avaliação da remuneração dos CEOS versus o retorno dos acionistas para 10 empresas. Uma avaliação 1 da remuneração dos CEOS versus o retorno dos acionistas indica que a empresa está no grupo de empresas que tem a melhor relação. Uma avaliação 2 indica que a empresa é similar às empresas que tem uma relação muito boa, mas não a melhor. Empresas com a pior relação têm uma avaliação 5. Remuneração dos Remuneração dos Vendas Empresa Setor Altos Executivos Altos Executivos vs. (US$ milhões) (US$ 1000) Retorno dos Acionistas Bankers Trust 8.925 Bancário 9.565 3 Coca Cola General Mills LSI Logic Motorola Readers Digest Sears Sprint Walgreen Wells Fargo 2.437 1.410 696 1.847 1.490 3.414 3.344 1.490 2.861 Bebidas Alimentação Eletrônico Eletrônico Gráfico Varejo Telecomunicações Varejo Bancário 18.546 5.567 1.239 27.973 2.968 38.236 14.045 12.140 8.723 5 1 2 4 3 4 4 2 3

Fonte: Business Week, 21 de abril de 1997.

10

7 Código do Setor 8 19 19 12 15 2 11 10 22 48 Fonte: Fortune.454 38. Os dados para uma amostra de empresas da Fortune 500 estão na tabela abaixo.157. Tyson Foods Hewlett-Packard Intel Northrup Seagate Tech. b) Qual é a escola com menor freqüência absoluta? Quantos alunos foram pesquisados nessa escola? c) Qual é a escola com maior freqüência relativa? Qual a porcentagem de alunos pesquisados nessa escola? d) Qual o número de alunos pesquisados na escola D? 6.847 8.0 87.3 49. A pesquisa foi aplicada a 200 jovens. a) Construa uma distribuição de freqüência adotando essa amostra de 200 alunos de todas as escolas aleatoriamente. escolhidos ao acaso. Complete as tabelas: a) xi 0 1 2 3 4 5 6 7 Total b) fi 1 4 3 2 1 25 15 fri (%) 15 xi 20 25 30 35 40 45 50 Total fi 45 30 60 30 10 300 11 fri (%) 5 . Unisys Westvaco Woolworth a) b) c) d) e) f) Vendas (US$ milhões) 10. A escola A tem 1500 alunos. Empresa Banc One CPC Intl.371 3. todos nessa faixa etária.272 9.092 Lucros (US$ milhões) 1. C e D.0 213.427. Quantos elementos existem nesse conjunto de dados? Qual é a população? Quantas variáveis existem no conjunto de dados? Quais variáveis são qualitativas e quais são quantitativas? Que porcentagem de empresas teve um lucro acima de US$ 100 milhões? Que porcentagem de empresas tem código de setor 8? 5. 2500 alunos.2 168.0 234. A revista Fortune fornece dados sobre a classificação das 500 maiores corporações industriais dos Estados Unidos em termos de vendas e de lucros.071 8.588 6.844 6.0 2. 4000 alunos. a escola B. 2000 alunos e a escola D.0 5.586.a) b) c) d) e) Quantos elementos existem nesse conjunto de dados? Quantas variáveis existem nesse conjunto de dados? Quais variáveis são qualitativas e quais variáveis são quantitativas? Que porcentagem das empresas pertence ao setor bancário? Que porcentagem das empresas recebeu um valor 3 na avaliação da remuneração dos CEOS versus o retorno dos acionistas? 4.420 20.0 580.075 8. B. a escola C. 28 de abril de 1997.7 212. Suponha que um psicólogo queira fazer uma pesquisa sobre o comportamento do jovem de 11 a 14 anos em quatro escolas: A.

Resuma os dados em uma tabela de freqüências. O controle de qualidade selecionou 50 caixas na linha de produção e anotou em cada caixa o número de peças defeituosas. Os resultados do lançamento de um dado 50 vezes foram os seguintes: 6 1 5 2 5 5 6 4 2 6 2 3 3 5 2 6 3 1 2 4 4 5 3 5 6 3 1 5 1 1 6 3 4 3 5 2 6 4 6 2 6 3 2 5 4 5 4 6 1 3 12 . Contou-se o número de erros de impressão de um jornal durante 40 dias. Qual a porcentagem de dias em que ocorreram menos que 10 erros? Qual a porcentagem de dias em que ocorreram pelo menos 15 erros? Qual a porcentagem de dias em que ocorreram mais que 12 erros? Qual o número de dias em que ocorreram 11 erros? Qual o número de dias em que ocorreram menos que 7 erros? Qual o número de dias em que ocorreram pelo menos 7 erros? 8. obtendo-se os seguintes resultados: 8 10 10 5 12 11 14 12 12 10 12 6 8 7 7 5 14 12 16 15 7 10 12 18 15 6 12 8 9 11 16 15 5 12 6 7 14 10 12 8 a) b) c) d) e) f) g) h) i) Classifique o tipo de variável que se quer analisar estatisticamente. construa a distribuição de freqüências para variável discreta e responda: a) Qual a porcentagem de caixas com 2 peças defeituosas? b) Qual a porcentagem de caixas com menos que 2 peças defeituosas? c) Qual a porcentagem de caixas com pelo menos 2 peças defeituosas? d) Qual a porcentagem de caixas com mais que 2 peças defeituosas? e) Qual o número de caixas com 3 peças defeituosas? f) Qual o número de caixas com pelo menos 3 peças defeituosas? g) Qual o número de caixas com menos que 3 peças defeituosas? h) Qual o número de caixas em que não há peças defeituosas? 10.7. b) Qual a porcentagem de calouros com pelo menos 20 anos? c) Quantos calouros têm menos que 20 anos? d) Quantos calouros têm mais que 18 anos? 9. Uma indústria embala peças em caixas com 100 unidades. Uma pesquisa sobre a idade completa (cheia) dos alunos de uma classe de calouros de uma faculdade. revelou os seguintes valores: 18 17 18 20 21 19 20 18 17 19 20 18 19 18 19 21 18 19 18 18 19 19 21 20 17 19 19 18 18 19 18 21 18 19 19 20 19 18 19 20 18 19 19 18 20 20 18 19 18 18 a) Agrupe por freqüência estes dados para variável quantitativa discreta idade completa dos calouros. Elabore o rol. Obteve os seguintes dados: 2 0 0 4 3 0 0 1 0 0 1 1 2 1 1 1 1 1 1 0 0 0 3 0 0 0 2 0 0 1 1 2 0 2 0 0 0 0 0 0 0 0 0 0 0 0 1 4 1 2 Agrupe estes dados por freqüência.

Complete os dados que faltam na distribuição de freqüências: a) b) fi fri (%) Classes Classes 0a 8 10 0 a 2 8 a 16 10 2 a 4 16 a 24 14 4 a 6 24 a 32 9 32 a 40 8 a 10 Total 40 10 a 12 14 a 16 Total fi 2 9 13 fri (%) 4 8 16 12 3 14.8 7. durante um mês.2 4.6 4. b) Qual a porcentagem de vezes que ocorreu face par? c) Qual a porcentagem de vezes que ocorreu a face 5? d) Qual o número de vezes que ocorreu face ímpar? e) Qual o número de vezes em que ocorreram números primos*? * Definição de número primo = números que possuem apenas dois divisores: o próprio número e o número 1.7 7.5 3. (Exceção: número 1).3 Determinar: a) A amplitude total At.0 3.9 3. 2.4 5.8 4. e) A porcentagem de motoristas que sofreram no máximo 2 acidentes.6 10.5 10.a) Construa uma distribuição de freqüências para a variável discreta. Os seguintes dados mostram a duração das chamadas (em minutos) para uma amostra de 30 reservas feitas por telefone.0 minutos. A SP Transportes Aéreos aceita reservas de vôo por telefone.8 5.9 11. d) O número de motoristas que sofreram no mínimo 3 e no máximo 5 acidentes. o número de classes k e a amplitude de cada classe h.9 4. b) A distribuição de freqüências para a variável contínua.8 4.5 2.3 2.8 5. c) A porcentagem de ligações com duração menor que 8. A distribuição abaixo indica o número de acidentes ocorridos com 70 motoristas de uma empresa de ônibus: No de acidentes 0 1 2 3 4 5 6 7 No de motoristas 20 10 16 9 6 5 3 1 Determine: a) O número de motoristas que não sofreram acidentes.3 11.6 6. 11. A tabela abaixo apresenta as vendas diárias de um determinado aparelho por uma empresa comercial: 14 12 11 13 14 12 14 13 14 11 12 14 10 13 15 15 13 16 17 14 a) Construa a distribuição de freqüências para a variável discreta.8 6. 13. b) O número de motoristas que sofreram pelo menos 4 acidentes. c) O número de motoristas que sofreram menos de 3 acidentes.5 5.5 8.5 7.0 10.5 5.5 4.1 9. b) Em quantos dias as vendas foram superiores a 13 unidades? c) Qual a porcentagem de dias com vendas inferiores a 12 unidades? d) Em quantos dias as vendas foram inferiores a 15 unidades? e) Qual a porcentagem de dias com vendas de no mínimo 10 unidades? elétrico. 13 . 13 12 11 14 12.4 4.

e) A porcentagem de ligações com duração entre 4.0 4.0 5.5 7.5 5.5 4. e) O número de alunos que tiraram nota maior ou igual a 6.0.5 6.5 0. 16. b) A porcentagem de funcionários que ganham pelo menos 4 salários mínimos.0 1. f) O número de ligações com duração maior ou igual a 8.5 5.0 (inclusive) e 8. obtendo os resultados da tabela de distribuição de freqüências dada abaixo: Faixa salarial (em no de salários mínimos) 0 a 2 2 a 4 4 a 6 6 a 8 TOTAL Freqüência absoluta .5 3. c) A porcentagem de funcionários que ganham 2 ou mais salários mínimos.fi 25 30 13 12 80 Determinar: a) A porcentagem de funcionários que ganham menos que 4 salários mínimos.0 5. b) A distribuição de freqüências para a variável contínua.0 minutos de duração.5 (inclusive) e 7.0 6. i) O ponto médio da 3a classe.000 kWh (exclusive)? c) Qual a porcentagem de meses em que o consumo foi inferior a 13.5 4. adotando 9 classes com amplitudes idênticas e responda: a) Qual a porcentagem de meses em que o consumo foi pelo menos 10. h) O limite inferior da 4a classe.0 4. Os dados abaixo referem-se ao consumo residencial: 9520 8720 7760 8720 7440 7920 7200 8880 6880 7520 7200 7760 7680 7680 7440 7760 8880 8240 8240 7840 6640 6960 8480 8880 6720 7760 6880 7760 7120 7120 7360 9360 mensal de energia elétrica (kWh) em um condomínio 7840 8880 8480 8480 8880 8880 8320 8240 8560 7920 8320 9440 8480 8320 8560 8480 8480 10320 8560 8560 8800 8560 8560 13840 9360 9360 9600 12960 13280 13200 12800 8960 12480 11200 11360 12960 14560 13200 12480 14000 Construa a distribuição de freqüências para esses dados. d) O número de alunos que tiraram nota menor que 7.0 7. o número de classes k e a amplitude de cada classe h. 17.0 (exclusive) minutos. c) A porcentagem de alunos que tiraram nota menor que 4.0 6. f) A porcentagem de alunos que tiraram nota entre 4.0 4.0 5.0 8.0 4.0 minutos.0 5. g) O limite inferior da 4ª classe. As notas de 32 estudantes de uma classe são dadas abaixo: 6.d) O número de ligações com pelo menos 4.000 e 11. O departamento de pessoal de certa empresa fez um levantamento dos salários dos 80 funcionários do setor administrativo.000 kWh? 14 .0 1.5 3. 15.5.0 5.5 Determinar: a) A amplitude total At.0 6.5 2.5 (exclusive).0 8.5 7.000 kWh? b) Qual a porcentagem de meses em que o consumo ficou entre 9. e) A amplitude da 4ª classe.0 2. d) A porcentagem de funcionários que ganham entre 2 (inclusive) e 6 (exclusive) salários mínimos. f) O limite superior da 2ª classe.0 0.5. g) O limite superior da 2a classe.0 2.

87 1.09 2.58 3.17 3.20 mm (exclusive)? d) Qual a porcentagem de folhas com espessuras inferiores a 2. porcentagens acumuladas crescentes e pontos médios das classes.72 2.200.200.26 3.95 2.15 1. 20.69 1.00.99 2. mapeou os tipos de reservatório onde esse mosquito era encontrado.25 2.00. O Aedes aegypti é vetor transmissor da dengue.600.84 2.43 2.800.97 2.18 2. 19.75 3.04 1.18 1.38 1.00 1.29 1.04 1.00 a) b) c) d) e) Determine o salário médio de cada uma das 5 classes.01 1.83 3.56 2.89 2.00 1.11 1.000.60 mm? 21.87 2.51 Pede-se: A amplitude total.00 2.35 2. Calcule a porcentagem de funcionários que recebem salário no mínimo de R$ 1.64 2.00 1.09 1. Determine o número de funcionários que recebem salários inferiores a R$ 1.400.00 1.00.d) Qual o número de meses em que o consumo foi igual ou superior a 8.20 2.600.54 1.18 3. a amplitude das classes. fr i (%) Fac FR i (%) Classe 1 2 3 4 5 Salários R$ (xi) 1.45 3.34 2. Os pesos (em kg) dos 40 alunos de uma classe são dados abaixo: 69 65 60 95 57 76 81 49 72 60 71 53 54 49 67 65 92 74 63 62 68 59 64 60 72 66 53 55 58 83 73 74 64 70 81 96 62 45 50 75 Coloque os dados numa tabela de freqüências que contenha as freqüências absolutas.14 2.98 3. calcule: a) Qual a porcentagem de folhas com espessuras iguais ou superiores a 2.00 1. Depois. A tabela abaixo mostra parte dos dados coletados nessa pesquisa.76 1.08 1.00.76 2.800.000 kWh? e) Qual o número de meses em que o consumo foi inferior a 10.71 1.82 1.00 mm? b) Qual o número de folhas com espessuras inferiores a 2.89 2.74 1.19 2.93 2.86 3.94 2.600.06 2.66 1.92 2.400.17 2.56 3.99 2. Construa a distribuição de freqüências para a série abaixo.02 3.24 1.25 2. o número recomendado de classes.400.00 1.24 3.36 1.12 3.200. 15 .22 1. Uma pesquisa feita em São Luís – MA.33 1.96 1.62 1.000. a freqüência relativa das classes e a freqüência acumulada das classes.96 2.15 1. freqüências relativas.18 1.19 2.18 2.96 2.18 1.96 2.06 1.42 3.62 2.05 1.00 a a a a a No de funcionários (fi) 2 6 10 5 2 1.01 1.36 2.01 2.04 3. de 2000 a 2002.06 1.49 1.91 1.01 2.40 1.17 1.78 1.03 2.96 2. Calcule a porcentagem de funcionários que ganham salários pelo menos de R$1.18 2.800. que representa uma amostra dos salários (em R$) de 25 funcionários selecionados em uma empresa.03 1.59 2.000 kWh? 18.80 mm (inclusive) e 2.12 2.08 3. A tabela abaixo representa a distribuição das espessuras (em mm) de 100 folhas de tabaco: 2. a freqüência absoluta das classes.00 1.24 2.59 1.12 1.11 1. Determine o número de funcionários que recebem salários iguais ou superiores a R$ 1.94 2.00 mm? c) Qual o número de folhas com espessuras entre 1.

Folha de S.000.000 e menor que 20. 2005) 2005 - Com base na tabela e no texto acima.000 devedores. III .000. estão listados na tabela abaixo: JUSTIFICATIVAS PARA ATRASO NO PAGAMENTO DO CREDIÁRIO A compra era para outra pessoa 18% Salário atrasado 17% Estar sem dinheiro 12% Perda do emprego 12% Gastou o dinheiro com outras coisas 8% Esquecimento ou falta de tempo 5% a) Qual a frequência relativa das pessoas que apresentaram outras justificativas? b) Quais as frequências absolutas para cada tipo de devedor? 23. II .Paulo. Japão. 22.Se mantido o percentual de redução da população total de Aedes aegypti observada de 2001 para 2002. I .000 e menor que 10. d) maior que 15.000 e menor que 15. b) maior que 5. Os brasileiros tiveram. e) maior que 20. Os principais motivos alegados por 30. em junho. (Adaptado. um número total de mosquitos: a) menor que 5. o que demonstra iniciativas de inclusão digital. Está correto. O país ficou à frente de nações como a França. analise os possíveis motivos para a liderança do Brasil no tempo de uso da internet. ao justificarem atrasos no pagamento do crediário. o que se afirma em: a) I b) II c) III d) I e II e) II e III 16 . apenas. porque essa tecnologia promove a mudança de comportamento dos usuários.O uso de internet em casa se distribui igualmente entre as classes A. em 2003. c) maior que 10. Estados Unidos e Espanha.000.000. o maior tempo de navegação residencial na internet entre onze países monitorados pelo Ibope/NetRatings: média mensal de 16 horas e 54 minutos por pessoa.000. pesquisados em uma região metropolitana. B e C. teria sido encontrado.O país tem uma estrutura populacional com maior percentual de jovens do que os países da Europa e os EUA.A adesão ao sistema de internet por banda larga ocorre.

1999. DIFERENTES TIPOS DE REPRESENTAÇÕES GRÁFICAS DE SÉRIES ESTATÍSTICAS A distribuição de freqüências. 6. J. A.ed. & Batalha. Introdução à Estatística. os dados estatísticos se apresentam em termos de grandezas visualmente interpretáveis. A) GRÁFICO DE COLUNAS OU BARRAS SIMPLES Um gráfico de colunas é um dispositivo gráfico para retratar os dados qualitativos ou quantitativos discretos que foram sintetizados em uma distribuição de freqüências absolutas. Os gráficos propiciam uma idéia preliminar mais satisfatória da concentração e dispersão de valores.1999. ANDERSON. São Paulo: Atlas. MEDEIROS.CAPÍTULO 2 . A. B. 1995. G.A. de linhas. MARTINS. Amazônia: contradições no paraíso ecológico. 2. T. No eixo horizontal do gráfico são especificados os rótulos usados para cada classe. Estatística para os Cursos de Economia. São Paulo: Campus. Estatística Geral e Aplicada. vol. A estatística utiliza vários tipos de gráficos: de barras.R.REPRESENTAÇÃO GRÁFICA DAS SÉRIES ESTATÍSTICAS BIBLIOGRAFIA CONSULTADA: 1.ed.. 2. Exemplo: Na tabela abaixo. 2. São Paulo: Atlas. 4. & DONAIRE D. 3. Ocupação Trabalho não qualificado Artesanato Serviços burocráticos Gerencial Freqüência Absoluta 65 52 34 29 Fonte: Hanan. de setores. São Paulo: Pioneira Thomson Learning. INTRODUÇÃO No item anterior mostrou-se a utilidade das tabelas como instrumento de apresentação e análise de dados estatísticos. de colunas. 4. D. H. uma vez que através deles.ed. Estatística usando o Excel.ed. 5. G.H. D. Estatística Aplicada à Administração e Economia. E. M. Rio de Janeiro: LTC.1.S. 10. tanto de variáveis discretas como de variáveis contínuas. 2002. histogramas e polígonos de freqüência. os fatos essenciais e as relações que poderiam ser difíceis de reconhecer em massas de dados estatísticos podem ser observados mais claramente através dos gráficos. MARTINS. São Paulo: Cultura. 2008. 2005.L. 3. Além disso. Administração e Ciências Contábeis. LAPPONI. & WILLIAMS. 17 .C. A apresentação gráfica é um complemento importante da apresentação tabular. A principal vantagem de um gráfico sobre uma tabela é que ele permite conseguir uma visualização imediata da distribuição dos valores observados. Princípios de Estatística. 2002. A escala de freqüências é colocada no eixo vertical. São Paulo: Atlas.F. freqüências relativas ou freqüências relativas percentuais. Uma das maneiras mais concisas de se apresentar os dados estatísticos de uma tabela é através de gráficos. são apresentados dados de uma distribuição ocupacional na região amazônica de uma amostra de 180 trabalhadores. 4a ed.J.ed. TRIOLA. pode ser interpretada mais facilmente quando os valores dessas variáveis são apresentados em forma de gráficos. Silva e colaboradores. SWEENEY.

Representando-se. a variável qualitativa Ocupação na região amazônica. com barras simples. variáveis qualitativas ou quantitativas discretas. Exemplo: Na tabela abaixo.Representando-se. têm-se: 80 FREQÜÊNCIA ABSOLUTA 70 60 Artesanato 50 40 30 20 10 0 Trabalho Não Qualificado Serviços Burocráticos Gerencial OCUPAÇÃO Um gráfico de barras simples serve para retratar o mesmo tipo de variável que o gráfico de colunas simples. dez 1999. com colunas simples. ou seja. A diferença entre o gráfico de colunas e de barras é que no eixo vertical do gráfico de barras são especificados os rótulos usados para cada classe e a escala de freqüências é colocada no eixo horizontal. são apresentados dados da produção nacional de madeira por região brasileira em porcentagem. graficamente. graficamente. Região Freqüência Relativa (%) Sudeste 4 Centro-Oeste 7 Norte 20 Sul 69 Fonte: Revista de Silvicultura. a variável quantitativa Produção de Madeira por região brasileira. têm-se: SUL REGIÃO BRASILEIRA NORTE CENTRO-OESTE SUDESTE 0 10 20 30 40 50 60 70 80 PRODUÇÃO DE MADEIRA Freqüência Relativa (%) 18 .

000 2004 15. principalmente. evidenciando suas diferenças.000 11.000 11. Brasil.000 2003 13.000 10.000 6. Serve para retratar os dados qualitativos ou quantitativos discretos.000 12.00 Fonte: Revista Bares e Restaurantes. Refrigerante Mais Vendido Freqüência Relativa fri (%) Ângulo (graus) Coca-cola 38 136. set 2006.000 2002 12.40 Total 100 360. 19 .000 2.000 Fonte: Envolverde .000 0 2001 2002 2003 2004 2005 ANOS C) GRÁFICO DE SETORES O gráfico de setores ou pizza é um dispositivo gráfico comumente usado para apresentar as distribuições de freqüência relativa. têm-se: 16. Sua construção é feita com base em um círculo que é dividido em setores com áreas proporcionais às freqüências das diversas categorias. dados qualitativos.000 2005 15.Revista Digital de Ambiente.000 4.000 8. edição 51. Exemplo: Na tabela abaixo está indicada a quantidade de lixo gerado em dois bairros da periferia da cidade de São Paulo.60 Pepsi-cola 16 57. Educação e Cidadania. Representando-se.60 Coca-cola light 11 39. é apresentada a distribuição dos cinco refrigerantes mais vendidos no país. graficamente. abr 2006.000 12. com colunas duplas. Exemplo: Na tabela abaixo.000 14. Este gráfico serve para retratar.80 Guaraná Antarctica 26 93. a variável quantitativa Quantidade de Lixo em dois bairros da cidade de São Paulo.000 6.B) GRÁFICO DE COLUNAS OU BARRAS MÚLTIPLAS É a representação gráfica em que os retângulos referentes a determinado dado são dispostos um ao lado do outro. Quantidade de Lixo (freqüência absoluta) Anos Bairro A (1000 ton) Bairro B (1000 ton) 2001 8.000 QUANTIDADE DE LIXO (1000 ton) 14.60 Sprite 9 32. para facilitar a comparação entre eles.

360 = 136. analogamente. a variável qualitativa Refrigerante Mais Vendido no país. Representando-se. graficamente. 20 .80° 100 Determina-se. Exemplo: Na tabela abaixo. têm-se: SPRITE 9% COCA-COLA LIGHT 11% COCA-COLA 38% PEPSI-COLA 16% GUARANÁ ANTARCTICA 26% D) GRÁFICO DE LINHA É uma aplicação do processo de representação das funções num sistema de coordenadas cartesianas. os ângulos dos outros setores.Para que o ângulo correspondente a cada setor seja determinado. Este gráfico serve para retratar dados quantitativos. Anos 1997 1998 1999 2000 2001 2002 2003 2004 2005 Produção Brasileira de Petróleo (milhões de litros) (freqüência absoluta) 65920 66845 69738 71844 75014 84434 87024 86197 89587 Fonte: Ministério de Minas e Energia. 2007. É útil para se visualizar a variação de uma grandeza em relação à outra. Neste tipo de gráfico se utiliza uma linha poligonal para representar a série estatística. utiliza-se regra de três simples: 100 38 3600 x ⇒ x= 38. está indicada a variável quantitativa discreta Produção Brasileira de Petróleo de 2000 a 2004. com um gráfico de setores.

Anos Oferta e Demanda de Etanol no Brasil (bilhões de litros) (freqüência absoluta) Oferta Demanda 15.73 12. graficamente.98 3. ligam-se esses pontos. nesse caso. 92 PRODUÇÃO DE PETRÓLEO NO BRASIL (bilhões de litros) 88 84 80 76 72 68 64 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 ANO E) GRÁFICO DE LINHAS MÚLTIPLAS É uma aplicação do processo de representação das funções num sistema de coordenadas cartesianas. 2007.12 3. 21 .49 7.05 15. ligam-se esses pontos. dois a dois. o ano no eixo horizontal e as quantidades no eixo vertical.56 12.02 10. Neste tipo de gráfico se utiliza linhas poligonais para representar as séries estatísticas.38 12.51 14. gerando. que é o gráfico em linhas correspondente às séries em estudo. que é o gráfico em linha correspondente à série em estudo. todos os pontos das séries usando os pares ordenados.23 15. dois a dois. graficamente.62 8.Determinados.02 1997 1998 1999 2000 2001 2002 2003 2004 2005 Fonte: Embrapa . estão indicadas as variáveis quantitativas Oferta e Demanda de Etanol no Brasil de 1997 a 2005.50 5. por segmentos de reta.53 16. É útil para comparar a variação de uma grandeza em relação à outra.81 11. duas linhas poligonais (podem ser múltiplas). o que gera uma linha poligonal.75 14.61 2. por segmentos de reta. para cada uma das variáveis. Exemplo: Na tabela abaixo. Determinados. Pecuária e Abastecimento. o ano no eixo horizontal e as quantidades no eixo vertical. Este gráfico serve para retratar dados quantitativos. todos os pontos da série usando os pares ordenados.10 13.Ministério da Agricultura.

cujas bases se apóiam no eixo horizontal. 22 . 2005. O histograma é uma representação gráfica formada por retângulos justapostos. Renda Familiar Mensal Número de Salários Mínimos Número de Famílias (milhões) (freqüência absoluta) 13200 15000 6900 3800 4000 3250 1560 1300 900 500 0 a1 1a 2 2a3 3a 4 4a5 5a6 6a7 7a8 8a9 9 a 10 Fonte: IBGE. A altura de cada retângulo deve ser proporcional à freqüência correspondente a cada classe e o ponto médio da base de cada retângulo deve coincidir com o ponto médio do respectivo intervalo de classe. Os dados agrupados em intervalos de classe podem ser representados graficamente por meio de um histograma. Exemplo: Na tabela abaixo está indicado o número de famílias brasileiras de acordo com o número de salários mínimos que cada uma delas tem como renda familiar mensal.OFERTA e DEMANDA DE ETANOL NO BRASIL (bilhões de litros) 16 14 12 10 8 6 4 2 0 1996 OFERTA DEMANDA 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 ANO F) HISTOGRAMAS Representação gráfica da distribuição de freqüências somente de variável contínua.

Representando-se. têm-se: 16000 NÚMERO DE FAMÍLIAS (MILHÕES) 14000 12000 10000 8000 6000 4000 2000 0 1 2 3 4 5 6 7 8 RENDA FAMILIAR MENSAL (SALÁRIOS MÍNIMOS) 9 10 23 . graficamente. a variável quantitativa contínua Renda Familiar Mensal no país. por meio de um histograma.

b) Colunas múltiplas. Representar graficamente a distribuição de freqüências da empresa Delta. barras múltiplas.gov. polígono de freqüência. colunas simples. 0 160 1 120 2 90 3 70 4 40 5 20 6 10 3. colunas simples. Estes quatro gráficos. No de faltas do mês No de operários (freqüência absoluta) Fonte: Dados hipotéticos. linha.187. linha. Construir um gráfico de colunas simples segundo os dados abaixo: Número de alunos matriculados de 5a a 8a séries em 2002 por região brasileira Região No de Alunos Norte 1. d) Histograma. na ordem em que são apresentados (1.045.147. histograma. segundo o número de faltas mensais. barras simples. denominam-se: GRÁFICO 1 16000 80 GRÁFICO 2 FREQÜÊNCIA ABSOLUTA 70 60 50 40 30 20 10 0 Gerencial Serviços Burocráticos Artesanato Trabalho Não Qualificado NÚMERO DE FAMÍLIAS (MILHÕES) 14000 12000 10000 8000 6000 4000 2000 0 1 2 3 4 5 6 7 8 RENDA FAMILIAR MENSAL (SALÁRIOS MÍNIMOS) 9 10 OCUPAÇÃO GRÁFICO 3 100000 GRÁFICO 4 SUL PRODUÇÃO DE PETRÓLEO (mil m ) 3 80000 REGIÃO BRASILEIRA NORTE 60000 40000 CENTRO-OESTE 20000 SUDESTE 0 2000 2001 2002 2003 2004 0 10 20 30 40 50 60 70 80 ANO PRODUÇÃO DE MADEIRA Freqüência Relativa (%) a) Colunas simples. colunas simples. 2.inep.271. 3. polígono de freqüência. c) Histograma.LISTA 2 . 4). barras simples.767 Centro-Oeste 1. barras simples. diagrama de dispersão. 2. colunas simples.917 Nordeste 5.117.132 Sul 2.778 Sudeste 6. e) Colunas múltiplas.br 24 . barras simples.Exercícios para fixação 1.381 Fonte: www. como um gráfico de colunas simples para variável discreta.

60 Fonte: Embratur. c) Número de veículos motorizados registrados em Santa Vitória/MG Tipo de Veículo Quantidade (freqüência absoluta) Carro de passageiro 585 Minivan 75 Caminhão de 2 eixos 60 Caminhão de Multieixo 30 Moto 315 Barco a motor 15 Fonte: Dados hipotéticos. 2005.4. 2005. Construir um gráfico de barras simples segundo os dados abaixo: Turistas estrangeiros no Brasil .5 Pedagogia 3.00 Salvador 17.8 Engenharia 13.60 São Paulo 3. Construir um gráfico de setores para os dados tabelados em cada um dos itens abaixo.1 Direito 18. a) Estimativa da safra de grãos em 2004 por região brasileira Região Porcentagem (freqüência relativa) Norte 3 Nordeste 8 Sudeste 15 Centro-Oeste 33 Sul 41 Fonte: IBGE.Cidades mais visitadas em 2003 Cidade Porcentagem (freqüência relativa) Rio de Janeiro 22.8 Medicina 10. 2004.60 Recife 8.4 Fonte: Centro de Pesquisas Confiança. 25 . b) Profissão preferida no vestibular 2003 em universidades particulares Profissão Porcentagem (freqüência relativa) Administração 21.20 Fortaleza 48.4 Odontologia 14.10 Outras 0.0 Outros 18. 5.

o Brasil conquistou medalhas em apenas 11 modalidades.01 Rural 63.94 67.3 3.59 81. Construir um gráfico de barras múltiplas para representar a evolução ao longo das décadas da população urbana e rural brasileira.6 40. Ouro 6 3 2 2 1 2 0 0 0 0 1 Bronze 6 7 7 2 1 1 6 1 4 1 2 8.41 24. Em todas as Olimpíadas que participou até 2004.fcc.9 Fonte: www.75 16.41 18.25 83.06 32.59 75. População (%) Anos 1950 1960 1970 1980 1990 2000 2005 Fonte: www.br 9.5 33. Construir um gráfico de linha segundo os dados abaixo: Anos 2000 2001 2002 2003 2004 2005 Produção de Feijão (milhões de toneladas) 4. Construir um gráfico de colunas múltiplas para representar essas modalidades e o número de medalhas conquistadas em cada uma delas.3 4.4 Anos 1975 1985 1995 2005 Fonte: www.2 28.4 4. 2005.4 57.6 42.16 45.3 3.92 44.gov.84 54.08 55.ibge.conab. MEDALHAS Prata 2 3 3 1 1 4 3 3 1 0 0 Modalidades Vela Atletismo Judô Vôlei Tiro Esportivo Vôlei de Praia Natação Futebol Basquete Boxe Hipismo Fonte: COB.br 26 .org.gov.5 59.99 7.6.8 66. Construir um gráfico de linhas duplas segundo os dados abaixo: Participação de homens e mulheres no mercado de trabalho (%) Homens Mulheres 71.br Urbana 36.9 4.

5 a 3.0 a 3.0 a 2. Construa o histograma que represente os valores da freqüência relativa.0 23 46 3. de uma amostra de 50 bebês nascidos na Maternidade São Bento no período de 30 dias. em horas. b) Qual é o número de alunos com notas menores que 4. Os dados abaixo representam a massa.0? 27 . Os dados abaixo representam a vida útil.0 4 8 2. em quilogramas. O histograma abaixo representa a distribuição das notas de português dos 600 alunos de uma escola num determinado mês.0 e 10.0 Total 50 100 Fonte: Registro da Maternidade São Bento.5 14 28 2.10. Fac. Massa (kg) No de bebês % de bebês 2 4 1.0? c) Qual é o número de alunos com notas entre 8. fri (%). de 260 lâmpadas de certa indústria na cidade de Jacareí. No de lâmpadas 12 28 36 48 60 50 26 260 12.0 a 1. FRi (%) e pontos médios das classes).5 a 4. Duração (horas) 300 a 400 400 a 500 500 a 600 600 a 700 700 a 800 800 a 900 900 a 1000 Total Fonte: Dados hipotéticos. fri (%) 38% 20% 20% 12% 10% 0 2 4 6 8 10 notas a) Construa a tabela de distribuição de freqüências para as notas representadas no histograma acima (com fi. 11.5 2 4 1. 2003.5 a 2. Construir o histograma correspondente a essa distribuição.5 5 10 3.

os estudantes construíram um gráfico de setores e. 19.800 toneladas são provenientes de outros materiais. 60. indicaram os ângulos de alguns desses setores circulares. Calcule o decréscimo percentual entre os anos de 2000 e 2001 e o acréscimo percentual entre os anos de 2001 e 2002.000 toneladas são de papel. Para resumirem os dados encontrados. em milhares de toneladas.br). Observe os gráficos de setores abaixo e indique qual é o mais adequado para representar essas informações. 70 Produção de Soja no Estado de São Paulo (mil toneladas) 60 50 40 30 20 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 ANO 28 . totalizando 240. a produção de soja do estado de São Paulo entre os anos de 1997 e 2005 (Brasil Pesquisas. Tipo A 108 o Tipo B X o Tipo AB 36 o Tipo O 162 o 15.cempre.200 toneladas de plástico.org. O gráfico abaixo representa. Do lixo produzido no Brasil. no lugar das porcentagens. A B C D 14.000 toneladas de lixo por dia (www. como é mostrado na figura abaixo (Hospital São Bento). 4.200 toneladas de metais. 7. Um grupo de estudantes de enfermagem fez uma pesquisa sobre o tipo de sangue contido nos 540 frascos de um banco de sangue de certo hospital. 2006). diariamente.800 toneladas de vidro e 148.13. Calcule o número de frascos que contém sangue tipo B.

No gráfico abaixo pode-se observar como são divididos os 188 bilhões de reais do orçamento da União entre os setores de saúde.16. previdência e outros. realizada com os jogadores profissionais dos quatro principais clubes de futebol do Rio de Janeiro. incluindo o pH nos ambientes. que representa a distribuição estatística de espécies em diferentes faixas de pH. pode-se esperar um maior número de espécies no ambiente: a) A b) B c) C d) D e) E 17. nomeados de A a E. medindo parâmetros físico-químicos de cada um deles. Gráfico I Gráfico II Utilizando o Gráfico II. O Gráfico I representa os valores de pH dos cinco ambientes. Um estudo caracterizou cinco ambientes aquáticos. 29 . De acordo com esses dados. o percentual dos jogadores dos quatro clubes que concluíram o Ensino Médio é de aproximadamente: a) 14% b) 48% c) 54% d) 60% e) 68% 18. educação. como mostra a pesquisa abaixo. A escolaridade dos jogadores de futebol nos grandes centros é maior do que se imagina. em uma região.

Nos gráficos de setores abaixo estão representadas as porcentagens de reclamações sobre cada tipo de poluição ambiental. Moradores de três cidades. foram indagados quanto aos tipos de poluição que mais afligiam as suas áreas urbanas. X Y Z Considerando a queixa principal dos cidadãos de cada cidade. respectivamente: X Manejamento de lixo Controle de despejo industrial Manejamento de lixo Controle de emissão de gases Controle de despejo industrial Y Esgotamento sanitário Manejamento de lixo Esgotamento sanitário Controle de despejo industrial Manejamento de lixo Z Controle de emissão de gases Controle de emissão de gases Controle de despejo industrial Esgotamento sanitário Esgotamento sanitário a) b) c) d) e) 20. julgue as sentenças abaixo como verdadeiras (V) ou falsas (F): a) Além da desigualdade racial. há uma desigualdade salarial entre os sexos. De acordo com o gráfico. Y e Z. O gráfico abaixo mostra uma triste realidade brasileira: a desigualdade racial associada à renda do trabalhador. a: a) 121% b) 69% c) 65% d) 61% e) 50% 19. aproximadamente.Se os 46 bilhões gastos com a previdência fossem totalmente repassados aos demais setores de modo que 50% fossem destinados à saúde. aqui chamadas de X. a primeira medida de combate à poluição em cada uma delas seria. 40% à educação e 10% aos outros setores. o aumento percentual para o setor de saúde seria igual. ( ) 30 . ( ) b) A desigualdade salarial entre os sexos é maior entre os negros.

redução de mais de 6 mil pousos e decolagens de 2004 a 2005. o total anual de 2006 ultrapassaria 220 mil vôos. classifique em V ou F cada sentença seguinte: 31 . houve mais de 300 mil pousos e decolagens em aeroportos de São Paulo. 22. ( ) 21. no aeroporto de Brasília. está representado o número de rádio emissoras por região brasileira no ano 2000. b) O aeroporto do Galeão registrou acréscimo de mais de 40% nos pousos e decolagens de 2004 a setembro de 2006. o mesmo valor que uma mulher não-negra. seu rendimento por hora deveria aumentar 50%. No gráfico de colunas abaixo. é correto afirmar que: No total de pousos e decolagens em alguns aeroportos do país entre 2003 e setembro de 2006 Dados: Infraero a) Até setembro de 2006. ( ) d) Para que um homem negro recebesse. e) O aeroporto de Congonhas registrou uma taxa de variação percentual menor que 2% nos pousos e decolagens no período de 2003 a 2005. c) Houve. seu rendimento por hora deveria aumentar aproximadamente 100%. por hora. independentemente do sexo.c) Em média. o salário dos negros é metade do salário dos não-negros. o mesmo valor que uma mulher não-negra. Analisando-o. Com base no gráfico abaixo. por hora. ( ) e) Para que uma mulher negra recebesse. d) Se a média mensal de pousos e decolagens registrada em Congonhas até setembro de 2006 se mantivesse até o final do ano.

( ) d) Na região Norte há. o Índice Nacional de Preços ao Consumidor Amplo (IPCA). O gráfico a seguir mostra as variações do IPCA de quatro capitais brasileiras no mês de maio de 2008.435 municípios com até 170 mil habitantes. em substituição aos tradicionais questionários de papel. ( ) e) Nas regiões Sul e Sudeste estão mais de 60% das rádio emissoras de todo o país. c) Transportes. residente em 30 milhões de domicílios (57% do existente no país). A grande inovação tecnológica dos Censos 2007 foi a utilização de 82 mil computadores de mão (PDA`s). Para o cálculo da inflação. que toma como base os gastos das famílias residentes nas áreas urbanas. cobriu 5. o correspondente a 97% dos municípios brasileiros. b) Artigos de residência. Dotados de equipamentos de GPS (Sistema de Posicionamento Global. Com base no gráfico qual foi o item determinante para a inflação de maio de 2008? a) Alimentação e bebidas. d) Vestuário. utiliza-se. 24.7 milhões de pessoas. apenas. com rendimentos mensais compreendidos entre um e quarenta salários mínimos. Os resultados da pesquisa estão representados no gráfico de setores a seguir: 32 . principalmente no que diz respeito à rapidez e agilidade nas entrevistas. entre outros. “A Contagem da População. eles possibilitaram a exata localização dos recenseadores nas áreas de coleta (setores censitários). Esse número equivale a 60% da população estimada. processamento das informações recolhidas e comunicação dos resultados à sociedade. e) Habitação. “ Fonte: IBGE. o ângulo correspondente à região Sul seria menor que 90º. 5. ( ) 23. recenseando 108. ( ) c) O número de rádio emissoras na região Sudeste é 60% maior que na região Nordeste.27% das rádios emissoras brasileiras.73% das rádio emissoras de todo o país. iniciada no dia 16 de abril. em português). Essa operação envolveu mais de 90 mil pessoas em todo o país. ( ) b) Na região Centro-Oeste há 2. As vantagens foram inúmeras.a) Se esse conjunto de dados fosse representado em um gráfico de setores.

c) a devastação da Mata Atlântica remanescente vem sendo contida desde a década de 60. b) a menor população se concentra na região centro-oeste. d) a menor população se concentra na região nordeste. a área preservada da Mata Atlântica é maior do que a registrada no período de 1990-1992. que mostrou resultados de décadas de transformações da Mata Atlântica. Examinando o gráfico da área de vegetação natural remanescente (em mil km2) pode-se inferir que: a) a Mata Atlântica teve sua área devastada em 50% entre 1963 e 1973. 180.Observando o gráfico de setores podemos afirmar que: a) a maior população se concentra na região sul. mas reduziu nas décadas posteriores. foi possível acompanhar a evolução de ecossistemas paulistas desde 1962. segundo o último censo. b) a vegetação natural da Mata Atlântica aumentou antes da década de 60. a população brasileira era de. obtido pelo IBGE em 2003. O analfabetismo é um problema social que atinge parte da população brasileira. c) a menor população se concentra na região sudeste. e) a maior população se concentra na região norte. e) nos anos 2000-2001.400 habitantes.6%. aproximadamente. d) nos anos 2000-2001. que mostra o número de pessoas com 5 anos ou mais de idade não-alfabetizadas nas cinco regiões do Brasil. Em um estudo feito pelo Instituto Florestal. 25. a porcentagem de pessoas não-alfabetizadas no Brasil é igual a: a) 88% b) 78 % c) 68% d) 12% e) 10% 33 . 26. a área de Mata Atlântica preservada em relação ao período de 1990-1992 foi de 34. Desse estudo publicou-se o Inventário Florestal de São Paulo. Considerando que.762. Observe o gráfico de colunas abaixo.

5. 2001.3 Medidas de dispersão (dispersão de números) = amplitude total. 14.A.ed. 2005.ed. 11. Um conjunto de números pode reduzir-se a uma ou a algumas medidas numéricas que resumem todo o conjunto. A. 9. 1. M. DOWNING. TRIOLA. O. Estatística Geral e Aplicada. 3. SWEENEY.MEDIDAS QUANTITATIVAS BIBLIOGRAFIA CONSULTADA: 1. 10. 6.ed. 8. Usualmente. ANDERSON. 4. 3.ed.F. 5. & CLARK.. São Paulo: Saraiva. BUSSAB. 1995. & WILLIAMS. MARTINS. 12. São Paulo: Atlas. J. São Paulo: Atlas.C. organizar e sumarizar os números. 2.ed. P. Métodos Quantitativos: Estatística Básica.ed. Para interpretar os dados corretamente é necessário. Rio de Janeiro: LTC. e colaboradores. D.1 Média Aritmética ⇒ Notação: x Calcula-se a média aritmética efetuando-se a soma das observações dividida pelo número total de observações. mediana e moda. Estatística Aplicada. 2002. 11. Princípios de Estatística. os quinze vendedores de uma empresa de calefação central e ar condicionado venderam os seguintes números de ar condicionado central: 8. D. E. G. A. percentis. 4.1 Medidas de posição (tendência central) = média aritmética simples e ponderada. 7. MEDEIROS. W. 2002. Estatística usando o Excel.1 MEDIDAS DE POSIÇÃO (TENDÊNCIA CENTRAL) A) DADOS BRUTOS OU ROL A. São Paulo: Atlas. D. São Paulo: Harbra Harper How do Brasil. 2002. decis. & MORETIN. 1.R. Considerando este mês como uma população estatística de interesse. 1. J. LAPPONI.CAPÍTULO 3 . 5. 4. Estatística Aplicada à Administração e Economia. 3. 8. 12. 1. 1 e 2. São Paulo: Pioneira Thomson Learning. STEVENSON. INTRODUÇÃO Os métodos estatísticos envolvem a análise e a interpretação de dados numéricos. Introdução à Estatística. primeiramente. 17. São Paulo: Saraiva. desvio padrão e coeficiente de variação.ed. 7.J. 2002. etc. 16. D. J. Estatística Aplicada à Administração. 11. MARTINS. & DONAIRE. o número médio de unidades vendidas é: x= 8 + 11 + 12 + 5 + 14 + 12 + 8 + 11 + 16 + 12 + 12 + 17 + 7 + 9 + 11 = 11 15 34 . São Paulo: Campus. 9. Administração e Ciências Contábeis. 2.ed.2 Medidas Separatrizes = quartis. 2. 1999. W. x = i =1 n ∑ xi n Exemplo 1: Durante um determinado mês de verão. empregam-se as seguintes medidas: 1. Estatística para os Cursos de Economia. S. 12. 2008. G. variância. T. Vol. 12.

As posições centrais desse conjunto de dados são: n 14 = = 7 (7a 2 2 posição) ⇒ 44 e n 14 +1= +1= 8 2 2 elementos: (8a posição) ⇒ 46. 56.peso 2. portanto.A. 17. 12. 44.peso 2. 39.0 + 3 × 5.0 2+ 2+3+3 10 ~ x Colocados os dados brutos em ordem crescente ou decrescente (ROL).0.f i n onde xi é a observação de ordem i e fi é o peso da observação de ordem i. 40. a mediana desse conjunto de dados é igual a 11. A mediana é.0 + 3 × 9. 64. O aluno obteve as seguintes notas em Estatística: 6. 7. 43. a 8a posição. a mediana é o elemento que ocupa a posição central. 11. a metade terá valores inferiores à mediana e a outra metade terá valores superiores à mediana. ou seja. são: 1o bimestre . 2o bimestre .2 Média Aritmética Ponderada ⇒ Notação: x Exemplo 2: Considere a situação em que um professor informe que os pesos das notas bimestrais. respectivamente.0 + 2 × 8. 46. 38. 9. 48.3 Mediana ⇒ Notação: 2 × 6.0. 4o bimestre .0 e 5.peso 3. 2 Exemplo 3: Os quinze vendedores citados no Exemplo 1 venderam as seguintes quantidades de aparelhos de ar condicionado. a média aritmética das duas observações centrais. 51. n + 1 15 + 1 = = 8 .peso 3. 11. 12. 12. a média dos elementos que ocupam no rol as posições n 2 e n + 1. 61. determina-se o número n de elementos do rol. ou 2 2 ~ x = 11 Se n é par – Utiliza-se como mediana. em cada bimestre. Para se calcular a mediana. Portanto. Portanto.0. colocadas em ordem crescente (rol): 5. a média aritmética desses dois 44 + 46 ~ x= = 45 2 35 . 12. 3o bimestre . 2 Exemplo 4: O gerente de uma pizzaria mantém o controle das vendas dos diversos tipos de pizza. O elemento central desse conjunto de dados ocupa a posição seja. 16. Suponha que ele tenha observado os seguintes valores de vendas diárias em ordem crescente (rol) do tipo calabresa durante o período de quatorze dias: 37. A fórmula para o cálculo é: x = i =1n ∑ fi i =1 ∑ x i .0 70 = = 7. 14. 59. 8. O cálculo da média ponderada deve levar em conta os pesos desiguais dos bimestres. 9. Sua característica principal é dividir um conjunto ordenado de dados em dois grupos iguais. para o exemplo 2: x= A. utilizando o seguinte critério: Se n é ímpar – O rol admite um termo central que ocupa a posição n +1 . 8. 8. 38. 11.

7. Em tal caso. foi determinado o número médio de acidentes. A seguir. 2. Deve-se. É o valor (observação) que ocorre com maior freqüência num conjunto de dados. Exemplo 5: Os quinze vendedores citados no Exemplo 1 venderam as seguintes quantidades de aparelhos de ar condicionado: 8. freqüência. moda e mediana estão muito próximas umas das outras ou são até coincidentes. média. portanto. O departamento de trânsito da cidade de São Paulo coletou o número de acidentes ocorridos em certo cruzamento de ruas na zona oeste. com os dados apresentados na tabela abaixo: 36 . Exemplo 6: Sem perda de informação. 17. onde n é o número total de observações. OBSERVAÇÕES: • Se mais de um valor ocorre com maior. A. por 25 dias úteis do mês de março. o procedimento para se determinar a mediana é o seguinte: 1. 11. ou seja. 16. 12. 14. com o objetivo de estudar a possibilidade de colocação de um semáforo no citado cruzamento. 9. todos eles são chamados de moda. A moda para esse conjunto de dados é o valor que ocorre com maior freqüência. mas igual. 12. 3. Verificar se há um número ímpar ou par de observações. B) VARIÁVEIS DISCRETAS B.1 Média x de uma distribuição de freqüências Se os dados são provenientes de uma variável discreta.f i n n ∑ fi com fi sendo a freqüência da i-ésima classe e i =1 ∑ f i = n . Ordenar os valores (Rol).Portanto.f i i =1 n n = i =1 ∑ x i . x* = 12. 12. 11. • Muitas distribuições que surgem na prática são razoavelmente simétricas com a maioria dos valores concentrada próximo ao centro. a mediana é a média aritmética das duas observações centrais. considerando as freqüências absolutas fi como sendo as ponderações dos elementos xi correspondentes.4 Moda ⇒ Notação: x*. 8. 11. b) Para um número par n de observações. deve-se utilizar a média aritmética ponderada. a) Para um número ímpar n de observações. utilizar a fórmula da média ponderada para determinar a média de uma distribuição de freqüências: x= i =1 n ∑ x i . a mediana é o valor central. 12. • Uma distribuição com duas modas é chamada de distribuição bimodal. 5.

6 ≅ 13 acidentes/dia 25 B. • • n = ímpar ⇒ a mediana será o elemento central. ordem = n +1 2 Exemplo 7: Determinando a mediana do conjunto de dados do Exemplo 6. estão apresentados em tabelas. o elemento central é No de dias fi 2 4 5 10 2 1 1 n = 25 Freqüência Acumulada Fac=Fi 2 6 11 21 (13o elemento) 23 24 25 -------------------------------- n + 1 25 + 1 = = 13 2 2 (13o elemento). Como a mediana é o elemento que ocupa a posição central do conjunto ordenado de dados. basta verificar se o número de elementos da série é ímpar ou par. encontra-se a posição da mediana. No de acidentes xi 0 5 10 15 20 25 30 Total Solução: Como n = 25 (ímpar). provenientes de uma variável discreta. O valor xi que é o elemento central corresponde à mediana. pelas freqüências acumuladas. fi 0 20 50 150 40 25 30 315 x = i =1 ∑ x i . Após calcular a posição da mediana.2 Mediana ~ x de uma distribuição de freqüências Se os dados. abre-se a coluna de Fac e. ordem = n +1 2 n 2 e n = par ⇒ a mediana será a média aritmética entre os elementos centrais.No de acidentes xi 0 5 10 15 20 25 30 Total Solução: No de dias fi 2 4 5 10 2 1 1 n = 25 xi. eles já estão naturalmente ordenados. portanto: ~ x = 15 acidentes/dia 37 .f i n n = 315 = 12. Neste exemplo.

5 2 peças defeituosas/caixa B. O controle de qualidade selecionou 50 caixas na linha de produção e anotou em cada caixa o número de peças defeituosas. a moda é 15. sendo n = 50 (par). Exemplo 9: Determinando a moda do conjunto de dados do Exemplo 6.3 Moda x* de uma distribuição de freqüências É o valor que ocorre com maior freqüência na distribuição. No de acidentes xi 0 5 10 15 20 25 30 Total Solução: Por observação. No de dias fi 2 4 5 10 2 1 1 n = 25 38 . a identificação da moda é facilitada pela simples observação do elemento que se apresenta com maior freqüência. Para distribuições sem agrupamento de classes. ou seja. a média aritmética desses dois elementos: 1+ 2 ~ x= = 1.Exemplo 8: Uma indústria metalúrgica embala peças em caixas com 100 unidades. obteve a seguinte distribuição de freqüências: No de peças defeituosas xi 0 1 2 3 4 Total No de caixas fi 15 10 12 8 5 n = 50 Freqüência Acumulada Fac=Fi 15 25 (25o elemento) 37 (26o elemento) 45 50 -------------------------------- Solução: Observando a coluna das freqüências acumuladas. pois esse valor aparece com maior freqüência nesta distribuição (10 vezes). A seguir. x* = 15. nesse caso. os elementos centrais são: n 50 = = 25 (25o elemento) ⇒ 1 peça defeituosa/caixa 2 2 n 50 +1= + 1 = 26 (26o elemento) ⇒ 2 peças defeituosas/caixa 2 2 A mediana é.

00 5 1.00 2. n = número total de elementos.492.300. Então.00 15.600.000. consideram-se as freqüências absolutas das classes como sendo as ponderações dos pontos médios destas classes.000.2 Mediana de uma distribuição de freqüências Se os dados apresentados são classificados como variável contínua. ~ x = I Md onde: n   − ∑ Fac.: Os pontos médios das classes (xi) são determinados tomando-se a média aritmética entre o extremo inferior e superior de cada classe.00 2 1.00 Obs.h 2  + f Md IMd = limite inferior da classe da mediana. Calcula-se a ordem n 2 (como a variável é contínua. h = amplitude da classe da mediana.300.200.00 1.00 a a a a a 1.800.300 = 1.f i n n = 37.00 1.00 reais/funcionário 25 C. Solução: x = i =1 ~ x ∑ x i .C) VARIÁVEL CONTÍNUA C. utiliza-se a fórmula: ~ x ).400.800.200. Pela freqüência acumulada Fac.00 1. fMd = freqüência absoluta da classe da mediana. identifica-se a classe que contém a mediana (classe da 3.200.fi 2.00 8.800.00 1.900.1 Média x de uma distribuição de freqüências Se os dados apresentados são classificados como variável contínua. 39 . 1. Os salários (em R$) de 25 funcionários selecionados em uma empresa estão representados na tabela abaixo. ant .500.00 3. Determinando o salário médio dessa distribuição. Exemplo 10: Com perda de informação.00 37.00 10 1. Nesse caso.700.400.100. ∑ Fac. deve-se utilizar para o cálculo da média.00 7.00 2 n = 25 xi.00 1.00 6 1. o procedimento a seguir. obtem-se: Classe 1 2 3 4 5 Salários (em R$) 1. ant = soma das freqüências anteriores à classe da mediana.800. a média aritmética ponderada.00 1.00 1. não se preocupe se n é par ou ímpar).000.600.500. deve-se utilizar para o cálculo da mediana. 2.00 Total Ponto médio da classe No de funcionários xi fi 1.

pode-se optar por vários procedimentos.h 2  + f Md IMd = limite inferior da classe da mediana = 1. para se determinar a moda.00 +  = 1.00 No de funcionários fi 2 6 10 5 2 25 Fac 2 8 18 (classe da ~ x) 23 25 -------------------------- Solução: 1o passo: Calcula-se n 25 .490.600. como moda de Pearson.00 1. 2o passo: Identifica-se a classe da mediana pela Fac. ant = soma das freqüências anteriores à classe da mediana = 8 h = amplitude da classe da mediana = 200.00 1.000.400.00 1.200.400. Classe 1 2 3 4 5 Salários (em R$) 1.800.200.800. 3o passo: Aplica-se a fórmula: ~ x = I Md Neste caso: n   − ∑ Fac.5 ≅ 13 2 2 (13a posição). a freqüência absoluta da classe anterior. em sua fórmula. A fórmula de Czuber é a seguinte: x* = I Mo + (f Mo − f ant ).00 2.400.00 1. 1. além da freqüência absoluta da classe modal. moda de King.00 1. Neste caso.h 2f Mo − (f ant + f post ) 40 .600.00 fMd = freqüência absoluta da classe da mediana = 10 Ou seja:  25   − 8 .00 1.00. moda de Czuber.000.00 a 1.600. ou seja.Exemplo 11: Determinando a mediana da situação apresentada no Exemplo 10. o que leva a um valor mais preciso para a moda de uma variável contínua. entre outros.00 n = número total de elementos = 25 ∑ Fac. têm-se = 12.00 1. a freqüência absoluta da classe posterior. Será dado destaque à moda de Czuber. Como n = 25.00 10 reais/funcionário C.3 Moda x* de uma distribuição de freqüências Se os dados apresentados são classificados como variável contínua.200. ant .00 2  ~ x = 1400.400. a classe da mediana é a 3a classe.00 Total a a a a a 1. MODA DE CZUBER CZUBER levou em consideração.

200. Nesses casos.onde: IMo = limite inferior da classe modal.400. 41 .000. Neste caso.00 1.00 1.00 1.00 1. fpost = freqüência absoluta da classe posterior à classe modal. já que esta é a classe de maior freqüência.00 1.400. dois ou mais picos distintos de igual freqüência nos dados. a distribuição é bimodal (duas modas) ou de modas múltiplas.488.800.800.00 fMo = freqüência absoluta da classe modal = 10 fant = freqüência absoluta da classe anterior à classe modal = 6 fpost = freqüência absoluta da classe posterior à classe modal = 5 h = amplitude do intervalo de classe = 200. fMo = freqüência absoluta da classe modal.00 1.400. respectivamente.600. algumas vezes.89 reais/funcionário 2. Classe 1 2 3 4 5 Salários (em R$) 1. a classe modal é a terceira classe.00 = 1.10 − (6 + 5) Observação Importante: Ocorrem.00 + (10 − 6). h = amplitude do intervalo de classe. Exemplo 12: Determinando a moda de Czuber para a situação apresentada no Exemplo 10.00 Ou seja: x* = 1.00 No de funcionários fi 2 6 10 5 2 25 Solução: Por observação. IMo = limite inferior da classe modal = 1.600.200.200. fant = freqüência absoluta da classe anterior à classe modal.00 1.00 2.000.400.00 Total a a a a a 1.

Q3 = 3o quartil. composto por 75% dos elementos.h 4  + f Q3 lQi = limite inferior da classe Qi n = número total de elementos h = amplitude de classe fQi = freqüência absoluta da classe Qi ∑ Fac. neste capítulo. ant = soma das freqüências anteriores à classe Qi. A mediana.1. As fórmulas para a determinação dos quartis Q1 e Q3 são semelhantes àquelas usadas para o cálculo da mediana. 42 . Os quartis serão utilizados. Q2 = 2o quartil. composto por 25% dos elementos. decis e percentis. ant . cada um deles contendo 50% dos valores da seqüência. é também uma medida separatriz. coincide com a mediana.h 4  + f Q1 Q3 = IQ3  3n   − ∑ Fac. Além da mediana. como pode ser visto esquematicamente: 0% 25% 50% 75% 100% Q1 Q2 = ~ x Q3 Q1 = 1o quartil. que divide a seqüência ordenada em dois grupos. D. para dados agrupados em classes. ou seja. por exemplo.1 Quartis Os quartis dividem um conjunto de dados em quatro partes iguais. Determinação de Q1: 1o Passo: Calcula-se a posição Determinação de Q3: 2o Passo: Identifica-se a classe de Q1 pela Fac 3o Passo: Aplica-se a fórmula: n 4 1o Passo: Calcula-se a posição 2o Passo: Identifica-se a classe de Q3 pela Fac 3o Passo: Aplica-se a fórmula: 3n 4 Q1 = I Q1 onde: n   − ∑ Fac. serão destacadas outras medidas separatrizes. apenas. composto por 50% dos elementos. quartis. ant .2 MEDIDAS SEPARATRIZES São números reais que dividem a seqüência ordenada de dados em partes que contêm a mesma quantidade de elementos da série.

apenas.52 = = 39 4 4 (39a posição) 2o Passo: Pela Fac. 4. 1o Passo: Calcula-se a posição i. Determinando os valores do 1o e 3o quartis (Q1 e Q3). identifica-se as classes de Q1 e Q3 3o Passo: Uso das fórmulas: Q1 = I Q1 n   − ∑ Fac. 6. D.52  − 32 .2 DECIS Os decis dividem um conjunto de dados em dez partes iguais.n .10  4  = 52.5 minutos. obtem-se: Classe Tempo de auditoria No de balanços (em minutos) fi 1 3 3 9 a 19 2 5 8 19 a 29 3 4 5 29 a 39 39 a 49 49 a 59 Total 10 14 20 52 32 52 (classe de Q3) ----------------------Fac 18 (classe de Q1) Solução: Q1 = ? 1o Passo: Q3 = ? n 52 = = 13 4 4 (13a posição) 3n 3. 2.h 4  + f Q3 25% ⇒ 0% 10 34 ~ x 52.5 minutos/balanço Q 3 = 49 +  20 50% 75% 100% Q3 = IQ3  3n   − ∑ Fac.5 59 Interpretação: 25% dos balanços são realizados em até 34 minutos e 75% dos balanços são realizados em até 52.Exemplo 13: Em conjunto com uma auditoria anual. 3. para dados agrupados em classes. 8. O procedimento para a determinação dos decis é semelhante àquele usados para o cálculo dos quartis. 5.h 4  + f Q1 ⇒  52   − 8 . tal como indicado na tabela abaixo. 9 10 43 2o Passo: Identifica-se a classe de Di pela Fac . onde i =1. uma empresa de contabilidade pública anota o tempo necessário para realizar a auditoria de 52 balanços contábeis. ant .10 4  = 34 minutos/balanço Q1 = 29 +  10  3. 7. Os decis serão utilizados. ant .

h 10  + f Di onde: lDi = limite inferior da classe Di n = número total de elementos h = amplitude de classe fDi = freqüência absoluta da classe Di ∑ Fac. 2.3 PERCENTIS Os percentis dividem um conjunto de dados em cem partes iguais. 4.. ant .. apenas. portanto. 1o Passo: Calcula-se a posição i. O procedimento para a determinação dos decis é semelhante àquele usados para o cálculo dos quartis. 5.n  − ∑ Fac.. D. são realizados em tempos acima de 41 minutos.h  10  + f D4 ⇒  4.3o Passo: Aplica-se a fórmula: Di = I Di  i.80 ≅ 21 (21a posição) 10 2o Passo: Identifica-se a classe de D4 pela Fac 3o Passo: Aplica-se a fórmula: D4 = ID 4  4.ant = soma das freqüências anteriores à classe Di Exemplo 14: Determinando o valor do 4o decil (D4) para a situação apresentada no Exemplo 13. 99 100 44 . onde i = 1.10  10  = 41 minutos/balanço D 4 = 39 +  14 Interpretação: 40% dos balanços são realizados em até 41 minutos e 60% dos balanços. 98.52 = 20. para dados agrupados em classes. ant .n . . Os decis serão utilizados. 3.n   − ∑ Fac. 97. Classe Tempo de auditoria No de balanços (em minutos) fi 1 3 3 9 a 19 2 5 8 19 a 29 3 4 5 29 a 39 39 a 49 49 a 59 Total 10 14 20 52 18 32 (classe de D4) 52 ----------------------Fac Solução: 1o Passo: Calcula-se a posição 4.52  − 18 .

portanto.n  − ∑ Fac.10  100  = 54.52 = 42. 45 . ant . são realizados em tempos acima de 54.32 P82 = 49 +  20 minutos/balanço Interpretação: 82% dos balanços são realizados em até 54. Classe Tempo de auditoria No de balanços (em minutos) fi 1 3 3 9 a 19 2 5 8 19 a 29 3 4 5 29 a 39 39 a 49 49 a 59 Total 10 14 20 52 18 32 52 (classe de P82) ----------------------Fac Solução: 1o Passo: Calcula-se a posição 82.ant = soma das freqüências anteriores à classe Pi Exemplo 15: Determinando o valor do 82o percentil (P33) para a situação apresentada no Exemplo 13.n  − ∑ Fac.64 ≅ 43 100 (43a posição) 2o Passo: Identifica-se a classe de P82 pela Fac 3o Passo: Aplica-se a fórmula: P82 = I P82  82.2o Passo: Identifica-se a classe Pi pela Fac 3o Passo: Aplica-se a fórmula: Pi = I Pi onde:  i.h  100  + f P82 ⇒  82.h  100  + f Pi lPi = limite inferior da classe Pi n = número total de elementos h = amplitude de classe fPi = freqüência absoluta da classe Pi ∑ Fac.52  − 32 . ant .32 minutos e 18% dos balanços.32 minutos.

Essa média é 10 para as três séries. Ela é apenas uma indicação aproximada da dispersão ou variabilidade. índices de dispersão bastante estáveis. 10. Em resumo. portanto. 10. que é o valor da média. 10. 4. Portanto. 5. 10. 10. 17 As três séries têm uma característica comum. 10. 10 Y : 7. 11. descuidando do conjunto de valores intermediários. Dessas medidas. a média 10 não representa muito bem a série. na sua maioria. E. elas diferem entre si com relação ao agrupamento dos dados em torno dessa média. que são. 10. 15. Chamando de dispersão ou variabilidade a maior ou menor diversificação dos valores de uma variável em torno de um valor de tendência central tomado como ponto de comparação. A média 10 representa razoavelmente bem a série. Entretanto. a amplitude total é instável por ser influenciada por valores extremos.1. Em Y existe forte concentração de dados em torno da média e fraca dispersão. ressaltando a maior ou menor dispersão ou variabilidade entre esses valores e sua medida de posição. pode-se dizer que o conjunto X apresenta uma dispersão ou variabilidade nula e que o conjunto Y apresenta uma dispersão ou variabilidade menor que o conjunto Z. não há dispersão de dados. pois levam em consideração a totalidade dos valores da variável em estudo. e por isso mesmo. o que quase sempre invalida a idoneidade do resultado. 16. mas estão próximos dela. Na seqüência Z existem muitos valores muito afastados do valor 10 e. o que faz dessas medidas. 10. o desvio padrão e o coeficiente de variação. 10. devidos ao acaso. portanto. 11. serão estudadas a amplitude total. 10. 12. para qualificar os valores de uma dada variável. portanto. 9. a média representa muito bem essa série. ou seja. a Estatística recorre às medidas de dispersão ou de variabilidade. os mais empregados. 13 Z : 3. Em Z há fraca concentração de valores em torno da média e grande dispersão de dados. 10. Exemplo 16: Determinando a amplitude total para a variável discreta (no de acidentes) descrita no Exemplo 6. 6. 8.3 MEDIDAS DE DISPERSÃO Considere as seguintes séries de dados: X : 10. a variância. em X os dados estão totalmente concentrados na média 10 e. Solução: A T = 30 − 0 = 30 acidentes Exemplo 17: Determinando a amplitude total para a variável contínua (salários) descrita no Exemplo 10. 14. Solução: A T = 2000 − 1000 = 1000 E. 9. Na seqüência Y vê-se que vários dados diferem da média. A variância e o desvio padrão são medidas que não possuem essa falha.1 AMPLITUDE TOTAL A amplitude total é a diferença entre o maior e o menor valor observado: A T = x máx − x mín A amplitude total tem o inconveniente de só levar em conta os dois valores extremos da série. Na série X todos os dados são iguais a 10 e. apresentam grande concentração em torno de 10.2 VARIÂNCIA E DESVIO PADRÃO reais Como comentado. 46 . 10.

definido como a raiz quadrada do valor da variância.A variância baseia-se nos desvios em torno da média. porém é extremamente importante na inferência estatística e em combinações de amostras.25 = 7.25. 47 . para o cálculo da variância é mais interessante o uso das fórmulas: σ 2 ( x) = ∑ ( x i − x ) 2 . Solução: Para facilitar o cálculo da variância e do desvio padrão.25 25 − 1 ∑ fi − 1 Portanto a variância amostral é 50.04 33.fi 317. sob o ponto de vista prático é um inconveniente.fi n −1 Variância amostral Sendo a variância calculada a partir dos quadrados dos desvios.76 302.60 acidentes/dia: No de acidentes xi 0 5 10 15 20 25 30 Total No de dias fi 2 4 5 10 2 1 1 25 (x i − x ) 2 .76 1206. o que. O uso de uma ou de outra dependerá da finalidade que se tenha em vista. a média dos quadrados dos desvios. ou seja: σ( x ) = σ 2 s( x ) = s 2 Desvio padrão populacional Desvio padrão amostral Tanto o desvio padrão como a variância são usados como medidas de dispersão ou variabilidade. Por isso mesmo.09 acidentes/dia. Exemplo 18: Determinando a variância amostral e o respectivo desvio padrão para a variável discreta descrita no Exemplo 6. denominada desvio padrão.52 153. logo s = 50. s = s 2 .52 231. imaginou-se uma medida que tem utilidade e interpretação práticas.09 Portanto. ∑ ( x i − x )2 . usando x = 12. Assim. determinando. ela é um número em unidade quadrada em relação à variável em questão.fi n Variância populacional s2 (x) = onde n = ∑ fi . A variância é uma medida que tem pouca utilidade como estatística descritiva.fi 1. monta-se a tabela abaixo. porém.00 s2 (x) = 2 ∑ ( x i − x ) .60 109. o desvio padrão amostral é 7.80 57.206 = = 50.

logo s = 44. medida essa denominada coeficiente de variação (CV): σ CV = .000.00 Interpretação: Esse resultado indica que o desvio padrão representa 14.00 1. usando x = 1.600.492. Para contornar essa limitação. portanto.00 a a a a a 1.100 x ou s CV = .933. mas.800. um desvio padrão de 2 unidades pode ser considerado pequeno para uma série de valores cuja média é 200. Solução: Para facilitar o cálculo da variância e do desvio padrão. o desvio padrão amostral é R$ 211. há uma grande dispersão de valores salariais em torno do salário médio dos funcionários dessa empresa.328 221.933.400. E.400 2 s (x) = = = 44.33.800.184 640 216. s = s 2 .100.00 1.00 1.97 por funcionário.00 reais/funcionário: Classe 1 2 3 4 5 Salários (em R$) 1.600.97 Portanto.fi 1. o mesmo não pode ser dito.00 No de funcionários fi 2 6 10 5 2 25 (x i − x ) 2 .320 332. se a média for 20.000.933.928 1.3 COEFICIENTE DE VARIAÇÃO O desvio padrão por si só não representa muita coisa.00 1.21% 1.100 = 14.900.97. pode-se caracterizar o desvio padrão dos dados em termos relativos a sua média.00 2.00 Total Ponto médio da classe (xi) 1.100 x Exemplo 20: Determinando o coeficiente de variação para a variável contínua descrita no Exemplo 10.21% do valor médio e que.Exemplo 19: Determinando a variância amostral e o respectivo desvio padrão para a variável contínua descrita no Exemplo 10.33 = 211.00 1. Solução: CV = 211.97 .00 1.00 1. cuja média calculada é igual a R$ 1. 48 .00 e o respectivo desvio padrão calculado no exemplo acima é igual a R$ 211.492.00 1.700.00 1.400.200.33 25 − 1 ∑ fi − 1 Portanto a variância amostral é 44.492.500.00 1.300.00 1.078.200. monta-se a tabela abaixo.400 2 ∑ ( x i − x ) .fi 307. Assim.078.

7 e 7. 9. 140.4.00.8. 2.10. 2. 165. 165. escolheu-se o mês de setembro. 12.00 e 7 ganham R$ 120. 205.8.57. 8. encontrando-se os seguintes números: No de acidentes 0 1 2 3 4 No de dias (fi) 5 9 12 3 1 Construa um gráfico de barras simples para esta distribuição e calcule o número médio diário de acidentes em setembro. que trabalha em uma empresa. 155. 155.55.25. 200.2.25.55.59. 6. 12. 58. escolheu-se uma amostra de 50 veículos. Calcule a média. 140. ordenados em ordem crescente: R$ 5. 6. a nota mediana e a nota modal.62. 10.00. As notas de um candidato. 57. 10 ganham R$ 60. 2. 8. Um grupo de 64 pessoas. 180.50. 7.00.40.35. 180. 230. 140. 6.1.64. 55. encontrando-se o seguinte número de peças defeituosas por veículo: No de peças defeituosas 0 1 2 3 4 No de veículos (fi) 25 20 3 1 1 Construa um gráfico de colunas simples para esta distribuição e calcule o número médio de peças defeituosas por veículo. Considere uma amostra com os valores de 53. 4. 240. 6. Calcule a taxa de juros média e a taxa de juros mediana. 3. 57. Numa turma com 20 moças e 50 rapazes foi aplicada uma prova de Estatística. 140. arredondados para o valor do real mais próximo e apresentados em ordem crescente: R$ 140.60. 9. 5. 9. 225. Para se estimar o número de peças defeituosas de um veículo. 53. 2. a mediana e a moda para esse grupo de salários. 140. Uma amostra de 20 operários de uma companhia apresentou os seguintes salários recebidos durante certa semana. 2. foram: 8. Determinar a média.LISTA 3 – Exercícios para fixação 1. 69. em seis provas de um concurso.63. 6. As taxas de juros recebidas por 10 ações escolhidas ao acaso na BOVESPA durante um trimestre foram (em porcentagem): 2. 2. 13. Para se estimar o número de acidentes diários em um grande estacionamento durante um período de um mês.2.90. 15 ganham R$ 90. 140.64.10. Para uma amostra de 15 clientes de um pequeno mercado. Calcule a nota média.71.45. 64. foram observados os seguintes montantes de vendas.09 e 14. a mediana e a moda.25. Qual é a média salarial diária de todo o grupo? 8. Calcular a média. 49 . 2.00. 7. 10.10.25.61. o número mediano e o número modal. 190.53. 2.2 e a dos rapazes foi 7. 2. é formado por sub-grupos que tem salários diários com as seguintes características: 12 pessoas ganham R$ 50. Qual foi a média de toda a turma nessa prova? 7. 70. 20 ganham R$ 25. 8. A média aritmética das moças foi 9. a mediana e a moda para esses valores de vendas. 68 e 53. 140. 2. 5. o número mediano e o número modal.

12. a mediana e a moda de Czuber para esse conjunto de dados. No de dias para entrega de pedidos de compra 7 10 12 15 20 30 45 No de produtos comprados (fi) 50 150 200 400 1. de vendedores de gêneros alimentícios. Vendas semanais (em salários mínimos) 30 a 35 35 a 40 40 a 45 45 a 50 50 a 55 55 a 60 60 a 65 65 a 70 No de vendedores (fi) 2 10 18 50 70 30 18 2 Calcule a média.000 Calcule o número médio de dias para entregas de pedidos de compra. o número mediano e o número modal. em classes de salários mínimos.000 4. Na tabela abaixo se observa o número de dias necessários para entregas de pedidos de compra para a Dawson Supply Distribuidores em relação ao número médio de produtos comprados. 11. Compare os três valores obtidos e discuta esses resultados. 50 .200 2.10. Os dados abaixo representam uma amostra das vendas semanais. Em um levantamento entre os assinantes da revista "Fortune". foi feita a seguinte pergunta: "Quantas das últimas quatro edições você leu ou folheou?" A seguinte distribuição de freqüências sintetiza uma amostra de 500 respostas: Edição lida 0 1 2 3 4 No de assinantes (fi) 15 10 40 85 350 a) Qual é o número médio de edições lidas por um assinante da revista "Fortune"? b) Qual é o número mediano? c) Qual é o número modal? d) Compare os três valores obtidos nos itens anteriores e discuta esses resultados.

000 2. mediano e modal deste produto por supermercado pesquisado. os animais apresentaram um aumento de peso. mostrou que após um mês em que a ração normal foi substituída pela nova ração. Alturas (cm) 150 a 160 160 a 170 170 a 180 180 a 190 190 a 200 200 a 210 No de alunos ( f i ) 2 15 18 18 16 1 16. 14. 15.000 5. fornecedora de supermercados. segundo a distribuição. Substância Química (%) No de análises (fi) 3 0 a 16 5 16 a 32 7 32 a 48 9 48 a 64 4 64 a 80 2 80 a 96 Calcule a média.13. fez um levantamento do consumo de seu principal produto em vários supermercados. dada na tabela abaixo: Aumento de peso (em kg) 0 2 4 6 8 10 a a a a a a 2 4 6 8 10 12 N o de animais (fi) 5 7 20 16 7 5 Calcule o aumento médio de peso por animal.000 5. 51 . a tabela: No de unidades consumidas 0 1. o aumento mediano e o aumento modal.000 2. em termos de ganho de peso. Uma pesquisa para determinar a eficiência de uma nova ração para animais.000 4.000 3.000 No de supermercados ( f i ) 10 50 200 320 150 30 Determine o consumo médio. Interprete os resultados obtidos. Calcule a média. a mediana e a moda de Czuber para esse conjunto de dados e interprete os resultados obtidos.000 4. Interprete os resultados obtidos. a mediana e a moda para uma amostra das alturas de 70 alunos de uma escola.000 3. Uma empresa de âmbito nacional.000 1. obtendo em determinado mês.000 6. A tabela abaixo apresenta os resultados de 30 análises de uma substância química (em porcentagem) presente em amostras de água coletadas num rio de São Paulo. Interprete os resultados obtidos.

A partir de que nota o aluno fará jus ao prêmio? d) Todo aluno que tiver nota situada entre as 45% mais baixas fará recuperação. f) Se o distribuidor de leite da região deseja oferecer um desconto no preço do litro de leite para 25% das famílias que consomem o maior número de litros. b) Calcule a variância populacional. 8. 5. c) Todo aluno que tiver nota situada entre as 10% mais altas receberá um prêmio. 18. tem distribuição dada pela tabela abaixo: Notas de Estatística No de alunos xi (ponto médio) xi. Calcule a variância dos salários do setor de logística e o desvio padrão correspondente. 7. Calcule a moda de Czuber. Para uma amostra de 100 famílias: a) Escreva estas informações na forma de uma distribuição de freqüências. 8. 19. 9. 9. a) Construa a distribuição de freqüências.00 1.00 600. 7.00 No de funcionários (fi) 12 30 42 24 6 900.00 500. que representa uma amostra das notas de Estatística dos alunos de uma classe de certa universidade. 5. 5. O departamento de recursos humanos de uma empresa fez um levantamento dos salários de uma amostra de 120 funcionários do setor de logística. 6. obtendo os seguintes resultados: Salários (R$) 400. 8. 6. c) Determine o desvio padrão populacional.00 700.00 700. A partir de que nota o aluno não necessitará de recuperação? 20.00 6 Calcule o salário médio dos funcionários do setor de logística. 6. 20% consomem entre 2 e 3 litros e o restante das famílias consome entre 3 e 4 litros.00 900. 5. 7. a moda e o desvio padrão de x. 50% das famílias consomem entre 1 e 2 litros. 7. 9. interpretando os resultados obtidos em termos de coeficiente de variação.17. 7. A variável x. 6. 8.fi Fac 3 0 a2 12 2 a4 18 4a6 12 6a8 3 8 a 10 Total a) Complete a tabela.000. Estudando-se o consumo diário de leite em certa região. 7. Interprete os resultados obtidos.00 a) b) c) d) e) 600. verificou-se que 20% das famílias consomem até 1 litro de leite por dia. 8. 7. 6. 7. 5. Calcule o salário mediano.fi (x i − x ) 2 (x i − x ) 2 . 7. Para a série 5. a mediana.00 500. a família será beneficiada? 52 . 8. Calcule a amplitude total. 6. 8. b) Calcule a média. b) Construa o histograma para essa situação. 9.00 800.00 800. c) Qual o consumo médio diário de leite por família? d) E o consumo mediano? e) Qual o desvio padrão? Interprete o resultado obtido em relação à média. 9. 7. a partir de que número de litros. 6.

000 30. der isenção fiscal às empresas que estejam entre as 7% com melhor desempenho em relação ao volume exportado.000 a 70.000 90. der incentivos fiscais à metade das empresas que tenham melhor desempenho em relação ao volume exportado.000 a 100. Volume Exportado (em US$ milhões) 50. d) Se o proprietário do posto de gasolina deseja oferecer um brinde para 5% dos clientes que colocarem o maior número de litros de gasolina em seu tanque. para incrementar as exportações.000 40.000 80.000 40.000 a 60. Gasolina (em litros) 0 a 8 8 a 16 16 a 24 24 a 32 32 a 40 40 a 48 TOTAL No de carros (fi) 74 192 280 105 23 6 680 a) Calcule a média e o desvio padrão para esses dados agrupados. por correntista. Um banco decidiu diminuir as taxas bancárias para 10% de seus correntistas (pessoas físicas) que tenham os maiores saldos em uma de suas agências bancárias no interior do Paraná.000 50. Para isto.000 10. a partir de que valor exportado as empresas terão esses incentivos? b) Se o governo. qual é a estimativa do número total de litros de gasolina que serão vendidos? c) Calcule a mediana e a moda.000 20. A tabela abaixo apresenta a distribuição das exportações de empresas de equipamentos eletrônicos em 2004. para incrementar as exportações.000 20. obtendo a tabela: Saldos (R$) 0 10.000 70. Um posto de gasolina registrou a seguinte distribuição de freqüências para o número de litros de gasolina vendido por carro em uma amostra de 680 carros. Interprete o resultado obtido.000 No de empresas (fi) 5 10 20 10 5 Para essa distribuição de freqüências.000 60.000 No de contas correntes ( f i ) 50 100 80 10 10 Pergunta-se: A partir de que saldo o correntista terá redução de taxas bancárias? 53 .000 a 90. a partir de que número de litros o cliente será premiado? 22.000 30.21.000 a 80. b) Se o posto de gasolina espera atender cerca de 120 carros em determinado dia. analise e responda: a) Se o governo. a partir de que valor exportado as empresas terão isenção? 23. fez um levantamento desses saldos.

0 horas? b3) Qual a % de pessoas que utilizam o computador pessoal no máximo por 24.2 6.6 24.2 7.0 horas (exclusive)? b4) Qual o número de pessoas que utilizam o computador pessoal por mais de 8.0 15.8 10.2 9.4 12.2 8.000 3.4 3.9 3.4 11.8 27. g) Qual é o tempo modal de utilização do computador pessoal? h) Se determinado site der um prêmio a 2% dos usuários que o visitarem por mais vezes.000 6.2 6. trocando a peça que não apresentar este número mínimo de horas. b) Responda: b1) Qual a % de pessoas que utilizam o computador pessoal por menos de 12.0 11.2 20.000 4. Os dados abaixo são as horas de uso do computador pessoal durante uma semana para uma amostra de 50 pessoas.2 7. qual é a garantia.000 3.6 0.4 6. freqüência relativa (%). freqüência acumulada e freqüência acumulada relativa (%) – Calcule a amplitude de classe ideal para responder às próximas questões iniciando de 0. 8.2 25. f) Qual é o tempo mediano de utilização do computador pessoal? Interprete o resultado obtido.8 7.0 horas (inclusive)? c) Construa um histograma de freqüências absolutas para esta distribuição.5 18.000 1.4 8.6 19.24.8 12.6 14.2 8.6 8.000 5.0 17.1 7.4 6. d) Qual é o tempo médio de utilização do computador pessoal? e) Qual é o desvio padrão? Interprete o resultado obtido em termos de coeficiente de variação.1 8.4 8.8 6. O relatório Nielsen de Tecnologia Doméstica (20/02/2003) relatou o uso de tecnologia doméstica por pessoas com 12 anos ou mais. Uma amostra do tempo de vida útil de uma peça automotiva forneceu a seguinte distribuição: Vida útil (horas) 0 1.0 horas? b2) Qual o número de pessoas que utilizam o computador pessoal pelo menos por 20.0.9 14.8 4.2 21.8 11. se ele está disposto a trocar 4% das peças? 25.000 No de peças ( f i ) 6 42 86 127 74 15 Se o fabricante deseja estabelecer uma garantia mínima para o número de horas de vida útil dessa peça.6 12.3 20.2 a) Sintetize os dados construindo uma tabela de distribuição de freqüências – freqüência absoluta. a partir de quantas horas esses usuários serão premiados? 54 .4 11.9 11.0 22.2 5.5 6.3 12.3 11.000 2.8 8.5 7.000 2.000 4.0 9.000 5.

São Paulo: Atlas. A Estatística oferece meios de se chegar à relação entre a variável dependente (y) e as variáveis independentes (x1. Será estudado o modelo: y = ax +b (ajuste de uma reta).0 4. 55 . CORRELAÇÃO: Mede o grau de relação entre as duas variáveis.0 2.ed. 5. D. STEVENSON. xn) que influenciam o comportamento de y. São Paulo: Harbra Harper How do Brasil. 3.CAPÍTULO 4 . São Paulo: Pioneira Thomson Learning. Estatística Aplicada à Administração e Economia. 2002.S. DIAGRAMA DE DISPERSÃO Exemplo 1: Suponha que um analista toma uma amostra aleatória de 10 carregamentos por caminhão feitos por uma companhia e anota a distância em quilômetros e o tempo de entrega em dias (arredondado para o meio dia mais próximo). & WILLIAMS. É interessante plotar um diagrama. no caso a distância rodoviária. J. x3. Seja y uma variável de interesse e cujo comportamento futuro deseja-se prever. é plotado no eixo horizontal.ed.REGRESSÃO LINEAR E CORRELAÇÃO BIBLIOGRAFIA CONSULTADA: 1. ANDERSON.5 3. no qual cada ponto plotado representa um par observado de valores para as variáveis dependente e independente. O valor da variável independente.0 5. G. x3. MARTINS.0 4.5 1. NOBRE. & DONAIRE D. 2001. x2. J. Estatística Aplicada à Administração. Carregamento Distância Rodoviária (km) x 1 825 2 215 3 1070 4 550 5 480 6 920 7 1350 8 325 9 670 10 1215 Tempo de entrega (dias) y 3. a variável dependente do modelo.ed. 1995.0 1.J. xn) através da análise de regressão. SWEENEY. 2... D. 4. W.. É fácil identificar uma série de variáveis xi (x1. São Paulo: Saraiva. & CLARK. J. Estatística Aplicada.. 4.5 1.. conforme a tabela abaixo. 3. 2. É uma equação que descreve a relação em termos matemáticos. x2.. DOWNING. REGRESSÃO LINEAR E CORRELAÇÃO REGRESSÃO LINEAR SIMPLES: Método de análise da relação entre uma variável independente e uma variável dependente.0 3.. enquanto que. T.R.. A. D.M.0 Uma boa maneira de determinar se há relação entre a distância rodoviária percorrida e o tempo de entrega do carregamento é traçar um gráfico. São Paulo: Universidade Paulista.. 2007. Apostila de Estatística. x. Na REGRESSÃO a variável y é chamada de variável dependente e a variável x de variável independente. Princípios de Estatística. 2002.A.

é necessário calcular-se os valores de a e b de forma que a reta passe. 6 5 Tempo de Entrega (dias) 4 3 2 1 0 0 200 400 600 800 1000 1200 1400 1600 Distância Rodoviária (km) Pelo diagrama acima. x= b= ∑y ∑x − a. cujos coeficientes. Portanto. Este tipo de gráfico é chamado diagrama de dispersão (ver figura abaixo). Exemplo 2: Determinando a equação de regressão de mínimos quadrados para os dados apresentados no Exemplo 1. é apropriado ao caso. tão próxima quanto possível. n n A equação ajustada y = a. dos pontos assinalados no diagrama de dispersão. O melhor método para a determinação dos parâmetros a e b é o Método dos Mínimos Quadrados. a e b. Isto é. 56 .x + b permite predizer o valor de y a partir de um determinado valor de x.∑ y n∑ x 2 − ( ∑ x ) 2 ∑x ∑y = média dos xi. onde n = número de observações. y = = média dos yi n n b = y − a. é plotado no eixo vertical.x + b. AJUSTE DE UMA RETA .MÉTODO DOS MÍNIMOS QUADRADOS Estabelecido o modelo y = a. serão determinados.x . y. a análise de regressão linear. é possível calcular os parâmetros a e b pela aplicação das seguintes fórmulas: a= n∑ xy − ∑ x.o valor da variável dependente. deseja-se minimizar a discrepância total entre os pontos marcados e a reta. Assim. Segundo esse método. Para cada observação será marcado um ponto. parece que os pontos seguem uma relação linear. no caso o tempo de entrega.

400 1.0 = 0.∑ y n.5 1.12 é a reta ajustada.0 5.0 4.5 a= n.760.0 6.370.0 1.100.887.0 4.5 10 × 7104300 − (7620 )2 = 0.12 x= Portanto.075.0 n 10 ∑ y 28.225 1.476.0 ∑ x = 7620 ∑ y = 28.104.85 − 0.225 7.500 105. Para isso.x + 0.5 3.280.5 215.620 Tempo de entrega (dias) y 3.625 46.0 3.0035851× 762.500 230.0035851 ∑ x 7620 = = 762.144.075.625 448. conforme a figura abaixo.5 x2 680. é conveniente a construção da tabela: Carregamento amostrado 1 2 3 4 5 6 7 8 9 10 Total Solução: Distância (km) x 825 215 1070 550 480 920 1350 325 670 1215 7.900 302.5 y= = = 2.900 1.0 26.x + b ⇒ y = 0.1182 ≅ 0.0 1.5 1.0 2. logo b = 2.Neste caso.0 4.0 n = 10 ∑ x. que está traçada no diagrama de dispersão do Exemplo 1. 6 5 Tempo de Entrega (dias) 4 3 2 1 0 0 200 400 600 800 1000 1200 1400 1600 Distância Rodoviária (km) 57 .85 n 10 b = y − a.300 x.y = 26370.0 − 7620 × 28.400 846. é necessário calcular a e b.0 6.0 2.5 2.0 487.∑ x 2 − ( ∑ x ) 2 ∑ x 2 = 7104300 = 10 × 26370.0 480. y = a.y 2.x .0036.∑ xy − ∑ x.0 28.822.010.

Usando a equação de regressão desenvolvida acima. ou seja. Estas afirmações podem ser observadas abaixo. Isto é. Isto é. o tempo de entrega para um carregamento pela distância rodoviária de 1.x + 0. Para a distância de 1. todos os pontos dados estão numa linha reta que tem inclinação positiva (função linear crescente). medir o grau de ajuste dos valores em torno de uma reta.0036. COEFICIENTE DE CORRELAÇÃO É a medida que descreve o grau da associação linear entre duas variáveis aleatórias contínuas.12 = 3. que é a distância máxima para a qual essa equação de regressão foi estimada. Valores do coeficiente de correlação próximos a zero indicam que x e y não estão linearmente relacionados. perfeito. Os valores do coeficiente de correlação r estão sempre entre –1 e +1. 58 .12 = 0. Para avaliar o coeficiente de correlação linear entre duas variáveis. pelas configurações dos diagramas de dispersão para diferentes valores de r.00 → Relacionamento linear positivo. por exemplo. pode-se estimar o tempo de entrega de um carregamento para qualquer distância.000 km. o cálculo é o seguinte: y = 0.0036. Um valor -1 indica que as duas variáveis x e y estão perfeitamente relacionadas de forma linear negativa. Um valor +1 indica que as duas variáveis x e y estão perfeitamente relacionadas de forma linear positiva.72 dias Logo. por exemplo. é utilizado o coeficiente de correlação de Pearson. onde n é o número de observações. desde que as viagens não ultrapassem 1.1000 + 0. Este coeficiente de correlação é dado por: r= n ∑ xy − (∑ x )(∑ y) [n ∑ x 2 − (∑ x ) 2 ][n ∑ y 2 − (∑ y) 2 ] .350 km. 80 70 60 50 40 30 20 10 0 0 5 10 15 20 25 30 35 40 y x r = +1.000 km é igual a 3. x e y.72 dias. todos os pontos dados estão numa linha reta que tem inclinação negativa (função linear decrescente).

80 70 60 50 40 y 30 20 10 0 -10 0 5 10 15 20 25 30 35 x r ≅ 0. moderado.00 → Relacionamento linear negativo. 100 80 60 y 40 20 0 0 5 10 15 20 25 30 35 40 x r = 0 → Ausência de relacionamento linear 50 40 30 20 10 0 -10 -20 -30 0 5 10 15 20 25 30 35 40 y x r = -1.70 → Relacionamento linear positivo. perfeito 59 .

0 5. Reapresentando a tabela com o cálculo de y2.95 49033.0 1. necessário neste caso.500 105.104.5 r= n∑ xy − ( ∑ x )( ∑ y ) [n∑ x 2 − ( ∑ x )2 ].0 n = 10 ∑ x.0036.25 9.0 4.r ⇒ y ajustado ⇒ x >< y ⇒ r (coeficiente de correlação linear) g y RCL 1 RCL 2 RCL 3 ⇒ n ⇒ Σx ⇒ Σ x2 RCL 4 RCL 5 RCL 6 ⇒ Σy ⇒ Σ y2 ⇒ Σ x.x + 0.5 x2 680.0 ∑ x = 7620 2 ∑ y = 99.0 6.67 ou = 10 × 26370.887.625 448.225 1.0 16.400 846.075.400 1. o que representa uma excelente relação linear entre as variáveis x e y.12 .280.0 2.900 302.0 26.00 9.5 3.476.0 1.00 1.760.620 Tempo de entrega (dias) y 3.00 20.5 1.25 2.0 4.010.0 6.[n∑ y 2 − (∑ y )2 ] 46530 = 0.5 2.25 1.5)2 ] r = 95% r= A equação da reta ajustada.225 7.5 215.0 480.y 2.00 25.100. é y = 0. Lembrete: HP-12C (Regressão Linear): y ⇒ enter x ⇒ Σ+ ˆ .75 x.900 1.75 ∑ x 2 = 7104300 ∑ y = 28. com coeficiente de correlação igual a 95%.625 46.0 3.75 − (28.y 60 .144.y = 26370.00 4. para o cálculo de r: Carregamento amostrado 1 2 3 4 5 6 7 8 9 10 Total Solução: Distância (km) x 825 215 1070 550 480 920 1350 325 670 1215 7. como visto no Exemplo 2.Exemplo 3: Determinando o coeficiente de correlação linear de Pearson para os dados apresentados no Exemplo 1.075.0 2.5 1.0 28.9489 ≅ 0.370.0 4.300 y2 12.00 99.0 − 7620 × 28.0 487.5 [10 × 7104300 − (7620) 2 ] × [10 × 99.500 230.822.

Discuta a correlação dessas variáveis se: a) O coeficiente de correlação linear determinado foi de 0. d) Calcule o coeficiente de correlação e interprete seu significado.70 16. b) Qual a previsão de vendas dessa companhia para o 11o mês? 5. foram observadas duas variáveis: X: anos de experiência em um dado cargo e Y: tempo gasto na execução de certa tarefa relacionada com esse cargo. desde a construção) de cinco casas. b) O coeficiente de correlação linear determinado foi de 0. determine os coeficientes a e b da reta pelo método dos mínimos quadrados e escreva a equação da reta. c) Represente graficamente a reta obtida no diagrama de dispersão. faça o diagrama de dispersão. b) Determine a equação da reta. Tempo após construção (anos) x 5 7 10 13 20 Valor do aluguel (mil reais) y 6 5 4 3 2 a) Para esse conjunto de dados. 61 . O objetivo é ter uma equação matemática que permita realizar projeções e estimativas de vendas entre a variável dependente vendas e a variável independente investimento em propaganda. Na tabela abaixo são apresentados os custos de manutenção por hora classificados pela idade da máquina em meses.50 19. Se uma reta parecer apropriada.0 4 8.LISTA 4 – Exercícios para fixação 1. c) Fazer uma previsão de custo para uma máquina de 20 meses.20 42 26.9865. e) Qual será o valor do aluguel para uma casa com 16 anos de idade? f) Qual será a idade de uma casa cujo aluguel é 4.0 2 6. está querendo analisar a relação que existe entre o investimento em propaganda e o valor das vendas da empresa.7 3 6. Numa amostra de cinco operários de uma dada empresa.7 5 6.90 3. c) Determine o coeficiente de correlação e interprete o seu significado.5734. Na tabela abaixo estão indicados o valor y do aluguel (em mil reais) e a idade x (em anos. b) Se uma reta parecer apropriada. O departamento de vendas da rede relacionou os dados levantados na tabela abaixo: Investimento anual (milhões de reais) Vendas anuais (milhões de reais) 32 430 21 330 37 470 12 190 17 270 24 480 a) Construa o diagrama de dispersão. Idade x (meses) 6 15 24 Custos y ($) 9.2 6 8. Na tabela abaixo está representado o valor total de vendas (em milhões de reais) de uma companhia por 10 meses consecutivos.8 a) Faça o diagrama de dispersão.6 7 11.30 a) Determinar a reta de regressão.52 mil reais? 2. 33 19. 4.6 10 10.9 9 10. O diretor de vendas de uma rede de varejo com vendas a nível nacional. d) Faça uma projeção dos valores de vendas para investimento de 600 milhões de reais. determine a equação da reta pelo método dos mínimos quadrados e plote-a no diagrama de dispersão.0 8 11. b) Calcular o coeficiente de correlação e interpretar seu significado. x y 1 5.

O que ele sugere? b) Calcule o coeficiente de correlação e interprete seu significado.0 2002 23. Na tabela abaixo estão apresentados o número de anúncios publicados e o correspondente número de carros vendidos por 6 companhias.. Na tabela seguinte estão indicadas as porcentagens de mulheres que trabalham em cada companhia e as porcentagens de cargos de gerência ocupados por mulheres nessas companhias.0 25. d) Qual a previsão do gasto com alimentação para uma família com renda de 17 salários mínimos? e) Qual a previsão do gasto com alimentação para uma família com excepcional renda. b) Calcular o coeficiente de correlação.6.0 a) Ajustar uma reta aos dados (atenção: modificar a variável x para x = 0. suas vendas? 9. c) Estimar a produção de aço para 2005. 7. Renda familiar (salários mínimos) 3 5 10 20 30 50 70 100 150 200 Gasto com alimentação (salários mínimos) 1.0 10.7 2004 35. Na tabela abaixo é apresentada a produção de aço de uma indústria no período de 2000 a 2004: Ano (x) Produção de Aço (y) (toneladas) 2000 17.0 60. 2. c) Ajuste a reta de regressão e interprete o significado dos coeficientes.3 2003 28. 1.. d) Com base nos resultados anteriores. que usaram apenas este jornal como veículo de propaganda.).000 salários mínimos? Você acha este valor razoável? Por quê? 8. portanto.0 a) Construa o diagrama de dispersão.5 2001 19..0 15.0 40. c) Ajuste a reta de regressão e interprete o significado dos coeficientes. Companhia Anúncios Vendas A 74 139 B 45 108 C 48 98 D 36 76 E 27 62 F 16 57 a) Construa o diagrama de dispersão. como por exemplo. Os dados abaixo correspondem às variáveis renda familiar (em salários mínimos) e gasto com alimentação (em salários mínimos) em amostra de 10 famílias.0 20. aumentando.5 2. 1. O que ele sugere? b) Calcule o coeficiente de correlação e interprete seu significado. Companhia Federated Department Stores Kroger Marriot McDonald's Sears Porcentagem de mulheres 72 47 51 57 55 Porcentagem de mulheres gerentes 61 16 32 46 36 62 .0 80.0 6. Um jornal quer verificar a eficácia de seus anúncios na venda de carros usados. como você argumentaria com a Companhia F para que ela aumentasse o número de anúncios.

Quantidade produzida Custo Total (R$) 10 100 11 112 12 119 13 130 14 139 15 142 a) Construir o diagrama de dispersão. c) Ajuste uma reta aos dados pelo método dos mínimos quadrados e trace a reta no diagrama de dispersão.a) Construa o diagrama de dispersão. Os dados abaixo se referem às variáveis gastos com publicidade (em mil reais) e faturamento (em mil reais) para o Kuriuwa Hotel na cidade de Monte Verde. A tabela abaixo indica a quantidade de bolas de futebol de salão produzidas mensalmente e os respectivos custos totais de produção. uma companhia onde 55% dos funcionários são mulheres? 10. Como esse valor previsto se compara aos 36% da Sears. f) Determine o custo estimado para a produção de 16 bolas. e) Faça uma previsão da porcentagem de cargos de gerência ocupados por mulheres em uma companhia onde 55% são mulheres. é possível afirmar que o sistema se comporta de forma aproximadamente linear? c) Os pontos apresentam um comportamento crescente ou decrescente? d) Determine a equação da reta que melhor se ajusta a esses dados. b) Qual a previsão de faturamento do hotel se forem gastos R$ 8 mil em publicidade? c) Qual a previsão de gastos com publicidade no caso de se pretender um faturamento de R$ 50 mil? d) Calcule o coeficiente de correlação e interprete seu significado. 63 . Na tabela a seguir estão indicadas as quantidades produzidas mensalmente de televisores da marca SHAWN e os respectivos custos totais de produção. b) Calcule o coeficiente de correlação e interprete seu significado. b) O valor mais provável dos custos fixos. 11. utilizando Análise de Regressão. e) Determine o valor mais provável dos custos fixos. Quantidade produzida Custo Total (R$) 1 100 2 120 3 130 4 140 5 150 6 160 7 170 8 180 9 190 10 200 Pede-se estabelecer pela Análise de Regressão: a) A reta que melhor se ajusta a esses dados. MG. 12. Gastos com publicidade (mil reais) 1 2 4 6 10 14 Faturamento (mil reais) 20 32 40 44 52 54 a) Ajuste uma reta aos dados pelo método dos mínimos quadrados. b) Analisando o gráfico obtido. d) Faça uma previsão da porcentagem de cargos de gerência ocupados por mulheres em uma companhia que tem 60% de funcionários do sexo feminino. c) O valor do custo estimado para a produção de 12 televisores.

8% 1. 14.6% Com base no coeficiente de correlação linear.550 30 2. c) representar graficamente a reta de regressão no mesmo sistema de coordenadas do item a.4% 1. determinar a equação da reta) que melhor se ajusta à escala de oferta do produto Y. Um levantamento das taxas de retorno desses ativos nos últimos quatro meses é apresentado na tabela abaixo: Ativo X Y Janeiro 6.6% Taxa de Retorno (%) Fevereiro Março 4. como medida da relação entre séries de números que representam qualquer tipo de dados. b) identificar o modelo linear (ou seja.0% 1.8% 3. 15.7% 1.8% Abril 5.13. c) representar graficamente a reta de regressão no mesmo sistema de coordenadas do item a.800 50 1.1% 2.000 60 500 a) representar graficamente os dados apresentados. O que pode ser comentado a respeito do risco dessa carteira de ativos? 16.4% 4.1% Abril 2. Considere uma carteira AB. Um levantamento das taxas de retorno desses ativos nos últimos quatro meses é apresentado na tabela abaixo: Ativo A B Janeiro 2.7% 3. determinar a equação da reta) que melhor se ajusta à escala de demanda do produto X.5% Taxa de Retorno (%) Fevereiro Março 3. Uma pesquisa sobre a oferta de mercado de um produto Y levou à seguinte escala de demanda: Preço p (R$/unidade) Quantidade ofertada q (unidades) 47 34 65 75 80 120 100 130 120 170 a) Representar graficamente os dados apresentados.600 40 1. Uma pesquisa sobre a demanda de mercado de um produto X levou à seguinte escala de demanda: Preço p (R$/unidade) Quantidade demandada q (unidades) 20 3. pode ser utilizada também para medir a diversificação de uma carteira de ativos. O risco de uma carteira de ativos pode ser reduzido pela combinação de ativos negativamente correlacionados ou de baixa correlação positiva.1% 2. composta de 50% de ativos A e 50% de ativos B. composta de 50% dos ativos X e 50% dos ativos Y. Considere a carteira XY. O coeficiente de correlação. b) identificar o modelo linear (ou seja. faça um comentário a respeito do risco dessa carteira de ativos.5% 3. 64 .9% Determine o coeficiente de correlação linear.