Estatística Aplicada

1. Introdução à Estatística
1.1. Entendendo a importância da Estatística Jornais, televisão, rádio, revistas e outros meios de comunicação nos bombardeiam, diariamente, com notícias, baseadas em estatísticas, como se fossem verdades absolutas. Nessa hora, provavelmente, você sente a importância de ser capaz de avaliar corretamente o que lhe dizem. Todavia, será que os números apresentados resultam de uma análise estatística cuidadosa? O perigo está no fato de que, se não consegue distinguir as afirmações falsas das verdadeiras, então você está vulnerável à manipulação por outras pessoas, cujas conclusões podem conduzir você para decidir contra os interesses seus e, depois, arrepender-se. Por estas razões, conhecer Estatística é um grande passo no sentido de você tomar controle da sua vida (embora não seja, obviamente, a única maneira necessária para esta finalidade). Observe os seguintes exemplos de afirmações recentemente publicadas em dez meios de comunicação (não estou dizendo que cada uma delas seja verdadeira).   Sua expectativa é de que a inflação feche o ano entre 6% e 7%. (Folha de São Paulo, Dinheiro, 16 de maio de 2005) Atualmente, a taxa de pacientes com câncer de pulmão que não apresentam reincidência depois de cinco anos de tratamento é de 17% – um avanço de 70% em relação à década de 70. (Revista Veja, edição 1905, 18 de maio de 2005) As projeções de mercado para o IPCA de 2005 subiram de 6,30% para 6,39% em pesquisa semanal feita pelo Banco Central e divulgada hoje. (O Estado de São Paulo, 16 de maio de 2005) Um estudo da Corporate Executive Board mostrou que a produtividade de um funcionário brilhante chega a ser até 12 vezes superior à do colega mediano. (Revista Exame, edição 841, 27 de abril de 2005) De acordo com a Embratur (Empresa Brasileira de Turismo), a companhia aérea trouxe 1.473.183 dos 6.138.000 passageiros que entraram no país no ano passado, o equivalente a 24% desses passageiros. (Revista Aeromagazine, Notícias, 16 de maio de 2005) IBGE: Emprego industrial cai 0,2% em março. (JB Online, 16 de maio de 2005) Os investidores que colocam todo seu dinheiro em uma única ação estão elevando em mais de 50% a chance de queda do poder de compra de seu investimento em um período de 20 anos, aponta o estudo. (JB Online, 17 de abril de 2005) Nordestinos já são 52,6% dos migrantes. (Jornal O Globo, 16 de maio de 2005) Comércio varejista cresce 1,75% em volume de vendas e 2,44% em receita nominal. (IBGE, 12 de maio de 2005) Se a vítima não fosse o prefeito de Santo André, o impacto não seria o mesmo e o caso teria sido tratado como mera estatística. (Márcio Coimbra em http://www.ambito-juridico.com.br/aj/cron0237.htm)

  

 

Todas essas notícias são, na sua essência, Estatística. Elas parecem familiares, embora os exemplos sejam de áreas bastante distintas: economia, medicina, gestão, turismo, social, investimentos, comércio e até política. Em resumo, os números (também expressos por meio de tabelas e gráficos) e a interpretação deles surgem nos discursos de praticamente todo aspecto da vida contemporânea. Desse modo, as estatísticas são, freqüentemente, apresentadas como um testemunho de credibilidade a um argumento ou a uma recomendação, fato que você pode comprovar ouvindo o veiculado nos meios de comunicação: o primeiro pensamento é acreditar na notícia como se fosse verdade absoluta. Recorde-se, então, do ex-primeiroministro britânico Benjamin Disraeli (1804-1881), quando afirmou que “Há três espécies de mentiras: mentiras, mentiras deslavadas e estatísticas”. No entanto, Estatística é método, ciência e arte. É método quando, na Física, na Biologia, na Medicina ou na Pedagogia, aplica-se a populações específicas, isto é, serve a uma ciência particular, da qual se torna instrumento. É ciência quando, graças às suas teorias, estuda grandes conjuntos, independentemente da natureza destes, sendo autônoma e universal. Finalmente, é arte na construção de modelos para representar a realidade. Assim sendo, nem tudo está perdido, porque a Estatística pode ajudar você a reagir de modo inteligente às informações que lê ou escuta e, neste sentido, torna-se um dos mais importantes assuntos que provavelmente estudou. O presente artigo tem o objetivo de motivar você a ser mais um dos consumidores inteligentes de estatísticas e, para ser um deles, o primeiro passo é refletir e começar a questionar aquelas que encontrar. Por esta razão, convido você a reformar os seus hábitos estatísticos a partir de agora. Simplesmente, não mais aceite números, tabelas, gráficos e conclusões. Ao invés disso, comece a pensar nas fontes de informação e, mais importante, nos procedimentos usados
Prof. Rosiel Sousa blog: rosielsousa.blogspot.com

3

Estatística Aplicada

para gerar essa informação. Defenda-se contra afirmações falsas, embrulhadas como se fossem estatísticas. Aprenda a reconhecer se uma evidência estatística apóia, realmente, uma conclusão apresentada. A Estatística está toda ela em volta de você, algumas vezes usada de modo adequado, outras vezes não. Como o objetivo da Estatística é auxiliar a sua tomada de decisões em situações de incerteza, distinguir as boas das más estatísticas é mais do que nunca, um dever, uma obrigação. 1.2. Objeto da Estatística Estatística é uma ciência exata que visa fornecer subsídios ao analista para coletar, organizar, resumir, analisar e apresentar dados. Trata de parâmetros extraídos da população, tais como média ou desvio padrão. A estatística fornece-nos as técnicas para extrair informação de dados, os quais são muitas vezes incompletos, na medida em que nos dão informação útil sobre o problema em estudo, sendo assim, é objetivo da Estatística extrair informação dos dados para obter uma melhor compreensão das situações que representam. Quando se aborda uma problemática envolvendo métodos estatísticos, estes devem ser utilizados mesmo antes de se recolher a amostra, isto é, deve-se planejar a experiência que nos vai permitir recolher os dados, de modo que, posteriormente, se possa extrair o máximo de informação relevante para o problema em estudo, ou seja para a população de onde os dados provêm. Quando de posse dos dados, procura-se agrupá-los e reduzi-los, sob forma de amostra, deixando de lado a aleatoriedade presente. Seguidamente o objetivo do estudo estatístico pode ser o de estimar uma quantidade ou testar uma hipótese, utilizando-se técnicas estatísticas convenientes, as quais realçam toda a potencialidade da Estatística, na medida em que vão permitir tirar conclusões acerca de uma população, baseando-se numa pequena amostra, dando-nos ainda uma medida do erro cometido. Exemplo: Ao chegarmos a uma churrascaria, não precisamos comer todos os tipos de saladas, de sobremesas e de carnes disponíveis, para conseguirmos chegar a conclusão de que a comida é de boa qualidade. Basta que seja provado um tipo de cada opção para concluirmos que estamos sendo bem servidos e que a comida está dentro dos padrões. 1.2. Método Estatístico 1.2.1. O Método Científico Muitos dos conhecimentos que temos foram obtidos na antiguidade por acaso e, outros, por necessidades práticas, sem aplicação de um método. Atualmente, quase todo acréscimo de conhecimento resulta da observação e do estudo. Podemos dizer, então, que: Método é um conjunto de meios dispostos convenientemente para se chegar a um fim que se deseja. Dos métodos científicos, vamos destacar o método experimental e o estatístico. 1.2.2. O Método Experimental O método experimental consiste em manter constantes todas as causas (fatores), menos uma, e variar esta causa de modo que o pesquisador possa descobrir seus efeitos, caso existam. É o método preferido no estudo da Física, da Química, etc. 1.2.3. O Método Estatístico Muitas vezes temos a necessidade de descobrir fatos em um campo em que o método experimental não se aplica (nas ciências sociais), já que os vários fatores que afetam o fenômeno em estudo não podem permanecer constantes enquanto fazemos variar a causa que, naquele momento, nos interessa.
Prof. Rosiel Sousa blog: rosielsousa.blogspot.com

4

Estatística Aplicada

Como exemplo, podemos citar a determinação das causas que definem o preço de uma mercadoria. Para aplicarmos o método experimental, teríamos que fazer variar a quantidade da mercadoria e verificar se tal fato iria influenciar seu preço. Porém, seria necessário que não houvesse alteração nos outros fatores. Assim, deveria existir, no momento da pesquisa, uma uniformidade dos salários, o gosto dos consumidores deveria permanecer constante, seria necessária a fixação do nível geral dos preços das outras necessidades etc. Mas isso tudo é impossível. Nesses casos, lançamos mão de outro método, embora mais difícil e menos preciso, denominado método estatístico. O método estatístico, diante da impossibilidade de manter as causas constantes, adimite todas essas causas presentes variando-as, registrando esses variações e procurando determinar, no resultado final, que influências cabem a cada uma delas. 1.3. A Estatística Exprimindo por meio de números as observações que se fazem de elementos com, pelo menos, uma característica comum (por exemplo: os alunos do sexo masculino de uma comunidade), obtemos os chamados dados referentes a esses elementos. Podemos dizer, então, que: A Estatística é uma parte da Matemática Aplicada que fornece métodos para a coleta, organização, descrição, análise e interpretação de dados e para a utilização dos mesmos na tomada de decisões. A coleta, a organização e a descrição dos dados estão a cargo da Estatística Descritiva, enquanto a análise e a interpretação desses dados ficam a cargo da Estatística Indutiva ou Inferencial. Em geral, as pessoas, quando se referem ao termo estatística, o fazem no sentido da organização e descrição dos dados (estatística do Ministério da Educação, estatística dos acidentes de tráfego, etc.), desconhecendo que o aspecto essencial da Estatística é o de proporcionar métodos inferenciais, que permitam conclusões que transcedam os dados obtidos inicialmente. Assim, a análise e interpretação dos dados estatísticos tornam possível o diagnóstico de uma empresa (por exemplo, de uma escola), o conhecimento de seus problemas (condições de funcionamento, produtividade), a formulação de soluções apropriadas e um planejamento objetivo de ação. 1.4. Fases do Método Estatístico Podemos distinguir no método estatístico as seguintes fases: 1.4.1. Coleta de Dados A coleta de dados pode ser direta e indireta. A coleta é direta quando feita sobre elementos informativos de registro obrigatório (nascimentos, casamentos e óbitos, importação e exportação de mercadorias), elementos pertinentes aos prontuários dos alunos de uma escola ou, ainda, quando os dados são coletados pelo prórpio pesquisador através de inquéritos e questionários, como é o caso das notas de verificação e de exames, do censo demográfico, etc. A coleta direta de dados pode ser classificada relativamente ao fator tempo em: a) contínua (registro) – quando feita continuamente, tal como a de nescimentos e óbitos e a de frequencia dos alunos às aulas; b) periódica – quando feita em intervalos constantes de tempo, como os censos (de 10 em 10 anos) e as avaliações mensais dos alunos; c) ocasional – quando feita exporadicamente, a fim de atender a uma conjuntura ou a uma emergência, como no caso de epidemias que assolam ou dizimam rebanhos inteiros. A coleta se diz indireta quando é inferida de elementos conhecidos (coleta direta) e/ou do conhecimento de outros fenômenos relacionados com o fenômeno estudado. Como exemplo, podemos citar a pesquisa sobre a mortalidade infantil, que é feita através de dados colhidos por uma coleta direta.
Prof. Rosiel Sousa blog: rosielsousa.blogspot.com

5

Estatística Aplicada

1.4.2. Apuração dos Dados Após a coleta dos dados, torna-se necessária sua apuração, ou contagem, denominando-a Tabulação. Para tanto, de posse dos dados, devemos ordená-los mediante critérios de classificação. Pode ser manual, eletromecânica ou eletrônica. 1.4.3. Apresentação dos Dados Por mais diversa que seja a finalidade que se tenha em vista, os dados devem ser apresentados sob forma adequada (tabelas ou gráficos), tornando mais fácil o exame daquilo que está sendo estudado. 1.4.4. Análise dos Resultados O objetivo último da estatística é tirar conlusões sobre o todo (população) a partir de informações fornecidas por parte representativa do todo (amostra). Assim, realizadas as fases anteriores (Estatística Descritiva), fazemos uma análise dos resultados obtidos, através dos métodos da Estatística Indutiva ou Inferencial, que tem por base a indução ou inferência, e tiramos desses resultados conclusões e previsões. 1.5. Abusos da Estatística 1.5.1. Más Amostras Outra fonte de estatística enganosa são os métodos inadequados de coleta de dados. É comum um pesquisador analisar dados e formular conclusões errôneas porque o método de coleta de dados foi deficiente. Considere o seguinte exemplo: Um jornal fez a seguinte pergunta: “Se você tivesse que começar novamente, você teria filhos? Escreva-nos. Algumas semanas depois o jornal informava que 70% dos pais dizem que não vale a pena ter filhos. Será que está amostra não era tendenciosa constituída dos pais que queriam desabafar. Como os próprios pais é que decidiram se seriam incluídos na pesquisa, temos um exemplo de pesquisa autoselecionada, ou seja, uma pesquisa em que os próprios entrevistados decidem se serão incluídos. 1.5.2. Pequenas Amostras Os resultados obtidos com pequenas amostras não são necessariamente más, entretanto, os resultados obtidos com pequenas podem por vezes ser usados como uma forma de “mentira” estatística. As preferências de apenas 10 dentistas por determinado creme dental não devem servir de base para uma afirmação generalizada como “A pasta WW é recomendada por 8 em cada 10 dentistas.” Mesmo que a amostra seja grande, ela deve ser não tendenciosa e representativa da população de onde provém. 1.5.3. Estimativas por Suposição Outra fonte de engano estatístico envolve estimativas que são, na verdade, suposições (palpites), podendo apresentar erros substanciais. É preciso considerar a fonte da estimativa e a maneira como foi estabelecida. 1.5.4. Porcentagens Distorcidas: Por vezes utilizam-se porcentagens confusas ou distorcidas. Em um anúncio de página inteira, a Continental Airlines anuncia melhores serviços. No tocante ao caso de bagagem extraviada, o anúncio afirmava que se trata de uma área em que já melhoramos 100% nos últimos seis meses”. Em um editorial criticando essa estatística, o New York Times interpretou corretamente a melhora de 100% como significando que agora não se extravia mais qualquer bagagem – o que ainda não foi conseguido pela Continental Airlines.

Prof. Rosiel Sousa

blog: rosielsousa.blogspot.com

6

Estatística Aplicada

1.5.5. Perguntas Tendenciosas As perguntas em uma pesquisa podem ser formuladas de modo a “sugerirem” uma resposta. Por exemplo, Considere estas duas perguntas: Que rádio você prefere? A pergunta não sugere a resposta enquanto que a pergunta: A rádio Transamérica é a sua rádio preferida? Bom claro que é. Esta pergunta força a resposta. 1.5.6. Pressão do Pesquisador Quando se formulam perguntas a indivíduos pesquisados, esses freqüentemente dão respostas favoráveis à sua auto-imagem. Em uma pesquisa telefônica, 94% dos que responderam disseram que lavam suas mãos após usar um banheiro, mas a observação em lugares mostrou que o percentual efetivo é de apenas 68%. Outros exemplos: 1. Para determinar a reação do público à continuação de certo programa governamental, o pesquisador pergunta: “Acha que este programa dispendioso deve ser interrompido?” Explique por que esta pergunta provavelmente não proporcionará a informação desejada. Resposta: Ao formular a questão, o entrevistador está de fato, sugerindo que o programa é dispendioso. 2. Para estudar a reação do consumidor a um novo tipo de alimento enlatado, faz-se uma pesquisa de casa em casa durante as manhãs dos dias úteis, sem plano de voltar no caso de não ser encontrado ninguém em casa. Explique por que esta abordagem pode conduzir a uma informação enganadora. Resposta: Esta pesquisa não atinge os que têm maior probabilidade de usar o produto, pessoas solteiras ou casais em que ambos trabalham fora. 3. Uma estatística enganosa pode resultar, também da formulação de perguntas no lugar errado ou no momento errado. Explique por que, no caso seguinte, poderemos obter dados inúteis. Para predizer uma eleição, um pesquisar entrevista pessoas que saem do edifício onde está a sede nacional de um partido político. Resposta: As pessoas que saem de um edifício onde está a sede de um partido político provavelmente são filiadas ao partido. 4. Uma pessoa foi encarregada de pesquisar o reconhecimento da marca Nike, devendo contactar por telefone 1500 consumidores. Por que razão é incorreta a utilização de listas telefônicas como população para fornecer a amostra? Resposta: Excluem-se as pessoas com números não listados e pessoas sem telefone. 5. A revista Glamour publicou o seguinte resultado de uma pesquisa: “79% dos que responderam à nossa pesquisa de agosto afirmaram crer que os americanos se tornaram demasiadamente propensos a apelar para a justiça em casos corriqueiros”. A questão foi publicada na revista e os leitores podiam responder por correio, fax ou e-mail (tellus@galamour.com). Até que ponto é válido o resultado de 79%. Resposta: Como os pesquisados são auto-selecionados, os resultados da pesquisa não são válidos. 6. “De acordo com uma pesquisa de âmbito nacional feita por 250 agências de empregos, os sapatos gastos constituem o motivo mais comum para que um homem que procura emprego não cause boa impressão à primeira vista.” Os jornais apresentaram essa alegação com base em uma pesquisa encomendada pela Kiwi Brands, produtores de graxa para sapatos. Faça um comentário sobre a razão por que os resultados de tal pesquisa podem ser questionados. Resposta: Um fabricante de graxa para sapatos obviamente tem interesse na importância do seu produto, e há muitas maneiras de este fato afetar os resultados da pesquisa. 7. O jornal Newport Chronicle afirma que as mães grávidas podem aumentar suas chances de ter uma criança sadia comendo lagostas. A alegação se baseia em um estudo mostrando que as crianças nascidas de mães que comem lagostas têm menos problemas de saúde do que as nascidas de mães que não comem lagostas. Resposta: Mães que comem lagostas tendem a ser mais ricas e portanto podem pagar por melhor atendimento médico.

Prof. Rosiel Sousa

blog: rosielsousa.blogspot.com

7

Estatística Aplicada

2. População e Amostra
2.1. Variáveis    A cada fenômeno corresponde um número de resultados possíveis. Assim, por exemplo: para o fenômeno “sexo” são dois os resultados possíveis: sexo masculino e sexo feminino; para o fenômeno “número de filhos” há um número de resultados possíveis expresso através dos números naturais: 0, 1, 2, 3, ..., n; para o fenômeno “estatura” temos uma situação diferente, pois os resultados podem tomar um número infinito de valores numéricos dentro de um determinado intervalo. Variável é, convencionalmente, o conjunto de resultados possíveis de um fenômeno. Os exemplos acima nos dizem que uma variável pode ser: a) qualitativa – quando seus valores são expressos por atributos: sexo (masculino ou feminino), cor da pele (branca, preta, amarela, vermelha, parda), etc.; b) quantitativa – quando seus valores são expressos em números (salários dos operários, idade dos alunos de uma escola, etc.). Uma variável quantitativa que pode assumir, teoricamente, qualquer valor entre dois limites recebe o nome de variável contínua; uma variável que só pode assumir valores pertencentes a um conjunto enumerável recebe o nome de variável discreta. Assim, o número de alunos de uma escola pode assumir qualquer um dos valores do conjunto N = {1, 2, 3, ..., 58, ...}, mas nunca valores como 2,5 ou 3,78 ou 4,325, etc. Logo, é uma variável discreta. Já o peso desses alunos é uma variável contínua, pois um dos alunos pode pesar 72 kg, como 72,5 kg, como 72,54 kg, etc., dependendo esse valor da precisão da medida. 2.2. População e Amostra A Estatística é uma ciência baseada na teoria das probabilidades, cujo principal objetivo é nos auxiliar a tirar conclusões, em situações de incerteza, a partir de informações numéricas de uma amostra. É comum, por exemplo, às vésperas de uma eleição, um jornal afirmar que um candidato A vencerá com uma certa margem de votos. Em geral, esse tipo de afirmação está baseado numa pesquisa feita entre alguns eleitores, que constituem a amostra da pesquisa, uma vez que é impossível fazer a pesquisa com todos os eleitores (população envolvida). A primeira tarefa de um estatístico é definir clara e precisamente o problema a ser estudado, qual a população envolvida e que amostra irá utilizar. Exemplo 1: Queremos obter informações sobre a audiência de certo programa de TV, na Grande Vitória. - População: conjunto de todos os domicílios da região da Grande Vitória que possuem TV. - Amostra: conjunto de domicílios que serão visitados. Exemplo 2: Estudar a procedência dos candidatos a uma certa universidade. - População: conjunto de todos os candidatos à referida universidade. - Amostra: conjunto dos candidatos que serão entrevistados. Todos os elementos do grupo a ser estudado constituem a população. A parte da população efetivamente examinada é a amostra. Suponhamos uma pesquisa sobre o nível de escolaridade de um grupo de 800 (oitocentas) pessoas. Nesse caso, a população é o conjunto das oitocentas pessoas. Se sentirmos desnecessário ou impossível examinar os oitocentos elementos, podemos recorrer a amostragem, ou seja, podemos examinar alguns desses elementos. É claro que se escolhermos apenas dois desses oitocentos elementos, corremos o risco de selecionar exatamente dois elementos com as mesmas características. Se os dois forem analfabetos, por exemplo, podemos concluir que todos elementos da população também o são. Observe que, qualquer que seja a amostra, sempre corremos o risco de chegar a conclusões erradas, mas este risco diminui à medida qua aumenta a quantidade de elementos a serem examinados. Devemos estabelecer um número mínimo de elementos para compor a amostra. Essa quantidade não deve ser 8 Prof. Rosiel Sousa blog: rosielsousa.blogspot.com

Estatística Aplicada

menor que 10% do total de elementos da população. Assim, estaremos minimizando as chances das informações da amostra se afastarem demasiadamente daquelas que obteríamos se examinássemos toda a população. No exemplo citado anteriormente, como a população tem 800 elementos, devemos escolher uma amostra com, no mínimo, 80 pessoas (10% de 800). Podemos recorrer a diferentes formas de amostragem: amostragem aleatória simples, amostragem sistemática e amostragem estratificada proporcional. 2.2.1. Amostragem Aleatória Simples Este tipo de amostragem é equivalente a um sorteio lotérico. Na prática, a amostragem aleatória simples pode ser realizada numerando-se a população de 1 a n e sorteandose, a seguir, por meio de um dispositivo aleatório qualquer, k números dessa sequência, os quais corresponderão aos elementos pertencentes à amostra. Exemplo: Vamos obter uma amostra representativa para uma pesquisa da estatura de 90 (noventa) alunos de uma escola: a) Numeramos os alunos de 01 a 90. b) Escrevemos os números, de 01 a 90, em pedaços iguais de um mesmo papel, colocando-os dentro de uma caixa. Agitamos sempre a caixa para misturar bem os pedaços de papel e retiramos, um a um, 9 (nove) números que formarão a amostra. Neste caso, 10% da população. Quando o número de elementos da população é grande, esse tipo de sorteio torna-se muito trabalhoso. 2.2.2. Amostragem Sistemática Continuemos a considerar a população de 90 elementos de nossa lista numerada. Para organizar uma amostragem sistemática, sorteamos um número de 1 a 10, ao acaso. Suponhamos que tenha sido obtido o número 6. Ele será o primeiro elemento da amostra, e os demais serão determinados em intervalos de dez unidades. Assim, nossa amostra será: 6 16 26 36 46 56 66 76 86

A amostragem sistemática é simples de ser realizada e, no caso de amostras muito grandes, acarreta economia de tempo e dinheiro. 2.2.3. Amostragem Estratificada Proporcional Muitas vezes a população se divide em subpopulações – estratos. Como é provável que a variável em estudo apresente, de estrato em estrato, um comportamento heterogêneo e, dentro de cada estrato, um comportamento homogêneo, convém que o sorteio dos elementos da amostra leve em consideração tais estratos. É exatamente isso que fazemos quando empregamos a amostragem estratificada proporcional, que, além de considerar a existência dos estratos, obtém os elementos da amostra proporcional ao número de elementos dos mesmos. Exemplo: Supondo, no exemplo anterior, que, dos 90 alunos, 54 sejam meninos e 36 sejam meninas, vamos obter a amostra estratificada proporcional. São, portanto, dois estratos (sexo masculino e sexo feminino) e queremos uma amostra de 10% da população. Logo, temos:
Sexo M F Total Prof. Rosiel Sousa População 54 36 90 10% 10 × 54= 5,4 100 10 × 36= 36 , 100 10 × 90 90 = , 100 Amostra 5 4 9

blog: rosielsousa.blogspot.com

9

Estatística Aplicada

EXERCÍCIOS: Série Aula: 1) Classifique as variáveis em qualitativas ou quantitativas (discretas ou contínuas): a) Universo: alunos de uma escola. Variável: cor dos cabelos – .................................... b) Universo: casais residentes em uma cidade. Variável: número de filhos – .................................... c) Universo: as jogadas de um dado. Variável: o ponto obtido em cada jogada – .................................... d) Universo: peças produzidas por certa máquina. Variável: nº de peças produzidas por hora – .................................... e) Universo: peças produzidas por certa máquina. Variável: diâmetro externo – .................................... f) População: alunos de uma escola. Variável: cor dos olhos – .................................... g) P.: casais residentes em uma cidade. V.: sexo dos filhos – .................................... 2) Diga quais variáveis abaixo são discretas e quais são contínuas: a) P.: estação meteorológica de uma cidade. V.: precipitação pluviométrica, durante um ano – .................................... b) P.: Bolsa de Valores de São Paulo. V.: nº de ações negociadas – .................................... c) P.: funcionários de uma empresa. V.: salários – .................................... d) P.: pregos produzidos por uma máquina. V.: comprimento – .................................... e) P.: propriedades agrícolas do Brasil. V.: produção de algodão – .................................... f) P.: segmentos de reta. V.: comprimento – .................................... g) P.: bibliotecas da cidade de São Paulo. V.: número de volumes – .................................... h) P.: aparelhos produzidos em uma linha de montagem. V.: nº de defeitos por unidade – .................................... i) P.: indústrias de uma cidade. V.: índice de liquidez – .................................... 3) Na Escola São Leopoldo, para estudar a preferência em relação a refrigerantes, sortearam-se 150 estudantes, entre os 1.000 matriculados. Responda: a) Qual é a população envolvida na pesquisa? b) Que tipo de amostragem foi utilizada e qual é a amostra considerada? 4) A população envolvida em uma pesquisa sobre a incidência de cárie dentária em escolares da cidade de Morro Grande é apresentada abaixo. Baseando-se nesses dados, estratifique uma amostra com 200 elementos.
Escola A B C D Total População 500 250 440 360 1.550

5) Em uma escola existem 250 alunos, sendo 35 na 1ª série, 32 na 2ª série, 30 na 3ª série, 28 na 4ª série, 35 na 5ª série, 32 na 6ª série, 31 na 7ª série e 27 na 8ª série. Obtenha uma amostra de 40 alunos preenchendo a tabela abaixo.
Prof. Rosiel Sousa blog: rosielsousa.blogspot.com

10

Séries 1ª 2ª 3ª 4ª 5ª 6ª 7ª 8ª Total

População 35 __ __ 28 __ __ __ __ 250

Cálculo Proporcional 35 40 ⋅ = 5,6 250 = = = = = = =

Estatística Aplicada Amostra 6 __ __ __ 6 __ __ __ 40

6) Uma cidade X apresenta o seguinte quadro relativo às escolas de Ensino Fundamental. Obtenha uma amostra estratificada proporcional de 120 estudantes.
Escolas A B C D E F Total Nº de Estudantes Masculino Feminino 80 95 102 120 110 92 134 228 150 130 300 290 876 955

Série Casa: 1) População ou universo é: a) Um conjunto de pessoas; b) Um conjunto de elementos quaisquer; c) Um conjunto de pessoas com uma característica comum; d) Um conjunto de elementos com pelo menos uma característica em comum; e) Um conjunto de indivíduo de mesmo município, estado ou país. 2) Uma parte da população retirada para analisá-la denomina-se: a) Universo; b) Parte; c) Pedaço; d) Dados brutos; e) Amostra. 3) A parte da estatística que se preocupa somente com a descrição de determinadas características de um grupo, sem tirar conclusões sobre um grupo maior denomina-se: a) Estatística de População; b) Estatística de Amostra; c) Estatística Inferencial; d) Estatística Descritiva; e) Estatística Grupal.
Prof. Rosiel Sousa blog: rosielsousa.blogspot.com

11

Estatística Aplicada

4) Diga qual tipo de variável estamos trabalhando nos casos abaixo: a) Número de inscrições no Seguro Social; b) Número de passageiros no ônibus da linha Rio/São Paulo; c) Escolaridade d) Peso médio dos recém nascidos; e) Altitude acima do nível do mar; f) Uma pesquisa efetuada em 1.015 pessoas indica que 40 delas são assinantes de um serviço de computador on-line; g) Cada cigarro Camel tem 16,13 mg de alcatrão; h) O radar indica que Nolan Ryan rebateu a última bola a 82,3 km/h 5) Classifique as seguintes variáveis: a) Cor dos olhos: i) Qualitativa; ii) Qualitativa discreta; iii) Quantitativa contínua; iv) Quantitativa discreta; v) Qualitativa contínua. b) Número de filhos de um casal: i) Qualitativa; ii) Qualitativa discreta; iii) Quantitativa contínua; iv) Quantitativa discreta; v) Qualitativa contínua. c) Peso de um indivíduo: i) Qualitativa; ii) Qualitativa discreta; iii) Quantitativa contínua; iv) Quantitativa discreta; v) Qualitativa contínua. d) Altura de um indivíduo: i) Qualitativa; ii) Qualitativa discreta; iii) Quantitativa contínua; iv) Quantitativa discreta; v) Qualitativa contínua. e) Número de alunos de uma escola: i) Qualitativa; ii) Qualitativa discreta; iii) Quantitativa contínua; iv) Quantitativa discreta; v) Qualitativa contínua. f) Tipo sanguíneo: i) Qualitativa; ii) Qualitativa discreta; iii) Quantitativa contínua; iv) Quantitativa discreta; v) Qualitativa contínua. 6) Na Escola São Miguel, as classes têm 20, 40, 25 e 15 alunos. Determine uma amostra estratificada com 20 elementos.
Prof. Rosiel Sousa blog: rosielsousa.blogspot.com

12

Estatística Aplicada

7) Em uma cidade com 30.000 habitantes, deseja-se fazer uma pesquisa sobre a preferência por tipo de lazer entre pessoas de 20 anos de idade, levando em conta o sexo a que pertencem. a) Qual a população envolvida na pesquisa? b) Supondo que na cidade haja 5.500 mulheres e 6.000 homens com 20 anos, determine uma amostra com 1.200 pessoas. 8) Quer fazer-se um estudo que estabeleça a relação entre faixa salarial e interesse por teatro, tomando-se um grupo de 1.550 pessoas. A tabela abaixo indica o número de pessoas de determinadas faixas salariais. Determine uma amostra com 200 elementos.
Faixa salarial Até 3 salários mínimos De 3 a 6 salários mínimos De 6 a 9 salários mínimos Acima de 9 salários mínimos Total Nº de pessoas 776 387 232 155 1.550

3. Séries Estatísticas
3.1. Tabelas Um dos objetivos da Estatística é sintetizar os valores que uma ou mais variáveis podem assumir, para que tenhamos uma visão global da variação dessa ou dessas variáveis. E isso ela consegue, inicialmente, apresentando esses valores em tabelas e gráficos, que irão nos fornecer rápidas e seguras informações a respeito das variáveis em estudo, permitindo-nos determinações administrativas e pedagógicas mais coerentes e científicas. Tabela é um quadro que resume um conjunto de observações. 3.2. Séries Estatísticas Denominamos série estatística toda tabela que apresenta a distribuição de um conjunto de dados estatísticos em função da época, do local ou da espécie. Daí, podemos inferir que numa série estatística observamos a existência de três elementos ou fatores: o tempo, o espaço e a espécie. Conforme varie um dos elementos da série, podemos classificá-la em histórica, geográfica e específica. 3.2.1. Séries Históricas, Cronológicas ou Temporais Descrevem os valores da variável, em determinado local, discriminados segundo intervalos de tempo variáveis. Exemplo: PREÇO DO ACÉM NO VAREJO SÃO PAULO – 1989-94 Anos Preço Médio (US$) 1989 2,24 1990 2,73 1991 2,12 1992 1,89 1993 2,04 1994 2,62
FONTE: APA.

Prof. Rosiel Sousa

blog: rosielsousa.blogspot.com

13

Estatística Aplicada

3.2.2. Séries Geográficas, Especiais, Territoriais ou de Localização Descrevem os valores da variável, em determinado instante, discriminados segundo regiões. Exemplo: DURAÇÃO MÉDIA DOS ESTUDOS SUPERIORES – 1994 Número Países de Anos Itália 7,5 Alemanha 7,0 França 7,0 Holanda 5,9 Inglaterra Menos de 4
FONTE: Revista Veja.

3.2.3. Séries Específicas ou Categórica Descrevem os valores da variável, em determinado tempo e local, discriminados segundo especificações ou categorias. Exemplo: REBANHOS BRASILEIROS – 1992 Quantidade Espécies (1.000 cabeças) Bovinos 154.440,8 Bubalinos 1.423,3 Eqüinos 549,5 Asininos 47,1 Muares 208,5 Suínos 34.532,2 Ovinos 19.955,9 Caprinos 12.159,6 Coelhos 6,1
FONTE: IBGE.

3.2.4. Séries Conjugadas – Tabela de Dupla Entrada Muitas vezes temos necessidade de apresentar, em uma única tabela, a variação de valores de mais de uma variável, isto é, fazer uma conjugação de duas ou mais séries. Conjugando duas séries em uma única tabela, obtemos uma tabela de dupla entrada. Em uma tabela desse tipo ficam criadas duas ordens de classificação: uma horizontal (linha) e uma vertical (coluna). Exemplo: TERMINAIS TELEFÔNICOS EM SERVIÇO – 1991-93 Regiões 1991 1992 1993 Norte 342.938 375.658 403.494 Nordeste 1.287.813 1.379.101 1.486.649 Sudeste 6.234.501 6.729.467 7.231.634 Sul 1.497.315 1.608.989 1.746.232 Centro-Oeste 713.357 778.925 884.822
FONTE: Ministério das Comunicações.

Prof. Rosiel Sousa

blog: rosielsousa.blogspot.com

14

Estatística Aplicada

A conjugação, no exemplo dado, foi série geográfica-série histórica, que dá origem à série geográficohistórica ou geográfico-temporal. Podem existir, se bem que mais raramente, pela dificuldade de representação, séries compostas de três ou mais entradas. 3.3. Dados Absolutos e Dados Relativos Os dados estatísticos resultantes da coleta direta da fonte, sem outra manipulação senão a contagem ou medida, são chamados dados absolutos. Dados relativos são o resultado de comparações por quociente (razões) que se estabelecem entre dados absolutos e têm por finalidade realçar ou facilitar as comparações entre quantidades. Traduzem-se os dados relativos, em geral, por meio de porcentagens, índices, coeficientes e taxas. 3.3.1. As Porcentagens Considere a série: MATRÍCULAS NAS ESCOLAS DA CIDADE A – 1995 Categorias Número de Alunos 1º grau 19.286 2º grau 1.681 3º grau 234 Total 21.201
Dados fictícios.

Calculemos as porcentagens dos alunos de cada grau: 19286 . ⋅ 100 9096= 91 = , ,0 21201 . 1.681 ⋅ 100 7,92= 7,9 = 2º grau: 21201 . 234 ⋅ 100 110= 11 = , , 3º grau: 21201 . 1º grau: Com esses dados, podemos formar uma nova coluna na série em estudo: MATRÍCULAS NAS ESCOLAS DA CIDADE A – 1995 Categorias Número de Alunos % 1º grau 19.286 91,0 2º grau 1.681 7,9 3º grau 234 1,1 Total 21.201 100,0
Dados fictícios.

Os valores dessa nova coluna nos diz que, de cada 100 alunos da cidade A, 91 estão matriculados no 1º grau, 8, aproximadamente, no 2º grau e 1 no 3º grau. O emprego da porcentagem é de grande valia quando é nosso intuito destacar a participação da parte no todo. Considere, agora, a série:

Prof. Rosiel Sousa

blog: rosielsousa.blogspot.com

15

Estatística Aplicada

MATRÍCULAS NAS ESCOLAS DAS CIDADES A E B – 1995 Nº de Alunos Categorias Cidade A Cidade B 1º grau 19.286 38.660 2º grau 1.681 3.399 3º grau 234 424 Total 21.201 42.483
Dados fictícios.

Qual das cidades tem, comparativamente, maior número de alunos em cada grau? Como o número total de alunos é diferente nas duas cidades, não é fácil concluir a respeito usando os dados absolutos. Porém, usando as porcentagens, tal tarefa fica bastante facilitada. Assim, acrescentando na tabela anterior as colunas correspondentes às poscentagens, obtemos: MATRÍCULAS NAS ESCOLAS DAS CIDADES A E B – 1995 Cidade A Cidade B Nº de Alunos % Nº de Alunos 19.286 91,0 38.660 1.681 7,9 3.399 234 1,1 424 21.201 100,0 42.483

Categorias 1º grau 2º grau 3º grau Total
Dados fictícios.

% 91,0 8,0 1,0 100,0

o que nos permite dizer que, comparativamente, contam, praticamente, com o mesmo número de alunos em cada grau. 3.3.2. Os Índices Os índices são razões entre duas grandezas tais que uma não inclui a outra. São exemplos de índices: Índice cefálico = diâmetro transverso docrânio × 100 diâmetro longitudin crânio aldo idade mental × 100 idade crônica população superfície

Quociente intelectual =

Densidade demográfica = Índices econômicos:

Produção per capita = Consumo per capita = Renda per capita = Receita per capita =
Prof. Rosiel Sousa

valor daprodução total população consumo bem do população

renda população receita população 16

blog: rosielsousa.blogspot.com

Estatística Aplicada

3.3.3. Os Coeficientes Os coeficientes são razões entre o número de ocorrências e o número total (número de ocorrências e número de não-ocorrências). São exemplos de coeficientes: Coeficiente de natalidade = número nascimento de s população total número óbitos de população total

Coeficiente de mortalidade = Coeficiente educacionais:

Coeficiente de evasão escolar =

número alunos de evadidos número dematrículas inicial número alunos de aprovados número dematrículas final

Coeficiente de aproveitamento escolar = Coeficiente de recuperação escolar =

número alunos de recuperado s número alunos recuparaçã de em o

3.3.4. As Taxas As taxas são os coeficientes multiplicados por uma potência de 10 (10, 100, 1.000, etc.) para tornar o resultado mais inteligível. São exemplos de taxas: Taxa de natalidade = coeficiente de natalidade x 1.000 Taxa de mortalidade = coeficiente de maortalidade x 1.000 Taxa de evasão escolar = coeficiente de evasão escolar x 100 EXERCÍCIOS: Série Aula: 1) Clasifique as séries: a) PRODUÇÃO DE BORRACHA NATURAL – 1991-93 Anos Toneladas 1991 29.543 1992 30.712 1993 40.663
FONTE: IBGE.

b) AVICULTURA BRASILEIRA – 1992 Número Espécies (1.000 cabeças) Galinhas 204.160 Galos, frangos, frangas e 435.465 pintos Codornas 2.488
FONTE: IBGE.

Prof. Rosiel Sousa

blog: rosielsousa.blogspot.com

17

Estatística Aplicada

c) VACINAÇÃO CONTRA A POLIOMIELITE – 1993 Regiões Quantidade Norte 211.209 Nordeste 631.040 Sudeste 1.119.708 Sul 418.785 Centro-Oeste 185.823
FONTE: Ministério da Saúde.

d) AQUECIMENTO DE UM MOTOR DE AVIÃO DE MARCA X Minutos Temperatura (ºC) 0 20 1 27 2 34 3 41 4 49 5 56 6 63
Dados fictícios.

2) A tabela seguinte foi elaborada a partir da leitura do texto de Philip M. Fearnsinde, do Instituto Nacional da Amazônia. Regiões Área (km2) %
FONTE: Revista Ciência Hoje, nº 19.

DESMATAMENTO EM RONDÔNIA 1975 1978 1980 1.216,5 4.184,5 7.579,3 0,5 1,72 3,12

1983 13.955,2 5,74

a) Que tipo de fonte (primária ou secundária) foi consultada para a elaboração da tabela? b) Que tipo de série está representada na tabela? 3) Uma série estatística é denominada espacial quando? a) O elemento variável é o tempo; b) O elemento variável é o local; c) O elemento variável é a espécie; d) É o resultado da combinação de séries estatísticas de tipos diferentes; e) Os resultados são agrupados em subintervalos do intervalo observado. 4) Uma série estatística é denominada cronológica quando? a) O elemento variável é o tempo; b) O elemento variável é o local; c) O elemento variável é a espécie; d) É o resultado da combinação de séries estatísticas de tipos diferentes; e) Os resultados são agrupados em subintervalos do intervalo observado. 5) Uma série estatística é denominada composta quando? a) O elemento variável é o tempo; b) O elemento variável é o local; c) O elemento variável é a espécie; d) É o resultado da combinação de séries estatísticas de tipos diferentes; e) Os resultados são agrupados em subintervalos do intervalo observado. 6) Construa a tabela e especifique o tipo de série em cada caso:
Prof. Rosiel Sousa blog: rosielsousa.blogspot.com

18

Estatística Aplicada

a) As capacidades dos estádios do Maracanã (Rio de Janeiro), do Morumbi (São Paulo) e do Mineirão (Belo Horizonte) são, respectivamente: 220.000, 150.000, 110.000 pessoas. (Fonte: Brasil em dados) b) A população do Brasil em 1962 era de 74.100.000 habitantes; em 1964, de 78.800.000; em 1966, de 83.900.000 e em 1969, de 92.300.000. (Fonte: IBGE) 7) Uma escola registrou em março, na 1ª série, a matrícula de 40 alunos e a matrícula efetiva, em dezembro, de 35 alunos. A taxa de evasão foi de: TEE= 8) Complete a tabela abaixo: Escolas A B C D E F Total Nº de Alunos 175 222 202 362 280 540 1.781 Dados Relativos Por 1 Por 100 0,098 9,8 _____ _____ _____ _____ _____ _____ _____ _____ _____ _____ 1,000 100,0 nºdeevadidos 40 35 × 100 = × 100 = nº matrícula inicial 40 × 100 12 % = ,5

Cálculos: 175 × 1= 0,098 A→ 1.781

9) São Paulo tinha, em 1992, uma população de 32.182,7 mil habitantes. Sabendo que sua área terrestre é de 248.256 km2, calcule a sua densidade demográfica. 10) Um professor preencheu um quadro, enviado pela D.E., com os seguintes dados:
Promovidos Total Geral Nº de Nº de Retidos sem Em Nãosem Série Alunos Alunos recuperaçã recuperaçã Recuperados recuperado Promovido recuperaçã Retidos 30/03 30/11 o o s s o 1º A 49 44 35 03 06 05 01 40 04 1º B 49 42 42 00 00 00 00 42 00 1º C 47 35 27 00 08 03 05 30 05 1º D 47 40 33 06 01 00 01 33 07 Total 192 161 137 09 15 08 07 145 16

Calcule: a) a taxa de evasão, por classe. b) a taxa de evasão total. c) a taxa de aprovação, por classe. d) a taxa de aprovação geral. e) a taxa de recuperação, por classe. f) a taxa de recuperação geral. g) a taxa de reprovação na recuperação geral. h) a taxa de aprovação, sem a recuperação. i) a taxa de retidos, sem a recuperação. Série Casa: 1) Calcule a taxa de aprovação de um professor de uma classe de 45 alunos, sabendo que obtiveram aprovação de 36 alunos. 2) Considerando que Minas Gerais, em 1992, apresentou (dados fornecidos pelo IBGE): 


 

população: 15.957,6 mil habitantes; superfície: 586.624 km2; nascimentos: 292.036; óbitos: 99.281.
blog: rosielsousa.blogspot.com

Prof. Rosiel Sousa

19

Estatística Aplicada

Calcule: a) o índice de densidade demográfica; b) a taxa de natalidade; c) a taxa de mortalidade. 3) Uma série estatística é denominada categórica quando? a) O elemento variável é o tempo; b) O elemento variável é o local; c) O elemento variável é a espécie; d) É o resultado da combinação de séries estatísticas de tipos diferentes; e) Os resultados são agrupados em subintervalos do intervalo observado. 4) Uma série estatística é denominada geográfica quando? a) O elemento variável é o tempo; b) O elemento variável é o local; c) O elemento variável é a espécie; d) É o resultado da combinação de séries estatísticas de tipos diferentes; e) Os resultados são agrupados em subintervalos do intervalo observado. 5) Uma série estatística é denominada específica quando? a) O elemento variável é o tempo; b) O elemento variável é o local; c) O elemento variável é a espécie; d) É o resultado da combinação de séries estatísticas de tipos diferentes; e) Os resultados são agrupados em subintervalos do intervalo observado. 6) Uma série estatística é denominada mista quando? a) O elemento variável é o tempo; b) O elemento variável é o local; c) O elemento variável é a espécie; d) É o resultado da combinação de séries estatísticas de tipos diferentes; e) Os resultados são agrupados em subintervalos do intervalo observado. 7) Uma série estatística é denominada temporal quando? a) O elemento variável é o tempo; b) O elemento variável é o local; c) O elemento variável é a espécie; d) É o resultado da combinação de séries estatísticas de tipos diferentes; e) Os resultados são agrupados em subintervalos do intervalo observado. 8) Uma escola apresentava, no final do ano, o seguinte quadro: Séries 1ª 2ª 3ª 4ª Total a) Calcule a taxa de evasão por série. b) Calcule a taxa de evasão da escola. Matrículas Março Novembro 480 475 458 456 436 430 420 420 1.794 1.781

Prof. Rosiel Sousa

blog: rosielsousa.blogspot.com

20

Estatística Aplicada

4. Distribuição de Frequência
Praticamente se resume na maneira de ordenar os dados estatísticos em linhas ou colunas, tornando possível sua leitura, tanto no sentido horizontal quanto no vertical. 4.1. Tabela Primitiva / Rol Suponhamos termos feito uma coleta de dados relativos às estaturas de 40 (quarenta) alunos, que compõem uma amostra dos alunos de um colégio A, resultando a seguinte tabela de valores: ESTATURA DE 40 ALUNOS DO COLÉGIO A 166 162 155 154 160 161 152 161 161 168 163 156 150 163 160 172 162 156 155 153 160 173 155 157 165 160 169 156 167 155 151 158 164 164 170 158 160 168 164 161

A esse tipo de tabela, cujos elementos não foram numericamente organizados, denominamos tabela primitiva. A maneira mais simples de organizar os dados é através de uma certa ordenação (crescente ou decrescente). A tabela obtida após a ordenação dos dados recebe o nome de rol. ESTATURA DE 40 ALUNOS DO COLÉGIO A 150 151 152 153 154 155 155 155 155 156 156 156 157 158 158 160 160 160 160 160 161 161 161 161 162 162 163 163 164 164 164 165 166 167 168 168 169 170 172 173

Agora, podemos saber, com relativa facilidade, qual a menor estatura (150 cm) e qual a maior (173 cm); que a amplitude de variação foi de 173 – 150 = 23 cm; e, ainda, a ordem que um valor particular da variável ocupa no conjunto. Com um exame mais acurado, vemos qua há uma concentração das estaturas em algum valor entre 160 cm e 165 cm e, mais ainda, que há poucos valores abaixo de 155 cm e acima de 170 cm. 4.2. Distribuição de Freqüência Denominamos frequência o número de alunos que fica relacionado a um determinado valor da variável. Obtemos, assim, uma tabela que recebe o nome de distribuição de frequência:
ESTAT. (cm) 150 151 152 153 154 155 156 157 FREQ. 1 1 1 1 1 4 3 1 ESTAT. (cm) 158 160 161 162 163 164 165 166 FREQ. 2 5 4 2 2 3 1 1 ESTAT. (cm) 167 168 169 170 172 173 Total FREQ. 1 2 1 1 1 1 40

Este tipo de tabela não é aconselhavel quando estamos trabalhando com amostragens grandes, sendo que poderá ficar muito extensa, dificultando, além de sua elaboração, as análises e conclusões dos dados pesquisados. Sendo possível, a solução mais aceitável é o agrupamento dos valores em vários intervalos. Chamando de frequência de uma classe o número de valores da variável pertencentes à classe, os dados da tabela acima, podem ser dispostos como na tabela abaixo, denominada distribuição de frequência com intervalo de classe: ESTATURA DE 40 ALUNOS DO COLÉGIO A
Prof. Rosiel Sousa blog: rosielsousa.blogspot.com

21

Estatística Aplicada Estaturas (cm) 150 |–– 154 154 |–– 158 158 |–– 162 162 |–– 166 166 |–– 170 170 |–– 174 Total Frequência 4 9 11 8 5 3 40

4.3. Elementos de uma Distribuição de Freqüência 4.3.1. Classe Classes são intervalos de variação da variável. 4.3.2. Limites de Classe Denominamos limites de classe os extremos de cada classe. O menor número é o limite inferior da classe (L i) e o maior número, o limite superior da classe (Lf). 4.3.3. Amplitude de um Intervalo de Classe Amplitude de um intervalo de classe ou, simplesmente, intervalo de classe é a medida do intervalo que define a classe. Ela é obtida pela diferença entre os limites superior e inferior dessa classe e indicada por h. Assim: h = Lf – Li 4.3.4. Amplitude Total da Distribuição Amplitude total da distribuição (At) é a diferença entre o limite superior da última classe (limite superior máximo) e o limite inferior da primenra classe (limite inferior mínimo): At = Lf (máx.) – Li (mín.) 4.3.5. Ponto Médio de uma Classe É o ponto que divide o intervalo de classe em duas partes iguais. Pm= Li + L f 2

4.4. Determinação do número de Classes Não existe regra fixa para se determinar o número de classes. Sturges sugere uma regra para a determinação do número de classes (desde que se conheça o número de observações ou informações), que é a seguinte: n = 1 + 3,3 . log N onde, n = número de classes N = número de dados (observações) a distribuir Outra maneira de estipular o número de classes é empregando a seguinte relação (conhecendo a amplitude):
Prof. Rosiel Sousa blog: rosielsousa.blogspot.com

22

Estatística Aplicada

n=

At h

4.5. Tipos de Freqüências Freqüências simples ou absoluta (Fi) são os valores que realmente representam o número de dados de cada classe. Assim, a soma das freqüências simples é igual ao número total dos dados:

∑ Fi = N
Freqüências simples relativas (fi) são os valores das razões entre freqüências simples e a freqüência total: fi = Fi ∑ Fi

Freqüência acumulada (Fa) é o total das freqüências de todos os valores inferiores ao limite superior do intervalo de uma dada classe: Fa = ∑ Fi (i = 1 2, ...,k) , Freqüência acumulada relativa (fa) são os valores das razões entre freqüências simples e a freqüência total: fa= Fa ∑ Fi

Considerando a tabela do exemplo anterior (item 4.2), podemos montar a seguinte tabela com as frequências estudadas: ESTATURA DE 40 ALUNOS DO COLÉGIO A
i 1 2 3 4 5 6 Estaturas (cm) 150 |–– 154 154 |–– 158 158 |–– 162 162 |–– 166 166 |–– 170 170 |–– 174 Total Fi 4 9 11 8 5 3 ∑ = 40 Pm 152 156 160 164 168 172 fi 0,100 0,225 0,275 0,200 0,125 0,075 ∑ = 1,000 Fa 4 13 24 32 37 40 fa 0,100 0,325 0,600 0,800 0,925 1,000

4.6. Distribuição de Freqüência sem Intervalos de Classe Quando se trata de variável discreta de variação relativamente pequena, cada valor pode ser tomado com um intervalo de classe (intervalo degenerado) e, nesse caso, a distribuição é chamada distribuição sem intervalo de classe, tomando a seguinte forma:
xi x1 x2 x3 … xN Fi F1 F2 F3 F4 F5 Σ Fi = N

Exemplo: Seja x a variável “número de cômodos das casas ocupadas por vinte famílias entrevistadas”:
i Prof. Rosiel Sousa xi Fi

blog: rosielsousa.blogspot.com

23

Estatística Aplicada 1 2 3 4 5 6 2 3 4 5 6 7 4 7 5 2 1 1 Σ = 20

Completada com os vários tipos de freqüências, temos:
i 1 2 3 4 5 6 xi 2 3 4 5 6 7 Fi 4 7 5 2 1 1 ∑ = 20 Fa 4 11 16 18 19 20 fi 0,20 0,35 0,25 0,10 0,05 0,05 ∑ = 1,00 fa 0,20 0,55 0,80 0,90 0,95 1,00

EXERCÍCIOS: Série Aula: 1) As notas obtidas por 50 alunos de uma classe foram:
1 2 2 2 2 2 3 3 3 3 3 3 4 4 4 4 4 4 5 5 5 5 5 5 5 6 6 6 6 6 6 6 6 6 7 7 7 7 7 7 7 8 8 8 8 8 8 9 9 9

Complete a distribuição de freqüência abaixo:
i 1 2 3 4 5 Notas 0 |–– 2 2 |–– 4 4 |–– 6 6 |–– 8 8 |–– 10 Pm 1 ___ ___ ___ ___ Fi 1 ___ ___ ___ ___ ∑ = 50

2) Complete a tabela abaixo:
i 1 2 3 4 5 Classes 0 |–– 8 8 |–– 16 16 |–– 24 24 |–– 32 32 |–– 40 Fi 4 10 14 9 3 ∑ = 40 Fa ___ ___ ___ ___ ___ fi (%) ___ ___ ___ ___ ___ ∑ = 100 % fa (%) ___ ___ ___ ___ ___

3) Complete os dados que faltam na distribuição de freqüência:
Prof. Rosiel Sousa blog: rosielsousa.blogspot.com

24

i 1 2 3 4 5 6 7 8

xi 0 1 2 3 4 5 6 7

Fi 1 ___ 4 ___ 3 2 ___ ___ ∑ = 20

Fa ___ 4 ___ 13 ___ 18 19 ___

fi (%) 5,0 15,0 ___ 25,0 15,0 ___ ___ ___ ∑ = 100 %

Estatística Aplicada fa (%) ___ ___ ___ ___ ___ ___ ___ ___

4) A tabela abaixo apresenta uma distribuição de freqüência das áreas de 400 lotes:
Áreas (m2) Nº de Lotes 300 |–– 400 |–– 500 |–– 600 |–– 700 |–– 800 |–– 900 |–– 1.000 |–– 1.100 |–– 1.200 7 6 14 46 58 68 48 22 6 6 2

Com referência a essa tabela, determine: a) a amplitude total; b) o limite superior da quinta classe; c) o limite inferior da oitava classe; d) o ponto médio da sétima classe; e) a amplitude do intervalo da segunda classe; f) a freqüência da quarta classe; g) a freqüência relativa absoluta da sexta classe; h) a freqüência acumulada da quinta classe; i) o número de lotes cuja área não atinge 700 m2; j) o número de lotes cuja área atinge e ultrapassa 800 m2; k) a porcentagem de lotes cuja área não atinge 600 m2; l) a porcentagem de lotes cuja área seja maior ou igual a 900 m2; m) a porcentagem de lotes cuja área é de 500 m2, no mínimo, mas inferior a 1.000 m2; n) a classe do 72º lote; o) até que classe estão incluídos 60% dos lotes. Série Casa: 1) Complete a distribuição abaixo, determinando as frequências absolutas:
i 1 2 3 4 5 xi 2 3 4 5 6 Fi ___ ___ ___ ___ ___ ∑ = 34 Fa 2 9 21 29 34

2) A distribuição abaixo indica o número de acidentes ocorridos com 70 motoristas de uma empresa de ônibus:
Nº de acidentes Nº de motoristas 0 20 1 10 2 16 3 9 4 6 5 5 6 3 7 1

Determine: a) o número de motoristas que não sofreram nenhum acidente; b) o número de motoristas que sofreram pelo menos 4 acidentes;
Prof. Rosiel Sousa blog: rosielsousa.blogspot.com

25

Estatística Aplicada

c) d) e)

o número de motoristas que sofreram menos de 3 acidentes; o número de motoristas que sofreram no mínimo 3 e no máximo 5 acidentes; a porcentagem dos motoristas que sofreram no máximo 2 acidentes.

3) Complete os dados que faltam na distribuição de freqüência:
i 1 2 3 4 5 6 7 8 Classes 0 |–– 2 2 |–– 4 4 |–– 6 __ |–– __ 8 |–– 10 10 |–– 12 __ |–– __ 14 |–– 16 Pm 1 ___ 5 7 ___ ___ 13 ___ Fi 4 8 ___ 27 15 ___ 10 ___ ∑ = ___ Fa ___ ___ 30 ___ 72 83 93 ___ fi (%) 4,0 ___ 18,0 27,0 ___ ___ 10,0 7,0 ∑ = ___ fa (%) ___ ___ ___ ___ ___ ___ ___ ___

4) Conhecidas as notas de 50 alunos:
84 74 59 67 65 68 71 80 41 94 33 81 41 78 66 52 91 50 56 48 47 65 53 94 39 73 55 65 35 69 68 57 76 45 89 61 35 85 55 98 73 85 73 64 42 77 88 60 74 54

obtenha a distribuição de freqüência, tendo 30 para limite inferior da primeira classe e 10 para intervalo de classe. 5) As notas obtidas em Matemática por 80 estudantes de uma escola X estão relacionadas abaixo:
68 73 61 66 96 79 65 86 84 79 65 78 78 62 80 67 75 88 75 82 89 67 73 73 82 73 87 75 61 97 57 81 68 60 74 94 75 78 88 72 90 93 62 77 95 85 78 63 62 71 95 69 60 76 62 76 88 59 78 74 79 65 76 75 76 85 63 68 83 71 53 85 93 75 72 60 71 75 74 77

a) Organize o rol colocando os dados em ordem crescente. b) Qual é a menor nota? Qual é a maior nota? c) Qual é a amplitude total? d) Qual é a nota do estudante classificado em 10º lugar? e) Organize os dados em classes considerando 5 como amplitude. f) Faça a distribuição de freqüências. g) Quantos estudantes receberam nota superior ou igual a 85? Qual a porcentagem? 6) Observando a tabela abaixo, responda:
Faixa de renda Até 1 salário mínimo De 1 a 3 salários mínimos De 4 a 8 salários mínimos Acima de 8 salários mínimos Total Habitações 224.740 363.860 155.700 47.500 791.800

a) Qual é a porcentagem de domicílios onde a renda é superior a 8 salários mínimos? b) Quantos são os domicílios onde a renda está entre 1 e 3 salários? c) Quantos são os domicílios onde a renda está abaixo de 3 salários? 7) Em uma fábrica foram testadas 400 lâmpadas; a duração delas aparece na distribuição de freqüência abaixo:
Prof. Rosiel Sousa blog: rosielsousa.blogspot.com

26

Estatística Aplicada Duração (em horas) 300 |–– 400 400 |–– 500 500 |–– 600 600 |–– 700 700 |–– 800 800 |–– 900 900 |–– 1.000 1.000 |–– 1.100 1.100 |–– 1.200 Total Nº de lâmpadas 14 46 58 76 68 62 48 22 6 ∑ = 400

Observando a tabela, responda: a) Qual a amplitude de cada classe? b) Qual a amplitude total da distribuição? c) Qual o ponto médio da quinta classe? d) Qual a freqüência relativa absoluta da sexta classe? e) Qual a porcentagem de lâmpadas com durabilidade máxima de 500 horas? f) Qual a porcentagem de lâmpadas com durabilidade de 900 horas ou mais? g) Construir uma tabela de distribuição de freqüência, em que apareçam Pm, Fi, Fa, fi e fa.

5. Gráficos Estatísticos
5.1. Representação Gráfica Os gráficos constituem um poderoso instrumento de análise e interpretação de um conjunto de dados. Eles aparecem nos mais variados veículos de comunicação. Pesquisas de opinião pública, pesquisas eleitorais, economia, agricultura, saúde são apenas alguns exemplos de assuntos em que as representações gráficas assumem um papel fundamental para explicar o comportamento do objeto de estudo. Os mais importantes recursos fornecidos pelos gráficos são a facilidade e a rapidez na absorção e interpretação dos resultados, por parte do leitor. 5.1.1. Gráfico de Linha Os gráficos de linhas são bastante utilizados na identificação de tendências de aumento ou diminuição dos valores numéricos de uma dada informação. Assim, vamos encontrar com frequência esse tipo de representação em análises tais como lucros de empresas, incidência de moléstias, índices de crescimento populacional ou de mortalidade infantil, índices de custo de vida, etc. Seu traço é feito no plano cartesiano. Exemplo: Na cidade de São Joaquim (SC), foi anotada a temperatura registrada às 8 horas, durante sete dias consecutivos, conforme a seguinte tabela:
TEMPERATURA NA CIDADE DE SÃO JOAQUIM – SC Dia Temperatura (ºC) 1º 1 2º –2 3º –3 4º 4 5º 5 6º 6 7º 7

Com base na tabela, façamos a representação gráfica da variação de temperatura. Solução:
Prof. Rosiel Sousa blog: rosielsousa.blogspot.com

27

Estatística Aplicada
8 7 6 5 4 3 2 1 0 -1 -2 -3 -4

Te pe tura(º m ra C)

1 º

2 º

3 º

4 º

5 º

6 º

7 º

D ia

5.1.2. Gráfico de Colunas ou de Barras É a representação de uma série por meio de retângulos, dispostos verticalmente (em colunas) ou horizontalmente (em barras). Quando em colunas, os retângulos têm a mesma base e as alturas são proporcionais aos respectivos dados. Quando em barras, os retângulos têm a mesma altura e os comprimentos são proporcionais aos respectivos dados. Assim estamos assegurando a proporcionalidade entre as áreas dos retângulos e os dados estatísticos. Exemplo: a) Gráfico em colunas
PRODUÇÃO BRASILEIRA DE CARVÃO MINERAL BRUTO 1989-92 Quant. Produzida Anos (1.000 t) 1989 18.196 1990 11.168 1991 10.468 1992 9.241
Fonte: Ministério da Agricultura

20.000 M tone da il la s 15.000 10.000 5.000 0 1989 1990 A nos 1991 1992

b) Gráfico em barras
Prof. Rosiel Sousa blog: rosielsousa.blogspot.com

28

Estatística Aplicada EXPORTAÇÕES BRASILEIRAS MARÇO – 1995 Valor Estados (US$ milhões) São Paulo 1.344 Minas Gerais 542 Rio Grande do Sul 332 Espírito Santo 285 Paraná 250 Santa Catarina 202
Fonte: SECEX

São Paulo Minas Gerais Rio Grande do Sul Espírit Sant o o Paraná Sant Cat a arina 0 500 1.000 1.500

M ilhõe dedólare s s

5.1.3. Gráfico de Colunas ou de Barras Múltiplas Este tipo de gráfico é geralmente empregado quando queremos representar, simultaneamente, dois ou mais fenômenos estudados com o propósito de comparação. Exemplo:
BALANÇA COMERCIAL DO BRASIL – 1989-93 Valor (US$ 1.000.000) Especificações 1989 1990 1991 1992 Exportação (FOB) 34.383 31.414 31.620 35.793 Importação 18.263 20.661 21.041 20.554
Fonte: Ministério da Fazenda

1993 38.783 25.711

40.000

US$m o ilhã

30.000 20.000 10.000 0 1989 1990 1991 1992 Exportação (FOB) 1993 Im ação port

5.1.4. Gráfico de Setores A estatística recorre com frequência a esse tipo de gráfico, que consiste em distribuir num círculo setores proporcionais aos dados do problema. O gráfico de setores, ou setograma, é utilizado principalmente quando as quantidades a serem comparadas são muito diferentes umas das outras, caso em que uma ou mais delas se salientam em relação ao conjunto. 29 Prof. Rosiel Sousa blog: rosielsousa.blogspot.com

Estatística Aplicada

Exemplo:
DISTRIBUIÇÃO DE REMUNERAÇÕES MENSAIS NO BRASIL – 1983 Faixa Salarial Nº de empregados % (em salários mínimos) Até 3 salários 11.770.000 67,1 De 3 a 7 salários 3.931.000 22,4 De 7 a 15 salários 1.355.000 7,7 Mais de 15 salários 483.000 2,8 Total 17.539.000 100,0
De 7 a 15 salários Mais de 15 salários

%
De 3 a 7 salários

67,1 22,4 7,7
At 3 salários é

Grau s 241, 6 80,6 27,7

5.2. Representação Gráfica de Distribuição de Frequência Uma distribuição de frequência pode ser representada graficamente pelo histograma, pelo polígono de frequência e pelo polígono de frequência acumulada. 5.2.1. Histograma O histograma é um gráfico constituído no plano cartesiano por retângulos em número igual ao número de classes da distribuição. Cada classe é representada por uma coluna de altura correspondente a sua frequência. Trata-se também de um gráfico de área. É utilizado para variáveis contínuas; por isso, o gráfico também é contínuo: as colunas são justapostas. A área de cada coluna é proporcional à frequência da classe representada. Logo, a área de todo o histograma é proporcional à soma total das frequências. Exemplo:
i 1 2 3 4 5 6 Total Classes 150 |--- 155 155 |--- 160 160 |--- 165 165 |--- 170 170 |--- 175 175 |--- 180 Pm 152,5 157,5 162,5 167,5 172,5 177,5 Fi 6 10 15 5 3 1 40 Fa 6 16 31 36 39 40 fi (%) 15,0 25,0 38,0 12,0 8,0 2,0 100,0 fa (%) 15,0 40,0 78,0 90,0 98,0 100,0

Prof. Rosiel Sousa

blog: rosielsousa.blogspot.com

30

Estatística Aplicada
1 5

1 0 Fi 5 0

150 175

155 180

160

165

170

5.2.2. Polígono de Frequência Num sistema de coordenadas cartesianas ortogonais, tomamos sobre o eixo das abscissas segmentos proporcionais aos valores dos pontos médios das classes, e sobre o eixo das ordenadas segmentos proporcionais às frequências, determinando pontos no plano. Unindo os pontos obtidos, determinamos um diagrama poligonal, que convencionalmente é fechado no eixo das abscissas pelo ponto médio da classe imediatamente inferior à inicial e pelo ponto médio da classse imediatamente superior à final. Desta forma, obtemos um polígono de frequência. Vejamos agora como, a partir da tabela do item anterior, podemos construir um polígono de frequência.
1 5 1 2 9 Fi 6 3 0
150 175 155 180 160 165 170

5.2.3. Ogiva A ogiva é um gráfico de frequências acumuladas, o que justifica ser também denominada curva de caumulação de frequências. Retomando o exemplo do item 5.2.1., podemos construir um gráfico de ogiva com os valores de frequência acumulada (Fa).
4 0 3 0 Fa 2 0 1 0 0 10 5 15 5 10 6 15 6 10 7 15 7 10 8

Prof. Rosiel Sousa

blog: rosielsousa.blogspot.com

31

Estatística Aplicada

EXERCÍCIOS: Série Aula: 1)

Retrato do Orçamento Familiar
Itens que mais pesam (%)
Ed cação le u e u , it ra re çã (9 3 crea o ,2 ) Vest á (5 8 u rio ,0 ) Desp sa d rsas e s ive (in i b b as, clu e id cig rros e jo o a gs e rôn s) (3 6 let ico ,4 ) Alim na o e t çã (2 ,1 ) 5 2 Sa d e cu a o úe id d s p ssoa (1 ,0 ) e is 2 1 Tra sp es (1 ,9 ) n ort 3 5

Ha it çã (3 ,1 ) ba o 1 5

Capital Belém Belo Horizonte Brasília Curitiba Florianópolis Fortaleza Goiânia Porto Alegre Recife Salvador Rio de Janeiro* São Paulo*
Fonte: O Estado de São Paulo, 15/03/2001.

Renda média familiar (em salários mínimos) 7,52 10,76 23,83 12,59 12,06 9,34 7,42 12,73 9,08 6,06 17,20 15,62

Renda per capita (em salários mínimos) 1,95 2,69 6,40 3,57 3,34 2,24 1,86 3,88 2,26 1,43 5,60 4,27

* Para o Rio e São Paulo, os dados são referentes à Pesquisa do Orçamento Familiar de 1997/98.

Considerando que, nos primeiros meses de 2002, o salário mínimo era de R$ 200,00, aproximadamente, analise as informações seguintes, classificando-as em V ou F, justificando: I. Em Belém, uma família gastava, em média, R$ 468,00 por mês em moradia. II. No Recife, um indivíduo gastava menos de R$ 65,00 por mês em transporte. III. Os gastos com saúde de uma família em Fortaleza superavam os gastos com transportes de uma família em Goiânia. IV. Descontados os gastos com habitação e alimentação, sobravam a uma família paulista menos de R$ 1.300,00 por mês. 2) Analisando o gráfico de colunas ao lado, classifique em V ou F cada sentença seguinte, justificando: a) Se esse conjunto de dados fosse representado em gráfico de setores (pizza), o ângulo correspondente região Sul seria menor que 90º. b) O número de emissoras da região Sudeste supera soma do número de emissoras das regiões Nordeste, Centro-Oeste e Norte. c) Supondo que Goiás concentre 60% das emissoras região, o percentual de emissoras do país representado por este Estado é menor que 5%.
Prof. Rosiel Sousa
Rádio Emissoras - 2000
1064 762 664

um à a
227 165

de sua
Sudeste Sul Nordeste Centro-Oeste Norte

blog: rosielsousa.blogspot.com

32

Estatística Aplicada

3)

O pesadelo vai continuar
VEJA on-line perguntou aos internautas: “Capturando Bin Laden, os EUA estarão livres de novos atentados?”

Sim 4%

a) Quais as medidas dos ângulos apresentados no gráfico ao lado? b) Quantos internautas responderam “sim”?

Não 96%

Total de participantes: 1.061

4) O histograma abaixo representa o tempo de espera (em minutos) na fila de um banco, em certa manhã, no centro de Belo Horizonte. Que porcentagem do total de pessoas esperou até 20 minutos na fila?
Fi
16 12

6 4 2

Tempo

8 28

12

16

20

24

5) Considere os resultados abaixo de medição de temperatura, obtidos durante 10 dias, no mesmo horário, e construa um gráfico de linha.
Dia Temperatura (ºC) 1º 32 2º 35 3º 34 4º 30 5º 28 6º 31 7º 32 8º 33 9º 30 10º 29

6) A tabela abaixo representa, em termos percentuais, a distribuição da população brasileira por cor. Construa: a) um gráfico de setores; b) um gráfico de colunas.
Cor Branca Preta Amarela Parda Sem declaração Total
Fonte: IBGE.

% 54,23 5,92 0,56 38,85 0,44 100,00

7) Examinando o histograma abaixo, que corresponde às notas relativas à aplicação de um teste de inteligência a um grupo de alunos, responda? a) Qual é o intervalo de classe que tem maior freqüência? b) Qual a amplitude total da distribuição? c) Qual o número total de alunos? d) Qual é a freqüência do intervalo de classe 110 |–– 120? e) Quantos alunos receberam notas de teste entre 90 (inclusive) e 110? 33 Prof. Rosiel Sousa blog: rosielsousa.blogspot.com

Estatística Aplicada

f) Quantos alunos receberam notas de teste não inferiores a 100?
3 0 2 5 2 0 1 5 1 0 5

Série Casa:

0

1) Construa um gráfico de linha a partir da seguinte tabela:
COMÉRCIO EXTERIOR BRASIL – 1984-93 Quantidade (1.000 t) Exportação Importação 141.737 53.988 146.351 48.870 133.832 60.597 142.378 61.975 169.666 58.085 177.033 57.293 168.095 57.184 165.974 63.278 167.295 68.059 182.561 77.813

20 40 140

60 160

80

100

120

Anos 1984 1985 1986 1987 1988 1989 1990 1991 1992 1993

2) Represente as tabelas usando o gráfico de colunas: a)
PRODUÇÃO BRASILEIRA DE PETRÓLEO BRUTO 1991-93 Quantidade Anos (1.000 m3) 1991 36.180,4 1992 36.410,5 1993 37.164,3
Fonte: Petrobrás

b)
ENTREGA DE GASOLINA PARA CONSUMO BRASIL – 1988-91 Volume Anos (1.000 m3) 1988 9.267,7 1989 9.723,1 1990 10.121,3 1991 12.345,4
Fonte: IBGE

3) Represente as tabelas usando o gráfico de barras: a)
PRODUÇÃO DE OVOS DE GALINHA BRASIL – 1992 Quantidade Regiões (1.000 dúzias) Norte 57.297 Nordeste 414.804 Sudeste 984.659 Sul 615.978 Centro-Oeste 126.345
Fonte: IBGE

b)
PRODUÇÃO DE VEÍCULOS DE AUTOPROPULSÃO BRASIL – 1993 Tipos Quantidade Automóveis 1.100.278 Comerciais leves 224.387 Comerciais pesados 66.771
Fonte: ANFAVEA

4) Construa um gráfico de colunas múltiplas a partir da seguinte tabela:
Prof. Rosiel Sousa blog: rosielsousa.blogspot.com

34

Estatística Aplicada PROPORÇÃO DOS DOMICÍLIOS POR CONDIÇÃO DE OCUPAÇÃO BRASIL – 1990-91 NATUREZA Anos Próprios (%) Alugados (%) Cedidos (%) 1990 62,7 22,9 14,4 1991 70,3 16,5 13,2

5) Represente as tabelas por meio de gráficos de setores: a)
ÁREA TERRESTRE BRASIL Regiões Relativa (%) Norte 45,25 Nordeste 18,28 Sudeste 10,85 Sul 6,76 Centro-Oeste 18,86 Total 100,0
Fonte: IBGE

b)
PRODUÇÃO DE FERRO-GUSA BRASIL – 1993 Produção Estados (1.000 t) Minas Gerais 12.888 Espírito Santo 3.174 Rio de Janeiro 5.008 São Paulo 2.912
Fonte: Instituto Brasileiro de Siderurgia

6) A tabela a seguir mostra as áreas, em milhões de km2, dos oceanos. Representar graficamente os dados, usando: a) um gráfico de colunas; b) um gráfico de setores.
Oceano Área (milhões de km2) Antártico 36,8 Ártico 23,2 Atlântico 199,4 Índico 137,9 Pacífico 342,7

7) Construa um gráfico de setores a partir da seguinte tabela:
Espécie Auxílio-natalidade Auxílio-doença Auxílio-funeral Aposentadoria por Invalidez Aposentadoria por Tempo de Serviço Abono Permanente em Serviço Pensão por Morte Outras Espécies Quantidade 901.000 467.000 88.000 40.000 39.000 30.000 73.000 44.000

8) Dada a amostra: 3, 4, 4, 5, 6, 7, 7, 4, 5, 5, 6, 6, 7, 5, 8, 5, 6, 6, pede-se: a) construir a distribuição das freqüências absolutas; b) determinar as freqüências acumuladas, relativas absolutas e relativas acumuladas. c) construir o gráfico das freqüências absolutas (faça o gráfico que preferir). 9) De um exame final de Estatística, aplicado em 54 alunos da Faculdade FESAV, resultaram as seguintes notas:
7,0 7,1 2,1 2,8 8,6 8,0 6,7 6,9 4,2 4,5 7,0 7,8 3,5 6,7 6,4 5,7 9,8 7,0 4,2 7,4 7,1 6,1 10,0 8,0 5,0 6,2 8,3 6,8 7,5 7,2 6,2 5,1 9,2 7,5 7,8 7,0 7,2 4,3 6,6 6,4 6,9 7,4 8,9 6,9 7,1 6,5 6,1 6,9 9,0 7,0 1,7 8,3 5,0 5,0

Pede-se: a) Construir uma tabela de distribuição de freqüência, iniciando com 1,6 e adotando amplitude do intervalo de classe igual a 1,4, fechado à esquerda.
Prof. Rosiel Sousa blog: rosielsousa.blogspot.com

35

Estatística Aplicada

b) c) d) e) f) g)

Os pontos médios. Elaborar uma distribuição de freqüência acumulada e percentual (absoluta e acumulada). Quantos alunos obtiveram notas inferiores a 5,0? Quantos alunos obtiveram notas entre 5,0 e 8,0? Que porcentagem de alunos obteve notas acima ou igual a 7,0? Construa o gráfico de setores para as classes.

10) Construa um gráfico de colunas considerando a tabela abaixo:
DISTRIBUIÇÃO DE RENDA NO BRASIL – 1971 Faixa de renda Habitações Até 1 salário mínimo 224.740 De 1 a 3 salários mínimos 363.860 De 4 a 8 salários mínimos 155.700 Acima de 8 salários mínimos 47.500 Total 791.800

11) Represente num gráfico de setores as faixas de renda observadas no Brasil, em 1971, de acordo com a tabela observada no exercício 14 acima. Para isso, utilize as freqüências relativas absolutas. 12) A tabela abaixo no fornece as principais altas de preço verificadas no Brasil, no período de setembro a 11 de novembro de 1984. Construa um gráfico de colunas, com estes dados.
ELEVAÇÃO ACUMULADA DE SETEMBRO A 11 DE NOVEMBRO DE 1984 Produto % de alta Carne 2,5 Leite 10,7 Frutas 18,7 Vestuário 14,5
Fonte: IBGE.

13) Considerando as distribuições de freqüência seguintes, confeccione, para cada uma: a) o histograma; b) o polígono de freqüência; c) a ogiva. I.
i 1 2 3 4 5 Pesos (kg) 40 |–– 44 44 |–– 48 48 |–– 52 52 |–– 46 56 |–– 60 Fi 2 5 9 6 4 Σ = 26

II.
i 1 2 3 4 5 Estaturas (cm) 150 |–– 156 156 |–– 162 162 |–– 168 168 |–– 174 174 |–– 180 Fi 1 5 8 13 3 Σ = 30

III.
i 1 2 3 4 5 Prof. Rosiel Sousa Salários (R$) 500 |–– 700 700 |–– 900 900 |–– 1.100 1.100 |–– 1.300 1.300 |–– 1.500 Fi 8 20 7 5 2

blog: rosielsousa.blogspot.com

36

Estatística Aplicada 6 7 1.500 |–– 1.700 1.700 |–– 1.900 1 1 Σ = 44

14) Conhecidas as notas de 50 alunos:
68 71 80 41 94 85 35 61 55 98 33 81 41 78 66 52 50 91 48 66 65 35 55 69 73 77 64 73 85 42 84 74 59 67 65 65 47 53 39 94 74 54 77 60 88 57 68 45 76 89

Determine: a) a distribuição de freqüência começando por 30 e adotando o intervalo de classe de amplitude igual a 10; b) as freqüências acumuladas; c) as freqüências relativas; d) o histograma, o polígono de freqüência e a ogiva. 15) Um grau de nebulosidade, registrado em décimos, ocorre de acordo com a distribuição abaixo:
Nebulosidade Fi 0 |–– 0,5 |–– 1,5 |–– 2,5 |–– 3,5 |–– 4,5 |–– 5,5 |–– 6,5 |–– 7,5 |–– 8,5 |–– 9,5 |–– 10,0 320 125 75 65 45 45 55 65 90 145 676

Construa o histograma correspondente.

Prof. Rosiel Sousa

blog: rosielsousa.blogspot.com

37

Estatística Aplicada

6. Medidas de Posição: Medidas de Tendência Central
As medidas de posição mais importantes são as medidas de tendência central, que recebem tal denominação pelo fato dos dados observados tenderem, em geral, a se agrupar em torno de valores centrais. Dentre as medidas de tendência central, destacamos: - A média aritmética - A mediana - A moda As outras medidas de posição são as separatrizes, que englobam: - A própria média aritmética - Os quartis - Os percentis 6.1. Média Aritmética ( x) Em um conjunto de dados, podemos definir vários tipos de médias. Porém, em nossos estudos iremos nos limitar à mais importante: a média aritmética. Média aritmética é o quociente da soma dos valores da variável pelo número deles: x= sendo: Σ xi n

x é a média aritmética; xi os valores da variável;
n o número de valores.

6.1.1. Dados não-agupados Quando desejamos conhecer a média dos dados não-agrupados em tabelas de freqüências, determinamos a média aritmética simples. Exemplo: Sabendo-se que a venda diária de arroz tipo A, durante uma semana, foi de 10, 14, 13, 15, 16, 18 e 12 kg, temos, para venda média diária na semana de: x= Logo: x = 14 kg 6.1.2. Desvio em relação à média É a diferença entre cada elemento de um conjunto de valores e a média aritmética, ou seja:. di = xi − x . No exemplo anterior temos sete desvios:. d1 = 10 – 14 = –4 d2 = 14 – 14 = 0 d3 = 13 – 14 = –1 d4 = 15 – 14 = 1 d5 = 16 – 14 = 2 d6 = 18 – 14 = 4 d7 = 12 – 14 = –2 Σ xi 10 14 13 15 16 18 12 + + + + + + = = 14 n 7

Estatística Aplicada

6.1.3. Propriedades da média 1ª propriedade: A soma algébrica dos desvios em relação à média é nula:
i=1

∑ di = 0

k

No exemplo anterior:
i=1

) ∑ di = (−4) + 0+ (−1 + 1+ 2+ 4+ (−2) = (−7) + 7 = 0⇒ ∑ di = 0
i=1

7

7

2ª propriedade: Somando-se (ou subtraindo-se) uma constante (c) a todos os valores de uma variável, a média do conjunto fica aumentada (ou diminuída) dessa constante: yi = xi ± c ⇒ y = x± c Somando 2 a cada um dos valores da variável do exemplo dado, temos: y1 = 12, y2 = 16, y3 = 15, y4 = 17, y5 = 18, y6 = 20 e y7 = 14, Daí:
i=1 k

∑ yi = 12+ 16+ 15+ 17+ 18+ 20+ 14= 112

Logo: y= 112 = 16⇒ y = 16= 14+ 2 ⇒ y = x+ 2 7

3ª propriedade: Multiplicando-se (ou dividindo-se) todos os valores de uma variável por uma constante (c), a média do conjunto fica multiplicada (ou dividida) por essa constante: yi = xi × c ⇒ y = x× c ou yi = xi x ⇒ y= c c

Multiplicando por 3 cada um dos valores da variável do exemplo dado, temos: y1 = 30, y2 = 42, y3 = 39, y4 = 45, y5 = 48, y6 = 54 e y7 = 36, Daí:
i=1 k

∑ yi = 30+ 42+ 39+ 45+ 48+ 54+ 36= 294

Logo: y= 294 = 42⇒ y = 42= 14 3 ⇒ y = x× 3 × 7

6.1.4. Dados agrupados 6.1.4.1. Sem intervalos de classe Consideremos a distribuição relativa a 34 famílias de quatro filhos, tomando para variável o número de filhos do sexo masculino:

Estatística Aplicada Nº de meninos 0 1 2 3 4 Fi 2 6 10 12 4 Σ = 34

Como as freqüências são números indicadores da intensidade de cada valor da variável, elas funcionam como fatores de ponderação, o que nos leva a calcular a média aritmética ponderada, dada pela fórmula: x= Σ xi ⋅ Fi Σ Fi

O modo mais prático de obtenção da média ponderada é abrir, na tabela, uma coluna correspondente aos produtos xi ⋅ Fi :
Nº de meninos 0 1 2 3 4 Fi 2 6 10 12 4 Σ = 34

xi ⋅ Fi
0 6 20 36 16 Σ = 78

Temos, então: x= Σ xi ⋅ F 78 i = = 229⇒ x = 2,3 , ΣF 34 i

Logo: x = 2,3 meninos. 6.1.4.2. Com intervalos de classe Neste caso, convencionamos que todos os valores incluídos em um determinado intervalo de classe coincidem com o seu ponto médio (Pm), e determinamos a média aritmética ponderada por meio da fórmula: x= onde xi é o ponto médio (Pm) da classe. Exemplo: Calcular a estatura média dos alunos de uma escola conforme a tabela abaixo.
i 1 2 3 4 5 6 Estaturas (cm) 150 |–– 154 154 |–– 158 158 |–– 162 162 |–– 166 166 |–– 170 170 |–– 174 Fi 4 9 11 8 5 3 Σ = 40

Σ xi ⋅ Fi Σ Fi

Estatística Aplicada

Vamos abrir uma coluna para os pontos médios e outra para os produtos xi ⋅ Fi :
i 1 2 3 4 5 6 Estaturas (cm) 150 |–– 154 154 |–– 158 158 |–– 162 162 |–– 166 166 |–– 170 170 |–– 174 Fi 4 9 11 8 5 3 Σ = 40 xi 152 156 160 164 168 172

xi ⋅ Fi
608 1.404 1.760 1.312 840 516 Σ = 6.440

Temos, então: x= Logo: x = 161 cm. 6.1.5. Emprego da média A média é utilizada quando: a) desejamos obter a medida de posição que possui a maior estabilidade; b) houver necessidade de um tratamento algebrico posterior. EXERCÍCIOS: Série Aula: 1) Calcule a média aritmética da série: a) X: 1, 2, 8, 10, 12, 16, 21, 30. b) Y: 5, 6, 6, 10, 11, 11, 20. c) Z: 3,4; 7,8; 9,23; 12,15. 2) Um produto é acondicionado em lotes contendo cada um deles 10 unidades. O lote só é aprovado se apresentar um peso superior a 40 quilos. Se as unidades que compõem determinado lote pesam: 3; 4; 3,5; 5; 3,5; 4; 5; 5,5; 4; 5, este lote será aprovado? Qual o peso médio do produto? 3) Um produto é vendido em três supermecados por R$ 13,00/kg, R$ 13,20/kg e R$ 13,50/kg. Determine quantos R$/kg se paga em média pelo produto. 4) Calcule a média aritmética da série:
xi 2 3 4 5 Fi 1 4 3 2

Σ xi ⋅ Fi 6.440 = = 161 x = 161 ⇒ Σ Fi 40

5) Uma imobiliária gerencia o aluguel de residências particulares, segundo o quadro abaixo:

Estatística Aplicada Aluguel (R$) 0 |––– 200,00 200,00 |––– 400,00 400,00 |––– 600,00 600,00 |––– 800,00 800,00 |––– 1.000,00 Nº de casas Fi 30 52 28 7 3

i 1 2 3 4 5

6.2. Mediana (Md) A mediana é outra medida de posição definida como o número que se encontra no centro de uma série de números, estando dispostos segundo uma ordem. Em outras palavras, a mediana de um conjunto de valores, dispostos segundo uma ordem (crescente ou decrescente), é o valor situado de tal forma no conjunto que o separa em dois subconjuntos de mesmo número de elementos. 6.2.1. Dados não-agrupados Dada uma série de valores como, por exemplo: 5, 2, 6, 13, 9, 15, 10 de acordo com a definição de mediana, o primeiro passo a ser dado é o da ordenação (crescente ou decrescente) dos valores: 2, 5, 6, 9, 10, 13, 15 O valor que divide a série acima em duas partes iguais é igual a 9, logo a Md = 9. Se, porém, a série dada tiver um número par de termos, a mediana será a média aritmética dos valores centrais da série. Assim, a série de valores: 2, 6, 7, 10, 12, 13, 18, 21 tem para a mediana a média aritmética entre 10 e 12. Logo: Md = 10+ 12 22 = = 11 ⇒ Md = 11 2 2

Verificamos que, estando ordenados os valores de uma série e sendo n o número de elementos da série, o valor mediano (P) será: P= Para comprovar tal fato nas séries dadas: n+ 1 2

- Para n = 7, temos P =

7+ 1 = 4 . Logo, a mediana é o 4º termo da série, isto é: Md = 9. 2 8+ 1 - Para n = 8, temos P = = 4,5 . Logo, a mediana é a média aritmética do 4º e 5º 2 10+ 12 = 11 ⇒ Md = 11. termos da série, isto é: Md= 2

Notas:

Estatística Aplicada

• • •

Quando o número de elementos da série estatística for ímpar, haverá coincidência da mediana com um dos elementos da série. Quando o número de elementos da série estatística for par, nunca haverá coincidência da mediana com um dos elementos da série. A mediana será sempre a média aritmética dos 2 elementos centrais da série. Em uma série a mediana, a média e a moda não têm, necessariamente, o mesmo valor. A mediana depende da posição e não dos valores dos elementos na série ordenada. Essa é uma das diferenças marcantes entre mediana e média (que se deixa influenciar, e muito, pelos valores extremos). Vejamos: 5, 7, 10, 13, 15 ⇒ x = 10 e Md = 10 5, 7, 10, 13, 65 ⇒ x = 20 e Md = 10 isto é, a média do segundo conjunto de valores é maior do que a do primeiro, por influência dos valores extremos, ao passo que a mediana permanece a mesma.

6.2.2. Dados agrupados Se os dados se agrupam em uma distribuição de freqüência, o cálculo da mediana se processa de modo muito semelhante àquele dos dados não-agrupados, implicando, porém, a determinação prévia das freqüências acumuladas. Para o caso de uma distribuição, porém, a ordem, a partir de qualquer um dos extremos, é dada por: P= n+ 1 2

6.2.2.1. Sem intervalos de classe Neste caso, é o bastante identificar a freqüência acumulada imediatamente superior ao valor de P. A mediana será aquele valor da variável que corresponde a tal freqüência acumulada. Tomemos a tabela do item 6.1.4.1., completando-a com a coluna correspondente à freqüência acumulada:
Nº de meninos 0 1 2 3 4 Fi 2 6 10 12 4 Σ = 34 Fa 2 8 18 30 34

Sendo: P =

34+ 1 = 175 , 2

a menor freqüência acumulada que supera esse valor é 18, que corresponde ao valor 2 da variável, sendo esse o valor mediano. Logo, Md = 2. Nota: No caso de existir uma freqüência acumulada (Fa), tal que: P – Fa = 0,5, a mediana será dada pela média aritmética dos valores das variáveis correspondentes às freqüências acumuladas imediatamente inferior e superior a P. Exemplo:

Estatística Aplicada xi 12 14 15 16 17 20 Fi 1 2 1 2 1 1 Σ=8 Fa 1 3 4 6 7 8

Temos: P =

8+ 1 = 4,5 2

Logo: Md=

15+ 16 31 = = 155 , 2 2

6.2.2.2. Com intervalos de classe Devemos seguir os seguintes passos: 1º) Determinamos as freqüências acumuladas; n+ 1 2º) Calculamos P = ; 2 3º) Marcamos a classe correspondente à freqüência acumulada imediatamente superior à P. Tal classe será a classe mediana; 4º) Calculamos a Mediana pela seguinte fórmula: Md= Li+ (P − Fa* )⋅ h Fi

Li = é o limite inferior da classe mediana. Fa* = é a freqüência acumulada da classe anterior à classe mediana. Fi = é a freqüência simples da classe mediana. h = é a amplitude do intervalo da classe mediana. Exemplo:
i 1 2 3 4 5 6 Estaturas (cm) 50 |–– 54 54 |–– 58 58 |–– 62 62 |–– 66 66 |–– 70 70 |–– 74 Fi 4 9 11 8 5 3 Σ = 40 Fa 4 13 24 32 37 40

Temos: P = Li = 58

40+ 1 = 205 , 2 Fa* = 13

Logo,.a classe mediana será a terceira (i = 3). Fi = 11 h=4

Substituindo esses valores na fórmula, obtemos: Md= Li+ Isto é: Md = 60,73. OBS: Esta mediana é estimada, pois não temos os 40 valores da distribuição.
* (P − Fa )⋅ h (205− 13 ⋅ 4 , ) ⇒ Md= 58+ = 60 ,73 Fi 11

Estatística Aplicada

6.2.3. Emprego da Mediana • • • Quando desejamos obter o ponto que divide a distribuição em duas partes iguais. Quando há valores extremos que afetam de maneira acentuada a média aritmética. Quando a variável em estudo é salário.

EXERCÍCIOS: Série Aula: 1) Calcule a mediana da sequência: a) X: 2, 5, 8, 10, 12, 15, 8, 5, 12. b) Y: 3,4; 5,2; 4,7; 6; 8,4; 9,3; 2,1; 4,8. 2) Calcule a mediana da distribuição:
xi 2 4 5 6 8 Fi 5 20 32 40 2

3) Uma loja de departamentos selecionou um grupo de 54 notas fiscais, durante um dia, e obteve o quadro abaixo. Determine o valor mediano da série.
i 1 2 3 4 5 6 Consumo por nota (R$) 0 |––– 50,00 50,00 |––– 100,00 100,00 |––– 150,00 150,00 |––– 200,00 200,00 |––– 250,00 250,00 |––– 300,00 Nº de notas 10 28 12 2 1 1

6.3. Moda (Mo) É o valor que ocorre com maior freqüência em uma série de valores. Desse modo, o salário modal dos empregados de uma fábrica é o salário mais comum, isto é, o salário recebido pelo maior número de empregados dessa fábrica. 6.3.1. Dados não-agrupados A moda é facilmente reconhecida: basta, de acordo com definição, procurar o valor que mais se repete. Exemplo: Na série {7, 8, 9, 10, 10, 10, 11, 12} a moda é igual a 10. Há séries nas quais não exista valor modal, isto é, nas quais nenhum valor apareça mais vezes que outros. Exemplo: {3, 5, 8, 10, 12} não apresenta moda. A série é amodal. Em outros casos, pode haver dois ou mais valores de concentração. Dizemos, então, que a série tem dois ou mais valores modais. Exemplo: {2, 3, 4, 4, 4, 5, 6, 7, 7, 7, 8, 9} apresenta duas modas: 4 e 7. A série é bimodal.

Estatística Aplicada

6.3.2. Dados agrupados 6.3.2.1. Sem intervalos de classe Uma vez agrupados os dados, é possível determinar imediatamente a moda: basta fixar o valor da variável de maior freqüência. Exemplo: Qual a temperatura mais comum medida no mês abaixo:
Temperatura (ºC) 0 1 2 3 Fi 3 9 12 6 Σ = 30

Na distribuição acima a freqüência máxima é 12, correspondente ao valor 2 da variável. Logo, a temperatura mais comum é 2 ºC. 6.3.2.2. Com intervalos de classe A classe que apresenta a maior freqüência é denominada classe modal. Pela definição, podemos afirmar que a moda, neste caso, é o valor dominante que está compreendido entre os limites da classe modal. O método mais simples para o cálculo da moda consiste em tomar o ponto médio da classe modal. Damos a esse valor a denominação de moda bruta. Mo= onde: Li = é o limite inferior da classe modal. Ls = é o limite superior da classe modal. Exemplo: Calcule a estatura modal conforme a tabela abaixo.
i 1 2 3 4 5 6 Estaturas (cm) 50 |–– 54 54 |–– 58 58 |–– 62 62 |–– 66 66 |–– 70 70 |–– 74 Fi 4 9 11 8 5 3 Σ = 40

Ls+ Li 2

Temos que a classe modal é i = 3. Como: Mo= Ls+ Li 62+ 58 = = 60 2 2

Logo: Mo = 60 cm Para determinar a moda de uma variável contínua (com intervalos de classe), podemos optar por vários processos. Daremos destaque para a moda de Pearson, a moda de King e a moda de Czuber. 1º Processo: Moda de Pearson Segundo Pearson, a moda de uma variável contínua pode ser obtida através do valor da média e da mediana:

Estatística Aplicada

Mo= 3 − 2x Md 2º Processo: Moda de King King levou em consideração, em sua fórmula, a freqüência absoluta da classe anterior e a freqüência absoluta da classe posterior à classe modal. Mo= Li + onde: Li = limite inferior da classe modal. Fpost = freqüência absoluta da classe posterior à classe modal. Fant = freqüência absoluta da classe anterior à classe modal. h = amplitude do intervalo de classe. 3º Processo: Moda de Czuber Czuber levou em consideração, em sua fórmula, a freqüência absoluta da classe anterior e a freqüência absoluta da classe posterior, além da freqüência absoluta da classe modal. Mo= Li + onde: Li = limite inferior da classe modal. Fi = freqüência absoluta da classe modal. Fpost = freqüência absoluta da classe posterior à classe modal. Fant = freqüência absoluta da classe anterior à classe modal. h = amplitude do intervalo de classe. Comentários: A fórmula de Pearson tem normalmente interesse teórico. Se não dispusermos da média e da mediana da distribuição, a fórmula de Pearson é a mais trabalhosa. A fórmula de King é a mais simples delas, mas não é a mais precisa. A fórmula de Czuber é mais precisa que a fórmula de King, pois leva também em consideração a freqüência da classe modal. Normalmente o processo mais confiável é o valor de Czuber. EXERCÍCIOS: Série Aula: 1) Calcule a moda das séries abaixo: a) X: 2, 3, 5, 4, 5, 2, 5, 7 b) Y: 4, 12, 5, 9, 12, 4, 3 c) Z: 7, 7, 7, 7 7 d) J: 4, 5, 6, 6, 6, 7, 8, 8, 8, 9, 10, 10, 10, 11 e) T: 2, 5, 9, 8, 10, 12 2) Calcule a moda da distribuição:
xi 2 3 4 Fi 1 7 2

⋅h Fant+ Fpost

Fpost

Fi − Fant ⋅h 2 i − (Fant+ Fpost F )

Estatística Aplicada 5 2

3) Calcule a moda de Czuber para a distribuição representativa dos salários de 25 funcionários de uma empresa.
i 1 2 3 4 5 Salários (R$) 1.000,00 |––– 1.200,00 1.200,00 |––– 1.400,00 1.400,00 |––– 1.600,00 1.600,00 |––– 1.800,00 1.800,00 |––– 2.000,00 Nº de funcionários 2 6 10 5 2

6.4. Utilização das Medidas de Tendência Central Na maioria das situações, não necessitamos calcular as três medidas de tendência central. Normalmente precisamos de apenas uma das medidas para caracterizar o centro da série. Surge, então, a questão: qual medida deve ser utilizada? A medida ideal em cada caso é aquela que melhor representa a maioria dos dados da série. Quando todos os dados de uma série são iguais, a média, a mediana e a moda coincidirão com este valor e, portanto qualquer uma delas representará bem a série. No entanto, este caso dificilmente ocorrerá na prática. Na maioria das vezes, teremos valores diferenciados para a série e conseqüentemente a medida irá representar bem, apenas os dados da série que se situam próximos a este valor. Os dados muito afastados em relação ao valor da medida não serão bem representados por ela. Assim: - Devemos optar pela média, quando houver forte concentração de dados na área central da série; - Devemos optar pela mediana, quando houver forte concentração de dados no início ou no final da série; e - Devemos optar pela moda apenas em séries que apresentam um elemento típico, isto é, um valor cuja freqüência é muito superior à freqüência dos outros elementos da série.

EXERCÍCIOS: Série Aula: 1) Uma loja vende cinco produtos básicos, A, B, C, D e E. O lucro por unidade cormecializada destes produtos vale respectivamente R$ 200,00; R$ 300,00; R$ 500,00; R$ 1.000,00 e R$ 5.000,00. A loja vendeu em determinado mês 20, 30, 20, 10 e 5 unidades respectivamente. Qual foi o lucro médio por unidade comercializada por esta loja? 2) Um caminhão cujo peso vazio é 3.000 kg será carregado com 480 caixas de 10 kg cada, 350 caixas de 8 kg cada, 500 caixa de 4 kg cada e 800 caixas de 5 kg cada. O motorista do caminhão pesa 80 kg e a lona de cobertura da carga pesa 50 kg. (a) Se este caminhão tem que passar por uma balança que sá permite passagens a caminhões com peso máximo de 15 toneladas, este caminhão passará pela balança? (b) Qual o peso médio das caixas carregadas no caminhão?

Estatística Aplicada

3) Num quartel, constatou-se que o peso médio de 40 soldados era de 69 quilos. Posteriormente, verificou-se que a balança estava desregulada, ocasionando um peso indicado superior em 15 gramas ao peso verdadeiro. Qual era a média verdadeira dos pesos dos soldados? 4) Calcule o número médio de acidentes por dia em uma determinada esquina.
Nº de acidentes por dia: xi 0 1 2 3 4 Nº de dias Fi 30 5 3 1 1

Série Casa: 1) Considerando os conjuntos de dados: I. 3, 5, 2, 6, 5, 9, 5, 2, 8, 6 II. 20, 9, 7, 2, 12, 7, 20, 15, 7 III. 51,6; 48,7; 50,3; 49,5; 48,9 IV. 15, 18, 20, 13, 10, 16, 14 Calcule: a) a média aritmética b) a mediana c) a moda 2) Os salários-hora de cinco funcionários de uma companhia são: R$ 75,00; R$ 90,00; R$ 83,00; R$ 142,00; R$ 88,00 Determine: a) a média dos salários-hora b) o salário-hora mediano 3) As notas de um candidato, em seis provas de um concurso, foram: 8,4; 9,1; 7,2; 6,8; 8,7 e 7,2. Determine: a) a nota média b) a nota mediana c) a nota modal 4) Considerando a distribuição abaixo:
xi Fi 3 4 4 8 5 11 6 10 7 8 8 3

Calcule: a) a média b) a mediana c) a moda 5) Em uma das classes de 50 alunos, as notas obtidas formaram a seguinte distribuição:
Notas Nº de Alunos 2 1 3 3 4 6 5 10 6 13 7 8 8 5 9 3 10 1

Calcule:

Estatística Aplicada

a) a nota média b) a nota mediana c) a nota modal 6) Calcule a média, a mediana e a moda das distribuições de freqüência abaixo: I.
i 1 2 3 4 5 Notas 0 |–– 2 2 |–– 4 4 |–– 6 6 |–– 8 8 |–– 10 Fi 5 8 14 10 7 Σ = 44

II.
i 1 2 3 4 5 Estaturas (cm) 150 |–– 158 158 |–– 166 166 |–– 174 174 |–– 182 182 |–– 190 Fi 5 12 18 27 8 Σ = 70

III.
i 1 2 3 4 5 6 7 Salários (R$) 500 |–– 700 700 |–– 900 900 |–– 1.100 1.100 |–– 1.300 1.300 |–– 1.500 1.500 |–– 1.700 1.700 |–– 1.900 Fi 18 31 15 3 1 1 1 Σ = 70

IV.
i 1 2 3 4 5 6 7 Pesos (kg) 145 |–– 151 151 |–– 157 157 |–– 163 163 |–– 169 169 |–– 175 175 |–– 181 181 |–– 187 Fi 10 9 8 6 3 3 1 Σ = 40

7) Calcule a idade média e a idade mediana dos alunos de uma classe de primeiro ano de determinada Faculdade, em anos.
Idade (anos) xi 17 18 19 20 21 Nº de alunos Fi 3 18 17 8 4

8) O salário de 40 funcionários de um escritório está distribuído segundo o quadro abaixo. Calcule a salário médio destes funcionários.
i 1 2 3 4 5 6 Salário (R$) 400,00 |––– 500,00 500,00 |––– 600,00 600,00 |––– 700,00 700,00 |––– 800,00 800,00 |––– 900,00 900,00 |––– 1.000,00 Nº de funcionários Fi 12 15 8 3 1 1

9) Determine o valor mediano da distribuição a seguir que representa os salários de 25 funcionários selecionados de uma empresa.
i 1 2 3 4 5 Salário (R$) 1.000,00 |––– 1.200,00 1.200,00 |––– 1.400,00 1.400,00 |––– 1.600,00 1.600,00 |––– 1.800,00 1.800,00 |––– 2.000,00 Nº de funcionários Fi 2 6 10 5 2

10) Calcule a moda de Czuber para a distribuição de valores de 54 notas fiscais, emitidas na mesma dada, selecionadas em uma loja de departamentos:
i 1 2 3 4 5 6 Consumo por nota (R$) 0 |––– 50,00 50,00 |––– 100,00 100,00 |––– 150,00 150,00 |––– 200,00 200,00 |––– 250,00 250,00 |––– 300,00 Nº de notas 10 28 12 2 1 1

11) Calcule a moda de Czuber para a distribuição abaixo que representa a nota de 60 alunos em uma prova de matemática:
i 1 2 3 4 5 Notas 0 |––– 2 2 |––– 4 4 |––– 6 6 |––– 8 8 |––– 10 Nº de alunos 5 20 12 20 3

REFERÊNCIAS BUSSAB, W. O., MORETTIN, P. A. Estatística Básica. Ed. Saraiva. 5ª edição. 2004. CRESPO, A. A. Estatística Fácil. Ed. Saraiva. 16ª edição. 1998. DOWNING, D., CLARK, J. Estatística Aplicada. Ed. Saraiva. 2ª edição. 2005. FONSECA, J. S., MARTINS, G. A. Curso de Estatística. Ed. Atlas. 6ª edição. 1996. LAPPONI, J. C. Estatírtico Usando Excel. Ed. Lapponi. 2000. MARTINS, G. A. Estatística Geral e Aplicada. Ed. Atlas. 2ª edição. 2002. MARTINS, G. A., DONAIRE, D. Princípios de Estatística. Ed. Atlas. 4ª edição. 1995. NAZARETH, H. Curso Básico de Estatística. Ed. Ática. 7ª edição. 1995. PEREIRA, W., TANAKA, O. K. Estatística – Conceitos Básicos. Ed. Makron Books. SILVA, E. M., GONÇALVES, V., MUROLO, A. C. Estatística para os cursos de: Economia, Administração e Ciências Contábeis. Ed. Atlas. 3ª edição. 1999. TOLEDO, G. L., OVALLE, I. I. Estatística Básica. Ed. Atlas. 2ª edição. 1995.

SUMÁRIO
1. INTRODUÇÃO À ESTATÍSTICA.....................................................................................................................................3 1.1. ENTENDENDO A IMPORTÂNCIA DA ESTATÍSTICA..................................................................................................................3 1.2. OBJETO DA ESTATÍSTICA................................................................................................................................................4 1.2. MÉTODO ESTATÍSTICO...................................................................................................................................................4 1.2.1. O Método Científico..........................................................................................................................................4 1.2.2. O Método Experimental.....................................................................................................................................4 1.2.3. O Método Estatístico.........................................................................................................................................4 1.3. A ESTATÍSTICA.............................................................................................................................................................5 1.4. FASES DO MÉTODO ESTATÍSTICO.....................................................................................................................................5 1.4.1. Coleta de Dados................................................................................................................................................5 1.4.2. Apuração dos Dados.........................................................................................................................................6 1.4.3. Apresentação dos Dados...................................................................................................................................6 1.4.4. Análise dos Resultados......................................................................................................................................6 1.5. ABUSOS DA ESTATÍSTICA................................................................................................................................................6 1.5.1. Más Amostras....................................................................................................................................................6 1.5.2. Pequenas Amostras...........................................................................................................................................6 1.5.3. Estimativas por Suposição.................................................................................................................................6 1.5.4. Porcentagens Distorcidas:................................................................................................................................6 1.5.5. Perguntas Tendenciosas....................................................................................................................................7 1.5.6. Pressão do Pesquisador....................................................................................................................................7 2. POPULAÇÃO E AMOSTRA...............................................................................................................................................8 2.1. VARIÁVEIS...................................................................................................................................................................8 2.2. POPULAÇÃO E AMOSTRA................................................................................................................................................8 2.2.1. Amostragem Aleatória Simples..........................................................................................................................9 2.2.2. Amostragem Sistemática....................................................................................................................................9 2.2.3. Amostragem Estratificada Proporcional...........................................................................................................9 3. SÉRIES ESTATÍSTICAS...................................................................................................................................................13 3.1. TABELAS....................................................................................................................................................................13 3.2. SÉRIES ESTATÍSTICAS...................................................................................................................................................13 3.2.1. Séries Históricas, Cronológicas ou Temporais................................................................................................13 3.2.2. Séries Geográficas, Especiais, Territoriais ou de Localização........................................................................14 3.2.3. Séries Específicas ou Categórica.....................................................................................................................14 3.2.4. Séries Conjugadas – Tabela de Dupla Entrada...............................................................................................14 3.3. DADOS ABSOLUTOS E DADOS RELATIVOS.......................................................................................................................15 3.3.1. As Porcentagens..............................................................................................................................................15 3.3.2. Os Índices........................................................................................................................................................16 3.3.3. Os Coeficientes................................................................................................................................................17 3.3.4. As Taxas..........................................................................................................................................................17 4. DISTRIBUIÇÃO DE FREQUÊNCIA...............................................................................................................................21 4.1. TABELA PRIMITIVA / ROL.............................................................................................................................................21 4.2. DISTRIBUIÇÃO DE FREQÜÊNCIA......................................................................................................................................21 4.3. ELEMENTOS DE UMA DISTRIBUIÇÃO DE FREQÜÊNCIA.........................................................................................................22 4.3.1. Classe..............................................................................................................................................................22 4.3.2. Limites de Classe.............................................................................................................................................22 4.3.3. Amplitude de um Intervalo de Classe...............................................................................................................22 4.3.4. Amplitude Total da Distribuição.....................................................................................................................22 4.3.5. Ponto Médio de uma Classe............................................................................................................................22 4.4. DETERMINAÇÃO DO NÚMERO DE CLASSES.......................................................................................................................22 4.5. TIPOS DE FREQÜÊNCIAS................................................................................................................................................23 4.6. DISTRIBUIÇÃO DE FREQÜÊNCIA SEM INTERVALOS DE CLASSE.............................................................................................23 5. GRÁFICOS ESTATÍSTICOS............................................................................................................................................27

5.1. REPRESENTAÇÃO GRÁFICA............................................................................................................................................27 5.1.1. Gráfico de Linha..............................................................................................................................................27 5.1.2. Gráfico de Colunas ou de Barras....................................................................................................................28 5.1.3. Gráfico de Colunas ou de Barras Múltiplas....................................................................................................29 5.1.4. Gráfico de Setores...........................................................................................................................................29 5.2. REPRESENTAÇÃO GRÁFICA DE DISTRIBUIÇÃO DE FREQUÊNCIA............................................................................................30 5.2.1. Histograma......................................................................................................................................................30 5.2.2. Polígono de Frequência..................................................................................................................................31 5.2.3. Ogiva...............................................................................................................................................................31 6. MEDIDAS DE POSIÇÃO: MEDIDAS DE TENDÊNCIA CENTRAL........................................................................40 6.1. MÉDIA ARITMÉTICA ().................................................................................................................................................40 6.1.1. Dados não-agupados.......................................................................................................................................40 6.1.2. Desvio em relação à média..............................................................................................................................40 6.1.3. Propriedades da média....................................................................................................................................41 6.1.4. Dados agrupados.............................................................................................................................................41
6.1.4.1. Sem intervalos de classe..................................................................................................................................................41 6.1.4.2. Com intervalos de classe.................................................................................................................................................42

6.1.5. Emprego da média...........................................................................................................................................43 6.2. MEDIANA (MD)..........................................................................................................................................................44 6.2.1. Dados não-agrupados.....................................................................................................................................44 6.2.2. Dados agrupados.............................................................................................................................................45
6.2.2.1. Sem intervalos de classe..................................................................................................................................................45 6.2.2.2. Com intervalos de classe.................................................................................................................................................46

6.2.3. Emprego da Mediana......................................................................................................................................47 6.3. MODA (MO)..............................................................................................................................................................47 6.3.1. Dados não-agrupados.....................................................................................................................................47 6.3.2. Dados agrupados.............................................................................................................................................48
6.3.2.1. Sem intervalos de classe..................................................................................................................................................48 6.3.2.2. Com intervalos de classe.................................................................................................................................................48

6.4. UTILIZAÇÃO DAS MEDIDAS DE TENDÊNCIA CENTRAL.......................................................................................................50 REFERÊNCIAS.......................................................................................................................................................................54

ESTATÍSTICA APLICADA

Tecnico em Segurança do Trabalho

Prof. Rosiel Sousa do Nascimento

Bacabal (MA)

agosto 2012

Sign up to vote on this title
UsefulNot useful