You are on page 1of 62

Prof.

Ms Luiz Gonzaga de Paula

PROBABILIDADE E ESTATÍSTICA Resumo das aulas – professor Gonzaga PARTE 1
1 - INTRODUÇÃO
1.1 Evolução Histórica A origem da palavra estatística esta associada à palavra latina STATUS (Estado). Há indícios de que 3000 anos A.C. já se faziam censos na Babilônia, China e Egito. Contudo, mesmo que a prática de coleta de dados fosse conhecida, pelos povos antigos e se atribuam a Aristóteles 180 descrições de Estados, apenas no século XVII a Estatística passou a ser considerada disciplina autônoma, tendo como objetivo básico à descrição dos Bens do Estado. A palavra Estatística foi batizada pelo professor alemão Godofredo Achenwall (1719 – 1772). Godofredo determinou os objetivos da Estatística e suas relações com as demais ciências. Com a escola alemã as tabelas tornaram-se mais completas, surgiram às representações gráficas e os cálculos das probabilidades, a Estatística deixou de ser simples catalogação de dados numéricos coletivos para se tornar o estudo de como chegar a conclusões sobre o todo (população), partindo da observação de partes desse todo (amostra). 1.2 O que é Estatística? Estatística é uma parte da matemática aplicada que fornece métodos para coleta, organização, descrição, análise e interpretação de dados e para a utilização dos mesmos na tomada de decisões. A coleta, a organização, a descrição dos dados, o cálculo e a interpretação de coeficientes pertencem à Estatística Descritiva, enquanto a análise e a interpretação dos dados, associado a uma margem de incerteza, ficam a cargo da Estatística Indutiva ou Inferencial, também chamada como a medida da incerteza ou métodos que se fundamentam na teoria da probabilidade.

1

Prof. Ms Luiz Gonzaga de Paula

2 - ORGANIZAÇÃO DE DADOS ESTATÍSTICOS
2.1 - Fases do Método Estatístico Definição do problema: Saber exatamente aquilo que se pretende pesquisar é o mesmo que definir corretamente o problema. Planejamento: • Como levantar informações? • Que dados deverão ser obtidos? • Qual levantamento a ser utilizado? Censitário? Por amostragem? • Fazer o cronograma de atividades. • Estipular os Custos envolvidos. 2.2 - Coleta de Dados: Fase operacional. É o registro sistemático de dados, com um objetivo determinado. A coleta pode ser direta e indireta. Coleta Direta: Quando é obtida diretamente da fonte. Exemplo: Empresa que realiza uma pesquisa para saber a preferência dos consumidores pela sua marca. Quando feita sobre elementos informativos de registro obrigatório (nascimento, casamento, etc.) A coleta direta de dados pode ser classificada relativamente ao fator tempo em: a) continua – quando feita continuamente, tal como: registros de nascimento, óbitos, casamentos; b) periódica – quando feita em intervalos constantes de tempo, como os censos (de 10 em 10 anos) , avaliações mensais dos alunos, etc. c) ocasional -- quando feita extemporaneamente, a fim de atender a uma conjuntura ou a uma emergência, como no caso de epidemia. Exemplo registro de casos de dengue. Coleta Indireta: É feita por deduções a partir dos elementos conseguidos pela coleta direta, por analogia, por avaliação, indícios ou proporcional. 2.3 - Apuração dos Dados: Resumo dos dados através de sua contagem e agrupamento. É a condensação e tabulação de dados. Pode ser manual, mecanizada. 2.4 - Apresentação dos Dados: Os dados devem ser apresentados sob a forma de tabelas e gráficos, segundo regras práticas fixadas pelo Instituto Brasileiro de Geografia e Estatística. (IBGE) 2.5 - Análise e Interpretação dos Dados: A última fase do trabalho estatístico é a mais importante e delicada. Está ligada essencialmente ao cálculo de medidas e coeficientes, cuja finalidade principal é descrever o fenômeno (Estatística Descritiva)

2

Prof. Ms Luiz Gonzaga de Paula

3 - DEFINIÇÕES BÁSICAS DA ESTATÍSTICA
3.1 - Fenômeno Estatístico: É qualquer evento que se pretenda analisar, cujo estudo seja possível a aplicação do método estatístico. São divididos em três grupos: Fenômenos de massa ou coletivo: São aqueles que não podem ser definidos por uma simples observação. A estatística dedica-se ao estudo desses fenômenos. Ex: A natalidade em Minas Gerais, O preço médio da cerveja em Pouso Alegre, etc. Fenômenos individuais: São aqueles que irão compor os fenômenos de massa.

Exemplo: cada nascimento em Minas Gerais, cada preço de cerveja em Pouso Alegre, etc. Fenômenos de multidão: Quando as características observadas para a massa não se verificam para o particular. 3.2 - Dado Estatístico: É um dado numérico, considerado a matéria-prima sobre a qual iremos aplicar os métodos estatísticos. 3.3 – A Estatística nas Empresas A direção de uma empresa exige de seu administrador a importante tarefa de tomar decisões, e o conhecimento e o uso da Estatística facilitarão seu tríplice trabalho de organizar, dirigir e controlar a empresa. 3.4 – Populações, Amostra, Parâmetros, Estimativas e Atributo População: É o conjunto total de elementos (pessoas, coisas, objetos) portadores de, pelo menos, uma característica comum. Amostra: É uma parcela representativa da população que é examinada com o propósito de tirarmos conclusões sobre a essa população. (é qualquer subconjunto não vazio e finito de uma população). Parâmetros: São valores singulares que existem na população e que servem para caracterizá-la. Para definirmos um parâmetro devemos examinar toda a população. Exemplo: Os alunos do 5º ano de Administração da UNIVAS têm em média 1,70 m de estatura. Estimativa: É um valor aproximado do parâmetro e é calculado com o uso da amostra.

3

junho = 36.Variável Qualitativa: Quando seus valores são expressos por atributos: sexo. teoricamente. ou seja.Variável Quantitativa: Quando os dados são de caráter nitidamente quantitativo. 3. e o conjunto dos resultados possui uma estrutura numérica. ao dilatar-se.5. 3. Exemplo: Quando você vai medir a temperatura de seu corpo com um termômetro de mercúrio o que ocorre é o seguinte: O filete de mercúrio. trata-se. o levantamento e os estudos necessários ao tratamento desses dados são designados genericamente de estatística de atributo. 3. cor da pele. Ms Luiz Gonzaga de Paula Atributo: Quando os dados estatísticos apresentam um caráter qualitativo.5.2 . portanto da estatística de variável e se dividem em: a) Variável discreta ou descontínua: Seus valores são expressos geralmente através de números inteiros não negativos. passará por todas as temperaturas intermediárias até chegar na temperatura atual do seu corpo. abril = 30 . qualquer valor entre dois limites.Variável: É o conjunto de resultados possíveis de um fenômeno. etc. e a escala numérica de seus possíveis valores corresponde ao conjunto R dos números Reais.5 . Exemplos de variáveis: • • • • • • Cor dos olhos das alunas: Índice de liquidez nas indústrias mineiras: Produção de café no Brasil: Número de defeitos em aparelhos de TV: Comprimento dos pregos produzidos por uma empresa: O ponto obtido em cada jogada de um dado: qualitativa quantitativa contínua quantitativa contínua quantitativa discreta quantitativa contínua quantitativa discreta 4 .Prof. maio = 35 . podem assumir. Resulta normalmente de contagens.1 . b) Variável contínua: Resulta normalmente de uma mensuração. Exemplo: Números de alunos presentes às aulas de introdução à estatística no 1º semestre de 2009: março = 18.

1 . que garantem.Amostragem Casual ou Aleatória Simples É o processo mais elementar e freqüentemente utilizado.2 . Normalmente possuem a mesma probabilidade. um a um.Prof. dos 90 alunos.1 . esse tipo de sorteio tornase muito trabalhoso. daí obtemos os elementos da amostra proporcional ao número de elementos desses estratos.AMOSTRAGEM 4. É equivalente a um sorteio lotérico. Neste caso utiliza-se uma Tabela de números aleatórios. colocamos na urna e após mistura retiramos. os quais corresponderão aos elementos pertencentes à amostra. nove números que formarão a amostra. do exemplo anterior. de 10%.numeramos os alunos de 1 a 90. Trata-se do método que garante cientificamente a aplicação das técnicas estatísticas de inferências.1. 54 sejam meninos e 36 sejam meninas. por meio de um dispositivo aleatório qualquer x números dessa seqüência. portanto dois estratos (sexo masculino e sexo feminino). Exige que cada elemento da população possua determinada probabilidade de ser selecionado. temos: 5 . 4. de 10%. Somente com base em amostragens probabilísticas é que se podem realizar inferências ou induções sobre a população a partir do conhecimento da amostra. Exemplo: Vamos obter uma amostra. a seguir.Métodos probabilísticos • É uma técnica especial para recolher amostras. Pode ser realizada numerando-se a população de 1 a n e sorteando-se. supondo. construída de modo que os algarismos de 0 a 9 são distribuídos ao acaso nas linhas e colunas. Ms Luiz Gonzaga de Paula 4 . representativa para a pesquisa da estatura de 90 alunos da UNIVAS: 1º . a probabilidade de cada elemento ser selecionado será 1/N. 4.Amostragem Proporcional Estratificada: Quando a população se divide em estratos. em pedaços iguais de papel. tanto quanto possível. Assim. que.escrevemos os números dos alunos. 2º . de 1 a 90. OBS: quando o número de elementos da amostra é muito grande. convém que o sorteio dos elementos da amostra leve em consideração tais estratos. Exemplo: Vamos obter uma amostra proporcional estratificada. Logo.1. se N for o tamanho da população. o acaso na escolha. São.

não há necessidade de construir o sistema de referência.Amostragem Acidental Trata-se de uma amostra formada por aqueles elementos que vão aparecendo. os demais elementos seriam periodicamente considerados de 18 em 18. Assim. escolhemos por sorteio casual um número de 01 a 18. 76ª casa. Ms Luiz Gonzaga de Paula Tabela 4. etc. obtemos os seguintes números: 57 28 92 90 80 22 56 79 53 18 53 03 27 05 40 Então temos: a) para os meninos (de 01 a 54) 28 22 53 18 03 b) para as meninas (de 55 a 90) 57 90 80 56 4. 40ª casa. Nestes casos. pois as amostras nãoprobabilísticas não garantem a representatividade da população.2.2 . que são possíveis de se obter até completar o número de elementos da amostra. sendo 01 a 54 meninos e 55 a 90.4 F 36 3. Podemos. 6 . suponhamos que o número sorteado fosse 4 a amostra seria: 4ª casa. 4. Tomando na tabela de Números Aleatórios a 1ª e a 2ª colunas da esquerda. em que os entrevistados são acidentalmente escolhidos. etc.Métodos não Probabilísticos São amostragens em que há uma escolha deliberada dos elementos da amostra. Não é possível generalizar os resultados das pesquisas para a população.6 Total 90 Fonte: Autor amostra 5 4 9 Numeramos então os alunos de 01 a 90. usar o seguinte procedimento: como 900/50 = 18. o qual indicaria o primeiro elemento sorteado para a amostra. Exemplo: Suponhamos uma rua com 900 casas.1 . 58ª casa. de cima para baixo. Geralmente utilizada em pesquisas de opinião. 22ª casa. meninas e procedemos ao sorteio casual com urna ou tabela de números aleatórios.1. os prédios de uma rua. das quais desejamos obter uma amostra formada por 50 casas para uma pesquisa de opinião. a seleção dos elementos que constituirão a amostra pode ser feita por um sistema imposto pelo pesquisador.Prof. 4. São exemplos os prontuários médicos de um hospital.3 .1 Amostra proporcional estratificada alunos UNIVAS . neste caso.2009 Sexo População 10% M 54 5.Amostragem Sistemática: Quando os elementos da população já se acham ordenados.

Ele abrange três fases: 1ª .3 . Imagina-se que haja 47% de homens e 53% de mulheres na população. 3ª . Logo. uma amostra de 50 pessoas deverá ter 23 homens e 27 mulheres.Amostragem Intencional De acordo com determinado critério. ou presume. Exemplo: Numa pesquisa sobre preferência por determinado cosmético.Fixação de quotas para cada entrevistador a quem tocará a responsabilidade de selecionar os entrevistados. as faixas etárias etc. a renda média.2. de modo que a amostra total observada ou entrevistada contenha a proporção e cada classe tal como determinada na 2ª fase.2. 4. 7 .Determinação da proporção da população para cada característica. é escolhido intencionalmente um grupo de elementos que irão compor a amostra. A primeira tarefa é descobrir as proporções (porcentagens) dessas características na população.2 . Exemplo: Numa pesquisa sobre o "trabalho das mulheres na atualidade".Prof. presumidas ou estimadas. a habitação. Ms Luiz Gonzaga de Paula Exemplo: Pesquisas de opinião em praças públicas. O investigador se dirige intencionalmente a grupos de elementos dos quais deseja saber a opinião. 2ª . provavelmente se terá interesse em considerar: a divisão cidade e campo. 4. da população. serem relevantes para a característica a ser estudada.Classificação da população em termos de propriedades que se sabe. ruas de grandes cidades. A consideração de várias categorias exigirá uma composição amostral que atenda ao n determinado e às proporções populacionais estipuladas. o pesquisador se dirige a um grande salão de beleza e entrevista as pessoas que ali se encontram. Então o pesquisador receberá uma "quota" para entrevistar 27 mulheres. a idade dos filhos.Amostragem por Quotas Um dos métodos de amostragem mais comumente usados em levantamentos de mercado e em prévias eleitorais. o número de filhos. com base na constituição conhecidas.

Coluna indicadora – parte da tabela que especifica o conteúdo das linhas.Prof.) quando não temos os dados. Obs: O lado direito e esquerdo de uma tabela oficial deve ser aberto. • De acordo com a Resolução 886 do IBGE. do local ou da espécie. Três pontos (..SÉRIES ESTATÍSTICAS 5. respondendo às perguntas: O que?. Quando?. Ms Luiz Gonzaga de Paula 5 . Título – conjunto de informações. Linhas – retas horizontais imaginárias que facilitam a leitura. Notas e as Chamadas. 5. Cabeçalho – parte superior da tabela que especifica o conteúdo das colunas.1 . Zero (0) quando o valor é muito pequeno para ser expresso pela unidade utilizada.. Célula – espaço destinado a um só número.Tabela A Tabela resume um conjunto de dados dispostos segundo linhas e colunas de maneira sistemática.2 . 8 . Uma tabela compõe-se de: • • • • • • • Corpo – conjunto de linhas e colunas que contém informações sobre a variável em estudo. Onde? Localizado no corpo da tabela.Série Estatística: Série estatística é qualquer tabela que apresenta a distribuição de um conjunto de dados estatísticos em função da época. colocadas no rodapé da tabela. as mais completas possíveis. Um ponto de interrogação (?) quando temos dúvida quanto à exatidão de determinado valor. Fontes. nas casas ou células da tabela devemos colocar: Um traço horizontal (-) quando o valor é zero.

2. podemos classificá-la em: Histórica.2.Série histórica: Identifica-se pelo caráter variável do fator cronológico. Conforme Tabela 5. Ano 1994 1998 1999 Fonte: OMT Número de turistas 787117 1467922 1548571 5.1980 FILIAIS Norte Nordeste Sudeste Sul Centro Oeste Fonte: CODE INF/SESU/Ministério da Educação UNIDADES VENDIDAS 43 215 517 403 85 5.1 Entrada de turistas argentinos no Brasil – 1994-1999.2 . O local e a espécie (fenômeno) são elementos fixos. Também é chamada de espacial.Prof.3 O que fazer com o 13º salários (consumidores paulistanos – dezembro 2000).Série Geográfica: Apresenta como elemento variável o fator geográfico. o espaço e a espécie.2. A época e o fato (espécie) são elementos fixos. territorial ou de localização. Opções Pagar dívidas Fazer compras Poupar ou guardar Investir ou aplicar Gastar nas férias Outros Fonte: InformEstado 9 Valor percentual sobre o 13º salários 53% 14% 14% 7% 6% 6% .3 Série Específica: O caráter variável é apenas o fato ou espécie. 5.1 .2. Tabela 5. Tabela 5. geográfica e específica. Tabela 5. Ms Luiz Gonzaga de Paula Daí pode inferir que numa série estatística observamos a existência de três elementos: O tempo.2 Número de emissoras de rádio nas grandes regiões do Brasil . Conforme varie um dos elementos da série. Esta série também é chamada de temporal ou evolutiva. O local e o tempo permanecem constantes.

São geralmente utilizados sempre que os dizeres a serem escritos são extensos. 6. cujo objetivo é o de produzir. dispensando comentários explicativos adicionais. fornecendo elementos úteis à fase de análise dos dados.GRÁFICOS ESTATÍSTICOS São representações visuais dos dados estatísticos que devem corresponder. no investigador ou no público em geral.Prof. Principais tipos de gráficos: Diagramas. sem deixar de ser também informativos. dispostos verticalmente (em colunas) ou horizontalmente (em barras).1. Cartogramas e Pictogramas. mas nunca substituir as tabelas estatísticas. São os mais usados na representação de séries estatísticas. uma impressão mais rápida do fenômeno em estudo.1 Gráficos em barras horizontais ou em barras verticais (colunas). O gráfico estatístico é uma forma de apresentação dos dados estatísticos. É a representação de uma série por meio de retângulos.o gráfico deve possibilitar uma correta interpretação dos valores representativos do fenômeno em estudo. a) Gráficos em barras horizontais. São gráficos tipicamente expositivos. 10 . c) Gráficos de informação: São gráficos destinados principalmente ao público em geral. Clareza . Ms Luiz Gonzaga de Paula 6 . Os retângulos têm a mesma altura e os comprimentos são proporcionais aos respectivos dados. Gráficos de análise: São gráficos que se prestam melhor ao trabalho estatístico. A representação gráfica de um fenômeno deve obedecer a certos requisitos fundamentais para ser útil: a) b) Simplicidade – o gráfico deve ser destituído de detalhes de importância secundária. objetivando proporcionar uma visualização rápida e clara. Veracidade .o gráfico deve expressar a verdade sobre o fenômeno em estudo. Eles podem ser: 6.1 – Diagramas: São gráficos geométricos dispostos em duas dimensões.

1. quando 11 . • São freqüentemente usados para representação de séries cronológicas com um grande número de períodos de tempo. Ms Luiz Gonzaga de Paula b) Gráficos em barras verticais (colunas). Os retângulos têm a mesma base e as alturas são proporcionais aos respectivos dado. 6.Prof. As linhas são mais eficientes do que as colunas.2 Gráficos em linhas.

Fonte: Motores Elétricos WEG 12 . Ms Luiz Gonzaga de Paula existem intensas flutuações nas séries ou quando há necessidade de se representarem várias séries em um mesmo gráfico.1.3 Gráficos em setores. 6.C.Prof. Distribuição dos Em pregados da WEG Ltda por área de trabalho / m aio 2004 4% 8% 24% 16% APOIO TÉCNICO OPERAÇÃO TRANSPORTE ADMINISTRAÇÃO 48% DIRETORIA . (ou pizza) Também chamados de gráficos de Pizza. que fica dividido em tantos setores quantas são as partes.B. PRODUÇÃO DE CAFÉ NA REGIÃO DELTA 1994/2003 PRODUÇÃO (Milhões de Toneladas) 60 40 20 0 1 2 3 4 5 6 7 8 9 10 ANOS Fonte: I. O total é representado pelo círculo. È um gráfico particularmente apropriado para representar as divisões de um montante total.

Ms Luiz Gonzaga de Paula 6. pois sua forma é atraente e sugestiva. Este tipo de gráfico tem a vantagem de despertar a atenção do público leigo.3 .Pictogramas: São construídos a partir de figuras representativas da intensidade do fenômeno. Veja o exemplo abaixo: 13 . A desvantagem dos pictogramas é que apenas mostram uma visão geral do fenômeno. 6.Cartogramas: São ilustrações relativas a cartas geográficas (mapas).Prof. O objetivo desse gráfico é o de figurar os dados estatísticos diretamente relacionados com áreas geográficas ou políticas. e não de detalhes minuciosos.2 . Os símbolos devem ser auto-explicativos.

DISTRIBUIÇÕES DE FREQÜÊNCIA É um tipo de tabela que condensa uma coleção de dados conforme as freqüências (repetições de seus valores). 60 7. 50. Dados brutos: É uma relação de elementos que não foram numericamente organizados. 42 43. 57. 50. Ms Luiz Gonzaga de Paula 7 . 52. 41. 60.Prof. 46. 51. 58. 45. 41. 58.1 .46. 44. 42 43.representa as variáveis (valores da série) • fi . 14 . 41. 58.Distribuição de Freqüência sem Intervalos de Classe (Variável Discreta) É a simples condensação dos dados conforme as repetições de seus valores. 54. 60. 42. 41. 52. 60. 58. Exemplo: 41.representa a freqüência simples (repetição de valores). 42. Exemplo: Tabela 7.50. 46. 51 ROL: é uma seqüência ordenada dos dados brutos em ordem crescente ou decrescente. 54.1 .Distribuição de Freqüência sem Intervalos de Classe Dados Freqüência xi fi 41 3 42 2 43 1 44 1 45 1 46 2 50 2 51 1 52 1 54 1 57 1 58 2 60 2 Total 20 • xi . 41. 46. 50. 57. 44. Exemplo: 45. Colocamos na primeira coluna em ordem crescente apenas os valores distintos da série e na segunda coluna os valores das freqüências simples correspondentes.

29 . Usa a regra de Sturges para o cálculo de K: k ≅ 1 + 3. A construção da distribuição de freqüência com intervalos de classe (Variável Contínua) requer o conhecimento dos seguintes conceitos: Amplitude total da amostra (AA): é a diferença entre o valor máximo e o valor mínimo da amostra.3) Limites de classe: são os extremos de cada classe. que deve estar ligado à natureza dos dados.3 ⋅ log 20 . Método prático para construção de uma Distribuição de Freqüências com Intervalo de Classe 1º passo: Organize os dados brutos em um ROL.1) Classe: são os intervalos de variação da variável e é simbolizada por (i) e o número total de classes simbolizada por (K). k ≅ 1 + 3.2 . 44. O menor número é o limite inferior de classe (li) e o maior número.) No nosso exemplo: AA = 60 .) – X(min. 57.46. 42 43. 60 2º passo: Calcule a amplitude amostral (AA. esta vai depender na realidade de um julgamento pessoal.Distribuição de Freqüência Com Intervalos de Classe (Variável Contínua). Amplitude do intervalo de classe h h> AA K (7.3 ⋅ log n onde: K é o número de classe. AA = X(máx. 60. No nosso exemplo o rol é: 41. 41. K = 5. resulta K = 5 classes Obs: Qualquer regra para determinação do nº de classes não nos leva a uma decisão final. 58. 54. O símbolo |------representa um intervalo fechado à esquerda e aberto à direita.Prof. n é o número total de dados. Exemplo: em li |------.41 = 19 3º passo: Calcule o número de classes através da Regra de Sturges. 52. é mais racional efetuar o agrupamento dos valores em vários intervalos de classe.2) (7. 58.) (7. 50. 15 . 45.Li. Quando a variável for contínua ou o tamanho da amostra for muito elevado. 42. No nosso exemplo: n = 20 . Ms Luiz Gonzaga de Paula 7. limite superior de classe (Li). 46. 41. 50. 51.

(7. logo a primeira classe será representada por: 41 |------. Importante: Como h > . l3 = 49 e L3 = 53.6) Exercícios. Exemplo na tabela anterior AT = 61 .45. No exemplo: na 3º classe 49 |------. l i + Li 2 Exemplo: Calcular o ponto médio da terceira classe do exemplo anterior.1 . O menor número é o limite inferior de classe (li) e o maior número. devemos escolher um valor ligeiramente superior para haver K folga na última classe.61 5 Total 20 7. SOMATÓRIO: Revisão.49 = 4. K No nosso exemplo: AA/K = 19/5 = 3.41= 20.2 . AT = L(máx) – l(mín). O símbolo |------.57. limite superior de classe (Li).representa um intervalo fechado à esquerda e aberto à direita.53 1 53 |------.Elementos de uma distribuição de freqüência com intervalos de classe Limites de classe: são os extremos de cada classe.49 3 4 49 |------.5) Ponto médio de uma classe ( xi ): é o ponto que divide o intervalo de classe em duas partes iguais. O dado 53 não pertence à classe 3 e sim a classe 4 representada por 53 |------.Prof. onde: hi = Li – li..Distribuição de Freqüência com Intervalos de Classe Classe i 1 2 3 4 5 Intervalo de Freqüência classe fi 41 |------. Obs: AT sempre será maior que AA. 16 .. Amplitude total da distribuição (AT): é a diferença entre o limite superior da última classe e o limite inferior da primeira classe.4) Exemplo na tabela anterior h3 = 53 . As classes seguintes respeitarão o mesmo procedimento. x3 = (53+49)/2 = 51 xi = (7.57 57 |------. donde: 41 + h = 45..45 7 45 |------.2.. x3 = ( l3 + L3 )/2. Os primeiros elementos das classes seguintes sempre serão formados pelo último elemento da classe anterior. Ms Luiz Gonzaga de Paula 4º passo: calcula a amplitude do intervalo de classe h h> AA .8 AA Obs. Amplitude do intervalo de classe (hi): é obtida através da diferença entre o limite superior e inferior da classe e é simbolizada por hi.53. Utilizaremos em nosso exemplo h = 4 5º passo: monta a Tabela No nosso exemplo: o menor número da amostra = 41. Tabela 7. AT>AA (7.

3 – Freqüência Acumulada de uma Classe (Fi) É a soma da freqüência simples desta classe com as freqüências simples das classes anteriores.4.5) 8.1) 8.1 Freqüência simples (fi) são os valores que representam o número de dados de cada classe.. 17 .4 .1 . O somatório das freqüências simples é igual ao número total dos dados..Freqüência Acumulada Relativa de uma Classe (FRi) É a razão da freqüência acumulada desta classe.2. Freqüência acumulada (Fi) e Freqüência acumulada relativa (FRi).4) 8.. dividida pela freqüência total da distribuição: Fi FRi = ∑ fi (8.2) i 8. Montar uma tabela com as Freqüências relativas (fri).2 Freqüência simples relativa de uma classe (fri). São os valores das razões entre as freqüências simples de cada classe e a freqüência total da distribuição. A soma das freqüências simples relativa é igual a 1.3) (8.1 .Freqüência Acumulada Relativa percentual de uma Classe (FRi%) FRi% =FRi ..100 (8.100 8.Prof. fri % = fri .6) Exemplo: Dada à distribuição de freqüência das estaturas dos 40 alunos de uma faculdade.Freqüência simples relativa percentual de uma classe (fri %). ∑f i =n (8. Fi = f1+ f2 + . f ri = ∑f fi (8. +fi (8. Ms Luiz Gonzaga de Paula 8 – TIPOS DE FREQÜÊNCIAS 8.

600 0.275 0.00 21000.00 27606.800 0.Prof. classe 150 |-------.00 7380.00 39610.166 166 |-------.5 7.162 11 4 162 |-------.5 20.00 3250.00 17603.100 0.075 1.00 39512.00 18350.158 9 3 158 |-------.00 18300.5 60.00 22450.925 1.225 0.5 27.162 162 |-------.00 31452.2 Estaturas de 40 alunos com frequências relativas Classe i 1 2 3 4 5 6 Σ Estaturas (cm) Int.0 32.00 17319.00 12521.00 35700. 00 25300.00 43800.0 22.0 80.5 100 FRi 0.170 170 |-------.200 0.0 12.154 4 2 154 |-------.00 28000.00 14751.00 42130.166 8 5 166 |-------. Ms Luiz Gonzaga de Paula a) Dados: Tabela 8.00 7800.100 0.1 Estaturas de 40 alunos Classe ESTATURAS (cm) Freqüências i Intervalo de classe fi 1 150 |-------.170 5 6 170 |-------.00 6830.158 158 |-------.174 3 40 ------------------------- b) Solução Tabela 8.5 100 ------ Exercícios: 1º Um banco Americano selecionou ao acaso 25 contas de pessoas físicas em uma agência.0 92.000 ----- FRi% 10.00 22150. em determinado dia. obtendo os seguintes saldos em dólares: 52500.000 fri% 10.00 16323.325 0.125 0.00 Monte com estes dados uma distribuição de frequência com intervalo de classes (variável contínua).00 35600.154 154 |-------. 18 .174 ---------------- fi 4 9 11 8 5 3 40 Fi 4 13 24 32 37 40 --- Xi 152 156 160 164 168 172 ---- fri 0.

14 14 |-------.1400 3 10 1400 |-------.5 de distribuição de freqüência: Tabela 8.2000 25 4º .Prof.1600 4 1600 |-------.3 Idade (anos) Números de alunos X1 f1 17 3 18 18 19 17 8 20 21 4 40 3º – Construa a distribuição de freqüência para a série abaixo que representa uma amostra dos salários de 25 funcionários selecionados em uma empresa. conforme Tabela 8.3 Tabela 8.1200 2 2 6 1200 |-------.4 Tabela 8.10 10 |-------. Ms Luiz Gonzaga de Paula 2º – Construa a distribuição de freqüência para a série representativa da idade de 50 alunos do primeiro ano de Administração.18 18 |-------. dados na Tabela 8.24 fi 1 25 14 90 2 fri Fi FRi % 19 .1800 5 5 2 1800 |-------.complete a Tabela 8.22 22 |-------.5 completar os dados Casse i 1 2 3 4 5 Intervalo de classe 6 |-------.4 amostra dos salários de 25 Classe Salários R$ Números de funcionários i fi 1 1000 |-------.

as freqüências.Prof. A área de um histograma é proporcional à soma das freqüências simples.Polígono de freqüência: Polígono de freqüência é um gráfico em linha. Ms Luiz Gonzaga de Paula 9 . 9.Histograma: O histograma é formado por um conjunto de retângulos justapostos. representados em um sistema de coordenadas cartesianas. levantadas pelos pontos médios dos intervalos de classe.2 . cujas bases são os intervalos de classe e cujas alturas são valores proporcionais às freqüências simples correspondentes. Na linha horizontal (eixo das abscissas) colocamos os valores da variável e na linha vertical (eixo das ordenadas). Polígono de freqüência e Polígono de freqüência acumulada Para construção destes gráficos utilizamos o primeiro quadrante do sistema de eixos coordenados cartesianos ortogonais. sendo as freqüências marcadas sobre perpendiculares ao eixo horizontal.1 . 20 . 9.REPRESENTAÇÕES GRÁFICA DE UMA DISTRIBUIÇÃO Histograma.

A área do polígono de freqüência é igual à área do histograma. Esta curva nos dará uma noção de distribuição de freqüência da população. Ms Luiz Gonzaga de Paula Observações: 1. 3. Tabela 9. O histograma da amostra representa apenas a distribuição de freqüência da amostra e não da população.1. se imaginarmos o número n de elementos da amostra aumentando progressivamente.1 amostra dos salários de 25 funcionários classe Salários em R$ Números de funcionários i Int. Se considerarmos estes espaçamentos como sendo classes fictícias com freqüência zero e unirmos os pontos médios das bases superiores destes retângulos.1600 1600 |------. Tabela 9.1200 1200 |------. o número de classes iria aumentando progressivamente e a amplitude do intervalo de classe iria diminuindo.2000 Σ 2 6 10 5 2 25 21 . O histograma de um censo representa diretamente a distribuição de freqüência da população. no entanto. um polígono de freqüência para a série representativa de uma amostra dos salários de 25 funcionários selecionados em uma empresa. intencionalmente. 2. Deve deixar.Prof. obtemos o polígono de freqüência.1800 1800 |------. um espaço igual a um intervalo de classe no início e no final da representação gráfica do histograma. Exercícios: Construa uma distribuição de freqüência um histograma. o que transformaria o polígono de freqüência praticamente em uma curva polida de freqüência.1400 1400 |------. de classe fi 1 2 3 4 5 1000 |------.

Prof. Ms Luiz Gonzaga de Paula

Solução: a) Distribuição de freqüência: Tabela9.2 amostra dos salários de 25 funcionários Classe i 1 2 3 4 5 Salários em R$ Intervalo de classe 1000 |------- 1200 1200 |------- 1400 1400 |--------1600 1600 |------- 1800 1800 |------- 2000
Σ

fi 2 6 10 5 2 25

fri %

Fi

FRi %

Xi

b) Histograma:

c) Polígono de freqüência

22

Prof. Ms Luiz Gonzaga de Paula

9.3 – Gráfico de Pareto
O diagrama de Pareto é uma forma especial do gráfico de barras verticais, que dispõe os itens analisados desde o mais freqüente até o menos freqüente. Tem como objetivo estabelecer prioridades na tomada de decisão, a partir de uma abordagem estatística.

9.3.1-Análise de Pareto
No campo da qualidade o engenheiro Juran aplicou esse princípio demonstrando que alguns poucos fatores são responsáveis pelas maiorias dos efeitos observados. Estabeleceu assim, um método que permite classificar os problemas da qualidade identificando os poucos problemas que são vitais e diferenciando-os dos muitos que são triviais. Esse método foi por ele denominado Análise de Pareto. A forma gráfica de apresentar os dados estudados por esse método focou conhecida como gráfico de Pareto ou ainda Diagrama de Pareto. O gráfico de Pareto é usado sempre que for preciso ressaltar a importância relativa entre problemas ou condições, no sentido de: a) Escolher o ponto de partida para a solução de problemas; b) Avaliar o progresso de um processo; c) Identificar a causa básica de um problema.

9.3.2 – Passos para construir o diagrama de Pareto
1- Defina o objetivo da análise (por exemplo: índice de rejeições). 2- Estratifique o objeto a analisar (índice de rejeições: por turno; por tipo de defeito; por máquina; por operador; por custo). 3- Colete os dados, utilizando uma folha de verificação. 4- Classifique cada item. 5- Reorganize os dados em ordem decrescente. 6- Calcula a Freqüência Relativa Acumulada percentual (FRi) 7- Construa o gráfico, após determinar as escalas do eixo horizontal e vertical. 8- Construa a curva da porcentagem acumulada. Ela oferece uma visão mais clara da relação entre as contribuições individuais de cada um dos fatores
23

Prof. Ms Luiz Gonzaga de Paula

Exemplo: Análise de não Conformidade de Produto - construir um gráfico de Pareto para os defeitos encontrados nos componentes de um conjunto durante inspeção de qualidade no processo da montagem. Componentes do conjunto ABC Quantidade de peças produzidas: 1000 Roteiro para construção do gráfico de Pareto 1º Dadas bruto - coleta de dados, dos componentes com defeitos: Alinhamento 12; solda 21; parafuso solto 68; junção 15; sujeira 41; riscos 29; trinca 10; rebarba 06; bolha 01 2º ROL: organização dos dados em ordem decrescente: 68; 41; 29; 21; 15; 12; 10; 06; 01 3º construção da Tabela de distribuição de freqüência: Tabela 9.3 de distribuição de freqüências das peças com defeitos Tipo de defeito Freqüência Parafuso solto Sujeira Riscos Solda Junção Alinhamento Trinca Rebarba Bolha Total 68 41 29 21 15 12 10 06 01 202 Freqüência Freqüência Relativa Acumulada Classificação % % 34% 34% 1º 20% 54% 2º 14% 68% 3º 10% 78% 4º 07% 85% 5º 06% 91% 6º 05% 96% 7º 03% 99% 8º 01% 100% 9º 100% --

24

Motivos Rapidez para receber pedido Aparência do recinto Qualidade do café Opções de bebidas Presteza dos funcionários Total Tabela 9. Ms Luiz Gonzaga de Paula 4º Desenho do gráfico de Pareto GRÁFICO DE PARETO Exercício: construa um gráfico de Pareto para a distribuição de freqüências da Tabela 9.4 Frequência de respostas 22 10 19 70 5 126 Porcentagem 17 8 15 56 4 100 Ordem 2º 4º 3º 1º 5º 25 .4.Prof.

1 . As medidas de tendência central mais utilizada são: A média aritmética. 10. Exemplo: Determinar a média aritmética simples dos valores: 10.2) 26 .Prof. 18 e 12 x= 10 + 14 + 13 + 15 + 16 + 18 + 12 = 14 14 10. 13. • 10. determinamos a média aritmética simples. Ms Luiz Gonzaga de Paula 10 – MEDIDAS DE TENDÊNCIA CENTRAL São as estatísticas que representam uma série de dados orientando-nos quanto à posição da distribuição em relação ao eixo horizontal do gráfico da curva de freqüência. • A medida de tendência central procura estabelecer um número no eixo horizontal em torno do qual a série se concentra. dada pela seguinte fórmula: x= ∑x ⋅ f ∑f i i i (10. 14. 15.Média aritmética simples Média aritmética simples é igual ao quociente entre a soma dos valores das variáveis e o número total de variáveis.Média Aritmética: A média aritmética é designada por x .1. elas funcionam como fatores de ponderação. a moda e a mediana.1 . o que nos leva a calcular a média aritmética ponderada. x= ∑x n i (10. • Dados agrupados as frequências Quando os dados estão agrupados as freqüências.Média aritmética ponderada É uma média aritmética em que cada valor se encontra ponderado a um fator de ponderação. • Dados não agrupados as freqüências Quando desejamos conhecer a média dos dados não-agrupados as freqüências.1) Onde: xi são os valores das variáveis e n o número total de variáveis.1. 16.2 .

Ms Luiz Gonzaga de Paula a) Média aritmética ponderada em dados agrupados sem intervalos de classe Dispositivo prático: abre na tabela. f i 2 1 2 5 4 20 6 3 18 8 2 16 56 Σ 10 4º .substitui na formula os valores: x= ∑x ⋅ f ∑f i i i = 56 = 5.1 xi f i 2 1 5 4 6 3 8 2 Σ 10 Solução: 1º abre na tabela. 27 .2 x i f i xi . isto é.1 Tabela 10. 5. uma coluna correspondente aos produtos xi ⋅ f i Exemplos: Determinar a média da distribuição.Prof. considera-se a aproximação do resultado.6 10 Observação: Interpretação: O valor médio da série é 5. número de alunos.6. 6 alunos. da Tabela 10. por exemplo.6 é o ponto de concentração dos valores da série. por exemplo. Quando a variável for discreta. a coluna correspondente aos produtos xi ⋅ f i 2º efetua os produtos xi ⋅ f i 3º calcula o somatório da coluna xi ⋅ f i : Tabela 10.

158 158 |------.abre na tabela. de classe 150 |------.174 Σ fi 04 09 11 08 05 03 40 1 2 3 4 5 6 Solução: 1º .158 158 |------.abre na tabela.170 170 |------. a coluna correspondente aos produtos xi ⋅ f i e efetua os produtos xi ⋅ f i 3º .calcula o somatório das colunas f i e xi ⋅ f i .166 166 |------. temos: Tabela 10.174 Σ 04 09 11 08 05 03 40 xi 152 156 160 164 168 172 xi ⋅ f i 608 1404 1760 1312 840 516 6440 4º .166 166 |------.162 162 |------.e substitui na fórmula os valores: x= ∑x ⋅ f ∑f i i i = 6440 = 161 40 28 .154 154 |------.Prof.3 Classes i Int. Ms Luiz Gonzaga de Paula b) Média aritmética ponderada em dados agrupados com intervalos de classe: Dispositivo prático: Abre na tabela.3: Tabela 10. uma coluna correspondente a xi (pontos médios das classes) e outra correspondente aos produtos xi ⋅ f i Exemplos: Determinar a média da distribuição da Tabela 10.4 Classes Int.154 154 |------. de classe fi i 1 2 3 4 5 6 150 |------.170 170 |------. uma coluna correspondente a xi (pontos médios das classes) xi = li + Li 2 2º .162 162 |------.

5 . 12 } a moda é igual a 10.2 – Moda (Mo) Moda é o valor que ocorre com maior freqüência em uma série de valores. então. 11 . Exemplo: {2 . 10 . 8 . 4 . Ms Luiz Gonzaga de Paula 10. 10 . • Desse modo. 4 .Prof. procurar o valor que mais se repete. que a série tem dois ou mais valores modais. A série é bimodal. Exemplo: {3 .Em outros casos. 4 . 8 . 7 . 10. 12} não apresenta moda. é possível determinar imediatamente a moda: basta fixar o valor da variável de maior freqüência. Exemplo: Qual a temperatura mais comum medida na distribuição de freqüência da Tabela 10.A Moda quando os dados estão agrupados sem intervalos de classes Uma vez agrupados os dados.5 Freqüência Temperaturas fi 10 °C 3 11 °C 9 12 °C 12 13 °C 6 Resposta: 12º C é a temperatura modal. 9 . 10.2.2. isto é. de acordo com definição. isto é. Esse valor é denominado de valor modal. A série é amodal. Dizemos. o salário modal dos empregados de uma fábrica é o salário mais comum. 7 . 10 .1 .5 Tabela 10. 3 . • Há séries nas quais não exista valor modal. 6 . • . 7 . 9 } apresenta duas modas: 4 e 7. nas quais nenhum valor apareça mais vezes que outros. o salário recebido pelo maior número de empregados dessa fábrica. pois é a de maior freqüência. Exemplo: Na série { 7 . 8 . pode haver dois ou mais valores de concentração. 5 . 29 .2 . 10 .Moda quando os dados não estão agrupados • A moda é facilmente reconhecida: basta.

30 . O método mais elaborado para o cálculo do valor modal é o que utiliza fórmula de Czuber: M O = l* + Onde: D1 ⋅ h* D1 + D2 (10. Pela definição. neste caso.286 M O = 20 + Obs: 3 ⋅ 10 = 24.3 .3) M O = moda l * = limite inferior da classe modal D1 = diferença entre a freqüência simples da classe modal e a freqüência simples da classe anterior à classe modal D2 = diferença entre a freqüência simples da classe modal e a freqüência simples da classe posterior à classe modal h * = amplitude da classe modal Exemplo: Calcular a moda utilizando a fórmula de Czuber para a distribuição da Tabela 10. Já a média aritmética é a medida de posição que possui a maior estabilidade.30 6 4 30 |------.286 3+ 4 A moda é utilizada quando desejamos obter uma medida rápida e aproximada de posição ou quando a medida de posição deva ser o valor mais típico da distribuição.Prof. Ms Luiz Gonzaga de Paula 10. D2 = 6 − 2 = 4 .2. podemos afirmar que a moda. l * = 20 .10 1 2 10 |------.40 2 Solução: A classe modal é a terceira classe. é o valor dominante que está compreendido entre os limites da classe modal. h * = 30 − 20 = 10 e MO = 24. portanto.6 Tabela 10.A Moda quando os dados estão agrupados COM intervalos de classes A classe que apresenta a maior freqüência é denominada classe modal.6 Classe Intervalo de classe Freqüência fi 1 0 |------. a moda será: D1 = 6 − 3 = 3 .20 3 3 20 |------.

portanto o número de elementos do Rol é impar. 0.Prof. 15. 15}. 5.3. A mediana é convencionada como sendo a média dos valores que ocupam estas 2 2 posições centrais.Passo: Determina a posição do termo central. 4. 0.  2  Exemplo: Determinar a mediana da série: X: {5. 6} 31 . e o valor do elemento que ocupa esta posição é a mediana. 2. º  7 +1 º 3º .Passo determina o número de elementos do Rol. Exemplo: Determinar a mediana da série: X: {1. 10. 5.Passo verifique se o número de elementos é impar ou par. 6} 1º Passo . 3. 2º .Passo ordena os elementos da série. logo a Md = 9. 13.Passo: Determina o número de elementos do Rol: n= 7 elementos. 1. 10} 1º . 10. X: {2.ordena a série {0. 2º .Passo: Ordenando os elementos da série. 6. 4.1 . 3. 6. obtendo o Rol.Cálculo da mediana em dados não-agrupados (dados brutos) 1º . 9.3 – Mediana (Md) A mediana é um valor real que separa o rol em duas partes deixando à sua esquerda o mesmo número de elementos que a sua direita. 13. 0. 5.   = 4 posição  2  O valor que ocupa a 4º posição e divide a série em duas partes iguais é igual a 9. 1. 9. é o valor situado de tal forma no conjunto que o separa em dois subconjuntos de mesmo número de elementos. dispostos segundo uma ordem (crescente ou decrescente). 2. obtemos o Rol. 3. 3º . a) Se o número de elementos for impar o Rol admite apenas um elemento central que ocupa a  n +1 posição   . 1. Ms Luiz Gonzaga de Paula 10. b) Se o número de elementos for par o Rol admite dois elementos centrais que ocupam as posições n n   e   + 1 . Portanto a mediana de um conjunto de valores. 3. 2.

pelos valores extremos). a média do segundo conjunto de valores é maior do que a do primeiro. ou seja.3. 7.7 Variável Freqüência xi fi 2 1 5 4 8 10 10 6 12 2 ∑ f i =23 32 . portanto o número de elementos do Rol é par. 15} a média = 10 e a mediana = 10 Em {5. 65} a média = 20 e a mediana = 10 Isto é. 7. nunca haverá coincidência da mediana com um dos elementos da série. • 10. 10. • Quando o número de elementos da série estatística for par. Vejamos: Em {5. 13. Exemplo: a) Determinar a mediana da série da Tabela 10. A mediana será sempre a média aritmética dos 2 elementos centrais da série. • Em uma série a mediana. a média e a moda não têm. e muito. haverá coincidência da mediana com um dos elementos da série. Md = 2. o mesmo valor. Ms Luiz Gonzaga de Paula 2º . basta verificar se ∑ f i da distribuição é um número par ou impar e em seguida aplicar o mesmo raciocínio do caso anterior. por influência dos valores extremos. • A mediana depende da posição e não dos valores dos elementos na série ordenada. Assim. Os valores que ocupam estas posições são: 5º termo = 2 e 6º termo = 3. eles já estão naturalmente ordenados.5  2  Notas: • Quando o número de elementos da série estatística for ímpar.Cálculo da mediana em dados agrupados sem intervalos de classes (Variável Discreta) Se os dados estão agrupados sem intervalos de classes. ao passo que a mediana permanece a mesma. 13. 10. 3º .5 .Passo: Determina o número de elementos do Rol: n=10 elementos. necessariamente. portanto a mediana será:  2 +3 Md =   = 2. Essa é uma diferença marcante entre a mediana e média (que se deixa influenciar.2 .Prof.Passo: Determina as posições dos dois termos centrais: 10/2=5º termo e (10/2 + 1)= 6º termo.7 Tabela 10.

9 Tabela 10. a série admite dois elementos centrais que ocupa as posições: 32/2= 16º e 17º.8 Variável Freqüência Freqüência acumulada xi fi Fi 2 1 1 4 5 5 8 10 15 ← Cl Md 10 6 21 12 2 23 23 E em seguida identifica a classe mediana que é a freqüência acumulada imediatamente superior à 12º posição. para localizar esta posição. que é ímpar. Ms Luiz Gonzaga de Paula Solução: O número de elementos da série é n= ∑f i =23. que é par. ou seja. calcula  2  a freqüência acumulada da distribuição da Tabela 10. portanto. Md = 8 Exemplo: b) Determinar a mediana da Tabela 10.10 Variável Freqüência Freqüência acumulada xi fi Fi 0 3 3 1 5 8 2 8 16 ← Cl Md 3 10 26 ← Cl Md 5 6 32 32 85 33 . Tabela 10.9 Variável Freqüência xi fi 0 3 1 5 2 8 3 10 5 6 ∑ f i =32 Solução: O número de elementos da série é n= ∑ f i =32. A mediana será o valor da variável que corresponde à classe mediana.Prof. calcula a freqüência acumulada da distribuição. a série admite  23 + 1  º apenas um elemento central que ocupa a posição   = 12 .8 Tabela 10. para localizar estas posições. portanto.6 Tabela 10.

Existe uma fórmula prática para o cálculo da mediana em dados agrupados com intervalos de classes.70 5 6 70 |-----------. f∗ é a freqüência simples da classe mediana. Ms Luiz Gonzaga de Paula E em seguida identifica as classes medianas que são as freqüências acumuladas imediatamente superiores às posições 16º e 17º. Esta classe é aquela correspondente a freqüência acumulada  ∑ fi   .Prof. denominada classe mediana.54 4 2 54 |-----------. devemos primeiramente determinar a classe na qual se acha à mediana. que é a seguinte:    Md = l ∗ +  ∑ 2 fi  − F ( ant .58 9 3 58 |-----------. A mediana será a média dos valores das variáveis que correspondem às classes medianas.62 11 4 62 |-----------. o problema consiste em determinar o ponto do intervalo de classe em que está compreendida a mediana. de classe Freqüência fi 1 50 |-----------.)  h ∗   ∗ f (10.5  2  10. F( ant . admitindo-se que os valores se distribuem uniformemente em todo o intervalo de classe. feito isto.74 3 40 Solução: Segue os seguintes passos: 34 .Cálculo da mediana em dados agrupados com intervalos de classes (Variável Contínua) Neste caso.4) Onde: l ∗ é o limite inferior da classe mediana. ou seja:  2 +3 Md =   = 2. faz uma interpolação entre os limites inferior e imediatamente superior a   2    superior da classe mediana.) é a freqüência acumulada da classe anterior à classe mediana. Exemplo: Determinar a mediana da Tabela 10. Portanto.66 8 5 66 |-----------.3.3 .11 Classe Int.7 Tabela 10. h ∗ é a amplitude do intervalo da classe mediana.

4 = 60. obtemos: Md = 58 + (20 − 7).70 70 |-----------.54 54 |-----------.58 58 |-----------. F( ant . f ∗ = 11. h ∗ = 62 – 58 = 4. Quando a variável em estudo é salário.74 -------------------------- 2º) Calculamos ∑2 = fi 40 = 20 2 3º) Marcamos a classe correspondente à freqüência acumulada imediatamente superior à ∑2.62 62 |-----------. de classe 1 2 3 4 5 6 50 |-----------. 35 . no exemplo (3º classe). fi Tal classe será a classe mediana.) = 13. Substituindo esses valores na fórmula. no exemplo: l ∗ = 58.66 66 |-----------. 4º) Calculamos a Mediana pela fórmula prática (10. Tabela 10.Prof.1). Ms Luiz Gonzaga de Paula 1º) Determinamos as freqüências acumuladas .12 Freqüência Freqüência acumulada fi Fi 4 9 11 8 5 3 40 4 13 24 32 37 40 Classe Int. Quando há valores extremos que afetam de maneira acentuada a média aritmética.55 11 Emprego da Mediana • • • Quando desejamos obter o ponto que divide a distribuição em duas partes iguais.

cada parte ficará com 25 % de seus elementos. Os valores dos elementos que separam estes grupos são chamados quintis. que indicaremos por K1. Ms Luiz Gonzaga de Paula 11. O terceiro quartil. que indicaremos por Q3. Além da mediana. separa a série ordenada deixando 50 % de seus valores à esquerda e 50 % de seus valores à direita.MEDIDAS SEPARATRIZES Medidas Separatrizes são números reais que dividem a série ordenada de dados em partes que contem a mesma quantidade de elementos da série. Assim: O primeiro quartil. separa a série ordenada deixando 60% de seus valores à esquerda e 40 % de seus valores à direita. Observe que o segundo quartil é igual à mediana da série. 36 . O quarto quintil. que indicaremos por Q1. O terceiro quintil. cada parte ficará com 20 % de seus elementos. quintis. que indicaremos por Q2. é também uma medida separatriz. separa a série ordenada deixando 40% de seus valores à esquerda e 60 % de seus valores à direita. decis e percentis. que indicaremos por K3. Desta forma. separa a série ordenada deixando 75 % de seus valores à esquerda e 25 % de seus valores à direita. O segundo quintil. que indicaremos por K4. O segundo quartil. separa a série ordenada deixando 25% de seus valores à esquerda e 75 % de seus valores à direita. cada uma delas contendo 50 % dos valores da série. 11. a mediana que divide a série ordenada de dados em duas partes iguais.1 – Quartis Se dividirmos a série ordenada em quatro partes iguais. destacaremos outras medidas separatrizes que são: quartis. Os valores dos elementos que separam estes grupos são chamados quartis. separa a série ordenada deixando 20% de seus valores à esquerda e 80 % de seus valores à direita. Assim: O primeiro quintil. que indicaremos por K2. separa a série ordenada deixando 80% de seus valores à esquerda e 20 % de seus valores à direita. 11.Prof.2 – Quintis Se dividirmos a série ordenada em cinco partes iguais.

Observe que o quinto decil é igual à mediana e o segundo quartil da série. Os valores dos elementos que separam estes grupos são chamados percentis. O quarto decil. O quinto decil.Prof. separa a série ordenada deixando 20% de seus valores à esquerda e 80 % de seus valores à direita.5 – Cálculo das medidas separatrizes Se observarmos que os quartis. 11. separa a série ordenada deixando 1% de seus valores à esquerda e 99 % de seus valores à direita. De modo análogo são definidos os outros decis. Assim: O primeiro decil.. da seguinte forma: Tabela 11. Ms Luiz Gonzaga de Paula 11. O terceiro decil. Os valores dos elementos que separam estes grupos são chamados decis. cada parte ficará com 10 % de seus elementos. separa a série ordenada deixando 50% de seus valores à esquerda e 50 % de seus valores à direita. então basta estabelecermos processos de cálculos somente para os percentis. 11. De modo análogo são definidos os outros percentis.4 – Percentis Se dividirmos a série ordenada em cem partes iguais. porque todas as outras medidas separatrizes podem ser identificadas como percentis.. Assim. que indicaremos por D1. cada parte ficará com 1 % de seus elementos. que indicaremos por D2. separa a série ordenada deixando 30% de seus valores à esquerda e 70 % de seus valores à direita. separa a série ordenada deixando 40% de seus valores à esquerda e 60 % de seus valores à direita. D9 = P90 37 . separa a série ordenada deixando 60% de seus valores à esquerda e 40 % de seus valores à direita. que indicaremos por P1. que indicaremos por D6. que indicaremos por D4. O segundo decil. O primeiro percentil. O sexto decil. que indicaremos por D3.3 – Decis Se dividirmos a série ordenada em dez partes iguais. que indicaremos por D5. separa a série ordenada deixando 10% de seus valores à esquerda e 90 % de seus valores à direita. quintis e decis são múltiplos dos percentis.1 Quartis Quintis Decis Q1 = P25 K1 = P20 Q2 = P50 K2 = P40 Q3 = P75 K3 = P60 K4 = P80 D1 = P10 D2 = P20 D3 = P30 D4 = P40 .

1)  i ⋅ ∑ fi   − Fant  ⋅ h ∗  100   Pi = l ∗ +  ∗ f Onde: Pi é o percentil i ( i = 1. F( ant .151 151|-----------..) é a freqüência acumulada da classe anterior à classe que contem o percentil i.2 Classe Int. Ms Luiz Gonzaga de Paula Os quartis. 3.163 163|-----------.. Roteiro de cálculo: Exemplo: Calcule o primeiro. bastando substituir na equação (10. 2.1) f ∗ é a freqüência simples da classe que contem o percentil i.2 Tabela 11. o segundo e o terceiro quartis da distribuição da Tabela 11.181 181|-----------.157 157|-----------. quintis.. decis e percentis são medidas separatrizes importantes. usamos a mesma técnica de cálculo da mediana.Prof..... ∑f i é o somatório das freqüência simples.. Quando os dados são agrupados intervalo de classe. (11.1) pela equação (11. de classe 1 2 3 4 5 6 7 145|-----------.187 Freqüência fi 10 9 8 6 3 3 1 40 Solução: a) Cálculo do Q1 Segue os seguintes passos: 38 ..99) l ∗ é o limite inferior da classe que contem o percentil i h ∗ é a amplitude do intervalo da classe que contem o percentil i.175 175|-----------. utilizaremos estas medidas apena para variáveis contínuas.169 169|-----------.

175 6 175|-----------. Q1 = P25 3º Passo – Calcule a posição p = i ⋅ ∑ fi 100 . denominada classe de Pi .163 4 163|-----------. basta assumir o valor do limite superior da classe Pi . Tabela 11.3 Freqüência Freqüência acumulada Classe Int. p= 25 ⋅ 40 = 10 100 4º Passo – Identifica a classe correspondente à freqüência acumulada igual ou imediatamente superior à posição p. e substituindo na fórmula (11. i ⋅ ∑ fi 100 = 10. Ms Luiz Gonzaga de Paula 1º Passo – calcula as frequências acumuladas.169 6 33 5 3 36 169|-----------. A classe que contem a posição Pi na distribuição é a 1º classe. 2º Passo – Identifica a medida separatriz: Q2 = P50 39 . de classe fi Fi 1 145|-----------. isto for igual à freqüência acumulada. Pi .187 1 40 40 2º Passo – Identifica a medida separatriz que queremos obter com o percentil correspondente.Prof.157 2 9 19 3 8 27 157|-----------. l ∗ =145. identificando os valores. f ∗ = 10. quando isto ocorrer não há 100 necessidade de fazer o cálculo. h ∗ =151-145 = 6.181 3 39 7 181|-----------.1). F( ant .151 10 10 151|-----------. 5º Passo – Calcula P25 . b) Cálculo do Q2 ocorre quando a posição p = i ⋅ ∑ fi 1º Passo – calcula as freqüências acumuladas (já foram calculadas no exemplo anterior).) = 0 Obtemos: P25 = Q1 = 145 + (10 − 0) ⋅ 6 = 145 + 6 = 151 10 Importante: Observe que o valor calculado para Q1 é igual ao limite superior da classe Pi .

p = (75 * 40) / 100 = 30 100 4º Passo – Identifica a classe: A classe que contem a posição Pi na distribuição é a 4º classe. i ⋅ ∑ fi 5º Passo – Calcula P50. Ms Luiz Gonzaga de Paula 3º Passo – Calcule a posição p = . identificando os valores.Prof. 5º Passo – Calcula P75.) = 19 P50 = Q2 = 157 + c) Cálculo de Q3 (20 − 19). e substituindo na fórmula: l ∗ =163. e substituindo na fórmula: l ∗ =157. as medidas separatrizes. Exercícios: 40 .75 = 157. podemos determinar. acumulada percentual. F( ant . construir o polígono de freqüência acumulada percentual para a distribuição do exercício anterior. identificando os valores. i ⋅ ∑ fi 100 = 30.6 = 157 + 0.) = 27 (30 − 27) ⋅ 6 = 163 + 3 = 166 6 P75 = Q3 = 163 + Observação: Construindo o polígono de frequência geometricamente. i ⋅ ∑ fi 100 = 20. h ∗ =163-157 = 6. Fica como exercícios. f ∗ = 8. h ∗ =169-163 = 6. p = (50 * 40) / 100 = 20 100 4º Passo – Identifica a classe: A classe que contem a posição Pi na distribuição é a 3º classe. 2º Passo – Identifica a medida separatriz: Q3 = P75 i ⋅ ∑ fi 3º Passo – Calcule a posição p = . f ∗ = 6.75 8 1º Passo – frequência acumulada: já calculada no exemplo anterior. F( ant .

1 . 75} AT = 75 – 35 = 40 41 . 50. Ms Luiz Gonzaga de Paula 12 – MEDIDAS DE DISPERSÃO Dispersão: É a maior ou menor diversificação dos valores de uma variável em torno da média ou mediana.Prof. • A média ainda que considerada como um número que tem a faculdade de representar uma série de valores não pode por si mesma.1 – Amplitude Total (AT) a) Dados não agrupados A amplitude total é a diferença entre o maior e o menor valor da série: AT= X(máx. a Estatística recorre às medidas de dispersão absoluta. 70 . 70} Y = {68. variância e desvio padrão 12. já que todos os valores são iguais à média.1. 50. 70. 120. 70. destacar o grau de homogeneidade ou heterogeneidade que existe entre os valores que compõem o conjunto. As principais medidas de dispersão absoluta são: Amplitude total. 46. ressaltando a maior ou menor dispersão entre esses valores e a sua medida de posição. pois há menor diversificação entre cada um de seus valores e a média representativa.71 . Concluímos que o conjunto X apresenta dispersão nula e que o conjunto Y apresenta uma dispersão menor do que a do conjunto Z. 70. é fácil notar que o conjunto X é mais homogêneo que os conjuntos Y e Z.) Exemplo: X: {35. Entretanto. 12. Y e Z: X = {70. é mais homogêneo que o conjunto Z. obtemos: X = 350 = 70 5 Notamos que os três conjuntos apresentam a mesma média aritmética.) – X(mín. por sua vez. 65.Medidas de Dispersão Absoluta Para qualificar os valores de uma dada variável. 42.72} Z = {5. 69. 15. tomado como ponto de comparação. 16} Calculando a média aritmética de cada conjunto. Consideremos os seguintes conjuntos de valores das variáveis X. O conjunto Y.

) – l (mín.) Exemplo: Tabela 12.2 Classe Int.181 181|-----------.1 Variável Frequência xi fi 2 3 5 3 5 8 10 7 8 6 AT= 8 – 2 = 6 c) Dados agrupados com intervalos de classe A amplitude total é a diferença entre o limite superior da última classe e o limite inferior da primeira classe: AT= L(máx. descuidando do conjunto de valores intermediários. Ms Luiz Gonzaga de Paula b) Dados agrupados sem intervalos de classe A amplitude total é a diferença entre o maior e o menor valor da distribuição: Exemplo: Tabela 12.151 151|-----------.187 Freqüência fi 10 9 8 6 3 3 1 40 AT = 187 – 145 = 42 Observação: A amplitude total é a única medida de dispersão que não tem na média o ponto de referência.175 175|-----------.169 169|-----------.163 163|-----------. de classe 1 2 3 4 5 6 7 145|-----------. Desta forma a amplitude total é apenas uma indicação aproximada da dispersão.Prof.157 157|-----------. Tem o inconveniente de só levar em conta os dois valores extremos da série. 42 .

pois levam em consideração a totalidade dos valores da variável em estudo.3 – Cálculo da Variância e Desvio Padrão 1º caso – Dados brutos a) Se os dados representam uma População.1. porém é extremamente importante na inferência estatística e em combinações de amostras. 12. 12.Prof. a variância é calculada pela fórmula: σ 2 ∑ (x − x) = i 2 n (12.1 Variância A variância baseia-se nos desvios em torno da média aritmética.1.2 Desvio padrão O desvio padrão é definido como a raiz quadrada positiva da variância.2. O uso de uma ou outra dependerá da finalidade que se tenha em vista. 5. Ms Luiz Gonzaga de Paula 12.2 . Quando os dados representam uma amostra à variância e denotada por s 2 e o desvio padrão por s .Variância e Desvio Padrão Introdução: Como vimos a amplitude total é apenas uma indicação aproximada da dispersão por deixar influenciar pelos valores extremos.1. o que faz delas índices de variabilidade bastante estáveis. já a Variância e Desvio Padrão são medidas que fogem a essa falha. 12. por isso mesmo. para as medidas da variância e do desvio padrão deve-se lavar em consideração o fato de a sequência de dados representarem toda uma população ou apenas uma amostra de uma população. Tanto o desvio padrão como a variância são usados como medidas de dispersão ou variabilidade.1. A variância é uma medida que tem pouca utilidade na estatística descritiva. 5 1º passo calcula a média x= ∑x n i = 4 + 5 + 8 + 5 22 = = 5. 8.2. os mais importantes e geralmente empregados.5 4 4 43 . porém determinando a média aritmética dos quadrados dos desvios obtida entre os elementos da série e a sua média. Em particular.2. Com as seguintes notações: Quando os dados representam uma população à variância e denotada por σ 2 e o desvio padrão por σ .1) Exemplo: Calcular Variância e Desvio Padrão da seqüência: x: 4.

5)2 = 0.25 (8 – 5.25+0. a variância é calculada pela fórmula: s 2 ∑ (x − x) = i 2 n −1 (12.3) E o desvio padrão é igual à raiz quadrada positiva da variância: σ= ∑ (x − x) ∑f i i 2 ⋅ fi (12.5 unidades b) Se os dados representam uma População. obtém-se: 2.73 unidades 2º caso – Dados agrupados.1) da variância vem: 9 = 2.25 (5 – 5.25 n 4 5º passo: calcula Desvio Padrão.25+0. a) Se a Variável é representativa de uma População.4) 44 . que é a raiz quadrada positiva da variância: σ2 = ∑ (x i − x)2 = σ = 2.3) σ 2 ∑ (x − x) = ∑f i i 2 ⋅ fi (12.25+6.25= 9 4º passo substituindo esses valores na fórmula (12.25 3º passo soma-se estes valores.2) Observação: a única diferença entre a fórmula da variância populacional ( σ 2 ) e a fórmula da variância amostral ( s 2 ) é o denominador.25 (5– 5.25 = 1. Assim: s E o desvio padrão 2 ∑ (x = i − x)2 n −1 = 9 =3 4 −1 s = 3 = 1.5)2 = 0. Ms Luiz Gonzaga de Paula 2º passo calcula o quadrado de cada desvio em relação à média ( xi − x ) 2 (4 – 5.5)2 = 6.5)2 = 2. então a variância é calculada pela fórmula (12.Prof.

6) Exemplo 1: Variável Discreta Calcule a variância e o desvio padrão da distribuição da Tabela 12. então a variância é calculada pela fórmula (12.65 20 45 . Tabela 12.5) s2 = ∑ (x − x) ⋅ f ∑ f −1 2 i i i (12. a coluna correspondente aos produtos xi ⋅ f i Efetua os produtos xi ⋅ f i Calcula o somatório da coluna xi ⋅ f i : Tabela 12.3.3 Variável Freqüência xi fi 2 3 3 5 4 8 5 4 --20 1º passo: calcula a média da distribuição: • • • Abre na Tabela.Prof. Ms Luiz Gonzaga de Paula b) Se a Variável é representativa de uma de uma amostra.4 Variável Freqüência xi ⋅ f i xi fi 6 2 3 15 3 5 32 4 8 20 5 4 73 20 • Calcula a média: x = ∑x ⋅ f ∑f i i i = 73 = 3. representativa de uma população.5) E o desvio padrão é igual à raiz quadrada positiva da variância: s= ∑ (x − x) ⋅ f ∑ f −1 2 i i i (12.

1125 0.55 18.9275 20 4º passo: calcula o desvio padrão populacional σ = 0. Tabela 12.55 6 15 32 20 73 3º passo: calcula a variância populacional σ 2 ∑ (x − x) = ∑f i i 2 ⋅ fi = 18.55 = 0.1675 2.Calcule a variância e o desvio padrão da distribuição representativa de uma população.4 1 2º 4|-----------.9275 = 0.963 Exemplo 2 – Calcular a variância e o desvio padrão da distribuição do exercício anterior considerando que os dados sejam representativos de uma amostra.988 Exemplo 3 . da Tabela 12.5 Variável Freqüência xi fi 2 3 3 5 4 8 5 4 --20 xi ⋅ f i ( xi − x ) 2 ⋅ f i 8.4.9763 = 0.16 1 10 46 .9763 20 − 1 19 2º passo: calcula o desvio padrão amostral s = 0.12 5 4º 12|-----------. Ms Luiz Gonzaga de Paula 2º passo: abre na Tabela mais uma coluna para o cálculo ( xi − x ) 2 ⋅ f i Tabela 12.55 = = 0.9800 7.6 Classe Intervalo de classe Freqüência i fi 1º 0|-----------.2900 18.8 3 3º 8|-----------. 1º passo: calcula a variância amostral s2 = ∑ (x − x) ⋅ f ∑ f −1 2 i i i = 18.Prof.Variável Contínua .

24 = 3.2 Exemplo 4 – Se a Variável Contínua fosse representativa de uma amostra.4 1 2 4|-----------.12 5 10 1 14 4º 12|-----------.38 10 − 1 9 47 .4 = = 11.7 Classe Intervalo de classe Freqüência xi i fi 1º 0|-----------.16 10 --li + Li 2 xi ⋅ f i ( xi − x ) 2 ⋅ f i 40.28 12.24 10 6º passo: calcula o desvio padrão populacional: σ = 10.4 5º passo: calcula a variância populacional: σ 2 ∑ (x − x) = ∑f i i 2 ⋅ fi = 102.8 3 6 2º 3º 8|-----------. Ms Luiz Gonzaga de Paula Como na distribuição com intervalo de classe não temos os valores de xi .Prof.4 2 18 50 14 84 1º passo: calcula o ponto médio de cada classe: xi = 2º passo: calcula o somatório de: ∑x ⋅ f i i = 84 3º passo: calcula a média da distribuição: x = ∑x ⋅ f ∑f i i i = 84 = 8.80 31.96 17.4 10 4º passo: calcula o somatório de: ( xi − x ) 2 ⋅ f i = 102. substituímos estes valores pelos pontos médios de classe. Tabela 12.6 acrescentando as colunas necessárias para a resolução dos cálculos.4 102. a variância amostral seria denotada por s2 e sua fórmula de calculo seria: s2 = ∑(x i − x)2 n −1 = 102.36 102. xi = li + Li 2 Solução: usaremos e disposição da Tabela 12.4 = 10.

4 – Interpretação do Desvio Padrão O Desvio Padrão é a mais importante das medidas de dispersão.38 = 3. é possível calcular a probabilidade de ocorrência em função do afastamento da média segundo o número de desvios-padrão: • 0.373 Comentários: A unidade da variância é dada sempre no quadrado da unidade de medida da série de dados. ou seja: a variância não tem interpretação na estatística descritiva.Prof.2% para faixa µ ± 1 σ.1. Para suprir esta deficiência define o desvio padrão como a raiz quadrada positiva da variância. em algumas referências. 12.997 ou 99. A análise da curva permite a conclusão lógica do que se observa na prática: as ocorrências tendem a concentrar-se em torno de uma média e se tornam mais raras ou menos prováveis à medida que dela se afastam. denominada dispersão natural do processo. portanto admite interpretação. • 0.4% para faixa µ ± 2 σ.2.682 ou 68. Quando uma curva de frequência representativa de uma distribuição é perfeitamente simétrica como a curva da figura abaixo. O desvio padrão terá sempre a mesma unidade de medida da série e.7% para faixa µ ± 3 σ. Exercícios: 48 . Na faixa µ ± 3 σ ocorre a quase totalidade (99. • 0.954 ou 95. Ms Luiz Gonzaga de Paula E o desvio padrão amostral seria: s = 11.7%) dos valores. Por isso. portanto o valor da variância não pode ser comparado diretamente com os dados da série. ela é. podemos afirmar que: Por simples integração da função de densidade.

6% e CVB = 6 = 0. a temperatura média do ano é de 27ºC e o desvio padrão é 8 ºC.8) CV = s x (12.2.1 .Prof. Exemplo: Na cidade Alfa. conseqüentemente pode ser expresso em termos percentuais. 12. a temperatura média do ano é de 24ºC e o desvio padrão é 6 ºC. é uma divisão de elementos de mesma unidade. útil para a comparação em termos relativos do grau de concentração em torno da média de séries distintas.296 27 ou 29. Exercícios: 49 . Na cidade Beta.7) Coeficiente de variação amostral é calculado pela fórmula (12.7) CV = σ x (12. portanto um número adimensional. Medida essa denominada de coeficiente de variação. bastando multiplicar o resultado da divisão por 100.2 . Ms Luiz Gonzaga de Paula 12. Qual das duas cidades apresenta a temperatura mais homogenia? CV A = 8 = 0.Coeficiente de Variação (CV) O coeficiente de variação é a relação entre o desvio-padrão e a média aritmética da distribuição: Coeficiente de variação populacional é calculado pela fórmula (12.8) Nota que CV.25 24 ou 25% Resposta: A cidade Beta apresenta maior Homogeneidade nos valores de temperatura ao longo do ano.Medidas de Dispersão Relativa Trata-se de uma medida relativa de dispersão. porque tem menor coeficiente de variação.

a figura (b) mostra uma distribuição assimétrica positiva ( M O < M d < x ) e a figura (c) mostra uma distribuição assimétrica negativa ( M O > M d > x ). : assimetria negativa fraca. da moda e da mediana são coincidentes. Ms Luiz Gonzaga de Paula 13 .1.. 13.Prof. as distribuições são classificadas da seguinte forma: Se AS ≤ -1 Se -1 < AS < 0 Se AS = 0 Se 0 < AS < 1 Se AS ≥ 1 : assimetria negativa forte. 50 . os valores da média.1 Medidas de Assimetria Assimetria é o grau de afastamento de uma distribuição do grau de simetria.1 – Coeficiente de Pearson (As) AS = x − MO σ (13. A figura (a) abaixo mostra uma distribuição simétrica ( x = M O = M d ). Quando uma distribuição é simétrica. Segundo este critério. : assimetria positiva forte.MEDIDAS DE ASSIMETRIA E CURTOSE 13.1) Se AS = 0 : então a distribuição é simétrica. : simétrica : assimetria positiva fraca. Se AS > 0 : então a distribuição é assimétrica positiva. Se AS < 0 : então a distribuição é assimétrica negativa.

: assimetria positiva moderada.0. Se AS > 0 : então a distribuição é assimétrica positiva.2) Se AS = 0 : então a distribuição é simétrica. podemos observar três situações especiais indicadas na figura abaixo: 51 . No coeficiente de Bowley o valor varia de -1 a 1. Se AS < 0 : então a distribuição é assimétrica negativa.1 Se 0. Ms Luiz Gonzaga de Paula 13. : assimetria positiva forte.1. : assimetria negativa moderada.1 < AS < 0.Medidas de Curtose : assimetria negativa forte.2 – Coeficiente de Bowley (As) AS = Q3 + Q1 − 2 M d Q3 − Q1 (13.3 ≤ AS ≤ 1 13. as distribuições são classificadas da seguinte forma: Se -1 ≤ AS ≤ .1 ≤ AS < 0 Se AS = 0 Se 0 < AS ≤ 0.3 Se -0. Observando a concentração dos valores de uma distribuição em torno de sua Moda. Segundo este critério.3 < AS < . : assimetria negativa fraca.1 Se -0.2 . : simétrica : assimetria positiva fraca.3 Se 0.Prof.0.

f ∑f 2 1 i i σ Exercícios: 4 =3 (13. que aparece na fórmula (13. como mostra afigura. A medida de curtose procura classificar estes tipos de curvas com respeito ao afilamento ou achatamento de sua área central. como mostra afigura.3). f ∑f K= 2 1 i i σ4 −3 (13.3) K = o valor da curtose. Ms Luiz Gonzaga de Paula 1º caso – Na curava (a) os dados estão fortemente concentrados em torno da Moda. podemos utilizar o coeficiente de curtose dado pela fórmula: ∑ (x − x) . Platicúrtica. Os seguintes termos são usados para indicar a faixa do excesso de curtose de uma distribuição: Positivo: Nulo: Negativo: Leptocúrtica. que caracteriza a distribuição Mesocúrtica. o que faria a curva de fraquencia ser razoavelmente afilada.Prof. Se uma distribuição apresenta conforma a equação (13. Esta distribuição será estudada na seqüência do curso. curva (a) da Figura curva (b) da Figura curva (c) da Figura Para classificar uma distribuição quanto a sua curtose. representa o valor da curtose para uma distribuição teórica de probabilidade denominada distribuição normal padrão. o que faria a curva de fraquencia ser fracamente afilada. Observação: O valor 3. Mesocúrtica . 3º caso – Na curava (c) os dados estão fracamente concentrados em torno da Moda.4) ela é Mesocúrtica e conseqüentemente K = 0. : a distribuição Platicúrtica. o que faria a curva de fraquencia ser bastante afilada.4) 52 . Se K = 0 Se K > 0 Se K < 0 : a distribuição Mesocúrtica. : a distribuição Leptocúrtica. 2º caso – Na curava (b) os dados estão razoavelmente concentrados em torno da Moda. como mostra afigura. ∑ (x − x) .

O resultado final depende do acaso.Introdução: A maioria dos fenômenos de que trata a Estatística são de natureza aleatória ou probabilística. No primeiro exemplo: cara pertence ao espaço amostral {cara. 53 . Fenômenos Determinísticos são aqueles que repetidos sob as mesmas condições. No experimento aleatório "lançamento de um dado" temos o espaço amostral: {1.: cada elemento do espaço amostral que corresponde a um resultado recebe o nome de ponto amostral. (co.2 Fenômenos: Entendemos por fenômenos qualquer acontecimento natural. O conhecimento dos aspectos fundamentais do cálculo da probabilidade é uma necessidade essencial para o estudo da Estatística Indutiva ou Inferencial. coroa}.3 . coroa}.Espaço Amostral (S) É o conjunto universo ou o conjunto de resultados possíveis de um experimento aleatório.ca)} Obs. Os fenômenos classificam em: Determinísticos e Aleatórios. 14. 2. Exemplo: Da afirmação "é provável que o meu time ganhe a partida hoje" pode resultar: que ele ganhe que ele perca que ele empate Este resultado final pode ter três possibilidades. 4.1 . conduzem sempre a um mesmo resultado. 6}. No experimento aleatório "lançamento de uma moeda" temos o espaço amostral: {cara. 5.co) . (ca. Ms Luiz Gonzaga de Paula 14 . Fenômenos Aleatórios são fenômenos que.ca) .Prof. (co. 3. apresentam resultados imprevisíveis. 14.PROBABILIDADE 14. No experimento aleatório "dois lançamentos sucessivos de uma moeda" temos o espaço amostral: {(ca. mesmo repetido várias vezes sob condições semelhantes.co) .

Formule os eventos definidos pelas sentenças: a) Obter um número par na face superior do dado: A = {2. Exemplos: 1. E é chamado de evento certo. logo B é um evento certo de S. logo D é um evento impossível de S.4 – Eventos Evento é qualquer subconjunto do espaço amostral de um experimento aleatório. 6}. 3. onde B = S.1) 54 . tal que: P(A) = número de casos favoráveis de A / número total de casos Em outras palavras a probabilidade P(A) é definida como a relação entre o número de possíveis resultados favoráveis do evento A e o número de elementos do espaço amostral S.Prof. 2.6}. Ms Luiz Gonzaga de Paula 14. Se considerarmos S como espaço amostral e E como evento: Assim. 5. P( A) = Sendo: n ( A) o número de elementos do evento favorável A n ( S ) o número de elementos do espaço amostral S n( A) n( S ) (14.No lançamento de um dado temos S = {1. 4.Conceitos de Probabilidade Clássica Chamamos de probabilidade de um evento A (sendo que A está contido no Espaço amostral S) o número real P(A). logo C é um evento elementar de S. Se E ∈ S e E é um conjunto unitário. E é chamado de evento impossível. 5. qualquer que seja E. 2. Se E = Ø. 6} onde A ∈ S. 3. se E ∈ S (E pertence a S). c) Obter o número 4 na face superior: C = {4}. E é chamado de evento elementar.5 . 4. Se E = S. 14. então E é um evento de S. d) Obter um número maior que 6 na face superior: D = Ø. b) Obter um número menor ou igual a 6 na face superior: B = {1. 4.

3.Eventos Complementares P (CA) Sabemos que um evento pode ocorrer ou não.No lançamento de uma moeda qual a probabilidade de obter cara em um evento A? S = {ca. portanto: P (CA) = 1. 5. Ms Luiz Gonzaga de Paula OBS: Quando todos os elementos do Espaço amostral têm a mesma chance de acontecer.Numa distribuição de probabilidades o somatório das probabilidades atribuídas a cada evento elementar é igual a 1.Sabemos que a probabilidade de tirar o nº.No lançamento de um dado qual a probabilidade de obter um número maior que 6 em um evento A? S = {1. 4 no lançamento de um dado é: portanto: q = 1 .P(A) (14. 2. a q = 1 – p. + pn = 1 Exemplos: 1. co} = 2 e A = {ca} = 1 então: P(A) = 1/2 = 0.5. 55 . Sendo p a probabilidade de que ele ocorra (sucesso) e q a probabilidade de que ele não ocorra (insucesso). 4.0 = 100% Obs. 4. 5.. 4. logo. Exemplos: 1.. probabilidade de não tirar o nº.2) Obs. o espaço amostral é chamado de conjunto equiprovável. 4 no lançamento de um dado é p = 1/6. 3. 6} = 6 A = {2.5 = 50% 2 .No lançamento de um dado qual a probabilidade de obter um número menor ou igual a 6 em um evento A ? S = {1. 6} = 6 A = {1. 3.5 = 50% 3 .No lançamento de um dado qual a probabilidade de obter um número par em um evento A? S = {1. para um mesmo evento existe sempre a relação: p + q = 1 e q = 1 – p. 3. 2. 4 . 6} = 3 P(A) = 3/6 = 0.1/6 = 5/6. 5.: a probabilidade de todo evento certo é igual a 1 ou 100%.1 . onde: p1 + p2 + p3 + . 5.Prof. 6} = 6 P(A) = 6/6 = 1. 6 } = 6 A={ }=0 P(A) = 0/6 = 0 = 0% Obs.: a probabilidade de todo evento impossível = 0 ou 0% 14. . 4. 4. 2. 2.

no lançamento de uma moeda.2 . Consideremos a seguinte distribuição de probabilidades: P(a) = 1/8.3 Exemplo: No lançamento de um dado qual a probabilidade de se tirar o nº. 3 ou o nº.Prof. Então p = 3/5 (ganhar) e q = 1. Ms Luiz Gonzaga de Paula 2 . P(b) = 1/8. onde as suas "chances". 4? Os dois eventos são mutuamente exclusivos então: P = 1/6 + 1/6 = 2/6 = 1/3 14. d}.3 Probabilidade da Reunião (Eventos não Mutuamente Exclusivos) A probabilidade da união de dois eventos A e B. são de (3 para 2).3/5 =2/5 (perder). devemos excluir as probabilidades dos elementos comuns A e B para não serem computadas duas vezes. segundo os entendidos. Assim. já que. Exercícios: 1 Seja S = {a.5. Calcule o valor de x: 2. Assim: P(A ∪ B) = P(A) + P(B) – P(A ∩ B) 14. o outro não se realiza.4 56 .Calcular a probabilidade de um piloto de automóvel vencer uma dada corrida.5. a probabilidade de que um ou outro se realize é igual à soma das probabilidades de que cada um deles se realize: P(A ∪ B) = P(A) + P(B) 14. ao se realizar um deles. b. o evento "tirar cara" e o evento "tirar coroa" são mutuamente exclusivos. Isto é: A ∩ B ≠ φ . c.Eventos Mutuamente Exclusivos Dois ou mais eventos são mutuamente exclusivos quando a realização de um exclui a realização do(s) outro(s).As chances de um time de futebol T ganhar o campeonato que está disputando são de (5 para 2) Determinar a probabilidade de T ganhar e a probabilidade de T perder: 14. P(c) = 1/4 e P(d) = x. Isto éA ∩B= φ Se dois eventos são mutuamente exclusivos. quando há elementos comuns. Calcule também a probabilidade dele perder: O termo (3 para 2) significa: De cada 5 corridas ele ganha 3 e perde 2.

7) P( A) P( A | B) = P ( A ∩ B) → P ( A ∩ B) = P( B ) ⋅ P ( A | B) P( B) (14.6): P( B | A) = P( A ∩ B) P( A) (14. 3.. 20}. 2. Ms Luiz Gonzaga de Paula Exemplo: No lançamento de um dado. qual a probabilidade de o número sorteado ser o número 13? S = {1.19.. número de elementos da intersecção: n (A ∩ B) = 1 P ( A ∩ B ) = 1 20 10 20 P( A | B) = P( A ∩ B) 1 20 1 1 = × = → P( A | B) = . calcular a probabilidade de A ∪ B. 6} e o evento B = {2.5.6) Exemplo: Considere o conjunto de números inteiros S = {1. 6}. 17.6).5) P( A | B) = P( A ∩ B) P( B) (14. 5. a probabilidade de B ocorrer depois da ocorrência de A é chamada probabilidade condicional de B em relação a A.. consideramos o evento A = {1. e. 20}.. 3.5) e (14... 2. De fato da equação (14.19.ou seja 10% P ( B) 20 10 10 10 14.. Neste caso os eventos são dependentes e definidos pelas fórmulas (14. 6}.5. número de elementos do evento A: n (A) = 1 B = {1. 4 3 2 5 P ( A ∪ B ) = P ( A) + P ( B ) − P ( A ∩ B ) = + − = = 83.Probabilidade Condicional Se A e B são dois eventos. . 15. 9. 7. retire um número.4 .. 2.. .5 – Regra do Produto A definição da regra do produto é obtida a partir da definição de probabilidade condicional. Se o número sorteado for impar.Prof. vem: P ( A ∩ B) P( B | A) = → P( A ∩ B) = P( A) ⋅ P( B | A) (14.33% 6 6 6 6 14. 19}. e indica-se por : P (B|A).. 5. 11. 4.. número de elementos do espaço amostral S: n (S) = 20 A = {13}. número de elementos do evento B: n (B) = 10 P ( B ) = A ∩ B = {13}.5) e (14... A intersecção de A e B é: A ∩ B = {2. se por meio de um sorteio aleatório.8) 57 . 13. 3..

Prof. 58 . Portanto se A e B são eventos independentes. 3. 5. 9. 3. 7. 10. 26 Cartas vermelhas. 10. 4. 6. com reposição. 4. B. 7. sendo: 13 de Paus (Ás. 8. 6. Qual a probabilidade de ambas serem de ouros? P(A) = 13/52 (probabilidade de ser a primeira carta de ouros) P(B | A) = 12/51 (probabilidade de ser a segunda carta de ouros. são eventos independentes. 7. 3. tendo sido já retirada à primeira carta de ouros) P ( A ∩ B ) = P ( A) ⋅ P ( B | A) = 13 12 156 3 ⋅ = = = 0. valete. 4.5. 3. 4. 6. duas cartas de um baralho de 52 cartas. 2.25% 52 52 16 Observação: Se A. C. valete. 9.88% 52 51 2652 51 14. 2. dama e rei). D.7) e (14.9) Exemplo: São retiradas. 5. 8. dama e rei). valete. 2.0588 = 5. 10. 5.6 – Eventos Independentes Dois eventos são Independentes quando a realização de um dos eventos não afeta a probabilidade de realização do outro e vice-versa.10 Espaço amostral do baralho de 52 cartas: 26 Cartas pretas. 6. 13 de Copas (Ás. valete.8) vem: P ( A ∩ B ) = P ( A) ⋅ P ( B ) (14. 9. 10. 8. 8. Ms Luiz Gonzaga de Paula Exemplo: Duas cartas são retiradas de um baralho sem haver reposição. 7. 13 de Espadas (Ás. dama e rei). 2. 5.0625 = 6. 9. dama e rei). então: P(A ∩ B ∩ C ∩ D) = P(D) x P(C) x P(B) x P(A) 14. sendo: 13 de Ouros (Ás. Qual a probabilidade de que as duas cartas sejam de ouros? P(A) = 13/52 e P(B) =13/52 P ( A ∩ B ) = P ( A) ⋅ P ( B ) = 13 13 1 ⋅ = = 0. então: P ( B | A) = P ( A) e P ( A | B ) = P ( B ) que substituindo nas equações (14.

Qual é a probabilidade de as três bolas retiradas da 1ª. 2ª e 3ª urnas serem. uma urna B contém: 5 bolas brancas. 4 são defeituosas. 3 pretas. uma urna C contém: 2 bolas brancas.Uma urna A contém: 3 bolas brancas.De dois baralhos de 52 cartas retiram-se. Sendo retirada uma peça. 4 pretas. uma carta do primeiro baralho e uma carta do segundo. Qual a probabilidade de a carta do primeiro baralho ser um REI e a do segundo ser o 5 de paus ? 5.Em um lote de 12 peças. b) a probabilidade de essa peça não ser defeituosa.Qual a probabilidade de sair o um REI quando retiramos 1 carta de um baralho de 52 cartas ? 3. branca. Uma bola é retirada de cada urna. calcule: a) a probabilidade de essa peça ser defeituosa. Ms Luiz Gonzaga de Paula EXERCÍCIOS: 1. 2 pretas.De um baralho de 52 cartas retiram-se. 2 verdes.Qual a probabilidade de sair o ÁS de ouros quando retiramos 1 carta de um baralho de 52 cartas? 2.Prof. simultaneamente. duas cartas sem reposição. Qual é a probabilidade de a primeira carta ser o ÁS de paus e a segunda ser o REI de paus? 59 . respectivamente. 4. 4 verdes. preta e verde? 6. ao acaso. 1 verde.

Duas bolas são retiradas (sem reposição) de uma urna que contém 2 bolas brancas e 3 bolas pretas e 5 bolas verdes.Qual a probabilidade de sair uma figura (rei ou dama ou valete) quando retiramos uma carta de um baralho de 52 cartas? 8. ao mesmo tempo. Qual a probabilidade de tirarmos uma DAMA e um REI. Qual a probabilidade de que a 1ª seja branca e a 2ª seja preta? 12. Tiramos. não necessariamente nessa ordem? 9.Duas bolas são retiradas (sem reposição) de uma urna que contém 2 bolas brancas e 3 bolas pretas.Duas bolas são retiradas (com reposição) de uma urna que contém 2 bolas brancas e 3 bolas pretas. Qual a probabilidade de ambas serem COPAS ou ESPADAS? 10. uma carta do primeiro baralho e uma carta do segundo.Prof. a)Qual a probabilidade de que ambas sejam verdes ? b) Qual a probabilidade de que ambas sejam da mesma cor? 60 . Qual a probabilidade de que a 1ª seja branca e a 2ª seja preta? 11.Duas cartas são retiradas de um baralho sem haver reposição. Ms Luiz Gonzaga de Paula 7.São dados dois baralhos de 52 cartas.

0.20 + 0.0% de peças defeituosas. . . ∪ An = S Seja B outro evento no mesmo espaço amostral.Prof. e de 50 % se chover. Se o serviço de Meteorologia estimar em 40 % a probabilidade de chover durante o jogo. tal que P(B) > 0. A2. P (B|A1) + P (A2)..5. A1 ∪ A2 ∪ A3 . .11) Exemplo: Segundo especialistas esportivos. Calcule o percentual de peças defeituosas na produção desta indústria.40 .42 = 0. 61 . P (B | A1)=50% B| A2= Vasco ganhar o jogo se não chover durante a partida. P (B | A1) + P (A2). A1 = chover durante o jogo.70) = 0.60 . A máquina A1 produz 2.0% de peças defeituosas e a máquina A2 produz 8..50 ) + (0. P (B|A2) + . e: P (B) = P (A1).7 – Teorema da Probabilidade Total Seja A1. P (B|An) O teorema da probabilidade total pode ser escrito de forma geral e compacta. Ms Luiz Gonzaga de Paula 14. .62 ou 62% Exercício: Duas máquinas A1 e A2 são responsáveis por 70% e 30% respectivamente da produção de uma indústria. + P(B ∩ An). pela seguinte expressão: P( B) = ∑ [ P( Ai ) ⋅ P( B | Ai )] i =1 n (14. A3. a probabilidade de que o Vasco ganhe o próximo jogo é estimada em 70 % se não chover. P(B| A2) P(B) = (0. qual será então a probabilidade do Vasco ganhar o próximo jogo? Definição dos eventos: B = o Vasco ganhar o jogo.An um conjunto de eventos mutuamente exclusivos cuja união desses eventos forma o espaço amostral. + P (An).. 0. Então: P(B) = P(B ∩ A1) + P(B ∩ A2) + P(B ∩ A3) + . P (A1)= 40% A2 = não chover durante o jogo. P (A2)=60% B | A1= Vasco ganhar o jogo se chover durante a partida. P(B| A2)=70% P (B) = P (A1)..

40) Exercício: 1 Duas máquinas A1 e A2 são responsáveis por 60% e 40% respectivamente da produção de uma fábrica... Qual a probabilidade de que a peça tenha vindo da máquina A2? (Resposta: 25/39 ou 64.20 × 0.60 = 0.25) + (0. P( Ai | B ) = P( Ai ) ⋅ P( B | Ai ) P( A1 ) ⋅ P ( B | A1 ) + P ( A2 ) ⋅ P( B | A2 ) + . As porcentagens de peças defeituosas nas respectivas máquinas são 3%. Se uma peça defeituosa foi selecionada da produção desta fábrica.. 75 % das vezes ele chega em casa antes das 23 horas e quando usa o Peugeot só chega em casa antes das 23 horas em 60% das vezes. conhecida com Fórmula de Bayes...5. A2.. Qual a probabilidade de que ele. Quando ele usa o Monza.) 3 A probabilidade de um individuo da classe A comprar um carro é 3/4. Qual a probabilidade de que o indivíduo da classe B o tenha comprado? (Resposta 10/19 ou 52.Prof.63%) 62 . da classe B é 1/6 e da classe C é 1/20.80 P(B | A1) = 1 ...87%) 2 Três maquinas A1.. A3. n eventos mutuamente exclusivos tais que A1 ∪ A2 ∪ A3 .8 × 0. + P( An ) ⋅ P( B | An ) (14. qual é a probabilidade de que tenha sido produzida pela máquina A2. Sejam P(Ai) as probabilidades conhecidas de todos os eventos Ai e B um evento qualquer do espaço amostral S tal que conhecemos todas as probabilidades condicionais P(B| Ai).40 P( A1 | B) = Resposta: 71.0. A2.20 P(B | A2) = 1 . no dia de ontem. Em certa loja comprou-se um carro da marca Fiat..An.12).. Uma peça é sorteada ao acaso e verifica-se que é defeituosa. da classe B comprar da marca Fiat 3/5 e da classe C comprar da marca Fiat é 3/10.25 B = chegar em casa após 23 horas P(A2) = 0. tenha usado o Monza? A1 = usar o fusca A2 = usar carro importado P(A1) = 0.7143 P( A1 ) ⋅ P ( B | A1 ) + P( A2 ) ⋅ P( B | A2 ) (0.. A probabilidade de o indivíduo da classe A comprar um carro da marca Fiat é 1/10..8 × 0.75 = 0. 50% e 10% do total de peças de uma fábrica.0% e 7.0% respectivamente. .12) Exemplo de aplicação da rega de Bayes Certo professor da FAFIEP 80 % das vezes vai trabalhar usando um Monza e usando um Peugeot 407 SW nas demais vezes.0. e A3 produzem respectivamente 40%. 5% e 2%. Os índices de peças defeituosas na produção destas máquinas valem 3.8 – Regra de Bayes Sejam A1..25 = = 0. Ms Luiz Gonzaga de Paula 14.43 % P( A1 ) ⋅ P( B | A1 ) 0. ∪ An = S..1%.. Ontem o professor chegou em casa após às 23 horas. (Resposta: 28/46 ou 60. Então para cada i teremos a fórmula (14....