You are on page 1of 29

UNIVERSIDADE FEDERAL DO RECÔNCAVO DA BAHIA - CETEC CURSO: BIOLOGIA / MEDICINA VETERINÁRIA DISCIPLINAS: CET209 CET219 - BIOESTATÍSTICA PROFª: SANDRA

PINHEIRO

UNIDADE I ESTATÍSTICA DESCRITIVA

OBS: Os tópicos de Noções de Conjuntos e Introdução à Análise combinatória são apenas para o curso de Medicina Veterinária. Noções de Conjuntos
Conjunto: representa uma coleção de objetos. Em geral, um conjunto é denotado por uma letra maiúscula do alfabeto: A, B, C, ..., Z. Elemento: é um dos componentes de um conjunto. Em geral, um elemento de um conjunto, é denotado por uma letra minúscula do alfabeto: a, b, c, ..., z. Pertinência: é a característica associada a um elemento que faz parte de um conjunto. Símbolo de pertinência: Se um elemento pertence a um conjunto utilizamos o símbolo ∈ que se lê: "pertence". Apresentação: Os elementos do conjunto estão dentro de duas chaves { e }. Conjunto vazio: É um conjunto que não possui elementos. É representado por { } ou por Ø. O conjunto vazio está contido em todos os conjuntos. Conjunto universo: É um conjunto que contém todos os elementos do contexto no qual estamos trabalhando e também contém todos os conjuntos desse contexto. O conjunto universo é representado por uma letra U. Na sequência não mais usaremos o conjunto universo. Reunião de conjuntos A reunião dos conjuntos A e B é o conjunto de todos os elementos que pertencem ao conjunto A ou ao conjunto B. A ∪ B = {x: x ∈ A ou x ∈ B} Exemplo: Se A={a,e,i,o} e B={3,4} então A ∪ B={a,e,i,o,3,4}. Interseção de conjuntos A interseção dos conjuntos A e B é o conjunto de todos os elementos que pertencem ao conjunto A e ao conjunto B. A ∩ B = { x: x ∈ A e x ∈ B } Exemplo: Se A={a,e,i,o,u} e B={1,2,3,4} então A ∩ B=Ø. Algumas propriedades dos conjuntos Associativa: Quaisquer que sejam os conjuntos A, B e C, tem-se que: A ∪ (B ∪ C)=(A ∪ B) ∪ C A ∩ (B ∩ C) = (A ∩ B) ∩ C Comutativa: Quaisquer que sejam os conjuntos A e B, tem-se que: A ∪ B=B ∪ A A ∩B = B ∩A Distributiva: Quaisquer que sejam os conjuntos A, B e C, tem-se que:

Sandra-Med Vet./Biologia-2

a escolha do par (H. Arranjos São agrupamentos formados com p elementos. com repetição ou circulares (que não será abordado aqui). com p<m. m=4 e p=2./Biologia-3 . nenhuma das escolhas de um elemento pode coincidir com uma escolha do outro. um outro elemento M pode ser escolhido de n formas diferentes.p) = m!/(m-p)! Exemplo: Seja Z={A.D}.1. (p<m) de forma que os p elementos sejam distintos entre sí pela ordem ou pela espécie. Sandra-Med Vet. Na maioria das vezes serão considerados conjuntos Z com m elementos com grupos formados de p elementos.M) nesta ordem poderá ser realizada de m. Regra da soma: A regra da soma nos diz que se um elemento pode ser escolhido de m formas e um outro elemento pode ser escolhido de n formas. isto é. isto é. Fórmula: As(m. 1.2) = 4!/2!=24/2=12. Arranjo simples Não ocorre a repetição de qualquer elemento em cada grupo de p elementos. A-B = {x: x ∈ A e x∉B} Introdução à Análise combinatória Análise Combinatória é um conjunto de procedimentos que possibilita a construção de grupos diferentes formados por um número finito de elementos de um conjunto sob certas circunstâncias. encontre os arranjos simples desses 4 elementos tomados 2 a2 As(4. Problemas de Análise Combinatória podem ser resolvidos através de duas regras básicas: a regra da soma e a regra do produto.A ∩ (B ∪ C)=(A ∩ B) ∪ (A ∩ C) A ∪ (B ∩ C) = (A ∪ B) ∩ (A ∪ C) Diferença de conjuntos A diferença entre os conjuntos A e B é o conjunto de todos os elementos que pertencem ao conjunto A e não pertencem ao conjunto B.C. 1.n formas. p será a taxa do agrupamento. Os três principais tipos de agrupamentos são: Arranjos. desde que tais escolhas sejam independentes. então a escolha de um ou outro elemento se realizará de m+n formas.B. Permutações ou Combinações. que ser simples. Regra do Produto: A regra do produto diz que se um elemento H pode ser escolhido de m formas diferentes e se depois de cada uma dessas escolhas.

de forma que os m elementos sejam distintos entre sí pela ordem.BCA. 2.5.CA.ACB.CC.CB.7.D}.BC.9 ? Resp: 10 2) Usando-se apenas os algarismos 1.7.3.3.7.9 ? Resp: 25 2. m=4 e p=2.AC.9 quantos números com três algarismos podem ser montados? Resp: 60 1.DD} Exercícios: 1) Quantos números com 4 algarismos podemos formar com os algarismos 0.BB.C} e m=3.p) = mp.2. Sandra-Med Vet.1.B.6.4.B.AD.CD. Permutações Quando formamos agrupamentos com m elementos.BD.DB. Fórmula: Ar(m.AB. Permutação simples São agrupamentos com todos os m elementos distintos.2.1.CB. Fórmula: Ps(m) = m!. Exemplo: Seja Z={A. Ps={ABC. encontre os arranjos com repetição desses 4 elementos tomados 2 a 2 Ar(4.CBA} Exercícios: 1) De quantos modos distintos 5 pessoas podem sentar-se em um banco com 5 lugares? Resp: 120.CD.BD.C.BA.5.BA.3.2) = 42=16.9 ? Resp: 10000 2) Quantos números com 2 algarismos podemos formar com os algarismos 1.DA.3.8.BC. quantas são as permutações simples desses 3 elementos? Ps(3) = 3!=6.DB.5.AD.DC} Exercícios: 1) Quantos números diferentes com um algarismo podemos formar com os algarismos 0. Exemplo: Seja C={A.4.CAB./Biologia-4 .BAC. Arranjo com repetição Todos os elementos podem aparecer repetidos em cada grupo de p elementos.DC.DA.2.CA.7.AC.8. Ar={AA.1.6.5.As={AB.

Permutação com repetição: Dentre os m elementos do conjunto C={x1. então Pr(m) m! / (m1! m2!... .C. m=4 e p=2. m3 iguais a x3. m2=2. Combinação simples Não ocorre a repetição de qualquer elemento em cada grupo de p elementos.AC. logo: Pr(5) = 5! / (3! 2!) = 10.CD} Exercícios: 1) Quantos grupos de três animais podem ser montados com oito animais? Resp: 56 Sandra-Med Vet. Fórmula: Se m=m1+m2+m3+.xn}.+mn. 3.2)=4!/[2!2!]=24/4=6 Cs={AB. começando por uma vogal e terminando por uma consoante? Resp: 4320 2.BC.mn!) Exemplo: Qual o número possível de anagramas que podemos formar com as letras da palavra A R A R A? m1=3..+mn=m.. começando por A B? Resp: 5040 3) Quantos são os anagramas possíveis com as letras A B C D E F G H I..BD.x2.. Exercícios: 1) Quantos anagramas podemos formar com as 6 letras da palavra ARARAT? Resp: 60 2) Qual o número possível de anagramas que se pode montar com as letras da palavra A M A R? Resp: 12 3.2. .AD..2) Quantos são os anagramas possíveis com as letras: A B C D E F G H I..D}.../Biologia-5 ..x3. Fórmula: C(m. faremos a suposição que existem m1 iguais a x1. Combinações Quando formamos agrupamentos com p elementos. mn iguais a xn..1. de modo que m1+m2+m3+.p) = m! / [(m-p)! p!] Exemplo: Seja C={A. m2 iguais a x2..B. (p<m) de forma que os p elementos sejam distintos entre sí apenas pela espécie. quantas são as combinações simples desses 4 elementos tomados 2 a 2 ? C(4...

2)=5!/[2!3!]=10 Cr={AA. quantas são as combinações com repetição desses 5 elementos tomados 3 a 3 ? Resp: 35 Sandra-Med Vet.B. 12}.DD} Exercícios: 1) Seja C={2.BB.p)=C(m+p-1. Fórmula: Cr(m.C. E}.AB.CC. m=4 e p=2.p) Exemplo: Seja C={A.AC./Biologia-6 . quantas são as combinações com repetição desses 6 elementos tomados 4 a 4 ? Resp: 126 2) Seja C={A.2.BC. D. m=5 e p=3. quantas são as combinações com repetição desses 4 elementos tomados 2 a 2 ? Cr(4.2)=C(5.2) Quantas combinações com quatro elementos podem ser montadas com as dez primeiras letras do alfabeto? Resp: 210 3.AD. 8.BD. 4. B. Combinação com repetição Todos os elementos podem aparecer repetidos em cada grupo até p vezes. m=6 e p=4. 6. C.2)=C(4+2-1.CD. 10.D}.

No sentido mais amplo. Sandra-Med Vet. em latim. O que é amostragem A amostragem é um campo da estatística bastante sofisticado que estuda técnicas de planejamento de pesquisa para possibilitar inferências sobre um universo a partir do estudo de uma pequena parte de seus componentes. como uma ciência política. O cálculo apropriado do tamanho de amostras é atualmente uma exigência dos protocolos das pesquisas científicas. Foi pensada pelos ingleses. apresentação através de gráficos e tabelas. e significa o "estudo do estado". destinada a descrever características de um estado ou país. pessoas. envolvendo compilações de dados e gráficos. uma amostra (subconjunto de uma população). 1 . riqueza e recursos naturais (Laurenti et al. Agora. área.INTRODUÇÃO A ESTATÍSTICA A palavra estatística deriva da expressão status. É tratada através de técnicas e métodos que se fundamentam na Teoria das Probabilidades./Biologia-7 . • • • População: conjunto de todos os elementos (valores. nesse caso têm-se os valores dos parâmetros. Se a população em estudo for muito pequena. b) Indutiva ou Inferência Estatística: Consiste em obter e generalizar conclusões para a população com base em uma amostra. suas funções são: • • • • coleta de dados. Censo: é uma coleção de dados relativos a todos os elementos de uma população. A estatística descritiva vai resumir os dados através do uso de certas medidas-síntese. Amostra: um subconjunto de elementos extraídos de uma população. tais como população.DIVISÃO DA ESTATÍSTICA a) Estatística Descritiva: Na estatística descritiva as informações são reduzidas até o ponto em que se possa interpretá-las mais claramente. se a população em estudo for grande. organização e classificação destes dados. 1985). todos os indivíduos devem ser utilizados para a medição das características que se deseja conhecer sobre a mesma. na maioria das vezes faz-se necessário retirar uma amostra representativa através das técnicas de amostragem. que permitem descrever resumidamente os fenômenos. no século XVI. que tornem possível a interpretação de resultados. medidas) a serem estudados que possuam pelo menos uma característica em comum. cálculo de coeficientes (estatísticos).

só pode assumir valores pertencentes a um conjunto finito ou enumerável. De acordo com a estrutura numérica as variáveis podem ser classificadas em: * Quantitativas . Ex: Número de alunos. seus valores são resultados de um processo de contagem e são expressos através de números inteiros não-negativos.Esquemas amostrais Por esquema amostral entende-se a dupla: sorteio e métodos de estimação dos parâmetros. Ordinal: os dados podem ser dispostos em alguma ordem natural.se os resultados das observações serão expressos sempre através de números. Os principais esquemas amostrais são: amostragem aleatória simples. número de sementes de girassol. tipo sanguíneo.pode assumir qualquer valor pertencente a um determinado intervalo do conjunto dos Reais. • Sandra-Med Vet. nível de escolaridade. geralmente médias e totais. a variável contínua resulta normalmente de mensurações. Altura. Ex: Nível de escolaridade. temperatura máxima diária. que representam contagens ou medidas. Ex: Estatura e peso de atletas. Ex: Sexo. que se distinguem por alguma característica não-numérica. sexo. estratificada e por conglomerados. peso. estado civil. * Qualitativas . Os dados não podem ser dispostos segundo um esquema ordenado. As técnicas estatísticas devem ser aplicadas em cada variável de acordo com a classificação de cada uma delas. mas as diferenças entre os valores dos dados não podem ser determinadas ou não tem sentido. Ex: Idade. e de modo que se possam obter suas variâncias. Contínua ./Biologia-8 . Ex: Estado civil. cor da pele. Normalmente é usada uma combinação destes esquemas básicos. número de sementes. rótulos ou categorias. Geralmente.se os resultados das observações serão expressos através de categorias. sistemática. As variáveis qualitativas podem ser classificadas em: • • Nominal: caracteriza-se por dados que consistem apenas em nomes. 2 – CLASSIFICAÇÃO DAS VARIÁVEIS QUANTO AO TIPO Variável é qualquer atributo/característica que exerça alguma influência no fenômeno estudado. As variáveis quantitativas podem ser classificadas em: • Discreta .

são colocadas abaixo da fonte.Notas . reticências. Sandra-Med Vet.1 – Apresentação tabular Depois da coleta dos dados é necessário que eles sejam dispostos de uma forma ordenada e resumida. onde se especifica o conteúdo de cada coluna. . o local e a época em que foram registradas as informações. . quanto ao número de casas decimais. célula ou cela .Coluna indicadora . Contém informações gerais destinadas a conceituar ou esclarecer o conteúdo das tabelas. Algumas observações fazem-se importantes na elaboração de uma tabela. É colocado no rodapé da tabela. Uma tabela deve ser auto-explicativa de modo forma que consultas ao texto sejam desnecessárias. Casa.É obrigatório e deve ser colocado na parte superior da tabela.Cabeçalho . onde se tem a frequência com que a categoria aparece. Deve ser bastante claro. como hífen. 4) Deverá ser mantida a uniformidade.é a parte da tabela em que se especifica o conteúdo de cada linha.3 – APRESENTAÇÃO DOS DADOS 3. se necessárias.Fonte . Deve conter a designação do fato observado. São elas: 1) Nenhuma casa da tabela deve ficar em branco.Corpo da tabela . 3) Os totais e subtotais devem ser destacados.Título . emprega-se alguns dos sinais convencionais. . a fim de auxiliar o pesquisador na análise e facilitar a compreensão das conclusões apresentadas ao leitor. . não sendo fechadas à direita ou à esquerda por linhas verticais. Uma tabela possui elementos essenciais e complementares.é a indicação da entidade responsável pelo fornecimento ou elaboração dos dados. Na ausência de um dado numérico. 2) As tabelas devem ser fechadas no alto e embaixo por linhas horizontais.é a parte superior da tabela. Os elementos complementares são: ./Biologia-9 . etc.é o cruzamento de cada linha com uma coluna. Os elementos essenciais são: .É o conjunto de colunas e linhas onde se encontram as informações numéricas sobre o fato observado.

2. . 2. 3 . 2 . 3. Nº de sementes Um Dois Três Quatro total Nº de vagens 7 7 4 2 20 Sandra-Med Vet. . 4 . Para elaboração e análise das distribuições de freqüências serão definidos alguns conceitos importante: 1) Dados Brutos . 2. 2. 3 . Número da Tabela TOPO  Título Cabeçalho da coluna indicadora Linha  Fonte  RODAPÉ Nota geral  Nota específica  Cabeçalho das colunas numéricas Coluna Célula 4 . 4. 2. 1.1 . 1 .1 . 1. 1. 3. 1 . 2 . 3. 2. 1 . Para facilitar o trabalho é necessário ordenar os dados numéricos de forma crescente ou decrescente. 2. 1. 1.1 . Exemplo1: nº de sementes encontradas numa amostra de 20 vagens. Dados que não foram trabalhados. 4 . 4. 1.1 . Rol – É a ordenação dos dados brutos em uma determinada ordem crescente ou decrescente 1 . 2. Nº de sementes encontradas numa amostra de 20 vagens. 3 .DISTRIBUIÇÃO DE FREQÜÊNCIAS É um tipo de série estatística onde o fenômeno considerado é uma variável quantitativa (discreta ou contínua) e seus valores observados são descritos considerando o número de vezes que ocorreram na série (freqüência). 3. 2 . 3 .É o conjunto dos dados numéricos obtidos após a coleta dos dados./Biologia-10 . 2 . 2. 2.

31 32 . 3) Amplitude total ou “range” (AT) .22 .21 = 15.23 .26 .é uma tabela onde os valores da variável aparecem individualmente.32 .34 .25 . com pouca variedade de valores. as variações dos dados. uma vez que os valores extremos são percebidos de imediato. 25 .23 . 5) Frequência total (ft ou elementos observados.26 .É o número de vezes que o elemento aparece na amostra ou o número de elementos pertencentes à uma classe. ∑f i ) . 4) Frequência absoluta simples (fi) .31 .33 .34 .35 .30 .36 O rol torna possível visualizar. Esse tipo de distribuição é utilizado geralmente para representar uma variável discreta.35 .23 .34 .26 . Exemplo : Utilizando os mesmos dados anteriores TABELA 1 . Idade (xi) fi 21 3 22 2 23 2 24 1 25 4 26 3 28 1 30 1 31 3 32 1 33 3 34 3 35 2 36 1 TOTAL (ft) 30 Fonte: (dados hipotéticos) Sandra-Med Vet.31 .31 .34 .22 . é aconselhável a elaboração de uma tabela de distribuição de freqüência.Exemplo2: Idade dos alunos do curso Biologia da faculdade XY.36 .26 .21 .33 .25 .28 .35 .22 . Ex: Utilizando os mesmos dados anteriores: AT = 36 .25 .24 .21 .26 .23 .26 .É a soma das frequências simples absolutas de todos os Para condensarmos melhor os dados. Essas tabelas podem ser classificadas em: 6) Distribuição de Frequências de Dados Tabulados Não-Agrupados em Classes .25 .25 -21 .28 .33 21 .35 .25 .Idade dos alunos do curso Biologia da faculdade XY no ano de 2000.31 .30 . de forma bem ampla.34 .21 . no ano de 2000.33 – 31 Utilizando os mesmos dados anteriores vamos construir o rol: 21 .24 ./Biologia-11 .22 .É a diferença entre o maior e o menor valor observado da variável em estudo.24 .33 .33 .25 .

5 5 23. Geralmente os dados agrupados em classes são indicados para variáveis contínuas ou variáveis discretas cujo número de valores representativos seja muito grande./Biologia-12 .Este tipo de tabela não é aconselhável para uma variável com uma grande quantidade de valores distintos uma vez que poderá ficar muito extensa.Idade dos alunos do curso de Biologia da faculdade XY no ano de 2000. as análises e conclusões dos dados pesquisados. 7) Distribuição de frequências de dados agrupados em classes. além de sua elaboração.Os limites de classe são seus valores extremos. Ex: Utilizando os mesmos dados anteriores: h = 24 . Idade Nº de alunos (fi) 7 21. Outras possibidades são: | .5 | 26. Nesse último caso.5 2 Sandra-Med Vet.0 | 23.  a) Limites de Classe .5 || 36. o valor 21 é denominado limite inferior da primeira classe. || . Classe pode ser definida como sendo os subintervalos da Amplitude Total de uma variável.0 | 28.A amplitude de um intervalo de classe corresponde ao comprimento desta classe.21 = 3 c) Pontos Médios ou Centrais da Classe (xj) .5 | 31. enquanto o valor 24 é denominado limite superior da primeira classe. como: TABELA 2 .0 4 26. o procedimento visa a evitar certos inconvenientes. dificultando.5 1 28. Ex: Utilizando os mesmos dados anteriores: x1= 24 + 21 = 22.0 | 33.0 TOTAL 30 Fonte: (dados hipotéticos) O símbolo | indica a inclusão do limite inferior do intervalo naquela classe.É a média aritmética simples entre o limite superior e o inferior de uma mesma classe.5 6 33. Quando se tem as classes já definidas a amplitude pode ser definida como a diferença existente entre os limites superior (ou inferior) de duas classes consecutivas.0 7 31. No exemplo anterior de distribuição de frequência. b) Amplitude do Intervalo de Classe (h) .

2) Diagramas . atrair a atenção do leitor e inspirar confiança. A principal vantagem de um gráfico sobre a tabela é o fato de que ele permite conseguir uma visualização imediata da distribuição dos valores observados.são gráficos em que a magnitude das frequências é representada por certa mensuração de uma determinada figura geométrica.APRESENTAÇÃO GRÁFICA A apresentação gráfica é um complemento importante da apresentação tabular. Trata-se.são mapas geográficos em que as frequências das categorias de uma variável são projetadas nas áreas específicas do mapa./Biologia-13 . Em epidemiologia.representa a proporção de observações de um valor individual ou de uma classe. de um número relativo. portanto. São os gráficos mais usados na representação de séries estatísticas e se apresentam através de uma grande variedade de tipos. Sandra-Med Vet. Esse tipo de representação gráfica é de grande utilidade em Saúde Pública em que se deseja conhecer a distribuição geográfica de casos e óbitos de uma determinada doença epidêmica. Os gráficos podem ser cartogramas ou diagramas: 1) Cartogramas . f ri = ∑f fi = i fi ft Desejando expressar o resultado em termos percentuais. dispensando esclarecimentos adicionais no texto. multiplica-se o quociente obtido por 100: f ri = ∑ fi fi 100 5 . Todo gráfico deve apresentar um título e uma escala. em relação ao número total de observações. Devem ser simples.d) Frequência Simples Relativa ( fri) . os mapas alfinetados são de grande emprego para apreciar o aparecimento e expansão de certas moléstias. Os gráficos devem ser auto-explicativos e de fácil compreensão.

São gráficos muito comuns em jornais e revistas. Produção de leite (litros/vaca/ano) . Nº de animais abandonados em um abrigo para animais.Tipos de Diagramas: 1) Gráficos em Linhas ou Gráficos Lineares São frequentemente usados para a representação de séries temporais. As linhas são mais eficientes neste tipo de gráfico porque permitem a detecção de intensas flutuações nas séries e também possibilitam a representação de várias séries em um mesmo gráfico. tendo como principal vantagem o fato de despertar a atenção do público leitor./Biologia-14 .2001 1800 1600 1400 1200 1000 800 600 400 200 0 Sudeste Sul Centro-oeste Nordeste Sandra-Med Vet. 2000-2007 100 90 80 Nº de animais 70 60 50 40 30 1999 2000 2001 2002 2003 2004 2005 2006 2007 2008 Ano Fo nte:Fictícia 2) Gráficos Pictóricos (Pictogramas) São gráficos construídos a partir de figuras ou conjunto de figuras representativas da intensidade ou das modalidades do fenômeno.

ou quantitativas discretas. por meio de retângulos de igual largura./Biologia-15 . ou quantitativas discretas. 2006.3 0 5 10 15 Produção (T) 20 25 30 4) Gráficos em Colunas Prestam-se à mesma finalidade dos gráficos em barras horizontais. preferíveis a esses últimos quando as legendas a se inscreverem sob os retângulos forem breves. entretanto. Cada barra representa a intensidade de uma modalidade ou atributo.3) Gráficos em Barras Têm por finalidade comparar grandezas.6 Amendoim 9. Mais indicado para variáveis qualitativas. Arroz 25.5 15. e alturas proporcionais às respectivas grandezas.1 Sandra-Med Vet.5 Soja Sementes 20.1 Feijão 17.5 18. 2006. Produção(T) de sementes usadas como fonte de óleo no Estado Y. 35 30 25 Produção (T) 20 15 10 5 0 Girassol Oliva Sem entes Soja Milho 9. Mais indicado para variáveis qualitativas.8 Lentilha 5. Produção (T) de seme ntes usadas como alime ntos no Estado X.3 32. sendo.

0 20.0 35.200X 20 30 40 Feijão Arroz Soja Milho 140 50 Total Sandra-Med Vet.0 10.0 25.0 30.5) Gráficos de Colunas Remontadas ou de Barras Agrupadas Têm a mesma finalidade dos gráficos de barras e colunas simples. 2005-2006.0 15. Milho Soja ano-2006 ano-2005 Girassol 0. Mais indicado para variáveis qualitativas.0 5. ou quantitativas discretas que possuam poucas categorias cujas porcentagens sejam complementares.0 6) Gráficos em Setores (ou pizza) São utilizados para representar valores absolutos ou porcentagens complementares. Produção de Grãos na região C. Produção(T) de sementes usadas como fonte de óleo no Estado Y./Biologia-16 . mas são utilizados para estabelecer comparações entre duas ou mais categorias. quando se pretende comparar cada valor da série com o total.

60 3. 6.00 4.2399 N = 34 6 .MEDIDAS DE POSIÇÃO São medidas da estatística descritiva.40 3.40 Mean = 4. X= ∑x i =1 n i n Sandra-Med Vet. Indicado para variáveis quantitativas contínuas ou quantitativas discretas com muitas categorias. É obtida pela divisão da soma dos valores observados da variável pelo número total de observações. Dev.20 4.1) Média Aritmética Simples É a medida de tendência central mais comumente utilizada para descrever resumidamente uma distribuição de freqüência. de forma que a área de cada retângulo seja proporcional à freqüência da classe que ele representa.0209 Std. Separatrizes: são medidas que dividem um conjunto de dados ordenados em partes iguais. As medidas de posição podem ser: • • Tendência Central: são medidas que tendem a localizar pontos que ficam no centro de um conjunto de dados ordenados./Biologia-17 . Comprimento de vagens (cm) 8 6 Frequencia 4 2 0 3. = 0.7) Histograma É um gráfico formado por um conjunto de retângulos justapostos.80 4.1) Medidas de Tendência Central a. que tendem a localizar um determinado ponto do conjunto de dados.

os números que queremos sintetizar têm graus de importância diferentes.06 kg 10 Ex2: Encontre a altura média de 8 pés de Aloe Vera (babosa).6 3. Altura (m): 1.40 1.6 n = 10 2.4 3.4 + 3.5 X = 2.7 + 2.onde : xi = valor genérico da observação n = tamanho da amostra ou nº total de observações Ex1: Peso (em kg) de cachorros da raça pastor alemão entre a 4ª e 5ª semanas de vida: 2.2 2.7 + 3. Quando os dados estão agrupados por freqüências (absolutas ou relativas) os ponderadores serão as freqüências.21 1.8 + 2.6 + 2./Biologia-18 .19 a. Nº de sementes 1 2 3 4 total Nº de vagens 7 7 4 2 20 Sandra-Med Vet.2) Média aritmética ponderada Em algumas situações.f i =1 n i n i ∑ i =1 fi Ex1: Nº de sementes encontradas numa amostra de 20 vagens.5 + 3.5 = 3.6 3.2 + 2. X = ∑ x .01 1.05 1.8 2.27 1.32 1.7 3.6 + 3.5 3. Utiliza-se então uma média ponderada.6 + 3.7 2.25 1.

27 Nº de alunos 6 30 26 15 3 80 Sandra-Med Vet.7 6. 12.40 1.21 1. 13.7  6.7 Mo = 2. 12.05 1.01 1.27 1.1) Moda A moda é definida como o valor mais frequente do conjunto de dados.21 1.27 1. 12. 18. Ex1: Peso (em kg) de cachorros da raça pastor alemão entre a 4ª e 5ª semanas de vida: 2.2 Total b. Classificação de um conjunto de dados quanto a moda: • amodal : quando nenhum dos valores (ou característica) se repete mais que os outros do conjunto.Ex2: Encontre a nota média dos alunos Nota 4.21 1. • plurimodal : quando mais de dois valores (ou características) do conjunto de dados se repete mais que os outros.2 5. Moda Bruta: A moda bruta é simplesmente o ponto médio da classe de maior freqüência absoluta simples.6 3./Biologia-19 . Sua vantagem é que pode ser usada para variáveis qualitativas. 21} b.2  5. • bimodal : quando dois valores (ou características) do conjunto de dados se repete mais que os outros.7 3.7 kg Ex2: Encontre a moda de 10 pés de Aloe Vera (babosa). Ex: para a tabela das notas dos alunos encontre a nota modal.6 2.8 2.25 1.19 EX3: W = {10.2  6. É a medida de tendência central menos importante.7 5. 1.7 2. 18. 15.5 3.2) Moda para dados agrupados em classes Para dados agrupados em classes a moda pode ser obtida por três procedimentos.32 1.4 3.2 2.2 6. 13. Altura (m): 1. • unimodal : quando apenas um valor (ou característica) do conjunto de dados se repete mais que os outros.5 2.6 3.7  7.7  5. Trabalharemos apenas com a moda bruta.

2) Número de observações é par: Neste caso.16 0.18 0.9 6. Temos quatro tipos de separatrizes.5 6.5 Sandra-Med Vet.5 7.1 7.3 7. os decis.1.2 7.2) Separatrizes As separatrizes são medidas de posição que permitem calcularmos valores da variável que dividem ou separam a distribuição em partes iguais. 6.15 0.18 rol : 0.14 0.3 7.1 7.0 6.5 7.18 0.19 0.8 6./Biologia-20 .16 0.6.2.18 0.18 0. Além de separatriz a mediana é uma medida de tendência central porque será sempre o ponto situado no centro dos valores observados. 50% das observações estarão à esquerda do valor mediano e 50% delas estarão a direita do valor mediano. os quartis. e os percentis.3 rol : 6.5 7. também chamadas de quantis: a mediana.20 como n = 11 (ímpar) 11 + 1 Emd = =6 2 Então a mediana será o 6º elemento Md = 0. Ex1: Peso(g) de sementes de soja: 0.16 g Ex2: Comprimento(m) de 12 filhotes recém-nascidos de baleia azul 7.15 0.14 0.9 6.9 6.5 6.19 0. Trabalharemos apenas com mediana.0 7.15 0.14 0. que é também uma medida de tendência central.2 7.15 0.9 7.3 6.14 0.16 0.8 7.0 7.18 0.20 0.16 0. o elemento mediano (ou posição mediana) será determinado através da expressão: n Emd = 2 A mediana será determinada pela média aritmética entre os valores que ocupam a posição definida pelo elemento mediano e a posição sucessora.0 6. Mediana A mediana é uma separatriz que divide um conjunto ordenado de dados em duas partes exatamente iguais. a) Determinação da Mediana de valores não-tabelados: Tendo os valores observados ordenados de forma crescente ou decrescente podem ocorrer duas hipóteses com relação ao número de observações (n): 1) Número de observações pode ser ímpar: Neste caso o elemento mediano (ou posição da mediana) será dado por: n +1 Emd = 2 A mediana das observações será o valor indicado por Emd.

7 3 3 6.6. ant fi ) onde.0 metros b) Determinação da Mediana de valores tabelados agrupados em classes: Para dados agrupados em classes o elemento mediano é obtido através da fórmula Emd = n/2.1 + 0.0 + 7 .3 15 27 7.3 |-.0 = 7 .como n = 12 (par) 12 Emd = =6 2 Como temos 2 valores centrais a mediana será a média aritmética entre o 6º e o 7º elementos..5 |-.7 4 37 TOTAL 37 .7.9 5 8 6.5 Md = 7. li = limite inferior da classe mediana.7 |-./Biologia-21 .9 |-.1 |-.7. Comprimento(m) Nº de filhotes (fj ) Fiac 6.5 6 33 7.1 4 12 7.7. Pelo elemento mediano é encontrada a classe mediana e em seguida a mediana será calculada através da seguinte expressão: O elemento mediano será sempre definido como : E md = ∑ fi 2 .6.2 Sandra-Med Vet. e a mediana por: Md = l i + h (E md − f ac . não se fazendo distinção entre número par ou ímpar de observações. 7 .2 (18.5 |-.0 Md = 2 Md = 7.7. h = amplitude do intervalo de classe Emd = elemento mediano fac ant = frequência acumulada anterior à classe mediana fi = frequência absoluta simples da classe mediana Exemplo: Comprimento de filhotes recém-nascidos de baleia azul (Baleanoptera musculus). Emd = 37/2 = 18.5 – 12)/15 = 7.

Sandra-Med Vet./Biologia-22 .31 95% das vagens tinham aproximadamente 9 sementes ou menos e apenas 5% delas tinham 9 sementes ou mais. .5 – 94)/ 16 = 9. O elemento do percentil será sempre definido como: E ci = i . a) Ec25 = 25*110/100 = 27. Nº de sementes 0 -..5 C25 = 2 + 2 (27. 2. 99 . h = amplitude do intervalo de classe Emd = elemento do percentil i fac ant = frequência acumulada anterior à classe do percentil i fi = frequência absoluta simples da classe do percentil i Ex: Nº de sementes de 110 vagens.2.6 6 |-..2.06 25% das vagens tinham aproximadamente 2 sementes ou menos e 75% delas tinham 2 sementes ou mais. Através desta separatriz encontramos todas as demais.5 – 27)/ 16 = 2.8 8 |--| 10 TOTAL Número de vagens 27 16 34 17 16 110 fiac 27 43 77 94 110 Encontre o percentil : 25 e 95.5 C95 = 8 + 2 (104.2 metros de comprimento ou mais.2 metros e 50% deles têm 7.2 2 |-. li = limite inferior da classe do percentil i. b) Ec95= 95*110/100 = 104. ∑ fi 100 .50% dos filhotes têm comprimento inferior ou igual a 7. Percentil ou centil: separatriz que divide um conjunto ordenado de dados em cem partes iguais. i=1. ant fi ) onde. O percentil será definido por: Ci = l i + h (E ci − f ac . 6.4 4 |-.

pode-se tomar como amplitude total a diferença entre o limite superior da última classe e o limite inferior da primeira classe ou. quando existem classes abertas. AT = 150 . para dados grupados em classes de freqüências.Vmin Exemplo: A tabela a seguir fornece as informações sobre o consumo de ração (g) por quatro gatos durante cinco dias.149 = 2 g. MEDIDAS DE DISPERSÃO As medidas de dispersão (ou de variabilidade) servem para avaliar o grau de variabilidade ou dispersão dos de um conjunto de dados.1. entre o maior valore o menor valor. ainda.148 = 5 g.7. a diferença entre os pontos médios das classes extremas. 4ª) Não é possível definir a amplitude total. AT = 151 . 2ª) A desvantagem desta medida de dispersão é que leva em conta apenas os valores mínimo e máximo do conjunto./Biologia-23 . 7. Sandra-Med Vet. AT = 153 . Se ocorrer qualquer variação no interior do conjunto de dados. 3ª) Quando a distribuição de freqüências é por classes. ou seja. a amplitude total não nos dá qualquer indicação dessa mudança.140 = 14 g.150 = 0 g. Estas medidas nos permitem estabelecer comparações entre fenômenos da mesma natureza mostrando como os valores se distribuem acima ou abaixo da medida de tendência central. AT = 154 . Resolução: 1: 2: 3: 4: Observações: 1ª) A amplitude total é a medida mais simples de dispersão. Amplitude total Definição: A amplitude total (AT) de um conjunto de números é a diferença entre os valores extremos do conjunto. AT = Vmax . Gatos 1° 140 148 150 151 2° 152 150 150 150 Dia 3° 154 151 150 149 4° 154 153 150 150 5° 150 148 150 150 Média diária 150 150 150 150 1 2 3 4 Calcular as amplitudes totais nos exemplos anteriores e identificar qual gato apresenta a menor dispersão e qual apresenta a maior dispersão no consumo da ração.

81 0.80 0. Desvio padrão simples Definição: Sejam x1 . S= ∑ (x − X ) f ∑ f −1 n 2 i =1 i i i Sandra-Med Vet.1. 7.8 )2 + (0 .15 Para B: S = 0. para C: S = 0. utilizando a definição. Desvio padrão ponderado O desvio ponderado é para dados agrupados em classes onde a freqüência absoluta simples é considerada como o fator ponderador.. Com os valores encontrados para o desvio padrão. Exemplo: Pesos (kg) de badejos de três criatórios Criatórios A B C 1° 0.2.65 0..2. xn . x2 .72 0. temos: S = ∑ (x k i =1 i −X ) 2 n −1 = (0 . O desvio padrão é definido como: S= ∑ (x − X ) n i i =1 2 n −1 .75 − 0 .80 0.78 0.8 )2 4 −1 2 = 0 ...80 0.75 0.11 . podemos observar que o criatório C apresentou a menor dispersão em relação ao peso dos peixes.73 0.8 )2 + (1 − 0 .2.90 Média 4° 0.65 − 0 .95 0. Desvio padrão 7.08 .8 )2 + (0 .7.80 0.8 − 0 . n valores que a variável X assume.00 0.80 Resolução: Para A.2.71 Amostra 2° 3° 1./Biologia-24 .

para E: S 2 = 0.10 TOTAL X = 508 = 4. Estados que possuem filiais da clínica Vida. Porte da empresa.. xn . Numero de funcionários de um hospital.376 = 2.7 110 − 1 7.8 8 |-. Com os valores encontrados para o desvio padrão. Tempo de serviço de funcionários (em anos).6 6 |-.012 .006 . A variância é definido como: ∑(x −x) S = 2 i 2 n−1 Obs: a variância é o desvio padrão ao quadrado Exemplo: Pesos (kg) de badejos de três criatórios Para A: S 2 = 0. x2 .92 40. Variância Definição: Sejam x1 ..6 110 Nº de vagens 27 16 34 17 16 110 xi 1 3 5 7 9 - (xi.76 804 S= 804 = 7..4 4 |-..Ex: Encontre o desvio padrão para o número de sementes./Biologia-25 .2 2 |-.3. Nº de sementes 0 |-.44 97.X )2 * fi 349. ******************** ********************** EXERCÍCIOS ****************** 1) a) b) c) d) e) Classifique as variáveis abaixo quanto ao tipo: Faturamento da clínica (em R$). podemos observar que o empregado C apresentou a menor dispersão na produção diária da peça.92 309. n valores que a variável X assume.96 5. Sandra-Med Vet. para B: S 2 = 0.022 .

foram obtidos os seguintes resultados(em segundos) (dados do QSR Drive-Thru Time Study): McDonald’s: 287 128 92 267 176 240 192 118 153 254 193 136 Jack in the Box: 190 229 74 377 300 481 428 255 328 270 109 Encontre para cada um dos serviços: a) o tempo médio b) o tempo mediano c) o tempo modal d) desvio-padrão resp: McDonald’s: a) 186./Biologia-26 .5 b) 184 b) 270 c) amodal c) amodal d) 63.9 d) 125.2) Em pesquisa de tempos exigidos por serviços drive-through.5 Sandra-Med Vet.3 Jack in the Box: a) 276.

37 Resp: a) 3./Biologia-27 . c) 2. a idade média das crianças a idade modal a idade mediana a freqüência relativa percentual o desvio-padrão b) 2 . e) s = 1. Nº de Nº de salários mínimos funcionários 0 |— 2 45 2 |— 4 35 4 |— 6 20 6 |— 8 15 8 |— 10 5 Total 120 Encontre: a) b) c) d) e) o número de salários médio dos funcionários o salário modal o salário mediano a freqüência relativa percentual o desvio-padrão .95 .17 5 10 15 8 5 43 Resp: a) 1.3) Idades (em anos) de crianças que nasceram com baixo peso na maternidade X Idade (em anos) Nº de crianças 0 1 2 3 4 Total Encontre: a. c) 2 . c.33 . d. 4) A tabela abaixo representa os salários pagos a 100 funcionários do hospital Z. e. b.86 e) s = 2. b) 1 Sandra-Med Vet.

15 |-.3.08 0.2 |— 1.1 |— 1.3.00 24 3.80 |-.85 |-. Ganho de Nº de peixes peso (kg/sem) 0./Biologia-28 .05 |-.13 c) 0.95 |-.1 10 1.9 |— 1.0 |— 1.3.16 0.5) A tabela abaixo apresenta o ganho de peso(kg/sem) de peixes-boi da Amazônia em cativeiro.95 11 2.3.01 e) 1.20 6 3.0 6 1.2.9 2 0.2.90 10 2.10 9 3.20 |--| 3.10 |-.07 b) 0.80 2 2.2.25 3 TOTAL 90 Identificar os seguintes elementos da tabela: Sandra-Med Vet.3.96 d) 1.3 |— 1.14 7) Considere a seguinte tabela: Classes Fi 2.75 |-.16 6) Completar os dados que faltam: Valores fi Fiab 1 2 3 4 5 6 7 8 4 4 16 7 5 7 28 38 45 Fr 0.2 5 1.90 |-.85 3 2.8 |— 0.14 0.05 14 3.2.15 8 3.3 4 1.4 1 Total 28 Encontre: a) o ganho de peso médio b) o desvio-padrão c) 80% dos peixes têm ganho de peso superior ou igual a quanto? d) 68% dos peixes têm ganho de peso inferior ou igual a quanto? e) 25% dos peixes têm ganho de peso superior ou igual a quanto? Resp: a) 1.00 |-.

e) amplitude do intervalo de classe. Estatística-teoria e aplicações PEREIRA. e BERENSON.05. 0.03. Introdução à estatística STEPHAN. Resp. g) ponto médio da terceira classe. f) amplitude total. i) porcentagem de valores iguais ou maiores que 3. 0. 2. h) frequência absoluta acumulada além da sexta classe. K. Elementos de estatística Material didático (UFBA) da disciplina MAT 027 Material didático (UFBA) da disciplina MAT 193 Artigos científicos Matemática Essencial: pessoal. 40. c) limite inferior da sexta classe.com.50.. 0.htm Sandra-Med Vet. Mario F.a) frequência simples absoluta da quinta classe.sercomtel. REFERÊNCIAS BIBLIOGRÁFICAS • • • • • • • TRIOLA. O./Biologia-29 . b) frequência total.br/matematica/medio/combinat/combinat.: 24. d) limite superior da quarte classe. K. L.00. 90. 3.875.95.. W e TANAKA..20. 2.