You are on page 1of 48
Estatistica Descritiva 2.1 INTRODUGAO Como explicado no Capitulo 1, os objetivos da estatistica descritiva en- volvem organizac¢ao, sumarizagag e descrigaéo de dados quantitativos ou quali- tativos. Neste capitulo, mostraremos como se podem construir tabelas e graficos, particularmente, tabelas de distribuicées de freqiiéncias e seus grdficos — histo- gramas de freqiiéncias. Sdo também discutidos métodos numéricos para deter- minagao de medidas que oferecem entendimento de conjuntos de dados quanti- tativos — populagées e amostras — provenientes de varidveis em que ha interesse em estudar. 2.2 OBTENGAO DE DADOS Existem varias fontes para obter dados e informacées: ¢ Dados publicados pelo governo, industria ou individuos. e Dados oriundos de experiéncias (experimentos). ¢ Dados oriundos de pesquisa (survey). © Dados oriundos de observagées de comportamentos, atitudes etc. 26 © ESTATISTICA GERAL E APLICADA So considerados dados secunddrios aqueles jé coletados que se encontram organizados em arquivos, bancos de dados, anudrios estatisticos, publicacdes etc., enquanto so denominados dados primdrios aqueles colhidos diretamente na fonte das informacoes e dados. 2.3 NivEIS DE MENSURACAO E indispensavel que o pesquisador tenha claro o nivel de mensuracao da varidvel que pretende analisar, pois dependem do nivel de mensuracio da va- ridvel as possiveis operacées aritméticas entre seus valores e conseqiiente técni- ca estatistica permitida para andlise. 2.3.1 Nivel nominal O nivel nominal de mensuragao envolve simplesmente 0 ato de nomear, rotular ou classificar um objeto, pessoa ou alguma caracteristica, por meio de niuimeros ou outros simbolos. Nesse nivel, a varidvel pode assumir duas ou mais categorias. As categorias no tém ordem ou hierarquia. O que se mede é coloca- do em uma ou outra categoria, indicando somente diferengas com respeito a uma ou mais caracteristicas. Os numeros eventualmente utilizados tem fungao puramente de classifica- cdo e nao podem ser operados aritmeticamente. Por exemplo, a religiao é uma varidvel nominal. Se pretendermos operd-la aritmeticamente, teremos situagdes inusitadas como esta: 1 = catélico 2 = judeu 3 = protestante 4 = muculmano 5 = outros 1 + 2 = 3 um catélico + um judeu = protestante (?) Quando varidveis nominais assumem duas categorias, elas sio chamadas variéveis dicotémicas; e, se assumirem trés ou mais categorias, denominam-se varidveis categéricas. Sao exemplos de varidveis com nivel de mensuragao nominal: sexo (sim- bolizado por Me F; 1 e 2 etc.), filiacio partidaria, profissdes, categorias funcio- nais, estado civil, raga, mimero de chapas dos veiculos etc. ESTAT{STICA DESCRITIVA. 27 Trata-se de um nivel de mensuracao restritivo em termos de possibilidades do uso de técnicas estatisticas, uma vez que nao sao possiveis operacgées aritmé- ticas com seus valores. 2.3.2 Nivel ordinal Dada uma varidvel com nivel de mensuracao nominal em que a relacado > (maior do que) vale para todos os pares de classes, teremos entao uma escala ordinal. Observe que particularmente a relacdo > podera incluir mais alto do que, mais diffcil do que, mais importante do que, preferivel-a etc. Nesse nivel, a varidvel pode assumir varias categorias, porém essas catego- rias mantém uma relagdo de ordem do menor ao maior. Os simbolos, ou etique- tas, das categorias indicam uma hierarquizacao. Por exemplo, o prestigio ocupacional pode ser medido por diversas escalas que ordenam as profiss6es de acordo com seus prestigios: Profissao | -Engenheiro Quimico | Engenheiro de Produgao | Ator Pc Ue NOP) Oitenta é maior do que 70, 70 é maior do que 60 (os nimeros — simbolos ou categorias — definem posigées). Nao ha duvida de que as categorias nao es- téo separadas por intervalos iguais (nao ha um intervalo comum). Nao pode- mos dizer com exatidao que entre um Ator (60) e um Engenheiro de Produgao (70) existe a mesma distancia — de prestigio - que entre um Engenheiro de Pro- ducdo (70) e um Engenheiro Quimico (80). Aparentemente, nos dois casos a distancia é 10; todavia, nao é uma distan- cia real. O intervalo 10 nao é comum, representa diferentes dimensées, no caso de prestigio das profissées. Sao exemplos de varidveis com nivel de mensuracao ordinal: status socio- econémico, grau de escolaridade, hierarquizagéo de um conjunto de afirmagées, atitudes de pessoas em relacdo a determinado fato, resultado de testes etc. Trata-se de um nivel de mensuracaéo menos restritivo quanto ao uso de técnicas estatisticas. 2.3.3. Nivel intervalar Neste caso, a varidvel pode assumir varias categorias que mantém uma re- lacéo de ordem, além de intervalos iguais de medicao. As distancias entre cate- 28 © ESTATISTICA GERAL E APLICADA. gorias sao as mesmas em toda a escala. Existe um intervalo constante, ou seja, uma unidade de medida. Por exemplo: uma prova de Estatistica, com 30 questdes testes de igual di- ficuldade, é aplicada a trés garotas. Se Ana resolveu 10, Laura 20 e Breda 30, a distancia entre Ana e Laura é igual a distancia entre Laura e Breda. O zero (0) desse nivel de mensuragio é arbitrario, nao é real (da arbitraria- mente a uma categoria o valor zero, e a partir desse marco se constréi a esca- la). Um exemplo classico em ciéncias naturais é a temperatura (em graus Centi- grados ou Fahrenheit), em que o zero é arbitrario, nao implicando que realmente haja zero (nenhuma) temperatura (0 zero é uma das categorias dessas duas es- calas diferentes). Cabe ressaltar que diversas escalas utilizadas em estudos so- bre o comportamento humano nao sao verdadeiramente intervalares (escalas de atitudes), porém sdo tratadas como tal. Isso se faz porque o nivel de mensu- racao por intervalo permite operac6es aritméticas basicas (adicéo, subtracdo, multiplicagdo e divisio) e, portanto, das técnicas estatisticas, que de outro modo nao poderiam ser utilizadas. Atualmente, sio minoria os investigadores que nao concordam com esse procedimento. Trata-se de uma escala verdadeiramente quantitativa com possibilidade de aplicagao a todas as estatisticas paramétricas comuns. Sio exemplos de varidveis com nivel intervalar: peso, altura, volume etc. 2.3.4 Nivel de razao Neste nivel, além de todas as caracteristicas do nivel intervalar, 0 zero é real, é absoluto (nao é arbitrario). Zero absoluto significa que hd um ponto na escala onde nao existe a propriedade. Para 0 uso de métodos e técnicas estatisticas, ndo se faz distingdo entre os niveis intervalar e de raz4o. Como é comum, neste livro nos reportaremos a es- calas com niveis intervalares. E interessante lembrar que ha varidveis que podem ser medidas em mais de um nivel de mensuragao ou funcao dos propésitos de medicao. Por exemplo. a varidvel vendas em um periodo: crete A MOREA Categorias | |_Em unidades: de zero aK | | a0 _Baixa, Média e Alta E muito importante identificar o nivel de mensuracio de todas as varidv de uma investigacao, porque, dependendo do nivel de mensuragao da varidve. pode-se escolher uma ou outra técnica estatistica. esraristica pescririva 29 Normalmente, as varidveis com niveis de mensuracao nominal ou ordinal sao denominadas qualitativas, enquanto as varidveis com niveis de mensuragio intervalar ou razéo sto chamadas varidveis quantitativas. 2.4 GRAFICOS A organizagio, sumarizagio e descrigéo de dados podem ser feitas por meio da construcio de gréficos e tabelas. 2.4.1 Descricdo grafica de varidveis qualitativas O grafico de barras (horizontais ou verticais) e o grafico em forma de piz- za sao os graficos mais comuns para a descrig&o de dados oriundos de varidveis qualitativas. Basicamente, eles mostram as freqiiéncias de observagées para cada nivel, ou categoria, da varidvel que se deseja descrever. Os softwares esta- tisticos tam comandos especificos para a-construcéo desses tipos de graficos. EXEMPLO 2.1 Vamos construir os grdficos de colunas, barras e de pizza para os dados da seguinte tabela: Tabela 2.1 Automédveis nacionais mais vendidos: janeiro/agosto de 2000. Veiculos ‘Quantidades vendidas Gol 166.158 Uno | 58.556 Palio | 86.776 Astra i 22.006 Corsa | 66.065 Vectra | 23,162 Palio Weekend i 18,997 Fiesta | 24,586. Corsa Sedan | 55,334 Parati 18.765 Fonte: Jornauto, Séo Paulo, ago. 2000. 30 STATISTICA GERALE APLICADA 480.000. 160,000 140,000 120,000 400.000 80,000 Quantidades vendidas Got Uno Palio Astra Corsa Vectra Palio Fiesta Corsa Parati Weekend Sedan Grdfico 2.1 Automédveis nacionais mais vendidos: janeiro/agosto de 2000. Parati Corsa Sedan Fiesta Palio Weekend Vectra Veiculos Corsa Astra Palio Uno Got Quantidades vendidas Grdfico 2.2 Automéveis nacionais mais vendidos: janeiro/agosto de 2000. ESTATISTICA DESCRITIVA 31 Palio Weekend Fiesta Corsa Sedan @ Parati Grdfico 2.3 Automéveis nacionais mais vendidos: janeiro/agosto de 2000. 2.4.2. Descricao grafica de varidveis quantitativas Os histogramas sao os graficos mais adequados para a descrigéo de dados oriundos de varidveis quantitativas. Basicamente, eles mostram as freqiiéncias de observagées para cada valor ou conjunto de valores da variavel que se deseja descrever. Os softwares estatisticos t8m comandos especfficos para’a construcao dos histogramas. Com base em uma tabela de distribuig&o de freqiiéncias, é construido o histograma — trata-se de uma representacdo grdfica adequada para © tratamento de conjuntos de dados quantitativos com elevada quantidade de elementos. Vamos construir uma tabela de distribuicao de freqiiéncias e 0 histo- grama das idades dos funciondrios de uma amostra de 50 elementos seleciona- dos da empresa XPTO (Anexo A). Tabela 2.2 Idades de 50 funciondrios (colocadas em ordem crescente). 18 - 20 - 20 ~ 21 - 22 - 24 - 25 - 25 - 26-27-29 - 29 — 30 - 30- 31 ~ 3I - 32 - 33 - 34 - 35 - 36 - 36 - 37 — 37 - 37 - 37 — 38 - 38 - 38’- 40 - 41 - 43 - 44 - 44 - 45 - 45 - 45 - 46 - 47 - 48 - 49 - 50 - 51 - 53 - 54 - 54 - 56 ~ 58 - 62 ~ 65 1° passo: Construir o rol (dados em ordem crescente) e determinar a Amplitude Total: R R = Maior medida ~ Menor medida 32 ESTATISTICA GERAL E APLICADA No caso, 0 rol ja foi construido, e a Amplitude Total serd: R = 65-18 = 47. 2° passo: Como os dados serao agrupados em classes, é preciso escolher © ntimero de classes — K, bem como o tamanho do intervalo das classes - h. E possivel o uso de intervalos com tamanhos iguais, ou desiguais. Geralmente, es- colhem-se tamanhos iguais. Ha varios critérios para a escolha do nimero de classes. Dos dois critérios mostrados a seguir, usaremos 0 1° critério. 1° Critério: Férmula de Sturges: K=1 + 3,33 logn onde: n = ntimero de elementos que se deseja representar. 2° Critério: Regra empirica, dada pela Tabela 2.3. Tabela 2.3. Ntimero de classes para a construgdo da distribuigéo de Sreqiiéncias e histograma. Nimero de elementos que se tdeseja representar Nimero de classes Menor do-que 25: 5 ou6 (OEOUE 25-6 00 eens De? at4 See _Maiordo queS0 0 fie oe De Tok 26 No exemplo que estamos mostrando: K=1 + 3,33 log 50 = 1 + 3,33 (1,7) =7 3° passo: Quanto ao tamanho dos intervalos (iguais) das classes h: heR+K No ¢xemplo: h = 47+ 7=7 Quanto aos limites das classes, utilizaremos o seguinte critério: a | —b (in- cluiremos nesta classe todos os elementos maiores ou iguais a a e menores do que b. Denominaremos F; a freqiiéncia absoluta de elementos da classe i, ou seja: quantidade de elementos que pertencem 4 classe i. Quanto a freqiiéncia relativa — f, - da classe i: F fiz n N onde: né leseja representar — tamanho da amostra ESTATISTICA DESCRITIVA = 33. N é0 numero de elementos que se deseja representar — tamanho da po- pulacao Observe: 100. f, = % (porcentagem de elementos da classe i) Como a varidvel de estudo é agrupada em classes, temos interesse em de- terminar os pontos médios das classes ~ x; — média aritmética entre os limites inferior e superior da classe i. Também podem ser determinadas as freqiiéncias absolutas acumuladas — Fy — ¢ as freqiiéncias relativas acumuladas - f,,. Eis a tabela de distribuicgdo de freqiiéncias para os dados do exemplo: Recordando: K = numero de classes = 7 h = tamanho do intervalo = 7 Menor medida = 18 anos Maior medida = 65 anos Logo, a primeira classe conterd todas as idades maiores ou iguais a 18 e menores do que 25, pois os limites da 1# classe sao 18 [£225. Assim, a tabela da distribuigdo de freqiiéncias das idades podera ser repre- sentada da seguinte maneira: Classes Hshineed ; Fi | f % Fag io Se | x a 18; 25 6 | 6/50 = 0,12 12 | 6 | 012 | 12 | 21,5 2 25 32 | 10 0,20 20 16 0,32 32 | 285 3 32 39 13 0,26 26 29 0,58 | 58 35,5 4 | ar 46 | 8 | ofe} 16 | 37 | O74 | 74 | #25 _ 5 | 4+ 53 | 6 ir _o2| 12 | 43 | 086 | 96 | 495 6 [so 5 ono] 10 | 48 | 096 96 | 65 7 60 |— 66 2 | 0,04 4 50 1,00 100 63,5 Somas 50 | 1 100 I | Conforme os objetivos da Estatistica Descritiva, a tabela de distribuicaéo das freqiiéncias sintetiza e organiza uma colecdo de dados, facilitando a com- 34 gstariSTICA GERALE APLICADA preensio e andlise da varidvel sob estudo. Dentre outras consideragées sobre as idades dos 50 funciondrios que estamos analisando, poderemos afirmar: © a maior quantidade de funciondrios tem idade entre 32 e 38 anos; * apenas 4% dos funciondrios possuem idades iguais ou superiores a 60 anos, sendo 65 anos a maior idade do grupo; © cingiienta e oito por cento dos funciondrios da amostra tém idades infe- riores a 38 anos, sendo 18 anos a menor idade do grupo Quanto ao histograma das freqiiéncias absoluta intervalos 25, 32 39 46 53 60 66 de classes Figura 2.1 Histograma ~ Freqiiéncias absolutas ~ 50 idades. ESTATISTICA DESCRITIVA ee E o histograma das freqiiéncias relativas: ff intervalos das classes 0 a ee en se Figura 2.2 Histograma ~ Fregiiéncias relativas ~ 50 idades. Observar: os histogramas contém as mesmas informacées da tabela de dis- tribuigdo das freqiiéncias. Sao representagdes que buscam a organizacao e sin- tetizagao de grupos de dados quantitativos. EXERCICIOS - SERIE 1 2.1 A tabela a seguir mostra as dreas, em milhdes de km’, dos oceanos. Repre- sentar graficamente os dados com a construcao de um grafico de barras (colunas), e um grafico de pizza. Oceano | Antértico | Artic 368 | 23,2 Atlantico | {ndico | Pact co 199.4 137.9 | 3427 Area 1 | | _(imithoes km?) | ESTATISTICA DESCRITIVA 35 E o histograma das freqiiéncias relativas: f, intervalos das classes 6 0 18 25 32 39 46 53 60 Figura 2.2 Histograma — Freqiiéncias relativas ~ 50 idades. Observar: os histogramas contém as mesmas informagGes da tabela de dis- tribuicdo das freqiiéncias. Sao representagdes que buscam a organizacao e sin- tetizacdo de grupos de dados quantitativos. EXERCICIOS - SERIE I 2.1 A tabela a seguir mostra as reas, em milhdes de km?, dos oceanos. Repre- sentar graficamente os dados com a construcdo de um grafico de barras (colunas), e um grafico de pizza. Oceano Antartico | Artico | Atlantica Area 36,8 23,2 1994 | 137.9 (milhdes km?) | indico | Pacifico 342,7 36 —_BSTATISTICA GERAL E APLICADA 2.2. Construir os gréficos de colunas, barras e pizza para os dados da tabela: Divida lquida total do setor publico' de maio 2000 - Fluxos em R$ mi- Ih6es correntes: _Natureza Valor Divida externa liquida | 111.631 Governo federal e Bacen | 248.292 Governos estaduais e municipais 167.850 Empresas estatais | 13.324 (1) Consolida o endividamento do setor puiblico nao financeiro e Bacen (Banco Central) junto ao sistema financeiro, setor privado nao financeiro e resto do mundo. Fonte: Oikos ~ Andlise de Conjuntura ~ Unicentro Newton Paiva. Belo Horizonte, ano 8, n° 75, agosto de 2000. 2.3. Uma amostra de 50 estudantes apontou o seguinte rol de notas de Estatis- tica (avaliacéo de 0 a 100): 33 - 35 - 35 - 39 - 41 - 41 - 42 - 45 - 47 - 48 50 — 52 — 53 - 54-55 —-55 —- 57 - 59 - 60 - 60 61 — 64 — 65 — 65 - 65 — 66 - 66 — 66 - 67 - 68 69 — 71 - 73 - 73 - 74-74 - 76-77 -77-78 80 — 81 — 84 — 85 — 85 — 88 - 89 - 91 - 94 - 97 a) Construir a tabela de distribuicio de freqiiéncias. Iniciar a primeira classe com 30. b) Construir os histogramas das freqiiéncias absolutas e relativas. ©) Quais os limites da classe modal? E a classe com maior freqiifncia? d) e Quantos alunos obtiveram notas maiores ou iguais a 70? Qual é © ponto médio da primeira classe? 2.4 Considerar os dados obtidos pelas medidas das alturas de 100 inividuos (dadas em cm): 151 - 152 — 154 — 155 - 158 — 159 — 159 ~ 160 ~ 161 ~ 161] 161 — 162 — 163 ~ 163 ~ 163 ~ 164 ~ 165 - 165 16 168 = 168 = 168 - 168 — 168 — 168 — 168 = 168 - 169 - 16 169 - 169 - 169 - 169 - 169 - 169 - 170 - 170 - 170 - 171 170 - 170 - 171 - 171 - 171 - 171 - 172 - 172 - 172 - 17: 173 - 173 - 174 - 174 - 174 - 175 - 175 - 175 - 175 - 17 176 - 176 - 176 —- 177 - 177 - 177 - 177 - 178 - 178 - 17 179 - 179 - 180 - 180 - 180 - 180 - 181 - 181 - 181 - 18: 182 - 182 - 183 - 184 - 185 — 186 - 187 - 188 - 190 - 19 ESTATISTICA DESCRITIVA 37 a) Qual é a amplitude total? b) Em quantas classes poderemos agrupar esse conjunto de medidas? Lembre-se: log 100 = 2. c) Qual seré o tamanho dos intervalos das classes? d) Construir a tabela das classes com seus limites. e) Determinar para cada classe: F,, fi, %, Facs acs Macs © Xi« f) Construir os histogramas das freqiiéncias absolutas e relativas. g) Analisando a tabela e os grdficos, redigir um breve relatério sobre as alturas desse grupo de pessoas. acionados no Anexo A. Retirar uma amostra aleatéria simples de 70 ae Construir uma tabela de distribuicao de freqiiéncias de sua amostra, bem) como os histogramas. Preparar um breve relatério que sintetize o compprtamento da varidvel tempo de servico. : 2.5 MEDIDAS DE TENDENCIA CENTRAL Como o préprio titulo sugere, nossa pretensao aqui é a determinacio e 0 calculo de medidas que oferegam o posicionamento da distribuigéo dos valores de uma varidvel que desejamos analisar. 2.5.1 Média aritmética ou média amostral A medida de tendéncia central mais comum para um conjunto de dados é a média aritmética. A média aritmética de uma amostra de n observacées — x, X2, «+ X, — representada pelo simbolo xX (1é-se x - barra), é calculada por: _ soma dos valores de x _ 1x nuimero de observacdes n EXEMPLO 2.2: Encontrar a média aritmética para o conjunto de observa- c6es: 5, 1, 6, 2, 4. Solugdo: temos cinco observacées: n = 5, entao: De 541167274 18 x eC n 5 5 38 ESTATISTICA GERAL F APLICADA Quando os valores de x; estéio agrupados com suas respectivas freqiiéncias absolutas F,, a média aritmética ou média amostral 6 expressa por: EXEMPLO 2.3: Determinar a idade média para 0 conjunto dos 50 funcio- narios considerados no exemplo da segao 2.4.2. Solug4o: Da tabela de distribuicéo de freqiiéncias, temos: Intervalos das classes Fi, x } XF; 18-25 6 21,5 { 129 25 | 32 10 28,5 | 285 324-39 | cals Se Oe |e a0 0U, 39 | 46 8 42,5 | 340 —A8 BO 8 2 eer od 00 oe [ic 150,0 i | 262,00. ere | S| 18? z 50 | 1,922 Logo: X = Zk ieee = 38,44 anos. 50 O resultado 38,44 anos é aproximado, uma vez que utilizamos os pontos médios x; como representantes das classes em que foram agrupadas as 50 ida- des. O valor da média aritmética, desconsiderando-se 0 agrupamento em clas- ses, é de: soma das idades 18+20+20+...+65 1.916 X= = 38,32 anos numero de observacdes 50 50 Observar: a diferenga entre os resultados foi de 38,32 - 38,44 = - 0,12. Assim, quando o analista dispuser da tabela de distribuigédo de freqiiéncias, e admitir que uma aproximagcao do calculo da média nao vai comprometer suas conclusées, poderd usar a formula para os dados agrupados. Caso contrario, de- vera utilizar a formula comum para o calculo da média aritmética. ee ESTATISTICA DESCRITIVA EXERCICIOS - SERIE I 2.6 2.7 2.8 2.9 A média minima para aprovacio em determinada disciplina é 5,0. Se um estudante obtém as notas 7,5; 8,0; 6,0; 2,5; 2,0; 5,5; 4,0 nos trabalhos mensais da disciplina em questo, pergunta-se se ele foi ou nao aprovado. A seguir, 6 dada a distribuicéo da quantidade de defeitos por microcompu- tador para uma amostra de 100 aparelhos: | quantidade de defeitos por Jol tf ef sf als 6 | | Namero de aparelhos [15 | 28 | 20 | 14 | 10 ts | Determinar o ntimero médio de defeitos por microcomputador. Calcular a média para cada uma das distribuigées: a x{3lai7is 2) fo} n 12 | 13 | A)2\/slej4) 3 Als] se]! 6| Ox f& @ wilt 9 « | A areas “7 [6 geese aot Gta tsis ons |. 9 | 18 88 | to 8 10 29 | 3 “6 28 a1 | 5/48 “90 | 5 6 [Aluguel | 4-6 64-8 /8}-10)t0-— 1212) 14/1410] 161-18 (em $ 100) | l | auantidade) 1@ | 25 | 32 | 40 | 30 | 18 | 12 de casas | | l { Considerar os dados do Exercicio 2.3. Calcular a média aritmética das 50 observag6es amostrais; em seguida, determinar a média com base nos da- dos da tabela de distribuicéio de freqiiéncias (dados agrupados em classes). Comparar os resultados obtidos — avalie a diferenca entre os dois resulta- dos para a nota média. 2.10 Considerar os dados do Exercicio 2.4 e calcular a média aritmética das 100 observacdes e a média para os dados agrupados. Contrastar os resultados obtidos. 40 ESTATISTICA GERAL E APLICADA, 2.11 Retirar uma amostra aleatéria simples de 40 funciondrios da empresa XPTO (Anexo A). Considerar as varidveis: salario e renda de cada elemen- to da amostra. Determinar o salario médio e a renda média. 2.5.2 Mediana Colocados em ordem crescente, mediana () é o valor que divide a amos- tra, ou populacdo, em duas partes iguais. Assim: x -—_—_+——4 0 50% 100% 2.5.2.1 Calculo da mediana - variavel discreta “ : ‘ n+1 Se n for fmpar, a mediana sera o elemento central (de ordem =. Sen for par, a mediana sera a média entre os elementos centrais (de ordem te Lay: 2 2 EXEMPLO 2.4: Calcular a mediana para as distribuicées: a) n= 11, né impar, logo (X) sera o elemen- to de ordem > ou seja, aoe = 6 Sera, portanto, 0 sexto elemento. Para Contém o identificé-lo, abre-se a coluna das Fre- < 6% elemento qiléncias Acumuladas (F,,). Por meio da F,,, encontra-se o valor (x;) correspondente 4 mediana. Neste exemplo, sera 0 3 (X = 3). Observar: é 0 x; correspondente a classe que contive: a ordem calculada, no caso 0 sexto elemento. ESTATISTICA DESCRITIVA = 41 b) x F, Fg n= 42, né par, logo (%) seré a média en- . l tre os elementos da ordem “e241, ou 82 5 | 5 oie 85 | 10 | 15 seja ¢ =21e 7 +1 = 22°. Como no eye 87 15 | 30 «< 21%@22* exemplo anterior, identificam-se os ele- =|. mentos de ordem 21 e 22 pela F,,. 8 | 88 go | 4 | 4 ’ zx | 4 Assim: 21° corresponde a 87; 22° corresponde a 87, logo 87 +87 _ 2 87 2.5.2.2 Calculo da mediana - varidvel continua n ea : 1" passo: Calcula-se a ordem 7. A variavel é continua, independente- mente se n é par ou impar. 2° passo: Pela F,,, identifica-se a classe que contém a mediana (classe Ma). 3" passo: Utiliza-se a formula: (=) : fo ee Fra em que: lyq = limite inferior da classe Md : n = tamanho da amostra ou ntimero de elementos Df = soma das freqiiéncias anteriores a classe Md h = amplitude da classe Md Fya = freqiiéncia da classe Md 42 ESTATISTICA GERAL E APLICADA EXEMPLO 2.5: Dada a distribuicéo amostral, calcular a mediana: Intervalo das classes F, ee 35-45 5 5 45 55 ie die 55 | 65 (oes | 35 < Classe Md 65 75 14 | 49 75} 85 6 | 55 85 | 95 3 [ 8B x 58 ie 1° passo: Calcula-se > Como n = 58, temos 3 = 29°. 2° passo: Identifica-se a classe Md pela F,.. Nesse caso, a classe Md é a 3*. 3° passo: Aplica-se a formula: No caso, Iy= 55 n=58 Sf=17 h=10 Fya=18 Logo: e -17).10 ¥=55+\2 _/ 6167 18 Entéo: 50% das observagées tem medidas abaixo de 61,67, e 50% acima desse valor. 2.5.3 Quartis Os quartis dividem um conjunto de dados em quatro partes iguais. Assim: 0% 25% 50% 75% 100% ef a Qr= Mo Qs ESTATISTICA DESCRITIVA 43 Q: = 1 quartil, deixa 25% dos elementos Q) = 2% quartil, coincide com a mediana, deixa 50% dos elementos Qs = 3° quartil, deixa 75% dos elementos Eis as formulas para os calculos de Q; e Q;, para o caso de variaveis conti- nuas. Determinacao do 1° quartil: 1° passo: Calcula-se a ordem. t 2° passo: Identifica-se a classe Q, pela F,.. 3° passo: Aplica-se a formula: Determinagao do 3° quartil: 1° passo: Calcula-se a ordem * 2° passo: Identifica-se a classe Q, pela F,.. 3° passo: Aplica-se a formula: EXEMPLO 2.6: Dada a distribuigdo, determinar os quartis (Q; e Q;) ea mediana. [ Classes F Fig TEW ee We 27 15 21 «< _ Classe Q, (contém o 14° elemento) 27 | 37 0 Al___| — Classe Ma (contém o 28° elemento) 37 LK 47 10 51 < Classe Q; (contém o 422 elemento) 47-57 6 56 a 56 44 ESTATISTICA GERAL E APLICADA Solugao: 1° passo: n = 56 Q=? ¥=? Qs, =? n_ 56 _ jy 3n _ 3(56) _ e 422 4.4 2 4 2° passo: Pela F,, identificam-se a classe Q; (2%), a classe Md (3%) e a classe Q; (4%). 3° passo: Uso das férmulas: Para Q; temos: lg = 17; n= 56; Yf=6; h=10; Fo, =15 Para ¥ temos: lyg = 27; n=56; Yf=21; h= 10; Fyg = 20 __-_-~,,_,_ EE Logo: (2-6) -10 Q =17+\4 A = 2238 (S-21} 10 x=27+52 =305 20 (te-a +10 = 37 +\—___«__ = 38 Q To Diante desses resultados, pode-se afirmar que, nessa distribuigdo, ha: 25% 25% 25% 25% Io ape 7 22,33 30,5 38 a7 Isto é: 25% das observacées estado entre 7 e 22,33 25% das observacées estado entre 22,33 e 30,5 25% das observacées estao entre 30,5 e 38 25% das observacées estao entre 38 e 57 estarisrica bescrirva 45 2.5.4 Decis Continuando o estudo das medidas separatrizes: mediana e quartis, ha os decis. Sao os valores que dividem a série em 10 partes iguais. 0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100% Di De Ds Ds Ds Ds Dr Ds Ds O calculo para um decil (D,) é dado por: 1° passo: Calcula-se a ordem 3, em que: i = 1, 2, 3, 4,5, 6, 7,8e9. 2° passo: Identifica-se a classe D; pela Fa.. 3° passo: Aplica-se a formula: em que: lp, = limite inferior da classe D; iz n = tamanho da amostra Y; = soma das freqiiéncias anteriores a classe D; h = amplitude da classe D, freqiiéncia da classe D; 2.5.5 Percentis Sao as medidas que dividem a série em 100 partes iguais. 0% 1% 2% 3% 50% a 97% 98% 99% 100% Py Pe Ps Peo Par Poss Pos O cdlculo de um percentil (P;) € dado por: 1° passo: Calcula-se a ordem io em que: i = 1, 2, 3; ..., 98, 99. 2° passo: Pela F,. identifica-se a classe Pj. 3° passo: Usa-se a formula: 46 ESTATISTICA GERAL, F APLICADA. em que: lp, = limite inferior da classe P; mM es fl tamanho da amostra amplitude da classe P; Fp, = freqiiéncia da classe P; i=1, 2,3, .., 99 soma das freqiiéncias anteriores a classe P; EXEMPLO 2.7: Determinar o 4° decil e o 72° percentil da seguinte distri- buigdo: Classes F, Fag 44-9 | 8 8 1 9h 14 12 20 < Classe D, 4-19 | 7 37 < Classe P» 19-24 | 3 40 2 l 40 Solucdo: Calculo do Dy: Calculo do Py»: 1° Passo: 1° Passo: in _ (40) _ 16. in _ 72(40) _ 99 go 10 10 100-100 : 2° Passo: Identificam-se as classes D, e Py. pela Fy. 3° Passo: Para D,: b= 9 38 n=40 h=5 F,=12 Para Pr: b,= 14 Df=20.n=40 h=5 F,=17 neauel a woal e205 10 12 72.40 100 -20)-5 =16,59 EsratisTica DEscRITIVA. 47 Portanto, nessa distribuicao, o valor 12,33 divide a distribuigéo em duas partes: uma (a esquerda) com 40% dos elementos e a outra com 60%. O valor 16,59 indica que 72% dos elementos da distribuigdo esto abaixo de 16,59 e 28% acima. 2.5.6 Moda Dentre as principais medidas de posigio, destaca-se a Moda. Eo valor mais freqiiente da distribuicado. Para distribuicdes simples (sem agrupamento em classes), a identificagao da Moda é facilitada pela simples observacao do ele- mento que apresenta maior freqiiéncia. Assim, para a distribuicao: x, Qas cl 205 | 2d 25 307 AR | 7 a: oa | 1 2 | 8 a moda sera 248. Indica-se: M, = 248. Para dados agrupados em classes (varidveis continuas), hd diversas formu- las para o calculo da Moda. Destacaremos 0 cdlculo da moda por meio da férmu- la de Czuber. 1° Passo: Identifica-se a classe modal (classe com maior freqiiéncia). 2° Passo: Aplica-se a formula: i tAg em que: 1,,, = limite inferior da classe modal A, = diferenga entre a freqiiéncia da classe modal e a freqiténcia da classe imediatamente anterior diferenga entre a freqiiéncia da classe modal e a freqiiéncia da classe imediatamente posterior h = amplitude da classe modal Ag EXEMPLO 2.8: Determinar a moda para a distribuigdo: 23 | 34-4 | 4E5 1 Glasses | O}—1 12 | F, 3 10 7 8 oo 1° Passo: Indica-se a classe modal. No caso, trata-se da 3* classe: 2 }— 3. 2° Passo: Aplica-se a formula: 48 ESTATISTICA GERAL E APLICADA em que: ly, A, =17-10=7 A, =17-8=9 h=1 Portanto: M, =2+—2 749 1=2,44 EXEMPLO 2.9: Calcular a moda para a distribuicdo: _Salérios (USS)_ =| 80 180 } 180-260 | 250}-~300 | 300 }500_ Ne de empregados 70 140 | ao | 60 Observar que as amplitudes das classes nao so iguais. Nesse caso, é preci- so calcular as densidades das classes: F; + h, para identificar qual a classe modal (aquela com maior densidade). Assim: [satarios (uss) || | | | 70 | | jE OD ea al ee ee | | (70) | 140 ; 14070=2,0 | he ae a | 60) | 140 140/50=2,8 | < classe modal [250 | 300 fe | (200) 60 | 0200-03 | OO O00 SS 1° Passo: Indentifica-se a classe modal. No caso, sera a 3* classe: eeeeeaee 2° Passo: Aplica-se a formula, onde: ly, = 250 Ay = 2,8 - 2,0 = 0,8 A, = 2,8 - 0,3 = 2,5 h =50 M, =250 + 28.50 = 262,12 08+25 ESTATISTICA DESCRITIVA 49 Portanto, o salério mais freqiiente para esse grupo de 410 empregados é US$ 262,12. EXERCICIOS - SERIE III 2.12 Para cada série, determine a mediana: D 1, 3, 3, 4, 5, 6,6 MD) 12, 7, 10, 8, 8 ID 1, 3, 3, 4, 6, 8, 8,9 IV) 82, 86, 88, 84, 91, 93 2.13 Para cada distribuic&éo, determine a mediana: d |x 2{3f4 [5 ]7] mlx | 12/13 [15 | 47 | LA 3] 5 | 38) 4! ol F, | 5 | 13 | 18 | 20 1) _ x,_| 232 | 235 | 237 | 240 | 2) (re Ls! aol asl ot a ID] x | 73 | 75 | 7 | 79 L fe 2 | 10_\ 12 | 5. 2.14 Para cada distribuicéo, determine a mediana: ee — = D | Glasses | i. ..4..4_—2— LF Sao a | 6 | 4 3 | Gases | 22-25 {| a5p—28 | zero | so ae i | 23 | so [| 2» | 2.15. Para cada série, determine a moda: D 3,4, 7,7, 7, 8, 9, 10 I) 43, 40, 42, 43, 47, 45, 45, 43, 44, 48 2.16 Para cada distibuigio, determine a moda: p | «|v [75 [re] | mlx) 25) 35 | a5 | 6s | Fr] 8 te) tetas | (pe ae |, ae i0n\eo 2.17 Para cada distribuigao, determine a moda: D | Classes | 7/10 | 10/13 | 13/16 | 16,19 |. tame | LA] 6 a ae ee 50 2.18 2.19 2.20 STATISTICA GERAL B APLICADA 1) | Glasses | 10-20 20-30 | 30/40 | 40;-50 F 7 19 Para as distribuicdes: D | clsses| 4)-6 | 6-8 | 8} 10 | 1; 12 | eo | i | 15 5 (Ge | i | a0 ao aij os oe (Fe 3 a Calcule: D2, P4g € Q3. Interprete-as. A seguir, temos a distribuic&o do ntimero de acidentes didrios, durante 53 dias, em certa rodovia: (eeu 0 i oo | [Ne de dias (5 1 | 10 3 Pede-se: a) Determinar a média. b) Determinar a mediana. c) Calcular a moda. d) Qual a porcentagem de dias em que tivemos dois ou mais acidentes por dia? O ntimero de operarios acidentados por més em uma fabrica nos ultimos dois anos foi: Seer as ane jan. Fev. | Mar. | Abr. Maio | Jun. | Jul. | Ago. [set [en Nov. | Dez | jt fe {4 — Geo ees ee a als t 7l+{eis{wislatalsfatalta Fazer X — numero de operdrios-acidentados por més. a) Construir a distribuicgdo de freqiiéncia. b) Calcular a média, mediana e moda. 2.21 ‘Idade (anos) =~ + -|, +2 +¢ob | ede esTATIsTICA DEscriTIVA = 51 Sendo: 10; 14]14 | 18/18 | 2222 | 26 26 | 30(30 34134 }— 38 (38 | 42| | | 15 | a ) 30 20 15 10 5 [pessoas | i | | 2.22 a) Determinar a média. b) Calcular a medida que deixa 50% dos elementos. c) Determinar e interpretar a moda. d) Calcular e interpretar o 3° decil. e) Determinar a medida que deixa ¥% dos elementos. f) Calcular e interpretar o percentil 80°. A seguir, estao dadas as notas (em créditos) de 50 alunos: 60 85 33 52 65 77 84 65 74 57 71 35 81 50 35 64 74 47 54 68 80 61 41 91 55 73 59 53 77 45 41 55 78 48 69 85 67 39 60 76 94 98 66 66 73 42 65 94 88 89 Pede-se: a) Determinar a amplitude total da amostra. b) Numero de classes pela formula de Sturges. Dado log 50 = 1,7. ) Amplitude das classes. d e) Freqiiéncias absolutas das classes. Quais as classes? (Iniciar pelo 30.) f) Freqiiéncias relativas. g) Pontos médios das classes. h) Freqiiéncias acumuladas crescentes. i) Histograma das freqiiéncias absolutas. ) Calcular a média amostral. 1) Calcular e interpretar a moda. m) Calcular e interpretar a médiana. n) Determinar e interpretar 0 1° quartil. 0) Calcular e interpretar 0 55° percentil. 52 _ESTATISTICA GERAL E APLICADA 2.6 MEDIDAS DE DISPERSAO Sao medidas estatisticas utilizadas para avaliar o grau de variabilidade, ou dispersdo, dos valores em torno da média. Servem para medir a representativi- dade da média. dispersao Sejam as séries: (a) 20, 20, 20 (b) 15, 10, 20, 25, 30 Tem-se: ¥, = 20 e ¥, = 20 Observar: apesar de as séries terem médias iguais, a série a nado apresenta disperséo em torno da média: x, = 20, enquanto os valores da série b apresen- tam dispersdéo em torno da média X, = 20. Nesta sec&o so apresentadas medi- das estatisticas que avaliam o grau de disperso, ou variabilidade, de uma va- riavel. 2.6.1 Amplitude total E uma medida de dispersio dada pela diferenca entre o maior e 0 menor valor da série. R= Xinde — Xin | EXEMPLo 2.10: Para a série: 10, 12, 20, 22, 25, 33, 38 R = 38-10 = 28 A utilizacdo da amplitude total como medida de dispersao € limitada, pois sendo uma medida que depende apenas dos valores externos, n4o capta possi- veis variacdes entre esses limites. 2.6.2 Variancia amostral Como se deseja medir a disperséo dos dados em relacdo 4 média, é inte ressante analisar os desvios de cada valor (x;) em relacéo a média. xX, isto d; = (x; — X). Se os d; forem baixos, teremos pouca dispersao; ao contrario, se desvios forem altos, teremos elevada dispersiio. E facil constatar que a sor: ESTAT{STICA DESCRITIVA, 53 dos desvios em torno da média é zero. Isto é: Ld; = 0. Para o calculo da varidn- cia, consideram-se os quadrados dos desvios: d?. A varidncia, S?, de uma amostra de n medidas é igual 4 soma dos quadrados dos desvios: ¥° d?, dividida por (n - 1), assim: para dados agrupados, hi 2 n-1 Te- =A Desenvolvendo o quadrado das diferencas: (x; — ¥)°, e somando os termos comuns, encontram-se as seguintes férmulas praticas para o cdlculo da varidncia amostral: s?=_t [a+] | oa | - : [xan at _ n | n-1 n n-1 | Quanto maior o valor de S?, maior a dispersio dos dados amostrais. EXEMPLO 2.11: Calcular a variancia para as medidas amostrais: 3, 7, 2, 1s Solugdo: Vamos determinar S? pela formula basica. Para tanto, é inte- ressante a construcao da seguinte tabela: mw = =? 7 3 | -42)=-1.2 a) moe 2 eet 1 | 32 | 10,24 ; ee Oe ee ad eat | 0 | 3300 OT 54 STATISTICA GERAL E APLICADA Logo, a varincia amostral serd: Agora, vamos determinar S$? pela aplicagdo da férmula prdtica. Para tanto, € interessante a construgao da seguinte tabela: Bo — oF | 9 _— To Soa a 8 | 64. ra | 127 2.6.3. Desvio padrao amostral Como explicado no item 2.6.2, 0 cdlculo da variancia é obtido pela soma dos quadrados dos desvios em relacio 4 média. Assim é que, se a varidvel sob andlise for medida em metros, a variancia deverd ser expressa em m? (metros ao quadrado). Ou seja, a variancia é expressa pelo quadrado da unidade de me- dida da varidvel que esta sendo estudada. Para melhor interpretar a dispersao de uma varidvel, calcula-se a raiz quadrada da variancia, obtendo-se 0 desvio padrao que sera expresso na unidade de medida original. Assim: s=Vs? O desvio padrao das cinco medidas amostrais do exemplo 2.11 é dado por: s = V8? =J9,7 =3,1 ESTATISTICA DESCRITIVA 55 2.6.4 Interpretacao do desvio padrao Nesta secao, vamos apresentar duas regras para interpretacéo do desvio padrao: 1) 24) Regra Empirica Para qualquer distribuicgéo amostral com média X e desvio padrao S, ha: ¢ O intervalo X+S contém entre 60% e 80% de todas as observacdes amostrais. A porcentagem aproxima-se de 70% para distribuicdes apro- ximadamente simétricas, chegando a 90% para distribuigdes fortemente assimétricas. . ¢ O intervalo x+2S contém aproximadamente 95% das observacées amostrais para distribuigdes simétricas e aproximadamente 100% para distribuicdes com assimetria elevada. ¢ O intervalo X £35 contém aproximadamente 100% das observacées amostrais, para distribuicées simétricas. Teorema de Tchebycheff Para qualquer distribuicéo amostral com média X e desvio padrao S, ha: ¢ O intervalo X+2S contém, no minimo, 75% de todas as observagdes amostrais. © O intervalo X+3S contém, no minimo, 89% de todas as observacdes amostrais. EXEMPLO 2.12: Calcular a variancia e o desvio padrao da seguinte dis- tribuicéo amostral: Solucdo: Célculo da variancia amostral 56 _ ESTATISTICA GERAL E APLICADA, E conveniente a construgiio da tabela: x, F, XF; xiF, So a 7 Se ey 27 : fe | —_— [108s [ ae 16-1 16 st = i [toss 186) = 2 [17228 eee] 16 Logo, a variancia amostral é 2,86. Calculo do desvio padrao amostral Como: S = /S?, logo S = 2,86 = 1,69. EXEMPLO 2.13: Com os dados do exemplo 2.3 - distribuicao amostre. das idades de 50 funciondrios da empresa XPTO -, vamos determinar a varia-.- cia, o desvio padrao, e constatar as regras para interpretagao do desvio padrao Solugao: Com base nos dados do exemplo 2.3, pode-se construir a sé- guinte tabela de distribuigéo de freqiiéncias: _Intervalos das classes | F, ci XF fe _XTF; ee ||| 778,50 25 32 | 10 28,5 285 | 8.122,5¢ 3239 [as 35,5 461,50 | 1638350 eee ee | acon ee | : 53 60 I 5 56,5 | 60 -_67 | 2 63,5 | y [50 1.922 | 80.856,50 STATISTICA DESCRITIVA 57 — = 38,44 anos. n 50 Logo, a média amostral sera: ¥ Quanto a varidncia amostral: = h [zen Co) n-1 a 49 2 1.922 80.456,50 — Cas = 134,18 n 50 Eo desvio padrio: $ = /S? = 13418 =11,58 anos. Verificacdo das regras para interpretacdo do desvio padrao: ¥ +S =38,44 +11,58 = (26,86 ; 50,02) Com auxilio dos dados da Tabela 2.2, concluimos que, entre 27 € 50 anos, temos: (33/50) 100 = 66% das observacées. Isto é: o intervalo compreendido entre a média menos um desvio padrdo e a média mais um desvio padréo con- tém, nesse exemplo, 66% das 50 idades. A regra empirica indica que o referido intervalo devera conter de 60% a 80% das observacées. ¥+2S = 38,44 + 2(11,58) = (15,28 ; 61,60) Com auxilio dos dados da Tabela 2.2, concluimos que, entre 16 e 62 anos, temos: (49/50) 100 = 98% das observacGes. Isto é: o intervalo compreendido entre a média menos duas vezes o desvio padrao e a média mais duas vezes 0 desvio padrao contém, nesse exemplo, 98% das 50 idades. A regra empirica in- dica que o referido intervalo deverd conter aproximadamente 100% das obser- vacdes para distribuicdes com assimetria elevada. A distribuigdo com que esta- mos trabalhando é acentuadamente assimétrica. O resultado de 98% também confirma 0 critério de Tchebycheff que define no minimo 75% de observacées para o intervalo x +2S. 2.6.5 Coeficiente de variagéo de Pearson Trata-se de uma medida relativa de dispersdéo. Enquanto a amplitude total (R), a variancia (S*) e o desvio padrao (S) sio medidas absolutas de dispersao, 0 coeficiente de variaco (C.V.) mede a dispersao relativa. Assim: Ss C. «100 onde: S = desvio padrao amostral xX = média amostral 58 ESTATISTICA GERAL F. APLICADA Eis algumas regras empiricas para interpretacdes do coeficiente de varia- cdo: Se: CV. < 15% ha baixa dispersdo Se: 15% < C.V. < 30% ha média dispersio Se: CV. = 30% ha elevada dispersio EXEMPLO 2.14: Em uma empresa, o salario médio dos homens é de $ 4.000, com desvio padrao de $ 1.500, e 0 saldrio médio das mulheres é de $ 3.000, com desvio padrao de $ 1.200. A dispersdo relativa dos saldrios é maior para os homens? Solugao: Dos dados do problema temos: Homens: xX, = 4.000 Sy = 1.500 Mulheres: X,,;= 3.000 Sy = 1.200 para os homens: C.V.= 5#.x100 = 15 ,, 100 = 37,5% Xs 4.000 para as mulheres: C.V, = 5! x100 = 120 ,. 100 = 40% cy 3.000 Resposta: Os saldrios das mulheres tém dispersdo relativa maior do que os saldrios dos homens. As duas distribuigées apresentam elevada dispersio (CV. > 30%). 2.6.6 Escore padronizado Outra medida relativa de dispersdo é 0 escore padronizado para uma medi- da x;. E dado por: onde: X = média amostral S = desvio padrao amostral Um escore Z; negativo indica que a observacao x; esta a esquerda da mé- dia, enquanto um escore positivo indica que a observacao esta a direita da média. EXEMPLO 2.15: Sado dadas as médias e os desvios padrées das avaliagées de duas disciplinas: Portugués Matematica Xp = 6,5 Xy = 5,0 Sp = 1,2 Su = 0,9 EstaristicA DEScRITIVA == 59. Relativamente as disciplinas Portugués e Matematica, em qual delas obte- ve melhor performance um aluno com 7,5 em Portugués e 6,0 em Matematica? Solugao: Vamos determinar os escores padronizados para as notas obti- das: Nota de Portugués: Zp = ae = 0,83 -_ ees A melhor performance relativa deu-se na disciplina Matematica, pois Zy > Zp. Observe que, em termos absolutos, o aluno conseguiu melhor nota em Portu- gués, 2.6.7 Detectando outliers Nos trabalhos de coleta de dados, podem ocorrer observagdes que fogem das dimensées esperadas — os outliers. Para detecté-los, pode-se calcular 0 esco- re padronizado (Z,) e considerar outliers as observacdes cujos escores, em valor absoluto (em médulo), sejam maiores do que 3. EXEMPLO 2.16: Os dados de uma pesquisa revelaram média 0,243 e desvio padrao 0,052 para determinada varidvel. Verificar se os dados 0,380 e 0,455 podem ser considerados observagées da referida varidvel. Solugdo: Tem-se: % = 0,243 S = 0,052 para x; = 0,380 Ze Ost0E 028 © 763 0,052 para x; = 0,455 Z, = 02455 = 0.243 _ 4 og 0,052 Resposta: 0 dado 0,380 pode ser considerado normal; por outro lado, 0,455 pode ser um outliers, portanto descartavel. 2.7 MEDIDAS DE ASSIMETRIA Denomina-se assimetria o grau de afastamento, de uma distribuigéo, da unidade de simetria. Em uma distribuigdo simétrica, hd igualdade dos valores da média, mediana e moda. Eis uma ilustracdo grafica de uma distribuicdo si- métrica. 60 ESTATISTICA GERAL E APLICADA Eixo de simetria Em uma distribuicao assimétrica positiva, ou assimétrica a direita, hd: M, 0, diz-se que a distribuicdo é assimétrica positiva. AS <0, diz-se que a distribuicdo é assimétrica negativa. EXEMPLO 2.17: Dada a distribuicéo amostral, calcular os dois coeficien- tes de assimetria de Pearson. | Salérios ($ 1.000) | 30}—50_ 50 100 [400-150 Empregados 80 50 | 30 Para aplicar as formulas, é necessdrio calcular média, moda, desvio pa- drao, 1° e 3° quartis e mediana. Assim: | Classes XF; XxTF; | Glasses. 2 | | 30} 50 3.200 128.000 | 50 100 3.750 281.250 100} 150. ana z 10.700 878.000 00 _ 66,875 . =30+—4_.20 = 41,429 7 +3 : 5? - 1|878.000 — 29.700)" | _ 1 92162 159 S = 31,96 (40-0) =30 20 = 40 Qa 60 Qs =50+ O20) 50 = 90 x =30 + 89=9 99 - 50 80 62 tiva. 10 5 13. 13 ESTATISTICA GERAL E APLICADA 2x _ 40+90-2(50) _ 90 — 40 = 95,875 ~ 41,429 _ p796 0.6 Como, nos dois casos, AS > 0, diz-se que a distribuicgdo é assimétrica posi- EXEMPLO 2.18: Obtencdo das estatisticas descritivas pelo uso do Micro- soft Excel. Sao dadas 60 rendas de familias do bairro Psiu (dados em $ 1.000). 3 15 13» 3 12 9 6 5 14 4 13 g NOteSy_~rHes— wRoneanor tay 6 4 15 4 f — \ Medidas estatisticas T ' _ | Média | 7,683 Erro padrao. | 0,582 Mediana 7,500 Moda | 3,000 Desvio padrao. - ' 4.508 Variancia da amostra } 20,322, Curtose (oo staz5 Assimetria { 0,284 Interval | 15,000 Minimo \ 4,000 Maximo \ 16,000 Soma | 467,000 | Contagem 60,000 | | | | | | | | | | | | Neste exemplo, foi utilizada a Funcio Estatistica do Excel — Microsoft. Os resultados podem ser interpretados, sinteticamente, da seguinte maneira: * Arenda média do conjunto das 60 familias é de $ 7.683. * O erro padrao = quociente entre o desvio padrio ea raiz quadrada de n, no caso n = 60, é de $ 582. tante 50%, acima desse valor (veja que a mediana é 7,500). . 60 familias é de $ 3.000. . Cingiienta por cento das familias tém renda inferior a $ 7.500, ¢ o res- A moda igual a 3,000 significa que a renda mais freqiiente do grupo de A disperso em tomno da média, medida pelo desvio padrao, é de $ 4.508. ‘A medida de curtose avalia 0 grau de achatamento da distribuicdo, e, neste exemplo, indica que a distribuicao é leptoctirtica (é delgada), pois 0 coeficiente é negativo. EstaTisrica Descrrva 63 A distribuigao das rendas é suavemente assimétrica a direita (coeficiente 0,284). Veja, a moda é menor do que a mediana, e a mediana é menor do que a média. A amplitude total € igual a $ 15.000, ou seja: $ 16.000 ~ $ 1.000. A menor renda é $ 1.000, enquanto a maior é de $ 16.000. O somatério de todas as rendas atinge $ 461.000, ¢ a quantidade de ele- mentos, no caso familias, é 60 (contagem 60,000). EXERCICIOS - SERIE IV 2.23 2.24 2.25 2.26 Dada a amostra: 2, 3, 4, 5, 7, 10, 12. a) Qual é a amplitude total? b) Calcular a variancia. ©) Determinar o desvio padrao. Calcular a variancia amostral: Glasses | 2}-4,/ 4h-6 | -10 | 10}-12 | Fi a fs t | sae tase | mene eel | sete ones |oaen ee A seguir, temos a distribuicao de freqiiéncia dos pesos de uma amostra de 45 alunos: [Peso em ky [4045 | 45 50 50 F565 | 85 60] 60 65 65/70] «| ww foe i]s | 8 N° de alunos a) Determinar o peso médio. b) Determinar a varidncia. ©) Qual € 0 valor do coeficiente de variacéio? d) A distribuigao é simétrica? A distribuigao a seguir possui desvio padrao igual a 3,02. Determinar o valor do coeficiente de variacao e interpreté-lo. | Glasses | op4 | | or 4 | Freqiiéncia | 64 2.27 2.28 2.29 ESTATISTICA GERAL APLICADA Um fabricante de caixas de cartolina fabrica trés tipos de caixas. Testa-se a resisténcia de cada caixa, tomando-se uma amostra de 100 caixas e de- terminando-se a pressao necessdria para romper cada caixa. Sao os se- guintes os resultados dos testes: Tipos de caixas _ _ | “Presséio média de ruptura (béria) «| —150— | = 200 Desvio padrdo das presses (baria) || 40 _ 50 a) Que tipo de caixa apresenta a menor variacao absoluta na pressdo de ruptura? b) Que tipo de caixa apresenta a maior variacao relativa na presséo de ruptura? Um pesquisador de radio XY aborda 30 transeuntes ao acaso e pergun- ta-lhes a idade. O resultado é dado pela tabela: 35 26 39 25 39 22 42 40 30 22 21 40 16 32 39 21 28 39 18 37 23 14 27 44 30 32 21-15 26 43 a) Resumir as informagées sob forma de uma distribuicao de freqiiéncia. Dado log 30 = 1,48. b) Apresentar os dados na forma de um histograma. c) Calcular a média e o desvio padrao. Cronometrando o tempo para varias provas de uma gincana automobilis- tica, encontramos: Equipe 1: 40 provas Tempo médio: 45 segundos Variancia: 400 segundos ao quadrado Equipe 2: tempo: 20 40 50 80 N° de provas: 10 15 30 5 a) Qual 0 coeficiente da variacio relativo & equipe 1? b) Qual a média da equipe 2? c) Qual o desvio padrao relativo 4 equipe 2? d) Qual a média aritmética referente 4s duas equipes consideradas e=. conjunto? e) Qual a equipe que apresentou resultados mais homogéneos? Justifice- £) Qual a equipe que apresentou menor dispersao relativa? ESTATISTICA DESCRITIVA 65 2.30 Dada a amostra de 60 rendas (em milhares) de dada regiao geogrdfica: 2.31 D 7 8 5 4 3 2 9 9 6 15 1 13 14 4 3 6 6 8 11 12 13 14 2 15 5 4 10 1 3 8 10 11 13 14 15 16 9 5 3 2 3 3 4 4 4 6 7 8 9 1 12 13 14 16 Agrupar os elementos em classes. Sendo K = 6 eh = 3. Construir o histograma. Calcular a média. Calcular e interpretar a mediana. Determinar e interpretar 0 3° quartil. Calcular e interpretar o 4° decil. Calcular e interpretar o 47° percentil. Determinar a medida que deixa 25% das rendas. Determinar a variancia. Determinar o desvio padrao. Qual é o valor do coeficiente da variagao? m) A distribuigao é simétrica? n) Constatar as regras para interpretagaio do desvio padrao. Considerar a populacao dos funcionarios da empresa XPTO (Anexo A). a) b) °) d) e) Retirar uma amostra aleatéria simples de 60 funcionarios, registran- do os valores das rendas familiares. Construir uma tabela de distribuicéio das freqiiéncias, Calcular e interpretar todas as medidas de tendéncia central apresen- tadas neste capitulo. Calcular e interpretar todas as medidas de dispersao apresentadas nes- te capitulo. A distribuigdo é simétrica? Preparar um relatério que explique as rendas familiares dos emprega- dos da XPTO. 66 _ESTATISTICA GERAL E APLICADA. EXERCICIOS - SERIE V 2.32 Para cada uma das questées a seguir, assinale a alternativa correta: 1. A média aritmética é a razdo entre: a) ( ) o nimero de valores € 0 somatério deles; b) ( ) © somatério dos valores e o numero deles; c) (_) os valores extremos; d) (_) os dois valores centrais. Na série 60, 90, 80, 60, 50, a moda sera: a) ( ) 50; b) C ) 60; ©) ( ) 66; d) ( ) 90. A medida que tem o mesmo numero de valores abaixo e acima dela é: a) ( ) a moda; b) ( ) a média; c) ( ) a mediana; d) (_) o lugar mediano. A soma dos desvios entre cada valor e a média é: a) (_ ) positiva; b) ( ) negativa; c) ( ) diferente de zero; d) (+) zero. Na série 60, 50, 70, 80, 90, o valor 70 sera: a) ( ) a média e a moda; b) ( ) a média e a mediana; c) ( ) a mediana e a moda; d) ( ) a média, a mediana e a moda. Quando queremos verificar a questaéo de uma prova que apresentc— maior numero de erros, utilizamos: a) ( ) moda; b) (_) média; c) € ) mediana; d) ( +) qualquer das anteriores Dado o histograma a seguir, no interior de cujos retangulos forz~ anotadas as freqiiéncias absolutas, entéo a mediana é: 30 25 20 10 15 2 4 6 8 10 12 aC ) 65 b) ( ) 6,0 OC ) 7,5 ad). 10. 11. 12. EE gsTaristica DescRmIvA 67 Na série 15, 20, 30, 40, 50, ha abaixo da mediana: a) ( ) 3 valores; b) (_ ) 2 valores; ©) ( ) 3,5 valores; @ ( ) 4 valores. Dada a figura a seguir, podemos afirmar que: F x a) (.) amoda é major do que a mediana e menor do que a média; b) ( ) amoda é menor do que a mediana e maior do que a média; ©) () a moda € menor do que a mediana e esta maior do que a média; d) () amediana é maior do que a média e menor do que a moda. 0 coeficiente de variacao é uma medida que expressa a razdo entre: a) (_) desvio padrao e méd b) (_) média e desvio padrao; ©) (_) amplitude semi-interquartélica e mediana; d) (_) desvio padrao e moda. O cdlculo da variancia supée 0 conhecimento de: a) (_) média; b) (_) mediana; ©) (_) ponto médio; d) (_) moda. Numa distribuicéo de valores iguais, 0 desvio padrao é: a) ( ) negativo; b) (_) positivo; ©) ( ) a unidade; d) ( ) zero. Na série 10, 20, 40, 50, 70, 80, a mediana sera a) ( ) 30; b) ( ) 35; ©) C ) 40; d) ( ) 45. ESTATISTICA GERAL # APLICADA 14. Examinando a figura a seguir, podemos dizer que: SX A “| Ss. : a) () 0 desvio padrao da distribuigéo A é maior do que o da distri- buicdo B, e as médias sao iguais; b) (_) 0 desvio padrao de A é menor do que o de B, e as médias sao diferentes; ©) ( ) 0 desvio padrao de A € igual ao de B, independentemente do valor da média; d) (_) as distribuigdes possuem 0 mesmo coeficiente de variacdo. 15. Realizou-se uma prova de Matematica para duas turmas. Os resulta- dos foram os seguintes: TumaA:¥=5 e $ =25 TurmaB:¥=4 e S=2 Com esses resultados, podemos afirmar que: a) ( ) a turma B apresentou maior dispersao absoluta; b) (_) a dispersao relativa ¢ igual a dispersdo absoluta; ©) ( ) tanto a disperséo absoluta quanto a relativa sio maiore: para a turma B; 4) ( ) a dispersao absoluta de A é maior do que a de B, mas er. termos relativos as duas turmas nao diferem quanto ao gra~ de dispersao das notas. 16. O desvio padrao de um conjunto de dados é 9. A varidncia sera: a) ( ) 3; _ oC ) 36; d) ( ) 81. ESTATISTICA DESCRITVA 69 17. Cingiienta por cento dos dados da distribuigao situam-se: a) (_ ) abaixo da média; b) () acima da mediana; ©) (_ ) abaixo da moda; d) (_ ) acima da média. 18. Dada a figura a seguir (poligono de freqiiéncia), o primeiro quartil da distribuicdo sera: 2 4 6 8 10 12 Classes a) ( oC 19. Os coeficientes de variacao dos resultados a seguir sao: Estatistica: ¥ = 80 $= 16 Histéria: xX = 20 S=5 a) ( ) 16% e 40%; D) ( ) 20% e 25%; oO) ( ) 50% e 40%; d) ( ) 80% e 40%. 20. Média, mediana e moda sao medidas de: a) (_ ) dispersao; b) ( ) posicao; ©) (_ ) assimetria; d) ( ) curtose. 21. Uma empresa possui dois serventes, recebendo saldrios de $ 2.500,00 cada um, quatro escriturdrios recebendo $ 6.000,00 cada um, um chefe de escritério com saldrio de $ 10.000,00 e trés técnicos rece- bendo $ 22.000,00:cada um. A média desses saldrios é: a) (_ ) $ 1.050,00; b) (_) $ 5.050,00; c) ( ) $ 26.250,00; d) ( ) nea. 70 _ESTATISTICA GERALE APLICADA 22. O valor dominante de uma distribuicdo de freqiiéncia chama-se: a) ( ) mediana; b) (_). média; ©) ( ) moda; d) ( ) 1° quartil. 23. Na distribuigdo a seguir: Classes A moda é: | a) ( ) 50,6; b) C ) 55; } ( ) 50; d) ( ) 56. 24, Para a distribut A média sera: i a) () 350; b) ( -) 313; © ( ) 324,76; d) ( ) 323,80. 25. O valor da medida que deixa 45% dos elementos da distribuigdo é - - | Renda [10 20120 30/30 | 40/40 | 50/50 | 60/60 } 70|70 | 80/80 | 90190 | ~ 12: iu : : [elias i +: |Ne de | | | | | / Familias) 50 | 100 | 150 | 250 | 150 | 100 | 8 | 70 | 50 a) ( ) 45; b) C ) 50; oC ) 46; d) ( ) 63. 26. 27. 28. 29. 30. O 5° decil da distribuicdo é: Classes ae 2 ay | | F | 5 a) ( ) 7,20; c) ( ) 6,60; A média da distribuigdo é: | _ Classes a OL 6 Fo 1 a) ( ) 12,0; ec) ( ) 10,83; esratistica Descrrrva = 71. b) ( ) 5,50; b) C ) 85; d ¢ ) 11,4. O desvio médio da distribuicéo amostral é: Classes en ee ee [130-150 _| Fo Loe a) ( ) 12; b) ( ) 14 ©) C ) 16; d) ( ) 20. A variancia da distribuicao populacional é: [ Classes | 1-3 Se Lot | 5 a) ( ) 2,24; ) ( ) 2,55 Seo tol ae 2 | 2 | oe un Ee mn oF pa b) ( ) 2,8; dc )4 A média de uma série de valores iguais a uma constante é: a) ( ) zero; b) (_) 0 valor da constante; c) ( ) a unidade; d) (_) nao € possivel calcular o desvio padrao.

You might also like