P. 1
Apontamentos de Estatística Descritiva 2011-2012

Apontamentos de Estatística Descritiva 2011-2012

|Views: 1,389|Likes:
Published by daff93

More info:

Published by: daff93 on Nov 13, 2011
Copyright:Attribution Non-commercial

Availability:

Read on Scribd mobile: iPhone, iPad and Android.
download as PDF, TXT or read online from Scribd
See more
See less

05/16/2013

pdf

text

original

Probabilidades e Estatística

Estatística Descritiva
Introdução
Estatística – Ciência/Disciplina cujo objectivo fundamental é a recolha, a compilação, a análise e a interpretação de dados. Nota: A palavra “estatística” deriva da palavra alemã “staatenkund” que significa “ciência das coisas do estado”. Os primeiros estudos estatísticos tinham como objectivo o conhecimento dos bens do Estado e de como estavam distribuídos pela população. Como todas as ciências, a Estatística utiliza uma linguagem própria. Assim, num estudo estatístico, começamos por definir: População/Universo – conjunto de elementos com determinada característica em comum e com interesse para o estudo. Ex.: Objectivo: estudar a altura dos alunos do IPCB. População: conjunto de todos os alunos do IPCB. População Alvo – a totalidade dos elementos sobre os quais se deseja obter determinado tipo de informação. Ex: Aceitação de uma bebida alcoólica pelos portugueses. População: Habitantes de Portugal. População Alvo: Portugueses maiores de idade (≥ 18 anos). Finita – número de alunos de uma escola. População Infinita – conjunto das temperaturas nos diversos pontos do país num determinado momento. Cada elemento da população é designado por unidade experimental ou unidade estatística. Ex.: cada aluno do IPCB constitui uma unidade experimental do estudo das alturas dos alunos do IPCB.

NATÉRCIA SANTOS

2011/2012

1

PROBABILIDADES E ESTATÍSTICA

ESTATÍSTICA DESCRITIVA

Se vamos estudar a altura dos alunos do IPCB, à característica “altura” chamamos variável estatística. Variável Estatística – característica ou atributo em estudo, comum a todos os elementos de uma população. Ex.: cor dos olhos, altura, idade, etc. Quantitativa: quando se expressa numericamente (altura, peso, etc.) (mensurável). Variável Estatística Qualitativa: quando se expressa nominalmente (profissão, cor dos olhos, religião, etc) (não mensurável). Cada variável pode tomar um determinado conjunto de valores. Ex.: cor dos olhos (variável) –> azul, castanho, verde, etc. (valores)

Discreta: pode tomar um número finito de valores. Ex.: nº de golos num jogo. Variável Estatística Quantitativa Contínua: pode tomar um número infinito de valores. Ex.: peso corporal, altura, etc.

Ao resultado da observação de uma variável chama-se dado estatístico. Não classificado: sem qualquer ordenação. Dado Estatístico Classificado: agrupados através de um quadro estatístico. Ex.: abb cad dbc Valores qualitativos Dados não classificados xi a b c d Fi 2 3 2 2

Dados classificados

NATÉRCIA SANTOS

2011/2012

2

Ex. Se for seleccionada uma boa amostra. Nem sempre é possível ou conveniente analisar todos os elementos da população em estudo.PROBABILIDADES E ESTATÍSTICA ESTATÍSTICA DESCRITIVA Nota: por vezes é conveniente fazer corresponder um número a cada expressão nominal correspondente a um dado qualitativo para facilitar o tratamento dos dados. Ex. porque: • • O universo é infinito ou demasiado extenso. e com base nesses resultados efectuar uma boa avaliação dos parâmetros correspondentes da população (Ex. . NATÉRCIA SANTOS 2011/2012 3 . Este processo permite.: Pressões atmosféricas nos diversos pontos da terra.: Experimentar fósforos para verificar se têm problemas. Nestes casos recorre-se a uma amostra. x(2). Ex. A recolha de dados é muito dispendiosa ou leva muito tempo e quando fica completa os resultados já estão desactualizados. Sondagem – estudo estatístico de uma população feito através de uma amostra. Parâmetro Estatístico – característica numérica da população.) Para se efectura um estudo estatístico é necessário recolher os dados. podemos calcular características amostrais (ex... Amostra – subconjunto de elementos extraídos da população. • A observação implicaria a destruição generalizada dos elementos da população.: Altura média (Parâmetro populacional) dos alunos do IPCB).: Censo à opinião pública sobre um candidato.. A recolha de dados pode ser realizada através de um censo/resenseamento ou de uma sondagem. ter acesso a todos os elementos da amostra. Ex. Distribuição Estatística – conjunto de dados ordenados de forma ascendente [x(1)...: média das alturas dos alunos da ESTCB). Censo/Resenseamento – processo que permite ter acesso a todos os elementos da população. num dado momento.: Variável: cor dos olhos 1 – azul 2 – verde (. x(n)].

• Sistemática – seleccionar os elementos da amostra a partir de intervalos fixos. Ex. na proporção em que a dimensão do estrato está para a dimensão da população. Conveniência – seleccionar os empregados de uma empresa para responder sobre o grau de satisfação dos clientes em relação ao atendimento.: atribuir um número a cada aluno da EST e seleccionar 30 ao acaso. O número de alunos a escolher em cada estrato deve ser proporcional ao número de alunos de cada curso. qualitativamente e quantitativamente. Por cotas – por idade / por classe social. Ex. Ex. • Estratificada – recenseamento das unidades mais abrangentes e procede-se a uma amostragem aleatória simples em cada um dos estratos. Amostragem Não aleatória • • • Acidental – baseia-se no que convém ao observador. Para se obter uma amostra representativa da população devem ser tomados os seguintes cuidados: • Imparcialidade – todos os elementos devem ter a mesma oportunidade de fazer parte da amostra. • Tamanho – a amostra deve ter uma dimensão adequada. Aleatória: escolha parcial/totalmente ao acaso dos elementos a Amostragem constituirem a amostra Não aleatória/ Viciada Amostragem Aleatória • Simples – extrair da população ao acaso.: Seleccionar os alunos cujo número é múltiplo de 5.PROBABILIDADES E ESTATÍSTICA ESTATÍSTICA DESCRITIVA Técnicas de Amostragem Amostragem: Operação através da qual se torna um certo número de elementos da população em estudo.: Considerar que cada curso é um estrato. NATÉRCIA SANTOS 2011/2012 4 . um número de elementos fixado como dimensão da amostra. etc. • Representatividade – a amostra deve conter em proporção tudo o que a população possui.

• Estatística Dedutiva/Inferência Estatística – quando a partir das conclusões obtidas durante a análise de um conjunto de dados se retiram conclusão sobre todos os elementos da população a estudar.PROBABILIDADES E ESTATÍSTICA ESTATÍSTICA DESCRITIVA Consoante o tipo de estudo a realizar podemos classificar a estatística em: • Estatística Descritiva – quando se analisa um conjunto de dados retirados de uma amostra. População amostra Parâmetros (desconhecidos) Estatísticas (conhecidos) • NATÉRCIA SANTOS 2011/2012 5 .

NATÉRCIA SANTOS 2011/2012 6 . Supondo que foram observados k dados diferentes. a tabela seguinte apresenta a forma de organização dos dados em tabela de frequências: xi x1 x2 . A organização dos dados pode ser realizada através de Tabelas de Frequências e de Gráficos. ∑ fi = n i =1 k Fi – Frequência Absoluta Acumulada: é o somatório de todas as frequências absolutas de índice menor ou igual a i. A soma de todas as frequências absolutas é igual ao número total de observações da amostra. Tabelas de Frequências As tabelas de frequências permitem organizar os dados observados. Numa primeira coluna colocamos os dados observados (xi) por ordem crescente (no caso dos dados serem contínuos os dados são agrupados em classes sendo estas apresentadas na primeira coluna da tabela – ver forma de criação de classes mais à frente). A forma de organização em tabela ou o tipo de gráfico a usar depende do tipo de dados: Discretos ou Contínuos... Uma vez definidos os valores da variável. fk Fi F1=f1+0 F2=f2+F1 fri Fri Fr1=fr1+0 Fr2=fr2+Fr1 fr1 = fr2 f1 n f2 = n Fk=fk+Fk-1=n frk = k fk n Frk=frk+Fr(k-1)=1 ∑ fi = n i =1 ∑ fri = 1 i =1 fi ... xk k fi f1 f2 .PROBABILIDADES E ESTATÍSTICA ESTATÍSTICA DESCRITIVA Organização de Dados Após a recolha de dados é necessário proceder à sua organização de forma a se conseguir retirar informação.Frequência Absoluta: corresponde ao número de vezes que ocorre o valor do dado de índice i. vamos contabilizar quantas vezes é observado cada um desses valores. obtendo-se a Frequência Absoluta de cada dado.

se n < 25  k =  n . Com esta definição de classe podemos definir: Amplitude da Classe = Si .PROBABILIDADES E ESTATÍSTICA ESTATÍSTICA DESCRITIVA fri – Frequência Relativa: é o quociente entre a frequência absoluta e o f número total de observações da amostra. os dados são agrupados em intervalos ou classes sendo estas que passam a figurar na 1ª coluna da respectiva Tabela de Frequências. sendo dados discretos. para proceder à sua organização em tabela de frequências é necessário definir as classes com que vamos trabalhar.Ii I + Si Ponto Médio da Classe = i = x i' 2 Com base nos dados observados. Definição: No âmbito da disciplina define-se classe como sendo um intervalo fechado à esquerda e aberto à direita: [Ii. fri = i n Fri – Frequência Relativa Acumulada: é o somatório de todas as frequências relativas de índice menor ou igual a i. Este valor é usado como limite inferior da classe seguinte ao qual se soma a amplitude calculada para obter o limite superior. a amplitude de cada classe será determinada da seguinte forma: Amplitude da Classe = Amplitude do Intervalo de Variação = Nº de Classes Valor Máximo Observado − Valor Mínimo Observado Nº de Classes = A definição das classe deve começar tendo por base o valor mais baixo observado ao qual se soma a amplitude calculada obtendo-se o limite superior da classe. Não existe uma regra universalmente aceite para determinar o nº de classes a considerar. NATÉRCIA SANTOS 2011/2012 7 . Para isso devemos começar por definir quantas classes vamos usar e depois a amplitude de cada classe. apresentem uma grande diversidade de dados observados. No âmbito da disciplina iremos utilizar a seguinte regra:  5 . No caso dos dados serem relativos a variáveis contínuas ou. se n ≥ 25  Uma vez definido o nº de classes a considerar.Si[ onde Ii e Si definem respectivamente os limites inferior e superior da classe. Este procedimento é repetido até se definirem todas as classes previstas para o conjunto de dados.

Representações Gráficas Os dados também podem ser representados graficamente.usam-se para organizar/representar os dados observados sem recurso à tabela de frequências • Gráficos da Função Cumulativa – usam-se para representar frequências absolutas acumuladas ou frequências relativas acumuladas Gráficos – Dados Agrupados em Classes • Histograma – gráfico construído com rectângulos adjacentes de tal modo que a base de cada rectângulo tem largura proporcional à amplitude da respectiva classe e a altura é proporcional à respectiva frequência (absoluta.usam-se para representar frequência absolutas Diagramas de Caule e Folhas . Os tipos de gráficos a usar dependem do tipo de dados com que estamos a trabalhar: Gráficos – Dados Discretos • Gráficos de Barras – usam-se para representar frequência absolutas ou frequências relativas • Pictogramas (semelhantes aos gráficos de barras mas que utilizam imagens relativas aos dados em vez das barras) • • Sectogramas . este obtém-se unindo os pontos médios dos topos dos rectângulos dos histogramas. consoante o que se pretende representar) • Polígonos de Frequências – Os polígonos de frequências são gráficos construídos a partir de histogramas diferindo o modo de construção consoante se está a representar frequências absolutas/relativas ou frequências acumuladas.PROBABILIDADES E ESTATÍSTICA ESTATÍSTICA DESCRITIVA NOTA: Por vezes acontece termos observações que não ficam incluidas nas classes consideradas inicialmente. NATÉRCIA SANTOS 2011/2012 8 . Apresentam-se de seguida exemplos de organização de dados. Caso o polígono esteja a ser construido com base no histograma de frequências acumuladas (absolutas/relativas). absoluta acumulada ou relativa acumulada. A este polígono dá-se o nome de Ogiva de Galton. relativa. este obtém-se unindo os limites superiores dos topos dos rectângulos dos histogramas. Caso o polígono esteja a ser construido com base no histograma de frequências absolutas/relativas. Geralmente este facto deve-se a arredondamentos nos cálculos e resolve-se criando uma nova classe com a amplitude da anterior de forma a que todas as observações constem na tabela de frequências.

2 20 7 = 0.9 0.05 0.2=0.8 0. Os alunos com 20 anos constituem 10% do total de alunos (ver nas frequência relativas). 17 18 19 17 21 20 19 20 22 18 18 17 18 18 18 19 19 17 18 19 Organização dos dados em Tabela de Frequências xi 17 18 19 20 21 22 k fi 4 7 5 2 1 1 Fi 4+0=4 7+4=11 5+11=16 18 19 20 k fri Fri 0.2 0. Existem 16 alunos com idade inferior a 20 anos (ver nas frequências absolutas acumuladas).35 20 0.PROBABILIDADES E ESTATÍSTICA ESTATÍSTICA DESCRITIVA Exemplos de Organização de Dados Discretos A tabela seguinte apresenta as idades de 20 alunos de uma turma.25 0.10 0.95 1 4 = 0. NATÉRCIA SANTOS 2011/2012 9 .05 ∑ fi = 20 i =1 ∑ fri = 1 i =1 Através da tabela podemos verificar que: Existem 7 alunos com 18 anos (ver nas frequência absolutas).55 0.35+0. 80% dos alunos têm idade inferior ou igual a 19 anos (ver nas frequência relativas acumuladas).

Com base directa nos dados observados temos: NATÉRCIA SANTOS 2011/2012 10 . Cada sector corresponde a um valor observado sendo a sua amplitude proporcional à respectivafrequência absoluta. a amplitude do sector correspondente aos alunos com 18 anos será igual a: a18 = Procedendo 7 * 360 o = 126 o 20 para cada idade observada obtém-se o gráfico apresentado ao lado. Diagrama de Caule e Folhas: Permite ao observados uma percepção do aspecto global dos dados sem perda da informação contida na colecção de dados inicial.PROBABILIDADES E ESTATÍSTICA ESTATÍSTICA DESCRITIVA Representações Gráficas Gráficos de Barras: fi 8 7 6 5 4 3 2 1 0 Gráfico de Barras 17 18 19 20 21 22 Xi Sectograma: gráfico circular dividido em sectores. O cálculo da amplitude de cada sector realiza-se da seguinte forma: n − 360 o fi − ai f * 360 o ou seja amplitude do sector = ai = i n Por exemplo. Trata-se de uma linha vertical registando-se à esquerda o dígito das dezenas e à direita os sucessivos dígitos das unidades.

. mas não é uma sebenta exaustiva de todos os casos estudados nas aulas. 0 1 7777888888899999 2 0012 3 NOTA: Apesar de neste documento não aparecerem exemplos de gráficos de função cumulativa ou de frequências relativas não significa que não sejam objecto de avaliação – este é um documento de apoio. O estudo da disciplina deve ser realizado preferencialmente através dos apontamentos fornecidos nas aulas NATÉRCIA SANTOS 2011/2012 11 .PROBABILIDADES E ESTATÍSTICA ESTATÍSTICA DESCRITIVA 0 1 7898887998887799 2 1200 3 Ordenando obtemos..

160[ [160.65 0. 151 157 158 156 163 170 172 171 174 150 154 162 173 166 165 160 160 164 153 158 Organização dos dados em Tabela de Frequências 1.25 ∑ fi = 20 i =1 ∑ fri = 1 i =1 NATÉRCIA SANTOS 2011/2012 12 .Construir a Tabela de Frequências Classes [150.2=0.175[ k fi 4 4 5 2 5 Fi 4+0=4 4+4=8 5+8=13 15 20 k fri Fri 0. vamos considerar 5 classes.2 20 4 = 0.4 0.165[ [165.Calcular o nª de classes a considerar Como n=20 <25.8 . 5 Para simplificar os cálculos vamos considerar classes de amplitude 5.Calcular a Amplitude de cada classe Amplitude da Classe = 174 .25 0.2 20 0.75 1 4 = 0.2+0.10 0.150 = 4. 2.PROBABILIDADES E ESTATÍSTICA ESTATÍSTICA DESCRITIVA Exemplos de Organização de Dados Agrupados em Classes A tabela seguinte apresenta as alturas de 20 alunos de uma turma.170[ [170. 3.2 0.155[ [155.

Pode não existir. Não é afectada pelos valores extremos NATÉRCIA SANTOS 2011/2012 13 . Medidas de Tendência Central Média • • • Existe sempre. É afectada pelos valores extremos Dados Agrupados em k Classes _ x = 1 n k Dados Organizados em k Modalidades _ x = 1 n k ∑ i =1 fi x i ∑ fix i' . pode existir mais do que uma moda. xi' é o ponto médio da classe i =1 Moda • • Valor mais frequente. As medidas de localização dividem-se em: • Medidas de Tendência Central: Média Moda Mediana • Medidas de Tendência não Central – Quantis Quartis Decis Centis/Percentis As fórmulas para o cálculo das medidas de localização são diferentes consoante se está a trabalhar com dados discretos ou com dados agrupados em classes.PROBABILIDADES E ESTATÍSTICA ESTATÍSTICA DESCRITIVA Medidas de Localização As medidas de localização são medidas calculadas com base nos dados permitindo descrever globalmente o conjunto de valores observados. Duas Modas: distribuição Bimodal Mais do que duas Modas: Distribuição Plurimodal • • Não leva em conta todos os valores observados. Leva em conta todos os valores observados. Apenas uma Moda: a distribuição diz-se Unimodal.

Aplicar a fórmula: f(Mo + 1) Mo = li (Mo ) + × a(Mo ) = f(Mo − 1) + f(Mo + 1) A Moda (Mo) é o valor com maior frequência absoluta = Mo = li + fp fa + fp × ai Legenda: li = li(Mo ) .Frequência Absoluta da classe anterior à classe Modal ai = a(M o ) .amplitude da classe Modal Mediana • • • • Corresponde ao valor do meio. Determinar a Classe Modal: classe com maior frequência absoluta.Frequência Absoluta da classe posterior à classe Modal fp = f(M o − 1) .PROBABILIDADES E ESTATÍSTICA ESTATÍSTICA DESCRITIVA Dados Organizados em k Modalidades Dados Agrupados em k Classes 1.limite inferior da classe Mediana Fa = F(M e − 1) . 2.frequência acumulada da classe anterior à classe Mediana fi = f(M e ) . Aplicar a fórmula: n − F(Me − 1) Me = li (Me ) + 2 × a(Me ) = f(Me ) = Me Dados Organizados em k Modalidades Me  x  n +1  se n é ímpar     2   = x x  n+2  n    +   se n é par  2   2  2 x (k ) . Não leva em conta todos os valores observados.elemento x que acumula k observações – ver nas Fi n − Fa 2 = li + × ai fi Legenda: li = li(Mo ) .frequência absoluta da classe Mediana ai = a(M e ) .limite inferior da classe Modal fa = f(M o + 1) . Não é afectada pelos valores extremos Dados Agrupados em k Classes 1.amplitude da classe Mediana NATÉRCIA SANTOS 2011/2012 14 . 2 2. Determinar a Classe Mediana: classe que n acumula observações. Existe sempre.

A figura seguinte apresenta o respectivo diagrama de caixa com bigodes.frequência acumulada da classe anterior à classe Quartil fi = f(Q i ) . Determinar a posição do quartil PQi = i × (n + 1) = k. Para cada lado da caixa desenha-se uma linha horizontal (bigodes) até aos valores extremos da distribuição.elemento x que acumula k observações – ver nas Fi 2.Quantis Quartis • Dividem a distribuição em 4 partes iguais Dados Agrupados em k Classes 1.limite inferior da classe Quartil Fa = F(Q i − 1) . d × (x(k +1) − x (k) ) x (k ) . 3 2. Determinar a classe quartil: classe que i×n acumula PQi = observações 4 3. Aplicar a fórmula: i×n − F(Qi − 1) Q i = li (Q i ) + 4 × a(Qi ) = f(Q i ) i×n − Fa = Q i = li + 4 × ai fi Legenda: li = li (Qi ) . Q2= Me =10. d 4 i = 1. 3 PQi = i×n 4 .frequência absoluta da classe Quartil ai = a(Q i ) . i = 1. Q3=12. 2.amplitude da classe Quartil Diagrama de Caixa com Bigodes Uma vez calculados os quartis e considerando os valores extremos (valor mínimo e valor máximo observados) podemos construir uma caixa com bigodes: À escala.PROBABILIDADES E ESTATÍSTICA ESTATÍSTICA DESCRITIVA Medidas de Tendência Não Central . Q1=9. marcamos os quartis que definem uma caixa na qual se asinala a mediana. 2. Determinar a posição do quartil Dados Organizados em k Modalidades 1. 5 6 7 8 9 10 11 12 13 14 Q1 Q2=Me Q3 NATÉRCIA SANTOS 2011/2012 15 . Aplicar a fórmula Qi = x(k) + 0. max=14. EX: No estudo de uma distribuição obtiveram-se os seguintes valores: Min=5.

amplitude da classe Decil NATÉRCIA SANTOS 2011/2012 16 . Determinar a classe decil: classe que i×n acumula PDi = observações 10 3. i = 1.PROBABILIDADES E ESTATÍSTICA ESTATÍSTICA DESCRITIVA Medidas de Tendência Não Central – Decis e Centis/Percentis NOTA: As fórmulas para os Decis (Di) e para os Centis (Ci)/Percentis (Pi) são análogas às dos Quartis apenas diferindo no número de partes em que dividimos a distribuição – 10 ou 100 em vez de 4. Decis • Dividem a distribuição em 10 partes iguais Dados Agrupados em k Classes 1.elemento x que acumula k observações – ver nas Fi 2. Aplicar a fórmula: i×n − F(Di − 1) Di = li (Di ) + 10 × a(Di ) = f(Di ) i×n − Fa = Di = li + 10 × ai fi Legenda: li = li (Di ) .. Determinar a posição do decil Dados Organizados em k Modalidades 1. 2.... 2..limite inferior da classe Decil Fa = F(D i − 1) . . d 10 i = 1.9 PDi = i×n 10 . Determinar a posição do decil PDi = i × (n + 1) = k.9 2. d × (x (k +1) − x (k) ) x (k ) . Aplicar a fórmula Di = x (k) + 0...frequência acumulada da classe anterior à classe Decil fi = f(D i ) .frequência absoluta da classe Decil ai = a(Di ) .

.... . i = 1. Determinar a classe centil: classe que i×n acumula PCi = observações 100 3. Determinar a posição do centil Dados Organizados em k Modalidades 1. 2.frequência acumulada da classe anterior à classe centil fi = f(C i ) . 2. Aplicar a fórmula: i×n − F(C i − 1) 100 C i = li (C i ) + × a(C i ) = f(C i ) x (k ) .. Determinar a posição do centil i × (n + 1) PCi = = k.amplitude da classe centil NATÉRCIA SANTOS 2011/2012 17 .limite inferior da classe centil Fa = F(C i − 1) . Aplicar a fórmula Ci = x (k) + 0..elemento x que acumula k observações – ver nas Fi i×n − Fa × ai = C i = li + 100 fi Legenda: li = li (C i ) ..99 100 PCi = i×n 100 .PROBABILIDADES E ESTATÍSTICA ESTATÍSTICA DESCRITIVA Centis/Percentis • Dividem a distribuição em 100 partes iguais Dados Agrupados em k Classes 1.99 2. d i = 1.frequência absoluta da classe centil ai = a(Di ) . d × (x (k +1) − x (k) ) 2.

É assim necessário complementar as medidas de tendência central com medidas que permitam avaliar o grau de dispersão dos dados. os dados são expressos em metro (m) e a variância define-se em metro quadrado (m2). ' x i é o ponto médio da classe A variância é uma medida que se expressa no quadrado da unidade da variável (por exemplo. _ ' xi é o ponto médio da classe Variância (s2): obtém-se somando os quadrados dos desvios das observações da amostra. no caso do estudo da altura dos alunos de uma escola. Dá informação sobre a variabilidade dos dados em relação à média. As medidas seguintes já têm em conta todos os dados: Desvio Absoluto Médio (dm): é a média aritmética dos valores absolutos dos desvios de cada um dos dados em relação à média. Dados Organizados em k Modalidades Dados Agrupados em k Classes 1 s2 = n k i =1 ∑ fi (xi − x) _2 s2 = 1 n k i =1 ∑ fi (xi' − x) _2 . da média). s = s2 NATÉRCIA SANTOS 2011/2012 18 . Desvio Padrão (s): é a raíz quadrada da variância. Amplitude Total: é a diferença entre o valor máximo e o valor mínimo observados w = x (max) − x (min) Amplitude Inter Quartil: é a diferença entre o terceiro quartil e o primeiro quartil AIQ=Q3-Q1 Estas medidas são pouco realistas em termos de avaliação da dispersão dos dados uma vez que não consideram todos os dados no seu cálculo. Dados Organizados em k Modalidades Dados Agrupados em k Classes dm 1 = n k i =1 ∑ fi | xi − x | _ dm = 1 n k i =1 ∑ fi | xi' − x | . relativamente à sua média. É conveniente usar uma medida de dispersão que se expresse na mesma unidade dos dados: usamos então o Desvio Padrão.PROBABILIDADES E ESTATÍSTICA ESTATÍSTICA DESCRITIVA Medidas de Dispersão As medidas de localização não permitem avaliar se os dados de uma distribuição estão ou não concentrados em torno de um valor (por exemplo. e dividindo pelo número de observações da amostra.

um Coeficiente de Variação acima de 50% indica um alto grau de dispersão dos dados em torno da média e. os dados se situam entre 0 e 1 valores e entre os 19 e 20 valores. suponha-se que a média das notas a uma disciplina é de 10 valores e que os dados variam entre os 8 e os 12 valores – a dispersão dos dados é baixa. Uma distribuição diz-se assimétrica quando não existe simetria da curva de frequências em relação à recta vertical que passa pela abcissa correspondente à média. consequentemente. para a mesma média. Medidas de Assimetria Assimetria: grau de desvio ou afastamento da simetria de uma distribuição. Em termos práticos. o Coeficiente de Variação de Pearson é uma medida independente das unidades em que se expressa a variável. a média de 10 valores já não é representativa da distribuição. devendo o Cvp apresentar um valor acima dos 50%. pelo que deve ser utilizada quando se pretendem comparar distribuições que se expressem em unidades diferentes ou que apresentem médias diferentes.PROBABILIDADES E ESTATÍSTICA ESTATÍSTICA DESCRITIVA Coeficiente de Variação de Pearson (Cvp): é o quociente. entre o desvio padrão e a média da distribuição. uma pequena representatividade da média como medida realística. Uma distribuição pode ser classificada como sendo: Simétrica: NATÉRCIA SANTOS 2011/2012 19 . Por exemplo. em termos percentuais. pelo que o Cvp deve apresentar um baixo valor. s C vp = _ x 100 x Ao contrário das medidas de dispersão anteriores. Mas se.

PROBABILIDADES E ESTATÍSTICA ESTATÍSTICA DESCRITIVA Assimétrica Positiva: Assimétrica Negativa: Métodos de Classificação de uma distribuição quanto à Simetria Para distribuições Unimodais e Moderadamente Assimétricas a classificação pode ser realizada das seguintes formas: Comparação das Medidas de Tendência Central • • • Se Mo = Me = média temos uma Distribuição Simétrica Se Mo < Me < média temos uma Distribuição Assimétrica Positiva Se média < Me < Mo temos uma Distribuição Assimétrica Negativa Cálculo de Coeficientes de Assimetria • Primeiro Coeficiente de Assimetria de Pearson x − Mo C p1 = s _ C p1 = 0 . Distribuição Simétrica Se C p1 > 0 . Distribuição Assimétrica Negativa NATÉRCIA SANTOS 2011/2012 20 . Distribuição Assimétrica Positiva C p1 < 0 .

PROBABILIDADES E ESTATÍSTICA ESTATÍSTICA DESCRITIVA • Segundo Coeficiente de Assimetria de Pearson 3 (x − Me ) C p2 = s _ C p2 = 0 . Tal facto. Distribuição Assimétrica Negativa NOTA: Em certas situações pode acontecer que as conclusões obtidas através destes métodos não sejam todas coincidentes. Distribuição Assimétrica Positiva C p2 < 0 . usualmente. Distribuição Simétrica Se C q > 0 . Distribuição Assimétrica Positiva C q < 0 . NATÉRCIA SANTOS 2011/2012 21 . Distribuição Simétrica Se C p2 > 0 . deve-se a erros de arredondamento dos cálculos ou ao facto de não se usarem os dados todos disponíveis para o cálculo dos coeficientes. Distribuição Assimétrica Negativa Também podemos classificar a distribuição usando o Coeficiente Quartílico de Assimetria: Cq Q + Q1 − 2Q 2 = 3 Q 3 − Q1 C q = 0 .

Distribuição Platicúrtica K < 0 .PROBABILIDADES E ESTATÍSTICA ESTATÍSTICA DESCRITIVA Medidas de Achatamento ou Curtose As medidas de achatamento dão uma indicação da intensidade das frequências na vizinhança dos valores centrais.263 2 (P90 − P10 ) K = 0 . A classificação da distribuição quanto à curtose é realizada por comparação com a curva da Distribuição Normal: Distribuição Mesocúrtica: Se a curva da distribuição for igual à curva da distribuição Normal. Distribuição Leptocúrtica NATÉRCIA SANTOS 2011/2012 22 . Distribuição Platicúrtica: Se a curva da distribuição for mais achatada do que a curva da distribuição Normal. Distribuição Mesocúrtica Se K > 0 . Leptocúrtica Mesocúrtica Platicúrtica Coeficiente de Curtose K = Q 3 − Q1 − 0. Distribuição Leptocúrtica: Se a curva da distribuição for mais afunilada do que a curva da distribuição Normal.

You're Reading a Free Preview

Download
scribd
/*********** DO NOT ALTER ANYTHING BELOW THIS LINE ! ************/ var s_code=s.t();if(s_code)document.write(s_code)//-->