Universidade Federal do Pará

Instituto de Tecnologia

Estatística Aplicada I

Universidade Federal do Pará
Instituto de Tecnologia

Capítulo I

Estatística Descritiva

Prof. Dr. Jorge Teófilo de Barros Lopes

Campus de Tucuruí – CTUC
Curso de Engenharia Mecânica

Campus de Tucuruí – CTUC
Curso de Engenharia Mecânica
ESTATÍSTICA APLICADA I - Estatística Descritiva

I - Estatística Descritiva

ESTATÍSTICA APLICADA I - Estatística Descritiva

I - Estatística Descritiva 

Introdução 

Introdução 

Conceitos e definições 

Conceitos e definições 

Classificação dos dados 

Classificação dos dados 

Caracterização e apresentação dos dados 

Caracterização e apresentação dos dados 

Estatísticas amostrais 

Estatísticas amostrais 

Outras apresentações gráficas de dados 

Outras apresentações gráficas de dados 

Regressão linear 

Regressão linear

ESTATÍSTICA APLICADA I - Estatística Descritiva

1.1 Introdução

ESTATÍSTICA APLICADA I - Estatística Descritiva

1.1 Introdução 

ESTATÍSTICA: É a disciplina que objetiva estudar os
métodos científicos para a coleta, organização, resumo,
apresentação e análise de dados, bem como obter
conclusões válidas e tomar decisões razoáveis baseadas
em tais análises. 
Técnicas Estatísticas: São as várias técnicas por meio
das quais é possível estudar conjuntos de dados e, a
partir de uma amostra (se necessária), tirar conclusões
válidas para conjuntos maiores (população).

ESTATÍSTICA APLICADA I - Estatística Descritiva 

De uma maneira geral, as técnicas estatísticas são
utilizadas em três etapas principais do trabalho de
pesquisa:
1. A coleta de dados, incluindo o planejamento do
trabalho e da pesquisa;
2. A apresentação dos dados coletados; e
3. A análise dos dados coletados, com a formulação
de conclusões e generalizações.

ESTATÍSTICA APLICADA I - Estatística Descritiva

1

1.1 Introdução

1.1 Introdução

Coleta de dados

Apresentação dos dados coletados

- Essa primeira etapa corresponde ao estabelecimento
do método de coleta de dados (questionário ou teste
ou ensaio de material) e elaboração dos
questionamentos; determinação das variáveis que
serão estudadas, de acordo com o interesse do
pesquisador; e o cálculo do tamanho da amostra, de
acordo com a natureza da pesquisa, do tempo e do
orçamento disponíveis.

- A segunda etapa requer técnicas específicas para a
transformação dos dados numéricos em tabelas ou
gráficos (é a partir da organização dos dados
coletados que se poderá elaborar a interpretação).
Análise dos dados coletados
- Essa etapa é simultânea à anterior, pois durante a
própria organização dos dados já é possível ir
percebendo a tendência geral da pesquisa.

ESTATÍSTICA APLICADA I - Estatística Descritiva

1.1 Introdução

ESTATÍSTICA APLICADA I - Estatística Descritiva

1.1 Introdução

• No sentido de melhor esclarecer o significado da
análise e interpretação dos dados, deve-se estabelecer
uma distinção entre
Estatística Descritiva 

Estatística Descritiva: Objetiva sintetizar e representar de
uma forma compreensível a informação contida num
conjunto de dados.
• Como o próprio nome sugere, constitui-se num conjunto
de técnicas que objetivam descrever, analisar e interpretar
os dados numéricos de uma população ou amostra.
• Adquire importância quando o volume de dados for
significativo.

e
Inferência Estatística.

• Materializa-se na construção de tabelas e/ou gráficos ou
no cálculo de medidas que representem convenientemente
a informação contida nos dados.

ESTATÍSTICA APLICADA I - Estatística Descritiva

1.1 Introdução

ESTATÍSTICA APLICADA I - Estatística Descritiva

1.1 Introdução 

Inferência Estatística: Baseada na análise de um conjunto
limitado de dados (uma amostra), objetiva caracterizar o
todo a partir do qual tais dados foram obtidos (a população).
• Objetivo mais ambicioso que o da estatística descritiva.
• Os métodos e técnicas utilizados são mais sofisticados.

Figura 1.1- Diferença entre Estatística Descritiva e Inferência
Estatística (Silva e Carvalho, 2006).
ESTATÍSTICA APLICADA I - Estatística Descritiva

ESTATÍSTICA APLICADA I - Estatística Descritiva

2

1.1 Introdução

I - Estatística Descritiva

Figura 1.2- Diferença entre Estatística Descritiva e Inferência
Estatística (Silva e Carvalho, 2006). 

Introdução 

Conceitos e definições 

Classificação dos dados 

Caracterização e apresentação dos dados 

Estatísticas amostrais 

Outras apresentações gráficas de dados 

Regressão linear

ESTATÍSTICA APLICADA I - Estatística Descritiva

1.2 Conceitos e Definições 
População: É o conjunto de todos os elementos que contêm
uma certa característica que se deseja estudar.
• Como é comum a todos os elementos, esta característica
varia em quantidade ou qualidade.
• Uma população pode ter dimensão finita ou infinita. 
Amostra: É um subconjunto de dados que pertencem à
população. As amostras aleatórias são escolhidas por meio
de processos (técnicas de amostragem) que garantem que o
subconjunto obtido é representativo da população.
ESTATÍSTICA APLICADA I - Estatística Descritiva

1.2 Conceitos e Definições 
Fases do método de análise estatística:
• No âmbito da Estatística, o método de abordagem dos
problemas pode ser dividido em cinco fases:
1.

Estabelecimento do objetivo da análise a efetuar (questões a
serem resolvidas) e definição das populações correspondentes;

2.

Concepção de um procedimento adequado para a seleção de
uma ou mais amostras (escolha das técnicas de amostragem a
utilizar).

3.

Coleta de dados.

4.

Análise dos dados (Estatística Descritiva).

5.

Estabelecimento de inferências a respeito da população
(Inferência Estatística)

ESTATÍSTICA APLICADA I - Estatística Descritiva

1.2 Conceitos e Definições 
Principais motivos para o estudo da amostra:
1. População infinita;
2. Custo em termos de tempo ou de dinheiro que um
estudo em toda a população implicaria;
3. Obtenção de informação por meio de testes destrutivos,
no âmbito industrial;
4. Impossibilidade de acesso a todos os elementos da
população.
ESTATÍSTICA APLICADA I - Estatística Descritiva

1.2 Conceitos e Definições 
Fases do método de análise estatística:
Identificação do problema → Objetivo da análise
Planejamento da experiência → Técnicas de Amostragem
Coleta de dados
Análise exploratória dos dados → Estatística Descritiva

ESTATÍSTICA APLICADA I - Estatística Descritiva

Análise e interpretação dos resultados → Inferência Estatística
ESTATÍSTICA APLICADA I - Estatística Descritiva

3

k deverá ser no mínimo 3 e no máximo 20. para se proceder um estudo descritivo. pois podem tratarse de erros de observação.Estatísticas amostrais – a partir de algumas medidas promove-se um resumo dos dados levantados.Estatística Descritiva 1.Estatística Descritiva 1. ESTATÍSTICA APLICADA I .3 Classificação dos Dados  Iniciando o estudo: • Para se ter uma idéia mais concreta sobre os dados levantados.  Freqüência de classes: O passo seguinte é subdividir os dados pelas classes ou categorias e determinar o número de indivíduos pertencentes a cada uma. pois podem ocorrer registros que não se encaixam no padrão geral observado e. com a indicação da freqüência de cada um. dispersão e forma.Como a variável k é um número inteiro.3 Classificação dos Dados  Iniciando o estudo:  Introdução  Conceitos e definições  Classificação dos dados  Caracterização e apresentação dos dados  Estatísticas amostrais  Outras apresentações gráficas de dados  Regressão linear • Não existe uma estratégia única para iniciar o estudo descritivo. dando origem ao chamado rol. bem como do próprio registro ou provenientes de alterações do fenômeno em estudo.Ordenação dos dados – fase onde se começa a ter uma idéia a respeito de algumas medidas de posição (média.  Rol: Os dados brutos são então ordenados de forma crescente ou decrescente. as quais serão estudadas a posteriori. um recurso de visualização dos dados constantes na tabela. usa-se k = 7).  Tabulação dos dados: Depois de elaborar o rol é preciso determinar quantas faixas terá a tabela de freqüência. para uma melhor interpretação das mesmas é conveniente conhecer as técnicas utilizadas. ESTATÍSTICA APLICADA I . deve-se recorrer às tabelas e/ou gráficos que podem representar.Estatística Descritiva 1. ESTATÍSTICA APLICADA I . de maneira sintética. quartis etc. obtêm- se dados brutos. ESTATÍSTICA APLICADA I .4.Estatística Descritiva 1. resultando nas freqüências de classes. • Embora estas análises já se encontrem disponíveis em vários softwares e calculadoras programáveis. .). ou seja. se k ≈ 6. . pode-se fazer uma nova tabela com todas as freqüências. .I . faz-se o desenho gráfico.  Apresentação final dos dados (tabela completa): Com base em todos os cálculos feitos anteriormente. um conjunto de números ainda sem organização alguma.Estatística Descritiva • Portanto. ela deverá ser aproximada para o maior inteiro (por exemplo. dessa forma. ESTATÍSTICA APLICADA I . as informações sobre o comportamento de variáveis numéricas levantadas.Estatística Descritiva 4 . • Isso é necessário. mediana. relativamente à posição. a sua veracidade deve ser averiguada.3 Classificação dos Dados  Iniciando o estudo: ESTATÍSTICA APLICADA I .3 Classificação dos Dados  Dados brutos: Como primeiro resultado de uma pesquisa.Agrupamento dos dados e representação gráfica – revela a forma possível para a população em estudo e permite escolher a classe de modelos que deve ser explorada nas análises mais sofisticadas.  Gráficos: A partir da tabela de freqüências. é importante: . A fórmula de Sturges é utilizada para estabelecer o número aproximado de classes k ≅ 1 + 3 .Estatística Descritiva 1.22 ⋅ log n onde: n = número de elementos da amostra (tamanho da amostra) k = número de classes que a tabela de classes deverá contar.3 Classificação dos Dados • Observações: . embora uma primeira recomendação seja começar por uma exploração visual dos dados levantados.

bom e excelente. uma pessoa com 60 kg tem o dobro do peso de uma com 30 kg. ESTATÍSTICA APLICADA I .Observações: • Escala intervalar: temperatura de 0ºC não significa que não haja temperatura. 2.Estatística Descritiva 1. em determinadas horas de dias sucessivos. ESTATÍSTICA APLICADA I .Nominal . a razão entre os dados expressos numa escala absoluta passa a ter significado. c) Não ordenáveis . 4.Absoluto ESTATÍSTICA APLICADA I . o registro de temperaturas em ºC. o valor zero tem significado).Exemplo: Pesos de pessoas expressos em kg. . a escala absoluta tem origem fixa (nesta escala.5 kg. que é aquela que pode assumir qualquer valor em certo intervalo da reta real (por exemplo. o peso de funcionários de uma fábrica: 60. Exemplo: Classificação das pessoas pela cor do cabelo (preto.não existe nenhum critério relevante que permita estabelecer preferência por qualquer classe em relação às restantes. • Escala absoluta: peso de 0 kg significa que não existe peso. 5. é necessário que se faça a distinção entre os dados discretos e os contínuos.Estatística Descritiva ESTATÍSTICA APLICADA I .Estatística Descritiva 1. Por exemplo. não faz sentido dizer que o terceiro dia esteve duas vezes mais quente que o segundo. Neste caso..3 Classificação dos Dados d) Dados absolutos: Contrariamente ao que sucede com a escala intervalar.Ordinal a) Exaustivas . pode-se atribuir um significado à diferença entre esses números.Observação: Neste caso. a razão entre os valores registrados naqueles dias seria diferente.Estatística Descritiva 5 .3 Classificação dos Dados  Os dados que constituem uma amostra podem ser de quatro tipos. número de páginas em um livro: 1. .. Os dados são contínuos quando são valores de uma variável aleatória contínua..Intervalar . ESTATÍSTICA APLICADA I . Os dados denominam-se discretos quando são valores de uma variável aleatória discreta.Observação: Quando se trabalha com dados quantitativos.).1. Se em três dias consecutivos a temperatura atingir 5ºC. assim distribuídos: 1.3 Classificação dos Dados b) Dados ordinais: São semelhantes aos dados nominais. 10°C e 20ºC. • Quantitativos .3 Classificação dos Dados c) Dados intervalares: No caso da escala intervalar.) ESTATÍSTICA APLICADA I . • Em conseqüência ao fato da origem ser fixa. castanho. . 60. os dados são diferenciados e ordenados por números expressos em uma ordem cuja origem é arbitrária.3 Classificação dos Dados a) Dados nominais: Quando cada um deles for identificado pela atribuição de um nome que designa uma classe. que é a aquela que assume valores em pontos da reta real (por exemplo. regular. louro etc.3 Classificação dos Dados . . pois se a temperatura fosse expressa em outra escala.). b) Mutuamente exclusivas .cada dado pertence somente a uma classe.Estatística Descritiva 1. mas não à razão entre eles. . nessa escala existe a possibilidade de se estabelecer uma ordenação dos dados nas classes.Estatística Descritiva 1. 3.qualquer dado pertence a uma das classes. contudo.52 kg..Exemplo: Classificação de conceitos de avaliação na disciplina em insuficiente. as classes devem ser: • Qualitativos . segundo algum critério relevante.

Exemplos: Algarismos Números Notação científica significativos 3200 1. o último dígito remanescente. 32 e 210 possuem 2 algarismos significativos..500 216. até 0.73 Número a arredondar Arredondamento para Número arredondado 12.03200 Número arredondado 3.000 e 33.2 x 10-2 3. Exemplo: 17.99 2.705 .700 ≈ 5. Exemplos: 3. caso não haja vírgula decimal. 5. mas o algarismo a ser arredondado aumenta 1 unidade.Estatística Descritiva 1. não se alterará.8 216. frações de 0. Exemplos: 7.69.Estatística Descritiva 1..5 ≈ 6.3 Classificação dos Dados  Arredondamento de dados: O arredondamento de um dado estatístico deve obedecer as seguintes regras.32 Número a arredondar Arredondamento para Número arredondado Inteiro Inteiro Décimos Centésimos ESTATÍSTICA APLICADA I .325 ≈ 3..3 Classificação dos Dados ESTATÍSTICA APLICADA I .Estatística Descritiva 6 . o digito remanescente será acrescido de uma unidade (ou seja.. 1. 216 216 216.500 216.1. ou até o último dígito (zero ou não) caso haja uma vírgula decimal. 2.032 0. arredondadas para cima). frações maiores de 0.3 Classificação dos Dados 1.578 Centésimos 15. todos os zeros à direita da vírgula decimal são significativos Exemplos: 1. ESTATÍSTICA APLICADA I .200 x 10-2 2 3 5 4 2 4 ESTATÍSTICA APLICADA I . são simplesmente eliminadas. 5. se for par. se a fração a ser eliminada é exatamente 0.58 ESTATÍSTICA APLICADA I .489 Inteiros 12 12. 6. 9. Arredondamento de dígitos seguidos do cinco: Quando o dígito situado mais à esquerda dos que serão eliminados for um cinco ou um cinco seguido somente de zeros.6500 ≈ 5.4.30 possuem 4 algarismos significativos.03 possuem 3 algarismos significativos. só aumentará de 1 unidade caso torne-se um algarismo par). Arredondamento por excesso: Quando o primeiro dígito após aquele que será arredondado for maior ou igual a cinco seguido por dígitos maiores que zero.733 Décimos 12..3452 → 17.48. • Os zeros entre dígitos diferentes de zero são significativos Exemplos: 303 e 1.3400 32050 0.3 (correto) 17. 3. contados a partir da esquerda até o último dígito diferente de zero à direita.55 x 100 8.7 12.561 Décimos 15.2 x 103 1.750 216..6 15.475 ≈ 9. aquele situado mais à esquerda entre os que irão ser eliminados.6.8.3. não deverá ser alterado o dígito remanescente (ou seja. e se for impar será aumentado de uma unidade (ou seja.5 ≈ 4..500..3 Classificação dos Dados  Algarismos significativos  Algarismos significativos: Os algarismos significativos de um número são os dígitos diferentes de zero. 215. Nunca se deve fazer arredondamentos sucessivos.734999 ≈ 1.6501 ≈ 5.3 Classificação dos Dados 3. 49 ≈ 3. arredondadas para baixo).205 x 104 3. Se for necessário um novo arredondamento.4999..3 Classificação dos Dados Exemplos: 3. Exemplos: 3.50000.504 Inteiros 16 15.000.688 ≈ 3.Estatística Descritiva • Todos os dígitos diferentes de zero são significativos. a 0. for igual ou menor que quatro.992 Centésimos 12. 1.3400 x 100 3.70 ESTATÍSTICA APLICADA I .43 ≈ 2. 5. são eliminadas.Estatística Descritiva 1.Estatística Descritiva 1. então o algarismo a ser arredondado.7 Número a arredondar Arredondamento para 15.55 8. Arredondamento por falta: Quando o primeiro dígito.Observações: 1.3452 → 17.999.. recomenda-se o retorno aos dados originais.4 (incorreto) 2. • Se existir uma vírgula decimal..35 → 17.

Caso seja apresentada uma temperatura como 32ºC (2 significativos).32 = 4584. está indicado que a temperatura está entre 32.3 Classificação dos Dados  Algarismos significativos: • Valores medidos ou calculados: o número de algarismos significativos de uma grandeza medida ou um valor calculado é uma indicação da incerteza.Estatística Descritiva 7 . possui 1 algarismo significativo. ESTATÍSTICA APLICADA I .31 x 106 (0. intervalar ou absoluta. Exemplo: a pressão em uma caldeira é 6 atm.46 x 39.Observações: ESTATÍSTICA APLICADA I .2 − 7856. seguem as regras anteriores.0000000.5ºC (3 significativos).3 Classificação dos Dados .83 = 496. Exemplo: 5 dias = 5.9 • Nas operações de potenciação e radiciação o resultado deverá ter o mesmo número de algarismos significativos da base (potenciação) ou do radicando (radiciação).Estatística Descritiva 1. está indicado que a temperatura está entre 31.4 Caracterização e Apresentação dos Dados  Tabela de freqüências:  Introdução  Conceitos e definições  Classificação dos dados  Caracterização e apresentação dos dados  Estatísticas amostrais  Outras apresentações gráficas de dados  Regressão linear • Devido à necessidade das categorias estarem ordenadas.1001 = 12620 12441. Caso ela seja apresentada como 32. indica que o valor do 3º algarismo tem uma incerteza menor ± 0. ou seja. usando os critérios de arredondamento.Estatística Descritiva 1.55ºC.Observações: • Na adição e na subtração faz-se a operação normalmente e no final reduz-se o resultado.3 Classificação dos Dados  Algarismos significativos: 1. Exemplos: 12.. • Números inteiros que são parte de uma expressão física possuem precisão infinita.45 e 32. quanto mais algarismos significativos. Exemplos: (1.75 x 104)1/2 = 0. somente se pode falar de freqüências acumuladas quando os dados estão em escalas ordinais.. Exemplos: 12441 + 57.Estatística Descritiva I . menor a incerteza no valor.407 / 13.91 + 1.5ºC.Estatística Descritiva ESTATÍSTICA APLICADA I .87 x 102 • Na multiplicação e na divisão o resultado deverá ter igual número de algarismos (ou um algarismo a mais) que a grandeza com menor quantidade de algarismos significativos que participa da operação. para o número de casas decimais da grandeza menos precisa.20 = 12620.52 x 103)2 = 2.1 = 61. Exemplo: O valor de uma grandeza medida com 3 algarismos significativos.28 803.1.5ºC. Exemplo: o 2 na equação do perímetro do círculo 2πR.33 ESTATÍSTICA APLICADA I .5 e 32.Estatística Descritiva ESTATÍSTICA APLICADA I . dias. possui uma precisão infinita uma vez que por definição o diâmetro é 2 vezes o raio. • Números inteiros que descrevem o número de objetos discretos possuem precisão mínima. • Números inteiros que são resultados experimentais.88 = 4584.3 Classificação dos Dados .0031 + 119.987 + 0.328 = 61.2818 = 496.Estatística Descritiva 1. • A representação tabular com todos os tipos de freqüências é mostrada a seguir: ESTATÍSTICA APLICADA I .

o número total de dados (n) é calculado por : k n = ∑ ni 1= 1 b) Freqüência relativa (fi): O número total de dados que pertencem a uma classe ou categoria qualquer i. 3.Estatística Descritiva 1. marcam-se as freqüências das classes. • Denotando-se por ni tal freqüência e admitindo que as categorias especificadas contêm todos os dados. Faz-se a correspondência entre cada intervalo no eixo das classes com um valor no eixo das freqüências. k) de um conjunto de dados designa-se por freqüência absoluta da classe ou categoria i.4 Caracterização e Apresentação dos Dados  Tabela de freqüências: a) Freqüência absoluta (ni): O número de dados contidos numa classe ou categoria qualquer i (i = 1. segue-se o desenho do gráfico.. formando um desenho de colunas paralelas.Estatística Descritiva 8 . ESTATÍSTICA APLICADA I . No eixo das abscissas marcam-se. e é assim construído: • Os tipos de gráficos mais comuns são: histograma. designa-se por freqüência relativa da classe ou categoria i e é dada por fi = • As freqüências relativas são muitas vezes definidas em termos percentuais. a freqüência absoluta de dados que pertencem à classe ou às classes anteriores. um recurso de visualização dos dados constantes na tabela. d) Freqüência relativa acumulada (Fi): Representa para cada classe categoria i. a freqüência relativa de dados que pertencem à classe ou às classes anteriores.4 Caracterização e Apresentação dos Dados  Tabela de freqüências: 1. 1.Histograma: Este tipo de gráfico é utilizado para representar as freqüências absolutas (ni) em relação à sua classe. setograma e ogiva de Galton..4 Caracterização e Apresentação dos Dados  Gráficos estatísticos ESTATÍSTICA APLICADA I . quando expressos como uma proporção do número total de dados. ESTATÍSTICA APLICADA I . ESTATÍSTICA APLICADA I .4 Caracterização e Apresentação dos Dados  Tabela de freqüências: ni n ESTATÍSTICA APLICADA I ..Estatística Descritiva ESTATÍSTICA APLICADA I .Estatística Descritiva 1.Estatística Descritiva 1. .4 Caracterização e Apresentação dos Dados  Gráficos estatísticos • Uma vez elaborada a tabela de freqüências.1. 2. as classes dos dados. polígono de freqüência. No eixo das ordenadas. em escala.Estatística Descritiva 1.4 Caracterização e Apresentação dos Dados  Tabela de freqüências: c) Freqüência absoluta acumulada (Ni): Representa para cada classe ou categoria i..

No eixo das abscissas. inicia-se com a freqüência zero e com limite inferior da 1ª classe. 3. 4.4 Caracterização e Apresentação dos Dados  Gráficos estatísticos .4 Caracterização e Apresentação dos Dados  Gráficos estatísticos ESTATÍSTICA APLICADA I . 2. é construído sobre o histograma.Estatística Descritiva 1.Estatística Descritiva 1.Ogiva de Galton: Este tipo de gráfico é utilizada para representar as freqüências acumuladas de uma distribuição.Gráfico em setores (Setograma): Também conhecido como gráfico de pizza.1. normalmente.Histograma 1. coloca-se o ponto médio de cada intervalo de classe. da seguinte forma: 1. No eixo das abscissas coloca-se as classes dos dados. ESTATÍSTICA APLICADA I .4 Caracterização e Apresentação dos Dados  Gráficos estatísticos 360º ⋅ni n ESTATÍSTICA APLICADA I . é construído da seguinte forma: . acrescenta-se um ponto médio com freqüência zero em cada uma das extremidades da escala horizontal. escreve-se uma das freqüências acumuladas. distribui-se os valores das freqüências percentuais ESTATÍSTICA APLICADA I .Estatística Descritiva 1. 2.4 Caracterização e Apresentação dos Dados  Gráficos estatísticos .Estatística Descritiva 1. No eixo das ordenadas.Estatística Descritiva 9 . 1.4 Caracterização e Apresentação dos Dados  Gráficos estatísticos . Faz-se um círculo. marcando o ponto com os limites superiores (Li) de cada classe.Polígono de freqüência: Utilizado para indicar o ponto médio ou representante de classe em suas respectivas freqüências absolutas. No círculo. Cada setor é regido pela fórmula: . permanecem as freqüências absolutas das classes (ni) . Para completar o polígono. Ligam-se os pontos médios por segmentos de reta. 2.Histograma e Polígono de freqüência: ESTATÍSTICA APLICADA I . é utilizado para representar valores relativos (%).4 Caracterização e Apresentação dos Dados  Gráficos estatísticos . é construído da seguinte forma: . tal como no histograma. No eixo das ordenadas.Polígono de freqüência: º Setori = 3.Ogiva de Galton: 1.Estatística Descritiva ESTATÍSTICA APLICADA I .

Estatística Descritiva 1. em todas as séries.2% TOTAL 120 100% ESTATÍSTICA APLICADA I . e também graficamente.3% ESTATÍSTICA APLICADA I . Podem ser utilizados para representar qualquer série estatística. em um sábado. e marcados no plano utilizando o sistema cartesiano.Estatística Descritiva 10 .Estatística Descritiva 1.3% 12. constatou- Este tipo de gráfico é semelhante ao de colunas. São utilizados para representar séries cronológicas. analisou-se o número de ocupantes por veículo para 1000 veículos que entraram no estacionamento do referido supermercado. se que 100 não tinham qualquer defeito. 15 tinham defeitos recuperáveis e 5 apresentavam defeitos irrecuperáveis. o tipo de gráfico que apresenta os dados estatísticos por meio de retângulos (colunas) dispostas em posições vertical. Os pontos da polígono são obtidos pelas informações contidas em cada linha da tabela. É utilizado para legendas longas. ESTATÍSTICA APLICADA I .5% Sem defeitos Recuperáveis irrecuperáveis • Exemplo: Em um estudo realizado com o objetivo de caracterizar o comportamento dos clientes de um supermercado. as freqüências (absolutas e relativas) dos dados que constituem essa amostra: Categoria de peças Freqüência absoluta (ni) Freqüência relativa (fi) Sem defeitos Recuperáveis irrecuperáveis 100 15 5 83.4 Caracterização e Apresentação dos Dados  Gráficos estatísticos .4 Caracterização e Apresentação dos Dados  Dados Qualitativos: . Todos os retângulos possuem a mesma base e a altura proporcional aos dados.Estatística Descritiva 1.1.2% 12.Estatística Descritiva 1.Gráfico linear: É o tipo . onde os retângulos (barras) estão dispostos horizontalmente.4 Caracterização e Apresentação dos Dados  Dados Quantitativos: Gráfico em Setores 4.4 Caracterização e Apresentação dos Dados  Dados Qualitativos: ESTATÍSTICA APLICADA I .Estatística Descritiva ESTATÍSTICA APLICADA I .4 Caracterização e Apresentação dos Dados  Gráficos estatísticos ESTATÍSTICA APLICADA I . Representar em uma tabela. Os resultados encontram-se resumidos na tabela seguinte: 83.4 Caracterização e Apresentação dos Dados  Gráficos estatísticos 1.Gráfico de colunas: • Exemplo: Em uma amostra constituída de 120 peças.Gráfico de colunas: É de gráfico que apresenta os dados estatísticos por meio de uma linha poligonal.5% 4.

299. 300.00 .0% 5.00 .2% 10. 299.35.73.22. .1.00 .Estatística Descritiva 1. 300.Estatística Descritiva 1.Estatística Descritiva ESTATÍSTICA APLICADA I . 299.7% 94.83.4 Caracterização e Apresentação dos Dados  Dados Quantitativos: ESTATÍSTICA APLICADA I .4 Caracterização e Apresentação dos Dados Classes Freqüência absoluta (ni) Freqüência relativa (%) (fi) Freqüência absoluta acumulada (Ni) Freqüência relativa acumulada (%) (Fi) [297.Estatística Descritiva 11 .0% 250 200 n i 150 100 50 0 1 2 3 4 5 6 7 Nº ocupantes / veículo ESTATÍSTICA APLICADA I .Estatística Descritiva 1. 299.00[ 8 21 28 15 11 10 5 1 1 8 21 28 15 11 10 5 1 1 8 29 57 72 83 93 98 99 100 8 29 57 72 83 93 98 99 100 TOTAL 100 100% ESTATÍSTICA APLICADA I . não é vantagem se utilizar os dados agrupados numa tabela de freqüências.81.80 ESTATÍSTICA APLICADA I .83. a tabela de freqüências pode ser construída se os dados forem agrupados por classes: ESTATÍSTICA APLICADA I . 304.00 . 301. 297.00[ [301. 300.76.12..36.4 Caracterização e Apresentação dos Dados  Dados Quantitativos: • No conjunto de dados mostrado não existe praticamente repetição de valores. do conteúdo de uma série de 100 garrafas que. 300. cujos valores observados são muito próximos uns dos outros. no decurso de um teste. 305. em gramas.7% 100. 299.00[ [300. 303.00[ [303.7% 15.4 Caracterização e Apresentação dos Dados  Dados Quantitativos: Freqüência Freqüência absoluta acumulada relativa acumulada (Ni) (Fi) 103 250 498 695 847 947 1000 Gráfico em colunas 300 10. 298. pois a mesma teria tantas linhas quanto o número de dados.16.Estatística Descritiva 1. . • No entanto.00[ [298. 303. 297.3% 25. 303. 301.4 Caracterização e Apresentação dos Dados  Dados Quantitativos: Nº de ocupantes por veículo (xi) Freqüência absoluta (ni) Freqüência relativa (fi) 1 2 3 4 5 6 7 103 147 248 197 152 100 53 10. 298. 302.86. • Exemplo: O conjunto de dados baixo representa o peso.8% 19.25. saíram de uma linha de enchimento automático: 302. 299.65.99. os dados observados correspondem a uma variável discreta.00[ [305. 299. .07. logo.00 .00[ [302.00[ [299.3% 14.00[ [304.5% 84. 306. 300.A freqüência de cada classe é o número de observações que ela contém.8% 69.3% TOTAL 1000 100% 1. 297. para o caso de dados relativos uma variável contínua existem algumas diferenças.23..20.52. 300.07.00 .38.0% 49. 298.7% 24. 302.4 Caracterização e Apresentação dos Dados  Dados Quantitativos: • Distribuições agrupadas: Essas distribuições são úteis quando existe um grande número de dados relativos a uma variável contínua.00 .00 .00 . 298.No exemplo anterior. .24.

amplitude interquartílica e coeficiente de variação. variância.00 ..5 Estatísticas Amostrais  As estatísticas amostrais ou medidas estatísticas são divididas em três grupos: a) Medidas de posição ou de tendência central: • Média aritmética. ESTATÍSTICA APLICADA I . decis. desvio médio. • São chamadas de medidas de tendência central.00[ [300.4 Caracterização e Apresentação dos Dados I .Estatística Descritiva  Dados Quantitativos:  Introdução  Conceitos e definições  Classificação dos dados  Caracterização e apresentação dos dados  Estatísticas amostrais  Outras apresentações gráficas de dados  Regressão linear Histograma 30 25 20 f i 15 10 5 0 [297.00 .5 Estatísticas Amostrais a) Medidas de posição: ESTATÍSTICA APLICADA I .5 Estatísticas Amostrais a) Medidas de posição: • Essas medidas nos orientam quanto à posição da distribuição no eixo x (eixo dos números reais). 306. • Possibilitam comparações de séries de dados entre si pelo confronto desses números. ou seja.00 . 301. desvio padrão.00[ [298. mediana. 304. média harmônica. 299. em torno dos quais tendem a concentrar-se os dados. n) a média aritmética simples ou média amostral..Estatística Descritiva a.1..00 . 300. representada por x é definida pela expressão: n ∑x x= i =1 i (dados não agrupados) n ESTATÍSTICA APLICADA I .00[ [304. ESTATÍSTICA APLICADA I . 302. percentis e moda.  O cálculo de estatísticas amostrais é uma forma mais sintética de descrever um conjunto de dados.00 .  As estatísticas amostrais são calculadas com base nos dados. possibilita representar um conjunto de dados relativos à observação de determinado fenômeno de forma reduzida.Estatística Descritiva 1.00[ Peso (kg) ESTATÍSTICA APLICADA I .00[ [302. 298. pelo fato de representarem os fenômenos pelos seus valores médios.00 . b) Medidas de dispersão: • Amplitude total. ESTATÍSTICA APLICADA I .00[ [301. média geométrica..1) Média aritmética: • Para um conjunto de n dados de xi (i = 1.00[ [299.Estatística Descritiva 1.00 .00 .Estatística Descritiva 1. c) Medidas de forma: • Medidas de assimetria e medidas de curtose.2. quartis.00[ [303. gráficos e distribuição de freqüências.Estatística Descritiva 12 .00 . 305.5 Estatísticas Amostrais  Nas seções anteriores foi visto a sintetização de dos dados sob a forma de tabelas. a partir das quais é possível descrever globalmente o conjunto de valores que os referidos dados tomam.00[ [305.Estatística Descritiva 1. 303.

Estatística Descritiva 1. 3.Estatística Descritiva 13 . assim: i i =1 ∴ n 2 + 1+ 3+ 3+ 2 + 3+7 + 5 + 5 + 2+ 1+ 3+ 1+ 1+ 4 x= ∴ 15 x = 2 .Estatística Descritiva 1.Estatística Descritiva 1. 3.5 Estatísticas Amostrais 1. 1. 5.87 n ∑n x i x= (dados agrupados) n ESTATÍSTICA APLICADA I . 4 n ∑x x= • Quando os dados estiverem agrupados numa distribuição de freqüência usa-se a média aritmética dos valores xi ponderadas pelas respectivas freqüências absolutas ni.5 Estatísticas Amostrais a) Medidas de posição: a) Medidas de posição: a. visto que se perdeu os valores concretos do conjunto (ficaram afetos a uma determinada classe) não se pode calcular a média amostral diretamente dos valores dos dados.1. 2. o qual é considerado como elemento representativo da classe. 1. 2. ni é a freqüência absoluta da classe i e xi é o ponto médio da classe i.1) Média aritmética: a.1) Média aritmética: a. 1. 5.1) Média aritmética: • Exemplo: Determinar a média aritmética simples (média aritmética amostral) dos dados mostrados abaixo: 2. 3.Estatística Descritiva 1. e a média amostral será calculada por meio desses representantes: k ∑n x i x= i=1 i (dados agrupados em classes) n onde k é o número de classes do agrupamento.5 Estatísticas Amostrais i i=1 ESTATÍSTICA APLICADA I .5 Estatísticas Amostrais a) Medidas de posição xi ni xini 1 2 3 4 5 7 4 3 4 1 2 1 4 6 12 4 10 7 Σ 15 43 ESTATÍSTICA APLICADA I . 7. ESTATÍSTICA APLICADA I . 3.5 Estatísticas Amostrais a) Medidas de posição: a) Medidas de posição: a.1) Média aritmética: • No caso da variável ser contínua.87 ( 1 ⋅ 4 ) + ... + ( 7 ⋅ 1 ) 43 = 15 15 ESTATÍSTICA APLICADA I .5 Estatísticas Amostrais a) Medidas de posição: a. à cada classe vai ser atribuído um representante (xi).1) Média aritmética: a.Estatística Descritiva ESTATÍSTICA APLICADA I .1) Média aritmética: • Exemplo (dados agrupados): Determinar a média aritmética simples (média aritmética amostral) da distribuição dada abaixo: • Exemplo (dados agrupados): n ∑ x i ni xi 1 2 3 4 5 7 ni 4 3 4 1 2 1 x= i =1 = n x = 2 . • Deste modo. 1.

a avaliação final tem peso 3 e as parciais peso 1.. .5 Estatísticas Amostrais 1.0 4507.5 3316. xn é a raiz de ordem n do produto desses números: G = n x1 ⋅ x 2 ⋅ .Estatística Descritiva 1.00 . x2.5 = = 8 . . xn ocorrem com as freqüências n1.Estatística Descritiva ESTATÍSTICA APLICADA I ....5 8386.. 4 e 8: 3 a.0 6268. 298.00[ [299. Nesse caso • Exemplo: Em um curso. a nota média de um estudante que obtenha nota 8. saíram de uma linha de enchimento automático (exemplo anterior): • Exemplo (dados agrupados em classes): Classes ni xi xini [297. x2..00[ [303.11 30011.5 na avaliação final e 7.00 .00 .2) Média geométrica (dados agrupados): Se os elementos x1..+nk = n a freqüência total. a qual representa o peso. xk a certos fatores de ponderação ou pesos w1.Exemplo: A média geométrica dos números 2..1) Média aritmética (Ponderada) a..00 ...5 3025.0 nas provas parciais. sendo n1+n2+...1) Média aritmética (Ponderada) • Às vezes...00 .5 299.Estatística Descritiva 14 .5 302. .5 Σ 100 ESTATÍSTICA APLICADA I .5 301. x2.00 . associam-se os números x1. x n .3 1+ 1+ 3 5 i i =1 ESTATÍSTICA APLICADA I .00 .. nk. + w k x k w1 + w 2 + . .Estatística Descritiva 1.0 e 9.5 Estatísticas Amostrais a) Medidas de posição: a) Medidas de posição: a. w2....x 2 x k x k x k = n x1n1 ⋅ x 2n2 .0 1517.. 306.1.Estatística Descritiva 1.Estatística Descritiva 1.0 ESTATÍSTICA APLICADA I ..00 .5 305. a média geométrica G desses elementos será deduzida como: G = n x1 x1 .5 303.5 300. wk que dependem do significado ou importância atribuída aos mesmos. + w k é denominada de média aritmética ponderada.. ∑w x i x= i =1 3 ∑w i = ( 1 ⋅ 7 .00[ [305.1) Média aritmética: a.5 Estatísticas Amostrais a) Medidas de posição: a) Medidas de posição: a.1) Média aritmética: • Exemplo (dados agrupados em classes): Determinar a média da distribuição a seguir. 302. no decurso de um teste.5 304.00[ [304.. 305..5 Estatísticas Amostrais a) Medidas de posição: a) Medidas de posição: a.0 ) + ( 1 ⋅ 9 . 300.5 Estatísticas Amostrais ESTATÍSTICA APLICADA I .5 304.. 299.0 x= 100 x = 300 ..2) Média geométrica: A média geométrica G (ou xG ) de um conjunto de n números x1.5 ) 41 .00[ [298.00[ [300.5 Estatísticas Amostrais 9 ∑n x i x= i i=1 n 30011.5 298. 301. xknk n1 vezes n2 vezes nk vezes 3 G = 2 ⋅ 4 ⋅ 8 = 64 = 4 ESTATÍSTICA APLICADA I .0 ) + ( 3 ⋅ 8 . n2. será: k ∑w x ∑w i x= 3 i i =1 i = w1 x 1 + w 2 x 2 + .00[ [301.. 304..00[ [302. em gramas..00[ 8 21 28 15 11 10 5 1 1 297.x1 x 2 x 2 . do conteúdo de uma série de 100 garrafas que. 303.00 .5 2380. .5 305.

11. 9. x ) é o valor que divide a amostra.. logo ~ x será o elemento de ordem (n+1)/2. 4.amostra ordenada -.5 Estatísticas Amostrais a) Medidas de posição: a) Medidas de posição: a. ou seja. em duas partes iguais. 3.11. x2. 4. então: Como n é par. 4. 5. 11.Estatística Descritiva a. 7. 7. 85 e 87. assim: ~ x = 3.Estatística Descritiva 1. 21º e 22º elementos. encontra-se o valor xi correspondente à classe que contém a ordem calculada.4) Mediana (variável discreta): a. 1.. 9 8. 5.Estatística Descritiva 1. logo ~ x será a média xi ni Ni entre os elemento de ordem n/2 e 82 85 87 89 90 9 12 11 6 4 Σ 42 9 21 32 38 42 21º 22º (n/2)+1. mediana (md.15 Como n é ímpar. . 8. ou seja. Me ou ~ ou população. 2. x2.4) Mediana (variável discreta): • Considerando que os dados que integram a amostra são colocados em ordem crescente.3) Média harmônica: A média harmônica H (ou x H ) de um conjunto de n elementos x1. determinar a mediana: n = 42. 15.5 Estatísticas Amostrais • Exemplo: Para a distribuição abaixo. a mediana amostral é definida como segue:  x~ = x n+ 1 n ímpar  2   x n + x n+ 2 ~ 2 x= 2  2 n par • Exemplo: Para as distribuições abaixo. determinar a mediana: ni Ni 1 3 5 2 1 4 9 11 Σ 11 2 2 2 = x5 + x6 5 + 7 = =6 2 2 ESTATÍSTICA APLICADA I . .Estatística Descritiva 1.. xn é a recíproca da média aritmética da recíproca dos elementos: H= 1 = 1 n 1 ∑ n j =1 x j a. contém o 6º elemento Da coluna da freqüência acumulada crescente. formando um vetor (x1. 4 e 8: H= n n 1 ∑x j =1 = j 3 3 = = 3 . 9.15 1. tabela de distribuição de freqüência): • Exemplo: Para a distribuição abaixo.1.5 Estatísticas Amostrais 1.Estatística Descritiva a) Medidas de posição: a. então: x~ = x n+ 1 = x5 = 7 x~ = 2 ESTATÍSTICA APLICADA I .5 Estatísticas Amostrais a) Medidas de posição: xi 100% x~ n = 11 (ímpar). determinar as respectivas medianas: 8. tabela de distribuição de freqüência): 1 2 3 4 x n + x n+ 2 1.4) Mediana (variável discreta.Exemplo: A média harmônica dos números 2. 15. Como no exemplo anterior. xn) . 5.43 1 1 1 7 + + 2 4 8 8 ESTATÍSTICA APLICADA I .. 2. 2. 2.. 8. ou seja. assim: 85 + 87 x~ = = 86 2 ESTATÍSTICA APLICADA I .. 7. 7. Assim: n n 1 ∑x j =1 0% j 50% . ESTATÍSTICA APLICADA I . 4. é par. identificam-se os elementos de ordem 21 e 22 pela Ni.Estatística Descritiva 15 . 3 Ordenando: Ordenando: 1. 5. 9. 11.5 Estatísticas Amostrais a) Medidas de posição: a) Medidas de posição: a.4) Mediana (variável discreta. (11+1)/2 = 6º elemento. 1.4) Mediana: Para os dados colocados em ordem crescente.5 Estatísticas Amostrais ESTATÍSTICA APLICADA I .

calcular a mediana: a. ni = 18. assim: 21º e 22º 87 + 87 ~ x= = 87 2 a. denominada classe Md (como a variável é contínua. n a dimensão da amostra e lMd . identifica-se a classe que contém a mediana (n/2). deixa 50% dos elementos. logo: n  58    − N i − 1  ai  − 17  10 2  = 55 +  2  = 61 . o valor aproximado para a mediana será calculado pela equação: n   − N Md −1  a Md 0 .4) Mediana (variável contínua. o limite inferior.5) Quartis: a.5) Quartis: • Como já visto anteriormente.5 Estatísticas Amostrais a) Medidas de posição: a) Medidas de posição: a.5 Estatísticas Amostrais 1. ESTATÍSTICA APLICADA I . a mediana é a medida de posição que divide um conjunto de dados em duas partes iguais. 35 45 55 65 75 85 5 12 18 14 6 3 5 17 35 49 55 58 2º Passo: Identifica-se a classe Md pela Ni (classe Md=3ª). respectivamente. n = 58. Q3 = 3º quartil. Q2 = 2º quartil.5 Estatísticas Amostrais ESTATÍSTICA APLICADA I .Estatística Descritiva 1. identificam-se os elementos de ordem 21 e 22 pela Ni. • Os quartis dividem um conjunto de dados em quatro partes iguais.5 − FMd − 1 2  x~ = l Md + a Md = l Md + n Md f Md onde: NMd-1 é a freqüência absoluta acumulada da classe antes da classe mediana. então 58/2=29º. ou seja.5 Estatísticas Amostrais ESTATÍSTICA APLICADA I .4) Mediana (variável discreta.4) Mediana (variável contínua. coincide com a mediana. assim: 50% 25% Q1 75% Q2 Q3 ESTATÍSTICA APLICADA I . não interessa se n é par ou ímpar).67 x~ = l i +  ni 18 58 Σ ESTATÍSTICA APLICADA I . a amplitude e a freqüência absoluta da classe mediana. é par. Ni-1 = 17. ai = 10. tabela de distribuição de freqüência): • Exemplo: Dada a distribuição amostral.Estatística Descritiva 1. deixa 25% dos elementos. 21º e 22º elementos. tabela de distribuição de freqüência): • Exemplo: Para a distribuição abaixo. aMd e nMd são.Estatística Descritiva 1. ou seja.1. ESTATÍSTICA APLICADA I .5 Estatísticas Amostrais a) Medidas de posição: a) Medidas de posição: a.Estatística Descritiva 1. 45 55 65 75 85 95 classe Md 3º Passo: Aplica-se a fórmula: Neste caso li = 55. tabela de distribuição de freqüência): • Para variáveis contínuas.5 Estatísticas Amostrais a) Medidas de posição: a) Medidas de posição: a. Como no exemplo anterior.Estatística Descritiva 16 . determinar a mediana: n = 42.Estatística Descritiva 50% 25% Q1 75% Q2 Q3 Q1 = 1º quartil. deixa 75% dos elementos. logo ~ x será a média xi ni Ni entre os elemento de ordem n/2 e 82 85 87 89 90 5 10 15 8 4 Σ 42 5 15 30 38 42 (n/2)+1. 87 e 87.4) Mediana (variável contínua. como n=58. tabela de distribuição de freqüência): • Exemplo: Classes ni Ni 1º Passo: Calcula-se n/2.

• Exemplo: Diante desses resultados.92 deixa 25% dos elementos.07 deixa 75% dos elementos.5 Estatísticas Amostrais a) Medidas de posição a) Medidas de posição: a. então 58/4=14. ESTATÍSTICA APLICADA I .5 Estatísticas Amostrais ESTATÍSTICA APLICADA I .92 25% 61.5) Quartis: • Exemplo: Dada a distribuição amostral. O valor de 71. 2 e 3). NQ1-1 = 5. NQ1-1 = 35. 597.1º Passo: Calcula-se a ordem kn/4.5) Quartis: a. nesta distribuição.25º elemento → 579 . pode-se afirmar que.5 Estatísticas Amostrais a) Medidas de posição: ESTATÍSTICA APLICADA I .5 Estatísticas Amostrais a) Medidas de posição: a. 196. 3º Passo: Aplica-se a fórmula: Neste caso lQ3 = 65.5) Quartis: • Exemplo: Para Q3. 2 e 3) para variáveis discretas segue a fórmula:  n +1 Qk = k    4  • A determinação de Qk (k = 1. nQ1 = 14. 207. 2º Passo: Identifica-se a classe Q1 pela Ni (classe Q1 =2ª).Aplica-se a fórmula: 7 +1 7 + 1 Q1 = 1 Q = 3  = 2º elemento → 196  = 6º elemento → 597  4   4  6 + 1  6 + 1    = 5.5 − 35 ) ⋅ 10 = 71 . 574.5º.07 95 ou seja: O valor de 52.Estatística Descritiva 1. classe Q1 classe Q3 58 3º Passo: Aplica-se a fórmula: Neste caso lQ1 = 45. 597 ? .75º elemento → 193.Estatística Descritiva 1. logo:  1n  − N Q1 − 1   (14 . como n=58. como n = 58. .2º Passo: Identifica-se a classe Qk pela freqüência acumulada N. tem-se: 2º Passo: Identifica-se a classe Q3 pela NQ3 (classe Q3 = 4ª).5 Estatísticas Amostrais 1.Estatística Descritiva 1.92 nQ1 12 ESTATÍSTICA APLICADA I .5 − 5 )  4  Q1 = l Q1 + ⋅ a Q1 = 45 + ⋅ 10 = 52 . 207. 574.5) Quartis: • A determinação de Qk (k = 1.Estatística Descritiva 1.5) Quartis: a.3 Q = 3  4   4   kn  − N Qk −1   4  ⋅a Q k = l Qk +  Qk nQ k ESTATÍSTICA APLICADA I .07 Q 3 = l Q3 +  Q3 nQ 3 14 ESTATÍSTICA APLICADA I .67 deixa 50% dos elementos.Estatística Descritiva 25% 35 52. então 58/4 = 43. aQ1 = 10. determinar Q1 e Q3: Classes ni Ni 35 45 55 65 75 85 5 12 18 14 6 3 5 17 35 49 55 58 45 55 65 75 85 95 Σ • Exemplo: Para Q1. 196. 305. 1º Passo: Calcula-se n/4.1. O valor de 61.5) Quartis: a. segue os passos: . 612. logo:  3n  − N Q3 − 1   4  ⋅ a = 65 + (43 . nQ1 = 12.5 Estatísticas Amostrais a) Medidas de posição: a) Medidas de posição: a. • Exemplo: Determine o 1º e o 3º quartis da série 185. 305. 1º Passo: Calcula-se 3n/4.67 25% 25% 71.5º.Estatística Descritiva 17 . E da série 185.8 Q1 = 1  = 1. n = 58. aQ1 = 10. n = 58. para o caso de variáveis contínuas.

Estatística Descritiva 18 . D7 = 7º decil. ESTATÍSTICA APLICADA I . deixa 1% dos elementos.Aplica-se a fórmula:  kn  − N Dk − 1   10  ⋅a D k = l Dk +  Dk n Dk 7 +1 D1 = 5  = 4º elemento → 305  10  7 +1 D6 = 6   = 4 .5 Estatísticas Amostrais a) Medidas de posição: a) Medidas de posição: a. deixa 90% dos elementos da série.Estatística Descritiva 2% 3% . deixa 50% dos elementos. 9).5 Estatísticas Amostrais 1. P2 = 2º percentil. 574. ESTATÍSTICA APLICADA I .8º elemento → 520 . P50 = 50º percentil. ..7) Percentis: • Os percentis dividem um conjunto de dados em cem partes iguais. 9) para variáveis discretas segue a fórmula:  n +1 Dk = k    10  • A determinação de Dk (k = 1. deixa 70% dos elementos da série. 196. • Exemplo: Determine o 5º e o 6º decis da série 185. 207. . P99 = 99º percentil.. . 97% P2 P3 P50 98% 99% P97 P98 P99 P1 = 1º percentil. D6 = 6º decil.1º Passo: Calcula-se a ordem kn/10. deixa 50% dos elementos da série. deixa 12% dos elementos da série.Estatística Descritiva ESTATÍSTICA APLICADA I . D5 = 5º decil. 2. deixa 99% dos elementos.Estatística Descritiva 1. ... deixa 80% dos elementos da série. deixa 10% dos elementos da série.6) Decis: a.. 612. 50% . D9 = 9º decil. . D8 = 8º decil. para o caso de variáveis contínuas.1. 2. .5 Estatísticas Amostrais 1.Estatística Descritiva 1. segue os passos: . deixa 2% dos elementos. assim: 10% 20% 30% 40% 50% 60% 70% 80% 90% D1 D2 D3 D4 D5 D6 D7 D8 D9 D1 = 1º decil.Estatística Descritiva 1. 597. . 305.5 Estatísticas Amostrais ESTATÍSTICA APLICADA I .6) Decis: • A determinação de Dk (k = 1.6) Decis: • Os decis dividem um conjunto de dados em dez partes iguais.7) Percentis: a. assim: 1% P1 ESTATÍSTICA APLICADA I .5 Estatísticas Amostrais a) Medidas de posição: a) Medidas de posição: a.2º Passo: Identifica-se a classe Dk pela freqüência acumulada N. .2  10  ESTATÍSTICA APLICADA I . D2 = 2º decil..5 Estatísticas Amostrais a) Medidas de posição: a) Medidas de posição: a.6) Decis (variáveis discretas): a. deixa 60% dos elementos da série. coincide com a mediana. coincide com a mediana.

.7) Percentis: • A determinação de Pk (k = 1.. na distribuição analisada.8º elemento → 520 ...5 Estatísticas Amostrais a) Medidas de posição: a) Medidas de posição: a.5 Estatísticas Amostrais a) Medidas de posição: a) Medidas de posição: a.O valor 55. ESTATÍSTICA APLICADA I .8 o = 100 100 l P72 = 65 ..Aplica-se a fórmula: • Exemplo: Determine o 50º e o 60º percentis da série 185.Estatística Descritiva a. 196. . .Para variáveis contínuas. para o caso de variáveis contínuas. nP72 = 14 3º Passo: 58 ESTATÍSTICA APLICADA I . • Portanto.7) Percentis: a. .5 Estatísticas Amostrais ESTATÍSTICA APLICADA I .1º Passo: Calcula-se a ordem kn/100. n = 58 .8) Moda • Moda (Mo) é a medida que indica o valor ou a gama de valores nos quais a concentração dos dados amostrais é máxima. para variáveis discretas segue a fórmula:  n +1 Pk = k    100  . a classe modal é o intervalo de classe com maior freqüência.82 P72 = 65 +  14 ESTATÍSTICA APLICADA I . 99). 612. a P72 = 10 . a moda é o valor dos dados que ocorre com maior freqüência. 305.Estatística Descritiva 1. nD4 = 18 classe P72 3º Passo: 58  4 ⋅ 58  − 17   10  ⋅ 10 = 55 .34 indica que 40% dos elementos da distribuição estão abaixo dele e os outros 60% acima. . N D4 − 1 = 17 . 2.5 Estatísticas Amostrais a) Medidas de posição: a.1.Estatística Descritiva 1. ESTATÍSTICA APLICADA I . tem-se que: .7) Exemplo (decil e percentil).. . . 99). segue os passos: • A determinação de Pk (k = 1. 2.5 Estatísticas Amostrais 1.  kn  − N Pk − 1   100  ⋅a Pk = l Pk +  Pk n Pk 7 +1 P50 = 50  = 4º elemento → 305  100  7 + 1 D6 = 60  = 4 .2  100  ESTATÍSTICA APLICADA I ..O valor 69.82 indica que 72% dos elementos da distribuição estão abaixo dele e os outros 28% acima.Estatística Descritiva 1. 574. 207.5 Estatísticas Amostrais Cálculo de P72  72 ⋅ 58  − 35   100  ⋅ 10 = 69 .7) Exemplo (decil e percentil): Determinar o 4º decil e o 72º percentil da seguinte distribuição: Classes ni Ni 35 45 55 65 75 85 5 12 18 14 6 3 5 17 35 49 55 58 45 55 65 75 85 95 Σ percentil da seguinte distribuição: Cálculo de D4 1º Passo: classe D4 2º Passo: kn 4 ⋅ 58 = 23 .Estatística Descritiva 19 .2 o = 10 10 l D4 = 55 .2º Passo: Identifica-se a classe Pk pela freqüência acumulada N. a D4 = 10 . 597.Para variáveis discretas.34 D4 = 55 +  18 Classes ni Ni 35 45 55 65 75 85 5 12 18 14 6 3 5 17 35 49 55 58 45 55 65 75 85 95 Σ a) Medidas de posição: 1º Passo: classe D4 2º Passo: classe P72 kn 72 ⋅ 58 = 41 .7) Exemplo (decil e percentil): Determinar o 4º decil e o 72º a. n = 58 .Estatística Descritiva 1. N P72 − 1 = 35 .

Densidades de classes: Quando as amplitudes das classes são diferentes. obtém-se imediatamente o valor que representa a moda ou a classe modal.5 Estatísticas Amostrais a) Medidas de posição: a) Medidas de posição: a.A classe com maior frequência absoluta é [55. a identificação da moda é facilitada pela simples observação do elemento que apresenta maior freqüência.5 Estatísticas Amostrais 1. ela é a classe modal.5 Estatísticas Amostrais a) Medidas de posição: a) Medidas de posição: a. as quais são obtidas por meio da relação ni/ai.5 Estatísticas Amostrais a) Medidas de posição: a. ∆1 ⋅ ai ∆1 + ∆ 2 M o = 55 + 18 − 12 ⋅ 10 ( 18 − 12 ) + ( 18 − 14 ) M o = 61 ESTATÍSTICA APLICADA I . .5 Estatísticas Amostrais 1.Exemplo: Determinar a moda para a distribuição: ni 35 45 55 65 75 85 5 12 18 14 6 3 45 55 65 75 85 95 ESTATÍSTICA APLICADA I .Estatística Descritiva 20 . existem diversas fórmulas para o cálculo da moda: .8) Moda (dados agrupados) • Para distribuições simples (sem agrupamento em classes).8) Moda • Assim. para os quais não se pode calcular a média e por vezes a mediana (se não forem susceptíveis de ordenação).Estatística Descritiva 1. ∆1= diferença entre a freqüência absoluta da classe modal e a imediatamente anterior. apresentados sob a forma de nomes ou categorias. 65[. tem-se: Mo = li + .Estatística Descritiva 1. ∆2 = diferença entre a freqüência absoluta da classe modal e a imediatamente posterior.5 Estatísticas Amostrais a) Medidas de posição: Classes ⋅ ai l = limite inferior da classe modal. onde . .Estatística Descritiva 1.8) Moda (dados agrupados) a. da representação gráfica dos dados.8) Moda a. aplica-se a fórmula abaixo.8) Moda (distribuições simples) a. logo. • Esta medida é especialmente útil para reduzir a informação de um conjunto de dados qualitativos.Aplicando a fórmula de Czuber. deve-se calcular as densidades de classes para identificar a classe modal.1. • Para dados agrupados em classe.Estatística Descritiva ESTATÍSTICA APLICADA I .Fórmula de Czuber: Após a identificação da classe modal.8) Moda (dados agrupados) .Exemplo: Para a distribuição abaixo Mo = 248. ai = amplitude da classe modal. ESTATÍSTICA APLICADA I .Estatística Descritiva ESTATÍSTICA APLICADA I . xi 243 ni 7 245 248 251 307 17 23 20 8 M o = li + ∆1 ∆1 + ∆ 2 ESTATÍSTICA APLICADA I .

3 ) ∆1 + ∆ 2 ou seja. mesmo que estes valores surjam em pequeno número na amostra. 11. nesse caso.  Se esse aluno elevar a nota mais baixa.8) Moda (dados agrupados) .  Estes valores são os responsáveis pela má utilização da média em muitas situações em que teria mais significado utilizar a mediana.Estatística Descritiva 21 .5 Estatísticas Amostrais a) Medidas de posição: a) Medidas de posição:  Observações:  Observações: 1.8 − 2 . caso contrário.4. Média versus Mediana: 1.5 Estatísticas Amostrais ESTATÍSTICA APLICADA I .Estatística Descritiva  Representação das distribuições dos dados na forma de uma curva de freqüência: ESTATÍSTICA APLICADA I . Média versus Mediana: 1. É dada pela relação: Mo ≅ 3~ x − 2x classe modal ∆1 2 . Média versus Mediana:  Diferença entre estas duas medidas fica mais clara quando se considera o exemplo das notas obtidas por um aluno como sendo: 10. a média reflete o valor de todas as observações. a preferência de uma ou de outra dependerá do contexto em que forem utilizadas: se a distribuição é simétrica essas medidas coincidem.Estatística Descritiva 1.Estatística Descritiva 1. ESTATÍSTICA APLICADA I . 14.8 0.7 2. 14. a mediana ainda será o mesmo valor.0 ⋅ a i = 250 + ⋅ 50 = 262 . observar que a mediana não é tão sensível quanto a média. além disso. 18.5 Estatísticas Amostrais 1.Fórmula de Pearson: Fornece uma boa aproximação quando a distribuição apresenta razoável simetria em relação à média. isto é. Média versus Mediana:  Entretanto. 16.5 Estatísticas Amostrais a) Medidas de posição: a) Medidas de posição: a.  A média.5 Estatísticas Amostrais ESTATÍSTICA APLICADA I .Exemplo: Determinar a moda para a distribuição: Salários (US$) 80 180 250 300 Mo = li + 180 250 300 500 ni ai ni/ai 70 140 140 60 100 70 50 200 0.3 .1.8 − 2 .Estatística Descritiva 1. 13. mas o valor da média sofrerá um aumento.0 2.12 ( 2 . é uma medida de posição muito pouco resistente.0 ) + ( 2 . passando para 14. passando de 10 para 14. a moda é aproximadamente igual a diferença entre o triplo da mediana e o dobro da média ESTATÍSTICA APLICADA I .8) Moda (dados agrupados) a. a média aritmética e a mediana são iguais a 14.8 − 0 . como pode ser comprovado. ela é muito influenciada por valores muito grandes ou muito pequenos. 15.Estatística Descritiva 1.5 Estatísticas Amostrais a) Medidas de posição: a) Medidas de posição:  Observações:  Observações: 1. às observações que são muito maiores ou muito menores do que as restantes. ESTATÍSTICA APLICADA I . ao contrário da mediana. 15.

xn é definido por: n ∑d R = x máx − x min DM = i=1 n n ∑x i = i i =1 n −x = ∑ x− x n . ambas possuem média aritmética igual a 20..Estatística Descritiva 22 . 24. não sendo afetada pela dispersão dos valores internos. . 20 e 15. adota-se frequentemente o símbolo σ para o primeiro e s para o último.1) Amplitude total (ou amplitude amostral): É definida como sendo a diferença entre o maior e o menor dos valores da série. . . entretanto.5 Estatísticas Amostrais 1. 15. n2.. a média é muito mais representativa para a segunda série. na primeira não existe dispersão. 20. enquanto a segunda apresenta dispersão em torno da média 20. .5 Estatísticas Amostrais b) Medidas de dispersão b) Medidas de dispersão b. 20. 25. ESTATÍSTICA APLICADA I . ESTATÍSTICA APLICADA I .5 Estatísticas Amostrais a) Medidas de posição: b) Medidas de dispersão  Observações: 2.. mas é maior ou igual à sua média harmônica: H ≤G≤ x  O sinal de igualdade somente é válido quanto todos os números do conjunto de dados são idênticos.2) Desvio médio: O desvio médio de um conjunto de n números x1. como pode ser calculado.Exemplo: Sejam as séries 20.5 Estatísticas Amostrais ESTATÍSTICA APLICADA I .Exemplo: Para a série 10. ou seja: b. 12.Estatística Descritiva 1.Quando é necessário distinguir entre o desvio padrão de uma população e o de uma amostra dela extraída. 30. geométrica e harmônica:  A média geométrica de um conjunto de números positivos é menor ou igual à sua média aritmética. 30.Estatística Descritiva 1. o desvio médio poderá ser indicado da seguinte forma: n ∑n DM = n i i=1 n ESTATÍSTICA APLICADA I .. x = média aritmética dos números. evitandose com isso que Σdi=0. x2 .. portanto. ESTATÍSTICA APLICADA I . pois depende apenas dos valores externos.2) Desvio médio (dados agrupados): Se x1. nn.Estatística Descritiva 1. respectivamente. x i − x = valor absoluto do desvio de cada número em relação à média aritmética. 36 onde R = 36 – 10 = 26 . • São medidas estatísticas utilizadas para avaliar o grau de variabilidade ou dispersão. 10.5 Estatísticas Amostrais 1. o que a torna instável. Relação entre as médias aritmética. • Servem para medir a representatividade da média . . . xn ocorrerem com as freqüências n1.3) Variância: A variância de um conjunto de dados é definida como o quadrado do desvio padrão.Estatística Descritiva b. .1.. 25.Observação: É uma medida de dispersão muito limitada.Estatística Descritiva ∑n di = i xi − x i =1 n = ∑n i x− x n ESTATÍSTICA APLICADA I . x2 . dos valores em torno da média.5 Estatísticas Amostrais b) Medidas de dispersão b) Medidas de dispersão b.

4) Desvio padrão: • O desvio padrão é uma medida que só pode assumir valores não negativos e quanto maior for. • Algumas propriedades do desvio padrão.5 Estatísticas Amostrais b) Medidas de dispersão 1  ∑ ni x i2 − N  (∑ n x ) 1  ∑ ni x i2 − n−1  (∑ n x ) σ2 = (dados agrupados) x = média populacional.1.Estatística Descritiva • Exemplo: Calcular o desvio médio.06 16 ESTATÍSTICA APLICADA I . a variância e o desvio padrão da seguinte distribuição amostral: xi 5 7 8 9 11 xi ni nixi ni 2 3 5 4 2 5 7 8 9 11 2 3 5 4 2 10 21 40 36 22 Σ 16 129 .Estatística Descritiva 23 .se s= 0. quanta mais variabilidade houver entre os dados.5 Estatísticas Amostrais b) Medidas de dispersão b) Medidas de dispersão b. toma-se a raiz quadrada da variância e obtém-se o desvio padrão.5 Estatísticas Amostrais 2 2 i i N 2 i n i    b.4) Desvio padrão: b. σ = σ2     s= s (desvio padrão populacional) 2 (desvio padrão amostral) ESTATÍSTICA APLICADA I .3) Variância: b.3) Variância: • Fórmulas práticas para os cálculos das variâncias: s2 = ESTATÍSTICA APLICADA I .5 Estatísticas Amostrais b) Medidas de dispersão b) Medidas de dispersão b. Assim.Para o caso da variância amostral são adotadas as seguintes fórmulas: n n ∑( x σ2 = i − X )2 i =1 = N ∑( x − X ) 2 (dados não agrupados) ∑( x s2 = ∑n ( x i σ2 = − x )2 ∑( x − x ) = n−1 N k i i=1 2 (dados não agrupados) n−1 k i −X) 2 i =1 = N ∑n ( x − X ) 2 (dados agrupados) i N ∑n ( x i s2 = X = média populacional.4) Desvio padrão: Uma vez que a variância envolve a soma de quadrados.Estatística Descritiva 1.5 Estatísticas Amostrais 1.o desvio padrão é sempre não negativo e será tanto maior.Estatística Descritiva 1. ESTATÍSTICA APLICADA I . para se conseguir uma medida da variabilidade ou dispersão com as mesmas unidades que os dados.Estatística Descritiva 1. n = tamanho da população. .5 Estatísticas Amostrais ESTATÍSTICA APLICADA I . que resultam imediatamente da definição. i −x) 2 i=1 n−1 ∑n ( x − x ) =∑ i n−1 b) Medidas de dispersão b.Estatística Descritiva 1. ESTATÍSTICA APLICADA I . N = tamanho da população.Média aritmética: k ∑n x i x= i =1 n 5 ∑n x i i = i =1 16 i = 129 = 8 . isto é. a unidade em que se exprime não é a mesma que a dos dados.3) Variância: . maior será a dispersão dos dados. são: . os dados são todos iguais.Para o caso da variância populacional são adotadas as seguintes fórmulas: . então não existe variabilidade.

a variância e o desvio padrão da seguinte distribuição amostral: .5) Amplitude interquartílica: • Esta medida é. ASI = Q3 − Q1 2 ESTATÍSTICA APLICADA I . uma solução de compromisso.94 6.4) Desvio padrão: b. de certa forma.24 = 1 .69 ESTATÍSTICA APLICADA I .1.5) Amplitude interquartílica: • Da definição de amplitude interquartílica.06 |9 – 8. a variância e o desvio padrão da seguinte distribuição amostral: • Exemplo: Calcular o desvio médio.86 = 1.88 Σ 16 129 19.5 Estatísticas Amostrais b) Medidas de dispersão ) 2 nx  1  ∑ ni x i2 − ∑ i i  = n−1 n   1  ( 129 ) 2  s2 = 1 . É definida como sendo a diferença entre o 3º e 1º quartis. na amostra. pois não é afetada.Desvio padrão: s = s 2 = 2 .083 ESTATÍSTICA APLICADA I . 083 − = 2 . pela existência de um pequeno número de valores demasiadamente grandes ou pequenos. que os dados não apresentem variabilidade.5) Amplitude interquartílica: • A medida anterior tem a grande desvantagem de ser muito sensível à existência.Estatística Descritiva 1.4) Desvio padrão: • Exemplo: Calcular o desvio médio. ESTATÍSTICA APLICADA I .06| = 1.Estatística Descritiva 1. b.06| = 2. de um modo geral.18 0. a amplitude interquartílica.5 Estatísticas Amostrais b) Medidas de dispersão ESTATÍSTICA APLICADA I .06| = 0. assim: DQ = Q3 − Q1 ESTATÍSTICA APLICADA I .86   16 − 1  16  s2 = xi ni nixi ni2xi 5 7 8 9 11 2 3 5 4 2 10 21 40 36 22 50 147 320 324 242 Σ 16 129 1.06 |7 – 8. Esta medida é não negativa e será tanto maior quanto maior for a variabilidade nos dados.06 |8 – 8.5) Amplitude interquartílica: • Alguns autores preferem calcular uma medida próxima da referida: a amplitude semiinterquartílica (ASI). uma amplitude interquartílica nula não significa necessariamente.Estatística Descritiva 1.24 ( .30 3.Estatística Descritiva 1. de uma observação muito grande ou muito pequena.12 3.06| = 0.Estatística Descritiva 24 .5 Estatísticas Amostrais b) Medidas de dispersão b.Desvio médio: DM = ∑n i x− x n = 19 .Estatística Descritiva b.2 16 xi ni nixi |xi-x| = |di| ni|di| 5 7 8 9 11 2 3 5 4 2 10 21 40 36 22 |5 – 8.5 Estatísticas Amostrais 1.5 Estatísticas Amostrais b) Medidas de dispersão b) Medidas de dispersão b.94 |11 – 8.5 Estatísticas Amostrais b) Medidas de dispersão b. • Por esse motivo.06| = 3. define-se uma outra medida.76 5.Variância: . pode-se concluir que 50% dos elementos do meio da amostra estão contidos num intervalo com aquela amplitude. • Ao contrário do que acontece com o desvio padrão.

que o salário das mulheres apresentam maior dispersão que os dos homens ESTATÍSTICA APLICADA I .Estatística Descritiva 1.6) Coeficiente de variação: • A variação ou dispersão real.Estatística Descritiva 1.000.5 Estatísticas Amostrais c) Medidas de forma b. da mesma variação em uma distância menor.00.00.6) Coeficiente de variação: b.5 Estatísticas Amostrais b) Medidas de dispersão CV = Dispersão absoluta Média ⋅ 100 ou CV = s ⋅ 100 x • coeficiente de variação é uma medida relativa de dispersão.00. • Exemplo: Em uma empresa.5 Estatísticas Amostrais b) Medidas de dispersão b.5 Estatísticas Amostrais 1.000. definida por: Dispersão relativa = ESTATÍSTICA APLICADA I . entretanto. • Uma distribuição de freqüência pode simétrica. • Alguns analistas consideram valores diferentes: Baixa dispersão: CV ≤ 15% Média dispersão: 15% < CV < 30% Alta dispersão: CV ≥ 30% ESTATÍSTICA APLICADA I .0% X 3000 CV = ESTATÍSTICA APLICADA I .5% 4000 1200 σ CV = ⋅ 100 = ⋅ 100 = 40 . na medida de uma determinada distância. com desvio padrão de $1. ou qualquer outra medida de dispersão. dado por: σ X ESTATÍSTICA APLICADA I . portanto.5 Estatísticas Amostrais σ 1500 ⋅ 100 = 37 .500. a dispersão relativa é denominada coeficiente de variação ou de dispersão. é denominada dispersão absoluta.1. determinada a partir do desvio padrão. assimétrica positiva ou assimétrica negativa. útil para a comparação em termos relativos do grau de concentração em torno da média de séries distintas. e o das mulheres é em média de $3.6) Coeficiente de variação: • Se a dispersão absoluta é o desvio padrão e a média é a aritmética. o salário médio dos homens é de $4.Estatística Descritiva ESTATÍSTICA APLICADA I . média ou alta variabilidade (dispersão) conforme os seguintes valores: Baixa dispersão: CV ≤ 10% Média dispersão: 10% < CV < 20% Alta dispersão: CV ≥ 20% c.6) Coeficiente de variação: b.200.Estatística Descritiva 25 . Então: Para os homens: Para as mulheres: b) Medidas de dispersão X ⋅ 100 = • Desses valores conclui-se.00.1) Medidas de assimetria: • Denomina-se assimetria o grau de desvio ou afastamento da simetria de uma distribuição.Estatística Descritiva 1. uma variação ou dispersão.6) Coeficiente de variação: • Diz-se que a distribuição possui baixa. é inteiramente diferente quanto ao efeito.5 Estatísticas Amostrais b) Medidas de dispersão b) Medidas de dispersão b. com desvio padrão de $1.Estatística Descritiva 1. • A medida desse efeito é proporcionada pela dispersão relativa.

a distribuição é assimétrica positiva AS < 0.Mesocúrtica: quando sua forma nem é achatada e nem delgada. tem-se que: Mo < ~ x<x • Em uma distribuição assimétrica negativa.96 Q + Q 3 − 2 x~ 40 + 90 − 2 AS = 1 = = 0 . ESTATÍSTICA APLICADA I .700 x= = 66 .1) Medidas de assimetria: c.62 159  160  s = 31 .Como AS > 0.700 ESTATÍSTICA APLICADA I .1) Medidas de assimetria: c.875 160 1  ( 10.Estatística Descritiva 1. .750 30/50 = 0.1º Coeficiente de Pearson: • Em uma distribuição assimétrica positiva.000 −  = 1021.Estatística Descritiva 26 .5 Estatísticas Amostrais c) Medidas de forma c) Medidas de forma c.2) Medidas de curtose: • Exemplo: 10.1) Medidas de assimetria: c. a distribuição é assimétrica negativa.250 50/50 = 1 468.Estatística Descritiva ESTATÍSTICA APLICADA I .700 )2  2 s = 878.1) Medidas de assimetria: • Exemplo: Identificar o grau de assimetria da distribuição: • Exemplo: Classes Salários ($1.00) 30 50 50 100 100 150 Empregados 60 50 30 xi 30 50 40 50 100 75 100 150 125 Σ ni nixi 80 50 30 3200 3750 3750 160 10. • Uma distribuição de freqüência pode ser: .429 AS = = = 0 .429 4+3 1  ( 10.000 −  = 1021.6 Ni 80 130 160 878.Estatística Descritiva 1.Estatística Descritiva 1.96 AS = x − Mo • Se AS = 0. dentre elas duas são bastante utilizadas: . mediana e modo.6 Q3 − Q1 90 − 40 • Denomina-se curtose o grau de achatamento de uma distribuição.Leptocúrtica: quando apresenta a forma delgada. a distribuição é simétrica AS > 0.Estatística Descritiva 1.1) Medidas de assimetria: • Uma distribuição simétrica apresenta a igualdade entre as três medidas de posição.000 80/20 = 4 281. .Platicúrdica: quando apresenta a forma achatada.5 Estatísticas Amostrais c) Medidas de forma c) Medidas de forma c. . ou: M o = x~ = x • Existem várias fórmulas para o cálculo do coeficiente de assimetria. média aritmética.2º Coeficiente de Pearson: σ ou AS = x − Mo s Q1 + Q3 − 2 ~ x Q 3 − Q1 ESTATÍSTICA APLICADA I .85 − 41 . ESTATÍSTICA APLICADA I .5 Estatísticas Amostrais nixi2 ni/ai 128.5 Estatísticas Amostrais c) Medidas de forma c) Medidas de forma c. ou assimétrica à esquerda.796 s 31 .000.62 159  160  4 M o = 30 + ⋅ 20 = 41 .5 Estatísticas Amostrais 1. tem-se que: x<~ x < Mo .1. ou assimétrica à direita.700 )2  2 s = 878. então a distribuição é assimétrica positiva.5 Estatísticas Amostrais AS = ( 40 − 0 ) Q1 = 30 + ⋅ 20 = 40 80 Q 3 = 50 + ( 120 − 80 ) ⋅ 50 = 90 50 ( 80 − 0 ) ~ x = 30 + ⋅ 20 = 50 80 x − M o 66 .000 ESTATÍSTICA APLICADA I .

possibilidade de detectar outliers (pontos bastante diferentes do conjunto de dados) e o desvio da simetria. K < 0.5 Estatísticas Amostrais 1. • Se K = 0.1.263 – a curva é leptocúrdica.Como K > 0.Estatística Descritiva 27 .375 160 Q 3 − Q1 90 − 40 K= = = 0 . quando o número de observações for moderadamente alto. ESTATÍSTICA APLICADA I .273.Estatística Descritiva 1. • Esse tipo de gráfico permite uma fácil visualização de duas características dos dados: a posição (meio) e a dispersão (espalhamento ou variabilidade) ESTATÍSTICA APLICADA I . logo: ( 16 − 0 ) P10 = 30 + ⋅ 20 = 34 80 ( 144 − 130 ) P90 = 100 + ⋅ 50 = 104 . no caso de amostras pequenas (até cerca de 20 observações).263 – a curva é platicúrdica. • São utilizados para dados contínuos. e são muito úteis para exibir um pequeno conjunto de dados. ESTATÍSTICA APLICADA I .6 Outras Apresentações Gráficas de Dados • • • Além dos diagramas já estudados. Um bom modo de obter uma apresentação visual eficiente de um conjunto de dados pode ser conseguido por meio de três tipos de gráficos: diagramas de pontos. Questões como quantidades de dados abaixo de certo valor.2) Medidas de curtose: • Exemplo: Para a mesma distribuição do exemplo da assimetria.2) Medidas de curtose: c. P90 = 90º percentil. pois existem muitas observações. diagramas de ramo e folhas e diagramas de caixa.Estatística Descritiva I . O diagrama de pontos é uma apresentação útil de dados. Entretanto. o diagrama de ramo e folhas e o diagrama de caixa podem ser mais úteis.Estatística Descritiva c) Medidas de forma  Introdução  Conceitos e definições  Classificação dos dados  Caracterização e apresentação dos dados  Estatísticas amostrais  Outras apresentações gráficas de dados  Regressão linear c. não são fáceis de responder.5 Estatísticas Amostrais c) Medidas de forma c) Medidas de forma c. tendência central (média ou mediana). calcula-se ainda P10 e P90.375 − 34 ) . e a construção de um diagrama de pontos. Q1 = 1º quartil. dispersão (desvio-padrão). K > 0.2) Medidas de curtose: • Para medir o o grau de curtose utiliza-se o coeficiente: K= Q 3 − Q1 2( P90 − P10 ) onde Q3 = 3º quartil. P10 = 10º percentil. existem outras formas bastante utilizadas internacionalmente para apresentar os dados amostrais. quantitativos e univariados. seria relativamente ineficiente .Estatística Descritiva 1. usando esses dados. então a distribuição é do tipo platicúrtica.6 Outras Apresentações Gráficas de Dados  Diagrama de pontos • Um diagrama de pontos é um gráfico estatístico que consiste em grupos de pontos de dados traçados em uma escala simples.355 2( P90 − P10 ) 2( 104 . ESTATÍSTICA APLICADA I .Estatística Descritiva 1.263 – a curva correspondente à distribuição é mesocúrtica.5 Estatísticas Amostrais ESTATÍSTICA APLICADA I .Estatística Descritiva ESTATÍSTICA APLICADA I .

13. 13. Oito protótipos desse projeto são construídos. • Geralmente.Estatística Descritiva 1. ESTATÍSTICA APLICADA I .6 Outras Apresentações Gráficas de Dados  Diagrama de pontos 1. 12. Ele considera estabelecer como especificação do projeto uma espessura de 3/32 pol. mas está inseguro. e uma folha (leaf). 12 13 14 Força de remoção • Exemplo 02: O engenheiro do exemplo anterior decide considerar um projeto alternativo com uma espessura maior da parede do conector. 12. Oito unidades do protótipo são produzidas e suas forças de remoção são medidas. 13.1. Construa um diagrama de pontos para esses dados. consistindo nos dígitos restantes.16): Considere o conjunto de dados abaixo.6 Outras Apresentações Gráficas de Dados  Diagrama de ramo e folhas (dados ordenados) Frequência Ramo 1 1 1 2 3 3 6 8 12 10 10 7 6 4 1 3 1 1 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 ESTATÍSTICA APLICADA I . resultando nos seguintes dados (em libras): 12. p. consistindo em um ou mais dígitos iniciais.0 13. 13.6 Outras Apresentações Gráficas de Dados  Diagrama de ramo e folhas (dados brutos) 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 Folha 6 7 7 5 5 1 4 2 4 3 8 0 9 7 8 1 7 5 1 8 0 1 9 7 0 5 3 6 1 0 3 3 5 1 7 4 6 0 0 8 9 5 8 3 3 4 1 9 8 3 3 4 0 1 4 3 5 1 0 5 6 1 4 6 8 0 2 0 9 8 6 8 0 8 8 7 9 1 0 6 154 131 178 151 201 153 174 154 115 76 167 142 163 200 176 120 160 184 145 150 168 208 135 171 170 167 158 229 148 118 141 133 146 158 149 ESTATÍSTICA APLICADA I . 1/8 pol.2-3): Um engenheiro está projetando um conector de náilon para ser usado em aplicação automotiva.6. a primeira parte 45. 12. 14. Exemplo: O dado 458 é dividido em duas partes.6 Outras Apresentações Gráficas de Dados  Diagrama de ramo e folhas • Esta forma de apresentação de dados tem sido freqüentemente utilizada em trabalhos técnicos do mundo inteiro.Estatística Descritiva 97 163 134 199 196 O diagrama de ramo e folhas resultante é apresentado a seguir: ESTATÍSTICA APLICADA I . 2004.Estatística Descritiva 28 . relativos à resistência a compressão de uma liga de alumínio.8.4 Força de remoção 3/32 pol.9. 105 245 207 218 160 221 228 180 157 175 183 174 190 101 149 186 199 193 171 87 121 181 194 165 160 181 180 158 176 133 156 172 158 237 150 143 110 123 169 135 1.1.3.1.Estatística Descritiva 1.2. 13. escolhe-se relativamente poucos ramos em comparação ao número de observações (5 a 20 itens).9.6 Outras Apresentações Gráficas de Dados  Diagrama de pontos • Exemplo 01 (Montgomery. 13.5 e 13. 13.5.6. 12. • Exemplo (Montgomery. sobrepondo-o ao anterior para uma melhor análise da influência da espessura da parede na força de remoção. resultando nos seguintes dados (em libras): 12. dividimos o elemento amostral em duas partes: um ramo (stem).4.Estatística Descritiva Ramo 15 Folha 6 7 7 1 0 0 1 1 0 0 0 0 0 0 8 1 7 5 5 5 1 3 2 0 0 1 0 3 1 8 3 3 3 1 0 1 1 4 7 8 9 4 5 3 3 2 1 6 8 5 6 4 3 4 3 9 5 8 4 5 4 4 9 9 6 7 5 6 9 7 8 8 8 8 7 8 9 6 6 8 Frequência 1 1 1 2 3 3 6 8 12 10 10 7 6 4 1 3 1 1 ESTATÍSTICA APLICADA I . Construa um diagrama de pontos para esses dados.7. • Para construir o diagrama de ramo e folhas. 1/8 pol. sendo as medidas observadas da força de remoção.Estatística Descritiva 1. 15 12 14 13.6 e 13. e a segunda parte 8.. p.9. 2004.6 Outras Apresentações Gráficas de Dados  Diagrama de ramo e folhas ESTATÍSTICA APLICADA I .2.

sujeitos a uma tensão alternada repetida. como já dito. Q3.8 Q3 = 1735 30 65 ESTATÍSTICA APLICADA I . Q2. Uma maneira de fazer isto seria dividir o ramo escolhido em dois ou mais novos ramos. a possibilidade de detectar outliers (pontos bastante diferentes do conjunto de dados) e o desvio da simetria.5 Q1 = 1097. • A linha inferior (ou esquerda) começa no primeiro quartil indo até o menor valor do conjunto de pontos dentro das amplitudes interquartis de 1. A probabilidade é muito pequena. Portanto.Estatística Descritiva • Uma linha é desenhada através da caixa.50 Q3 = 181. conforme mostrado abaixo: Ramo 14L 14U 15L 15U Folha 1 6 0 6 2 8 0 7 3 9 1 8 Ramo 5 9 3 4 4 8 8 8 14z 14t 14f 14s 14e 15z 15t 15f 15s 15e Ramo 1 2 3 5 8 11 17 25 37 (10) 33 23 16 10 6 5 2 1 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 N = 80 Min = 76 Max = 245 Média = 162. (b) Você acha que o corpo de prova “sobreviverá” além de 2.Estatística Descritiva 1.5 Q1 = 143. c) M = 1436. de 21. pode apresentar a média. opcionalmente. é opcional. a dispersão (desvio-padrão).6 Outras Apresentações Gráficas de Dados  Diagrama de ramo e folhas  Diagrama de ramo e folhas • Em alguns casos pode ser desejável construir mais intervalos ou ramos. a) Profundidade Ramo 1 5 8 10 17 22 29 33 (5) 32 22 18 11 7 5 4 2 3 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 Folha 75 06 45 10 00 02 03 10 16 01 05 30 20 10 23 00 15 58 65 90 15 02 23 15 21 02 08 50 83 40 85 98 85 16 09 38 15 52 12 42 50 88 18 15 58 30 68 22 74 64 90 20 55 85 20 60 69 70 81 35 40 60 67 78 94 81 82 92 b) Não. a partir do primeiro quartil.5. p. alinhados tanto horizontal como verticalmente.Estatística Descritiva 1.6 Outras Apresentações Gráficas de Dados  Diagrama de ramo e folhas 1567 1883 1203 1270 1015 845 1674 1016 1102 1605 706 2215 785 885 5 5 1 3 2 0 0 1 0 3 1 8 3 3 3 1 0 1 1 4 7 4 5 3 3 2 1 6 8 5 6 4 3 4 3 9 5 8 4 5 4 4 9 9 6 7 5 6 9 7 8 8 8 8 7 8 9 6 6 8 8 9 ESTATÍSTICA APLICADA I . em uma caixa retangular. no segundo quartil (que é o percentil 50 ou a mediana). ESTATÍSTICA APLICADA I .7 Mediana = 161. A média. o comprimento da caixa é igual a amplitude interquartil .000 psi e 18 ciclos por segundo: 1115 1310 1540 1502 1258 1315 1085 798 1020 865 2130 1421 1109 1481 Folha 6 7 7 1 0 0 1 1 0 0 0 0 0 0 8 1 7 5 1223 375 2265 1910 1018 1452 1890 2100 1594 2023 1315 1269 1260 1888 1782 1522 1792 1000 1820 1940 1120 910 1730 1102 1578 758 1416 1560 1055 1764 1330 1608 1535 1781 1750 1501 1238 990 1468 1512 1750 1642 ESTATÍSTICA APLICADA I . • Um diagrama de caixa apresenta três quartis.6 Outras Apresentações Gráficas de Dados  Diagrama de caixa (box plot) • Uma outra forma gráfica de apresentar os dados é o chamado diagrama de caixa (box plot) ou diagrama de caixa e linhas (box and whiskers).000 ciclos? Justifique a sua resposta. • Uma linha (whisker) estende-se de cada extremidade da caixa.17): Os seguintes dados são os números de ciclos até a falha.1. 2004.Estatística Descritiva 1.00 S2 = 33. com o canto esquerdo (ou inferior) no primeiro quartil.6 Outras Apresentações Gráficas de Dados  Diagrama de caixa (box plot) • (a) Construa um diagrama de ramo e folhas para esses dados.Estatística Descritiva 1. de corpos de prova de alumínio.6 Outras Apresentações Gráficas de Dados  Diagrama de ramo e folhas • Exercício (Montgomery. e o canto direito (ou superior) no terceiro quartil. • A caixa inclui a amplitude interquartil. tais como a tendência central (média ou mediana). DQ = Q3 .Estatística Descritiva 29 .6 Outras Apresentações Gráficas de Dados 1. Q1.77 Folha 1 2 3 5 0 1 4 6 8 Freqüência acumulada 0 3 4 7 8 8 8 ESTATÍSTICA APLICADA I . que permite descrever simultaneamente vários fatores importantes de uma série de dados. ESTATÍSTICA APLICADA I .Q1. (c) Encontre a mediana e os quartis.

. ESTATÍSTICA APLICADA I . diz-se que essas variáveis estão linearmente correlacionadas. Esta representação consiste na marcação das observações em um sistema de eixos cartesianos. ESTATÍSTICA APLICADA I .Estatística Descritiva I ..Estatística Descritiva  Diagrama de caixa (box plot) • Exercício: Represente o diagrama de caixa para os dados da resistência à compressão do alumínio mostrados no exercício anterior. N = 80 Min = 76 Max = 245 Média = 162. .Estatística Descritiva 1. • Se as variáveis fornecem um diagrama de dispersão em que os pontos se colocam ao redor de uma reta crescente ou decrescente.5 Q1 = 143.Estatística Descritiva 30 .1.. Ocasionalmente. i = 1. • Nesse caso. yi).6 Outras Apresentações Gráficas de Dados ESTATÍSTICA APLICADA I ..00  Introdução  Conceitos e definições  Classificação dos dados  Caracterização e apresentação dos dados  Estatísticas amostrais  Outras apresentações gráficas de dados  Regressão linear ESTATÍSTICA APLICADA I .50 Q3 = 181.Estatística Descritiva  Correlação linear • Para se ter uma idéia de como as duas variáveis se relacionam é comum representar graficamente esta relação por meio de um diagrama de dispersão. é chamado de dispersos (outliers). símbolos diferentes (círculos abertos e fechados.. 2.5. • Dados mais afastados dos que as linhas são plotados como pontos individuais.7 Regressão Linear  Relação entre duas variáveis • Em inúmeras ocasiões o estudo descritivo não se resume ao estudo de apenas uma variável. a partir do terceiro quartil.. xn). ESTATÍSTICA APLICADA I . n.6 Outras Apresentações Gráficas de Dados  Diagrama de caixa (box plot)  Diagrama de caixa (box plot) • A linha superior (ou direita) começa no terceiro quartil indo até o maior do conjunto de pontos dentro das amplitudes interquartis de 1. passase a ter dados bivariados (xi. x2. porém a menos de 3 amplitudes interquartis a partir da extremidade da caixa. por exemplo) são usados para identificar os dois tipos de outlier.7 Regressão Linear ESTATÍSTICA APLICADA I . em vez de uma amostra (x1. Um ponto além da linha.Estatística Descritiva 1. • Um dos objetivos desse estudo é a relação existente entre as variáveis do par. muitas vezes é necessário a observação de duas ou mais variáveis. • Um ponto a mais de 3 amplitudes interquartis a partir da extremidade da caixa é chamado de um outlier extremo.7 Mediana = 161. para se ter uma visão global do problema em estudo.Estatística Descritiva 1.6 Outras Apresentações Gráficas de Dados 1. .

para ser usada em refrigeração. • Essa dificuldade pode ser contornada pelo uso de uma medida que caracterize a correlação linear e seja independente do observador que esteja examinando os dados.Estatística Descritiva 1. contendo a média da segunda variável.8 96.5 98.1.6 97.7 Regressão Linear 1.5 98. y y x Variáveis não correlacionadas x Variáveis não correlacionadas linearmente x Variáveis não correlacionadas linearmente x 100 125 150 175 200 225 250 275 y 99. y ) s x2 ⋅ s 2y onde: Cov (x. ESTATÍSTICA APLICADA I .2 98.Estatística Descritiva 1.1 98. y ) = ∑ ( x − x )⋅ ( y − y ) n−1 e sx2 e sy2 são as variâncias da variáveis x e y. a explicação possível para os valores da segunda variável é sua média. Nesse caso.5 97.7 • Desse diagrama pode-se extrair que talvez exista uma correlação linear entre as variáveis. o eixo da dispersão será horizontal.0 96.3 97. construa o diagrama de dispersão para esses dados. ESTATÍSTICA APLICADA I .y) é a covariância das variáveis x e y. e diz-se que as variáveis não são linearmente correlacionadas.Estatística Descritiva 1.8 97.5 98. o qual é dado pela relação: r= Cov ( x .7 Regressão Linear  Correlação linear  Correlação linear y y x Correlação linear forte • Exemplo: A tabela abaixo mostra os dados da temperatura do gás combustível (ºF) e da respectiva taxa de calor (Btu/kwh) para uma turbina de combustão. • Se nenhuma tendência positiva ou negativa pode ser detectada. e seu cálculo é dado por Cov ( x .8 97.Estatística Descritiva 31 .8 x 300 325 350 375 400 425 450 500 y 97. mais forte será a correlação.7 Regressão Linear 1. x x Correlação linear forte Correlação linear fraca (positiva) (negativa) (positiva) ESTATÍSTICA APLICADA I .7 Regressão Linear ESTATÍSTICA APLICADA I .8 98.7 Regressão Linear  Correlação linear  Correlação linear • Quanto menor a dispersão dos pontos em torno da reta. y y y • A correlação linear será positiva ou negativa caso a tendência da reta seja crescente ou decrescente.7 Regressão Linear  Coeficiente de correlação linear • A determinação da correlação entre duas variáveis por meio de uma inspeção nos pares anotados ou no diagrama de dispersão correspondente é pouco precisa e subjetiva.Estatística Descritiva ESTATÍSTICA APLICADA I .0 97.Estatística Descritiva ESTATÍSTICA APLICADA I . esta relação pode ser traduzida por meio de uma reta.  Coeficiente de correlação linear • Karl Pearson propôs o chamado coeficiente de correlação linear.

sy2 = 0 r = 0. os pontos (x. ou seja.y) = 0. indica correlação linear negativa perfeita. deve-se esperar um valor y2 maior que a média y. y y x • A correlação entre duas variáveis pretende captar o fato dessas variáveis apresentarem a mesma tendência ao crescimento. e se procura estimar o valor de y1 para certo valor x1 menor que a média x. obtém-se o coeficiente de correlação de forma mais simples: s r= onde: xy • r = 0.7 Regressão Linear  Coeficiente de correlação linear  Coeficiente de correlação linear • Nos casos em que os pontos do diagrama de dispersão estão em uma reta vertical ou horizontal. • O conhecimento da correlação entre duas variáveis. nada informa a respeito da qualidade dessa previsão. sx2 = 0 ESTATÍSTICA APLICADA I .Estatística Descritiva 32 . para um valor x2 maior que a média x . o quociente que calcula o coeficiente de correlação não está definido. o coeficiente de correlação será considerado nulo. não se pode. em geral.1. n ∑ x⋅∑ y n ESTATÍSTICA APLICADA I . o que é importante em problemas de previsão. x r = 0. s xx ⋅ s yy (∑ y ) • r = 1. indica correlação linear positiva perfeita.Estatística Descritiva x x2 x ESTATÍSTICA APLICADA I .y) = 0.Estatística Descritiva • Os problemas que envolvem estimativas de valores desconhecidos a partir de valores históricos são chamados problemas de previsão ou predição.Estatística Descritiva 1.y) estão sobre uma reta com coeficiente angular positivo. pois Cov (x. • Entretanto. nem apresentam tendência crescente ou decrescente.7 Regressão Linear 1.7 Regressão Linear  Coeficiente de correlação linear  Coeficiente de correlação linear • Fazendo-se as devidas substituições e simplificações. 2 s yy = ∑ y 2 − −1≤ r ≤ 1 (∑ x ) 2 s xx = ∑ x 2 − s xy = ∑ xy − n • r = -1. y y2 y y1 x1 ESTATÍSTICA APLICADA I . com base apenas no conhecimento da correlação. Nesse caso.7 Regressão Linear  Coeficiente de correlação linear  Coeficiente de correlação linear • Se as variáveis x e y são positivamente correlacionadas. indica que os pontos não estão correlacionados.7 Regressão Linear ESTATÍSTICA APLICADA I . • O fato de duas variáveis evoluírem no mesmo sentido ou em sentidos opostos fornece uma idéia do que se pode esperar sobre um valor desconhecido da variável y para um particular valor de x. ou tendências contrárias.7 Regressão Linear 1.Estatística Descritiva 1.y) estão sobre uma reta com coeficiente angular negativo. devese esperar o valor correspondente y1 menor que a média y . acompanhando a tendência do eixo crescente dos pontos. transformar a incerteza da previsão em risco (isto só pe possível quando a correlação é perfeita).Estatística Descritiva 1. ESTATÍSTICA APLICADA I . embora possa fornecer uma pista para a previsão de um valor desconhecido de uma delas. o fato de duas variáveis serem correlacionadas levanta a possibilidade de uma relação causal entre elas. pois apresenta numerador e denominador nulos. os pontos (x. Cov (x.

7 Regressão Linear 1. portanto.Estatística Descritiva 1.7 Regressão Linear  Regressão linear simples – Modelo teórico • Considere o relacionamento de duas variáveis x e y com as seguintes características: x: é a variável cujos valores são controlados e. a qual é introduzida no valor de y por fatores imponderáveis.Estatística Descritiva 1. deve-se pensar como estimar os valores de α e β.  Método dos mínimos quadrados • Um dos métodos mais utilizados para ajustar uma reta a um conjunto de dados é o Método dos Mínimos Quadrados (MMQ). dificilmente se conhece a população dos valores de y para cada valor da variável controlada x. • Um método de previsão que permite a avaliação em termos de confiabilidade é a regressão linear. pois.7 Regressão Linear ESTATÍSTICA APLICADA I . ŷ. dado um valor para x. a previsão ou expectativa para o correspondente valor de y é: y =α +β x • Entretanto.7 Regressão Linear ESTATÍSTICA APLICADA I . • Essa reta serve de modelo matemático para expressar a relação linear entre duas variáveis. uma correlação forte entre duas variáveis. cuja equação pode ser escrita como: y =α +β x O valor de y é dado por: y = y+U ou y =α + β x+U onde: y é a parte funcional de y (a parte do valor de y explicada pelo valor de x). o que pode ser ser feito de forma eficiente por meio do método dos mínimos quadrados. determinados. geralmente. y: variável aleatória.7 Regressão Linear  Regressão linear simples – Modelo teórico • Nessas condições.y). seu valor depende do valor atribuído a x. quer pelo coeficiente de correlação linear. ela proporciona a transformação da incerteza em risco • Quando se verifica.Estatística Descritiva 33 . é a variável que se quer prever. ESTATÍSTICA APLICADA I . embora para cada valor de x se possa ter vários valores de y. O que se conhece.7 Regressão Linear  Regressão linear simples  Regressão linear simples – Modelo teórico • Como visto anteriormente.Estatística Descritiva 1. ESTATÍSTICA APLICADA I . U é a parte aleatória de y. ESTATÍSTICA APLICADA I . quer por meio do gráfico de dispersão. o qual consiste em determinar a reta que minimiza a soma dos quadrados dos desvios (os chamados erros ou resíduos) entre os verdadeiros valores de y e os valores estimados a partir da reta de regressão que se pretende ajustar.Estatística Descritiva ESTATÍSTICA APLICADA I . ŷ^= a + bx • Portanto. satisfeitas determinadas condições.Estatística Descritiva 1.  Regressão linear simples – Modelo teórico • O modelo teórico define a verdadeira reta de regressão. devido a sua característica aleatória (variável dependente de x). com base nos dados amostrais. a relação entre essas variáveis pode ser descrita por meio de uma reta de regressão (a reta que melhor se ajusta aos dados). ela é conhecida por variável independente ou variável de decisão.1. uma previsão construída baseada nas informações obtidas da correlação nada diz a respeito da confiabilidade do valor previsto. apenas uma amostra dessas variáveis. ou seja. são alguns valores dos pares (x.

min ∑ ε i2 = min ∑ ( y i − ˆy i ) 2 = min ∑ [ y i − ( a + bx i )] 2 ESTATÍSTICA APLICADA I . VE = ∑ ( yˆ − y ) ESTATÍSTICA APLICADA I . • Sendo números positivos. ao invés de somar essas diferenças. o que dará origem ao coeficiente de explicação R2. é necessário que as primeiras derivadas em relação a a e a b sejam nulas. y yi ŷ y ŷ = a + bx } yi − ˆy = parte do valor de y não explicada pela média yˆ − y = parte do valor de y explicada pela regressão } } xi ESTATÍSTICA APLICADA I .Estatística Descritiva .Estatística Descritiva 1. • Designando: VT = variação total. esses quadrados refletem a qualidade do ajuste através de sua soma.7 Regressão Linear 1. xx ESTATÍSTICA APLICADA I . por yˆ − y . soma dos quadrados das variações de y em relação à sua média. • Uma forma de medir a qualidade do ajuste é verificar qual a porcentagem da variação dos valores de y em relação à sua média pode ser explicada pela regressão de y sobre x. • A reta estimada é obtida de tal modo que a soma dos quadrados dos desvios ou resíduos (εi = yi – ŷ) seja mínima. para estimar os parâmetros do modelo. assim:  ∂ 2  ∂ a ∑ ( y i − a − bx i ) = 0    ∂ ∑ ( y i − a − bx i ) 2 = 0  ∂ b As estimativas dos mínimos quadrados para os parâmetros α e β são: a= ∑ y −b∑x = y−bx n ESTATÍSTICA APLICADA I .1. a e b os estimadores de α e β. a soma dos quadrados das variações em 2 relação à média. ou seja.7 Regressão Linear 1. • No método dos mínimos quadrados.7 Regressão Linear  Coeficiente de explicação  Coeficiente de explicação • Do gráfico abaixo. deve-se verificar a qualidade do ajuste dessa reta aos dados históricos. e na soma podem anular-se.7 Regressão Linear 1. isto é. 2 VT = ( y − y ) = ∑( i − ) VE = variação explicada. soma-se o quadrado delas para evitar que valores positivos e negativos se anulem. não refletindo o ajustamento. onde ŷ = a + bx é a regressão de y sobre x. e as segundas sejam maiores ou iguais a zero. • O modelo de regressão linear é a reta de regressão ŷi = a + bxi + εi onde ŷ é o estimador de y.Estatística Descritiva y = parte do valor de y explicada pela média x • Interessa avaliar que porcentagem da parte não explicada pela média.7 Regressão Linear  Método dos mínimos quadrados  Método dos mínimos quadrados • Adota-se o quadrado das diferenças.Estatística Descritiva 1.7 Regressão Linear  Método dos mínimos quadrados  Coeficiente de explicação • Como tal.Estatística Descritiva 34 . y i − y . n b= ∑x⋅∑ y ∑ xy − n s = (∑ x ) s x − ∑ n 2 2 xy • Calculada a estimativa de mínimos quadrados para uma amostra dada. observa-se que o valor de yi correspondente a um valor xi pode ser composto de duas partes: a parte explicada pela média e a parte não explicada pela média. pois como os pontos se situam acima e abaixo da reta estimada. as diferenças podem ser positivas ou negativas. pode ser explicada pela regressão de y sobre x.Estatística Descritiva ESTATÍSTICA APLICADA I .

4 9702.0 9564. observou-se no diagrama de dispersão uma possível relação linear entre as variáveis.0 97.2 9702.516 a= b= 2 2 2 n n 16 16 .7 10000 15625 22500 30625 40000 50625 62500 75625 90000 105625 122500 140625 160000 180625 202500 250000 9820.0 9370.9 )2 1559375 − ⋅ 153259 .5 19700. ESTATÍSTICA APLICADA I .O valor da correlação e do coeficiente de explicação indicam uma forte correlação linear entre a temperatura do gás combustível e a taxa de calor. uma curva bem definida.7 Regressão Linear 1.0057 ) ⋅ 4625 = 99 .7 Regressão Linear  Método dos mínimos quadrados i x y x2 y2 xy 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 100 125 150 175 200 225 250 275 300 325 350 375 400 425 450 500 99.0 26895.9 − ( −0 .0057 (4625) (∑ x ) 1559375 − ∑x − n 16 ∑ y − b ⋅ ∑ x = 1565 .5 98.Estatística Descritiva 1.8 97.3 97. estimar.3 9409. • A forma linear dessas funções transformadas pode então ser usada para estimar os parâmetros da curva ajustada àquela tendência. entretanto.0 12350. conforme será estudado a seguir.9 9910.5 97.5 98.0057 x ESTATÍSTICA APLICADA I .99 )2 = 0 .0 36562.2 9467.8 98.2 9643.0 96.5 38920.1 98. o diagrama de dispersão apresenta uma tendência não linear. em alguns casos. geralmente. sem apresentar qualquer tendência.0 17237.0 31785.7 Regressão Linear  Coeficiente de explicação  Método dos mínimos quadrados • O coeficiente de explicação pode ser definido agora como sendo a porcentagem da variação total representada pela variação explicada.0 22095. 2 a) Confirme essa relação por meio do coeficiente de correlação. isto é.0 Σ 4625 1565.Estatística Descritiva  Método dos mínimos quadrados • Cálculos: r= s xy s xx ⋅ s yy • Cálculos: = ∑ x⋅∑ y ∑ xy − ∑ r= (∑ x ) n 2 ∑x 2 − n (∑ y ) 2 ⋅ ∑y 2 − n 4625 ⋅ 1565 .9 1559375 153259. o valor que melhor explica y é.0 14775.7 Regressão Linear ESTATÍSTICA APLICADA I .Estatística Descritiva 35 .8 9506. ESTATÍSTICA APLICADA I .8 451365.0 24500.2 9350. R2 R2 = R2 = b ⋅ VE = VT ∑ x⋅∑ y ∑ xy − n (∑ y ) ∑y − n 2 ∑ ( yˆ − y ) ∑ ( y − y) • Exemplo: No exemplo anterior. em torno da qual os pontos parecem agrupar-se.6 97.9 451365 − 16 r= ( 4625 )2 ( 1565 .0 48350.8 − 16 16 r = − 0 .8 97.Estatística Descritiva • Existe um grupo de funções que apresentam diagramas ajustáveis a muitas dessas tendências.8 96. portanto.7 Regressão Linear 1.0 43560.8 97.8 9564.1. Pode-se.8 9525.Estatística Descritiva 1.8 9761.7 Regressão Linear  Funções linearizáveis  Funções linearizáveis • Para que se evite erros de previsão.0 ESTATÍSTICA APLICADA I .2 9702.8 9564. ESTATÍSTICA APLICADA I .977 .0 41225. a sua média.0 34160.2 98.Sendo assim a reta de regressão é: yˆ = a + bx = 99 .5 98.99 R 2 = ( − 0 . através do MMQ os parâmetros a e b e traçar a reta de regressão: ∑ x ⋅ ∑ y 451365 − 4625 ⋅ 1565 .2 9604.0 29340.9 ∑ xy − n 16 = = −0 . e que possuem a qualidade de poder transformar-se em funções lineares com a aplicação de logaritmos ou por mudança de variável. a condição inicial para um estudo de regressão linear entre duas variáveis é que essas variáveis apresentem uma razoável correlação linear.516 − 0 . • Caso os valores de y para crescentes valores de x variem de modo aleatório. 2 i ou R2 = b ⋅ 2 s xy R2 = r 2 s yy b) Encontre a reta de regressão pelo método dos mínimos quadrados.Estatística Descritiva 1.

Estatística Descritiva 1.Estatística Descritiva . obtém-se a forma linear: 3. A = ln a e X = ln x.7 Regressão Linear  Funções linearizáveis  Funções linearizáveis b 2.7 Regressão Linear 1. • Para x > 0.xb. tem-se a forma linear: y y Y = A + B.Estatística Descritiva 1. Y = ln y) e o coeficiente de correlação correspondente podem indicar a oportunidade e qualidade do ajuste.x 0<b<1 b>1 x Crescente Concavidade para cima Contém a origem x Crescente Concavidade para baixo Contém a origem O diagrama de dispersão de (X = ln x. y y y = a. a > 0. a x Decrescente Concavidade para cima Assíntota em x = 0 e y = a ESTATÍSTICA APLICADA I . tem-se a forma linear: Y = A + b. y b>0 b . com x ≥ 0 e b ≥ 0 • Se x = 0.x a 0<b<1 a b>1 x Crescente Concavidade para cima x=0→y=a x Decrescente Concavidade para cima x=0→y=a O diagrama de dispersão de (x. a > 0.7 Regressão Linear  Funções linearizáveis 1. a > 0. a > 0 . com x ≥ 0 e b ≥ 0 1. x ≥ 0 • Aplicando o logaritmo.xb.ln b • Fazendo Y = ln y. Função hiperbólica. y) e o coeficiente de correlação correspondente podem indicar a oportunidade e qualidade do ajuste. Função hiperbólica.ln x • Fazendo Y = ln y. x ≥ 0 • Como no caso anterior. A = ln a e B = ln b. tipo I: y = a + . x > 0.Estatística Descritiva 36 .Estatística Descritiva ESTATÍSTICA APLICADA I . ESTATÍSTICA APLICADA I .Estatística Descritiva  Funções linearizáveis y = abx. tem-se: ln y = ln a + b. b > 0.1. tipo I: y= a+ y = a + b. Função exponencial: y = abx. y > 0 x • A primeira e a segunda derivadas fornecem a forma das curvas. y > 0 x • Fazendo X = 1/x. ESTATÍSTICA APLICADA I . Função potência: • Para este caso. a primeira e a segunda derivadas da função fornecem a forma da curva. Função potência:  Funções linearizáveis y = a.7 Regressão Linear  Funções linearizáveis 2. aplicando o logaritmo.b/a x Crescente Concavidade para baixo Assíntota em y = a ESTATÍSTICA APLICADA I . tem-se: ln y = ln a + x. Função exponencial: ESTATÍSTICA APLICADA I . as derivadas fornecem a forma das curvas.7 Regressão Linear 1.7 Regressão Linear 1. então y = 0.X y a b<0 O diagrama de dispersão de (X=1/x. b > 0. 2. Y=lny) e o coeficiente de correlação correspondente podem indicar a oportunidade e qualidade do ajuste. x > 0 .

7 Regressão Linear  Funções linearizáveis 5.50 11.00 13.7 Regressão Linear 1.) 427 440 447 453 460 465 470 472 ESTATÍSTICA APLICADA I . x ≥ 0 a + bx • As derivadas da função indicam que a curva é decrescente e tem concavidade voltada para cima.00 11. h. b > 0. Construa um diagrama de dispersão para os dados da tabela. y 1/a 4. Função hiperbólica. x e-a/b Decrescente Concavidade para cima Crescente Concavidade para baixo y = a + b. Calcule a regressão de y sobre x para a função de maior correlação. Comente os resultados obtidos. Y=1/y) e o coeficiente de correlação correspondente podem indicar a oportunidade e qualidade do ajuste. a > 0. b > 0. x ≥ 0 a + bx • Fazendo Y = 1/y. obtém-se a forma linear: y y y = a + bX b<0 b>0 x e. e.00 12. Construa o gráfico de dispersão da forma linear correspondente à função escolhida em (c). x ESTATÍSTICA APLICADA I .Estatística Descritiva 1. Calcule a oferta para um preço de 15.ln x. y = 1/a.00 10. x > 0 ESTATÍSTICA APLICADA I . a > 0. f. Calcule o coeficiente de correlação dos pares em (d). c. g.ln x. b. tipo II: y= 1 .7 Regressão Linear  Funções linearizáveis  Funções linearizáveis 4. y) e o coeficiente de correlação correspondente podem indicar a oportunidade e qualidade do ajuste. Para x =0. x > 0 • As derivadas indicam a forma da curva: • Fazendo X = ln x. tipo II: 1 y= . Função logaritmo: y = a + b.Estatística Descritiva  Funções linearizáveis 5.Estatística Descritiva 1. ESTATÍSTICA APLICADA I .1. obtém-se: 1 1 = Y a + bx ou Y = a + bx O diagrama de dispersão de (x.50 y = oferta (em 1000 un. O diagrama de dispersão sugere o uso de alguma forma linearizável para ajustar os pontos? d.7 Regressão Linear 1.7 Regressão Linear ESTATÍSTICA APLICADA I .50 12.Estatística Descritiva 1. Função logaritmo: ESTATÍSTICA APLICADA I .a/b O diagrama de dispersão de (X=ln x.Estatística Descritiva • Exemplo: a.00. Calcule o coeficiente de correlação linear das variáveis.50 13.7 Regressão Linear  Funções linearizáveis  Funções linearizáveis • Exemplo: Um estudo sobre a oferta de mercado de um produto revelou as quantidades que os produtores estariam dispostos a oferecer a vários níveis de preços x = preço 10.Estatística Descritiva 37 . i. com assíntotas em y = 0. Função hiperbólica. Calcule o coeficiente de explicação para a função escolhida em (g).

53 2.Estatística Descritiva X = ln x 2 ( 94 ) = 10 .947 .15 6.1.5 13.00 1.5 2.60 424 440 447 453 460 465 470 472 5. Diagrama de dispersão: a forma linear é y = a + b.634 = 11 .0 ESTATÍSTICA APLICADA I x .0 12.8 1.56 2. 5 11 11.456 42.1 1.9879 0 .0 11.034.209 211.0 10.30 2.7 Regressão Linear  Funções linearizáveis  Funções linearizáveis • Solução: • Solução: d.Estatística Descritiva 1.072.2 1.105.76 5.0 3.456 − = 1.0 1.809 205. 94 ⋅ 3. Coeficiente de correlação.52 5.Estatística Descritiva 1. portanto.44 2.115 − r= y = oferta (em 1000 un. Coeficiente de correlação.0771 8 11 .7 Regressão Linear 1.67 3.7 2.8 1. y = a + b.176.6 2. A correlação obtida com a curva logarítmica é maior.456 − = 1.8 2.0 13.652. essa função será escolhida para o processo de regressão.115.652.5 12.30 2.203.1 2.ln x 450 445 440 435 430 425 420 2 2.45 1.9 3 ln x ESTATÍSTICA APLICADA I . 5 14 n x y x2 y2 xy 1 2 3 4 5 6 7 8 10.25 121.48 2.57 ESTATÍSTICA APLICADA I .Estatística Descritiva 19 .5 6110.225 220. 2. 5 12 12.284 982.634 ) 2 = 1. 5 13 13.5 s xx = 1.55 6.5 ⋅ 1.40 6.600 216.00 156. Coeficiente de correlação.0 5209.634 48.711 .831 − s yy ESTATÍSTICA APLICADA I .634 = 131.25 160. com X = ln x.25 144.2 Σ 19.57 − s yy ( 19 .4 2.634 ) 2 = 1. 475 470 465 460 455 450 445 440 435 430 425 420 9 9.29 2. Diagrama de dispersão y b.48 2.5 11.44 2.5 8 ( 3.67 ⋅ 3.7 Regressão Linear ESTATÍSTICA APLICADA I .77 182.40 2.5 10 10.35 2.329 193.00 110.67 ) 2 = 0 . e.98 10 .60 427 440 447 453 460 465 470 472 475 y 470 465 460 455 c.456 8. ESTATÍSTICA APLICADA I .0 Σ 94.53 2.5 424 440 447 453 460 465 470 472 100. A forma do diagrama de dispersão sugere a curva logaritmica por suas características.00 182.831.56 2.600 198.5 8 131. Coeficiente de correlação.7 Regressão Linear 1.7 Regressão Linear  Funções linearizáveis  Funções linearizáveis • Solução: • Solução: e.711 .0 4620.0 5812.45 1.3 2.652.35 2.X.900 222.2 2.140.95 6.45 − f.40 2.227.634 1.0 6372.711 .5 = 0 .Estatística Descritiva 1.25 182329 193600 198809 205209 211600 216225 220900 222284 4270.652.947. b.5 5520.5 s xx = 48 .00 132. n X=ln x y X2 y2 Xy 1 2 3 4 5 6 7 8 2.711.3453 r= = 0 .5 1.5 8 s xy = 42.3453 8 ( 3.Estatística Descritiva 38 .7 Regressão Linear  Funções linearizáveis  Funções linearizáveis • Solução: • Solução: a.0771 ⋅ 1.5 8 s xy = 8.0 4917.

5 A regressão de y sobre x explica 97.67 = 921907 n n 8 y = 92 . ESTATÍSTICA APLICADA I .Estatística Descritiva 39 .4% são atribuídos a fatores imponderáveis.Estatística Descritiva FIM ESTATÍSTICA APLICADA I .3453 = 0 .6% das variações de y a partir de sua média.7 Regressão Linear 1.1505 ⋅ ln 15 = 490 .00 é de 490.1907 + 147 .1505.7 Regressão Linear  Funções linearizáveis  Funções linearizáveis • Solução: • Solução: g. Cálculo da regressão linear: b= a= s xy s xx = i.Estatística Descritiva ESTATÍSTICA APLICADA I .1505 0 .00: 11 . ln x h.1505 ⋅ ln x = 92 . Cálculo do R2.976 1.0771 y = 92 .3453 = 147 .1907 + 147 .68 mil unidades.711. Projeção da oferta para um preço de 15.1907 + 147 .68 ∑ y − b ⋅ ∑ x = 3.634 − 147 . 11 .1505 ⋅ 19 .1. os outros 2.Estatística Descritiva I .1505 ⋅ 8 A oferta esperada quando o preço for 15. R2 = b ⋅ s xy s yy = 147 .