You are on page 1of 109

ENGENHARIA DE CONTROLE E AUTOMAO

ESTATSTICA BSICA





















PROF. SEBASTIO ALVES CARNEIRO



VITRIA
2011-2

DIREITOS RESERVADOS
IFES Centro Federal de Educao Tecnolgica do Esprito Santo
Crditos de autoria da editorao
COPYRIGHT proibido a reproduo, mesmo que parcial, por qualquer meio, sem
autorizao escrita dos autores e do detentor dos direitos autorais.

Catalogao na fonte: Rogria Gomes Belchior - CRB 12/417



C289 Carneiro, Sebastio Alves

Probabilidade e estatstica. / Sebastio Alves Carneiro. Vitria: CEFETES, 2008.

1. Probabilidade. 2. Estatstica. I. Centro Federal de Educao Tecnolgica do Esprito
Santo. II. Ttulo.

CDD 519

sumrio
Ol, Aluno (a)!

Seja bem-vindo (a) ao nosso curso de Estatstica Bsica!

Sou o professor Sebastio Alves Carneiro, responsvel pela gerncia e produo de material dessa
disciplina, no curso de Tecnologia em Anlise e Desenvolvimento de Sistemas.

Sou formado em Engenharia Eltrica e tenho Mestrado em Controle de Sistemas pela Universidade
Federal do Esprito Santo - UFES. Atualmente, ocupo o cargo de Diretor Adjunto, no Campus Serra.
J lecionei a disciplina de Probabilidade e Estatstica no curso de Anlise e Desenvolvimento de
Sistemas, no Campus Serra.

Acredito que, com tecnologia na sala de aula, o papel do educador muda de detentor do
conhecimento para guia das investigaes dos alunos. O novo professor tem que estar preparado
para deixar de ser o que apenas fornece informaes para ser um orientador, aquele que ajuda a
selecionar informaes e fazer articulaes. Ns aprendemos uns com os outros, a toda hora, a
qualquer momento.

A disciplina de Estatstica importante para sua formao, pois uma rea do conhecimento que
utiliza teorias probabilsticas para explicao de eventos, estudos e experimentos. Tem por objetivo
obter, organizar e analisar dados, determinar as correlaes que apresentem, tirando delas suas
conseqncias para descrio e explicao do que passou e previso e organizao do futuro.
Portanto, sero estudados neste curso tanto os conceitos fundamentais, como as tcnicas formais da
estatstica.

Nosso curso ser dividido em 6 captulos:no primeiro, faremos a introduo de nossos estudos; no
segundo, estudaremos a construo de grficos, bem como suas propriedades e aplicaes; no
terceiro, veremos mtodos grficos; no quarto estudaremos medidas de ordenamento e posio; no
quinto, estudaremos medidas de disperso e por fim Correlao e Regresso.

Um curso de Estatstica Bsica requer um tempo dirio de estudo e dedicao. Por isso muito
importante que voc faa todas as atividades propostas, tanto neste material como na sua sala de
aula virtual.

Leia os textos com bastante ateno, sempre com esprito questionador e investigativo.
Personalize o seu estudo. D novos ttulos e subttulos, reorganizando a diviso do texto. Assim,
voc o ver por uma nova tica e ser mais fcil reter as informaes por partes.
Crie perguntas e tente respond-las sem pesquisar. Depois, confira as respostas.
Sintetize com suas palavras o que foi estudado. Faa resumos: destaque o tema central, as
definies essenciais, os exemplos, os casos particulares, as observaes.
Leia bem os enunciados das questes propostas e interprete o que se pede. Comece, ento, a
responder com ateno, sempre pesquisando no livro texto ou em outros meios que facilitem sua
resposta. Verifique se todas esto corretas, revendo o que foi feito.
Interesse-se, participe e discuta com o professor e com seus colegas.
Faa anlise dos exerccios resolvidos que se encontram ao longo deste fascculo e, se houver
dvidas, entre em contato com o seu professor.


Voc logo perceber que o sucesso neste curso questo de tempo!

CAPTULO 1

AMOSTRAGEM
1.1. INTRODUO



Ol, Aluno (a)!
O objetivo fundamental da Introduo dar uma viso inicial da estatstica.
Neste captulo, veremos histricos da estatstica, mtodo estatstico,
definies bsicas da estatstica e iniciaremos amostragem.

A estatstica uma rea do conhecimento que utiliza teorias probabilsticas
para explicao de eventos, estudos e experimentos. Tem por objetivo obter,
organizar e analisar dados; bem como determinar suas correlaes, tirando
delas suas conseqncias, explicar o que passou e prever o que ocorrer no
futuro.
Bons estudos!
Prof. Sebastio A. Carneiro

1.2. HISTRICO

Faremos um breve histrico para expor o modo como a estatstica surgiu.

ANTIGUIDADE: os povos na antiguidade registravam o nmero de habitantes, nascimentos,
bitos. J faziam "estatsticas".
IDADE MDIA: as informaes na Idade Mdia eram tabuladas com finalidades tributrias e
blicas.
SCULO XVI: no sculo XVI surgem as primeiras anlises sistemticas, as primeiras tabelas e
os nmeros relativos.
SCULO XVIII: no sculo XVIII a estatstica surge com notao cientfica a qual adotada
pelo acadmico alemo GODOFREDO ACHENWALL. As tabelas ficam mais completas,
surgindo s primeiras representaes grficas e os clculos de probabilidades. A estatstica deixa
de ser uma simples tabulao de dados numricos para se tornar o estudo de como se chegar
concluso sobre uma populao, partindo de observao de partes dessa populao.

1.3 MTODO ESTATSTICO


O mtodo estatstico se aplica ao estudo dos fenmenos aleatrios. Um fenmeno considerado
aleatrio se seus resultados variarem, a cada repetio, nas mesmas condies.















1.4. FASES DO MTODO ESTATSTICO


importante conhecer todas as fases do mtodo estatstico, pois voc dever segui-las quando desejar
fazer uma pesquisa.









Comentando as fases do mtodo estatstico:


1
a
- DEFINIO DO PROBLEMA: Saber exatamente o que se quer pesquisar o mesmo que
definir corretamente o problema.

2
a
- PLANEJAMENTO: Como levantar informaes? Que dados devero ser obtidos? Qual o
levantamento a ser utilizado: censitrio, por amostragem? E o cronograma de atividades? Os custos
envolvidos?

3
a
- COLETA DE DADOS: Fase operacional. o registro sistemtico de dados, com um objetivo
determinado.

MTODO: um meio mais eficaz para atingir determinada meta.

MTODO CIENTFICO: um conjunto de regras bsicas para
desenvolver uma experincia a fim de produzir novo conhecimento, bem
como corrigir e integrar conhecimentos pr-existentes.Destacamos o mtodo
experimental e o mtodo estatstico.

MTODO EXPERIMENTAL: consiste em manter constantes toda a
causa, menos uma, que a que sofre variao para se observarem seus
efeitos.
Exemplos: Estudos da Qumica, da Fsica, etc.

MTODO ESTATSTICO: um processo para obter, apresentar e analisar
caractersticas ou valores numricos para uma melhor tomada de deciso em
situaes de incerteza.
Exemplo: Quais as causas que definem o preo de uma mercadoria quando a
sua oferta diminui?
Comentrio: Seria impossvel, no momento da pesquisa, manter constantes a
uniformidade dos salrios, o gosto dos consumidores, o nvel geral de preos
de outros produtos, etc.
Apresentao
dos dados

Definio
do
problema
Coleta
de
dados
Apurao dos
dados

Planejamento

4 - APURAO DOS DADOS: Resumo dos dados por meio de sua contagem e de seu
agrupamento. a condensao e tabulao de dados.

5 - APRESENTAO DOS DADOS: H duas formas de apresentao, que no se excluem
mutuamente. A apresentao tabular uma apresentao numrica dos dados em linhas e colunas
distribudas de modo ordenado, segundo regras prticas fixadas pelo Conselho Nacional de
Estatstica. A apresentao grfica dos dados numricos constitui uma apresentao geomtrica que
permite uma viso rpida e clara do fenmeno.

6 - ANLISE E INTERPRETAO DOS DADOS: A ltima fase do trabalho estatstico a
mais importante e delicada. Est ligada essencialmente ao clculo de medidas e coeficientes, cuja
finalidade principal descrever o fenmeno (estatstica descritiva).





1.5. CONCEITOS BSICOS


Muitas vezes, apesar dos recursos computacionais e da boa vontade, no possvel estudar todo um
conjunto de dados de interesse, pois fica caro e leva muito tempo. Assim, normalmente, se trabalha
com partes da populao denominadas de amostras.



1.5.1 Populao

ATIVIDADE 1

Responda a questo a seguir:

Em que fase do mtodo estatstico devemos:
a) ter uma viso rpida e clara do fenmeno?
b) fazer o registro sistemtico de dados?;
c) fazer a condensao e tabulao de dados?
d) ser mais cuidadosos, pois a fase mais importante e delicada do
mtodo?
e) fazer o cronograma de atividades?
f) definir corretamente o problema?

Populao o conjunto total de elementos portadores de, pelo menos, uma caracterstica comum.

Note-se que o termo populao usado num sentido amplo e no significa, em geral, conjunto de
pessoas.o

Exemplos:

a) o conjunto das rendas de todos os habitantes do Esprito Santo;
b) o conjunto de todas as notas dos alunos de Estatstica;
c) o conjunto das alturas de todos os alunos da Universidade; etc.

Um levantamento efetuado sobre toda uma populao denominado de levantamento censitrio ou
Censo.
1.5.2 Amostras

Amostras so parcelas representativas de uma populao, examinada com o propsito de se tirarem
concluses sobre essa populao.

Exemplos:
a) antes da eleio diversos rgos de pesquisa e imprensa ouvem um conjunto selecionado
de eleitores para ter uma idia do desempenho dos vrios candidatos nas futuras eleies;
b) uma empresa metal-mecnica toma uma amostra do produto fabricado em intervalos de
tempo especificados para verificar se o processo est sob controle e evitar a fabricao
de itens defeituosos;
c) o IBGE faz levantamentos peridicos sobre emprego, desemprego, inflao, etc;
d) redes de rdio e TV se utilizam constantemente dos ndices de popularidade dos
programas para fixar valores da propaganda, ou ento, modificar ou eliminar programas
com audincia insatisfatria;
e) bilogos marcam pssaros, peixes, etc, para tentar prever e estudar seus hbitos.








1.5.3 Varivel

Varivel , convencionalmente, o conjunto de resultados possveis de um fenmeno.

Varivel qualitativa: quando seus valores so expressos por atributos:
Exemplo: sexo, cor da pele, etc.

Varivel quantitativa: quando os dados so de carter nitidamente quantitativo, e o conjunto
dos resultados possui uma estrutura numrica. Divide-se em:

a) Varivel discreta: seus valores so expressos geralmente por nmeros inteiros no
negativos. Resulta normalmente de contagens.

Exemplo:

ATIVIDADE 2

1) Estabelea a populao, a amostra e o tipo de fonte de dados em cada
caso:

a) Numa escola de primeiro grau com 560 alunos matriculados, foram
sorteados 100 alunos que responderam a um questionrio sobre
preferncia por sites na internet.
b) Entre os 1300 funcionrios de uma empresa de manuteno em
informtica selecionaram 65 pessoas e perguntaram qual componente do
computador que apresentava maior quantidade de defeitos. Os resultados
obtidos foram os seguintes:

Componente defeituoso Nmero de funcionrios
Mouse 35
Teclado 10
Fonte de tenso 20


a) nmero de computadores vendidos no ms (231);
b) quantidade de placa me em estoque (346).

b) Varivel contnua: resulta normalmente de uma mensurao, e a escala numrica de seus
possveis valores corresponde ao conjunto R dos nmeros Reais, ou seja, pode assumir, teoricamente,
qualquer valor entre dois limites.

Exemplos:
a) quando se mede a temperatura do corpo de algum com um termmetro de mercrio,
o que ocorre o seguinte: o filete de mercrio, ao dilatar-se, passa por todas as
temperaturas intermedirias at chegar temperatura do corpo no momento da
medio (37,6
o
C).
b) dimetro de um furo (23,456mm);
c) peso de um objeto (12,2345kg).



ATIVIDADE 3

1) Classifique as variveis abaixo em qualitativas ou quantitativas:
- cor dos olhos dos alunos;
- ndice de liquidez nas indstrias capixabas;..
- produo de caf no Brasil;
- nmero de defeitos em aparelhos de TV;.
- comprimento dos pregos produzidos por uma empresa;
- pontuao obtida em cada jogada de um dado.

2) Para os seguintes valores, indique as variveis discretas (D) e as contnuas (C):
(a) peso do contedo de um pacote de DVD virgem;
(b) dimetro de um CD;
(c) nmero de artigos defeituosos produzidos;
(d) nmero de indivduos, em uma rea geogrfica, que recebem seguro- desemprego;
(e) nmero mdio de clientes potenciais visitados por vendedores de uma empresa durante
o ltimo ms;
(f) temperatura interna de um computador;
(g) nmero de unidades estocadas de um artigo;
(h) razo entre o ativo circulante e o passivo exigvel;
(i) total de toneladas embarcadas;
(j) quantidade embarcada de computadores;
(k) volume de trfego de um posto de pedgio;
(l) nmero de comparecimento ao encontro anual de uma companhia.

1.6 AMOSTRAGEM

O processo de escolha de uma amostra da populao denominado de amostragem.



Quando a amostra tendenciosa, no podemos extrapolar os resultados obtidos para o universo da
populao. o caso da amostragem por convenincia, que ocorre quando a participao voluntria
ou os elementos da amostra so escolhidos por uma questo de convenincia (muitas vezes,
os amigos e os amigos dos amigos). Deste modo, o processo amostral no garante que a amostra seja
representativa.

A melhor forma de conseguir este objetivo obter uma amostra aleatria de uma populao bem
definida. Existem tcnicas de amostragem a que devemos recorrer para assegurar que a amostra
fornea uma boa estimativa dos parmetros populacionais.
H vrios mtodos de amostragem: aleatria simples, (cada elemento da populao tem igual
probabilidade de ser escolhido para caracterizar a amostra); amostragem sistemtica (depois de
ordenada a populao, seleciona-se a amostra probabilstica);amostragem estratificada, etc.


1.6.1 AMOSTRAGEM CASUAL OU ALEATRIA SIMPLES

A amostragem casual ou aleatria simples o processo mais elementar e frequentemente utilizado na
coleta de dados. Todos os elementos da populao tm que ter a mesma probabilidade de
pertencerem amostra. Equivale a um sorteio lotrico. Pode ser realizada numerando-se a populao
de 1 a n e sorteando-se, a seguir, por meio de um dispositivo aleatrio qualquer, x nmeros dessa
seqncia, os quais correspondero aos elementos pertencentes amostra.

Exemplo 1:

Vamos obter uma amostra, de 10%, representativa para a pesquisa da estatura de 90 alunos de
uma escola:
1 passo - Numeramos os alunos de 1 a 90.
2 passo - Escrevemos os nmeros dos alunos, de 1 a 90, em pedaos iguais de papel, colocamos
em uma urna e, aps mistura, retiramos, um a um, os nove nmeros que formaro a amostra.

Resultado obtido= {aluno 20, aluno 27, aluno 15, aluno 56, aluno 81, aluno 12, aluno 66, aluno
54, aluno 72}.


Exemplo 2:

Uma cidade turstica tem 30 hotis de trs estrelas. Pretende-se conhecer o custo mdio da diria para
apartamento de casal. Os valores populacionais consistem nos seguintes preos dirios: 125, 120, 135,
121, 122, 124, 125, 130, 138, 124, 120, 120, 125, 120, 119, 125, 123, 124, 128, 124, 124, 122, 128,
126, 123, 125, 122, 127, 125, 123.
Extraia uma amostra aleatria simples de tamanho 5 desta populao por sorteio.
R: Escrevemos os valores em papis, ento os colocamos em uma urna, misturamos e sorteamos a
amostra de n=5 .
Resultado obtido: n= (120, 124, 122, 128, 123)

Obs.: Quando o nmero de elementos da amostra muito grande, esse tipo de sorteio torna-se muito
trabalhoso. Nesse caso, utiliza-se uma tabela de nmeros aleatrios ou isso feito por meio de
software que gera esses nmeros.

1.6.2 Amostragem sistemtica


Amostra sistemtica constituda de elementos retirados da populao, segundo um sistema
preestabelecido.

conveniente quando a populao est naturalmente ordenada, como fichas em um fichrio, listas
telefnicas, etc.

Exemplo 1:

Suponha que uma empresa de telefonia fixa deseja saber o grau da satisfao de seus usurios com os
servios prestados. O nmero de assinantes da ordem de 50.000 e ns desejamos selecionar uma
amostra aleatria de 1.000 assinantes com o intuito de obter a avaliao sobre os servios.

Um modo alternativo de seleo a seleo de 1 assinante a cada 50. O procedimento ser selecionar
aleatoriamente um assinante entre os primeiros 50, digamos que o vigsimo assinante (20) fosse
selecionado. O prximo selecionado seria o de ordem 70 (20+50), o seguinte de ordem 120 (70+50) e
assim por diante, ou seja: 20, 70, 120, 170, 220 ....... . Com esse mtodo so economizados recursos
fsicos e financeiros.

A amostra sistemtica frequentemente utilizada em pesquisas nas quais o tamanho da populao
grande ou que a pesquisa seja feita por pessoas que no esto familiarizadas com tabelas de nmeros
aleatrios ou com uso de software.

No caso da seleo de amostra aleatria simples de assinantes, seria necessrio que tivssemos os
assinantes numerados, sequencialmente, de 1 a 50.000 e seriam selecionados os 1.000 assinantes. A
seleo poderia ser feita com o uso de uma tabela de nmeros aleatrios ou de software que gerasse
esses nmeros.


Exemplo 2:
dada uma populao constituda pelas 12 primeiras letras do alfabeto. Explique o que voc faria
para obter uma amostra sistemtica de 3 elementos.


Resoluo:
Dividindo 12 por 3 obtm-se 4. Sorteie ento uma das quatro primeiras letras do alfabeto. Essa letra
sorteada ser a primeira da amostra. Depois, a partir dessa letra, conte quatro e retire a quarta letra
para a amostra. Repita o procedimento e retire mais uma letra de forma sucessiva.
Exemplo: Se a letra sorteada for B, ento a amostra ser C, G e K.

As amostras sistemticas so suscetveis a erros induzidos por periodicidade naturais da populao,
permitindo ao investigador prever e, possivelmente, manipular quem entrar na amostra.

1.6.3 AMOSTRAGEM PROPORCIONAL ESTRATIFICADA

Quando a populao se divide em estratos (subpopulaes), convm que o sorteio dos elementos
da amostra os leve em considerao. Desse modo, obtemos os elementos da amostra
proporcionalmente ao nmero de elementos desses estratos.

Exemplo:

Vamos obter uma amostra proporcional estratificada, de 10%, do exemplo anterior, supondo que,
dos 90 alunos, 54 sejam meninos e 36 sejam meninas. So, portanto, dois estratos (sexo
masculino e sexo feminino). Logo, temos:





Tabela 1.1 Amostra proporcional estratificada









Numeramos, ento, os alunos de 01 a 90 (de 01 a 54 para os meninos e de 55 a 90 para as meninas) e
procedemos ao sorteio.


Exemplo:

Em determinada regio, a populao com cursos superiores composta por 40% de homens e 60% de
mulheres. Deseja-se fazer uma pesquisa com 50 pessoas com cursos superiores.

Neste caso, seleciona, os dois grupos (homens e mulheres) e sorteiam-se 20 homens e 30 mulheres.

Homens = 40% de 50 = 20;
Mulheres= 60% de 50 =30.






Riscos da amostragem.

O processo de amostragem envolve riscos, pois se toma decises sobre toda a populao com
base em apenas uma parte dela. A teoria da probabilidade, que veremos neste curso, pode ser
utilizada para fornecer uma idia do risco envolvido, ou seja, do erro cometido ao utilizar uma
amostra ao invs de toda a populao.















SEXO POPULACO 10 % AMOSTRA
MASC. 54 5,4 5
FEMIN. 36 3,6 4
Total 90 9,0 9

Na realidade, a amostragem proporcional estratificada leva em considerao
as diferenas que h dentro de uma populao e mais democrtica.
ATIVIDADE 4

1) Imagine que voc tem 500 cadastros arquivados em sua empresa, dos quais voc
quer uma amostra de 2%. Como voc procederia para obter uma amostra
sistemtica e uma amostra aleatria?

2) Uma populao se encontra dividida em quatro estratos, com tamanhos
90 N
1
=
,
120 N
2
=
,
60 N
3
=
e
480 N
4
=
. Ao se realizar uma amostra, doze elementos
da amostra foram retirados do primeiro estrato. Qual o nmero de elementos de
cada estrato?

3) Com o objetivo de fazer testes de qualidade com determinados produtos de uma
empresa de informtica, optou-se por realizar um levantamento por amostragem. A
populao constituda por:
Produto A : A1, A2, A3, A4, A5, A6, A7, A8, A9, A10;
Produto B : B1, B2, B3, B4, B5, B6, B7, B8, B9, B10;
Produto C : C1, C2, C3, C4, C5, C6, C7, C8, C9, C10,
C11, C12, C13, C14,C15,C16, C17, C18, C19, C20,
C21, C22, C23, C24, C25, C26, C27, C28, C29, C30.

Como voc faria para obter uma amostra global, de tamanhos 10?



4) Uma escola possui 120 alunos, sendo 32 na quinta srie, 24 na sexta srie, 26 na
stima srie e 38 na oitava srie. Em uma amostra de 15 alunos, quantos de cada srie faro
parte dessa amostra, nessa mesma ordem de sries?
a) 4, 2, 3 e 6 alunos
b) 4, 3, 4 e 4 alunos
c) 5, 2, 3 e 5 alunos
d) 4, 3, 3 e 5 alunos



CAPTULO 2

SRIES E CONSTRUO DE GRFICOS


Ol, Aluno (a)!

Neste captulo, estudaremos sries e construo de grficos. As tabelas, os grficos e as figuras
so elementos grficos que apresentam dados ou informaes com a finalidade de facilitar sua
leitura e compreenso.
Bons estudos!
Prof. Sebastio A. Carneiro

2.1 SRIE ESTATSTICA

Qualquer tabela que apresente a distribuio de um conjunto de dados estatsticos em funo da
poca, do local ou da espcie uma srie estatstica.

Os trabalhos tcnico-cientficos utilizam-se, em geral, de tabelas estatsticas para apresentar
dados. Elas podem ser definidas como conjuntos de dados estatsticos associados a um fenmeno,
dispostos numa determinada ordem de classificao. Expressam, pois, as variaes qualitativas e
quantitativas de um fenmeno.

TABELA um quadro que resume um conjunto de dados dispostos em linhas e colunas de
maneira sistemtica.
De acordo com a Resoluo 886, do IBGE, nas casas ou clulas da tabela, devem-se inserir:
- um trao horizontal (-) quando o valor zero;
- trs pontos (...), quando no se tm os dados;
- zero (0),quando o valor muito pequeno para ser expresso pela unidade utilizada;
- um ponto de interrogao (?),quando h dvidas quanto exatido de determinado valor.
Obs.: o lado direito e o esquerdo de uma tabela oficial devem ser abertos.



2.1.1 SRIE TEMPORAL

Tambm chamada de histrica ou evolutiva, a srie temporal identifica-se pelo carter varivel do
fator cronolgico (tempo). O local e a espcie (fenmeno) so elementos fixos.

Exemplo:

Tabela 2.1 Evoluo das reservas brasileiras

Ano
Evoluo das reservas brasileiras
(em bilhes de dlares)
2000 32
2001 36
2002 37
2003 49
2004 52
2005 53
2006 85
2007 180
2008 190
Fonte: Revista Veja - edio 2050

Observar que a Evoluo das reservas brasileiras (em bilhes de dlares) variou com o
tempo (de 2000 a 2008).



2.1.2 SRIE GEOGRFICA

Tambm chamada de espacial, territorial ou de localizao, a srie geogrfica apresenta como
elemento varivel o fator geogrfico. A poca e o fato (espcie) so elementos fixos.

Exemplo:
Tabela 2.2 Vendas em 2007 da empresa ABC Informtica Ltda..

FILIAIS
COMPUTADOR
ES
VENDIDOS
So Paulo 12.645
Rio de Janeiro 15.765
Minas Gerais 13.410
Esprito Santo 8.546
TOTAL 50.366


Observar como as vendas de computadores da empresa ABC Informtica Ltda. variaram em 2007
nos estados da regio Sudeste; ou seja, houve variao geogrfica.







2.1.3 SRIE ESPECFICA

Tambm chamada de categrica, a srie especfica tem como carter varivel apenas o fato ou
espcie.

Exemplo:
Tabela 2.3 Vendas por setor em 2006 das 200 maiores empresas de tecnologia do
Brasil.














Observar que houve variao por setores de empresas de tecnologia do Brasil e no h informao quanto
variao no tempo ou por regio.


De uma forma geral, se a srie simples no for temporal ou geogrfica, voc pode consider-la
especfica.


2.1.4 SRIES CONJUGADAS

Tambm chamadas de tabelas de dupla entrada, as sries conjugadas so apropriadas apresentao
de duas ou mais sries de maneira conjugada, com duas ordens de classificao: uma horizontal e
outra vertical. O exemplo abaixo o de uma srie geogrfico-temporal.

Exemplo:

Tabela 2.4 Vendas no 1 bimestre de 2007 da empresa ABC Informtica
Ltda.

FILIAIS Janeiro Fevereiro Maro Abril Maio Junho
So Paulo 1200 1280 1360 1440 1520 1600
Rio de Janeiro 1350 1390 1430 1470 1510 1550
Minas Gerais 1410 1670 1930 2190 2450 2710
Esprito Santo 1046 1099 1152 1205 1258 1311
TOTAL 5006 5439 5872 6305 6738 7171

Observar que as vendas de computadores variam nos estados da regio Sudeste, de janeiro a junho de
2007, caracterizando, assim, a srie conjugada geogrfico-temporal.


Setores
Vendas
(milhes de dlares)
Comunicao 56.927,70
Hardware 20.488,20
Servios de Software 7.300,40
Servios 5.603,50
Software 2.419,10
Distribuio 1.380,40
Internet 657,40
Fonte: Info Exame- ago. 2007.















ATIVIDADE 1

1. Que tipo de srie est representado nesta tabela?

TERMINAIS TELEFNICOS EM SERVIO
1992-1993
REGIES 1992 1993
Norte 375.658 403.494
Nordeste 1.379.101 1.486.649
Sudeste 6.729.467 7.231.634
Sul 1.608.989 1.746.232
Centro-oeste 778.925 884.822
Fonte: Ministrio das Comunicaes.


2. qual a origem dos dados para a elaborao da tabela?


3. Procure identificar em jornais ou em revistas exemplos das sries apresentadas.







2.2 Grficos Estatsticos

Grficos estatsticos so representaes visuais dos dados estatsticos. No substituem as tabelas
estatsticas apenas fornecem uma representao mais imediata dos dados.


Os grficos estatsticos tm como caractersticas a simplicidade, a clareza e a veracidade. Fazem uso
de escalas e do sistema de coordenadas e possibilitam uma compreenso mais imediata dos dados.


Veremos a seguir os tipos de grficos mais utilizados

2.2.1DIAGRAMAS

Diagramas so grficos geomtricos dispostos em duas dimenses. So os mais usados na
representao de sries estatsticas, por esse motivo no abordaremos os outros tipos de grficos. Os
diagramas podem ser:




a) Grficos Em Linhas Ou Lineares

Grficos em linhas ou lineares so os frequentemente usados para representao de sries
cronolgicas com um grande nmero de perodos de tempo. As linhas so mais eficientes do que as
colunas quando existem intensas flutuaes nas sries ou quando h necessidade de se representarem
vrias sries em um mesmo grfico.

Exemplo:

Tabela 2.5 Evoluo das reservas

Ano
Evoluo das reservas brasileiras
(em bilhes de dlares)
2000 32
2001 36
2002 37
2003 49
2004 52
2005 53
2006 85
2007 180
2008 190
Fonte: Revista Veja - edio 2050


0
20
40
60
80
100
120
140
160
180
200
1998 2000 2002 2004 2006 2008 2010


Figura 1 - Grfico Evoluo das reservas brasileiras




Observe que as reservas brasileiras dispararam depois de 2005. O grfico retrata isso mais
facilmente!


B) GRFICOS EM BARRAS HORIZONTAIS

Quando as legendas no so breves, usam-se de preferncia, os grficos em barras horizontais. Neles,
os retngulos tm a mesma altura e as bases so proporcionais aos respectivos dados.


Exemplo :
Tabela 2.6 Empresas com maior nmero de funcionrios
entre as maiores empresas de tecnologia do Brasil

Empresas Funcionrios
ATENTO BRASIL (Servios) 54.415
CONTAX (Servios) 49.397
DEDIC (Servios) 14.903
EMBRATEL (Comunicao) 14.268
TELEFUTURA (Servios) 11.174
CSU CARDSYSTEM (Servios) 10.153
TIM (Comunicao) 9.972
SERPRO (Servios de Software) 9.960
CTBC (Comunicao) 8.734
EDS (Servios) 8.239
Fonte: Info Exame, ago. 2007


a
0 10.000 20.000 30.000 40.000 50.000 60.000
ATENTO BRASIL (Servios)
CONTAX (Servios)
DEDIC (Servios)
EMBRATEL (Comunicao)
TELEFUTURA (Servios)
CSU CARDSYSTEM (Sevios)
TIM (Comunicao)
SERPRO (Servios de Software)
CTBC (Counicao)
EDS (Servios)


Figura 2 - Grfico Empresas com maior nmero de funcionrios entre as maiores empresas de
tecnologia do Brasil.


ATIVIDADE 2

Reproduza os dois tipos de grficos anteriores usando uma planilha
eletrnica, buscando novos dados em jornais ou em revistas, e, a seguir,
compare os resultados: lembre-se de que o resultado dever ser o mesmo..



c) Grficos em barras verticais (colunas)

Quando as legendas no so breves, usam-se, de preferncia, os grficos em barras verticais. Nesses
grficos, os retngulos tm a mesma base e as alturas so proporcionais aos respectivos dados.

Exemplo:
A tabela a seguir mostra alguns resultados das empresas com maior crescimento de vendas - em % -
entre as 200 maiores empresas de tecnologia do Brasil.

Tabela 2.7 Empresas com maior crescimento de vendas entre as
200 maiores empresas de tecnologia do Brasil.

Empresas Vendas (%)
VIATELECOM (Comunicao) 181,80
NEXTSYS (Software) 156,90
PROVIDER (Servios) 85,30
TEELAP (Distribuio) 84,10
POSITIVO (Hardware) 77,60
HOLDI TI (Servios) 74,40
SYNTAX (Hardware) 71,10
TIVIT (Servios) 70,90
NEXTEL (Comunicao) 67,10
WITTEL (Software) 65,00
Fonte: Info Exame, ago. 2007.

0,00
20,00
40,00
60,00
80,00
100,00
120,00
140,00
160,00
180,00
200,00
VI AT ELECOM
(Comuni cao)
NEXT SYS
(Ser vi os de
Sof t war e
PROVI DER
(Ser vi os)
T EELAP
(Di st r i bui o)
POSI T I VO
(Har dwar e)
HOLDI T I
(Ser vi os)
SYNT AX
(Har dwar e)
T I VI T (Ser vi os) NEXT EL
(Comuni cao)
WI T T EL (Ser vi os
de Sof t war e)

Figura 3 - Grfico Empresas com maior crescimento de vendas entre as 200 maiores empresas de
tecnologia do Brasil.


d) Grficos em colunas superpostas

Os grficos em colunas superpostas diferem dos grficos em barras ou colunas convencionais apenas
pelo fato de apresentarem cada barra ou coluna segmentada em partes por componentes. Servem para
representar comparativamente dois ou mais atributos.

Exemplo:

Construo de um diagrama em colunas superpostas que retrate os lucros retidos e os
dividendos da Empresa de Ao Steel Corporation , 1969-74, em milhes de dlares.

Tabela 2.8 lucros retidos e os dividendos da Steel Corporation, 1969-74.

Ano Lucros Dividendos Lucros Retidos
1969
1970
1971
1972
1973
1974
217
148
154
157
326
635
130
130
98
87
87
119
87
18
56
70
239
516
Fonte: Fictcia

0
100
200
300
400
500
600
700
1969 1970 1971 1972 1973 1974

Figura 4 - Grfico lucros retidos e os dividendos da Steel Corporation, 1969-74.



ATIVIDADE 2.3

Reproduza os dois tipos de grficos anteriores, usando uma planilha eletrnica, buscando
tambm novos dados em jornais ou em revistas. A seguir, compare os resultados; lembrando-se
de que este dever ser o mesmo.

E) GRFICOS EM SETORES (PIZZA)


Os grficos em setores so construdos com base em um crculo e so empregados sempre que
desejamos ressaltar a participao do dado no total. O total representado pelo crculo, que fica
dividido em tantos setores quantas so as partes. Os setores so tais que suas reas so
respectivamente proporcionais aos dados da srie. O grfico em setores s deve ser empregado
quando h, no mximo, sete dados para no sobrecarregar sua partio.


Exemplo:

Construo de um diagrama em setores que retrate a participao no mercado mundial das
empresas de smartphones.


Tabela 2.9 Participao no mercado mundial dos fabricantes de
smartphones.


Empresas
Participao no
mercado mundial
(%)
Symbian 71,7
Linux 14,3
Windows Mobile 6,9
Blackberry 4,7
Palm OS 2,3
Outros 0,1
Fonte: Info Exame, ago. 2007

Symbian
71,7%
Linux
14,3%
Windows Mobile
6,9%
Blackberry
4,7%
Outros
0,1%
Palm OS
2,3%
Symbian
Linux
Windows Mobile
Blackberry
Palm OS
Outros

Figura 5 - Grfico Participao no mercado mundial dos fabricantes de smartphones.


Observe que, atualmente, a empresa Symbian domina o mercado de smartphones!




F) GRFICO POLAR (RADAR)

O grfico polar o ideal para representar sries temporais cclicas, isto , sries ideais que
apresentem em seu desenvolvimento determinada periodicidade, como a ocorrncia de chuvas no ano
numa determinada regio, a variao da temperatura ao longo do dia, a venda de monitores da filial 1
durante a semana, o consumo de energia eltrica durante o ms ou ano, o nmero de passageiros de
uma linha de nibus ao longo da semana, etc.

O grfico polar faz uso do sistema de coordenadas polares.

Exemplo:

Dada a srie: nmero de ocorrncias de manuteno efetuadas nos computadores da companhia
InfoWay em 2007.


Tabela 2.10 Nmero de ocorrncias de manuteno

MESES
OCORRNCIAS
Janeiro 148
Fevereiro 164
Maro 152
Abril 188


















1. traamos uma circunferncia de raio arbitrrio (em particular, damos preferncia ao raio de
comprimento proporcional mdia dos valores da srie);
6 construmos uma semi-reta (de preferncia, na horizontal) partindo de O (plo) e com uma
escala (eixo polar);
7 dividimos a circunferncia em tantos arcos quantas forem s unidades temporais;
8 traamos, a partir do centro O (plo), semi-reta passando pelos pontos de diviso;
9 marcamos os valores correspondentes das ocorrncias de manuteno, iniciando pela semi-reta
horizontal (eixo polar);
10 ligamos os pontos encontrados com segmentos de reta;
11 se pretendermos fechar a poligonal obtida, empregamos uma linha interrompida.



Figura 6 - Grfico nmero de ocorrncias efetuadas nos computadores em 2007

Pelo grfico, percebemos que os meses em que houve mais ocorrncias efetuadas nos
computadores foram outubro e novembro; com essa informao, podemos nos planejar para
esses meses, contratando mais funcionrios, etc. Observe quanto uma informao como essa
importante em sua vida profissional!

Maio 160
Junho 176
Julho 164
Agosto 184
Setembro 164
Outubro 219
Novembro 211
Dezembro 140
FONTE: Sindan.
Exemplo 2:

Comparar os itens mais vendidos de uma empresa de informtica, por meio de grfico polar, nos
meses de janeiro e fevereiro de 2010.


2.11 Itens mais vendidos de uma empresa de informtica.

Itens mais
Vendidos
Janeiro Fevereiro
Placas-me 280 250
Teclados 350 400
Mouses 400 320
Impressoras 180 220
Fontes
203 150
Gabinetes 281 260
Processadores 98 130

0
100
200
300
400
Placas-me
Teclados
Mouses
Impressoras Fontes
Gabinetes
Processadores
Figura 7 Grfico itens mais vendidos de uma empresa de informtica

____ Vendas em janeiro - - - - Vendas em fevereiro


Anlise:

Observando o grfico polar, verificamos que houve queda de vendas em Placas-me, mouses, fontes
e gabinetes, enquanto as vendas aumentaram para teclados, impressoras e processadores.

2.3 Uso indevido de grficos

Muitas vezes, o uso indevido dos grficos pode trazer uma interpretao falsa dos dados que esto
sendo analisados, chegando mesmo a confundir o leitor. Vejamos, atravs de um exemplo, como esse
fato pode ocorrer. Os dois grficos apresentados a seguir representam os mesmos dados, e a primeira
impresso a de que os dois representam dados nitidamente diferentes.

No grfico (a), as flutuaes das vendas aparecem nitidamente, j no grfico(b), tem-se a impresso
de que a flutuao das vendas no manifesta praticamente tendncia alguma, exceto leve flutuao.
Trata-se, na realidade, de um problema de construo de escalas. Enquanto o grfico apresenta-se
com uma escala mais ou menos convencional, o grfico(b) revela propores consideravelmente
diferentes para as escalas em que foram divididos os dois eixos.





Vendas de computadores no ano de 2009 da empresa ABC informtica.

0
1000
2000
3000
4000
J
a
n
F
e
v
M
a
r
A
b
r
M
a
i
J
u
n
J
u
l
A
g
o
S
e
t
O
u
t
N
o
v
D
e
z

Figura 8 Grfico A Viso real dos dados

0
1000
2000
3000
4000
Jan Fev Mar Abr Mai Jun Jul Ago Set Out Nov Dez

Figura 9 Grfico B - Viso distorcida dos dados

Veja os dados reais de vendas de computadores no ano de 2009 da empresa ABC informtica:

Tabela 2.12 Vendas de computadores no ano de 2009 da empresa ABC informtica

Ms Vendas
Jan 2401
Fev 2520
Mar 1900
Abr 2610
Mai 1940
Jun 2750
Jul 2200
Ago 2970
Set 2980
Out 3180
Nov 3420
Dez 3800



ATIVIDADE 2.4

1) Reproduza os grficos anteriores, manualmente e usando uma planilha eletrnica, buscando
novos dados em jornais ou em revistas, e, a seguir, compare os resultados; lembrando-se de que
o resultado dever ser o mesmo.

2) Monte um grfico do tipo barras verticais das empresas que apresentaram maior lucro, em
milhes de reais, entre as empresas de tecnologia:

Empresas
Lucro
(em Milhes de Reais)
Empresa 1 150,50
Empresa 2 95,70
Empresa 3 47,30
Empresa 4 42,90
Empresa 5 37,50
Empresa 6 33,60
Empresa 7 27,30
Empresa 8 19,10
Empresa 9 9,30
Empresa 10 7,90

3) Numa empresa de manuteno em informtica, 60% dos funcionrios vo fazer manuteno
em monitores, 24 % em mouses e teclados, 8% em fontes e 8% nas demais peas do computador.
O grfico que melhor representa essa situao o de:

e) ( ) Linha
f) ( ) Barras
g) ( ) Setores
h) ( ) Colunas superpostas





Chegamos ao final de mais um captulo; nele, vimos s diversas formas de organizar e analisar os
dados de uma srie de observaes, as tabelas de frequncias e os mtodos grficos.
importante que esses conceitos estejam bem compreendidos; caso contrrio, faa uma reviso,
pois eles sero necessrios nos prximos captulos.

Vamos para o captulo 3!
CAPTULO 3

MTODOS GRFICOS






3.1 Distribuio de frequncia

Distribuio de frequncia um tipo de tabela que condensa uma coleo de dados conforme as
frequncias (repeties de seus valores).

Distribuio de frequncias uma tcnica para apresentar uma coleo de objetos
classificados de modo a mostrar a quantidade existente em cada classe. Ser muito utilizada
em frequncias de probabilidades. Resumidamente, significa agrupar os dados repetidos.




3.1.1 Tabela primitiva ou tabela de dados brutos

a tabela inicial de coleta de dados, os elementos no so numericamente organizados. difcil
formar uma idia exata do comportamento da pesquisa efetuada.






Ol, Aluno (a)!

Neste captulo, estudaremos mtodos grficos, que so os histogramas que serviro de
base para a compreenso dos captulos seguintes. Entender esse contedo, ento, de
fundamental importncia, pois a anlise grfica em estatstica feita com base nele.

Bons estudos!
Prof. Sebastio A. Carneiro
Ol, Turma!
Acompanhe atentamente os passos seguintes, pois vamos usar um exemplo para deixar bem clara
cada etapa.

Prof. Sebastio A. Carneiro
Exemplo:

Foram tomados os preos de 20 monitores de 15 polegadas, LCD, em 20 empresas de informtica.




Figura 10 - Monitores LCD

Tabela 3.1 Preos de 20 monitores LCD

Empresas
Valor do
monitor
Empresa 1 R$ 418,0
Empresa 2 R$ 420,0
Empresa 3 R$ 418,0
Empresa 4 R$ 410,0
Empresa 5 R$ 413,0
Empresa 6 R$ 430,0
Empresa 7 R$ 420,0
Empresa 8 R$ 430,0
Empresa 9 R$ 416,0
Empresa 10 R$ 418,0
Empresa 11 R$ 418,0
Empresa 12 R$ 420,0
Empresa 13 R$ 417,0
Empresa 14 R$ 418,0
Empresa 15 R$ 420,0
Empresa 16 R$ 430,0
Empresa 17 R$ 418,0
Empresa 18 R$ 430,0
Empresa 19 R$ 415,0
Empresa 20 R$ 418,0








Como podemos ver, no possvel identificar, de imediato, quem tem o menor ou o maior
preo.

3.1.2 ROL
a tabela obtida aps a ordenao dos dados (crescente ou decrescente).







Exemplo

Tabela 3.2 Ordenao dos preos dos monitores

Empresas
Valor do
monitor
Empresa 4 R$ 410,0
Empresa 5 R$ 413,0
Empresa 19 R$ 413,0
Empresa 9 R$ 415,0
Empresa 13 R$ 416,0
Empresa 1 R$ 416,0
Empresa 3 R$ 416,0
Empresa 10 R$ 416,0
Empresa 11 R$ 416,0
Empresa 14 R$ 417,0
Empresa 17 R$ 417,0
Empresa 20 R$ 418,0
Empresa 2 R$ 418,0
Empresa 7 R$ 418,0
Empresa 12 R$ 420,0
Empresa 15 R$ 420,0
Empresa 6 R$ 420,0
Empresa 8 R$ 420,0
Empresa 16 R$ 430,0
Empresa 18 R$ 430,0






3.1.3 Distribuio de frequncia sem intervalos de classe

Vamos continuar utilizando o exemplo anterior para construir nossa tabela ROL.
Observou!? Agora temos, de imediato, a empresa que vende mais barato, a que
vende mais caro...
A distribuio de frequncia sem intervalos de classe a simples condensao dos dados, conforme
as repeties de seus valores; ou seja, a ocorrncia que o valor repete. usada para diminuir o
tamanho da srie.

Exemplo:

Vamos continuar utilizando o exemplo anterior para construir a distribuio de frequncia sem
intervalos de classe.

Tabela 3.3 Valor do monitor e nmero de empresas com o mesmo preo

Valor do
monitor
Nmero de empresas
com o mesmo preo
R$ 410,0 1
R$ 413,0 2
R$ 415,0 1
R$ 416,0 5
R$ 417,0 2
R$ 418,0 3
R$ 420,0 4
R$ 430,0 2
Total 20



a) Diagrama de uma distribuio de frequncia

Uma distribuio de frequncia sem intervalos de classe representada graficamente por um
diagrama, em que cada valor da varivel representado por um segmento de reta vertical e de
comprimento proporcional respectiva frequncia.

Notou!? O tamanho da tabela foi reduzido; as informaes continuaram as mesmas.

FIGURA 11 Diagrama de uma distribuio de freqncia sem intervalo de classe.


3.1.4 Distribuio de frequncia com intervalos de classe

Quando a amostra grande, a tabela tambm tende a ser grande; nesse caso, mais racional efetuar o
grupamento dos valores em vrios intervalos de classe.

Exemplo:

Ao acaso, foram pesquisados os preos de 200 monitores LCD, de um mesmo modelo, em 200
empresas de informtica. Veja os valores no anexo da apostila e observe que, aps o ordenamento dos
preos em ordem crescente (ROL), o valor mnimo encontrado R$ 412,0 e o valor mximo R$
440,0. Com os preos ordenados, montamos a tabela a seguir:

Tabela 3.4 Preos de 200 monitores LCD em 200 empresas de informtica

Valor do monitor
(R$)
Frequncias
412 |------- 415 10
415 |------- 418 15
418 |------- 421 20
421 |------- 424 25
A partir de agora, chamaremos o nmero de repeties de frequncia de ocorrncia ou
simplesmente de frequncia.

Nmero de repeties = frequncia de ocorrncia = frequncia.
424 |------- 427 30
427 |------- 430 30
430 |------- 433 28
433 |------- 436 22
436 |------- 439 12
439 |------- 442 * 8
Total 200



* Se voc est com dvida sobre o modo como a tabela foi montada, no se
preocupe, pois o objetivo deste captulo exatamente esse. Fique atento e
no perca os prximos passos da matria.


A partir de agora, iremos chamar a primeira coluna de classe.

a) Elementos de uma distribuio de frequncia com intervalos de classe




a) Classe

Classe o intervalo de variao da varivel, simbolizada por i. O nmero total de classes
simbolizado por k.

Exemplo:

Na tabela anterior, temos: k=10 e para 415 |------- 418 a classe 2 (i =2).

b) Limites de classe:

So os extremos de cada classe. O menor nmero o limite inferior de classe (li) e o maior nmero
o limite superior de classe (Li).

Exemplo:

Em 427 |------- 430... Limite inferior l6= 427 e limite superior L6= 430

O smbolo |------ representa um intervalo fechado esquerda e aberto direita. O dado 427 do ROL,
no pertence classe 5, e sim, classe 6, representada por 427 |----- 430.

c) Amplitude de intervalo de classe

a diferena entre o limite superior e o inferior da classe. simbolizada por hi = Li - li.


Antes de iniciarmos a construo de uma distribuio de frequncia com intervalos de classe,
vamos ver alguns conceitos importantes.

Exemplo:

Na tabela anterior, hi= 427 424 = 3.

Obs.: Na distribuio de frequncia com classe, o hi ser igual em todas as classes.

d) Amplitude total da distribuio

a diferena entre o limite superior da ltima classe e o limite inferior da primeira classe.
AT = L(max) - l(min).

Exemplo:

Na tabela anterior, AT = 442 - 412= 30.

e) Amplitude total da amostra

a diferena entre o valor mximo e o valor mnimo da amostra.

Em que:

AA = Xmax - Xmin.

Xmax = 440 (mximo valor real encontrado do monitor)

Xmin = 412 (mnimo valor real encontrado do monitor)

Em nosso exemplo, AA = 440 - 412 = 28.

Observe que: AT sempre ser maior que AA. Voc tem que estar convencido dessa afirmao.

f) Ponto mdio de classe:

o ponto que divide o intervalo de classe em duas partes iguais.

Exemplo:

Em 418 |------- 421 o ponto mdio x3 = (418+421)/2 = 419,5, ou seja, x3=(l3+L3)/2.


Veja como fica a distribuio de frequncia de preos de 200 monitores anterior:

Tabela 3.5 Classe Frequncia de preos de 200 monitores


Classe Frequncias
i=1 (primeira classe) 412 |------- 415 10
i=2 (segunda classe) 415 |------- 418 15
i=3 (terceira classe) 418 |------- 421 20
i=4 (quarta classe) 421 |------- 424 25
i=5 (quinta classe) 424 |------- 427 30
i=6 sexta classe) 427 |------- 430 30
i=7 (stima classe) 430 |------- 433 28
i=8 (oitava classe) 433 |------- 436 22
i=9 (nona classe) 436 |------- 439 12
i=10 (dcima classe) 439 |------- 442 8
Total 200






ATIVIDADE 3.3

1. Determine a amplitude da amostra -1, -2 , 3, 4, 5.
2. Dada a distribuio de frequncia a seguir, que representa os dimetro de furos encontrados
em gabinetes de computadores:




















Determine:
a) o limite superior da sexta classe;
b) o limite inferior da segunda classe;
c) a Amplitude total da distribuio;
d) o Ponto mdio da quinta classe;
e) o intervalo de classe;
f) quantos computadores apresentaram dimetros de furos entre 28 a 30,99 mm;
g) quantos computadores apresentaram dimetros de furos igual ou superiores a 22 mm;
h) percentualmente, quantos computadores apresentaram dimetros de furos entre 16 e 27,99
mm.

Dimetros de Furos
(mm) Computadores
10 |------- 13 5
13 |------- 16 15
16 |------- 19 25
19 |------- 22 35
22 |------- 25 45
25 |------- 28 30
28 |------- 31 28
31 |------- 34 22
34 |------- 37 12
37 |------- 40 8
Total 225

c) Mtodo prtico para construo de uma distribuio de freqncia







Depois de feita a pesquisa de campo, siga os seguintes passos:

(Vamos utilizar o exemplo dos preos de 200 monitores LCD levantados em 200 empresas de
informtica).

1 - Organize os dados brutos em um ROL;
2 - Calcule a amplitude amostral AA;

No nosso exemplo: AA =440 - 412 =28.

3 - Calcule o nmero de classes por meio da "Regra de Sturges";

A Regra de Sturges uma frmula que compacta os dados e estabelecer o nmero de classes
(nmero de linhas) que a distribuio de frequncia ter. Ela dada conforme a frmula seguir:

i =1 + 3,3 . log n

Em que:

i = nmero de classes (valor inteiro mais prximo);
n = quantidade de amostras da pesquisa.


Obs.: Qualquer regra para determinao do nmero de classes da
distribuio de frequncia (o nmero de linhas que ter a tabela) no nos
leva a uma deciso final; isso pois esta vai depender de um julgamento
pessoal, que deve estar ligado natureza dos dados e clareza que se deseja
obter na distribuio de frequncia.

Existem outras opes regra de Sturges, como:

i = n
1/2




No caso do nosso exemplo dos 200 monitores:

n = 200 amostras

i =1 + 3,3 . log 200

i = 8,6 , adotamos i = 9, ou seja a tabela ter 9 linhas



Vamos mostrar um mtodo prtico para construo de uma distribuio de frequncia.


Observe que, efetivamente no nosso exemplo, i = 10.
Veremos em breve o motivo.



4 - Calcule a amplitude do intervalo de classe h = AA/i.;

No nosso exemplo: AA/i = 28/9 = 3,11.

Obs.: Adotaremos neste caso h = 3 para termos intervalos de classe valores inteiros e assim obter uma
melhor visualizao na tabela.



5 - Monte a tabela da seguinte forma:

i |------- Li= i + h

Exemplo:

1
|------- L
1
=
1
+ h
412 |------- 415

Em que:

1
o menor nmero inteiro da amostra.

Obs.:
1
deve ser preferencialmente um valor inteiro menor ou igual a Xmin e
L
1
deve ser preferencialmente um valor inteiro maior ou igual a
1
+ h.

No nosso exemplo: o menor nmero da amostra 412. Assim, teremos: L
1
=
1
+ h = 412+3 = 415,
logo, a primeira classe ser representada por 412 |------- 415.

O primeiro elemento das classes seguintes sempre sero formados pelo ltimo elemento da classe
anterior.

Assim a segunda classe fica:

2
= L
1
e

L
2
= (
2
+ h )

2
|------- L
2
= (
2
+ h )

2
= 415 e L
2
= 415 + 3 = 418

415 |------- 418 Observe que confere com a tabela 3.6.

As classes seguintes respeitaro o mesmo procedimento.


Ao final da montagem da tabela, percebemos que a ltima classe 10 e no 9, conforme
estabelecia a regra de sturges. Isso ocorre porque a regra de sturges fornece a orientao do
nmero de classe, mas preferimos utilizar nmeros inteiros nos limites inferiores e superiores
de classe para melhorar a apresentao da tabela, com isto, a classe passou de 9 para 10.
c) Representao grfica de uma distribuio

Em todos os grficos acima, utilizamos o primeiro quadrante do sistema de eixos coordenados
cartesianos ortogonais. Na linha horizontal (eixo das abscissas), colocamos os valores da varivel e,
na linha vertical (eixo das ordenadas), as frequncias.
.

Histograma: formado por um conjunto de retngulos justapostos, cujas bases se localizam
sobre o eixo horizontal, de tal modo que seus pontos mdios coincidam com os pontos
mdios dos intervalos de classe. A rea de um histograma proporcional soma das
frequncias simples ou absolutas.


Exemplo: Vamos montar o histograma da distribuio de frequncia anterior:

Tabela 3.6 Valores dos monitores

Valor do monitor
(R$)
Frequncias
412 |------- 415 10
415 |------- 418 15
418 |------- 421 20
421 |------- 424 25
424 |------- 427 30
427 |------- 430 30
430 |------- 433 28
433 |------- 436 22
436 |------- 439 12
439 |------- 442 8
Total 200



Histograma da distribuio de frequncia


Figura 12 - Histograma da distribuio de frequncia



Quem estiver utilizando a planilha eletrnica Excel deve instalar esse recurso em
Ferramentas/Suplementos/Ferramentas de Anlise; caso contrrio, pode-se utilizar as
ferramentas de desenho dos aplicativos.



3.1.5 Polgono de frequncia

um grfico em linha, sendo as frequncias marcadas sobre perpendiculares ao eixo
horizontal, levantadas pelos pontos mdios dos intervalos de classe. Fornece, na realidade, o
contorno, ou seja, a envoltria, em vez de retngulos paralelos.


Exemplo de polgono de frequncia:



Figura 13 - Exemplo de Polgono de frequncia da distribuio de dados

a) Frequncias simples ou absolutas

So os valores que realmente representam o nmero de dados de cada classe. A soma das
frequncias simples igual ao nmero total dos dados da distribuio. Veja exemplo a seguir.

b) Frequncias relativas

So os valores das razes entre as frequncias absolutas de cada classe e a frequncia total da
distribuio. A soma das frequncias relativas igual a 1 (100 %).

Exemplo de frequncias relativas fri (%)


Tabela 3.7 Exemplo de frequncias relativas fri

classe fi fri (%)
412 |------- 415 10 5,0%
415 |------- 418 15 7,5%
418 |------- 421 20 10,0%
421 |------- 424 25 12,5%
424 |------- 427 30 15,0%
427 |------- 430 30 15,0%
430 |------- 433 28 14,0%
433 |------- 436 22 11,0%
436 |------- 439 12 6,0%
439 |------- 442 8 4,0%
Total 200 100%
c) Frequncia simples acumulada de uma classe Fi

o total das frequncias de todos os valores inferiores ao limite superior do intervalo de uma
determinada classe.


Tabela 3.8 Exemplo de frequncias relativas fri e acumulada Fri

classe fi fri (%) Fi
412 |------- 415 10 5,0% 10
415 |------- 418 15 7,5% 25
418 |------- 421 20 10,0% 45
421 |------- 424 25 12,5% 70
424 |------- 427 30 15,0% 100
427 |------- 430 30 15,0% 130
430 |------- 433 28 14,0% 158
433 |------- 436 22 11,0% 180
436 |------- 439 12 6,0% 192
439 |------- 442 8 4,0% 200
Total 200 100%



d) Frequncia relativa acumulada de uma classe Fri

a frequncia acumulada da classe, dividida pela frequncia total da distribuio.


Tabela 3.9 Exemplo de frequncias relativas fri e acumulada Fri

classe fi fri (%) Fi Fri (%)
412 |------- 415 10 5,0% 10 5,0%
415 |------- 418 15 7,5% 25 12,5%
418 |------- 421 20 10,0% 45 22,5%
421 |------- 424 25 12,5% 70 35,0%
424 |------- 427 30 15,0% 100 50,0%
427 |------- 430 30 15,0% 130 65,0%
430 |------- 433 28 14,0% 158 79,0%
433 |------- 436 22 11,0% 180 90,0%
436 |------- 439 12 6,0% 192 96,0%
439 |------- 442 8 4,0% 200 100,0%
Total 200 1

Observar que temos o valor acumulativo em percentagens. Como exemplo, podemos ver da
tabela anterior que o preo do monitor at R$ 436,00 est entre os 90% dos monitores pesquisados, ou
seja, apenas 10% dos monitores custam mais do que R$ 436,00

3.1.6 Curva de Frequncia (Curva polida):

Enquanto o polgono de frequncia nos d a imagem real do fenmeno estudado, a curva de
frequncia nos d a imagem tendencial; ou seja, mostra o comportamento dos dados segundo um
grfico de linha j estudado. O polimento, do ponto de vista geomtrico, corresponde eliminao
dos vrtices da linha poligonal de um polgono de frequncia. Para conseguir o polimento, vamos
utilizar uma frmula bastante simples, apresentada a seguir:


A fci (frequncia calculada da classe ou frequncia polida) , na realidade, uma mdia ponderada
das frequncias em torno da frequncia a ser polida.

( )
4
. 2 fpost fi fant
fci
+ +
=

Em que:

fci = frequncia calculada da classe considerada (frequncia polida).
fi = frequncia simples da classe a ser polida.
fant = frequncia simples da classe anterior a ser polida.
fpost = frequncia simples da classe posterior a ser polida.




Figura 14 - Curva de Frequncia ou Curva polida da distribuio de dados


ATIVIDADE 3.5

1) A tabela a seguir apresenta as velocidades dos Links de Internet de 400 computadores
conectados a uma grande empresa.

Kbytes
Quantidade de
computadores
conectados
300 |------- 400 14
400 |------- 500 46
500 |------- 600 58
600 |------- 700 76
700 |------- 800 68
800 |------- 900 62
900 |------- 1000 48
1000 |------- 1100 22
1100 |------- 1200 6

Com relao a essa tabela, determine:
a) a frequncia da quarta classe;
b) a frequncia relativa da sexta classe;
c) a frequncia acumulada da quinta classe;
d) o nmero de computadores cuja velocidade do link no atinge 700 kbites;
e) o nmero de computadores cuja velocidade do link atinge e ultrapassa 800 kbites;
f) a percentagem de computadores cuja velocidade do link no atinge 600 kbites;
g) a percentagem de computadores cuja velocidade do link seja maior ou igual a 900
kbites;
h) a percentagem de computadores cuja velocidade do link seja maior ou igual a 500
kbites e inferior a 1000 kbites;
i) a classe dos 72 computadores mais rpidos no link.

2) Os dados a seguir, obtidos em uma pesquisa realizada no comrcio local, apresentam as
diferenas encontradas nos preos de 100 placas-me. Com base nisso:

a) forme com esses dados uma distribuio de frequncia com intervalo de classe;
b) confeccione o histograma e o polgono de frequncia correspondentes.


3,9 7,4 10.0 11,8 2,3 4,5 10,5 8,4 15,6 7,6
18,8 2,9 2,3 0,4 5 9 5,5 9,2 12,4 8,7
4,5 4,4 10,6 5,6 8,5 2,4 17,8 11,6 0,8 4,4
7,1 3.2 2,7 9,5 2,7 9,5 13,1 3,8 6,3 7,9
4,8 5,3 12,9 6,9 6,3 7,5 2,6 3,3 4,6 16
3,9 7,4 10.0 11,8 2,3 4,5 10,5 8,4 15,6 7,6
18,8 2,9 2,3 0,4 5 9 5,5 9,2 12,4 8,7
4,5 4,4 10,6 5,6 8,5 2,4 17,8 11,6 0,8 4,4
7,1 3.2 2,7 9,5 2,7 9,5 13,1 3,8 6,3 7,9
4,8 5,3 12,9 6,9 6,3 7,5 2,6 3,3 4,6 16

3) Examinando o histograma abaixo, que corresponde s notas relativas aplicao de um teste
de inteligncia a um grupo de alunos do curso de anlise e desenvolvimento de sistema,
responda:
a. Qual o intervalo de notas que apresentou maior frequncia?
b. Qual a amplitude total da distribuio?
c. Qual o nmero total de alunos?
d. Qual a frequncia do intervalo de classe 14 | 15?
e. Quantos alunos receberam notas entre 9 e 16?
f. Quantos alunos receberam notas no-inferiores a 12?




25






20






15






10






5



1

4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21

Ol, Aluno (a)!

Chegamos ao final do terceiro captulo, em que foram apresentadas diversas formas de
organizar e analisar os dados de uma srie de observaes, as tabelas de frequncias e os
mtodos grficos. importante que esses contedos estejam bem compreendidos; caso
contrrio, faa uma reviso, pois eles sero necessrios nos prximos captulos.

Sigamos adiante!


NOTAS
CAPTULO 4
MEDIDAS DE ORDENAMENTO E DE POSIO



4.1 MEDIDAS DE POSIO
As mais importantes medidas de posio so as medidas de tendncia central, pois se verifica uma
tendncia dos dados observados a se agruparem em torno dos valores centrais.

As medidas de tendncia central mais utilizadas so: mdia aritmtica, moda e mediana. Outras
medidas de tendncia central menos utilizadas, que no estudaremos neste curso, so as mdias:
geomtrica, harmnica, quadrtica, cbica e bi quadrtica.
Outras medidas de posio so as separatrizes, que englobam: a prpria mediana, os decis, os quartis
e os percentis.

4.2 MDIA DE POPULAO E DE AMOSTRAS
Em estatstica, o conceito de mdia tambm pode ser usado para descrever um conjunto de
observaes. Quando o conjunto das observaes uma populao, chamado de mdia da
populao e representaremos por . Quando o conjunto das observaes uma amostra estatstica,
chamado de mdia amostral e representaremos por X . Na prtica, ao lidar com grandes populaes,
quase sempre impossvel achar o valor exato da mdia da populao, devido ao tempo, ao custo e a
outras restries de recursos. Por esse motivo, estudaremos somente a mdia amostral que ser
chamada de mdia, simplesmente.

4.3 REPRESENTAO DOS VALORES DE UMA SRIE DE VALORES
Os valores de uma srie de valores sero representados por uma letra maiscula, normalmente X, e a
sua posio na srie, por uma letra minscula, normalmente i. A quantidade total de valores na srie
ser representada por n.

Na srie X: 4, 8, 12, 20 e 50, temos: X1= 4; X2= 8; X3=12; X4=12; X5=50 e n=5.


Ol, Aluno (a)!

Neste captulo, estudaremos as medidas de ordenamento e de posio, denominadas tambm de
medidas de tendncia central, tais como mdia, moda, mediana e separatrizes, as quais nos
permitiro resumir e analisar uma srie de dados.

Bons estudos!

Prof. Sebastio A. Carneiro
Em um conjunto de dados, podemos definir vrios tipos de mdias. Porm, em nossos
estudos, vamos nos limitar ao mais importante: a mdia aritmtica.

4.4 MDIA ARITMTICA ( )

igual ao quociente da soma dos valores do conjunto e o nmero total dos valores.
n
Xi
X

=

A mdia sempre ser indicada por uma letra maiscula com um trao superior.


Exemplo 1:
Calcular a mdia dos valores anteriores:
4, 8, 12, 20 e 50.

= 4+ 8+ 12+ 20 + 50 = 94_ = 18,8
5 5
Exemplo 2:
Calcular a mdia dos valores a seguir:
2; -4; 0; 11; 1; 20; 30.
= 2+ -4+ 0+ 11+ 1+ 20+ 30 = 60 = 8,57
7 7

4.4.1 Mdia Aritmtica para dados no-agrupados:
Quando desejamos conhecer a mdia dos dados no-agrupados em tabelas de frequncias,
determinamos a mdia aritmtica simples, conforme j visto no item anterior.
Exemplo:
A venda diria de memria RAM 1 GB , durante uma semana, foi de 100, 140, 130, 150, 160, 180 e
120 unidades; ento, a venda mdia diria de memria RAM foi:

Figura 15 - Memria RAM
.= (100+140+130+150+160+180+120) / 7 = 140 unidades
O resultado obtido, 140, representa o valor dirio de venda de memrias RAM. Ou seja, 140
representa os 7 valores.

4.4.2 DESVIO EM RELAO MDIA

a diferena entre cada elemento da srie de valores e a mdia aritmtica, ou seja: di = Xi -


No exemplo anterior, temos sete desvios:... d1 = 100 - 140 = - 40 , ...d2 = 140 - 140 = 0 , ...d3 = 130 -
140 = -10 , ...d4 = 150 - 140 = 10 ,... d5 = 160 - 140 = 20 ,... d6 = 180 - 140 = 40 ...e... d7 = 120 - 140
= - 20.

4.4.3 PROPRIEDADES DA MDIA

1 propriedade: A soma algbrica dos desvios em relao mdia sempre nula.




No exemplo anterior: d1+d2+d3+d4+d5+d6+d7 = 0

2 propriedade: Somando-se (ou subtraindo-se) uma constante (c) a todos os valores de uma
varivel, a mdia do conjunto fica maior (ou menor) dessa constante.

Se no exemplo original somarmos a constante 2 a cada um dos valores da varivel, teremos:
= 102+142+132+152+162+182+122 / 7 = 142 unidades ou
= .+ 2 = 140 +2 = 142 unidades

3 propriedade: Multiplicando-se (ou dividindo-se) todos os valores de uma varivel por
uma constante (c), a mdia do conjunto fica multiplicada (ou dividida) por essa constante.


Se no exemplo original multiplicarmos a constante 3 a cada um dos valores da varivel, teremos:
a) Z = 300+420+390+450+480+540+360 / 7 = 420 unidades
Z= x 3 = 140 x 3 = 420 unidades
ATIVIDADE 4.1

1) Marque a opo correta. Na tabela primitiva: {6, 2, 7, 6, 5, 4} a soma dos desvios
em relao mdia aritmtica igual:
a) ( ) ao nmero - 4
b) ( ) ao nmero 8
c) ( ) ao nmero 0
d) ( ) ao nmero 25
e) ( ) ao nmero 4
2) Numa empresa de informtica, a mdia de vendas de 130 computadores. A
empresa faz uma promoo e a quantidade de unidades vendidas aumenta em
20%. Assim, qual a mdia de vendas no perodo da promoo?
3) Marque a opo correta. um professor, aps verificar que toda a classe obteve
nota baixa, eliminou as questes a que os alunos no responderam. Com isso, as
notas de todos os alunos foram aumentadas de 3 pontos. Ento:
a) ( ) a mdia aritmtica ficou alterada de 3, assim como a soma dos desvios;
b) ( ) a mdia aritmtica diminui de 3;
c) ( ) no houve alterao nem na mdia nem nos desvios;
d) ( ) a mdia aritmtica aumentou de 3.

4) Considerando que voc tem srie aritmtica, na qual o primeiro termo -3, a
razo -5 e o nmero de elementos 389, pede-se: qual a soma dos desvios da
srie considerada?

5) Qual a soma dos desvios da mdia da srie considerada a seguir?
33 28 23 18 13 8
12 33 54 75 96 117
-9 38 85 132 179 226
-30 43 116 189 262 335
-51 48 147 246 345 444
-72 53 178 303 428 553
-93 58 209 360 511 662

b) Mdia Aritmtica para dados agrupados:
b1) Sem intervalos de classe
Numa rede, trafega um fluxo dirio de dados, conforme a tabela a seguir. Qual a mdia diria de
dados que trafega na rede?
Tabela 4.1 Trfego de fluxo dirio de dados na rede
Fluxo de dados Durao (h)
128 MB 2






Tabela 4.2 Trfego de fluxo dirio de dados na rede representada por Xi fi.





Como a durao so nmeros indicadores da intensidade de cada valor da varivel, as frequncias
funcionam como fatores de ponderao, o que nos leva a calcular a mdia aritmtica ponderada da
seguinte forma:

=
fi
fi Xi
X
.


Devemos, assim, montar uma nova coluna (Xi.fi) na tabela:
Tabela 4.3 Ocorrncia de trfego de fluxo dirio (Xi x fi)




256 MB 6
350 MB 8
380 MB 5
400 MB 3
Total 24
O fluxo de dados ser representado pela varivel Xi, a durao com que os dados trafegam na
rede, representaremos por fi.
Xi fi
128 MB 2
256 MB 6
350 MB 8
380 MB 5
400 MB 3
Total 24
Devemos observar que a mdia ponderada no uma nova frmula para o clculo da mdia. Na
realidade, h um agrupamento dos valores repetidos.
Xi fi Xi.fi
128 MB 2 128 . 2 = 256
256 MB 6 256 . 6 = 1536
350 MB 8 350 . 8 = 2800
380 MB 5 380 . 5 = 1900
400 MB 3 400 . 3 = 1200
Total fi = 24 Xi.fi = 7692

Calcular a mdia conforme a frmula a seguir:
5 , 320
24
7692
.
= = =

fi
fi Xi
X


Ou seja, a quantidade mdia de dados que trafegam na rede de 320,5 MB.

ATIVIDADE 4.2
1-Marque a alternativa correta:
Em uma prova de Estatstica, 3 alunos obtiveram a nota 8,2; outros 3 obtiveram a nota 9,0;
5 obtiveram a nota 8,6; 1 obteve a nota 7,0 e 1, a nota 8,9. A mdia aritmtica :
a) ( ) uma mdia aritmtica simples com valor 8,0;
b) ( ) uma mdia aritmtica simples com valor 8,7;
c) ( ) uma mdia aritmtica ponderada com valor 8,0;
d) ( ) uma mdia aritmtica ponderada com valor 8,5;
e) ( ) nenhuma das respostas anteriores.
2 Em uma classe de 50 alunos, as notas obtidas foram as seguintes:

Notas
Nmero de
alunos
4 3
5 8
6 12
7 12
8 8
9 5
10 2

Qual a nota mdia da turma?

3- Suponha que adicionamos 100 a cada um dos valores de uma amostra. O que acontece
com a mdia?



b2) Com intervalos de classe
No caso de mdia aritmtica para dados agrupados com intervalos de classe, convencionamos
que todos os valores includos em um determinado intervalo de classe coincidem com o seu ponto
mdio, e definimos a mdia da mesma maneira como calculamos a mdia aritmtica para dados
agrupados sem intervalos de classe.

Xi =(Li +li)/2

Em que:

Xi Ponto mdio da classe;
Li Limite superior da classe;
Li - Limite inferior da classe.

=
fi
fi Xi
X
.


Exemplo:
Vamos usar o exemplo da pesquisa dos preos de 200 monitores LCD da marca AOC, em 200
empresas de informtica, para calcular a mdia de preos.
Tabela 4.4 Preos de 200 monitores LCD da marca AOC em 200 empresas de
informtica.












Calculando os valores de Xi. fi, teremos:
Tabela 4.5 Ocorrncias de Preos de 200 monitores LCD da marca AOC, em 200
empresas de informtica (Xi. fi)

Classe Fi Xi Xi. fi
412 |------- 415 10 413,5 4135
415 |------- 418 15 416,5 6247,5
418 |------- 421 20 419,5 8390
Valor do monitor
(R$)
Frequncias
412 |------- 415 10
415 |------- 418 15
418 |------- 421 20
421 |------- 424 25
424 |------- 427 30
427 |------- 430 30
430 |------- 433 28
433 |------- 436 22
436 |------- 439 12
439 |------- 442 8
Total 200
421 |------- 424 25 422,5 10562,5
424 |------- 427 30 425,5 12765
427 |------- 430 30 428,5 12855
430 |------- 433 28 431,5 12082
433 |------- 436 22 434,5 9559
436 |------- 439 12 437,5 5250
439 |------- 442 8 440,5 3524
Total 200 85370

Logo, a mdia ser:
9 , 426
200
85370
.
= = =

fi
fi Xi
X
ATIVIDADE 4.3


1) Calcule o valor mdio da placa-me (mainboard ou motherboard), cujos valores esto
distribudos a seguir:

Tipo de
placa-me
Valor
R$
Quantidade
Tipo 1 300 |------- 305 14
Tipo 2 305 |------- 310 46
Tipo 3 310 |------- 315 58
Tipo 4 315 |------- 320 76
Tipo 5 320 |------- 325 68
Tipo 6 325 |------- 330 62
Tipo 7 330 |------- 335 48
Tipo 8 335 |------- 340 22

2) Marque a opo correta: Um aluno faz trs provas com pesos 2, 2 e 3. Se ele tirou 2 e 7 nas
duas primeiras, quanto precisa tirar na terceira prova para ficar com mdia maior ou igual a
6?
a) ( ) pelo menos 5
b) ( ) pelo menos 6
c) ( ) pelo menos 7
d) ( ) pelo menos 8




4.5 MODA (MO)
A moda utilizada quando desejamos obter uma medida rpida e aproximada de posio. J a mdia
aritmtica a medida de posio que possui a maior estabilidade.
especialmente til para reduzir a informao de um conjunto de dados qualitativos, apresentado sob
a forma de nomes ou categorias, para os quais no se pode calcular a mdia.

o valor que ocorre com maior frequncia em uma srie de valores.

Desse modo, o salrio modal dos empregados de uma fbrica o salrio mais comum, isto , o
recebido pelo maior nmero de empregados dessa fbrica.

4.5.1 MODA QUANDO OS DADOS NO ESTO AGRUPADOS

A moda facilmente reconhecida, basta, de acordo com a definio, procurar o valor que mais se
repete.

Exemplo:
Na srie {7 , 8 , 9 , 10 , 10 , 10 , 11 , 12}, a moda 10.
1. H sries nas quais no existe o valor modal, isto , no h repeties de valores.
Exemplo:
A srie {3 , 5 , 8 , 10 , 12} no apresenta moda. Ela amodal.
.Em outros casos, pode haver dois ou mais valores de concentrao. Dizemos, ento, que a
srie tem dois ou mais valores modais.
Exemplo:
A srie {2 , 3 , 4 , 4 , 4 , 5 , 6 , 7 , 7 , 7 , 8 , 9} apresenta duas modas: 4 e 7. Ela bimodal.

4.5.2 MODA QUANDO OS DADOS ESTO AGRUPADOS
a) Sem intervalos de classe
Uma vez agrupados os dados, possvel determinar imediatamente a moda: basta fixar o
valor da varivel de maior frequncia.

Exemplo: Na medio de temperatura durante o ms de junho de 2005, na cidade de Curitiba, qual a
mais recorrente?
Tabela 4.6 Ocorrncias de temperaturas em junho de 2005, na cidade de Curitiba.
Temperaturas Frequncia
0 C 3
1 C 9
2 C 12
3 C 6

Resposta: 2 C a temperatura modal, pois a de maior frequncia.
a) Com intervalos de classe

A classe que apresenta a maior frequncia denominada classe modal. Pela definio, podemos
afirmar que a moda, nesse caso, o valor dominante que est compreendido entre os limites inferior e
superior da classe modal. O mtodo mais simples para o clculo da moda consiste em tomar o ponto
mdio da classe modal. Damos a esse valor a denominao de moda bruta.
Mo = (* + L* ) / 2
Em que:
* = limite inferior da classe modal e,
L*= limite superior da classe modal.


Exemplo:
Calcule o preo modal dos pendrives de 4Gb, os preos esto dispostos na tabela a seguir:


Figura 16 - Pendrive de 4Gb

Tabela 4.7 Distribuio de Frequncia dos preos dos pendrives
Preo
R$
Frequncia
54|------ 58 9
58|------ 62 11
62|------ 66 8
66|------ 70 5

Resposta: a classe modal 58|-------- 62, pois a de maior frequncia. *=58 e L*=62
Mo = (58+62) / 2 = R$ 60 (esse valor estimado, pois no conhecemos o valor real da moda).
.
O clculo da moda tambm pode ser feito pela frmula de CZUBER. Vale a pena pesquis-lo.


ATIVIDADE 4.4

1- Calcule o tipo modal dos mouses pticos a seguir:










2- Calcule o valor modal da placa-me (mainboard ou motherboard), cujos valores esto
distribudos na tabela a seguir:

Tipo de
placa-me
Valor R$ Quantidade
Tipo 1 300 |------- 305 14
Tipo 2 305 |------- 310 46
Tipo 3 310 |------- 315 58
Tipo 4 315 |------- 320 76
Tipo 5 320 |------- 325 68
Tipo 6 325 |------- 330 62
Tipo 7 330 |------- 335 48
Tipo 8 335 |------- 340 22

3-quando queremos verificar que tipo de monitor apresentou maior nmero de defeitos,
utilizamos:

a) ( ) moda;
b) ( ) mediana;
c) ( ) mdia;
d) ( ) qualquer das anteriores.


Mouse Quantidades
Tipo 1 344
Tipo 2 234
Tipo 3 656
Tipo 4 125
Tipo 5 111
Tipo 6 256
4.6 MEDIANA (MD)

Ordenados os elementos da srie de dados, a mediana o valor (pertencente ou no srie) que a
divide ao meio e ocupa a (n+1)/2 posio na srie, isto , 50% dos elementos da srie so menores ou
iguais mediana e os outros 50% so maiores ou iguais mediana.


Emprego da Mediana
Quando desejamos obter o ponto que divide a distribuio em duas partes iguais.
Quando h valores extremos que afetam de maneira acentuada a mdia aritmtica.
A mediana usada em computao em diversas aplicaes.

Exemplo: Processamento de imagens, mantendo as propriedades das bordas da imagem(filtro
mediana). filtro de mediana um dos coringas para processamento de imagens.

4.6.1 MEDIANA PARA SRIE COM NMERO MPAR DE TERMOS

Para Srie com nmero mpar de termos a mediana pertence srie de dados.

.Exemplo:
Clculo da mediana da srie {1, 3, 0, 0, 2, 4, 1, 2, 5}:
1 - Ordenar a srie {0, 0, 1, 1, 2, 2, 3, 4, 5};
Temos n = 9; logo, a mediana ocupa a 5
a
posio, ou seja (9+1)/2 = 5 elemento da srie ser a
mediana;
Observe que a mediana pertence srie de dados.

4.6.2 MEDIANA PARA SRIE COM NMERO PAR DE TERMOS:
Para Srie com nmero par de termos a mediana no pertence srie de dados.



A mediana obtida pela mdia dos dois elementos centrais da srie.

Exemplo:

Clculo da mediana da srie {1, 3, 0, 0, 2, 4, 1, 3, 5, 6}:
1 - Ordenar a srie {0, 0, 1, 1, 2, 3, 3, 4, 5, 6};

Temos n = 10; logo, a mediana ocupa a 5,5
a
posio, ou seja (10+1)/2 = 5,5 elemento da srie ser a
mediana;

Para obter o valor 5,5
a
da srie, basta dividir os valores da 5
a
e da 6
a
posio ;
Temos:
5
a
posio = 2
6
a
posio = 3

A mediana ser a mdia desses 2 valores, ou seja Md= (2+3) / 2, ou seja, Md = 2,5 .

Observe que a mediana(2,5) no pertence srie de dados.


Notas:
Quando o nmero de elementos da srie estatstica for mpar, haver
coincidncia da mediana com um dos elementos da srie.
Em uma srie a mediana, a mdia e a moda no tm,
necessariamente, o mesmo valor.
A mediana depende da posio e no dos valores dos elementos na
srie ordenada. Essa uma das diferenas marcantes entre mediana
e mdia (que se deixa influenciar, e muito, pelos valores
extremos). Vejamos:
Em {5, 7, 10, 13, 15}, a mdia = 10 e a mediana = 10;
Em {5, 7, 10, 13, 65}, a mdia = 20 e a mediana = 10;
A mdia do segundo conjunto de valores maior do que a do primeiro por
influncia dos valores extremos, ao passo que a mediana permanece a
mesma.
.
4.6.3 MEDIANA PARA SRIE COM DADOS AGRUPADOS
a) Sem intervalos de classe:
(Caso 1) No haver nenhuma frequncia acumulada igual metade da frequncia acumulada
total.
Fci
fi
Fi =

2

No caso da mediana para srie com dados agrupados sem intervalos de classe, o bastante,
identificar a frequncia acumulada imediatamente superior metade da soma das frequncias. A
mediana ser o valor da varivel que corresponde a tal frequncia acumulada.

Exemplo:
Calcule a mediana da tabela abaixo:
Tabela 4.8 Distribuio de Frequncia

Varivel
Xi
Frequncia
fi
Frequncia acumulada
Fc
0 2 2
1 6 8
2 9 17
3 13 30
4 5 35
total 35

Como o somatrio das frequncias 35, a frmula ficar: (35+1) / 2 = 18 e no existe este valor na
freqncia acumulada(2,8,17,30,35) (30 o valor imediatamente superior a 18); logo, a mediana
ser igual a 3.
.
(Caso 2) Haver nenhuma frequncia acumulada igual metade da frequncia acumulada total.
Fci
fi
Fi = =

2

No caso de existir uma frequncia acumulada (Fci), tal que:
Fci
fi
Fi = =

2

a mediana ser dada por:
2
X X
1) Fc(i Fci +
+
= Md

.
Exemplo 1:
Calcule a mediana da tabela abaixo:
Tabela 4.9 Distribuio de Frequncia
Varivel
Xi
Frequncia
Fi
Frequncia
acumulada
Fc
12 1 1
14 2 3
15 1 4
16 2 6
17 1 7
20 1 8
total 8

Temos
2

=
fi
Fi =8/2=4, neste caso existe este valor na freqncia acumulada(1,3,4,6,7,8) logo,
a mediana ser igual:

X
Fci
=15
X
Fc(i+1)
=16

Md= [15+16)]/2 = 15,5

Md=15,5

Exemplo 2

Calcule a mediana da tabela abaixo:

Tabela 4.10 Distribuio de Frequncia
Varivel
Xi
Frequncia
Fi
Frequncia
acumulada
Fc
1 2 2
7 7 9
83 9 18
total 18

Temos
2

=
fi
Fi =18/2=9, neste caso existe este valor na freqncia acumulada(2,9,18) logo, a
mediana ser igual:

X
Fci
=7
X
Fc(i+1)
=83

Md= [7+83]/2 = 45

Md=45

b) Com intervalos de classe
Desejamos calcular a mediana da tabela abaixo, que representa os pesos de 40 alunos.
Tabela 4.10 Pesos de 40 alunos







Primeiramente, vamos incluir a frequncia acumulada na Tabela.

Tabela 4.11 Pesos de 40 alunos
Classes frequncia
fi
Frequncia
acumulada
F
50 |----- 54 4 4
54 |----- 58 9 13
58 |----- 62 11 24
62 |----- 66 8 32
66 |----- 70 5 37
70 |----- 74 3 40
Total 40
Temos:

Pesos (kg) fi
50 |------ 54 4
54 |------ 58 9
58 |------ 62 11
62 |------ 66 8
66 |------ 70 5
70 |------ 74 3
Total 40
Devemos seguir estes passos:
1) Determinamos as frequncias acumuladas;
2) Calculamos
2

fi
;
3) Marcamos a classe correspondente frequncia acumulada imediatamente superior
2

fi
. Tal
classe ser a classe mediana;
4) Calculamos a mediana pela seguinte frmula:..
*
*
*
. ) (
2
f
h ant F
fi
Md
(
(

+ =

l
Em que:
* o limite inferior da classe mediana;
F(ant) a frequncia acumulada da classe anterior classe mediana;
f* a frequncia simples da classe mediana;
h* a amplitude do intervalo da classe mediana.
20
2
40
2
= =

fi


Logo, a classe mediana ser 58 |----- 62, pois 24, correspondente a frequncia acumulada
imediatamente superior 20, veja na tabela anterior.
Assim:
* = 58 (limite inferior do intervalo)
F(ant) = 13 (frequncia acumulada inferior a 20)
f* = 11 (frequncia simples do intervalo 58 |----- 62)
h* = 4 (intervalo de classe, observe que fixo e igual a 4)

Portanto, a mediana ser:
( ) [ ]
4 .
11
13 20
58
. ) (
2
*
*
*

+ =
(
(

+ =

f
h ant F
fi
Md l

Md= 60,54 kg

Interpretao: Md = 60,54 kg

50% dos alunos, ou seja, 20 alunos, pesam menos ou igual a 60,54 kg.




ATIVIDADE 4.5

1. Calcule a marca mediana dos mouses pticos a seguir:









2. medida que tem o mesmo nmero de valores, abaixo e acima dela, :

a) ( ) a moda.
b) ( ) a mdia.
c) ( ) a mediana.
d) ( ) o lugar mediano.

Calcule a marca mediana dos teclados:









4) Calcule o tipo mediano da placa-me (mainboard ou motherboard), cujos valores esto
distribudos abaixo:

Tipo de
placa-me
Valor R$ Quantidade
Tipo 1 300 |------- 305 14
Tipo 2 305 |------- 310 46
Tipo 3 310 |------- 315 58
Tipo 4 315 |------- 320 76
Tipo 5 320 |------- 325 68
Tipo 6 325 |------- 330 62
Tipo 7 330 |------- 335 48
Tipo 8 335 |------- 340 22
Mouse Quantidades
Tipo 1 344
Tipo 2 234
Tipo 3 656
Tipo 4 125
Tipo 5 111
Tipo 6 256
Teclados Quantidades
Fabricante A 344
Fabricante B 234
Fabricante C 656
Fabricante D 125
Fabricante E 111
4.7 ASSIMETRIA

As medidas de assimetria mostram o quanto a curva de frequncia se desvia ou afasta da posio
simtrica (rea do lado esquerdo igual a rea lado direito do grfico de distribuio de frequncia).



Simetria: uma distribuio de frequncia simtrica quando a mdia, a mediana e a moda so
iguais, ou seja, apresentam um mesmo valor ou, ainda, coincidem num mesmo ponto. Neste caso,
temos o lado esquerdo igual ao lado direito.

Assimetria: uma distribuio de frequncia assimtrica quando a mdia, a mediana e a moda
recaem em pontos diferentes da distribuio, isto , apresentam valores diferentes, sendo que o
deslocamento desses pontos pode ser para a direita ou para a esquerda. Quanto ao grau de
deformao, as curvas de frequncia podem ser:

a) Simtrica Mdia = Moda
b) Assimtrica Positiva Mdia > Moda
c) Assimtrica Negativa Mdia < Moda


A Figura 4.3 a seguir ilustra os tipos de assimetria:

Figura 17 - Tipos de assimetria
ATIVIDADE 4.6

a) Determine o tipo de assimetria das sries a seguir:

1. Srie A

Estatura(m) frequncia
fi
2 |----- 6 6
6 |----- 10 12
10|----- 14 24
14|----- 18 12
18|----- 22 6
Total 60

2. Srie B

Estatura(m) frequncia
fi
2 |----- 6 6
6 |----- 10 12
10|----- 14 24
14|----- 18 30
18|----- 22 6
Total 78

3. Srie C










Estatura(m) frequncia
fi
2 |----- 6 6
6 |----- 10 30
10|----- 14 24
14|----- 18 12
18|----- 22 6
Total 78













4.8 SEPARATRIZES

As medidas separatrizes so medidas de posio e tm por finalidade dividir uma srie de dados. As
medidas separatrizes so: mediana, quartil, decil e percentil.



4.8.1 QUARTIS

Denominamos quartis os trs valores que separam a srie em 4 partes iguais.




Q1 Primeiro quartil, valor que representa os primeiros 25% dos elementos da srie;
Q2 Segundo quartil (mediana) , valor que representa os primeiros 50% dos elementos da srie;
Q3 Terceiro e ltimo quartil, valor que representa os primeiros 75% dos elementos da srie;

Quartis em dados no agrupados

Deve-se utilizar o mesmo princpio do clculo da mediana para os 3 quartis. Efetivamente, sero
calculadas "3 medianas" na mesma srie.

Exemplo1:
Calcule os quartis da srie {5, 2, 6, 9, 10, 13, 15}.
O primeiro passo a ser dado o da ordenao (crescente ou decrescente) dos valores:
{2, 5, 6, 9, 10, 13, 15}.
O valor que divide a srie acima em duas partes iguais 9; logo, a Md = 9, que ser = Q
2
.
Observe que temos agora {2, 5, 6} e {10, 13, 15} como os dois grupos de valores iguais
proporcionados pela mediana (quartil 2). Para o clculo dos quartis 1 e 3, basta calcular as medianas
das partes iguais provenientes da verdadeira Mediana da srie (quartil 2).
Logo, em {2, 5, 6} a mediana = 5. Ou seja: o quartil 1;
em {10, 13, 15} a mediana =13. Ou seja: o quartil 3.
Exemplo 2:
Calcule os quartis da srie {1, 1, 2, 3, 5, 5, 6, 7, 9, 9, 10, 13}.
A srie j est ordenada, ento calcularemos o Quartil 2 = Md = (5+6)/2 = 5,5.
O quartil 1 ser a mediana da srie esquerda de Md: {1, 1, 2, 3, 5, 5}
Q
1
= (2+3)/2 = 2,5
O quartil 3 ser a mediana da srie direita de Md: {6, 7, 9, 9, 10, 13}
Q
3
= (9+9)/2 = 9

b) Quartis para dados agrupados em classes
Usamos a mesma tcnica do clculo da mediana, bastando substituir, na frmula da mediana,
2

fi
por
4
.

fi k
.

Para determinar os quartis, devemos seguir estes passos:
1) determinamos as frequncias acumuladas;
2) calculamos
4
.

fi k
,
Sendo k o nmero de ordem do quartil;
3) calculamos a Mediana pela seguinte frmula:..
*
*
*
. ) (
4
.
f
h ant F
fi k
Qk
(
(

+ =

l
Em que:
* o limite inferior da classe mediana.
F(ant) a frequncia acumulada da classe anterior classe mediana.
f* a frequncia simples da classe mediana.
h* a amplitude do intervalo da classe mediana.


Exemplo 3:
Calcule os quartis da tabela abaixo, que representa os pesos de 40 alunos.



Tabela 4.12 Pesos de 40 alunos








Vamos calcular o primeiro quartil (Q
1
).

Primeiramente, vamos incluir a frequncia acumulada na Tabela.
Pesos (kg) fi
50 |------ 54 4
54 |------ 58 9
58 |------ 62 11
62 |------ 66 8
66 |------ 70 5
70 |------ 74 3
Total 40








Temos k=1 para o primeiro quartil

Calculamos 10
4
40 . 1
4
.
= =

fi k

Procuramos na tabela anterior a frequncia acumulada, imediatamente, superior a 10; neste caso,
temos o valor 13.





Logo, a classe do primeiro quartil 54 |------ 58,
Assim:
* = 54.
F(ant) = 4
f* = 9
h* = 4
Logo, o primeiro quartil ser:
[ ]
67 , 56 4 .
9
4 10
54
. ) (
4
.
*
*
*
1 =

+ =
(
(

+ =

f
h ant F
fi k
Q l

Q
1
= 56,66 kg

Interpretao: Q
1
= 56,66 kg
25% dos alunos pesam menos ou igual a 56,66 kg.
Ou ainda, podemos afirmar que 75% dos alunos pesam mais que 56,66 kg.

4. Vamos calcular o terceiro quartil (Q
3
):
Temos k=3
Calculamos 30
4
40 . 3
4
.
= =

fi k

Pesos (kg) fi F
50 |------ 54 4 4
54 |------ 58 9 13
58 |------ 62 11 24
62 |------ 66 8 32
66 |------ 70 5 37
70 |------ 74 3 40
Total 40
Pesos (kg) fi F
50 |------ 54 4 4
54 |------ 58 9 13 Valor imediatamente superior a 10
58 |------ 62 11 24
Logo,.a classe do terceiro quartil 62 |------ 66
Assim:
* = 62
F(ant) = 24
f* = 8
h* = 4
Logo, o terceiro quartil (Q3) ser:

[ ]
0 , 65 4 .
8
24 30
62
. ) (
4
.
*
*
*
3 =

+ =
(
(

+ =

f
h ant F
fi k
Q l

Q
3
= 65 kg

Interpretao: Q
3
= 65 kg
75% dos alunos pesam menos ou igual a 65kg.
.



4.8.2 DECIS

Denominamos decis os nove valores que separam uma srie em 10 partes iguais.




D1 Primeiro decil, valor que representa os primeiros 10% dos elementos da srie;
D2 Segundo decil, valor que representa os primeiros 20% dos elementos da srie;


D5 Quinto decil (mediana), valor que representa os primeiros 50% dos elementos da srie;
ATIVIDADE 4.7

Calcule os 3 quartis das sries a seguir:

a) Teclados:








b) Tipos de placa-me:

Tipos de
placa-me
Valor R$ Quantidade
Tipo 1 300 |------- 305 14
Tipo 2 305 |------- 310 46
Tipo 3 310 |------- 315 58
Tipo 4 315 |------- 320 76
Tipo 5 320 |------- 325 68
Tipo 6 325 |------- 330 62
Tipo 7 330 |------- 335 48
Tipo 8 335 |------- 340 22
Teclados Quantidades
Tipo 1 344
Tipo 2 234
Tipo 3 656
Tipo 4 125
Tipo 5 111
D9 Nono e ltimo decil, valor que representa os primeiros 20% dos elementos da srie;

Para o clculo dos percentis, usaremos a mesma tcnica do clculo dos quartis, bastando
substituir, na frmula,
4
.

fi k
por
10
.

fi k
.


4.8.3 PERCENTIL OU CENTIL
Denominamos percentis ou centis os noventa e nove valores que separam uma srie em 100 partes
iguais.



Indicamos: P
1
, P
2
, ... , P
99
.
evidente que P
50
= Md ; P
25
= Q
1
e P
75
= Q
3
.
Os percentis, normalmente, so usados para grandes sries de dados.

Para o clculo dos percentis, usaremos a mesma tcnica do clculo dos quartis, bastando
substituir, na frmula,
4
.

fi k
por
100
.

fi k
.
Exemplo:
Vamos calcular o 8 percentil (P
8
) da tabela abaixo, que representa os pesos de 40 alunos:

Tabela 4.13 Pesos de 40 alunos








Pesos (kg) fi
50 |------ 54 4
54 |------ 58 9
58 |------ 62 11
62 |------ 66 8
66 |------ 70 5
70 |------ 74 3
Total 40
Novamente, vamos incluir a frequncia acumulada na Tabela.







Temos k=8
Calculamos 2 , 3
100
40 . 8
100
.
= =

fi k

Logo,.a classe do 8 percentil 50 |------ 54
Assim:
* = 50
f* = 4
h* = 4
Logo, o 8 percentil (P
8
) ser:
P
8
= 53,2 kg

Interpretao: P
8
= 53,2 kg
8% das pessoas pesam menos ou igual a 53,2kg.


Pesos (kg) fi F
50 |------ 54 4 4
54 |------ 58 9 13
58 |------ 62 11 24
62 |------ 66 8 32
66 |------ 70 5 37
70 |------ 74 3 40
Total 40
F(ant) = 0



Cuidado! Sempre a frequncia acumulada anterior da primeira classe ser
zero.


ATIVIDADE 4.8

1- Calcule o 16
o
, o 29
o
e o 73
o
percentis das sries a seguir:

a) Teclados:








b) Tipos de placa-me:

Tipos de
placa-me
Valor R$ Quantidade
Tipo 1 300 |------- 305 14
Tipo 2 305 |------- 310 46
Tipo 3 310 |------- 315 58
Tipo 4 315 |------- 320 76
Tipo 5 320 |------- 325 68
Tipo 6 325 |------- 330 62
Tipo 7 330 |------- 335 48
Tipo 8 335 |------- 340 22


Teclados Quantidades
Tipo 1 344
Tipo 2 234
Tipo 3 656
Tipo 4 125
Tipo 5 111



























ATIVIDADE 4.8

Aps construir o histograma e a curva polida do seu trabalho prtico, calcule
a mdia, a mediana, o primeiro, o segundo e o terceiro quartis, alm dos
percentis (P
15
,P
25
,P
35
,P
50
,P
75
e P
80
), determinando tambm o tipo de
assimetria que o histograma apresenta.

Chegamos ao final deste captulo, no qual aprendemos a calcular as medidas
de ordenamento e posio. importante que esse contedo esteja bem
compreendido; caso contrrio, faa uma reviso, pois ele ser necessrio
para entender os prximos contedos.

Vamos para o captulo 5!

Prof. Sebastio A. Carneiro
CAPTULO 5
MEDIDAS DE VARIABILIDADE



Ser que a mdia uma medida suficiente para caracterizar uma srie de dados?

Veja o exemplo a seguir:

Exemplo 1:

Observe o trfego de dados numa rede de computadores: em uma hora h trfego de dados a 49
Mbps(rpida) e na prxima hora h trfego de dados a 51 Mbps(rpida tambm), enquanto que em
outra rede uma hora o trfego de dados 1 Mbps (muito lenta) e na prxima hora o trfego de
dados 99 Mbps(muito rpida).

49Mbps 49Mbps
51Mbps 51Mbps
01:00h
02:00h

Figura 18 Dois computadores se comunicando a 49 Mbps e 51 Mbps

Ol, Turma!

Neste captulo, veremos que a mdia no suficiente para identificar uma srie de dados.
Devemos encontrar uma medida que nos mostre a forma como os elementos da srie se
distribuem, dispersam-se ou variam em torno da mdia.

Bons estudos!
Prof. Sebastio A. Carneiro
1Mbps 1Mbps
99Mbps 99Mbps
01:00h
02:00h

Figura 19 Dois computadores se comunicando a 1 Mbps e 99 Mbps



As duas redes tm a mesma mdia de comunicao de dados nas 2 horas de comunicao, 50 Mbps,
mas em condies diferentes: observe que a primeira rede mais estvel que a segunda.


Portanto, temos a mesma mdia, mas em condies diferentes.



MEDIDAS DE DISPERSO

Disperso ou Variabilidade:

a maior ou a menor diversificao dos valores de uma varivel em torno de um valor de
tendncia central (mdia ou mediana) tomado como ponto de comparao.

A mdia o valor que melhor representa uma srie de valores, mas ela, por si s, no pode destacar o
grau de homogeneidade ou heterogeneidade existente entre os valores que compem o conjunto. Por
esse motivo, precisamos de mais elementos que concretizem bem uma srie de valores.

Consideremos os seguintes conjuntos de valores das variveis X, Y e Z:

Por esse motivo, vamos estudar o conceito de variabilidade, pois, se algum pedisse para voc
escolher, qual voc escolheria?Embora a mdia de trfego das duas redes de computadores seja
50 Mbps. A responda, com certeza, seria uma rede mais estvel (Figura 5.1), pois varia menos.
Assim, veremos a seguir como quantificar as variaes das sries em torno da mdia.

X = { 5, 5, 5, 5, 5 } 5 = X
Y = { 3, 4, 5, 6, 7 } 5 = Y
Z = { 0, 1, 5, 9, 10 } 5 = Z


Observe que os trs conjuntos apresentam a mesma mdia aritmtica (25/5 = 5). Entretanto, fcil
notar que o conjunto X mais homogneo que os conjuntos Y e Z. O conjunto Y, por sua vez, mais
homogneo que o conjunto Z.


5.1 MEDIDAS DE DISPERSO ABSOLUTA

5.1.1 Amplitude total (AT):

a) Para uma srie de dados, a amplitude total a diferena entre o maior e o menor valor observado:

AT = X mximo - X mnimo.


Exemplo:

Para os valores 4, 5, 8, 2 e 17 a amplitude total ser: AT = 17 - 14 = 13

b) Para uma srie de dados, mesmo quando os dados esto agrupados sem intervalos de classe, ainda
temos:

AT = X mximo - X mnimo


Exemplo:

Para os dados seguintes, agrupados sem intervalos, a amplitude total ser:

Tabela 5.1 dados agrupados sem intervalos







AT = 14 - 10 = 4

c) Para uma srie de dados com intervalos de classe, a amplitude total ser o limite superior da ltima
classe e o limite inferior da primeira classe. Logo:
AT = L mximo - l mnimo

Exemplo:

Para os dados agrupados em intervalos de classe conforme a seguir, a amplitude total ser:

Tabela 5.2 Dados agrupados em intervalos de classe.

Xi Fi
10 11
11 6
13 5
14 13





AT = 26 - 10 = 16



A amplitude total tem o inconveniente de s levar em conta os dois valores
extremos da srie.

a nica medida de disperso que no tem na mdia o ponto de referncia.




5.1.2 VARINCIA

Varincia a medida que considera a totalidade dos valores da varivel em estudo. Baseia-se nos
desvios em torno da mdia.

a) VARINCIA DA POPULAO (
2
)

A varincia de uma populao, que representaremos por
2
, a mdia aritmtica dos quadrados
dos desvios absolutos.
n
d

=
2
2

Sabemos que:

d= xi -

Em que:

- Mdia aritmtica da populao, representada por uma srie x
i,
em que i = 1, 2, ....,n

Logo:

( )
n
xi


=
2
2



Tambm pode ser representada deste modo:

( )
2
1
2
1

=
=
n
i
xi
n



b) VARINCIA DA AMOSTRA (s
2
)

Classes fi
10 |------ 16 4
16 |------ 22 5
22|-------26 2
Se o conjunto das observaes uma amostra estatstica, teremos, neste caso, a varincia amostral e
a representaremos por
2
s ; sua mdia representada por X .

A varincia de uma amostra, que representaremos por
2
s , dada conforme indicao a seguir:
1
2
2

=

n
d
s
Sabemos que:

d= xi - x

Em que:
x - Mdia aritmtica da amostra, representada por uma srie x
i ,
, em que i = 1, 2, ....,n

Logo:

( )
1
2
2

=

n
x xi
s

Tambm pode ser representada deste modo:

( )
2
1
2
1
1

=
n
i
x xi
n
s

No clculo da varincia de uma amostra, devemos dividir a soma dos desvios quadrticos por (n-1)
e no n, para que o valor esperado da varincia seja o melhor estimador da variabilidade do
conjunto de dados.



c) VARINCIA PARA SRIE DE DADOS SIMPLES


Exemplo:

Clculo da varincia da amostra representada por - 2 cm , -1 cm, 0 cm , 1 cm , 4 cm.

Primeiramente, devemos calcular a mdia:

4 , 0
5
2
= = =

n
Xi
X

O passo seguinte calcular os desvios e seus quadrados. Acompanhe a tabela a seguir:


Tabela 5.3 Desvios e seus quadrados de uma srie de dados.



Xi
x d= xi - x d
2
=
2
) ( x xi
- 2 0,4 - 2,4 5,76
- 1 0,4 - 1,4 1,96









Temos n = 5, a varincia fica:

( )
2
2
2
3 , 5
4
2 , 21
1 5
2 , 21
1
cm
n
x xi
s = =

=



Propriedades:

PROPRIEDADE 1

Quando somamos ou subtramos uma constante (k) a todos os valores de uma varivel, a sua
varincia fica inalterada, pois a varincia de uma constante igual a zero.

PROPRIEDADE 2

Quando multiplicamos ou dividimos todos os valores de uma varivel por uma constante (k), a
sua varincia fica multiplicada ou dividida pelo quadrado da constante.




ATIVIDADE 5.1

1) Marque a opo correta: Para a srie amostral de valores 0, -1, -2, 5, 4, -3, -7, 2, -4 e 6:
a. ( ) a mdia 3,4 e a varincia, 17,8.
b. ( ) a mdia zero e a varincia, 16.
c. ( ) a mdia 3,4 e a varincia, 4.
d. ( ) a mdia zero e a varincia, 17,8.
e. ( ) a mdia zero, mas impossvel calcular a varincia.

2) Faa uma anlise visual e observe qual srie mais dispersa:

X: 10,11,12,13 e
Y: 1, 110, 120, 130

Agora, comprove a sua afirmao.

3) Calcule a varincia da srie amostral: 3 kg, 4kg e 7kg, indicando o valor correto dentre
as opes a seguir:
a) ( ) 4,3 kg
b) ( ) 2,9 kg
c) ( ) 2,9 kg
2

d) ( ) 4,3 kg
2


4) Calcule a varincia, considerando os dois casos, populao e a mostra, da srie 31
Kbytes, 38 Kbytes , 19 Kbytes , 27 Kbytes , 24 Kbytes, 42 Kbytes , 32 Kbytes , 18
Kbytes , 43 Kbytes , 15 Kbytes, 39 Kbytes, indicando o valor correto dentre as opes a
0 0,4 - 0,4 0,16
1 0,4 0,6 0,36
4 0,4 3,6 12,96

2 , 21 ) (
2
=

x xi
seguir:
a) ( ) S
2
=90,7 Kbytes e
2
=99,8 Kbytes
b) ( ) S
2
=90,7 Kbytes
2
e
2
=99,8 Kbytes
2

c) ( ) S
2
=90,7 e
2
=99,8
d)
( ) S
2
=99,8 Kbytes
2
e
2
=90,7 Kbytes
2

5)- Suponha que adicionamos 500 a cada um dos valores de uma amostra. O que acontece
com a mdia, desvio mdio e a varincia?


D) VARINCIA PARA DISTRIBUIO DE FREQUNCIA -
2

Quando os dados estiverem agrupados em intervalos de frequencia, a varincia calculada
conforme a seguir:

( )


=
fi
fi xi .
2
2



Exemplo:

Clculo da varincia da srie a seguir, que representa a variao interna de computadores em
o
C:

X: 0,0,1,1,1,1,1,1,2,2,2,2,2,2,2,2,2,2,2,2,3,3,3,3,3,3,3,4,4,4

Considerar os dados como populacional

Inicialmente, montar a DF:
Tabela 5.4 Distribuio de frequncia







Em seguida, calcular a mdia:
Tabela 5.5 Distribuio de frequncia com Xi Fi










= = =

30
63
.
fi
fi Xi
2,1C


Montar a tabela a seguir para facilitar os clculos:

Xi f i
0 2
1 6
2 12
3 7
4 3
xi f i xi.f i
0 2 0
1 6 6
2 12 24
3 7 21
4 3 12
fi =30 xi.fi= 63
Tabela 5.6 Distribuio de frequncia com (xi- )
2
. f i











Usamos a frmula a seguir para calcular a varincia:

( )
( )
2
0
2
2
09 , 1
30
7 , 32
.
C
fi
fi xi
= =




Outra maneira de calcular a varincia populacional desenvolver o somatrio:

( )
( )
n
xi
xi x xi
2
2
2


=


Tente resolver essa igualdade!
Assim, a varincia para dados no agrupados fica:

( )
2
2
2
2
2
|
|

\
|
=

n
xi
n
xi
n
n
xi
xi


E para dados agrupados, a varincia na populao fica:

2
2
2
.
|
|

\
|
=

n
fi xi
n
fi xi

ou

2
2
2
.
|
|

\
|
=

fi
fi xi
fi
fi xi



Para calcular a varincia de dados agrupados amostrais, bastar substituir o denominador n por
(n-1) ou fi por fi-1

Uma das vantagens de calcular a varincia dessa forma o fato de no usar a mdia, pois a
mdia em alguns casos tem que ser arredondada, o que gera erros de arredondamento. Nos
casos em que a mdia no arredondada, as duas frmulas fornecem o mesmo resultado.



Exemplo:

Xi f i xi- (xi- )
2
(xi- )
2
f i

0 2 -2,1 4,41 8,82
1 6 -1,1 1,21 7,26
2 12 -0,1 0,01 0,12
3 7 0,9 0,81 5,67
4 3 1,9 3,61 10,83
fi =30 32,7
Resoluo do exemplo anterior, usando a segunda maneira de calcular a varincia:

Montar a tabela a seguir:

Tabela 5.7 Distribuio de frequncia com xi
2
f i









Calcular a varincia:

( )
2
0
2
2
2
2
09 , 1
30
63
30
165
.
C
n
fi xi
n
fi xi
=
|

\
|
=
|
|

\
|
=




Observou? Como no houve arredondamento na mdia, os dois valores da varincia so
idnticos, como j era esperado.

ATIVIDADE 5.2

2) Calcule a varincia populacional das distncias a seguir:









2m 13m 15m 20m
2m 13m 15m 20m
2m 13m 15m 20m
2m 13m 15m 20m
2m 13m 15m 20m
2m 13m 15m 20m
2m 13m 15m 20m
2m 13m 15m 20m
2m 13m 15m
2m 13m 15m
2m 13m 15m
13m 15m
13m 15m
13m 15m
13m 15m
13m 15m
13m 15m
13m 15m
13m
13m

xi xi
2
f i xi . f i xi
2
. f i
0 0 2 0 0
1 1 6 6 6
2 4 12 24 48
3 9 7 21 63
4 16 3 12 48
Total fi =30 xi.fi= 63 xi
2
. f i =165

Observe que a unidade da srie est elevada ao quadrado (
o
C)
2
, o que, sob o
ponto de vista prtico, um inconveniente. Por esse motivo, imaginou-se
uma nova medida com utilidade e interpretao prtica.

A varincia, na verdade, uma medida que tem pouca utilidade como
estatstica descritiva pois amplifica os desvios, alm de apresentar sua
unidade ao quadrado; porm, extremamente importante na inferncia
estatstica, alm de ser base para o conceito de desvio padro.




5.1.3 DESVIO PADRO S

O desvio padro, que representado por s, a medida de disperso mais empregada no clculo de
variabilidade, pois elimina a amplificao dos desvios e sua unidade a mesma da srie de dados.

O desvio padro por definio simplesmente a raiz quadrada positiva da varincia.

2
s s =

Assim, todas as frmulas de varincia so utilizadas no clculo de desvio padro; basta, claro,
tirar a raiz quadrada positiva das frmulas da varincia.

Exemplo:

Clculo do desvio padro populacional da srie seguinte, que representa a variao interna de
computadores em
o
C:

X: 0,0,1,1,1,1,1,1,2,2,2,2,2,2,2,2,2,2,2,2,3,3,3,3,3,3,3,4,4,4

Como j calculada no exemplo anterior, a varincia da srie s
2
=1,09 (
o
C)
2


O desvio padro a raiz quadrada de
2
=1,09 (
o
C)
2
, ou seja:

= = = C) ( 1,09
2 o 2
1,04
o
C

O desvio padro possui algumas propriedades, dentre as quais destacamos:


PROPRIEDADE 1

Se somarmos, ou subtrairmos, uma constante(k) a todos os valores da srie, o desvio padro no
se altera.

yi= xi k Sy =Sx ou sy = sx

Exemplo:

Y= { 11,12,13,14} e X= {1,2,3,4} Y = 10 + X : Sy = Sx = 1,118

Observe: Sy = Sx

PROPRIEDADE 2

Se multiplicarmos, ou dividirmos uma constante(k) a todos os valores da srie por uma constante
(diferente de zero), o desvio padro fica multiplicado, ou dividido, por essa constante.

yi= xi . k sy = sx . k ou sy= sx . k
Exemplo:

Y= { 10,20,30,40} e X= {1,2,3,4} Y = 10.X : Sy = 11,18 e Sx = 1,118

Observe: Sy = 10. Sx



ATIVIDADE 5.3

1- Marque a opo correta: Dados os conjuntos de nmeros: A = {-2, -1, 0, 1, 2} e B = {220,
225, 230, 235, 240}.
Podemos afirmar, de acordo com as propriedades do desvio padro, que o desvio padro de B
igual:
a) ( ) ao desvio padro de A;
b) ( ) ao desvio padro de A, multiplicado pela constante 5;
c) ( ) ao desvio padro de A, multiplicado pela constante 5;
d) ( ) ao desvio padro de A mais a constante 230.

2- Considere os seguintes conjuntos de nmeros:
A = {10, 20, 30, 40, 50}
B = {100, 200, 300, 400, 500}
Que relao existe entre os desvios padres dos dois conjuntos de nmeros?

3- Dados os conjuntos de nmeros:
A = {220, 230, 240, 250, 260}
B = {20, 30, 40, 50, 60}
Que relao existe entre os desvios padres dos dois conjuntos de nmeros?

4- Suponha que adicionamos 100 a cada um dos valores de uma amostra. O que acontece com a
mdia, desvio mdio, varincia e o desvio padro?

5- Marque a opo correta: O desvio padro de um conjunto de dados 9. A varincia ser:

a) ( ) 3;
b) ( ) 18;
c) ( ) 36;
d) ( ) 81.
6- Marque a opo correta: A varincia de um conjunto de dados 9. desvio padro ser:

a) ( ) 3;
b) ( ) 18;
c) ( ) 36;
d) ( ) 81.




Na estatstica descritiva, o desvio padro por si s tem limitaes. Veja o exemplo:
Um desvio padro de 2 unidades pode ser considerado pequeno para uma srie de valores cujo
valor mdio 200; no entanto, se a mdia for igual a 20, o mesmo no pode ser dito. Alm disso, o
fato do desvio padro ser expresso na mesma unidade dos dados limita o seu emprego quando
desejamos comparar duas ou mais sries de valores, expressas em unidades diferentes.

Veja outro exemplo:
O desvio padro da temperatura interna de computadores 2,5
o
C, enquanto o desvio padro dos
preos desses computadores de R$ 30,00. A pergunta em relao variabilidade , quem variou
mais a temperatura interna dos computadores ou os preos?

Para contornar essas dificuldades e limitaes, iremos definir a seguir o Coeficiente de Variao
de Pearson - CVP.


5.1.4 COEFICIENTE DE VARIAO DE PEARSON - CVP

O coeficiente de variao de Pearson contorna as limitaes de comparao de sries diferentes do
desvio padro.


O Coeficiente de Variao de Pearson a razo entre o desvio padro e a mdia referente a dados
de uma mesma srie:

(%) 100 .
x
s
CVP =


Exemplo:

Vamos tomar os resultados das estaturas e dos pesos de um grupo de indivduos:

Tabela 5.8 Estaturas e pesos de um grupo de alunos






Qual das duas medidas, estatura ou peso, apresenta maior variabilidade?

Resposta:

Observe que no podemos compar-las, pois so sries diferentes; para resolver o problema, basta
calcular o CVP da estatura e o CVP do peso. O resultado maior ser o mais heterogneo (maior
disperso ou variabilidade).


CVP estatura = ( 5 / 175 ) x 100 = 2,86 %
CVP peso = ( 2 / 68 ) x 100 = 2,94 %.
DISCRIMINAO MDIA DESVIO PADRO
ESTATURAS 175 cm 5,0 cm
PESOS 68 kg 2,0 kg

Logo, nesse grupo de alunos, os pesos apresentam maior grau de disperso que as estaturas.
(Se tomssemos somente o desvio padro para responder a pergunta, teramos, com certeza, uma
resposta errada).

Observe! A srie estatura apresenta maior desvio padro; mesmo assim, mais homognea que a
srie peso, que apresenta menor desvio padro.


ATIVIDADE 5.4



1- A renda mdia mensal na localidade A R$ 1.750,00 e na localidade B R$ 1.500,00. Os
desvios padres so R$ 100,00 e R$ 80,00. Faa uma anlise comparativa quanto ao grau de
homogeneidade da renda nessas duas localidades.

2- Um grupo de 95 moas tem estatura mdia de 160,6 cm, com um desvio padro igual a 5,97
cm. Outro grupo de 128 moas tem uma estatura mdia de 161,9 cm, com um desvio padro
igual a 6,01 cm. Qual o coeficiente de variao de cada um dos grupos? Qual o grupo mais
homogneo?

3- Um grupo de 200 famlias tem renda mdia de R$ 1.063,8, com um coeficiente de variao de
4,3%. Qual o desvio padro da renda desse grupo?

4- Uma distribuio apresenta as seguintes estatsticas: S = 2,6 e CVP = 1,9%. Determine a
mdia dessa distribuio.

5- Numa pequena cidade, 165 famlias tm a renda mdia de R$ 1.350,98, com um desvio padro
de R$ 55,98. Qual a variabilidade relativa das famlias?

6- Ao se formar voc obteve duas ofertas de empregos de empresas de informtica . Qual a
empresa representa a melhor opo? Porque?


Empresa 1 Empresa 2
Mdia Salarial R$ 3900,00 R$ 4500,00
Mediana R$ 3500,00 R$ 2700,00
Desvio Padro R$ 117,00 R$ 225,00






ATIVIDADE 5.5

Aps construir o histograma e a curva polida do seu trabalho prtico, calcule a mdia, a mediana
e o primeiro, o segundo e o terceiro quartis; calcule tambm os percentis (P
15
,P
25
,P
35
,P
50
,P
75
e
P
80
) e o coeficiente de variao de Pearson.

Chegamos ao final deste captulo, em que aprendemos a calcular as medidas de variabilidade.
Observe, no exemplo mostrado no incio do captulo, envolvendo os trfegos de dados de duas
redes de computadores, que temos:

Primeiro caso:

2 computadores que se comunicam a 49 Mbps e 51 Mbps

Velocidade mdia = 50 Mbps

e desvio padro = 1 Mbps

Segundo caso:

2 computadores que se comunicam a 1 Mbps e 99 Mbps

Velocidade mdia = 50 Mbps

e desvio padro = 49 Mbps

Ou seja, no primeiro caso teremos uma mdia de 50 Mbps com uma pequena variao de
velocidade (desvio padro = 1Mbps), enquanto que no segundo caso temos tambm a mesma
mdia de 50 Mbps, s que neste caso com uma grande variao de velocidade (desvio padro =
49 Mbps). Embora j no incio, intuitivamente, voc tenha percebido o conceito de
variabilidade, para esse exemplo simples, o desvio padro na realidade quantifica a
variabilidade para qualquer srie de dados, e a sim voc poder comparar os dados.

Concluindo, a mdia no uma medida suficiente por si s, necessita-se de mais informaes
para se representar uma srie de dados.


Vamos adiante!

Prof. Sebastio A. Carneiro
CAPTULO 6


6.1 INTRODUO
Em diversas investigaes deseja-se avaliar a relao entre duas medidas
quantitativas. Por exemplo, o uso do cigarro e incidncia do cncer ou cncer ou consumo
e a renda familiar.
Procuramos at agora descrever a distribuio de valores de uma nica varivel. Assim,
calculamos as medidas de tendncia central e variabilidade.
Quando temos duas ou mais variveis, temos um novo problema: as relaes que podem
existir entre as variveis estudadas. Nesse caso, as medidas estudadas no so eficientes.
Assim, quando consideramos variveis como peso e altura de um grupo de pessoas, uso do
cigarro e incidncia do cncer, vocabulrio e compreenso da leitura, domi nnci a e submisso,
procuramos verificar se existe alguma relao entre as variveis de cada um dos pares e qual o grau
dessa relao. Para isso, necessrio o conhecimento de novas medidas.
Sendo a relao entre as variveis de natureza quantitativa, a correlao c o instrumento
adequado para descobrir e medir essa relao.
Uma vez caracterizada a relao, procuramos descrev-la atravs de uma funo matemtica. A
regresso o instrumento adequado para a determinao dos parmetros dessa funo.
NOTA:
No nosso curso ficaremos restritos s relaes entre duas vari vei s (correlao simples).
6.2 CORRELAO
6.2.1. Relao funcional
Sabemos que o permetro de uma circunferncia e o seu raio esto relacionados. A relao
entre os dois perfeitamente definida e pode ser expressa por meio de uma sentena
matemtica:
C = 2 . R
Em que:
C o permetro de uma circunferncia
R o raio da circunferncia
Vemos que esta relao exata, portanto, uma relao funcional.

6.2.2 Relao Estatstica

Quando existe uma relao entre as variveis que no exata, veja o exemplo:
A relao entre o peso e a altura de um grupo de pessoas. Observamos facilmente que a ligao entre
peso e altura no to precisa quanto ligao entre o raio e a rea de um crculo, porm, em mdia
quanto maior a altura, maior o peso.


6.2.3 Correlao
Quando duas variveis esto ligadas por uma relao estatstica, dizemos que existe correlao entre
elas. A correlao, ento, a verificao da existncia e do grau de relao entre duas variveis.

Assim As relaes do ti po raio e a rea de um crculo so conhecidas como relaes
funcionais e as do tipo peso e estatura so conhecidas como relaes estatsticas.


6.2.4 Diagrama de Disperso

Diagrama de Disperso uma forma simples de verificar a tendncia da correlao existente.

Consideremos uma amostra aleatria, formada por dez dos 183 alunos(s alunos do sexo
masculinos) do curso de Engenharia de Controle e automao:

Tabela 1
Quantidade Aluno Altura Peso
1 1 160 65
2 22 163 67
3 138 167 68
4 34 168 69
5 11 169 74
6 67 171 71
7 87 173 72
8 90 175 74
9 56 176 77
10 74 178 76

Se plotarmos os dados amostrais num sistema cartesiano ortogonal de pares ordenados,
obteremos o grfico a seguir:











Os pares de valores das duas variveis colocados num diagrama cartesiano chamamos de
diagrama de disperso

A vantagem de construir um diagrama de disperso est em que, muitas vezes uma simples
observao j nos d uma idia bastante clara de como as duas variveis se relacionam.

Uma vez caracterizada esta relao, procura-se descrev-la sob forma matemtica, atravs de
uma funo no nosso exemplo temos uma reta imagem. A estimao dos parmetros dessa
funo matemtica o objeto da regresso que veremos a seguir.













A correlao pode ser:
linear positiva se os pontos do diagrama tm como "imagem" uma reta ascendente;
linear negativa se os pontos tm como "imagem" uma reta descendente;
no-linear se os pontos tm como "imagem" uma curva.
Se os pontos apresentam-se dispersos, no oferecendo uma "imagem" definida, conclumos que
no h relao alguma entre as variveis em estudo.

Algumas situaes que podem se apresentar os diagramas de disperso











6.3. Coeficiente de correlao linear
Empregamos para a medir a correlao linear o coeficiente de correlao. Esse coeficiente deve
indicar o grau de intensidade da correlao entre as duas variveis e o sentido da correlao (positivo
ou negativo).

Usaremos o coeficiente de correlao de Pearson, que dado de acordo com a frmula a seguir:




=
] ) ( . ][ ) ( . [
) ).( ( .
2 2 2 2
i i i i
i i i i
y y n x x n
y x y x n
r


Em que:
n o nmero de observaes.

O coeficiente de correlao de Pearson ( r ) assume valores limites de -1 a +1, assim, o valor
de r pertence ao intervalo [-1, +1].


Pode-se verificar que:
a. se a correlao entre duas variveis perfeita e positiva, ento r = +1;
b. se a correlao perfeita e negativa, ento r = -1;
c. se no h correlao entre as variveis, ou a relao no linear ento r = 0.
NOTAS:
Para que uma relao possa ser descrita por meio do coeficiente de correlao de Pearson
imprescindvel que ela se aproxime de uma funo linear. Uma maneira prtica de verificarmos a
linearidade da relao a inspeo do diagrama de disperso.

Analise do comportamento simultneo das variveis

Se 0,6 | r | 1 h uma forte correlao entre as variveis analisadas
Se 0,3 | r | 0,6 h uma correlao fraca entre as variveis analisadas
Se 0 | r | 0,3 no h uma correlao entre as variveis analisadas ou nada podemos con-
cluir sobre a relao entre as variveis.

Exemplo 1:

Calcular o coeficiente de correlao relativo do exemplo dado na tabela a seguir.









Quantidade Aluno Altura Peso
1 1 160 65
2 22 163 67
3 138 167 68
4 34 168 69
5 11 169 74
6 67 171 71
7 87 173 72
8 90 175 74
9 56 176 77
10 74 178 76
Resoluo: O modo simples para obtermos r criarmos novas colunas na tabela correspondentes aos
valores de x
i
y
i
, x
2
e y
2
. Assim:


Altura (xi) Peso (yi) xi . yi xi
2
yi
2

160 65 10400 25600 4225
163 67 10921 26569 4489
167 68 11356 27889 4624
168 69 11592 28224 4761
169 74 12506 28561 5476
171 71 12141 29241 5041
173 72 12456 29929 5184
175 74 12950 30625 5476
176 77 13552 30976 5929
178 76 13528 31684 5776
xi= 1700 yi= 713 xi .yi= 121402 xi
2
= 289298 yi
2
= 50981















Como r= 0,927 h uma forte correlao entre as variveis analisadas, pois 0,6 | r | 1



Exemplo 2:

Calcular o coeficiente de correlao relativo do exemplo dado na tabela a seguir.




=
] ) ( . ][ ) ( . [
) ).( ( .
2 2 2 2
i i i i
i i i i
y y n x x n
y x y x n
r
Quantidade xi yi
1 20 64
2 16 61
3 34 84
4 23 70
5 27 88
6 32 92
7 18 72
8 22 77

Resoluo: O modo simples para obtermos r criarmos novas colunas na tabela correspondentes
aos valores de x
i
y
i
, x
2
e y
2
. Assim:

n (xi) (yi) xi . yi xi
2
yi
2

1 20 64 1280 400 4096
2 16 61 976 256 3721
3 34 84 2856 1156 7056
4 23 70 1610 529 4900
5 27 88 2376 729 7744
6 32 92 2944 1024 8464
7 18 72 1296 324 5184
8 22 77 1694 484 5929
n= 8 xi= 192 yi= 608 xi .yi= 15032 xi
2
= 4902 yi
2
= 47094













Como r= 0,862 h uma forte correlao entre as variveis analisadas, pois 0,6 | r | 1




=
] ) ( . ][ ) ( . [
) ).( ( .
2 2 2 2
i i i i
i i i i
y y n x x n
y x y x n
r
Exemplo 3:

Calcular o coeficiente de correlao relativo do exemplo dado na tabela a seguir.

Quantidade xi yi
1 1 60
2 2 51
3 3 95
4 4 70
Resoluo: O modo simples para obtermos r criarmos novas colunas na tabela correspondentes
aos valores de x
i
y
i
, x
2
e y
2
. Assim:



n (xi) (yi) xi . yi xi
2
yi
2

1 1 60 60 1 3600
2 2 51 102 4 2601
3 3 95 285 9 9025
4 4 70 280 16 4900
n= 4 xi= 10 yi= 276 xi .yi= 727 xi
2
= 30 yi
2
= 20126




Como r= 0,503 h uma fraca correlao entre as variveis analisadas, pois 0,3 | r | 0,6



ATIVIDADE 6.1


1) Considere os resultados de 2 grandezas fsicas, X(Temperatura) e Y(Presso), obtidos num
laboratrio de calibragem:

Temperatura (
o
C) 50 55 60 65 70 75 80 85 90
Presso(kgf/cm) 20 35 37 42 37 52 50 68 66


a)Verifique, pelo diagrama, se existe correlao retilnea.
b) Em caso afirmativo, calcule o coeficiente de correlao.



6.3 REGRESSO
6.3.1. Ajustamento da reta
Em regresso linear simples desejamos estudar determinada varivel em funo de outra,
utilizamos para isso a anlise de regresso.
A anlise de regresso tem por objetivo descrever, atravs de um modelo matemtico, a relao
entre as duas variveis, partindo de n observaes entre as mesmas.
Quando estamos analisando o comportamento de duas variveis a varivel na qual desejamos
fazer uma estimativa recebe o nome de varivel dependente e a outra recebe o nome de varivel
independente.
Para a determinao dos parmetros utilizaremos o mtodo dos mnimos quadrados
Mtodo dos Mnimos Quadrados
o mtodo mais utilizado para ajustar uma linha reta a um conjunto de pontos, pois utiliza a tcnica
dos mnimos quadrados. A reta resultante tem duas caractersticas importantes: (1
a
) aa soma dos
desvios verticais dos pontos em relao reta zero, e (2
a
) a soma dos quadrados desses desvios
mnima, ou seja, nenhuma outra reta apresenta uma menor soma de quadrados de tais desvios.
Para o nosso exemplo podemos considerar a altura como a varivel independente(X) e o peso a
varivel como a dependente(Y), Nosso problema agora consiste em determinar o ajustamento de uma
reta relao entre essas duas variveis, ou seja, vamos obter uma funo definida por:
Reta de regresso linear
= a . X + b
Em que :
a e b so os parmetros.
Calculo do parmetro a:






=
2 2
) ( .
) ).( ( .
i i
i i i i
x x n
y x y x n
a
Calculo do parmetro b:



Em que :

a mdia da varivel Y.

a mdia da varivel X.

Ou seja:






Exemplo 4:


Estabeleca a equao de regressso da altura (X) sobre o peso (Y) do exemplo 1

















Resoluo:
Devemos obter:

Clculo do parmetro a:

Quantidade Aluno Altura Peso
1 1 160 65
2 22 163 67
3 138 167 68
4 34 168 69
5 11 169 74
6 67 171 71
7 87 173 72
8 90 175 74
9 56 176 77
10 74 178 76




Devemos reutilizar a Tabela feita no exemplo 1:

Altura (xi) Peso (yi) xi . yi xi
2
yi
2

160 65 10400 25600 4225
163 67 10921 26569 4489
167 68 11356 27889 4624
168 69 11592 28224 4761
169 74 12506 28561 5476
171 71 12141 29241 5041
173 72 12456 29929 5184
175 74 12950 30625 5476
176 77 13552 30976 5929
178 76 13528 31684 5776
xi= 1700 yi= 713 xi .yi= 121402 xi
2
= 289298 yi
2
= 50981










Clculo do parmetro b:









b= -38,23



=
2 2
) ( .
) ).( ( .
i i
i i i i
x x n
y x y x n
a
Assim, temos a equao da reta:




Plotando a reta imagem teremos a Figura a seguir:





6.3.2 Interpolao e extrapolao
Na regresso, os valores Y so preditos com base em valores dados ou conhecios de X.

Ou seja, basta atribuir valores a X e obter atravs da equao Y = a . X +b o valor de Y.

Exemplo 5:

Considerando os dados do exemplo 1, qual o peso de um aluno de 162 cm ?
Resoluo:
Podemos observar que tal altura no existe na Tabela do exemplo 1, neste caso vamos lanar
mo da reta imagem para resolver o problema.

X= 162 Y = 0,644 . X 38,23 = 0,644 . 162 38,23 = 66,1 kg

Assim, para um aluno que tem 162 estimamos que ele deve pesar 66,1 kg

Observe que o valor 162 pertence ao intervalo de altura dado na Tabela [160 178 ], dizemos
neste caso que fizemos uma interpolao.

162 [160 178 ] interpolao

Exemplo 6:

Considerando os dados do exemplo 1, qual o peso de um aluno de 158 cm ?
Resoluo:
Podemos observar que tal altura no existe na Tabela do exemplo 1, neste caso vamos lanar
mo da reta imagem para resolver o problema.

X= 158 Y = 0,644 . X 38,23 = 0,644 . 158 38,23 = 63,5 kg

Assim, para um aluno que tem 158 estimamos que ele deve pesar 63,5 kg

Observe que o valor 158 no pertence ao intervalo de altura dado na Tabela [160 178 ],
dizemos neste caso que fizemos uma extrapolao.

158 [160 178 ] extrapolao

IMPORTANTE:
Devemos ter o cuidado de s usar a extrapolao em casos onde as consideraes tericas ou
experimentais demonstrem a sua possibilidade, pois estamos fora do campo de observao que foi
feito o levantamento.
Exemplo:
Ao fazer o levantamento da temperatura versus presso numa caldeira, podemos utilizar a interpolao
para obter medidas no observadas durante o ensaio, mas se fizermos uma extrapolao tomando
temperaturas acima da temperatura da caldeira a presso interna poder destru-la parcial ou
totalmente.

6.4 Outros tipos de regresso
Para as funes no lineares so aplicados modelos de regresso no lineares, as funes mais comuns
no lineares so:
6.4 1.Funo Mltipla
Quando uma funo tem diversas variveis explanatrias.

6.4 2.Funo Potencial
Tambm conhecida como funo de Cobb-Douglas.

6.4 3.Funo Exponencial

6.4 4.Funo Logstica

Os diversos tipos de regresso so freqentemente usados para o clculo de demandas.
Exemplos que podemos citar so: o tempo de execuo de uma tarefa em funo do tempo de
experincia na execuo desta tarefa, o clculo do volume de vendas em funo dos anos, o clculo do
custo em funo da taxa de cmbio.

ATIVIDADE 6.2

1) A tabela abaixo apresenta o desempenho de um veculo(km) adicionando aditivo(ml)
colocado em 1 litro de gasolina em propores variveis:

Ensaio
Aditivo
(ml/1Lgasolina)
Desempenho
(km)
1 1,0 10
2 2,0 11,25
3 3,0 12,5
4 4,0 16,25
5 5,0 17,5
6 6,0 17,5
7 7,0 20

a. Verifique, pelo diagrama de disperso, se h correlao retilnea entre o aditivo e o
desempenho do veculo
b. Calcule o coeficiente de correlao;
c. Caso se verifique a correlao retilnea obtenha a equao do desempenho do veculo em
funo do aditivo adicionado.
d. Caso se verifique a correlao retilnea verifique o desempenho do veculo para a condio de
no adicionar aditivo.
e. Caso se verifique a correlao retilnea verifique o desempenho do veculo para uma
quantidade de 3,5 ml/1L gasolina.
f. Caso se verifique a correlao retilnea verifique o desempenho do veculo para uma
quantidade de 3,5 ml/1L gasolina.
g. Caso se verifique a correlao retilnea verifique o desempenho do veculo para uma
quantidade de 100 ml/1L gasolina. (Comente o resultado )
2) Considere os resultados de 2 grandezas fsicas, X(Temperatura) e Y(Presso), obtidos num
laboratrio de calibragem:

Temperatura (
o
C) 50 55 60 65 70 75 80 85 90
Presso(kgf/cm) 20 35 37 42 37 52 50 68 66

Caso se verifique a correlao retilnea verifique a presso para as temperaturas possveis a:
a) 57
o
C
b) 76,5
o
C
c) 110
o
C
d) 40
o
C

3) Um departamento de vendas de uma industria relacionou as vendas anuais em milhes,
denominada como varivel dependente y, com o investimento anual em propaganda em milhes
denominada como varivel independente x, cujos valores esto registrados na tabela seguinte.
Pede-se:


Propaganda
(milhes)
30 21 35 42 37 20 8 17 35 25
vendas
(milhes)
430 335 520 490 470 210 195 270 400 480


a) analisar a possibilidade de definir um modelo que represente a relao entre as variveis da
amostra.
b) Obter a reta de regresso linear, com o mtodo dos quadrados mnimos e desenhar os dados e
a reta de regresso.
c) Projetar os valores para valores de investimentos em propaganda iguais a 20, 30 e 45
milhes.



4) Suponha que um analista toma uma amostra aleatria de 10 carregamentos recentes por caminho
feitos por uma companhia e anota a distncia em quilmetros(X) e o tempo de entrega em dias(Y)
e anote os dados na Tabela a seguir. Pede-se:
a) Faa consideraes se parece apropriada a anlise de regresso linear simples entre a distncia em
quilmetros e o tempo de entrega em dias.
b) Caso se confirme a regresso linear simples, obtenha a reta de regresso linear.
c) Analise do ponto de vista de interpolao ou extrapolao o ponto X = 0

Distncia(km) 825 215 1070 550 480 920 1350 325 670 1215
tempo de
entrega(dias) 3,5 1 4 2 1 3 4,5 1,5 3 5

5- Um departamento de manuteno de uma industria relacionou uma amostra dos atendimentos/hora
dos seus clientes e no nmero de reclamaes no Procon, cujos valores esto registrados na tabela
seguinte. Pede-se:


Atendimentos/h 2 4 6 8 10 12 14 16 18 20
Reclamaes 50 40 45 30 20 23 15 8 10 5


d) analisar a possibilidade de definir um modelo que represente a relao entre as variveis da
amostra.
e) Obter a reta de regresso linear, com o mtodo dos quadrados mnimos e desenhar os dados e
a reta de regresso.
f) Projetar os valores para valores de investimentos em propaganda iguais a 0, 1 e 25
Atendimentos/h.

6- Suponha que um analista de um laboratrio de industria qumica toma uma amostra aleatria de 10
produtos embalados sob presso, onde a presso [g/cm
2
] (X) e o PH(Y) so anotados na Tabela a
seguir. Pede-se:
a) Faa consideraes se parece apropriada a anlise de regresso linear simples entre a presso e o
PH nos produtos embalados.
b) Caso se confirme a regresso linear simples, obtenha a reta de regresso linear.
c) Projetar os valores para presses iguais a 168, 171 e 174 [g/cm
2
]















Presso PH
166 6,5
167,5 7,5
169 7,2
170,5 6,5
172 7,4
173,5 7,1
175 7,8
176,5 6,6
178 7,7
179,5 7
Leitura Complementar

Embora o conceito Arredondamento de dados esteja em Leitura Complementar importantssimo que
voc leia com ateno, pois iremos utiliz-lo constantemente no curso e em toda sua vida profissional.

Arredondamento de dados de acordo com a resoluo 886/66 do IBGE

Muitas vezes, necessrio ou conveniente suprimir unidades inferiores s de determinada ordem. Esta
tcnica denominada arredondamento de dados.
De acordo com a resoluo 886/66 do IBGE, o arredondamento feito da seguinte maneira:
1 - Quando o primeiro algarismo a ser abandonado 0,1,2,3 ou 4, fica inalterado o ltimo
algarismo a permanecer.
Ex: 54,24 passa a 54,2 ; 34,03 passa a 34,0

2 - Quando o primeiro algarismo a ser abandonado 6,7,8, ou 9, aumenta-se de uma unidade o
algarismo a permanecer.
Ex: 13,87 passa a 13,9 ; 24,08 passa a 24,1 ; 14,99 passa a 15,0

3 - Quando o primeiro algarismo a ser abandonado 5, h duas solues:
a) Se ao 5 seguir em qualquer casa um algarismo diferente de zero, aumenta-se uma unidade ao
algarismo a permanecer.
Ex: 7,352 passa a 7,4 ; 95,6501 passa a 95,7 ; 86,250002 passa a 86,3
b) Se o 5 for o ltimo algarismo ou se ao 5 s se seguirem zeros, o ltimo algarismo a ser conservado
s ser aumentando de uma unidade se for mpar.
Exemplos:
34,75 passa a 34,8
44,65 passa a 44,6
54,75000 passa 54,8
74,6500 passa a 74,6
Obs: No devemos nunca fazer arredondamento sucessivos. Exemplo: 37,3452 passa a 37,3 e no para
37,35 e depois para 37,4.

Compensao

Suponhamos os dados abaixo, aos quais aplicamos as regras do arredondamento:
15,32 + 37,85 + 40,44 + 71,17 = 164,78 ( (167,8)
15,3 + 37,8 + 40,4 + 71,2 = 167,7
Verificamos que houve uma pequena discordncia: a soma exatamente 164,78
quando, pelo arredondamento, deveria ser 164,8, entretanto, para a apresentao
dos resultados, necessrio que desaparea tal diferena, o que possvel pela
prtica do que denominamos compensao, conservando o mesmo nmero de
casas decimais.
Usamos "descarregar" a diferena na(s) maior(es) parcela(s). Veja:
15,3 + 37,8 + 40,4 + 71,3 = 167,8
Obs: Se a maior parcela igual ou maior que o dobro de qualquer outra parcela,
"descarregamos" a diferena apenas na maior parcela.



ANEXOS

Resultado da pesquisa de campo referente aos preos (R$) de 200 monitores LCD de uma
determinada marca em 200 empresas de informtica

431,3 431,3 431,3 432,0 413,0 413,0 413,0 414,0 414,0 414,0
422,0 422,5 422,5 422,5 422,8 416,0 416,0 417,0 417,0 417,0
425,5 425,5 426,0 426,0 426,0 419,0 419,0 419,0 420,0 420,0
421,0 421,0 421,0 421,0 421,0 422,0 422,0 422,0 422,0 422,0
424,0 424,0 424,0 424,0 424,0 424,0 424,5 424,5 424,5 424,5
427,0 427,0 427,0 427,0 427,0 427,0 427,5 427,5 427,5 427,5
430,0 430,0 430,0 430,0 430,0 430,0 430,6 430,6 430,6 430,6
433,0 433,0 433,0 433,0 433,0 434,0 434,0 434,0 434,0 434,0
436,0 436,0 436,0 436,0 437,0 437,0 437,0 437,0 438,0 438,0
439,0 439,0 439,0 440,0 440,0 440,0 440,0 440,0 417,0 438,0
420,0 420,0 420,3 420,3 420,3 420,3 420,7 420,7 420,7 420,7
418,0 418,0 418,0 418,0 419,0 422,8 422,8 422,8 423,0 423,0
424,5 424,5 425,0 425,0 425,0 425,0 425,5 425,5 425,5 425,5
427,5 427,5 428,0 428,0 428,0 428,0 428,5 428,5 428,5 428,5
430,6 430,6 431,0 431,0 431,0 431,0 431,0 431,3 431,3 431,3
434,0 434,0 435,0 435,0 435,0 435,0 435,0 435,0 435,0 435,0
417,8 417,8 417,8 417,8 438,0 435,0 435,0 423,0 423,0 423,5
415,0 415,0 415,0 415,0 416,0 426,0 426,0 426,3 423,5 423,5
428,5 428,5 429,0 429,0 429,0 429,0 429,0 429,8 429,8 429,8
412,0 412,0 412,5 412,5 432,0 432,0 432,0 432,0 426,3 426,3













































REFERNCIAS


Bibliografia Bsica (ttulos; peridicos etc.)
Ttulo/Peridico Autor Ed. Local Editora Ano
CURSO DE
ESTATSTICA
FONSECA, JAIRO S.
& MARTINS,
GILBERTO A.
6 SO PAULO ATLAS 2008
INTRODUO
ESTATSTICA
TRIOLA, MARIO F. 10 RIO DE
JANEIRO
LTC 2008
ESTATSTICA
BSICA
TOLEDO, GERALDO
L. & OVALLE, IVO I.
2 SO PAULO ATLAS 1995

Bibliografia Complementar (ttulos; peridicos etc.)
Ttulo/Peridico Autor Ed. Local Editora Ano
ESTATSTICA
USANDO EXCEL
LAPPONI, JUAN
CARLOS
1 SO PAULO
LAPPONI
TREINAMENTO E
EDITORA
2002
ESTATSTICA
SPIEGEL, MURRAY
R.
3 SO PAULO
MAKRON BOOKS

2004
ESTATSTICA
BSICA
BUSSAB, WILTON O.
& MORETTTIN,
PEDRO A.
5 SO PAULO SARAIVA 2004
ESTATSTICA
APLICADA
ADMINISTRAO
STEVENSON,
WILLIAM J.
1 SO PAULO HARBRA 2001
ESTATSTICA
FCIL
CRESPO, ANTNIO
ARNOT
18
SO PAULO SARAIVA 2006