You are on page 1of 51

Autores: Prof. Edwin F. F.

Silva
Prof. Wesley Cndido de Melo
Colaboradores: Prof. Santiago Valverde
Prof. Jean Carlos Cavaleiro
Prof. Daniel Scodeler Raimundo
Estatstica Aplicada
Professores conteudistas: Edwin F. F. Silva e Wesley Cndido de Melo
Edwin F. F. Silva
Possui licenciatura em Fsica pela Universidade Catlica de Braslia (2005); especializao em Higiene das radiaes
ionizantes (Senacap, 2011); em Metodologia do Ensino e Aprendizagem em Matemtica (2009); ps-graduao em
Transporte (em andamento) pela Universidade de Braslia. Atualmente, professor da Faculdade Fortium, ministrando
aulas de clculo e estatstica nos cursos de Sistema de Informaes e Administrao, e da Universidade Paulista, no
curso de Engenharia. Atua em pesquisas relacionadas poluio sonora, na rea de polos geradores de viagens e
tambm como corretor de questes dos cursos de graduao a distncia da UNIP e como tutor do curso de RH da
UNIP Interativa.
Wesley Cndido de Melo
Possui licenciatura em Fsica pela Universidade Catlica de Braslia (2006); especializao em Matemtica
e Estatstica pela FACITEC (2008); ps-graduao em Transporte (em andamento) pela Universidade de Braslia.
Atualmente, professor da Universidade Paulista, ministrando aulas para os cursos de Engenharia, Gesto de RH
e Segurana Privada; da Faculdade JK, nos cursos de Administrao e Radiologia. Atua tambm como corretor de
questes dos cursos de graduao a distncia da UNIP e como tutor do curso de RH da UNIP Interativa. pesquisador
vinculado ao grupo de pesquisa em Poluio sonora com nfase em Rudos aeronuticos no curso de Fsica da
Universidade Catlica de Braslia.
Todos os direitos reservados. Nenhuma parte desta obra pode ser reproduzida ou transmitida por qualquer forma e/ou
quaisquer meios (eletrnico, incluindo fotocpia e gravao) ou arquivada em qualquer sistema ou banco de dados sem
permisso escrita da Universidade Paulista.
Dados Internacionais de Catalogao na Publicao (CIP)
S586e Silva, Edwin F.
Estatstica aplicada / Edwin F. Silva; Wesley Cndido de Melo.
So Paulo: Editora Sol, 2012.
112 p., il.
Nota: este volume est publicado nos Cadernos de Estudos e
Pesquisas da UNIP, Srie Didtica, ano XVII, n. 2-064/12, ISSN 1517-9230.
1. Estatstica. 2. Distribuio de frequncias. 3. Probabilidades.
I. Ttulo.
CDU 519.2
Prof. Dr. Joo Carlos Di Genio
Reitor
Prof. Fbio Romeu de Carvalho
Vice-Reitor de Planejamento, Administrao e Finanas
Profa. Melnia Dalla Torre
Vice-Reitora de Unidades Universitrias
Prof. Dr. Yugo Okida
Vice-Reitor de Ps-Graduao e Pesquisa
Profa. Dra. Marlia Ancona-Lopez
Vice-Reitora de Graduao
Unip Interativa EaD
Profa. Elisabete Brihy
Prof. Marcelo Souza
Prof. Dr. Luiz Felipe Scabar
Prof. Ivan Daliberto Frugoli
Material Didtico EaD
Comisso editorial:
Dra. Anglica L. Carlini (UNIP)
Dra. Divane Alves da Silva (UNIP)
Dr. Ivan Dias da Motta (CESUMAR)
Dra. Ktia Mosorov Alonso (UFMT)
Dra. Valria de Carvalho (UNIP)
Apoio:
Profa. Cludia Regina Baptista EaD
Profa. Betisa Malaman Comisso de Qualicao e Avaliao de Cursos
Projeto grco:
Prof. Alexandre Ponzetto
Reviso:
Andria Gomes
Geraldo Teixeira Jr.
Sumrio
Estatstica Aplicada
APRESENTAO ......................................................................................................................................................7
INTRODUO ...........................................................................................................................................................7
Unidade I
1 HISTRIA DA ESTATSTICA ..............................................................................................................................9
1.1 Introduo estatstica ........................................................................................................................9
1.2 Importncia da estatstica .................................................................................................................11
1.3 Elementos fundamentais da estatstica ...................................................................................... 12
1.3.1 Populao e amostra ............................................................................................................................. 12
1.4 Fases do mtodo estatstico ............................................................................................................. 13
1.5 Dados estatsticos ................................................................................................................................ 13
1.6 Formas iniciais de tratamento dos dados................................................................................... 15
1.7 Notaes por ndices .......................................................................................................................... 16
1.7.1 Notao sigma () ................................................................................................................................. 16
1.8 Sries estatsticas simples e compostas .................................................................................. 19
2 APRESENTAO DE DADOS GRFICOS E TABELAS ........................................................................ 20
2.1 Elementos bsicos das tabelas ........................................................................................................ 26
3 MEDIDAS DE TENDNCIA CENTRAL: MDIA, MODA E MEDIANA PARA
DADOS SIMPLES .................................................................................................................................................. 26
3.1 A mdia aritmtica simples (x) ....................................................................................................... 27
3.2 A mdia aritmtica ponderada xp ................................................................................................. 29
3.3 A mediana (Md)..................................................................................................................................... 31
3.4 A moda ..................................................................................................................................................... 34
3.5 Posio relativa da mdia, moda e mediana ............................................................................. 36
4 MEDIDAS DE DISPERSO PARA DADOS SIMPLES .............................................................................. 36
4.1 Amplitude total ..................................................................................................................................... 38
4.2 Desvio mdio absoluto ....................................................................................................................... 39
4.3 Varincia .................................................................................................................................................. 40
4.4 Desvio padro ........................................................................................................................................ 45
4.5 Coeciente de variao ..................................................................................................................... 46
Unidade II
5 DISTRIBUIO DE FREQUNCIAS ............................................................................................................. 52
5.1 A construo de uma distribuio de frequncias para dados contnuos .................... 53
5.2 A construo de uma distribuio de frequncias para dados discretos ...................... 59
5.3 Representaes grcas de dados agrupados ......................................................................... 60
6 AS MEDIDAS DE POSIO E VARIABILIDADE NUMA DISTRIBUIO
DE FREQUNCIA ................................................................................................................................................... 69
6.1 As medidas de posio ....................................................................................................................... 70
6.1.1 A mdia ....................................................................................................................................................... 70
6.1.2 A mediana .................................................................................................................................................. 71
6.1.3 A moda ........................................................................................................................................................ 72
6.2 As medidas de disperso numa distribuio de frequncia ................................................ 73
6.2.1 O desvio mdio ........................................................................................................................................ 73
6.2.2 Varincia ..................................................................................................................................................... 74
6.2.3 Desvio padro ........................................................................................................................................... 75
7 INTRODUO PROBABILIDADE ............................................................................................................. 80
7.1 Teorias dos conjuntos, espao amostral e eventos ................................................................. 81
8 PROBABILIDADE: ORIGEM, MTODOS E PRINCIPAIS TEOREMAS ................................................ 91
8.1 Origens da probabilidade .................................................................................................................. 92
8.1.1 Mtodos objetivos .................................................................................................................................. 92
8.1.2 Mtodo subjetivo .................................................................................................................................... 96
8.2 Principais teoremas de probabilidade .......................................................................................... 96
7
APRESENTAO
O objetivo deste material fazer com que o aluno tenha condies de interpretar um conjunto
de observaes de forma clara e objetiva, a m de distinguir as limitaes e as vantagens do uso de
amostras, assim como os mtodos para sua obteno; tenha habilidade para descrever e interpretar
dados por meio de guras (tabelas e grcos), estimativas pontuais e de variabilidade; calcular o intervalo
de conana da proporo e mdia, assim como identicar sua aplicao; coletar e interpretar dados
de forma sistematizada e imprimir credibilidade a anlises quantitativas dos fenmenos de realidade
investigada.
Assim, esperamos contribuir da melhor forma possvel com seu aprendizado.
Com nossos cumprimentos,
Equipe organizadora.
INTRODUO
Desde a Antiguidade, a estatstica faz parte da vida das pessoas, mesmo que de forma indireta, mas o
certo que essa cincia est presente na vida das pessoas o tempo todo. Quando abrimos um jornal, por
exemplo, l est uma srie de grcos e tabelas que nos auxiliam no entendimento de determinado tema,
ou quando lemos uma reportagem que traz como tema a probabilidade de o mercado nanceiro fechar
em alta ou em baixa, ou, ainda, virando a pgina desse mesmo jornal, temos a manchete divulgando os
dados do Censo 2010.
Diante desses fatos, nos perguntamos de que forma a estatstica pode nos ajudar, seja no levantamento
de dados para uma empresa saber como vo suas vendas, seja para saber os riscos de investir nas aes
de uma empresa, ou, ainda, como o governo pode determinar as caractersticas dos vrios aspectos,
sociais, econmicos e ambientais dos estados e at mesmo de nosso pas.
So perguntas como essas que a estatstica nos ajuda a responder, e ainda no podemos pensar
nessa cincia como se ela se limitasse a apenas compilar tabelas de dados e os ilustrar gracamente.
Dessa forma, de sua importncia conhecer as inmeras variveis associadas a ela, pois em qualquer
ramo da sociedade contempornea esto presentes os processos estatsticos. E o estudante que no
souber trabalhar com esses conceitos estar em desvantagem no mercado de trabalho.
Para tirar o mximo proveito da interpretao de um determinado fenmeno, deve-se seguir algumas
etapas, como, por exemplo, planejar a obteno de dados, interpretar e analisar os dados obtidos e
apresentar os resultados de maneira a facilitar a tomada de decises razoveis.
fundamental que o texto produzido neste material leve o aluno a pensar em situaes do seu
cotidiano e que dessa forma ele possa associar a teoria com a prtica vivenciada em seu dia a dia.
Pensando nisso, ele foi dividido em duas unidades, nas quais sero abordados, na primeira unidade:
sries estatsticas, grcos estatsticos, medidas de tendncia central, medidas de disperso, entre outros
8
temas; j na segunda unidade, sero apresentados: dados tabulares, distribuio de frequncia, medidas
de posio e variabilidade numa distribuio de frequncia, probabilidade, bem como alguns de seus
teoremas, entre outros temas.
9
R
e
v
i
s

o
:

A
n
d
r

i
a

G
o
m
e
s

-

D
i
a
g
r
a
m
a

o
:

L

o

-

0
1
/
0
8
/
2
0
1
2
ESTATSTICA APLICADA
Unidade I
Como a Unio realiza a distribuio de renda para os Estados, Municpios e o Distrito Federal? Como
saber quem deve receber mais ou menos verbas? Como saber se determinado trecho de uma via ou
rodovia ou no perigoso?
So a questes como essas que a disciplina Estatstica procura responder.
1 HISTRIA DA ESTATSTICA
Na histria do desenvolvimento humano, a sociedade primitiva se deparou com os primeiros
problemas para saber o tamanho da sua populao, a quantidade de terras e suas riquezas, por isso teve a
necessidade de cont-las. Em decorrncia disso, os governantes das grandes civilizaes antigas zeram
indiretamente um estudo estatstico para saber os bens que seu Estado possua e como a populao
desse Estado estava distribuda.
No Antigo Egito, aproximadamente 3040 a.C., Herdoto pediu que fosse feito um estudo sobre a
riqueza da populao, com o objetivo de saber a quantidade de recursos econmicos e humanos para
realizar a construo das pirmides. Na China, aproximadamente 2238 a.C., o imperador Yao pediu que
fosse feito um estudo da populao, com objetivos industriais e comerciais.
A palavra estatstica foi sugerida pelo alemo Gottifried Achemmel (1719/1772) e associada
palavra latina status (Estado).
Essa cincia teve acelerado desenvolvimento a partir do sculo XVII, com os estudos de Bernoulli,
Fermat, Laplace, Gauss e outros que estabeleceram suas caractersticas atuais.
Saiba mais
Para uma abordagem mais detalhada da histria da estatstica, ler o
artigo: Conceitos iniciais e breve histrico da estatstica, disponvel em:
<http://mundobr.pro.br/uneal/wp-content/uploads/2010/04/01.conceitos_
inicias-historico-somatorio.pdf>. Acesso em: 12 jul. 2012.
1.1 Introduo estatstica
A todo instante, nos noticirios, em revistas, jornais, internet, ouvimos falar na palavra estatstica,
o que possvel perceber o quanto importante conhecermos a fundo essa cincia. Algumas de
10
Unidade I
R
e
v
i
s

o
:

A
n
d
r

i
a

G
o
m
e
s

-

D
i
a
g
r
a
m
a

o
:

L

o

-

0
1
/
0
8
/
2
0
1
2
suas aplicabilidades podem ser observadas nas pesquisas de opinio pblica e nos dados publicados
diariamente na imprensa. Na realidade, a estatstica contempla muitos outros aspectos, sendo de vital
importncia na interpretao de processos em que exista variabilidade.
De acordo com Dervalmar, possvel distinguir duas concepes para a palavra estatstica. No
plural, estatsticas indica qualquer coleo de dados quantitativos ou, ainda, ramo da matemtica que
trata da coleta, da anlise, da interpretao e da apresentao de massa de dados numricos. Assim,
por exemplo, as estatsticas demogrcas referem-se aos dados numricos sobre o quantitativo de
nascimentos, falecimentos, matrimnios, desquites etc. As estatsticas econmicas esto relacionadas
aos dados numricos como emprego, produo, vendas e com outras atividades ligadas aos vrios
setores da vida econmica.
No singular, estatstica indica a atividade humana especializada, ou um corpo de tcnicas, ou ainda
uma metodologia desenvolvida para a coleta, a classicao, a apresentao, a anlise e a interpretao
de dados quantitativos e a utilizao desses dados para a tomada de decises.
Estatstica um conjunto de mtodos e processos quantitativos que serve para estudar e medir os
fenmenos coletivos.
Para ns didticos, comum os livros-textos apresentarem a estatstica em duas grandes reas,
embora no se trate de reas isoladas: estatstica descritiva e estatstica inferencial.
estatstica descritiva aquela que tem por objetivo descrever e analisar determinada populao,
utilizando mtodos numricos e grcos, para se determinarem padres, em um conjunto de
dados, e assim apresentar a informao em uma forma conveniente.
Exemplo 1: O grco a seguir apresenta a participao relativa das bandeiras de cartes de crdito,
no quarto trimestre de 2010.
Visa
52,2%
Outras
9,4%
Master Card
38,4%
Figura 1 - Participao relativa das bandeiras (quantidade de transaes)
Por meio do grco, possvel ver claramente que mais da metade das transaes so feitas com
a bandeira Visa e que aproximadamente 40% so feitas com a bandeira MasterCard. Como o grco
descreve os tipos de bandeiras de cartes utilizadas em todas as transaes do quarto trimestre de 2010,
o grco um exemplo de estatstica descritiva.
11
R
e
v
i
s

o
:

A
n
d
r

i
a

G
o
m
e
s

-

D
i
a
g
r
a
m
a

o
:

L

o

-

0
1
/
0
8
/
2
0
1
2
ESTATSTICA APLICADA
Exemplo 2: ndice Nacional de Preos ao Consumidor (INPC)
Sua apresentao envolve a sintetizao, em um nico dado, dos aumentos dos produtos de uma
cesta bsica.
Trata-se de um exemplo de estatstica inferencial, que constitui o conjunto de mtodos para a
tomada de decises, nas situaes em que h incerteza, variaes ou outras generalizaes acerca de
um conjunto maior de dados.
Exemplo 3: Anlise de mercado
Quando uma empresa pretende lanar um produto, precisa conhecer as preferncias dos consumidores
no mercado de interesse. Faz-se necessria uma pesquisa de mercado.
Exemplo 4: Ocorrncia de terremotos
Os gelogos esto continuamente coletando dados sobre a ocorrncia de terremotos. Gostariam
de inferir quando e onde ocorrero tremores e qual a sua intensidade. Trata-se, sem dvida, de uma
questo complexa que exige longa experincia geolgica, alm de cuidadosa aplicao de mtodos
estatsticos.
1.2 Importncia da estatstica
Com o desenvolvimento humano e tecnolgico, temos presenciado grandes descobertas na rea
da sade, da engenharia, da economia etc.; por outro lado, tambm observamos os problemas que
se espalham pelo mundo, por exemplo, a ameaa com a degradao do meio ambiente, as epidemias
(H1N10) causando grandes preocupaes para os governantes e para a populao mundial. Como
ajudar pesquisadores, cientistas, engenheiros etc. a se nortearem com o que deve ser feito tanto para
criar novas possibilidades como tambm para solucionar os problemas existentes?
O mtodo estatstico lida com informaes, associando os dados ao problema, mostrando como e o
que coletar para obter concluses a partir de todos os dados, de tal forma que essas concluses possam
ser entendidas por outras pessoas. Assim, esse mtodo auxilia os vrios prossionais no planejamento e
na tomada de decises.
Saiba mais
O artigo A elaborao de estatsticas de mortalidade segundo causas
mltiplas apresenta uma aplicao da estatstica mostrando a sua
importncia para a tomada de decises. Disponvel em: <http://www.
scielosp.org/pdf/rbepid/v3n1-3/03.pdf>. Acesso em: 15 jul. 2012.
12
Unidade I
R
e
v
i
s

o
:

A
n
d
r

i
a

G
o
m
e
s

-

D
i
a
g
r
a
m
a

o
:

L

o

-

0
1
/
0
8
/
2
0
1
2
Vejamos alguns exemplos:
O governo anualmente divulga o censo sobre a dinmica da populao brasileira, apresentando seu
crescimento demogrco, suas caractersticas e como vivem os brasileiros.
As grandes empresas fazem levantamentos sobre vendas, produo, inventrio, folha de pagamento
e outros dados, a m de vericar se a empresa est crescendo, como seu crescimento est em relao a
outras empresas e como tomar decises futuras.
A anlise dos dados muito importante para fazer um planejamento adequado.
Saiba mais
Para mais informaes sobre o Censo, acesse o site do IBGE:
<http://www.ibge.gov.br>.
1.3 Elementos fundamentais da estatstica
Amostra: qualquer subconjunto no vazio de uma populao.
Amostragem: o meio de escolha da amostra e consiste na seleo criteriosa dos elementos a
serem submetidos ao estudo.
1.3.1 Populao e amostra
Para o pesquisador, o estudo de qualquer fenmeno, seja ele natural, econmico, social ou biolgico,
necessita da coleta e da anlise de dados estatsticos. A coleta de dados parte inicial de qualquer
pesquisa.
Populao: o conjunto de todos os itens (pessoas, coisas e objetos) que interessam ao estudo de
um fenmeno coletivo.
Parmetro: a denominao de uma caracterstica numrica estabelecida para toda uma populao.
Estimador: a caracterstica numrica estabelecida para toda a amostra.
Exemplo: pesquisas sobre tendncias de votao.
Em pocas de eleio, comum a realizao de pesquisas com o objetivo de conhecer as tendncias
do eleitorado. Para que os resultados sejam, de fato, representativos, deve-se atentar para que as
caractersticas da populao qual os resultados da pesquisa sero estendidos sejam to prximas
13
R
e
v
i
s

o
:

A
n
d
r

i
a

G
o
m
e
s

-

D
i
a
g
r
a
m
a

o
:

L

o

-

0
1
/
0
8
/
2
0
1
2
ESTATSTICA APLICADA
quanto possvel. A escolha da amostra, o questionrio, a entrevista, a sintetizao dos dados e a
representao dos resultados so as etapas desse tipo de pesquisa.
Populao
so todos
os eleitores
habilitados do
municpio.
Fenmeno coletivo
(Eleies para Prefeitura
de um municpio).
Amostra um grupo
numrico de eleitores
selecionado na
populao do municpio
Parmetro uma
proporo de votos
para o candidato
A obtida na
populao
Estimador
uma proporo
de votos para
o candidato A
obtida na amostra
Amostra
Figura 2
1.4 Fases do mtodo estatstico
Em uma pesquisa, quando se deseja empreender um estudo estatstico completo, existem fases do
trabalho que devem ser trabalhadas para se chegar aos resultados nais do estudo.
As principais fases so:
denio do problema delimitao do problema;
planejamento organizao das aes que sero realizadas na pesquisa de campo;
coleta de dados ir a campo buscar as informaes;
apurao dos dados organizao das informaes coletadas;
apresentao dos dados grcos e tabelas;
anlise e interpretao dos dados por meio da linguagem matemtica (mdia, mediana,
moda, desvio padro, percentuais etc.).
Observe quais so as fases principais do mtodo estatstico compem a organizao de um projeto,
sua execuo e apresentao nal.
1.5 Dados estatsticos
Quando se trabalha com a observao, a mensurao, a anlise e a interpretao de nmeros, esses
nmeros nos conduzem a ndices inacionrios, ndices de desemprego, probabilidade de determinado
candidato ganhar as eleies etc. Esses nmeros, portanto, sero chamados de dados estatsticos, os
quais precisaro ser organizados e sumarizados para sua correta interpretao.
O dado bruto significa que os dados no esto numericamente organizados e processados.
o processamento e a organizao dos dados que os transformam em informao, enfatizando
14
Unidade I
R
e
v
i
s

o
:

A
n
d
r

i
a

G
o
m
e
s

-

D
i
a
g
r
a
m
a

o
:

L

o

-

0
1
/
0
8
/
2
0
1
2
seus aspectos mais importantes. A informao, portanto, resultado de um tratamento dos
dados.
Para organizar e processar os dados estatsticos, podem-se utilizar resumos visuais e numricos,
como grcos, mapas, tabelas e modelos numricos.
A mensurao ou a observao de itens como ndices de preos, renda mensal per capita de um Estado
etc. do origem aos dados estatsticos. Como esses itens originam valores que tendem a apresentar
certo grau de variabilidade quando so medidos sucessivas vezes, iremos cham-los, ento, de variveis.
importante identicar os quatro tipos de variveis: variveis contnuas, variveis discretas, variveis
nominais e variveis ordinais.
Variveis contnuas: podem assumir qualquer valor num intervalo contnuo (dado contnuo), ou
seja, ser um nmero real. Exemplos: altura, peso, velocidade etc.
Variveis discretas: em geral, originam-se da contagem de itens e s podem assumir valores
inteiros. Exemplos: nmero de alunos em sala de aula, nmero de professores que trabalham na
escola etc.
Variveis nominais: so aquelas que existem com o objetivo de denir categorias, e as observaes,
mensuraes e anlises so feitas levando-se em conta essas mesmas categorias. Exemplos de
categoria seriam: separao por sexo, estado civil, esporte predileto, cor etc.
Variveis ordinais: quando existe o desejo de dispor os elementos observados segundo uma
ordem de preferncia ou desempenho, atribuem-se valores relativos para indicar essa ordem.
Exemplo: primeiro, segundo, terceiro grau de escolaridade etc.
As variveis discretas e contnuas so ditas variveis quantitativas porque envolvem dados numricos.
J as variveis nominais e ordinais precisam ser transformadas em valores numricos para serem objeto
da anlise estatstica, e so ditas variveis qualitativas. Por exemplo: em um departamento da empresa
JJ, que tem 36 funcionrios, fez-se uma pesquisa para vericar alguns dados. Classique as variveis,
conforme os dados da tabela a seguir.
Tabela 1
Estado civil Grau de instruo N lhos Salrio (X. min) Idade (anos-meses)
Solteiro
Ensino
Fundamental
- 4,00 23 03
Casado
Ensino
Fundamental
1 4,56 32 10
Casado Ensino Superior 3 19,40 48 11
Solteiro Ensino Mdio - 10,53 25 08
Solteiro Ensino Mdio - 16,22 31 05
15
R
e
v
i
s

o
:

A
n
d
r

i
a

G
o
m
e
s

-

D
i
a
g
r
a
m
a

o
:

L

o

-

0
1
/
0
8
/
2
0
1
2
ESTATSTICA APLICADA
Resoluo
Varivel qualitativa nominal: estado civil.
Varivel qualitativa ordinal: grau de instruo.
Varivel quantitativa discreta: nmero de lhos.
Varivel quantitativa contnua: salrio e idade.
Variveis discretas e contnuas = variveis quantitativas.
Variveis nominais e ordinais = variveis qualitativas.
E ainda:
Dados qualitativos: consistem em atribuir qualidade ou atributo varivel pesquisada.
Dados quantitativos: consistem em nmeros que representam contagens ou medidas.
1.6 Formas iniciais de tratamento dos dados
Em geral, quando nos propomos a buscar ou construir informaes a partir de dados, deparamo-nos,
inicialmente, com um conjunto de dados brutos que pouco nos dizem. preciso organiz-los
minimamente para que comecem a fazer algum sentido, viabilizando sua anlise.
Exemplo 1: a tabela a seguir apresenta as notas de 40 estudantes da disciplina de estatstica.
Tabela 2
50 96 75 87 65 45 72 10
32 54 25 69 72 30 81 20
24 45 80 90 64 95 23 90
80 35 96 47 65 70 73 63
60 20 45 89 20 90 80 70
Essa tabela chamada de tabela primitiva ou dados brutos, pois os dados coletados esto dispostos
conforme a ordem da coleta e no na ordem de numerao.
Observando os dados anteriores, tabela primitiva, ca difcil visualizar em torno de que valor tendem
a se concentrar as notas dos estudantes, qual a maior ou qual menor nota, e ainda quantos alunos se
acham abaixo de uma dada nota.
16
Unidade I
R
e
v
i
s

o
:

A
n
d
r

i
a

G
o
m
e
s

-

D
i
a
g
r
a
m
a

o
:

L

o

-

0
1
/
0
8
/
2
0
1
2
Uma primeira forma de organizao dos dados brutos o chamado rol. Obtemos o rol quando
organizamos os dados brutos em ordem crescente ou decrescente de grandeza.
Ainda com respeito tabela de nota dos 40 estudantes da disciplina de estatstica, vejamos como ca:
Tabela 3
10 20 20 20 23 24 25 30
32 35 45 45 45 47 50 54
60 63 64 65 65 69 70 70
72 72 73 75 80 80 80 81
87 89 90 90 90 95 96 96
Agora, podemos saber, com relativa facilidade, qual a menor nota (10) e qual a maior nota (96). Para
determinar a amplitude do rol, basta realizar a diferena entre o maior e o menor nmero do rol, ou seja,
para o exemplo, a amplitude de variao foi de 96 10 = 86.
Exemplo 2: seja A = {10, 7, 3, 9, 1, 5, 10, 4, 2, 8} o conjunto das notas dos alunos, determine o rol
e a amplitude do rol:
{10, 7, 3, 9, 1, 5, 10, 4, 2, 8} dado bruto
{1, 2, 3, 4, 5, 7, 8, 9, 10, 10} rol
Amplitude = {maior valor do rol menor valor do rol}
A = 10 1 = 9
Limites de classe: so os nmeros extremos de cada classe; sendo assim, temos um limite inferior
e um superior, que denominamos de amplitude de variao.
A = L
sup.
- L
inf.
1.7 Notaes por ndices
A notao por ndices bastante utilizada na estatstica, sendo importante esclarecer seu signicado.
O smbolo x
i
(l-se x ndice i) ir representar qualquer um dos n valores assumidos pela varivel x, x
1
, x
2
,
x
3
, x
4
, ..., x. n denominado ndice e poder assumir qualquer dos nmeros entre 1, 2, 3, 4,..., n.
1.7.1 Notao sigma ()
A maioria dos processos estatsticos vai exigir o clculo da soma de um conjunto de nmeros. A letra
maiscula grega sigma () utilizada para representar o somatrio.
17
R
e
v
i
s

o
:

A
n
d
r

i
a

G
o
m
e
s

-

D
i
a
g
r
a
m
a

o
:

L

o

-

0
1
/
0
8
/
2
0
1
2
ESTATSTICA APLICADA
Assim, se determinada varivel y tiver os valores 3, 5, 7, 9 e 11, o y ser:
y = 3 + 5 + 7 + 9 + 11
y = 35
Por outro lado, se o consumo semanal de arroz por x, durante um ms, foi 2 kg, 4 kg, 3 kg, 5 kg, o
total consumido por x no ms teria sido:
x = 2 + 4 + 3 + 5
x = 14, x teria consumido 14 kg de arroz durante o ms referido.
A notao sigma possui algumas propriedades que precisamos desenvolver para facilitar os contedos
que estudaremos nesta disciplina.
A)
x x x
i
n
i 1
1 =

= =
, isso signica que devemos somar as n observaes de x, comeando com
a primeira.
Por exemplo, num conjunto de dados x = {2, 4, 6, 8, 10, 12}, em que n = 6, temos:
x x
x
i
i
n
i
i
i
= =

= = + + + + +
=
1 1
6
2 4 6 8 10 12
42
Por outro lado, possvel utilizar essa notao quando se pretende analisar a soma de apenas uma
parte dos dados disponibilizados, podendo-se, portanto, abreviar a soma de um conjunto de dados.
Dessa forma, podemos ter:
x x x x
i 1 2 3
1
3
+ + =

x x x x x
i
i
8 9 10 11
8
4
+ + + =
=

B) Se cada valor da varivel x multiplicado ou dividido por uma constante, temos que isso ser
igual ao valor da constante multiplicado ou dividido pela somatria de x.
c x c x . . =

18
Unidade I
R
e
v
i
s

o
:

A
n
d
r

i
a

G
o
m
e
s

-

D
i
a
g
r
a
m
a

o
:

L

o

-

0
1
/
0
8
/
2
0
1
2
Assim,
4 4 4 4 4
4 4
1 2 3 4
1
4
1 2 3 4
1
4
x x x x x
x x x x x
i
i
i
i
= + + +
= + + + =
=
=

( )
Por exemplo: se x
i
= {2, 4, 6, 8, 10, 12}, n = 6, e cada valor de x multiplicado pela constante
c = 2, temos:
cx c x =

cx c x
i
i
i
i
= = + + + + =
= + + + +
= =

1
6
1
6
2 2 2 4 2 8 210 212
2 2 4 6 8 10
( ) ( ) ( ) ( ) ( )
( ++
= = =
= =

12
2 2 2 42 84
1
6
1
6
)
( ) x x
i i
i i
C) O somatrio de uma constante c ser igual ao produto da constante pelo nmero de vezes (n) que
ela se repete. Assim, temos:
c nc
i
i i
n
=
=

Por exemplo, numa determinada observao, o conjunto de dados de x


i
= {7, 7, 7, 7, 7, 7}, n = 6,
temos que x
i
uma constante c que se repete. Ento, temos:
x c
xi c nc
i i
i
i i
=
= = = + + + + + = =
= =

1
6
1
6
7 7 7 7 7 7 6 7 42 ( )
D) O somatrio de uma soma ou de uma diferena de duas variveis ser igual soma ou diferena
dos somatrios individuais das duas variveis. Assim, temos:
( )
( )
x y x y
x y x y
i i i i
i
n
i
n
i
n
i i i i
i
n
i
n
i
n
+ = +
=
= = =
= = =


1 1 1
1 1 1
19
R
e
v
i
s

o
:

A
n
d
r

i
a

G
o
m
e
s

-

D
i
a
g
r
a
m
a

o
:

L

o

-

0
1
/
0
8
/
2
0
1
2
ESTATSTICA APLICADA
Por exemplo:
i X Y (X-Y)
( ) x y
x y
=
= =


9
20 11 9
1 8 5 3
2 3 2 1
3 4 0 4
4 5 4 1
- - - -
20 11 9
Figura 3
E) O somatrio de um conjunto de dados x ao quadrado nos obriga a elevar cada elemento de xi ao
quadrado para efetuar a soma. Assim, temos:
x x x x x
i
i
n
n
2
1
1
2
2
2
3
2 2
=

= + + + + ...
Por exemplo, numa dada observao, o conjunto de dados de x
i
= {2, 4, 6, 8, 10}, n = 5; temos, ento:
x
i
i
2
1
5
2 2 2 2 2
2 4 6 8 10
4 16 36 64 100 220
=

= + + + + =
= + + + + =
F) O somatrio ao quadrado de um conjunto de dados ser obtido tomando-se a soma dos valores
de x
i
e elevando-se ao quadrado. Assim, temos:
( ) ( ... ) x x x x x
i
i
n
n
=

= + + + +
1
2
1 2 3
2
Por exemplo, se temos um mesmo conjunto x
i
= {2, 4, 6, 8, 10}, n = 5, tal qual no exemplo do item
E, teremos um resultado distinto. Vejamos, neste caso:
( ) ( ) ( ) x
i
i=

= + + + + = =
1
5
2 2 2
2 4 6 8 10 30 900
No confunda
x
i
i
n
2

com
x
i
i
n

2
, pois, conforme se observa no exemplo anterior, seus resultados
sero diferentes.
1.8 Sries estatsticas simples e compostas
Uma srie estatstica dene-se como qualquer tabela na qual haja distribuio de um conjunto de
dados estatsticos destinados a uma mesma ordem de classicao: quantitativa. Ou, ainda, no sentido
20
Unidade I
R
e
v
i
s

o
:

A
n
d
r

i
a

G
o
m
e
s

-

D
i
a
g
r
a
m
a

o
:

L

o

-

0
1
/
0
8
/
2
0
1
2
mais amplo, srie uma sucesso de nmeros referidos a qualquer varivel. Caso os nmeros expressem
dados estatsticos, a srie ser chamada de srie estatstica.
As tabelas so utilizadas para apresentar sries estatsticas. Os trs caracteres presentes na tabela
que as apresenta so:
a poca (fator temporal ou cronolgico) a que se refere o fenmeno estudado;
o local (fator espacial ou geogrco) onde o fenmeno acontece;
o fenmeno (espcie de fato ou fator especco) que descrito de forma categrica. As sries
so divididas em dois grupos:
As sries so divididas em dois grupos:
1. Sries homgradas: onde h variao discreta ou descontnua na varivel descrita.
- Srie temporal
Sries homgradas: - Srie geogrca
- Srie especca.
2. Sries hetergradas: so aquelas nas quais o fenmeno/fato apresentam gradaes ou
subdivises.
Sries hetergradas: Distribuio de frequncias
2 APRESENTAO DE DADOS GRFICOS E TABELAS
A representao grca das sries estatsticas tem por nalidade sintetizar os resultados obtidos e,
assim, chegar a concluses sobre a evoluo do fenmeno ou sobre como se relacionam os valores da
srie. O grco mais apropriado car a critrio do pesquisador, respeitando os elementos de clareza,
simplicidade e veracidade (NOGUEIRA, 2009).
Diretrizes para a construo de um grco:
o ttulo do grco deve ser o mais claro e completo possvel, sendo necessrio acrescentar subttulos;
a orientao geral dos grcos deve ser da esquerda para a direita;
as quantidades devem ser representadas por grandezas lineares;
sempre que possvel, a escala vertical h de ser escolhida de modo a aparecer a linha 0 (zero);
s devem ser includas no desenho as coordenadas indispensveis para guiar a vista na leitura, um
tracejado muito cerrado diculta o exame do grco;
a escala horizontal deve ser lida da esquerda para a direita e a vertical de baixo para cima;
21
R
e
v
i
s

o
:

A
n
d
r

i
a

G
o
m
e
s

-

D
i
a
g
r
a
m
a

o
:

L

o

-

0
1
/
0
8
/
2
0
1
2
ESTATSTICA APLICADA
os ttulos e as marcaes do grco dispor-se-o de maneira que sejam facilmente legveis,
partindo da margem horizontal inferior ou da margem esquerda.
Leitura e interpretao de um grco:
declarar qual o fenmeno ou fenmenos representados, a regio considerada, o perodo de tempo,
a fonte dos dados etc.;
examinar o tipo de grco escolhido, vericar se o mais adequado, criticar a sua execuo, no
conjunto e nos detalhes;
analisar cada fenmeno separadamente, fazendo notar os pontos mais em evidncia, o mximo e
o mnimo, as mudanas mais bruscas;
investigar se h uma tendncia geral crescente ou decrescente ou, ento, se o fato exposto
estacionrio;
procurar descobrir a existncia de possveis ciclos peridicos, qual o perodo aproximado etc.
Eis os tipos mais comuns de grcos:
Grco em linha
1 2 3 4 5 6 7
500
400
300
200
100
0
Srie 1
Srie 2
Figura 4
Grco em colunas
Populao
1940 1950 1960 1970
100
80
60
40
20
0
Populao
Figura 5
22
Unidade I
R
e
v
i
s

o
:

A
n
d
r

i
a

G
o
m
e
s

-

D
i
a
g
r
a
m
a

o
:

L

o

-

0
1
/
0
8
/
2
0
1
2
Grco em barras
semelhante ao grco em colunas, porm os retngulos so dispostos horizontalmente.
Populao do Brasil
0 20 40 60 50 100
1970
1960
1950
1940
Populao do
Brasil
Figura 6
Grco em setores
Anos Faturamento de uma empresa (em milhes)
2008 3
2009 4
2010 5
Total 12
Figura 7
a representao grca de uma srie estatstica, em crculo, por meio de setores. utilizado
principalmente quando se pretende comparar cada valor da srie com o total.
Total __________360
Parte___________ x
Para 2008: 12 - 360
3 - x
x = 90
Para 2009: 12 - 360
4 - x
x = 120
Para 2010: 12 - 360
5 - x
x = 150
23
R
e
v
i
s

o
:

A
n
d
r

i
a

G
o
m
e
s

-

D
i
a
g
r
a
m
a

o
:

L

o

-

0
1
/
0
8
/
2
0
1
2
ESTATSTICA APLICADA
2008
2009
2010
Figura 8
Grco polar
a representao de uma srie por meio de um polgono. Movimento mensal de compras de uma
agncia em 1972.
Tabela 4
Meses Valores (R$ 1.000,00)
Janeiro 12
Fevereiro 13
Maro 14
Abril 12
Maio 15
Junho 19
Julho 17
Agosto 18
Setembro 14
Outubro 16
Novembro 12
Dezembro 18
Jan
Fev
Mar
Abr
Mai
Jun
Jul
Ago
Set
Out
Nov
Dez
20
15
10
5
0
Srie 1
Figura 9
24
Unidade I
R
e
v
i
s

o
:

A
n
d
r

i
a

G
o
m
e
s

-

D
i
a
g
r
a
m
a

o
:

L

o

-

0
1
/
0
8
/
2
0
1
2
Grco carta geogrca
a representao grca de um mapa geogrco indicando um acontecimento, por exemplo,
a previso de tempo para determinado dia em determinado Estado ou pas. A gura a seguir um
cartograma que informa a produo de petrleo segundo suas regies geogrcas.
Cartograma 1.2 Produo de petrleo,
segundo regies geogrcas (milhes b/d) 2003
frica
Amricas
Central e do Sul
8,4
14,2
6,7
7,9
7,9
22,6
Oriente
Mdio
sia-Pacco
Europa e Ex-Unio Sovitica
Amrica do
Norte
Figura 10
Nota: inclui leo de xisto, leo de areias betuminosas o LGN, exceto para o Brasil.
Para o Brasil, inclui LGN e no inclui leo de xisto e leo de areias betuminosas.
Pictograma
a representao grca mais utilizada na atualidade por jornais e revistas, pois um grco de
forma atraente e de fcil interpretao. Mostra o fenmeno estudado inserido com um grco de linha,
coluna, barra ou de setor, conforme o exemplo a seguir, em que um outdoor aponta a verba gasta com
publicidade junto com um grco de linha para mostrar seu desempenho anual.
25
R
e
v
i
s

o
:

A
n
d
r

i
a

G
o
m
e
s

-

D
i
a
g
r
a
m
a

o
:

L

o

-

0
1
/
0
8
/
2
0
1
2
ESTATSTICA APLICADA
Figura 11
Publicidade em alta
Institucional
De utilidade
pblica
Oramento prev
aumento de 20%
em gastos da
administrao direta
Valor da
publicidade
Em R$ Milhes
2007 2008 2009 2010 2007 2008 2009 2010
80,1
120,2
158,1
167 532,1
425,1
294,7
152,6
Figura 12
Saiba mais
Aplicao de grcos de controle de Soma Acumulada (CUSUM) para
monitoramento de um processo de usinagem. Disponvel em: <http://
dspace.universia.net/bitstream/2024/542/1/ArtigoXVISIMPEP2009.PDF>.
Acesso em: 20 jul. 2012.
26
Unidade I
R
e
v
i
s

o
:

A
n
d
r

i
a

G
o
m
e
s

-

D
i
a
g
r
a
m
a

o
:

L

o

-

0
1
/
0
8
/
2
0
1
2
2.1 Elementos bsicos das tabelas
Uma forma de sintetizar os valores que uma ou mais variveis podem assumir por meio de uma
tabela.
Uma tabela constituda dos seguintes elementos:
Quadro 1
Ttulo
o conjunto de informaes que precede a tabela e contm a indicao dos fatores: o
qu? Quando? Onde?
Cabealho a parte superior da tabela que especica o contedo das colunas.
Corpo da tabela o espao que contm as informaes sobre o fenmeno observado.
Fonte a indicao da entidade responsvel pelo levantamento dos dados.
Ttulo Produo de petrleo em barris/dia
Estado e Regio
Total
Barris/dia
Cabealho
Rio de Janeiro 1.597.387
Coluna
indicadora
Esprito Santo 193.962
Amazonas 52.964
Bahia 49.472
Rio Grande do Norte 60.861
Sergipe 42.072
So Paulo 16.983
Alagoas 6.300
Cear 7.530
Paran (xisto) 3.393
Rodap
Figura 13
3 MEDIDAS DE TENDNCIA CENTRAL: MDIA, MODA E MEDIANA PARA
DADOS SIMPLES
No desenvolvimento de um estudo estatstico, muitas vezes invivel examinar todos os elementos
da populao de interesse para tirar concluses; pensando nisso, h medidas que possibilitam
condensar as informaes para esclarecer a fase analtica da estatstica descritiva. A inferncia
estatstica nos d elementos para generalizar, de maneira segura, as concluses obtidas da amostra
para a populao.
Quando se trata de amostra, a preocupao central que ela seja representativa.
27
R
e
v
i
s

o
:

A
n
d
r

i
a

G
o
m
e
s

-

D
i
a
g
r
a
m
a

o
:

L

o

-

0
1
/
0
8
/
2
0
1
2
ESTATSTICA APLICADA
Assim que decidimos extrair informaes por meio de um levantamento amostral, temos
imediatamente dois problemas:
denir cautelosamente a populao de interesse;
selecionar a caracterstica que iremos pesquisar.
Portanto, temos situaes prossionais em que nos bastam poucos dados ou estatsticas de dados
simples. Por outro lado, tm-se tambm situaes em que um nmero maior de elementos deve ser
investigado e tratado como distribuies de frequncia.
Quando estamos diante de um conjunto de dados, seja ele pequeno ou grande, em geral buscamos
medidas que possam ser usadas para indicar um valor que tende a representar melhor aquele determinado
conjunto de nmeros. E as medidas mais usadas nesse sentido so as chamadas medidas de tendncia
eventual ou central, que so a mdia, a mediana e a moda.
Sabe-se que esses valores sero medidos de forma distinta conforme um grande conjunto de dados
ou um pequeno conjunto de dados. Tambm o clculo desses valores ser afetado caso as variveis
sejam discretas ou contnuas.
Em estatstica, a mdia o valor mdio de uma distribuio ou de um conjunto de dados,
determinado segundo uma regra estabelecida a priori e que se utiliza para representar todos os
valores da distribuio. Existem diversas formas de calcular a mdia de um conjunto de nmeros,
por exemplo, algumas delas so: mdia aritmtica, mdia aritmtica ponderada, mdia geomtrica e
mdia harmnica.
Observao
Neste mdulo, trataremos do clculo dessas estatsticas para os
chamados dados simples ou conjuntos de dados com menos de 30
elementos.
3.1 A mdia aritmtica simples (x)
A mdia aritmtica um dos valores mais representativos de um conjunto de dados. Obtm-se o
valor da mdia aritmtica dividindo-se o somatrio dos valores do conjunto de dados pelo nmero de
valores total desse conjunto.
Na mdia aritmtica, temos como smbolo: x (l-se x trao ou x barra).
Assim, temos que, para a amostra, se calcula o valor mdio utilizando-se os seguintes parmetros:
28
Unidade I
R
e
v
i
s

o
:

A
n
d
r

i
a

G
o
m
e
s

-

D
i
a
g
r
a
m
a

o
:

L

o

-

0
1
/
0
8
/
2
0
1
2
x
x
n
i
i
n
=
=

1
, onde
x Mdia aritmtica da amostra (estimativa)
n Nmero de dados da amostra
x
i
Cada varivel da amostra
Vamos, agora, tomar um exemplo de mdia aritmtica. Supondo um conjunto de dados
x
i
= {2, 4, 6, 8, 10,12}, onde n = 6, temos:
x
x
n
i
i
n
= =
+ + + + +
=
=

1
2 4 6 8 10 12
6
7
Exemplo 1:
Uma amostra das notas das provas de matemtica dos estudantes da 7 srie de uma grande escola
de So Paulo x
i
, em que:
x
i
= {87, 42, 64, 58, 90, 90, 85, 63, 47, 74, 100, 94} e n = 12, temos:
x
x
n
i
i
n
= =
+ + + + + + + + + + +
=
=

1
87 42 64 58 90 90 85 63 47 74 100 94
12
74 5 ,
A nota mdia na prova de matemtica dos estudantes da 7 srie dessa escola de So Paulo, por
amostragem, 74,5.
Observao
So as propriedades que a mdia aritmtica simples possui que a fazem
a medida de tendncia central mais usada e mais importante de todas.
So propriedades da mdia aritmtica:
em um conjunto de dados, sempre possvel o clculo da mdia, independentemente de quais
elementos compem esse conjunto de dados;
em um determinado conjunto de dados, o valor da mdia ser nico e corresponder a uma constante;
todos os valores de determinado conjunto de dados iro afetar a mdia, se um valor se modica,
a mdia aritmtica tambm se modicar; somando-se ou subtraindo-se uma determinada
constante c a cada elemento de um determinado conjunto de dados x
i
= x
1
, x
2
, x
3
, ..., x
n
, a mdia
29
R
e
v
i
s

o
:

A
n
d
r

i
a

G
o
m
e
s

-

D
i
a
g
r
a
m
a

o
:

L

o

-

0
1
/
0
8
/
2
0
1
2
ESTATSTICA APLICADA
aritmtica car aumentada ou diminuda dessa constante c; se, por outro lado, multiplicarmos
cada elemento desse conjunto de dados por uma constante c, a nova mdia ser tambm
multiplicada por essa constante c; se dividirmos cada elemento do conjunto de dados por essa
mesma constante c, a mdia ser dividida por c.
Assim, se temos um conjunto x
i
= x
1
, x
2
, x
2
, ..., x
n
, a mdia ser:
x
x
n
i
n
1
1
1
=
=

, logo:
x
c x
n
x
x
n
nc
n
x x c
i
i
n
i
i
n
2
1
2
1
2 1
=
+
= + = +
= =

( )
a soma algbrica dos desvios dos nmeros de um conjunto de dados em torno da mdia zero,
isso pode ser representado da seguinte forma:
x x
i
=

0
Por exemplo, se temos um conjunto de dados x
i
= (2, 4, 6, 8, 10), onde n = 5, temos que:
x
x
i
i
= =
+ + + +
=
=

1
5
5
2 4 6 8 10
5
6
Se aplicarmos a frmula acima, temos:
x x x
i i
= = + + + +

6 2 6 4 6 6 6 8 6 10 6 ( ) ( ) ( ) ( ) ( )
x x
x x
i
i

= + + +
=
4 2 0 2 4
0
Observao
A mdia aritmtica a mais utilizada em nosso dia a dia. obtida
dividindo-se a soma das observaes pelo nmero delas.
3.2 A mdia aritmtica ponderada xp
Num conjunto de dados em que cada elemento ou cada observao possui a mesma importncia,
o clculo da mdia aritmtica simples mostrar bem a populao ou a amostra estudada. No
entanto, se queremos atribuir pesos distintos ou importncias distintas aos elementos de um
30
Unidade I
R
e
v
i
s

o
:

A
n
d
r

i
a

G
o
m
e
s

-

D
i
a
g
r
a
m
a

o
:

L

o

-

0
1
/
0
8
/
2
0
1
2
conjunto de dados, a estatstica a ser adotada a mdia aritmtica ponderada, em que a cada
valor x
i
dever ser atribudo um determinado peso p
i
. A expresso estatstica para o clculo da
mdia ponderada :
x
x p
p
p
i i
i
n
i
i
n
=
=
=

1
1
Supondo que um estudante tenha de efetuar uma srie de quatro exames para obter sua mdia
nal e passar de ano, cada exame possui um peso diferente na composio dessa mdia, conforme a
tabela a seguir:
x
x p
p
x
p
i i
i
n
i
i
n
p
=
=
+ + +
=
=

1
1
0 30 68 0 20 89 0 40 45 01
,
( , ) ( , ) ( , ) ,
logo
00100
0 30 0 20 0 40 010
20 4 17 8 18 10 66 2
( )
, , , ,
, , ,
+ + +
= + + + = x
p
Exame Nota Peso
1 68 0,30
2 89 0,20
3 45 0,40
4 100 0,10
1,00
Figura 14
A nota mdia ser, ento, 66,2, resultado diferente do que seria obtido se utilizssemos a mdia
aritmtica simples.
Num conjunto de dados, em que cada elemento ou cada observao possui importncia diferente,
utilizamos a mdia aritmtica ponderada.
Exemplicando as mdias aritmtica e ponderada:
Mdia aritmtica exemplo: um aluno tirou as notas 5, 8 e 6 em trs provas. A sua mdia aritmtica
ser (5 + 8 + 6)/3 = 7,25.
Mdia ponderada exemplo: um aluno fez um teste (peso 1) e duas provas prova (peso
2), tirando 8 no teste, 5 na primeira prova e 6 na segunda prova. A sua mdia (ponderada)
ser [(1 x 8) + (2 x 5) + (2 x 6) ]/3 = 6. Se o teste e a prova tivessem o mesmo peso (e
no importa qual o valor do peso, importa apenas a relao entre os pesos), a mdia seria,
aproximadamente, 6,33.
Distribuio por frequncia a tabela em que se organizam grandes quantidades de dados,
determinando o nmero de vezes que cada dado ocorre frequncia (f
i
) e a porcentagem com que
aparece frequncia relativa (f
r
).
31
R
e
v
i
s

o
:

A
n
d
r

i
a

G
o
m
e
s

-

D
i
a
g
r
a
m
a

o
:

L

o

-

0
1
/
0
8
/
2
0
1
2
ESTATSTICA APLICADA
Observao
f
i
= n nmero total de observaes;
x
i
= valor da varivel ou pontos mdios de classes;
k = nmero de classes ou de valores individuais diferente da varivel.
Exemplo: em uma turma, a nota atribuda a 30 alunos, referente a um teste de estatstica, foi
disposta em ordem crescente: 4, 4, 4, 4, 5, 5, 5, 5, 5, 5, 5, 5, 6, 6, 6, 6, 6, 7, 7, 7, 7, 7, 8, 8, 8, 8, 9, 9, 10.
Observando que algumas notas se repetem, podemos utilizar o nmero de observaes ou frequncia
de cada um deles como o peso ou fator de ponderao.
Assim:
(4x4)+(7x5)+(5x6)+(5x7)+(4x8)+(2x9)+(1x10)
x = ------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------- = 6,29
4+7+5+5+4+2+1
Utilizando uma tabela para representar a distribuio de frequncia, temos:
Tabela 5
x
i
f
i
x
i
f
i
x
i
f
i
176
x = ------------------------------------ = --------------------------- = 6,29
n 28
4 4 4x4 = 16
5 7 5 x 7 = 35
6 5 6 x 5 = 30
7 5 7 x 5 = 35
8 4 8 x 4 = 32
9 2 9 x 2 = 18
10 1 10 x 1 = 10
28 176
3.3 A mediana (Md)
Outra medida importante de um conjunto de dados a mediana. A mediana divide determinado
conjunto de dados que dever estar ordenado em dois grupos iguais, em que metade ter valores
menores, e metade ter valores maiores que a mediana.
Antes de calcular a mediana, preciso organizar os valores num rol em ordem crescente, para ento
contar at a metade dos valores e encontrar a mediana. Em geral, aps organizarmos os dados em um
rol, podemos calcular a posio da mediana com a frmula a seguir:
32
Unidade I
R
e
v
i
s

o
:

A
n
d
r

i
a

G
o
m
e
s

-

D
i
a
g
r
a
m
a

o
:

L

o

-

0
1
/
0
8
/
2
0
1
2
(n+1)
Md = ----------------------------
2
Em que n o nmero de dados observados. Por exemplo, para um conjunto de dados
xi = {6, 9, 3, 5, 2, 9, 5, 5, 8, 7, 1, 7, 2}, em que n = 13, temos primeiro que organizar esses
dados em um rol e depois encontrar a posio da mediana para ento saber qual ser a
mediana. Seno, vejamos:
rolx
i
- {1, 2, 3, 5, 5, 5, 6, 7, 7, 8, 9, 9}
(n+1) 13+1
Md = ---------------------------- = ---------------------------- = 7
2 2
Md = 5
A mediana outra medida de posio denida como o nmero do meio, quando as medidas so
organizadas em ordem ascendente ou descendente. Em outras palavras, a mediana de um conjunto de
termos ordenados o valor situado de tal forma no conjunto que o separa em dois subconjuntos de
mesmo nmero de elementos.

Observao
Se o nmero de elementos for mpar, ento a mediana ser exatamente
o valor do meio. Se o nmero de elementos for par, ento a mediana ser
exatamente a mdia dos dois valores do meio.
Para determinar a mediana:
organize o conjunto de dados em um rol;
para um conjunto de dados cujo n = mpar, a mediana ser o valor do meio;
para um conjunto de dados cujo n = par, a mediana ser a mdia dos dois valores do meio.
Para um conjunto de dados x
i
= {6, 4, 8, 3, 2, 9, 7, 1}, em que n = 8, temos, ento:
rolx
i
= {1, 2, 3, 4, 6, 7, 8, 9}
(n+1) 8+1
Posio mediana = ---------------------------- = ---------------------------- = 4,5
2 2
A mediana ser o valor que est a meio caminho dos dois valores mdios; nesse caso, entre 4 e 6.
Como fazer? Deve-se tirar a mdia entre os dois valores do meio para obter o valor da mediana.
33
R
e
v
i
s

o
:

A
n
d
r

i
a

G
o
m
e
s

-

D
i
a
g
r
a
m
a

o
:

L

o

-

0
1
/
0
8
/
2
0
1
2
ESTATSTICA APLICADA
Assim, temos:
4 + 6
Md = ---------------------------- = 5
2
Observao
Quando usamos a mediana?
Empregamos a mediana quando:
desejamos obter o ponto que divide a distribuio em partes iguais;
h valores extremos que afetam de maneira acentuada a mdia;
a varivel em estudo salrio.
Em teoria da probabilidade e em estatstica, a mediana uma medida de tendncia
central, um nmero que representa as observaes de determinada varivel, de tal forma que
esse nmero, a mediana, de um grupo de dados ordenados, separa a metade inferior da amostra,
populao ou probabilidade de distribuio, da metade superior. Mais concretamente, 1/2 da
populao ter valores inferiores ou iguais mediana, e 1/2 da populao ter valores superiores
ou iguais mediana.
Em casos de populaes (n) mpares, a mediana ser o elemento de posio central
n+


1
2
.
Para os casos de populaes (n) pares, a mediana ser o resultado da mdia simples dos elementos

de posio central
n
e
n
2
1
2

. Por exemplo, para as seguintes sries, temos:


Exemplo 1
1, 3, 5, 7, 9, o n da srie mpar, temos:
n+


1
2
5 1
2
3 posio
A mediana igual a 5, pois a 3 posio da srie.
34
Unidade I
R
e
v
i
s

o
:

A
n
d
r

i
a

G
o
m
e
s

-

D
i
a
g
r
a
m
a

o
:

L

o

-

0
1
/
0
8
/
2
0
1
2
Exemplo 2
1, 2, 4, 7, 9, 10, o n da srie par, temos:
n n
e
n
e
2
1
2
6
3
1
2
3 4



e


3 e 4
A mdia ser a mdia entre o 3 e o 4 elemento da srie, que ser:
3 = 4
4 = 7
Md
Md
=
+

=
4 7
2
5 5 , Md = 5,5
3.4 A moda
Muitas vezes, em um conjunto de dados, existem valores que se repetem com frequncia maior.
A moda justamente esse valor ou esses valores que mais se repetem em um conjunto de dados.
possvel haver estatsticas que no possuam moda ou que possuam mais de uma moda.
No exemplo que demos anteriormente, para um conjunto de dados x
i
= {1, 2, 3, 4, 6, 7, 8, 9}, no
existe moda, e diz-se que o conjunto ou distribuio amodal.
A moda uma estatstica muito mais descritiva e sua importncia cresce medida que um valor ou grupo
de valores se repete mais que outros, e nesse sentido a moda indicaria o valor tpico daquele conjunto de
dados com maior ocorrncia. Por exemplo, o conjunto de dados x
i
= {2, 2, 7, 9, 9, 9, 10, 10, 11, 12, 18} tem
moda igual a 9, porque o nmero 9 aquele com maior frequncia, repetindo-se trs vezes.
Denominamos moda o valor ou valores de um conjunto de dados que aparecem com maior
frequncia em uma srie. Por exemplo: o salrio modal dos professores de uma escola o salrio mais
comum, isto , o salrio recebido pelo maior nmero de empregados dessa escola.
A moda pode apresentar mais de um valor, diferentemente da mdia ou da mediana. especialmente
til quando os valores ou observaes no so numricos, uma vez que a mdia e a mediana podem no
ser bem denidas.
A moda de {pera, pera, banana, limo, limo, limo, pssego} limo.
35
R
e
v
i
s

o
:

A
n
d
r

i
a

G
o
m
e
s

-

D
i
a
g
r
a
m
a

o
:

L

o

-

0
1
/
0
8
/
2
0
1
2
ESTATSTICA APLICADA
A srie {1, 3, 4, 5, 5, 6, 6} apresenta duas modas (bimodal): 5 e 6.
A srie {1, 3, 2, 5, 8, 7, 4, 9} no apresenta moda.
Exemplo
Sabendo-se que a produo leiteira diria de uma vaca, durante uma semana, foi de 10, 14, 13, 15,
16, 18 e 12 litros, pede-se que se encontre a mdia, a moda e a mediana para a produo diria de leite
dessa vaca.
Mdia
x
x
n
i
i
n
= =
+ + + + + +
= =
=

1
10 14 13 15 16 18 12
7
98
7
14
Logo, x = 14 litros de leite em mdia por dia, o que signica uma produo de 98 litros de leite em
mdia por semana.
Observao
A mdia pode ser um nmero diferente de todos os valores da amostra
que ela representa.
Moda
Como no possui um valor que aparece com maior frequncia que os outros, no h valor de moda
para esse exemplo.
Mediana
Ordenando os dados de forma crescente, temos: 10 - 12 - 13 - 14 - 15 16 18
Md
n
Md
Md
=
+


=
+


=
1
2
7 1
2
4
Mediana ser o 4 elemento da srie, que igual a 14 litros de leite por dia.
36
Unidade I
R
e
v
i
s

o
:

A
n
d
r

i
a

G
o
m
e
s

-

D
i
a
g
r
a
m
a

o
:

L

o

-

0
1
/
0
8
/
2
0
1
2
Observao
Cada frequncia acumulada a soma das frequncias anteriores
classe.
f
1
a = f
1
f
2
a = f
1
a + f
2
f
3
a = f
2
a + f
3
f
4
a = f
3
a + f
4
...........
f
n
a = f
(n-1)
a + f
n
3.5 Posio relativa da mdia, moda e mediana
Em uma distribuio de frequncias simtricas, as medidas de mdia, mediana e moda coincidem.
J quando a assimetria torna-se diferente, essa diferena tanto maior quanto a assimetria.
Resumidamente, temos:
(a) (b) (c)
x = Md = Mo Mo Md x x Md Mo
Figura 15 - Distribuies: (a) simtrica, (b) assimtrica e (c) assimtrica negativa.
a) x = xmd = M
o
curva simtrica
b) M
o
< xmd < x curva assimtrica positiva
c) x < xmd < M
o
curva assimtrica negativa
4 MEDIDAS DE DISPERSO PARA DADOS SIMPLES
Observamos que a moda, a mediana, e a mdia podem ser usadas para condensar, num nico nmero,
aquilo que mdio ou tpico de um conjunto de dados. No entanto, a informao fornecida pelas
medidas de posio necessita, em geral, ser complementada pelas medidas de disperso. Essas medidas
so usadas para indicar o quanto os dados se apresentam dispersos em torno da regio central. Dessa
forma, caracterizam o grau de variao existente no conjunto de valores. As medidas de disperso mais
utilizadas so:
amplitude total;
37
R
e
v
i
s

o
:

A
n
d
r

i
a

G
o
m
e
s

-

D
i
a
g
r
a
m
a

o
:

L

o

-

0
1
/
0
8
/
2
0
1
2
ESTATSTICA APLICADA
desvio padro;
varincia;
coeciente de variao.
Note que, quanto maiores forem as medidas de disperso, mais heterogneos so os dados e, ao
contrrio, quanto menores forem essas medidas, mais homogneo o conjunto.
Vejamos a seguir alguns exemplos que mostram a necessidade de conhecermos as medidas de disperso.
Exemplo 1
Sabe-se que em Honolulu (Hava) e em Houston (Texas) a temperatura mdia diria quase a
mesma, em torno de 23,9 C. Pergunta-se: ser que, por isso, podemos inferir que a temperatura seja
basicamente a mesma em ambas as localidades? Ou no ser possvel que, enquanto uma cidade
melhor para natao, a outra o seja para atividades externas?
A temperatura em Honolulu varia muito pouco ao longo do ano, oscilando, em geral, entre 21,1 C
e 26,7 C. Por outro lado, a temperatura em Houston pode diferir sazonalmente (nas estaes do ano),
isto , apresentar-se baixa em janeiro (cerca de 4,4 C) e alta em julho e agosto (bem perto de 37,8 C).
Logo, podemos perceber uma oscilao signicativa. Desnecessrio dizer que as praias em Houston no
esto cheias de gente o ano todo.
Exemplo 2
Suponha que, numa particular cidade, tanto ladres quanto professores secundrios tenham uma
renda mdia mensal de R$ 900,00. Ser que essa informao indica que as duas distribuies de renda
so, necessariamente, semelhantes? Muito ao contrrio, poder-se-ia descobrir que elas diferem, e
muito, num outro aspecto importante, que o fato de as rendas dos professores concentrarem-se ao
redor de R$ 900,00 (serem constantes, homogneas), enquanto as dos ladres espalham-se mais (so
descontnuas, heterogneas), o que reete, portanto, maiores oportunidades para prises, desemprego,
pobreza e, em alguns casos, fortunas excepcionais.
Os fatos mostram que precisamos, alm de uma medida de tendncia central, de um ndice que
sinalize o grau de disperso dos dados em torno da mdia. Esse ndice uma medida indicativa do que
costumamos chamar de variabilidade ou disperso.
Retornando ao exemplo 1, poderamos concluir que a distribuio de temperatura em Houston
(Texas) tem maior variabilidade do que a distribuio de temperaturas em Honolulu (Hava). Da mesma
forma, podemos dizer que a distribuio de rendas entre professores apresenta menos variabilidade do
que a distribuio de rendas entre ladres.
Assim, quando se deseja entender, analisar e descrever de forma adequada um determinado conjunto
de dados, faz-se necessrio dispor no apenas de informaes relativas s medidas de posio. preciso
38
Unidade I
R
e
v
i
s

o
:

A
n
d
r

i
a

G
o
m
e
s

-

D
i
a
g
r
a
m
a

o
:

L

o

-

0
1
/
0
8
/
2
0
1
2
que se disponha de informaes relativas variabilidade (disperso) daqueles nmeros que compem o
referido conjunto de dados. Essas medidas de variabilidade ou disperso indicam se os dados observados
esto prximos ou separados uns dos outros.
Diferente das medidas de posio, as medidas de disperso no so autoexplicativas, sua aplicabilidade
depende da comparao de populaes ou de amostras do mesmo tamanho e da mesma caracterstica
para que se obtenha alguma informao importante a partir daquela determinada variabilidade.
As principais medidas de disperso so: a amplitude total (ou intervalo), o desvio mdio, a varincia
e o desvio padro. A mdia serve de referncia para todas essas medidas, exceto para o intervalo (ou
amplitude total). proporo que essas medidas se elevam, isso representa um aumento da disperso,
o que signica que, se a medida for igual a zero, no existe disperso.
As medidas de variabilidade, que tm a mdia aritmtica como ponto de referncia, so importantes
porque nos permitem avaliar o grau de disperso das observaes em relao a essa mesma mdia,
isto , permitem-nos avaliar o quo distante os dados de um determinado grupo de observaes esto
da mdia calculada, dando-nos uma noo mais precisa da situao de determinada populao ou
amostra, alm de condies de tirar concluses e informaes importantes daqueles dados disponveis.
Exemplo 3
Um estudante de economia resolve fazer uma pesquisa sobre os salrios mdios dos funcionrios
de determinado setor industrial em So Paulo. Nessa pesquisa, esse estudante conseguiu os seguintes
dados em termos de salrios mnimos mensais:
x
i
= {1.0; 1.5; 2.0; 2.0; 2.0; 2.5; 3.0; 3.0; 80.0; 85.0}
Ao calcular o salrio mdio desse setor, ele chegou ao valor mdio de 18,2 salrios mnimos por ms.
Ora, mas esse dado, sem o clculo de sua disperso em relao mdia aritmtica, pouco nos diz sobre
a realidade dessa populao, e acabamos por ter uma viso distorcida do padro de vida da maior parte
dos funcionrios desse setor analisado pelo estudante. As medidas de variabilidade ou disperso nos
permitem perceber essa distoro.
Temos, como principais medidas de disperso, intervalo, desvio mdio, varincia e desvio padro.
As medidas mais comuns de variabilidade para dados quantitativos so a varincia; a sua raiz
quadrada e o desvio padro. A amplitude total, a distncia interquartlica e o desvio absoluto so mais
alguns exemplos de medidas de disperso.
4.1 Amplitude total
O intervalo ou amplitude total de determinado conjunto de dados obtido pela diferena entre o
maior e o menor valor nesse conjunto de nmeros. Indica, portanto, a distncia entre a maior e a menor
observao de um conjunto de dados. Assim, temos:
39
R
e
v
i
s

o
:

A
n
d
r

i
a

G
o
m
e
s

-

D
i
a
g
r
a
m
a

o
:

L

o

-

0
1
/
0
8
/
2
0
1
2
ESTATSTICA APLICADA
Amplitude
total
= Valor
mximo
- Valor
mnimo
Por exemplo, num conjunto de dados x
i
= {2, 3, 3, 5, 5, 5, 8, 10, 12}, em que n = 9, a amplitude total
ser:
A
total
= V
mximo
- V
mnimo
= 12 - 2 = 10
Em alguns casos, o intervalo ou amplitude total pode ser expresso simplesmente pela indicao
do menor e do maior nmero do conjunto de dados. No caso do exemplo anterior, a amplitude total
poderia ser expressa simplesmente pela identicao do menor e do maior nmero, indicada como
sendo de (2 a 12) ou (2 12).
A grande vantagem da amplitude total que ela apresenta certa facilidade de ser calculada, mesmo
quando o conjunto de dados observados relativamente grande. No entanto, como a amplitude total
apenas leva em conta os dois extremos do conjunto de nmeros, em alguns casos ela pode ser uma
medida enganosa quanto indicao da disperso de um conjunto de nmeros, tendo, portanto, uma
utilidade limitada.
O intervalo de determinado conjunto de dados obtido pela diferena entre o maior e o menor valor
nesse conjunto de nmeros.
4.2 Desvio mdio absoluto
O desvio mdio absoluto inaugura o estudo das medidas de variabilidade que tm a mdia como
ponto de referncia.
O chamado desvio nada mais que a diferena entre cada valor de determinado conjunto de
dados e a mdia desse mesmo conjunto de nmeros (x
i
- x). O valor absoluto de um nmero ser
ele prprio, sem o sinal que lhe associado, e indicado por meio de duas linhas verticais que o
enquadram.
Assim, |-67| = 67; |9| = 9.
preciso calcular primeiro a mdia aritmtica dos dados disponveis, que em geral se apresentam
como dados amostrais.
O desvio mdio absoluto ser calculado pela mdia dos desvios dos valores a contar da mdia,
ignorando o sinal (+ ou -) do desvio, ou seja, convertendo os valores dos desvios em valores absolutos,
considerando-os todos desvios positivos. Assim, temos:
D
mdio
=
x x
n
i
i
n

1
40
Unidade I
R
e
v
i
s

o
:

A
n
d
r

i
a

G
o
m
e
s

-

D
i
a
g
r
a
m
a

o
:

L

o

-

0
1
/
0
8
/
2
0
1
2
Em que n o nmero de observaes.
Vamos, agora, tomar um exemplo de desvio mdio. Num conjunto de dados amostrais x
i
= {2, 4, 6, 8, 10, 12},
em que n = 6, determine o desvio mdio. Temos, ento:
D
mdio
=
x x
n
i

Precisamos, primeiro, calcular a mdia, para ento passarmos ao clculo do desvio mdio. Relembrando
a frmula do clculo da mdia aritmtica, temos:
x
x
n
x x
i
= =
+ + + + +
= =

2 4 6 8 10 12
6
7 7
Agora, podemos calcular os desvios para cada valor do conjunto de dados. Assim, temos:
x
i
- x
D
mdio
=
x x
n
i

=
+ + + + + 5 3 1 1 3 5
6
D
mdio
=
5 3 1 1 3 5
6
3
+ + + + +
=
D
mdio
= 3
2 7 - 5
4 7 - 3
6 7 - 1
8 7 1
10 7 3
12 7 5
0
Figura 16
O valor encontrado anteriormente representa a diferena mdia de cada observao e a mdia da
distribuio, mas tambm nesse caso s seria possvel obter mais informaes a partir do desvio mdio
comparando com outras populaes ou amostras de mesmas caractersticas. Por exemplo, se outro
conjunto de dados, com as mesmas caractersticas e tamanho, apresentasse um desvio mdio absoluto
igual a 2,4, ou seja, menor que o desvio mdio absoluto calculado no exemplo anterior, poder-se-ia dizer
que esse segundo conjunto de valores mais homogneo do que o nosso exemplo, j que a diferena
de cada um dos seus elementos em relao mdia aritmtica menor. Teramos, assim, uma disperso
menor.
O desvio que a diferena entre cada valor de determinado conjunto de dados a mdia desse
mesmo conjunto de nmeros.
4.3 Varincia
Como no clculo do desvio mdio, para o clculo da varincia, precisaremos utilizar o desvio de
cada elemento de um conjunto de dados em relao mdia aritmtica (x
i
- x). No entanto, ao invs de
41
R
e
v
i
s

o
:

A
n
d
r

i
a

G
o
m
e
s

-

D
i
a
g
r
a
m
a

o
:

L

o

-

0
1
/
0
8
/
2
0
1
2
ESTATSTICA APLICADA
trabalharmos com os valores absolutos (em mdulo), agora os desvios so elevados ao quadrado antes
da soma. Para o caso de dados amostrais, ao invs de dividirmos por n, dividimos por n 1 (que o total
da amostra menos uma unidade).
A varincia ir nos dizer o grau de disperso de determinado grupo de dados com relao mdia
aritmtica desses nmeros. Assim, a varincia populacional poder ser calculada da seguinte forma:


2
2
=

( ) x
n
i
, onde

2
: Varincia populacional;
x
i
: Cada observao do conjunto de
dados populacional;
: Mdia da populao;
n: Nmero de observaes.
A varincia amostral poder ser calculada pela seguinte frmula:
s
x x
n
i 2
2
1
=

( )
, onde
s
2
: Varincia da amostra;
x
i
: Cada observao do conjunto
amostral;
x: Mdia da amostra;
n: Nmero de observaes da
amostra.
Por exemplo, seja determinado conjunto de dados x
i
= {1, 3, 5, 7, 9, 11, 13}, em que n = 7. Calcule a
varincia desse conjunto de dados, supondo:
que esse conjunto de dados representa toda uma populao;
que esse conjunto de dados representa uma amostra.
A) Para calcular a varincia desse conjunto de dados, considerando que ele representa toda uma
populao, devemos utilizar a seguinte frmula:


2
2
=

( ) x
n
i
Devemos passar ao clculo da mdia desse conjunto de dados para, ento, proceder ao clculo da
varincia. Sendo assim, temos:

= =
=
+ + + + + +
=
=

x
n
i
1 3 5 7 9 11 13
7
7
7
(mdia populacional)
42
Unidade I
R
e
v
i
s

o
:

A
n
d
r

i
a

G
o
m
e
s

-

D
i
a
g
r
a
m
a

o
:

L

o

-

0
1
/
0
8
/
2
0
1
2
Partindo da mdia, podemos agora calcular os desvios e partir para o clculo da varincia populacional,
j que supomos que o conjunto de dados representava toda a populao. Assim, temos:
x
i
- (x
i
- )
2

2
2
2
2 2 2 2 2 2
2
6 4 2 2 4 6
7
36 16 4 4 16
=

=
+ + + + +
=
+ + + + +

( )
( ) ( ) ( )
x
N
i
336
7
16
16
2
=
=
7 7 1 = 6 6
2
7 7 3 = 4 4
2
7 7 5 = 2 2
2
7 7 7 = 0 0
7 7 9 = - 2 (-2)
2
7 7 11 = - 4 (-4)
2
7 7 13 = - 6 (-6)
2
0 112
Figura 17
Desse modo, a varincia populacional desse conjunto de dados seria igual a 16.
B) Se, por outro lado, temos o mesmo conjunto de dados e supondo que ele representa apenas dados
amostrais, devemos calcular a varincia amostral de outra forma, partindo do clculo da mdia
para, ento, calcularmos a varincia.
Como vimos no item 2, a expresso para o clculo da mdia aritmtica em uma amostra a mesma
do clculo da mdia para uma populao, mas utilizaremos para as amostras outra notao. Vejamos:
x
x
n
x
i
= =

7 (mdia amostral).
Normalmente, a mdia amostral aproxima-se da mdia populacional quanto maior o tamanho da
amostra, mas no se iguala a ela.
Passemos, ento, ao clculo da varincia amostral. Utilizaremos os mesmos passos do clculo da
varincia populacional. Dessa forma:
s
x x
n
i 2
2
1
=

( )
x x
i
- x (x
i
- x)
2
S
x x
n
S
S
i 2
2
2
2 2 2 2 2 2
2
1
6 4 2 2 4 6
7 1
36 16 4 4
=

=
+ + + + +

=
+ + +

( )
( ) ( ) ( )
++ +

=
=
16 36
7 1
112
6
18 666
2
S , ...
7 7 1 = 6 6
2
7 7 3 = 4 4
2
7 7 5 = 2 2
2
7 7 7 = 0 0
7 7 9 = - 2 (-2)
2
7 7 11 = - 4 (-4)
2
7 7 13 = - 6 (-6)
2
0 112
Figura 18
43
R
e
v
i
s

o
:

A
n
d
r

i
a

G
o
m
e
s

-

D
i
a
g
r
a
m
a

o
:

L

o

-

0
1
/
0
8
/
2
0
1
2
ESTATSTICA APLICADA
A varincia amostral desse conjunto de dados igual a 18,666.
Como a mdia aritmtica, a varincia possui algumas propriedades importantes que devemos colocar
em destaque e que facilitam o clculo de alguns problemas mais complexos.
A) Somando-se ou subtraindo-se uma constante a cada elemento de um conjunto de dados, o valor
da varincia no se altera.
Por exemplo, um conjunto de dados x
i
= {2, 4, 6, 8}, em que n = 4, e a mdia igual a 5. A varincia
desse conjunto ser dada como segue:

2
2
2
2 2 2 2
2
2 2
2 5 4 5 6 5 8 5
4
3 1
=

=
+ + +
=
( ) + ( )

( )
( ) ( ) ( ) ( )
x
n
i
++ +
=
+ + +
= =
1 3
4
9 1 1 9
4
20
4
5
2 2
Se somarmos uma constante c = 4 a cada um dos elementos do conjunto de dados, temos um novo
conjunto de dados y
i
= {6, 8, 10, 12}, em que a mdia ser igual a 9. A varincia ser, ento:

2
2 2
2
2 2 2 2
2
2
2
6 9 8 9 10 9 12 9
4
3 1
=

=
( ) + ( ) + ( ) + ( )
=
( ) + (

( ) y
n
i
)) + ( ) + ( )
=
+ + +
= =
2 2 2
1 3
4
9 1 1 9
4
20
4
5
Sendo assim, demonstramos que
2
2
2
= =, ou seja, ao somarmos uma constante a cada elemento
de um conjunto de dados, a varincia permanece a mesma.
B) Ao multiplicarmos uma constante c a cada elemento de um conjunto de dados, temos uma nova
varincia ao multiplicarmos a varincia do conjunto de dados original por c
2
.
Assim, a nova varincia ser representada da seguinte forma:

2
2 2
1
2
= c .
C) Ao dividirmos cada elemento de um conjunto de dados por uma constante arbitrria c, obtemos
a nova varincia dividindo-se a antiga varincia por c
2
.
Assim, podemos apresentar a nova varincia da seguinte forma:


2
2 1
2
2
=
c
D) A varincia de uma constante igual a zero.
44
Unidade I
R
e
v
i
s

o
:

A
n
d
r

i
a

G
o
m
e
s

-

D
i
a
g
r
a
m
a

o
:

L

o

-

0
1
/
0
8
/
2
0
1
2
Existe uma frmula alternativa e reduzida para o clculo da varincia populacional, deduzida da
frmula original, que :

2
2
2
=

x
n
i
Para a varincia amostral, tambm existe uma frmula alternativa bastante utilizada que no exige
o clculo da mdia e que decorre da frmula anterior:
s
x x n
n
x
i i 2
2 2
1
=


( )
Lembrete
Relembrando as propriedades de varincia:
ao somarmos uma constante a cada elemento de um conjunto de dados, a varincia permanece
a mesma;
ao multiplicarmos uma constante c a cada elemento de um conjunto de dados, temos uma nova
varincia ao multiplicarmos a varincia do conjunto de dados original por c2;
ao dividirmos cada elemento de um conjunto de dados por uma constante arbitrria c, obtm-se
a nova varincia dividindo-se a antiga varincia por c2;
varincia de uma constante igual a zero.
Saiba mais
Para aprofundamento do tema desta unidade, seguem alguns links que
podem auxili-lo:
Mtodos quantitativos e estatsticos para a tomada de deciso.
Disponvel em: <http://www.santahelena.ueg.br/posgraduacao/mba/2007/
download/metodosquantitativos/METODOS_QUANTITATIVOS_PARTE_I.pdf>.
Acesso em: 25 jul. 2012.
Estatstica exploratria. Disponvel em: <http://www.cin.ufpe.br/~psb/
EAD/Estatistica%20Exploratoria%20-%20Volume%201%20v11.pdf>.
Acesso em: 25 jul. 2012.
45
R
e
v
i
s

o
:

A
n
d
r

i
a

G
o
m
e
s

-

D
i
a
g
r
a
m
a

o
:

L

o

-

0
1
/
0
8
/
2
0
1
2
ESTATSTICA APLICADA
4.4 Desvio padro
Obtm-se o desvio padro extraindo-se a raiz quadrada da varincia. Assim como a varincia e
o desvio mdio, o desvio padro tambm representa uma medida de variabilidade absoluta, e indica
o desvio de cada um dos nmeros x
i
de um dado conjunto de observaes em relao mdia .
tambm chamado por alguns autores de desvio da raiz mdia quadrtica.
Matematicamente, o desvio padro poder ser representado da seguinte forma:
Desvio padro populacional Desvio padro amostral

( ) x
n
i
2

s
x x
n
i
=

( )
2
1
Por exemplo, um conjunto de dados amostrais x
i
= {2, 4, 6}, em que n = 3 e a mdia igual a 4.
Vamos, ento, calcular o desvio padro para a amostra:
s
x x
n
s
i
=

=
+ +

=
=
+ +
= = =

( )
( ) ( ) ( )
( )
2
2 2 2
2 2
1
2 4 4 4 6 4
3 1
2 0 2
2
8
2
4 2
Esse conjunto de dados ir apresentar um desvio padro igual a 2.
As propriedades da varincia tambm so aplicveis ao desvio padro. No entanto, existem duas
propriedades que sero distintas no caso do desvio padro por causa de sua caracterstica de raiz
quadrada mdia positiva da varincia.
Assim, ao multiplicarmos cada elemento de um conjunto de dados por uma constante c, o novo
desvio padro ser igual ao antigo multiplicado pela constante. Temos, ento:

2
= c .
1
Por outro lado, se dividirmos cada elemento de um conjunto de dados por uma constante c, o novo
desvio padro ser igual ao anterior dividido pela constante c. Assim, temos:


2
1
=
c
As demais propriedades da varincia sero as mesmas para o desvio padro.
46
Unidade I
R
e
v
i
s

o
:

A
n
d
r

i
a

G
o
m
e
s

-

D
i
a
g
r
a
m
a

o
:

L

o

-

0
1
/
0
8
/
2
0
1
2
4.5 Coeciente de variao
Em estatstica descritiva, o coeficiente de variao serve para indicar se o desvio padro
grande ou pequeno em relao mdia aritmtica da srie que est sendo estudada; portanto,
uma comparao entre o desvio padro e a mdia aritmtica de uma pesquisa que vai determinar
em porcentagem o quanto houve de desvio em relao mdia. O coeficiente de variao
calculado por:
Cv
s
x
=
, onde:
S = desvio padro;
x = mdia aritmtica, que pode ser de uma srie populacional ou amostral.
Por exemplo, no item 3.4, foi determinado o desvio padro de uma srie amostral, portanto, vamos
calcular o coeciente de variao dessa srie, que ser:
Cv
S
x
Cv
Cv
Cv
=
=
=
=
2
4
0 5
50
,
%
Nesse exemplo, o coeciente de variao grande, indica que a variabilidade foi a metade em
relao mdia dessa srie.
As propriedades da varincia se aplicam ao desvio padro, exceto:
quando multiplicarmos cada elemento de um conjunto de dados por uma constante c, o novo
desvio padro ser igual ao antigo multiplicado pela constante;
quando dividirmos cada elemento de um conjunto de dados por uma constante c, o novo desvio
padro ser igual ao anterior dividido pela constante c.
Em probabilidade e estatstica, o desvio padro a medida mais usada da disperso estatstica.
No seno como a raiz quadrada da varincia, ou, ainda, a raiz quadrada da mdia aritmtica dos
quadrados dos desvios, tomados a partir da mdia aritmtica. denido dessa forma de modo a dar-nos
uma medida da disperso que seja:
um nmero que no seja negativo;
use as mesmas unidades de medida que os nossos dados.
47
R
e
v
i
s

o
:

A
n
d
r

i
a

G
o
m
e
s

-

D
i
a
g
r
a
m
a

o
:

L

o

-

0
1
/
0
8
/
2
0
1
2
ESTATSTICA APLICADA
Faz-se uma distino entre o desvio padro (sigma) do total de uma populao ou de uma varivel
aleatria e o desvio padro s de um subconjunto em amostra.
O termo desvio padro foi introduzido na estatstica por Karl Pearson, em seu livro Sobre a disseco
de curvas de frequncia assimtricas, de 1894.
Exemplo
Utilizando-se o exemplo apresentado anteriormente, temos que a produo leiteira diria de uma
vaca, durante uma semana, foi de 10, 14, 13, 15, 16, 18 e 12 litros, pede-se calcular a amplitude, o desvio
padro (S), a varincia (S
2
) e 5 o coeciente de variao (CV).
Soluo
Amplitude
R = 18 10 = 8 litros de leite, ou seja, a maior variao do nmero de litros de leite produzido por
dia pela vaca de 8 litros.
Observao
Sabemos que a mdia para esses dados : x = 14 litros de leite por dia.
Desvio padro
s
x x
n
x x x x xn x
n
i
n
=

( )

=

( )
+
( )
+ + ( )

=
=
1
2
1
1
2
2
2 2
1 1
...
10 14 14 14 13 14 15 14 16 14 18 14 12 1
2 2 2 2 2 2
( ) + ( ) + ( ) + ( ) + ( ) + ( ) + 44
7 1
2
( )

=
( ) + ( ) + ( ) + ( ) + ( ) + ( ) + ( ) +
=
+ + + + + +
=
4 0 1 1 2 4 2
6
16 0 1 1 4 16 4
6
4
2 2 2 2 2 2 2
22
6
=
7
2,65 litros de leite por semana
Varincia
S
2
= (S)
2
= (2,65)
2
7 (litros de leite)
2
Coeciente de variao
48
Unidade I
R
e
v
i
s

o
:

A
n
d
r

i
a

G
o
m
e
s

-

D
i
a
g
r
a
m
a

o
:

L

o

-

0
1
/
0
8
/
2
0
1
2
cv
S
x
= = =
2 65
14
0 1893
,
,
ou seja, existe uma variabilidade de 18,93% dos dados em relao mdia.
Saiba mais
Dica de leitura:
Anlise do risco na avaliao de projetos de investimentos: uma
aplicao do mtodo de Monte Carlos. Disponvel em: <http://www.
regeusp.com.br/arquivos/c6-Art7.pdf>. Acesso em: 18 jul. 2012.
Resumo
Nesta unidade, vimos que a estatstica utiliza mtodos matemticos
para solucionar problemas reais de tomada de deciso quando h incerteza.
Em situaes nas quais poderamos contar unicamente com a sorte,
temos um instrumento que nos possibilita aumentar as chances de tomar
a melhor deciso.
Utiliza ferramentas matemticas denidas e, mesmo lidando com
grande nmero de dados, essas ferramentas resumem a anlise em tabelas
ou grcos. Na prtica, a estatstica pode ser empregada como base
conceitual e fundamental em vrias outras cincias, inclusive em anlises
gerenciais.
Foram apresentados tambm os clculos de medidas de tendncia
central (mdia, mediana, moda), as quais so utilizadas para representar
a srie pesquisada. Vimos que, por meio delas, podemos observar o
comportamento da varivel que as originou, isto , nos d uma ideia da
tendncia de todo um conjunto de dados. E, ainda, foram apresentadas de
forma resumida as ideias de simetria e assimetria em funo das medidas
de tendncia central.
Foram abordadas questes a respeito da distribuio de frequncia
e suas representaes grcas, estudo das medidas de disperso e
variabilidade; e, por m, foi apresentado um estudo de introduo ao clculo
da probabilidade que nos ajuda a entender o signicado de fenmenos
aleatrios para o entendimento do que provvel e presumvel e ainda os
vrios tipos de fenmenos em distribuio de probabilidade.
49
R
e
v
i
s

o
:

A
n
d
r

i
a

G
o
m
e
s

-

D
i
a
g
r
a
m
a

o
:

L

o

-

0
1
/
0
8
/
2
0
1
2
ESTATSTICA APLICADA
Exerccios
Questo 1 (ENEM/2011 adaptada). Uma equipe de especialistas do centro meteorolgico de uma
cidade mediu a temperatura do ambiente, sempre no mesmo horrio, durante 15 dias intercalados,
a partir do primeiro dia de um ms. Esse tipo de procedimento frequente, uma vez que os dados
coletados servem de referncia para estudos e vericao de tendncias climticas ao longo dos meses
e anos. As medies ocorridas nesse perodo esto indicadas a seguir:
Dia do ms
Temperatura
(em C)
1 15,5
3 14
5 13,5
7 18
9 19,5
11 20
13 13,5
15 13,5
17 18
19 20
21 18,5
23 13,5
25 21,5
27 20
29 16
Em relao temperatura, os valores da mdia, mediana e moda so, respectivamente, iguais a:
A) 17
o
C, 17
o
C e 13,5
o
C.
B) 17
o
C, 18
o
C e 13,5
o
C.
C) 17
o
C, 13,5
o
C e 18
o
C.
D) 17
o
C, 18
o
C e 21,5
o
C.
E) 17
o
C, 13,5
o
C e 21,5
o
C
Resposta correta: Alternativa B.
50
Unidade I
R
e
v
i
s

o
:

A
n
d
r

i
a

G
o
m
e
s

-

D
i
a
g
r
a
m
a

o
:

L

o

-

0
1
/
0
8
/
2
0
1
2
Anlise das alternativas
Com os dados fornecidos, tem-se a seguinte tabela de frequncias:
x
i
13,5 14 15,5 16 18 18,5 19,5 20 21,5
f
i
4 1 1 1 2 1 1 3 1
1) Para calcular a mdia tem-se:
X

=
+ + + + + + + + 13 5 4 14 1 15 5 1 16 1 18 2 18 5 2 19 5 1 20 3 215 1
4
, . . , . . . , . , . . , .
++ + + + + + +
= =
1 1 1 2 1 3 1
255
15
17
A mdia 17
o
C.
2) A mediana (valor do oitavo termo) 18
o
C.
3) A moda 13,5
o
C.
Sendo assim,
A) Alternativa incorreta.
Justicativa: de acordo com os clculos.
B) Alternativa correta.
Justicativa: de acordo com os clculos.
C) Alternativa incorreta.
Justicativa: de acordo com os clculos.
D) Alternativa incorreta.
Justicativa: de acordo com os clculos.
E) Alternativa incorreta.
Justicativa: de acordo com os clculos.
Questo 2 (ENEM/2011). A participao dos estudantes na Olimpada Brasileira de Matemtica das
Escolas Pblicas (OBMEP) aumenta a cada ano. O quadro indica o percentual de medalhistas de ouro,
por regio, nas edies da OBMEP de 2005 a 2009.
51
R
e
v
i
s

o
:

A
n
d
r

i
a

G
o
m
e
s

-

D
i
a
g
r
a
m
a

o
:

L

o

-

0
1
/
0
8
/
2
0
1
2
ESTATSTICA APLICADA
Regio 2005 2006 2007 2008 2009
Norte 2% 2% 1% 2% 1%
Nordeste 18% 19% 21% 15% 19%
Centro-Oeste 5% 6% 7% 8% 9%
Sudeste 55% 61% 58% 66% 60%
Sul 21% 12% 13% 9% 11%
Disponvel em: http://www.obmep.org.br. Acesso em: abr. 2010 (adaptado).
Em relao s edies de 2005 a 2009 da OBMEP, qual o percentual mdio de medalhistas de ouro
da regio Nordeste?
A) 14,6%.
B) 18,2%.
C) 18,4%.
D) 19,0%.
E) 21,0%.
Resoluo desta questo na plataforma.

You might also like