You are on page 1of 324

TO

OS

QU
APL
ICA ANTI
TAT
DO
IVO
SA
S
NEG
C
IOS

Mtodos Quantitativos Aplicados a Negcios

TO
D

OS

QU
APL
ICA ANTI
TAT
DO
IVO
SA
S
NEG
C
IOS

Fundao Biblioteca Nacional


ISBN 978-85-387-3091-0

Paulo Afonso Bracarense


Ubiratan Vieira Guimares

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

Paulo Afonso Bracarense


Ubiratan Vieira Guimares

Mtodos Quantitativos Aplicados a Negcios

Edio revisada

IESDE Brasil S.A.


Curitiba
2012
Este material parte integrante do acervo do IESDE BRASIL S.A.,
mais informaes www.iesde.com.br

2008 IESDE Brasil S.A. proibida a reproduo, mesmo parcial, por qualquer processo, sem autorizao por
escrito dos autores e do detentor dos direitos autorais.

CIP-BRASIL. CATALOGAO-NA-FONTE
SINDICATO NACIONAL DOS EDITORES DE LIVROS, RJ
________________________________________________________________________________
B788m
Bracarense, Paulo Afonso, 1957Mtodos quantitativos aplicados a negcios / Paulo Afonso Bracarense, Ubiratan Vieira
Guimares. - 1.ed., rev. - Curitiba, PR : IESDE Brasil, 2012.
320p. : 24 cm
Inclui bibliografia
ISBN 978-85-387-3091-0
1. Negcios 2. Investimentos 3. Investimentos - Anlises. I. Guimares, Ubiratan
Vieira. I. Ttulo.
12-6746.

CDD: 332.6
CDU: 336.76

17.09.12 02.10.12
039220
________________________________________________________________________________

Capa: IESDE Brasil S.A.


Imagem da capa: Shutterstock

Todos os direitos reservados.

IESDE Brasil S.A.

Al. Dr. Carlos de Carvalho, 1.482. CEP: 80730-200


Batel Curitiba PR
0800 708 88 88 www.iesde.com.br

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

Paulo Afonso Bracarense


Doutor em Engenharia de Produo com concentrao em Inteligncia Artificial pela Universidade Federal de Santa Catarina (UFSC). Mestre
em Estatstica e Experimentao Agrcola pela
Escola Superior de Agricultura Luiz de Queiroz
(ESALQ-USP). Bacharel em Estatstica pela Universidade Federal do Paran (UFPR). Professor
da UFPR. Diretor Superintendente da Fundao
da Universidade Federal do Paran (Funpar).

Ubiratan Vieira Guimares


Mestre em Administrao com concentrao em
Sistemas de Informao para Tomada de Deciso pela Universidade Federal do Rio Grande do
Sul (UFRGS). Especialista em Estatstica Aplicada
e Qualidade e Produtividade pelo Instituto Brasileiro de Qualidade Nuclear (IBQN). Bacharel em
Estatstica pela Universidade Federal do Paran
(UFPR). Foi diretor executivo do Ibmec Educacional em Curitiba e Coordenador Acadmico dos
Programas Executivos MBA e CBA do Ibmec MG.
Atuou na consultoria de grandes empresas e instituies, tais como: Electrolux S/A, Grupo Positivo,
Renault, Volvo, Spaipa, Banco Mundial, BID, V&M,
entre outras.

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

sumrio
sumrio

Introduo conceitos e aplicaes


9 | Pblico-alvo
10 | Linguagem matemtica
11 | Modelagem matemtica dos fenmenos reais

12 | Os papis da teoria de probabilidades e da anlise de dados amostrais


13 | Organizao dos captulos do livro

Anlise de dados

19

19 | Problema
23 | Conceitos fundamentais
26 | Variveis categorizadas
29 | Variveis quantitativas
36 | Medidas estatsticas

Probabilidades e distribuies de probabilidades


61 | Problema
63 | Conceitos fundamentais
67 | Axiomas e regras de probabilidades
70 | Probabilidades conjunta, marginal, condicional e independncia
73 | Teorema de Bayes
75 | Distribuies de probabilidades discretas
80 | Variveis aleatrias discretas

Amostragem

95

95 | Problema
96 | Conceitos fundamentais
99 | Tipos de amostragem
103 | Tabela de nmeros aleatrios
105 | Principais tcnicas de amostragem
111 | Tamanho da amostra

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

rio

61

Estimao

129

129 | Problema
130 | Conceitos fundamentais
133 | A distribuio normal
143 | Distribuio amostral das mdias
146 | Distribuio amostral das propores
148 | Estimao por ponto
151 | Intervalo de confiana
156 | Testes de hipteses
156 | Hiptese nula versus hiptese alternativa

Anlise de regresso e de correlao

173

173 | Problema
174 | Conceitos fundamentais
179 | Construindo a reta de regresso
188 | Verificao da bondade do modelo
201 | Predio e intervalos de predio

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

sumrio
sumrio

Teoria da deciso

213

213 | Problema
214 | Conceitos fundamentais
216 | Critrios de escolha utilizando distribuio a priori
221 | Representao atravs de diagrama de deciso
223 | Estabelecimento de distribuies de probabilidades
229 | Tomada de decises baseada na utilidade esperada
230 | Tomada de deciso com probabilidades a posteriori

Anlise de sries temporais

249

249 | Problema
250 | Conceitos fundamentais
254 | Mtodo dos mnimos quadrados ordinrios
260 | Modelo de mdias mveis
273 | Outros mtodos de previso

Anexos

289

Referncias

319

rio

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

Apresentao

Mtodos Quantitativos
Aplicados a Negcios

Este livro foi escrito com o objetivo de fornecer


elementos tericos e tcnicos para profissionais
que necessitam tomar decises tendo como
material essencial conjuntos de dados que precisam ser analisados.
Um conjunto de dados, por si s, no passa de um
conjunto de dados. necessrio dominar uma
srie de tcnicas para que esses dados possam
gerar alguma informao. O patamar superior
da anlise de dados a aquisio do conhecimento. E ela s estar disponvel se ao domnio
terico do campo de atuao, experincia profissional e de vida e intuio do tomador de
decises forem trabalhadas as tcnicas quantitativas necessrias para agregar a esses atributos informaes provenientes de dados corretamente adquiridos.
O livro foi organizado de forma a cobrir toda a
base que compe o campo de conhecimento da
Estatstica. Comeando por tcnicas de estatstica descritiva e de anlise exploratria de dados,
passando pela medio da incerteza atravs da
teoria de probabilidades e pela compreenso
das possibilidades indutivas da teoria clssica
da Estatstica no trato com amostras.
Trs tcnicas teis e bastante utilizadas na rea
de negcios foram apresentadas em detalhes
balanceando-se a complexidade com a explorao da intuio. O trato conceitual foi priorizado
em relao ao trabalho matemtico extensivo.
Optamos por trabalhar com toda a conceituao
bsica at o quinto captulo, buscando ajudar o
leitor a desenvolver sua sensibilidade com relao aos conceitos abordados. Tratamos cada
tcnica com exemplos especficos e ilustrativos
na rea de Negcios.

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

Mtodos Quantitativos
Aplicados a Negcios

A cincia busca compreender os fenmenos


reais atravs de modelos, muitas vezes de
modelos matemticos muito prprios para
estudos realizados em ambiente de incerteza. A teoria de probabilidades e a teoria
estatstica clssica so ferramentas muito
teis para ajudar o tomador de decises em
sua opo por diferentes aes diante de
cenrios postos.
Esperamos que o contedo do livro, acompanhado das aulas, possa ser de grande valia
para os leitores. Estamos certos, no entanto,
que navegar por essas guas far com que
cada um se sinta mais confortvel em viver
e trabalhar em um mundo cercado de incertezas e que vale mais a pena compreender
o mundo dessa forma do que viver seguro,
acorrentado e mope na iluso das coisas
certas e absolutas.

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

Introduo conceitos
e aplicaes

Por que escrever mais um livro de Estatstica? De fato a literatura j fornece incontveis livros desse ramo da matemtica. Alguns mais tericos, outros
mais prticos. H tentativas inclusive de se escrever livros de estatstica sem
matemtica. H outros que se utilizam fartamente de um referencial complexo na matemtica para a discusso dos conceitos e das tcnicas estatsticas.
A grande preocupao dos autores foi oferecer comunidade estatstica e
principalmente no estatstica elementos que as auxiliassem na tarefa da
tomada de decises.

Pblico-alvo
Os livros de estatstica so bem diferentes, pois tratam a mesma questo
com abordagens diversas. O que leva um autor a escolher o tipo de abordagem,
a profundidade das discusses e o quanto de ferramental matemtico utilizar
depende fundamentalmente de seu pblico-alvo. Esta a chave da questo.
Muito bem, dessa forma devemos ento localizar nosso livro em razo do
nosso pblico-alvo. Este livro foi escrito para profissionais das mais diferentes reas do mundo dos negcios: economistas, contadores, engenheiros de
produo, administradores ou qualquer outro profissional chamado a tomar
decises e que esteja no nvel de gerncia ou pretenda alcan-lo. E mais, esperamos que o nosso pblico esteja realmente disposto a utilizar as tcnicas
oferecidas no livro em seu dia a dia.
O livro foi composto para um curso esbelto, no sentido de que pretende
fornecer os elementos mnimos necessrios para a utilizao de seu contedo
em poucas horas. Por isso, a seleo dos assuntos oferecidos, que so somente uma amostra do vastssimo campo da Estatstica, foi feita rigorosamente,
com as tcnicas mais utilizadas na ao gerencial. Mas h de ficar muito claro
que no se trata de um manual de aplicaes simplificado e essencialmente
prtico. O grande destaque o rigor conceitual na aplicao das tcnicas que
foram apresentadas sempre atravs de aplicaes em problemas corriqueiros da administrao.
Este material parte integrante do acervo do IESDE BRASIL S.A.,
mais informaes www.iesde.com.br

Introduo conceitos e aplicaes

Esse ltimo destaque norteou toda a redao do livro e fundamental


para que o tomador de decises consiga empregar as tcnicas expostas no
seu trabalho com a segurana necessria para que os resultados obtidos
possam efetivar mudanas de conduta ou aprofundamento de condutas j
empregadas. Para que a compreenso conceitual seja de fato um facilitador
da compreenso das tcnicas, ousamos acreditar que seja possvel aproximar do sentimento do leitor o contedo tcnico da intuio. Por isso, alm das
tcnicas, abusamos das analogias e no economizamos nas explicaes.
Evitamos o uso extensivo da matemtica. Ou, de outra forma, utilizamos
a mnima matemtica necessria para a apresentao dos conceitos e para
a soluo dos problemas. Sempre que possvel mantivemos o nvel de exigncia matemtica em patamares mais rudimentares possvel. Lembrando,
no entanto, que o livro dirigido para profissionais que buscam um nvel
de especializao superior ao dos cursos de terceiro grau e, portanto, certas
resistncias ao uso da matemtica precisaro ser ultrapassadas. Mas pretendemos tornar essa tarefa quase indolor.

Linguagem matemtica
Toda cincia tem sua linguagem prpria, assim, a Estatstica tem a sua e a
Matemtica tambm. Navegaremos por esses mares nem sempre sem turbulncias. Duas questes devem ser colocadas a respeito dessas linguagens.
A primeira o reconhecimento de que o emaranhado de notaes, notadamente na Estatstica, muitas vezes conduzem a confuses. Procuramos
amenizar um pouco essa dificuldade apresentando uma notao nica para
todas as tcnicas, expondo o significado de cada uma delas e mantendo-as
sempre mais prximas do que o mais usual, de forma que estudos complementares nas bibliografias sugeridas no se tornem mais um entrave para o
aprofundamento do conhecimento dos assuntos tratados.
A segunda questo de linguagem, e isso agora diz mais respeito matemtica, que procuramos evitar a retirada de concluses atravs de conceitos puramente matemticos. O caminho de usar a prpria matemtica para
induzir ou deduzir concluses sim muito frtil para quem tem o domnio
dessa linguagem. O que voc enxerga quando olha a expresso a2 = b2 +
c2? Se isso quer dizer mais ou menos a mesma coisa do que esta sequncia
de smbolos , voc no deve se preocupar muito. Essas letras no so
do alfabeto grego nem so runas, so letras do alfabeto cirlico. Um mate10

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

Introduo conceitos e aplicaes

mtico ou uma pessoa habituada com a linguagem matemtica enxergar


prontamente na expresso a2 = b2 + c2 um tringulo retngulo. Mas esse
nvel de exigncia no ser cobrado neste livro.
Naturalmente, esse conhecimento pode facilitar em certos momentos
a leitura do texto que estamos apresentando, mas o que o diferenciar da
maioria dos textos estatsticos possivelmente j encontrados pelo leitor
que neste livro no ser necessrio o domnio dessa linguagem. O que seria
bastante, no se pode deixar de dizer, mais confortvel para quem escreve.
Mas esse desafio foi extremamente estimulante na redao do texto.

Modelagem matemtica dos fenmenos reais


Os fenmenos que estudaremos esto no contexto do mundo da administrao e dos negcios. No s eles, mas praticamente todos os fenmenos
naturais ou no naturais esto eivados de incerteza. Segundo o estatstico
alemo Schumacher, quando Deus fez o mundo e desejou colocar nele um
ser inteligente ele pensou em duas situaes. A primeira, de fazer o mundo
completamente determinstico. Depois de muito refletir, concluiu que neste
mundo no haveria espao para o homem porque tudo j estaria pr-determinado e a inteligncia no seria de nenhuma utilidade. Pensou ento em um
mundo completamente aleatrio. Verificou tambm que no havia porque
colocar o homem inteligente neste mundo em que nada pode ser determinado, em que tudo ocorre devido ao acaso. Concluiu ento por um mundo que
tivesse os dois componentes: um determinstico e outro aleatrio. O papel
da Estatstica o de ajudar a compreender este mundo, particularmente no
comportamento aleatrio dos fenmenos.
A cincia tem procurado compreender os fenmenos da natureza atravs
de modelos que possam ajudar o pesquisador a construir uma certa racionalidade para a sua compreenso e muitas vezes para a sua interveno nos
fenmenos em foco. Boa parte deles construda sob pilares matemticos,
notadamente quando se utilizam de tcnicas estatsticas. Todo modelo construdo dessa forma implica fazer algumas restries ao comportamento do
fenmeno. O que se faz ento so simplificaes para que se possa domar a
complexidade do mundo real. Isso tem que ficar absolutamente claro. Quanto
mais complexo for o fenmeno em estudo, mais complexo ser o instrumental racional para compreend-lo.

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

11

Introduo conceitos e aplicaes

Esse limite tem que ser compreendido para no correr o risco de pensar
que o modelo possa substituir a realidade. E mais, a grande maioria dos compndios estatsticos alerta para o fato de que ela, a Cincia Estatstica, um
servidor leal quando usada com prudncia e sem arrogncia. Ela compe o
espectro das peas de evidncia na soluo de problemas que devem auxiliar o tomador de decises aliada ao conhecimento terico da matria em
estudo, da experincia extraestatstica e mesmo da intuio de quem deseja
administrar bem ou praticar a boa cincia. Como pea de evidncia, ela serve
mais para dar suporte do que fazer descobertas. Na fbula descrita pelo escritor escocs Andrew Lang, ele recomenda usar a Estatstica como o bbado
usa o poste, mais para apoio do que para iluminao.
A forma bsica dos modelos construdos para os fenmenos que comportam incerteza e so tratados atravs de modelagem matemtica : Y = f(x) + .
Nesse modelo, f(x) a componente determinstica e , a componente aleatria.
A tarefa do tomador de decises verificar, com base em alguma teoria que
envolva o assunto pesquisado, quais podem ser as alternativas para f(x) que
expliquem variaes de Y, e fazer suposies sobre o comportamento de que
o auxiliem no entendimento das variaes devidas ao acaso.

Os papis da teoria de probabilidades


e da anlise de dados amostrais
A componente aleatria, , chamada de erro estatstico ou resduo. Nela
esto todas as variveis menos importantes que podem explicar as variaes
de Y e tambm aquela parte genuinamente devida a oscilaes ocorridas ao
mero acaso.
Quando se fala de incerteza, de acaso, fala-se tradicionalmente de probabilidade. Mais recentemente, outras formas de se medir incerteza tm sido
propostas, como a lgica fuzzy, por exemplo, que ultrapassa os limites da
lgica clssica por admitir outros resultados, que no somente o dicotmico sim ou no, base aristotlica de toda a lgica clssica a partir da qual foi
construda a teoria de probabilidades. Mas para efeito do estudo das tcnicas apresentadas neste livro, construiremos toda a metodologia baseando-nos na probabilidade como medida de incerteza.
Dessa forma, a probabilidade pode ser definida como uma medida racional
de crena. Ela definida como um nmero entre 0 e 1 e busca medir o grau
12

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

Introduo conceitos e aplicaes

de incerteza associada a um fenmeno que no geral pode ser compreendido como alguma espcie de jogo em que fazemos apostas. As decises so
ento tomadas com base em quanto estamos dispostos a pagar no caso de
perdermos a aposta realizada. Naturalmente, se as consequncias de nossa
deciso errada forem muito graves, optaremos por apostar menos ou somente apostar com um certo grau mnimo de incerteza.
As tcnicas estatsticas utilizam-se fartamente de levantamento de dados
para a compreenso do fenmeno em estudo. Esses dados podem ser relativos a toda uma populao ou a uma parte dela chamada de amostra. Desejamos, obviamente, que a amostra represente a populao como um todo. Faremos observaes na amostra e a partir delas desejaremos fazer inferncias
para a populao. Veremos fartamente como isso pode ser feito, com rigor
cientfico, de forma a nos assegurarmos de que podemos compreender um
comportamento da populao a partir do comportamento da amostra.

Organizao dos captulos do livro


Convm, no entanto, antes de buscarmos fazer ilaes sobre a populao com base na amostra, explorar ao mximo as informaes que os dados
podem fornecer. Esta tarefa pode ser facilitada com o emprego de tcnicas
de estatstica descritiva e de anlise exploratria de dados. Esses assuntos
sero tratados no captulo 2 deste livro. Estudaremos as melhores formas de
tabular dados, de apresent-los em grficos adequados e de construir medidas que sintetizem as informaes necessrias para compreenso do fenmeno. Construir essas medidas tem por objetivo verificar o comportamento dos dados, que valores podem representar o comportamento geral dos
dados e como eles esto distribudos em torno de valores centrais e assim
por diante.
Quando falamos em amostragem, estamos de antemo reconhecendo
que um grau de incerteza est associado s medidas realizadas na amostra como candidatas a facilitadoras da compreenso do comportamento da
populao. Essa incerteza, como j especificado, ser tratada tendo como
base a teoria de probabilidades, que ser o tema do captulo 3. Este captulo
, entre todos, o que necessitar de maior trabalho matemtico. Entretanto,
essa talvez no seja a maior dificuldade do contedo do captulo, mas sim a
compreenso dos limites dos clculos que faremos.

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

13

Introduo conceitos e aplicaes

No lance de uma moeda honesta, a probabilidade de sair cara em um


lance pode ser ou um outro valor qualquer dependendo do que estamos
medindo. Se atirarmos a moeda cinco vezes, a probabilidade de sair cara exatamente no quinto lance sempre ? Depende de como olhamos o problema. Se olharmos somente para o quinto lance como um lance isolado, no
h dvidas do valor para a probabilidade de sair cara. Mas se por outro
lado estivermos interessados em calcular qual a probabilidade de sair cara
no quinto lance, aps quatro coroas, a probabilidade de sair cara no ser
mais igual a , com certeza ser um valor muito menor, conforme veremos
quando estudarmos o captulo de probabilidades. Esse fato no intuitivamente to fcil de ser percebido. E mostrar isso intuitivamente mais difcil
do que o simples clculo dessa probabilidade. Aqui, a linguagem matemtica facilitaria enormemente a compreenso do que est ocorrendo. Vamos
tentar compor essas duas formas de encarar o problema.
Tendo ento a noo da probabilidade, poderemos voltar ao trabalho
de destrinchar o comportamento dos dados atravs do estudo da forma de
produzi-los. Uma vez que nos deteremos fundamentalmente em retirar de
uma populao uma amostra de seus indivduos para quando estivermos
estudando-os, compreenderemos o comportamento da populao. Teremos que verificar quais so as melhores formas de se retirar esses dados e
de que tamanho dever ser essa parte da populao para que tenhamos
alguma segurana, medida atravs de probabilidades, em fazer afirmaes
sobre a populao.
Na matria que ser tratada no captulo 4, estudaremos tcnicas simples
mas eficientes de buscarmos amostras representativas da populao. No
temos dvidas que aps esse estudo o leitor aceitar o fato de que as pesquisas podem representar bem a opinio de eleitores ou de consumidores
quando falarmos de pesquisa de mercado. No momento pode ainda parecer
intuitivamente incorreto que uma amostra de tamanho 400 possa representar os eleitores de um municpio, mas que talvez uma amostra de 1 000 no
represente bem os eleitores de um bairro da cidade.
A nossa pretenso de falar da populao com base em elementos da
amostra passa pela compreenso de que descreveremos tanto a populao
como a amostra atravs de medidas estatsticas e da forma de comportamento dos dados que sero descritos atravs de distribuies de probabilidades.
Rigorosamente, essas medidas estatsticas sero medidas da prpria distribuio dos dados.
14

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

Introduo conceitos e aplicaes

Essa parte da estatstica chamada de inferncia estatstica ou de estatstica indutiva. Ela ser tratada no captulo 5, sobre estimao, em que trs
procedimentos sero estudados. O primeiro deles a chamada estimao
por pontos, na qual calculamos um valor na amostra, por exemplo, a mdia
de uma varivel, que dever servir como uma estimativa da mdia da populao. O segundo procedimento, chamado de estimao por intervalos
ou construo de intervalos de confiana, consiste em criar em torno do
valor do estimador pontual um intervalo em que esse valor possa estar
contido; associaremos esse intervalo a um certo nvel de confiana, relacionado com uma medida de probabilidade. E o terceiro procedimento
o de se fazer alguma afirmao sobre o valor de uma medida na populao atravs do estabelecimento de uma hiptese e ento realizar um teste
sobre essa declarao associado a uma certa probabilidade de estar-se errando na deciso. Esse procedimento conhecido como teste de hipteses
estatsticas.
O contedo at esse ponto do livro o mnimo obrigatrio a qualquer
livro que pretenda apresentar o principal da teoria que envolve a enormidade de procedimentos estatsticos que podem servir de auxlio na tomada
de decises. a partir desse ponto que os autores de livros de estatstica
devem decidir, de acordo com as necessidades do pblico que querem atingir, quais so as tcnicas teis para cumprir o seu objetivo. Optamos por trabalhar com trs tcnicas que podem ser amplamente utilizadas no auxlio
tomada de decises gerenciais para profissionais interessados nos chamados negcios.
No pretendemos com essa opo sugerir que essas tcnicas sejam suficientes. Muito pelo contrrio, gostaramos de poder estimular os leitores a
buscarem um maior aperfeioamento com a pesquisa na literatura de outras
tcnicas tambm teis. Contamos que esse marco introdutrio, disponvel
at o captulo 5, fornea instrumentos ao leitor para novas aventuras. No entanto, a nossa prtica no trabalho de aplicao de mtodos estatsticos aplicados a negcios nos leva a apresentar essas tcnicas neste livro por compreendermos que cobrem bem uma possvel lacuna no gerenciamento.
Elas so apresentadas nos captulos de 6 a 8. No captulo 6 discutiremos
Anlise de Regresso e Correlao, no captulo 7 a Teoria de Deciso Estatstica e no captulo 8 a Anlise de Sries Temporais e Modelos para Previso de
Demanda.

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

15

Introduo conceitos e aplicaes

Outras tcnicas estatsticas so bastante teis dependendo do ramo de


atuao de cada leitor. Tcnicas como: Controle Estatstico de Qualidade;
Anlise de Confiabilidade e de Sobrevivncia; Anlise de Credit Score; Planejamento de Experimentos; Anlise de Dados Categorizados; Anlise de Dados
Longitudinais; Nmeros ndices; Matemtica Atuarial; Processos Estocsticos
e Teoria de Filas; Anlise Multivariada; Anlise de Varincia; Testes No Paramtricos; Geoestatstica; Estatstica Espacial; Processos Estocsticos; e mais
uma infinidade de tcnicas estatsticas esto disponveis para aplicaes.
Para cada um desses tpicos h uma enormidade de livros especficos,
da mesma forma que h uma enormidade de outros livros para cada um
dos captulos que estamos apresentando. A abordagem de cada um desses
livros, o grau de complexidade dos conceitos e da matemtica envolvidos
que fazem de cada obra uma obra nica.

16

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

Anlise de dados

Problema
O departamento de Recursos Humanos da empresa ABC deseja readequar os salrios de seus funcionrios a partir de uma nova poltica de cargos e
salrios. A primeira providncia do coordenador do departamento foi verificar o perfil dos funcionrios da empresa.
Solicitou para um estudo preliminar a relao dos funcionrios em que
deveria constar algumas variveis para esse primeiro estudo: ordem de contratao, sexo, idade, salrio e setor.
Um auxiliar administrativo apresentou o seguinte quadro como resultado:
Nmero de
ordem

Nome

Sexo

Idade

Salrio
(R$)

Setor

A. L. Ferraz

49

1.714,00

Oper.

R. Abreu

48

1.701,00

Oper.

R. S. Reis

64

1.589,00

Oper.

N. Farias

37

1.418,00

Oper.

J. L. Jansen

42

1.000,00

Aux. Adm.

U. S. Machado

40

3.732,00

Tc.

F. Nogueira

21

1.330,00

Oper.

M. Pinheiro

33

1.307,00

Oper.

M. A. da Silva

39

1.282,00

Oper.

10

P. A. B. Costa

42

1.260,00

Oper.

11

H. F. Minho

39

975,00

12

N. M. de Lima

32

1.256,00

Oper.

13

C. F. Loureiro

22

1.185,00

Oper.

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

Aux. Adm.

19

Anlise de dados

Nmero de
ordem

20

Nome

Sexo

Idade

Salrio
(R$)

Setor

14

M. E. M. Ferreira

21

3.535,00

Tc.

15

J. A. Isaias

37

2.956,00

Tc.

16

J. Martins

24

1.179,00

Oper.

17

A. P. Ribeiro

28

966,00

18

L. C. Batista

32

3.204,00

19

A. F. dos Santos

31

881,00

20

C. A. Brando

38

3.080,00

Adm.

21

D. J. Feltrin

23

2.872,00

Tc.

22

L. S. Prestes

22

826,00

23

J. L. Campos

46

1.010,00

24

S. I. Magalhes

34

708,00

25

P. R. Gonalves

47

2.960,00

Adm.

26

M. I. Machado

42

2.797,00

Tc.

27

M. Paran

32

1.001,00

Oper.

28

U. V. Guimares

29

2.315,00

Adm.

29

E. M. Moreira

41

5.572,00

Ger.

30

A. P. de Andrade

30

2.372,00

Tc.

31

L. R. de Souza

51

4.829,00

Ger.

32

R. T. Moraes

23

1.826,00

Adm.

33

J. Pilloto

20

540,00

Oper.

34

F. C. Lopes

27

489,00

Oper.

35

C. A. Meier

33

479,00

Oper.

36

H. O. Silveira

22

1.904,00

37

K. D. Almeida

41

659,00

38

M. J. D. Colares

34

1.827,00

39

R. F. L. Silvrio

24

472,00

Oper.

40

M. N. Messias

20

640,00

Aux. Adm.

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

Aux. Adm.
Adm.
Aux. Adm.

Aux. Adm.
Oper.
Aux. Adm.

Tc.
Aux. Adm.
Tc.

Anlise de dados

Os dados apresentados foram organizados de forma a oferecer ao coordenador do departamento de Recursos Humanos as informaes que revelassem
a distribuio dos salrios segundo as variveis: (I) nmero de ordem, no sentido que o mais antigo na casa recebeu o nmero 1 e o mais novo o nmero
40, no importando muito o tempo de contratao, uma vez que a empresa
foi constituda h pouco tempo, (II) o sexo, (III) a idade, (IV) o salrio e (V)
o setor, dividindo os funcionrios segundo as funes: operacional (Oper.),
auxiliar administrativo (Aux. Adm.), tcnico (Tc.), administrativo (Adm.) e gerncia (Ger.), sendo uma gerncia tcnica e outra administrativa.
O coordenador analisou a tabela e verificou imediatamente que os funcionrios mais antigos eram na sua maioria do setor operacional, exceto dois auxiliares administrativos. Observou tambm que poucos funcionrios ganhavam
menos do que R$1.000,00 e que havia uma pequena predominncia de funcionrios do sexo masculino. Viu que o Reis de fato era o funcionrio mais velho,
com 64 anos, e que a empresa no tinha nenhum funcionrio com menos de 20
anos. Verificou tambm que ele prprio era o dcimo oitavo contratado como
tambm que entre os administradores era o mais antigo e que o seu salrio
era o maior comparado com seus pares, R$3.204,00. Concluiu, finalmente, que
da forma como os dados foram apresentados estava com dificuldade de tirar
maiores informaes sobre a distribuio de cargos e salrios.
Chamou um dos administradores e pediu que ele organizasse um pouco
melhor os dados e que em termos gerais no importava o nome das pessoas.
Foi prontamente atendido e recebeu o seguinte novo quadro:
Nmero de
ordem

Salrio
(R$)

Ger.

29

5.572,00

51

Ger.

31

4.829,00

40

Tc.

3.732,00

21

Tc.

14

3.535,00

37

Tc.

15

2.956,00

23

Tc.

21

2.872,00

42

Tc.

26

2.797,00

30

Tc.

30

2.372,00

Sexo

Idade

41

Setor

Mdia salarial

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

5.200,50

21

Anlise de dados

22

Nmero de
ordem

Salrio
(R$)

Tc.

36

1.904,00

34

Tc.

38

1.827,00

32

Adm.

18

3.204,00

38

Adm.

20

3.080,00

47

Adm.

25

2.960,00

29

Adm.

28

2.315,00

23

Adm.

32

1.826,00

49

Oper.

1.714,00

48

Oper.

1.701,00

64

Oper.

1.589,00

37

Oper.

1.418,00

21

Oper.

1.330,00

33

Oper.

1.307,00

39

Oper.

1.282,00

42

Oper.

10

1.260,00

32

Oper.

12

1.256,00

22

Oper.

13

1.185,00

24

Oper.

16

1.179,00

46

Oper.

23

1.010,00

32

Oper.

27

1.001,00

20

Oper.

33

540,00

27

Oper.

34

489,00

33

Oper.

35

479,00

24

Oper.

39

472,00

42

Aux. Adm.

1.000,00

39

Aux. Adm.

11

975,00

28

Aux. Adm.

17

966,00

Sexo

Idade

22

Setor

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

Mdia salarial

2.749,38

2.677,00

1.130,12

Anlise de dados

Setor

Nmero de
ordem

Salrio
(R$)

Sexo

Idade

31

Aux. Adm.

19

881,00

22

Aux. Adm.

22

826,00

34

Aux. Adm.

24

708,00

41

Aux. Adm.

37

659,00

20

Aux. Adm.

40

640,00

Mdia salarial

831,88

Com o novo quadro pde verificar uma srie de novas informaes, tais
como mdia salarial e nmero de funcionrios por categoria, e tambm que
havia uma certa coerncia dentro de cada categoria com relao ao tempo
de servio e salrio, ou seja, funcionrios mais antigos da mesma categoria
recebiam salrios maiores. Mas sobre sexo e idade e as suas relaes com as
demais informaes ainda havia muita dificuldade em tirar concluses.
Esse tipo de problema colocado no dia a dia do tomador de decises.
Os dados individuais, por mais bem organizados que estejam, trazem poucas
informaes. necessrio que sejam sintetizados atravs de tabelas, grficos
e medidas que possam resumir a informao de uma forma agregada.

Conceitos fundamentais
A Estatstica Descritiva, que mais modernamente, com a incorporao de
novas tcnicas, chamada de Anlise Exploratria de Dados, pode suprir a
necessidade de uma primeira organizao dos dados de forma a transform-los verdadeiramente em informao.
As tcnicas utilizadas na explorao dos dados tiveram uma evoluo
muito grande com o advento da computao e particularmente de programas que facilitam essas tarefas. Para o senso comum, a Estatstica resume-se
a esse trabalho. Veremos nos captulos seguintes que esse somente um
primeiro importante passo na organizao das informaes para aquisio
do conhecimento de modo a auxiliar a tomada de decises.
Fundamentalmente, a anlise de dados compreende trs frentes: organizao de tabelas, construo de grficos e sntese dos dados atravs do
clculo de medidas estatsticas.

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

23

Anlise de dados

Variveis quantitativas e categorizadas


Associadas a cada indivduo, temos medidas e atributos que o definem.
As medidas so caractersticas de variveis quantitativas e os atributos so
caractersticas de variveis categorizadas ou qualitativas.
As variveis quantitativas podem ser contnuas ou discretas. Elas so contnuas quando entre dois quaisquer valores possam estar novos valores. As variveis quantitativas contnuas so frutos de medidas que podem ser expressas pelos nmeros reais. O salrio dos empregados de uma empresa pode
ser considerado uma varivel contnua. As variveis so discretas quando so
fruto de contagem e podem ser expressas atravs de nmeros inteiros, como
a idade dos funcionrios. Uma outra caracterstica importante das variveis
quantitativas que podemos fazer operaes matemticas com seus valores,
como soma, subtrao, multiplicao e diviso.
As variveis categorizadas ou qualitativas so expressas em escalas ordinais,
como o caso da ordem em que os funcionrios foram contratados, ou expressas em categorias ou escalas nominais, como o sexo do funcionrio ou o setor
em que ele trabalha. No se pode, nesse caso, fazer operaes matemticas.

Valor discrepante ou outlier


Um valor discrepante ou outlier um valor que destoa do conjunto principal dos dados.

Tabelas e quadros estatsticos


Existe uma pequena diferena entre quadro estatstico e tabela estatstica.
A tabela estatstica o resultado de alguma forma de resumo dos dados.
As linhas esquerda e direita de uma tabela estatstica nunca devem ser
fechadas segundo as normas da ABNT. Elas so utilizadas para apresentao
de resultados estatsticos e tambm como ferramenta de desenvolvimento
de operaes. Uma tabela bastante importante utilizada em estatstica a
distribuio de frequncias.
J o quadro serve para apresentao de dados, como os do exemplo, ou para
apresentao de resultados-resumo, como um quadro de mdias, por exemplo.
O quadro pode ter seus limites esquerda e direita fechados por linhas.
24

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

Anlise de dados

Apresentao grfica
Os dados de uma tabela estatstica podem ser apresentados atravs
de grficos estatsticos, devendo o tipo de grfico ser compatvel com a
natureza dos dados. Os principais grficos so: o grfico de colunas ou de
barras, o grfico de setores ou pizza, o grfico de bastes, o grfico de linhas
e o histograma.
Existem, na anlise exploratria de dados, algumas apresentaes grficas que auxiliam a compreenso do comportamento dos dados, como
o ramo e folhas, o esquema de cinco nmeros e o diagrama de caixas ou
Box-plot.
O detalhamento da utilizao de cada tipo de grfico ser ainda assunto
deste captulo.

Medidas estatsticas
A utilizao de medidas estatsticas serve para resumir os dados atravs de
valores representativos. Existem quatro tipos de medidas utilizadas: medidas
de posio, de disperso, de assimetria e as de achatamento ou de curtose.
As medidas de posio objetivam verificar pontos que representem o conjunto de dados. Elas podem ser medidas de tendncia central, como a mdia,
por exemplo, que mostra em torno de que ponto os dados se concentram
ou as separatrizes, que informam o valor em que os dados se dividem em
quatro, dez ou cem partes.
As medidas de disperso mostram a intensidade de concentrao dos
dados em torno de medidas de tendncia central. As principais medidas de
disperso so a varincia, o desvio-padro e o coeficiente de variao.
As medidas de assimetria so utilizadas para verificar se os dados so simtricos em relao a um valor central, e as de curtose para verificar se o grfico
de dados concentra-se em valores prximos ao eixo X ou se distanciam dele.
Essas ltimas medidas de achatamento so de menor interesse na anlise de
dados, e no sero tratadas neste livro.

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

25

Anlise de dados

Variveis categorizadas
As variveis categorizadas so medidas de atributos, como sexo, grau de
instruo, setor de trabalho, categoria profissional, preferncia eleitoral etc.
Os indivduos esto relacionados a alguma categoria dentro de cada varivel, como sexo e categoria dos empregados da empresa ABC.

Distribuio por sexo


A tabela e os grficos abaixo apresentam a distribuio por sexo dos indivduos da empresa ABC.
Tabela 1 Sexo dos empregados da empresa ABC
Sexo

Nmero

Perc.

Fem.

19

47,5%

Masc.

21

52,5%

Total

40

100,0%

Um grfico estatstico objetiva dar a impresso visual da representao


dos dados. Os grficos adequados para a representao dessa tabela so os
de colunas ou de barras e o grfico de setores.
Grfico de colunas
Distribuio por sexo
20
15
10
5
0

26

Fem.

Sexo

Masc.

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

Anlise de dados

Grfico de barras
Distribuio por sexo

Masc.
Sexo
Fem.

10
15
Nmero

20

Grfico de setores
Distribuio por sexo

Fem.

48%

52%

Masc.

O grfico de setores til quando queremos observar o valor relativo da


participao de cada categoria no total.
Distribuio por categoria profissional
A tabela e os grficos apresentam a distribuio dos indivduos por categoria profissional na empresa:
Tabela 2 Categoria dos empregados da empresa ABC
Categoria

Nmero

Perc.

Gerncia

5,0%

Adm.

12,5%

Tc.

20,0%

Aux. Adm.

20,0%

Oper.

17

42,5%

Total

40

100,0%

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

27

Anlise de dados

Grfico de colunas
Categoria dos empregados da Empresa ABC
18
16
14

Nmeros

12
10
8
6
4
2
0
Gerncia

Adm.

Tc.

Aux. Adm.

Oper.

Grfico de setores
Categoria dos empregados da Empresa ABC
5%
13%
Gerncia
42%

20%

Adm.
Tc.
Aux. Adm.
Oper.

20%

28

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

Anlise de dados

Variveis quantitativas
As variveis quantitativas, sejam elas discretas ou contnuas, so apresentadas atravs da chamada distribuio de frequncias. Nos dois casos podemos construir distribuies de frequncias, que, como o prprio nome
indica, informam, atravs de tabelas, quais so os valores da varivel e qual a
frequncia de ocorrncia de dados para cada um desses valores.
No caso de varivel contnua, ou mesmo de varivel discreta com um
grande nmero de possibilidades, comum a construo de classes em que
mais de um valor contemplado.

Distribuio de frequncias
Vamos estudar inicialmente o caso de uma varivel discreta atravs da
verificao da distribuio de frequncias das idades dos funcionrios. Pode
ser de interesse saber qual a distribuio de idade dos funcionrios com
menos de trinta anos. A tabela da distribuio de frequncias correspondente a esses dados ser:
Distribuio de frequncias dos
funcionrios com menos de 30 anos

Total

Idade

Freq.

20

21

22

23

24

25

26

27

28

29

1
13

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

29

Anlise de dados

O grfico correspondente distribuio de frequncias dessas idades o


grfico de bastes:
3,5
3
2,5
2
1,5
1
0,5
0

10

Diagrama ramo e folhas


Uma outra forma de representao grfica utilizando as prprias idades
o chamado diagrama ramo e folhas, em que o ramo representa os algarismos
relativos s dezenas e as folhas os algarismos relativos unidade.
Ramo e folhas das idades dos 40 funcionrios:
2
3
4
5
6

00112223344789
01222334477899
0112226789
1
4

Observe o aspecto da informao grfica do diagrama ramo e folhas em


analogia ao histograma apresentado na sequncia. A vantagem de sua utilizao que ele mostra o desenho da distribuio sem perder a informao
detalhada.
Poderamos, eventualmente, considerar a idade como uma varivel aleatria contnua cuja representao est aproximada para os valores inteiros
das idades. A rigor, a varivel idade mesmo contnua, porque poderamos medir o tempo de vida em anos, dias e mesmo segundos. Nesse caso,
poderamos construir classes entre certas idades de tal forma que elas representassem um contnuo.
30

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

Anlise de dados

Histograma
A representao grfica da tabela da distribuio de frequncias, quando
organizada em classes, recebe o nome de histograma. um grfico de colunas adjacentes representando um contnuo.
Distribuio de frequncia das idades
Idade

Freq.

Perc.

20 a 29

14

35,0%

30 a 39

14

35,0%

40 a 49

10

25,0%

50 a 59

2,5%

60 ou +

2,5%

40

100,0%

Total

Histograma

16

Distribuio de frequncia das idades

Freq.

14
12

20 a 29 anos

10

30 a 39 anos

40 a 49 anos
50 a 59 anos

60 anos ou mais

4
2
0

1
Idade

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

31

Anlise de dados

Distribuio dos salrios


Salrio (R$)

Freq.

Freq. rel.

At 1.000,00

11

0,27

De 1.000,00 a 1.999,00

17

0,43

De 2.000,00 a 2.999,00

0,15

De 3.000,00 a 3.999,00

0,10

Acima de 4.000,00

0,05

40

1,00

Total

Histograma
Distribuio salarial
18
16

Freq.

14
12

At 100

10

De 1.000 a 1.999

De 2.000 a 2.999

De 3.000 a 3.999
Acima de 4.000

4
2
0

1
Salrios (R$)

Elementos de uma distribuio de frequncias


A distribuio de frequncias, como apresentada, til no s para apresentao de dados, mas para anlises um pouco mais aprofundadas. Vamos
reapresentar a distribuio de frequncias dos salrios de uma maneira mais
matematicamente formal.

32

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

Anlise de dados

Salrio (R$)

Freq.

Freq. rel.

X < 1.000,00

11

0,27

1.000,00 X < 2.000,00

17

0,43

2.000,00 X < 3.000,00

0,15

3.000,00 X < 4.000,00

0,10

X 4.000,00

0,05

40

1,00

Total

Observe agora que a distribuio apresentada como um contnuo. No


h descontinuidade entre R$1.999,00 e R$2.000,00, podemos, assim, ter a
representao de qualquer valor como R$1.999,85, por exemplo.
Definimos cinco classes. O nmero de classes de uma distribuio de frequncias no deve ser muito grande. Em torno de cinco a oito classes um
nmero bastante razovel e elas devem ter igual amplitude. No nosso caso,
como temos poucos valores acima de R$4.000,00 agregaremos todos esses
valores na ltima classe. Cada uma delas tem um limite inferior de classe e um
limite superior. A diferena entre o limite superior e o limite inferior chamamos de amplitude do intervalo de classe.
Podemos ainda definir o ponto mdio de cada classe. Esse valor ser
til para a determinao das medidas estatsticas quando no tivermos os
dados brutos. O ponto mdio representar todos os valores da classe. Entre
R$1.000,00 e R$2.000,00 temos 17 valores. Todos eles sero considerados
como R$1.500,00. Perdemos um pouco em informao, mas ganhamos em
poder de sntese.
A frequncia relativa ser uma aproximao de probabilidades. A probabilidade de sortearmos um dos 40 funcionrios e que esse sorteado perceba um salrio entre R$3.000,00 e R$4.000,00 ser de 4/40 ou de 0,10.
Formalmente, temos que P(3.000 X < 4.000) = 0,10. Podemos dizer, sem
perder muito o rigor, que essa probabilidade de 10%. A probabilidade de
sortearmos um funcionrio que ganhe menos do que R$2.000,00 pode ser
definida como P(X < 2.000) = 28/40 = 0,70. Tambm P(X 2.000) = 12/40 =
0,30. Observe que P(X < 2.000) + P(X 2.000) = 1, sempre que isso ocorre;
dizemos que essas probabilidades so complementares.

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

33

Anlise de dados

Se considerarmos a amplitude do intervalo de classe como a unidade, a


probabilidade pode ser calculada como a rea de cada retngulo, que ter
como base o valor 1 e como altura a frequncia relativa. Esse clculo de probabilidades atravs de reas ser fundamental quando tratarmos da inferncia estatstica.
Outro elemento importante em uma distribuio de frequncias a chamada frequncia acumulada. At R$2.000,00, temos 28 elementos, como
acabamos de ver. At R$3.000,00, temos 34 elementos e assim por diante.
Abaixo apresentamos a tabela completa da distribuio de frequncias:
Salrio (R$)

Freq.

Freq. rel.

X < 1.000,00

11

0,27

500

11

1.000,00 X < 2.000,00

17

0,43

1.500

28

2.000,00 X < 3.000,00

0,15

2.500

34

3.000,00 X < 4.000,00

0,10

3.500

38

X 4.000,00

0,05

4.500

40

40

1,00

Total

Ponto mdio

Freq. acumulada

Uma outra aproximao que podemos fazer suavizar a apresentao


do histograma, construindo um novo grfico que una os pontos mdios das
classes. Esse novo grfico chamado de polgono de frequncias e estar possivelmente mais prximo dos dados reais. Veja que com esse polgono de
frequncias podemos determinar atravs do clculo de reas as probabilidades de qualquer intervalo, como, por exemplo, P(1.022,34 X < 3.087,53).
O polgono de frequncias apresentado na figura a seguir. Observe que
a rea abaixo do polgono tambm igual unidade e toda rea que retirada do histograma recolocada. Podemos verificar isso atravs de semelhana de tringulos:

34

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

Anlise de dados

Distribuio salarial
18
16

Freq.

14
12

At 100

10

De 1.000 a 1.999

De 2.000 a 2.999

De 3.000 a 3.999
Acima de 4.000

4
2
0
Salrios (R$)

Srie temporal
Muitas variveis so medidas a intervalos de tempo. O grfico de linhas
a maneira mais adequada de apresentar a evoluo de uma varivel no
tempo. O eixo X sempre ser correspondente a uma escala de tempo.
Quando no h um nmero demasiadamente grande de pontos, a ligao entre os pontos por segmentos de retas ajuda a visualizar o padro de
variao ao longo do tempo.
Suponha que no exemplo da empresa ABC os dados tivessem sido apresentados pelo tempo de casa de cada funcionrio. Uma possvel organizao dos dados seria verificar quantos funcionrios a empresa tinha em cada
um de seus quatro anos de existncia, conforme a tabela abaixo:
Nmero de funcionrios por ano
Anos

Funcionrios

Ano 1

15

Ano 2

20

Ano 3

32

Ano 4

40

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

35

Anlise de dados

Grfico de linhas
Nmero de empregados por ano
45
40
35
30
25
20
15
10
5
0
Ano 1

Ano 2

Ano 3

Ano 4

Medidas estatsticas
O objetivo de sintetizao das informaes tem sido realizado at aqui atravs de apresentao tabular e grfica dos dados originais ou brutos. A forma
de completar essa tarefa se d atravs do clculo das medidas estatsticas.
Trataremos de trs tipos de medidas: (I) as de posio, (II) as de disperso e
(III) as de assimetria.

Medidas de posio
Trabalharemos aqui com dois tipos de medidas, as de tendncia central e
as separatrizes.
As medidas de tendncia central resumem os dados no centro da distribuio. So medidas de tendncia central a mdia aritmtica, a mediana e a
moda.

36

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

Anlise de dados

A mdia aritmtica
A mdia aritmtica ou simplesmente mdia uma das medidas mais importantes da Estatstica. Alm de resumir os dados, ela servir enormemente
para os propsitos de estimao de caractersticas da amostra para a populao, pois possui as melhores propriedades de um estimador.
Ela a soma dos dados dividida pelo nmero de observaes, e sua expresso matemtica :
x=

x
n
i=1

x1 + x 2 + ... + x n
n

Quando no houver conflito com outras expresses, apresentaremos


x i simplesmente como X.

i =1

A mdia aritmtica representa o centro de gravidade dos dados. Alguns cuidados, no entanto, devem ser tomados quando desejamos resumir os dados pelo
valor de sua mdia. Ela muito sensvel a valores extremos. Um nico valor muito
grande ou muito pequeno pode mudar substancialmente o valor da mdia, podendo ela perder sua representatividade. Esses valores extremos so chamados
de valores discrepantes ou outliers e quando eles aparecem em um conjunto de
dados devem receber um tratamento muito especial.
No nosso exemplo temos como valor da mdia das idades dos empregados da empresa ABC o valor 34 anos e a mdia dos salrios de R$1.791,20.
Se considerarmos a idade de 64 anos como um outlier a nova mdia ser
de 33,2 anos, e se considerarmos os salrios R$4.829,00 e R$5.572,00 como
valores muito acima dos demais, teremos uma mdia salarial de R$1.611,76,
quase R$200,00 de diferena com relao primeira mdia.
No primeiro caso a diferena parece no ter sido de grande significncia,
mas para a mdia salarial essa diferena pode ser considerada importante,
mesmo porque ser um elemento importante na anlise de cargos e salrios.
Retirar o salrio dos dois gerentes no clculo da mdia pode ser til para a
construo da nova poltica de cargos e salrios.
Essa sensibilidade da mdia a valores extremos pode ser bem compreendida com a seguinte ilustrao. Se coloco os ps prximos a uma rea gelada
e a cabea prxima a uma rea quente, a temperatura mdia do corpo ser
agradvel.

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

37

Anlise de dados

A mdia ponderada
Se tivermos o seguinte conjunto de dados: (2, 2, 2, 2, 2, 3, 3, 4, 4, 4) e queremos calcular a sua mdia, a soma dos dados pode ser realizada da seguinte
forma: (2 . 5) + (3 . 2) + (4 . 3) = 10 + 6 +12 = 28. Isso porque a frequncia do 2
5, a do 3 2 e a do 4 3. Observe que a soma das frequncias 10 (5 + 2 + 3),
igual ao nmero de observaes. Podemos expressar esse fato por:
X=

Xf
f

Em que f a frequncia de cada X. Essa expresso representa a chamada


mdia aritmtica ponderada ou simplesmente a mdia ponderada. Os ponderadores so as frequncias.
Esse clculo muito til quando os dados so apresentados em uma distribuio de frequncias em que X ser o ponto mdio de cada classe e a
frequncia ser o ponderador. Se observarmos que a frequncia relativa
igual frequncia dividida pelo nmero de observaes, isto frel =
podemos representar a mdia como:
X=

freq.
,
f

X .f

rel

No clculo da mdia ponderada das idades e dos salrios, encontramos


os seguintes valores para as mdias, com o auxlio das tabelas a seguir. Idade
mdia 34,75 anos e salrio mdio R$1.735,00.
Idade

Ponto mdio (X)

frel

X frel

20 --- 30

24,5

0,35

8,575

30|--- 40

34,5

0,35

12,075

40|--- 50

44,5

0,25

11,125

50|--- 60

54,5

0,025

1,3625

60|---| 70

64,5

0,025

1,6125
34,75

38

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

Anlise de dados

Salrio (R$)
X < 1.000,00

Ponto Mdio (X)

frel

X frel

500

0,28

140

1.000,00 X < 2.000,00

1.500

0,43

645

2.000,00 X < 3.000,00

2.500

0,15

375

3.000,00 X < 4.000,00

3.500

0,1

350

X 4.000,00

4.500

0,05

225
1.735

Os valores encontrados para os dados brutos foram idade mdia de 34


anos e salrio mdio de R$1.791,20. Os valores obtidos a partir da distribuio de frequncias sofreram pequenas alteraes, principalmente o valor do
salrio mdio, em razo de considerarmos o valor dos salrios dos gerentes
como R$4.500,00 na distribuio de frequncias, quando de fato eles tinham
valores bem superiores ao considerado.
Essas distores costumam desaparecer quando retiramos os outliers do
clculo ou quando o nmero de observaes for grande.

A mediana
A mediana o valor que divide o rol em duas partes iguais. O rol definido como a sequncia ordenada de dados. Por exemplo, para o seguinte
conjunto de dados (2, 3, 7, 7, 9) a mediana o nmero 7 que divide o rol em
duas partes iguais.
Quando o nmero de dados muito grande convm definir a posio da
mediana antes de sua determinao. A posio da mediana ser definida por
PMed = (n + 1)/2. No exemplo acima, a posio da mediana ser PMed = (5 + 1)/2 =
6/2 =3, portanto, a mediana ser o terceiro elemento do rol. O valor da mediana ser o do elemento que ocupa a terceira posio, nesse caso Med = 7.
No caso de n ser par, o procedimento semelhante, define-se a posio
da mediana e depois calcula-se a mdia aritmtica dos dois nmeros imediatamente inferior e superior do valor da posio da mediana. No exemplo da
empresa ABC, em que n = 40, teremos PMed = (40 +1)/2 = 41/2 = 20,5. A mediana
ser ento a mdia entre os valores que ocupam a vigsima e a vigsima primeira posies da varivel em considerao.

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

39

Anlise de dados

No nosso exemplo a idade mediana ser Med = 33, porque X20 = X21 = 33. O
salrio mediano ser Med = R$1.318,50, porque X20 = 1.307,00 e X21 = 1.330,00.

A mediana para dados agrupados


Uma forma aproximada de determinao da mediana para dados agrupados consiste em localizar inicialmente a classe que contm a mediana, com
o auxlio da distribuio de frequncias acumulada. Em seguida, tomar o
ponto mdio da classe mediana como um valor aproximado do verdadeiro
valor da mediana.
Observe na tabela a seguir que o vigsimo e o vigsimo primeiro valores esto na segunda classe que contm do dcimo segundo ao vigsimo oitavo elementos. Podemos, por simplicidade, determinar o valor da
mediana como aproximadamente R$1.500,00, o valor do ponto mdio da
classe mediana.
Essa aproximao para esse caso foi bastante razovel, como podemos
observar pela comparao do valor obtido nesse clculo e o valor real determinado pelos dados do rol. Quando a posio da mediana estiver muito prxima de alguma dos limites da classe, uma interpolao deve ser realizada.
Salrio (R$)

Freq.

Ponto mdio

Freq. acumulada

X < 1.000,00

11

500

11

1.000,00 X < 2.000,00

17

1.500

28

2.000,00 X < 3.000,00

2.500

34

3.000,00 X < 4.000,00

3.500

38

X 4.000,00

4.500

40

Total

40

A moda
A moda o valor que ocorre com maior frequncia. Para o conjunto de
dados (2, 3, 3, 3, 4), a moda ser o valor 3. Quando um conjunto tem uma s
moda, ele chamado de unimodal. Se tiver duas modas, de bimodal, e polimodal se tiver trs modas, ou mais. Se o conjunto no tiver nenhuma moda
ser chamado de amodal.
40

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

Anlise de dados

Separatrizes
As separatrizes so medidas que dividem um rol em duas partes proporcionais a certos valores. A medida que separa os dados em duas partes
iguais, ou em 50% e 50% a mediana, como vimos a pouco.
Uma srie de trs medidas pode separar o rol em quatro partes iguais.
Elas so chamadas de quartis. O primeiro quartil (Q1) separa o rol em 25%
e 75%, o segundo quartil (Q2) a prpria mediana e o terceiro quartil (Q3)
divide o rol em 75% e 25%.
Da mesma forma que a mediana, para os quartis devemos inicialmente
calcular a sua posio para depois determinar o seu valor. A posio do quari ( n +1)
til de ordem i, com i = 1..., 3 dada por PQi =
.
4
No nosso exemplo, se desejamos verificar o valor dos quartis para os salrios, teremos PQ1 = (40 + 1)/4 = 10,25 e PQ13 = 3(40 +1 )/4 = 30,75, lembrando que o segundo quartil a prpria mediana. Ento, verificando no rol de
dados, teremos Q1 = R$987,50 e Q3 = R$2.584,50, uma vez que o dcimo salrio de R$975,00 e o dcimo primeiro de R$1.000,00 e que o trigsimo de
R$2.372,00 e o trigsimo primeiro de R$2.797,00. Esses so valores aproximados, mas podemos verificar que so aproximaes bastante razoveis.
Podemos tambem definir um conjunto de nove medidas que separam
o rol em 10 partes, chamadas de decis, e um conjunto de 99 medidas que
separam o rol em 100 partes, chamadas de percentis. Bastando, para isso,
determinar as posies de cada decil pela expresso i.(n + 1)/10 e de cada
percentil por i.(n + 1)/100. fcil verificar que o vigsimo quinto percentil,
por exemplo, o primeiro quartil.
Com base nas separatrizes, podemos construir duas representaes que
fazem parte tambm da chamada anlise exploratria de dados, que so: o
esquema de cinco nmeros e o diagrama de caixa ou Box-plot.

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

41

Anlise de dados

Esquema de cinco nmeros


O esquema de cinco nmeros consiste em apresentar os valores extremos, os quartis e a mediana, conforme desenho a seguir:
Q1

Med

Xmn

Q3

Xmx

Diagrama de caixa ou Box-plot


O Box-plot, como corriqueiramente conhecido, constitui-se de uma caixa
ou um retngulo cujo valor esquerda na caixa o primeiro quartil, e o valor
direita na caixa o terceiro quartil. Um trao no centro da caixa representa
a mediana e os pontos extremos so mostrados fora da caixa.

+---+---+---+---+---+---+---+---+---+---+---+---+
0 1 2 3 4 5 6 7 8 9 10 11 12

No exemplo acima, o primeiro quartil (Q1) 7, a mediana 8,5 e o terceiro


quartil (Q3) 9. Essas trs medidas so utilizadas para a construo da caixa.
A diferena entre o terceiro e o primeiro quartis chamada de amplitude interquartlica (Aiq). Qualquer valor abaixo de Q1 1,5 Aiq e acima de Q3 + 1,5 Aiq
considerado como outlier. No exemplo em foco Aiq = 9 7 = 2, ento valores
menores do que 7 2(1,5) = 4 e maiores que 7 + 2(1,5) = 10 so outliers.
O valor 5 no diagrama o menor valor dos dados que no outlier, e o
valor 10 o maior valor dos dados que tambm no outlier. Marcamos
esses dois pontos e os unimos caixa por um trao.
Podemos tambm definir outlier extremo como valores abaixo de Q1 3 Aiq e
acima de Q3 + 3 Aiq . O valor 3,5 um outlier, por ser menor do que 4 e o valor
0,5 um outlier extremo por ser menor do que 7 3(2) = 1. No temos valores
de outlier direita. Marcamos ento o outlier com um asterisco (*) e o outlier
extremo com uma circunferncia ().
Esse diagrama indica que temos um conjunto de dados com uma certa
assimetria negativa.
42

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

Anlise de dados

Medidas de disperso
Essas medidas so teis para que possamos verificar o quanto os dados
se dispersam, ou, mais comumente, o quanto eles se dispersam em torno da
mdia. So medidas de variabilidade. Podemos dizer que dados com grande
variabilidade representam um conjunto heterogneo.
As trs principais medidas de variabilidade so (I) a varincia, (II) o desviopadro e (III) o coeficiente de variao.

A varincia
A varincia mede a variabilidade mdia dos desvios dos valores em torno
da mdia ao quadrado. Pode ser representada por VAR(X) ou 2. O quadrado
utilizado porque a mdia tem sempre a propriedade que a soma dos desvios
em torno de si igual a zero, ou seja, (X ) = 0. Dessa forma, a varincia
pode ser definida como:

2 =

(X )2
N

Quando tratamos de amostra em vez de populao, N substitudo por


(n 1), cuja justificativa ser apresentada no captulo referente Estimao,
quando tratarmos de distribuies amostrais. Nesse caso substitumos 2
por S2. Ento, para o caso de amostra, teremos:

S =
2

(X X)2
n1

Uma forma alternativa de determinar o valor da varincia, derivada da


expresso acima, dada por:
S2 =

X2 nX2
n1

ou

X2 (nX)

S2 =

n1

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

43

Anlise de dados

A varincia para dados agrupados pode ser determinada pela expresso:


S =
2

(X X)2 . f
n1

Em que f a frequncia de cada classe, X o ponto mdio de cada classe e


X a mdia aritmtica dos dados. Ou de forma alternativa por:

.f

S2 =

(X . f )
n

n1

O desvio-padro
Como a unidade da varincia sempre ao quadrado, a forma de representar uma medida de disperso na mesma unidade dos dados calculando a raiz
quadrada da varincia. Essa medida chamada de desvio-padro e , como
veremos, uma das medidas mais importantes da Estatstica.

O coeficiente de variao
O desvio-padro tem vrias utilidades em Estatstica. Uma delas comparar a variabilidade entre dois conjuntos que tm a mesma mdia. Como o
desvio-padro no tem um significado fsico mais bem definido, o seu valor
ser grande ou pequeno dependendo da dimensionalidade dos dados.
Um desvio-padro pode ser irrisrio ou imenso dependendo da dimenso dos dados que estamos tratando. Existe, no entanto, uma possibilidade
de comparao da variabilidade entre dois conjuntos padronizando o valor
do desvio-padro pelo valor da mdia do conjunto de dados.
Ou seja, se igualarmos a mdia a 100 e fizermos uma regra de trs simples,
obteremos:
X

100

CV

Ento,
CV = S . 100%
X
44

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

Anlise de dados

CV conhecido como o coeficiente de variao dos dados. Seu valor


dado em percentagem, o que possibilita uma informao mais intuitiva da
variabilidade, e a forma de comparar-se a heterogeneidade entre dois conjuntos com mdias diferentes.
Observe que os conjuntos A = {1, 2, 3}, B = {11, 12, 13} e C = {111, 112, 113} tm
o mesmo desvio-padro. Nos trs casos o seu valor igual a 1. No entanto, os
valores dos coeficientes de variao so: CVA = 50%, CVB = 8,3% e CVC = 0,9%.
Verifique que esses resultados esto mesmo de acordo com a intuio.
Se cada medida dessas for uma medida de distncia aferida por algum aparelho, muito menor o erro entre as medidas do conjunto C do que do
conjunto A.

Medidas de assimetria
Existem vrias medidas para verificar se os dados so simtricos em
torno de um valor central (a mdia) de um conjunto. A mais usual a apresentada abaixo:
A=

3 (mdia mediana)
S

Se A < 0, dizemos que os dados tm assimetria negativa, caso contrrio assimetria positiva. Se A = 0, o conjunto de dados simtrico. O aspecto grfico
de dados simtricos e assimtricos dado abaixo:

Mo Md X

assimetria positiva

X = Md = Mo

simtrico

Md Mo

assimetria negativa

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

45

Anlise de dados

Atividades de aplicao
1. Uma pesquisa realizada com fornecedores de uma determinada indstria tinha por objetivo atualizar alguns dados importantes para o controle financeiro e administrativo. As seguintes variveis foram observadas:
a) Nome da empresa
b) Idade da empresa
c) Faturamento anual
d) Nmero de funcionrios
e) Localizao (UF)
f) rea construda
Indique, para as variveis acima, qual o tipo de cada uma delas.
2. Indique a letra adequada coluna de acordo com as afirmativas abaixo:
a) Processo utilizado para selecionar elementos numa pesquisa
ou estudo.
b) Uma das formas de apresentao de dados.
c) Medida observada a partir de uma caracterstica da amostra.
d) Caracterstica observada em estudos ou pesquisas.
e) Medida observada a partir de uma caracterstica da populao.
((

Distribuio de frequncias.

((

Estatstica.

((

Amostragem.

((

Parmetro.

((

Varivel.

3. A diretoria de uma empresa, preocupada com a participao de seus


membros nas reunies ordinrias, fez um levantamento do nmero
de faltas no ltimo semestre. Os dados obtidos para os 48 membros
participantes esto apresentados a seguir:

46

200430010011

211111100030

002001120200

000000000010

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

Anlise de dados

a) Especifique o tipo de varivel estudada, classificando-a.


b) Construa um diagrama de bastes.
c) Construa uma tabela de frequncias.
d) Qual a proporo de membros que faltou no mximo a duas
reunies?
e) Determine as frequncias relativas.
4. A distribuio de frequncias abaixo apresenta os salrios dos 120 funcionrios da empresa A .
Salrios (em S. M.)

fi (n.o de funcionrios)

0 ---- 5

52

5 |--- 10

38

10|--- 15

17

15|--- 20

20|---| 50

Total

120

Determine:
a) A amplitude observada entre a 2.a e a 4.a classe.
b) O salrio mdio da 4.a classe de frequncias.
c) A frequncia acumulada da 3.a classe de frequncias.
d) Quantos funcionrios que recebe entre 5 e 15 salrios mnimos?
e) Quantos funcionrios que recebe pelo menos 10 salrios mnimos?

5. Pesquisando-se o preo mdio de fornos micro-ondas de diversas


marcas em 28 lojas e pontos de venda em Curitiba, observou-se a seguinte distribuio:
Preo (R$)
Lojas

192,00
1

220,00
7

240,00
11

255,00
6

262,00
2

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

280,00
1

47

Anlise de dados

a) Calcule o preo mdio do produto.


b) Calcule o preo mediano.
6. Os dados abaixo apresentam as vendas semanais em classes de salrios mnimos de vendedores de gneros alimentcios:
Vendas semanais

n. de vendedores

20 30

30 40

10

40 50

18

50 60

50

60 70

70

70 80

30

80 90

18

90 100

Total

200

a) Determine o nmero mdio de vendas semanais.


b) Determine o desvio-padro e o coeficiente de variao das vendas
semanais.
7. Trinta embalagens plsticas de mel foram pesadas com preciso de
decigramas. Os pesos, aps convenientemente agrupados, forneceram a seguinte distribuio de frequncias (em gramas):

Xi

31,5

32,5

fi

33,5
11

34,5

35,5

36,5

Determine:
a) A mdia da distribuio dos pesos das embalagens.
b) A mediana dos pesos.
c) A moda dos pesos.
d) A varincia dos dados.

48

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

Anlise de dados

American Express

10,95

30 Horas Visa Gold

11,90

Federal Card Nac.

9,80

Federal Card Int.

9,80

Credicard Nac.

9,20

30 Horas Visa Int.

11,90

Credicard Intern.

9,04

Ourocard Intern.

8,50

Federal Card Gold

9,50
10,50

Diners

10,70

BFB Gold

9,90

HSBC Open Card

Bradesco Nac.

10,32

BFB Intern.

9,90

HSBC Gold

Bradesco Intern.

10,22

Sudameris Classic

10,20

Sudameris Gold

10,20

Bradesco Gold

9,53

5,90

Disponvel em: Folha de So Paulo/Caderno


Dinheiro.

8. A tabela abaixo apresenta as taxas de juros do rotativo, cobradas pelos


cartes de crdito, em determinado ms.

a) Qual a taxa mdia cobrada no mercado?


b) Qual a taxa mediana?
c) Qual o valor do desvio-padro das taxas? O comportamento das
taxas homogneo?
d) Existe algum carto que possa ser considerado um outlier, supondo uma variao de 2 desvios da mdia?
9. A idade mdia dos candidatos a um determinado curso de aperfeioamento sempre foi baixa, na ordem de 22 anos. Como esse curso foi
planejado para atender a todas as idades, decidiu-se fazer uma campanha de divulgao. Para verificar se a campanha foi ou no eficiente,
fez-se um levantamento da idade dos candidatos ltima promoo,
e os resultados esto apresentados na tabela abaixo:

Idade

Nmero de candidatos

18 20

18

20 22

12

22 26

10

26 30

30 36

Baseando-se nesses resultados, voc diria que a campanha produziu


algum efeito (isto , a idade mdia aumentou)?
Este material parte integrante do acervo do IESDE BRASIL S.A.,
mais informaes www.iesde.com.br

49

Anlise de dados

10. Os salrios dos empregados da empresa A so 20% maiores que os da


empresa B, para todos os empregados comparados individualmente.
Com base nessa informao, podemos afirmar que:
a)

O desvio-padro dos empregados o mesmo para ambas as


empresas.

b)

O desvio-padro dos salrios dos empregados da empresa A


20% maior do que o dos salrios da empresa B.

c)

O desvio-padro dos salrios dos empregados da empresa A


igual ao desvio-padro dos salrios dos empregados da empresa
B, multiplicado pelo quadrado de 1,20 .

d)

No h elementos para se comparar o desvio-padro dos salrios


dessas empresas.

Gabarito
1.
a) Qualitativa nominal.
b) Quantitativa contnua.
c) Quantitativa contnua.
d) Quantitativa discreta.
e) Qualitativa nominal.
f) Quantitativa contnua.
2. b, c, a, e, d.
3.
a) Varivel quantitativa discreta, pois o nmero de faltas dado por
um valor inteiro.

50

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

Anlise de dados

b)
Diagrama de Bastes
30

Membros

25
20
15
10
5
0

Faltas

c)
Distribuio de frequncias
Nmero de faltas

Nmero de membros (f)

28

12

Total

48

d) No mximo duas reunies o mesmo que duas ou menos reunies,


logo ser a soma das frequncias de 0 + 1 + 2 dividido pelo total de
casos.

Proporo de no mximo 2 reunies =


ou 93,75%

28 + 12 + 5
= 0,9375
48

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

51

Anlise de dados

e)
Distribuio das frequncias relativas
Nmero de faltas

Frequncia relativa (fr)

0,583

0,250

0,104

0,042

0,021

Total

4.
a) A amplitude entre a 2. e a 4. classes varia entre 5 (limite inferior
da 2. classe) e 20 (limite superior da 4. classe), logo a Amplitude =
20 5 = 15.
b) O salrio mdio da 4. classe dado pela mdia entre 15 e 20, portanto, o valor 17,5.
c) A frequncia acumulada da 3. classe ser: 52 + 38 +1 7 = 107.
d) O nmero de funcionrios que recebem entre 5 e 15 salrios mnimos ser dado pela soma dos que ganham entre 5 e 10 mais os que
recebem entre 10 e 15 s.m., portanto, 38 + 17 = 55 funcionrios.
e) Pelo menos 10 s.m. o mesmo que no mnimo 10 s.m. Sendo assim, ser a soma das frequncias das classes a partir de 10 s.m. O
resultado ser 17 + 8 + 5 = 30. Outra forma de clculo seria subtrair
do total os que ganham menos de 10 s.m., ou seja, 120 90 = 30.
5.
a) Este um caso de mdia ponderada, sendo assim a frmula para a
resoluo :


52

X=

Xf = (192).1 + (220).7 + (240).11 + (255).6 + (262).2 + (280).1


28
f

6.706
28

X = 239,50 .

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

Anlise de dados

b) Para obter o preo mediano do produto, necessrio verificar a


posio da mediana, ou seja:


(n + 1)
(28 + 1)
, logo a PMed =
= 14,5 , ento a mediana ser
2
2
a mdia entre os valores ordenados correspondentes s posies 14 e 15.
PMed =

Verificando na distribuio, temos os valores; XPos14 = 240,00 e


XPos15 = 240,00. Portanto, como a mdia entre os valores ser de
240,00, a mediana ser 240,00.

6.
a) Calcula-se o ponto mdio das classes e obtm-se o resultado da
mdia por meio da expresso:
X=


Vendas (X)

TOTAL

Xf = 12 480 = 62, 4
f 200
Freq (f)

X.f

25

50

35

10

350

45

18

810

55

50

2 750

65

70

4 550

75

30

2 250

85

18

1 530

95

190

200

12 480

Ou, de outra forma, utilizando a frequncia relativa:

X = X.f rel X = 25.(0, 01) + 35.(0, 05) + ... + 95.(0, 01) = 62, 4

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

53

Anlise de dados

Vendas (X)

Freq (f)

X.f

F relativa

X. Freq rel

25

50

0,01

0,25

35

10

350

0,05

1,75

45

18

810

0,09

4,05

55

50

2 750

0,25

13,75

65

70

4 550

0,35

22,75

75

30

2 250

0,15

11,25

85

18

1 530

0,09

7,65

95

190

0,01

0,95

200

12 480

62,4

TOTAL

b) Como o desvio-padro a raiz quadrada da varincia, ento podemos calcular a varincia atravs da expresso:

S2 =

(x . f )2
n
n1

x2 . f

de x2 . f

X2

54

, em que precisamos obter os valores

X2.f

625

1 250

1 225

12 250

2 025

36 450

3 025

151 250

4 225

295 750

5 625

168 750

7 225

130 050

9 025

18 050
813 800

Logo, temos que a varincia ser:

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

Anlise de dados

(12 480)
200
S2 =
= 176,12 e dessa forma o resultado do
199
desvio-padro ser obtido por meio de:
813 800

7.

S = 176,12 = 13,27

O coeficiente de variao ser determinado por:


13,27
S
.100% = 21,3%
CV = .100% , onde CV =
62, 4
X

a) X = xf = (31,5).1 + (32,5) 5 + (33,5).11 + (34,5).8 + (35,5).3 + (36,5).2 =


f
30

= 1018
30

X = 33,93.

(n + 1) (30 + 1)
= 15,5, logo, a mediana ser a mdia entre os
=
2
2
valores de X na posio 15 e na posio 16. O resultado da mediana
33,5 + 33,5
= 33,5.
ser dado por Md =
2
c) A moda representada pelo valor de maior frequncia, e nesse
caso a Mo = 33,5.
(X . f )2
X2 . f
n
, em que
d) A varincia ser expressa por: S2 =
n1
obtemos os valores dos somatrios na tabela:
b) PMed =

Xi

Xi.fi

31,5

31,5

992,25

992,25

32,5

162,5

1 056,25

5 281,25

33,5

11

368,5

1 122,25

12 344,75

34,5

276,0

1 190,25

9 522,00

35,5

106,5

1 260,25

3 780,75

36,5

73,0

1 332,25

2 664,50

1 018,00

X2

X2.fi

34 585,50

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

55

Anlise de dados

Logo:

S2 =

34 585,5
29

8.
a) x =

(1 018)2
30
= 1,43

xi , em que

n i=1
1
187,96
x=
= 9,89.
(10,95 + 9,20 + 9,04 + ... + 10,50 + 5,90) =
19
19

b) Aps a ordenao dos valores, encontramos a posio da mediana



(n + 1) (19 + 1)
= 10, em que o valor de X na posio
=
2
2
10 corresponde a uma mediana igual a 9,9.
dada por PMed =

c) O desvio-padro ser obtido pela raiz quadrada da varincia, logo,


a varincia :
(x)2
n
S2 =
n1
tabela a seguir:

X2

Taxas (X)

56

e obtendo os somatrios atravs da

X2

10,95

119,9025

9,2

84,64

9,04

81,7216

10,7

114,49

10,32

106,5024

10,22

104,4484

9,53

90,8209

11,9

141,61

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

Anlise de dados

Taxas (X)

X2

11,9

141,61

8,5

72,25

9,9

98,01

9,9

98,01

10,2

104,04

10,2

104,04

9,8

96,04

9,8

96,04

9,5

90,25

10,5

110,25

5,9

34,81

187,96

1 889,486

(187,96)2
19
Temos: S2 =
18
ser dado pela 1, 67 = 1,29.
1 889,49

= 1,67, logo o desvio-padro

Para verificarmos se o grupo de dados homogneo, calculamos o coeficiente de variao (CV). Normalmente, grupos com
disperso relativa at 30% so considerados homogneos. O
S
clculo do coeficiente de variao dado por: CV = .100%
X
1,29
CV =
.100% = 13, 07%
9, 89

Logo, as taxas cobradas no mercado so homogneas.


d) Ser considerado um carto outlier aquele em que a taxa cobrada do
rotativo exceda os limites de X 2S, ou seja, 9,89 2.(1,29). Sendo
assim, os limites estaro entre 7,31 e 12,47. Dessa forma, o nico valor
fora desse intervalo corresponde a 5,90 do carto HSBC Gold.

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

57

Anlise de dados

9. Utiliza-se o ponto mdio das classes como valor de X na classe (observe que as classes tm amplitudes diferentes) e atravs da expresso
xf
obtm-se a mdia das idades. Ento,
X=
f

X=

19.(18) + 21.(12) + 24.(10) + 28.(8) + 33.(2)


50

= 22,48

Logo, a campanha no surtiu efeito, pois a idade mdia permanece


em torno de 22 anos.

10. B

58

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

Probabilidades e
distribuies de probabilidades

Problema
A Companhia de Seguros ABC deseja acionar uma empresa de nibus
para indenizar a viva de um cliente, que foi morto em um acidente com um
dos nibus da empresa. Deseja, para isso, construir peas de evidncias que
demonstrem impercia do motorista e, portanto, culpabilidade da empresa.
Entre as peas de evidncias, a Companhia ABC pretende demonstrar que a
chance de quatro testemunhas que depuseram a favor do motorista morarem em casas do mesmo quarteiro dele e estarem no nibus no evento do
acidente muito pequena.
O acidente ocorreu no meio da tarde de um dia de semana. Um casal de
pessoas idosas desceu do nibus em um determinado ponto do itinerrio e
o homem foi atropelado pelo prprio nibus. A viva garantiu que o nibus
arrancou antes que o seu esposo tivesse alcanado a calada.
O motorista alegou que esse fato no ocorreu e apresentou em sua defesa
o depoimento de quatro testemunhas que teriam acompanhado o acidente
por estarem no nibus naquele momento.
O advogado da companhia de seguros tinha ouvido falar que as empresas de transporte coletivo s contratavam motoristas se os mesmos apresentassem juntamente com os documentos pessoais uma relao de pessoas
que deporiam a seu favor em caso de acidentes, uma vez que as empresas
estavam tendo um prejuzo muito grande com causas judiciais.
Diante das circunstncias, o advogado levantou o endereo das testemunhas e do motorista e constatou que todos moravam em um mesmo quarteiro do bairro para o qual o nibus se dirigia.
Como ento determinar a probabilidade de as testemunhas de fato no
serem forjadas? O advogado procurou um consultor estatstico e solicitou
a ele que determinasse essa probabilidade, mesmo que fosse de forma
aproximada.
Este material parte integrante do acervo do IESDE BRASIL S.A.,
mais informaes www.iesde.com.br

61

Probabilidades e distribuies de probabilidades

Depois de alguma reflexo, o estatstico pensou que poderia aproximar


essa situao atravs de um procedimento clssico em Estatstica: o de tirar
bolas coloridas de uma caixa. O experimento aleatrio consiste em misturar
em uma caixa bolas de duas cores. Por exemplo, colocar seis bolas azuis em
uma caixa com 20 bolas brancas, misturar bem e retirar dessa caixa, sem
olhar, uma amostra de quatro bolas. Calcular ento a probabilidade que duas
dessas quatro bolas sejam azuis.
Essa probabilidade pode ser calculada da seguinte forma: de quantas maneiras pode-se retirar quatro bolas sem reposio de um total de 26? Esse
nmero igual a C26,4. Dentre todas essas combinaes, de quantas maneiras pode-se retirar duas bolas brancas das 20 contidas na caixa? Da mesma
forma, C20,2. E as outras duas azuis de seis? C6,2. Ento, a probabilidade de se
retirar duas bolas azuis na situao exposta dada por:
P (X = 2) =

C6,2C20,2
C26,4

O clculo dessa probabilidade resulta em P(X = 2) =

190 . 15

= 0,1906,
14 950
ento a probabilidade de se retirar duas bolas azuis em uma amostra sem
reposio de uma caixa com 26 bolas, sendo 20 brancas e 6 azuis, de 0,19
ou 19%.
Se o bairro em que mora o motorista e suas testemunhas for a caixa que
contm um nmero N de moradores, o nmero de habitantes do quarteiro
for N1, correspondentes ao nmero de bolas azuis na caixa e a lotao do
nibus for a amostra n, qual a probabilidade que dessa amostra n, n1 sejam
de moradores do quarteiro?
A expresso geral para o clculo dessa probabilidade :
P (X = n1) =

CN1,n C(N N1), (n n )


1

CN,n

Resta, ento, verificar os valores de N, N1, n e n1. Depois de um trabalho


intenso de levantamento de dados, o estatstico chegou s seguintes informaes. O bairro composto por 112 quarteires, os quarteires tm em mdia
20 casas e cada casa uma mdia de quatro moradores, portanto, o nmero de
habitantes do bairro era de N = 8 960. No quarteiro em que moravam o motorista e suas testemunhas havia 20 casas com tambm quatro moradores em
cada casa, um total de N1 = 80 moradores no quarteiro. A lotao do nibus
62

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

Probabilidades e distribuies de probabilidades

de 30 lugares sentados, ou seja, n = 30, e queremos calcular a probabilidade


de que cinco moradores do mesmo quarteiro (o motorista e as quatro testemunhas) estivessem juntos no nibus, isto , P(X = n1) = P(X = 5).
O clculo dessa probabilidade ento:
P (X = 5) =

C80,5C8880,35
C8960,40

= 0,00002

Ou seja, uma chance em 50 000. De fato, muito pequena.


Na avaliao feita, todos os benefcios de aproximao foram feitos a favor
do motorista. O nibus tinha lotao completa, quando se pode verificar que
nesse horrio da tarde ela nunca est completa. O nmero de pessoas que o
nibus servia era maior do que somente o seu bairro terminal. O nmero de
pessoas por residncia em bairros da periferia normalmente maior do que
a mdia de um casal com dois filhos. Todos esses fatores foram colocados a
favor do motorista. E ademais, h que se supor que todos os quatro passageiros estivessem prestando ateno ao acidente.
Esse um problema tpico de modelagem com probabilidades. H muitos
outros tipos de exemplo. Mas, talvez mais importante do que a aplicao direta
de probabilidades na soluo de problemas seja a sua grande utilidade como
instrumento para se trabalhar com inferncia estatstica e com as tcnicas de
tomada de decises aplicadas nos ltimos trs captulos do livro.

Conceitos fundamentais
A teoria de probabilidades foi desenvolvida para solucionar jogos de azar
durante o sculo XVII, mas somente no incio do sculo XX, graas ao matemtico russo A. Komolgorov, que formulou toda a teoria a partir de axiomas
bsicos, a teoria de probabilidades ganhou status prprio como um ramo
autnomo da matemtica. Existem vrias propostas de como medir a incerteza. Entre elas, a mais desenvolvida a da teoria de probabilidades. Mesmo
assim, h diferentes escolas que propem diferentes meios de acessar valores
de probabilidades. H, portanto, alguma controvrsia sobre os fundamentos
da teoria. Discutiremos trs enfoques conceituais diferentes, mas que, independentemente das diferentes definies, usam as mesmas regras matemticas como medidas objetivas de incerteza. Os trs enfoques so o da probabilidade clssica, o da frequncia relativa de ocorrncias e o da probabilidade
Este material parte integrante do acervo do IESDE BRASIL S.A.,
mais informaes www.iesde.com.br

63

Probabilidades e distribuies de probabilidades

subjetiva, que apesar do nome trata a probabilidade como uma medida objetiva, embora a forma de sua determinao seja subjetiva. Aqui a palavra
objetiva significa uma medida exata que se submete ao corpo axiomtico da
teoria de Komolgorov.
Esses trs enfoques foram apresentados porque sero usados indistintamente na soluo dos problemas colocados no livro. As diferenas possveis
decorrentes da diferena de enfoques sero discutidas toda vez que puderem causar algum tipo de dvida ou desconforto.
Iniciaremos com a apresentao de uma srie de definies bsicas que
ajudaro na construo de toda a teoria de probabilidades necessria para a
soluo dos problemas apresentados nos demais captulos.

Experimento aleatrio
Experimento aleatrio um experimento no qual sabe-se que resultados
podem ocorrer, mas no se sabe de antemo que resultado ocorrer. Pode-se,
no entanto, determinar a probabilidade associada a cada resultado. Por exemplo, no lance de um dado honesto sabe-se que os resultados possveis so 1, 2,
3, 4, 5 ou 6 na face superior, cada resultado com probabilidade 1/6.
Como determinar a probabilidade de sair um nmero par? Pela teoria
clssica de probabilidades verificamos que h seis resultados possveis. A probabilidade de sair um nmero par determinada pela razo entre o nmero
de casos favorveis e o nmero de casos possveis, ou seja, 3 casos favorveis
sobre 6 casos possveis, ento essa probabilidade de 3/6 ou .
Do ponto de vista frequentista, essa probabilidade pode ser calculada
com o lance de um dado 1 000 vezes, verificando-se quantas vezes saiu um
nmero par e dividindo-se esse valor por 1 000.
Tambm se pode determinar intuitivamente, atravs de probabilidade
subjetiva, que o resultado sair um nmero par no lance de um dado equivalente a sair cara no lance de uma moeda, e que, portanto, pela experincia
do tomador de decises, ele pode concluir que essa probabilidade seja .

Evento
Eventos so cada um dos resultados possveis de um experimento aleatrio. O evento de sair cara no lance de uma moeda chamado de evento
64

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

Probabilidades e distribuies de probabilidades

simples, porque estamos interessados em um resultado singular do experimento aleatrio. O evento sair um nmero par no lance de um dado um
evento composto, porque o resultado est associado a trs possveis eventos
simples.
Aos eventos no geral associa-se um conjunto, e a notao utilizada ser a
da teoria dos conjuntos, que estabelece denotar o conjunto com letras maisculas, e quando necessrio, os elementos do conjunto com letras minsculas. Ento o evento sair um nmero par pode ser representado pelo conjunto
A = {2, 4, 6}.
Tambm podemos pensar no caso da moeda, que o resultado do lance
pode ser 1 no caso de sucesso em sair uma cara e 0 no caso de fracasso em
sair uma coroa. Assim, se X o resultado do lance de uma moeda, X = 1 representa cara e X= 0 representa coroa.

Espao amostral
Podemos definir de forma simples o espao amostral como o conjunto
de todos os resultados possveis de um experimento aleatrio ou de outra
forma o conjunto de todos os eventos simples de um experimento aleatrio.
No geral, o espao amostral denominado por S (space, em ingls) ou pela
letra grega (mega).
No lance de um dado o espao amostral ser o conjunto S = {1, 2, 3, 4, 5,
6}. No lance de uma moeda o espao amostral ser S = {C, K}, em que C representa cara e K, coroa. Em muitos livros traduzidos encontramos o espao
amostral para esse experimento aleatrio como S = {H,T}. Aqui H representa
cara e T coroa, porque o jogo cara ou coroa em ingls chamado de head or
tail, cabea ou rabo.
Observe que o espao amostral o conjunto de todos os elementos, ou o
conjunto universo da teoria de conjuntos.

Evento certo e eventos mutuamente exclusivos


Um evento dito certo quando no h possibilidade de ocorrncia de
outro evento. Tambm evento impossvel aquele que no tem qualquer
possibilidade de ocorrncia. No lance de um dado, um nmero de 1 a 6 aparecer na face superior do dado um evento certo. No lance de dois dados, a
Este material parte integrante do acervo do IESDE BRASIL S.A.,
mais informaes www.iesde.com.br

65

Probabilidades e distribuies de probabilidades

soma das faces superiores ser 15 um evento impossvel. Essa definio ser
til um pouco mais tarde quando tratarmos de probabilidades.
Eventos mutuamente exclusivos so aqueles cujos elementos no podem
pertencer a dois conjuntos ao mesmo tempo. Segue um exemplo de eventos
no mutuamente exclusivos com relao ao nmero que aparece na face
superior do lanamento de um dado. Seja o evento A sair um nmero par e
o evento B um nmero menor do que 4. Ento A e B no so mutuamente
exclusivos porque o evento 2 ocorre em ambos os conjuntos. A = {2, 4, 6} e
B = {1, 2, 3}.

Eventos complementares
Dois eventos so complementares quando os seus elementos pertencem
a eventos mutuamente exclusivos e a reunio de todos os elementos igual
ao espao amostral. Por exemplo, no lance de um dado o evento A = {1, 2}
complementar ao evento B = {3, 4, 5, 6}. Tambm o evento sair um nmero
par na face superior no lanamento de um dado complementar ao evento
sair um nmero mpar.
usual denotar o evento complementar de A como ou Ac.

Probabilidade
Probabilidade uma medida de incerteza que pode assumir valores entre
0 e 1. No existe probabilidade negativa nem maior do que 1. A probabilidade
de sair cara no lance de uma moeda igual a ou 0,5 e no 50%.
Embora probabilidade e percentagem sejam medidas de naturezas diferentes, no incomum que se utilize percentagem com o sentido de probabilidade. Quando isso no nos atrapalhar, utilizaremos indistintamente as
duas acepes.
A probabilidade de um evento A pode ser definida como o nmero de
elementos favorveis sobre o nmero de elementos possveis. O cardinal do
conjunto A, denotado por #A, representa o nmero de elementos favorveis
do evento A e o #S o nmero de elementos do espao amostral, ento:
P (A) = #A
#S
66

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

Probabilidades e distribuies de probabilidades

No evento nmero par no lance de um dado, A = {2, 4, 6}, cujo nmero de


elementos dado por #A = 3 e S = {1, 2, 3, 4, 5, 6} com #S = 6, ento:
P (A) = #A = 3 = 1 = 0,5
2
#S 6

Probabilidade, chance e verossimilhana


Esses trs termos so muitas vezes utilizados indistintamente, mas de fato
representam fenmenos de natureza distinta.
Dizemos que a chance de se ganhar na mega-sena de aproximadamente
1 para 50 milhes se jogarmos um bilhete com 6 nmeros. A ideia de chance
est relacionada a jogo. curioso notar que a teoria de probabilidade em
seus primrdios era denominada nos meios acadmicos como a teoria das
chances, somente mais tarde se distinguiu chance de probabilidade, tendo
sido reservada para essa ltima a primazia de denominar a teoria que se encarrega de medir incerteza.
Por outro lado, a palavra verossimilhana tambm no tem o mesmo significado de probabilidade. Por exemplo, bem sabido que se em uma noite
de inverno o frio for intenso e o cu estiver estrelado, a possibilidade de
ocorrncia de geada na manh do dia seguinte bastante grande. Devemos
dizer que verossmil e no que provvel a ocorrncia de geada. Essa palavra muito pouco utilizada coloquialmente em portugus e por isso falamos
em provvel ou verossmil indistintamente.
Na lngua inglesa, a palavra correspondente verossimilhana likelihood,
bastante comum no uso coloquial. Ento, em muitos livros de estatstica traduzidos do ingls para o portugus, o tradutor prefere utilizar probabilidade nos locais em que aparece likelihood e isso pode trazer alguma confuso
conceitual. Foraremos um pouco o uso correto e distinto de probabilidade
e verossimilhana quando for necessrio no texto.

Axiomas e regras de probabilidades


As regras para o uso de probabilidades, muitas vezes apresentadas como
teoremas, partem de um conjunto de princpios que leva em conta a natureza da medida de probabilidade. Esse conjunto de princpios conhecido

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

67

Probabilidades e distribuies de probabilidades

como os Axiomas de Kolmogorov, o matemtico russo que as estabeleceu no


incio do sculo XX.

Axiomas de Kolmogorov
Seja A um evento e S o espao amostral de um experimento aleatrio, ento:
(I) 0 P(A) 1;
(II) P(S) = 1;
(III) P(A B) = P(A) + P(B) P(A B), se A e B no so eventos mutuamente
exclusivos.
O primeiro axioma define probabilidade como uma medida no negativa e no maior que a unidade. Ento, um nmero definido no intervalo
de 0 a 1 e no uma percentagem. Ela pode ser apresentada em forma de
frao 4/10, com o numerador sempre menor ou igual ao denominador,
ou em forma decimal 0,4. No teremos preferncia neste livro na forma
de apresentao final das probabilidades calculadas, mas sempre convm
fazer as operaes atravs de fraes para no haver acmulo de erros
devido a arredondamentos.
O segundo axioma informa que a probabilidade do espao amostral
sempre 1. O espao amostral pode ser tomado como o evento composto
certo. Por outro lado, o evento complementar a S o conjunto vazio, denotado por { } ou .
O terceiro axioma diz que a probabilidade da unio de dois eventos a
soma das probabilidades dos eventos menos a probabilidade de sua interseo. Se A e B so mutuamente exclusivos, ento A B = . Vejamos um
exemplo de eventos no mutuamente exclusivos.
No lance de um dado, seja A o evento sair um nmero par e B o evento
sair um nmero menor que 4. Ento, A = {2, 4, 6} e B = {1, 2, 3}, a unio dos
dois eventos A B = {1, 2, 3, 4, 6} e a interseo e A B = {2}. Ento P (A B)
= 1/2 + 1/2 1/6 = 5/6, uma vez que P (A) = 1/2; P (B) = 1/2 e P(A B) = 1/6.
Verifique que de fato o cardinal de A B #(A B) = 5.
necessrio fazer a subtrao porque caso contrrio o elemento 2 entraria duas vezes, enquanto na unio ele s entra uma vez, apesar de ser
elemento dos conjuntos A e B.
68

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

Probabilidades e distribuies de probabilidades

Regras de probabilidades
Algumas regras teis derivadas dos axiomas de probabilidades sero
apresentadas sem prova. Em um contexto formal elas poderiam ser apresentadas como teoremas com as devidas provas, mas esse no o interesse
neste texto.

Eventos complementares
Se A um evento e o seu evento complementar, ento P(A) + P() =
1, ou ainda P() = 1 P(A). Um caso particular ocorre para o caso do conjunto vazio, sabidamente complementar ao conjunto universo. P() = 1 P(S),
ento como P(S) = 1, P() = 0.

Regra da adio
Se A e B so eventos mutuamente excludentes, isto , A
P(A B) = P(A) + P(B), haja vista que P() = 0.

B = , ento

Sejam os eventos A ={2, 4} e B { 3, 5} e S = {1, 2, 3, 4, 5, 6}, ento P(A B) =


P(A) + P(B) = 2/6 +2/6 = 4/6, verifique que A B = {2, 3, 4, 5}, cujo cardinal e
#( A B) = 4.
A

B
5

2
4
1

3
6
S

Regra da diferena
Se A e B so dois conjuntos quaisquer, podemos definir a diferena entre
os dois conjuntos, A\B como o conjunto de todos os elementos que pertencem a A e que no pertencem a B. Ento P(A\B) = P(A) P(A B).
Sejam os eventos A ={2, 4} e B { 2, 3, 5} e S = {1, 2, 3, 4, 5, 6}, ento P(A\B) = P(A)
P(A B) = 2/6 1/6 = 1/6. Verifique que A\B = {4} cujo cardinal #(A\B) = 1.
Este material parte integrante do acervo do IESDE BRASIL S.A.,
mais informaes www.iesde.com.br

69

Probabilidades e distribuies de probabilidades

A
4

B
5

Probabilidades conjunta,
marginal, condicional e independncia
Probabilidade conjunta
Em muitas aplicaes, estaremos interessados na probabilidade de ocorrncia conjunta de dois ou mais eventos. Considere uma pesquisa de mercado em que dois produtos, A e B, foram apresentados para uma amostra de 1
000 pessoas, 500 homens e 500 mulheres. Os resultados das preferncias so
apresentados na tabela a seguir:
Sexo

Prefere produto A

Prefere produto B

Total

Masculino (M)

200

300

500

Feminino (F)

100

400

500

Total

300

700

1 000

O evento, quando um homem prefere o produto A, representado por


(M e A), quando uma mulher prefere o produto A por (F e A) e assim por
diante, e a probabilidade associada ao primeiro representada por P(M
e A). Essa probabilidade pode ser determinada por P(M e A) = 200/1 000
= 0,2. Ento, podemos construir uma tabela de probabilidades conjuntas,
conforme a seguir:
Sexo

70

Prefere produto A

Prefere produto B

Total

Masculino (H)

0,2

0,3

0,5

Feminino (M)

0,1

0,4

0,5

Total

0,3

0,7

1,0

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

Probabilidades e distribuies de probabilidades

Probabilidade marginal
Adicionalmente s probabilidades conjuntas, possvel determinar as
probabilidades marginais com respeito ao sexo e preferncia por produto.
Essas probabilidades so chamadas de probabilidades marginais ou de probabilidades incondicionais. Por exemplo, a probabilidade marginal de que
um indivduo escolhido aleatoriamente seja homem de P(H) = 0,5 e a probabilidade que o produto A seja escolhido de P(A) = 0,3.
Observe que a probabilidade de que o produto A seja escolhido a soma
de duas probabilidades mutuamente excludentes: P[(A e H) ou (A e M)] = P(A
e H) + P(A e M) = 0,2 + 0,1 = 0,3.

Probabilidade condicional
Se estivermos interessados na probabilidade de ocorrncia de um evento
uma vez que outro evento j ocorreu, podemos definir probabilidades condicionais. Por exemplo, podemos estar interessados em saber qual a probabilidade de ocorrncia do evento preferncia pelo produto A dado que o
elemento sorteado foi um homem.
Definimos ento, P(A/H) como a probabilidade condicional e diz-se probabilidade de A dado H:
P(A/H) =

P(A H)
2
0,2
=
= 0,4
=
5
0,5
P(H)

Na verdade restringimos nosso espao amostral para o evento ocorreu


homem. Podemos tambm restringir o espao amostral por preferncia por
produto. Assim, podemos determinar a probabilidade de escolhermos um
homem dado que o produto preferido foi o produto A, desejamos ento calcular P(H/A):
P(H/A) =

P(H A)
2
0,2
=
= 0,67
=
3
0,3
P(A)

Independncia
Verificamos que a probabilidade de preferncia do produto A dado que
um homem foi sorteado igual a 0,4. Ento:
P(A/M) =

P(A M) 0,2
2
=
= 0,4
=
5
0,5
P(M)

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

71

Probabilidades e distribuies de probabilidades

Podemos concluir desse fato que a preferncia pelo produto A depende


do sexo da pessoa sorteada. Definimos assim que dois eventos so estatisticamente independentes quando a ocorrncia de um evento no afeta a
ocorrncia do outro. E, portanto, se C e D so independentes, denotamos
(C D), ento:
P(C/D) = P(C)
Alguns exemplos interessantes de eventos independentes: Evento C,
sexo do segundo filho e evento D, sexo do primeiro filho. Evento C, resultado do lance da segunda moeda, e evento D, resultado do lance da primeira
moeda. Evento C, sorteio do nmero correspondente dezena da loteria
federal, e evento D, resultado do nmero correspondente unidade da loteria federal.
Ento, a probabilidade de o segundo filho ser homem, dado que o primeiro foi mulher, igual probabilidade de o segundo filho ser homem.

Regra da multiplicao
Quando dois eventos so independentes, temos que P(C/D) = P(C). Observe tambm que
Se P(C/D) = P(C

D)/P(D) ento P(C

D) = P(C/D) P(D).

Utilizando a afirmao de independncia, temos ento que: se C e D so


eventos independentes:
P(C

D), = P(C) P(D)

Verifique que para o exemplo da pesquisa de mercado a seguir os eventos preferncia por um produto e sexo so independentes.
Sexo

Prefere produto A

Prefere produto B

Total

Masculino (H)

0,08

0,32

0,4

Feminino (M)

0,12

0,48

0,6

Total

0,20

0,80

1,0

P(A/H) = 0,08/0,4 = 8/40 = 1/5 = 0,2 e P(A/M) = 0,12/0,6 = 12/60 = 0,2.


Nesse caso, pode-se verificar que o produto das probabilidades marginais
correspondentes igual probabilidade conjunta. P(A) P(H) = 0,2 . 0,4 = 0,08
= P(A e H). Normalmente, denota-se P(A e H) como a probabilidade da interseo, ento: P(A H) = P(A) P(H).
72

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

Probabilidades e distribuies de probabilidades

Teorema de Bayes
O objetivo do teorema de Bayes o de fazer reviso de probabilidades
com base em novas peas de evidncia. Vamos apresentar o teorema a partir
de um exemplo prtico. A Companhia de Petrleo ABC deseja verificar qual
a probabilidade de haver petrleo no litoral paranaense, uma vez que foi
descoberto petrleo no litoral sul de So Paulo. Especialistas da Companhia
acreditam que devido s circunstncias geogrficas h uma probabilidade
de 70% de haver petrleo no Paran.
Contratam, ento, uma empresa de prospeco que realiza pesquisas
amostrais. Da experincia passada dessa empresa com a realizao desse
teste, ela garante uma sensibilidade do teste de 90%, isto , em 90% das
vezes em que ele fornece resultado positivo, de fato h petrleo. E garantem
tambm uma especificidade de 80%, ou seja, em 80% das vezes em que o
teste fornece resultado negativo, de fato no h petrleo. Com esses dados,
a empresa far uma reviso da probabilidade de haver petrleo, estimada
em 70% pelos tcnicos da Companhia ABC.
Para equacionar o problema, vamos chamar o evento ter petrleo de A,
de tal forma que A1 representar resultado positivo e A2 resultado negativo.
Assim, P(A1) = 0,7 e P(A2) = 0,3. Chamaremos essas probabilidades de probabilidades a priori.
O evento B representar o teste. Ento, se o teste fornece resultado positivo quando h petrleo em 90% das vezes, podemos representar essa probabilidade como P(B/A1) = 0,9. E se o teste fornece resultado negativo quando
no h petrleo em 80% das vezes, significa que em 20% fornece resultado
negativo quando h petrleo, portanto P(B/A2) = 0,20.
Da definio de probabilidade condicional, temos que se P(B/A1) =
P(A1 B) /P(A1) ento P(A1 B) = P(A1) P(B/A1).
Assim, P(A1

B) = (0,7).(0,9) = 0,63. E P(A2

Observamos que se B = {(A1


Ento P(B) = 0,63 + 0,06.

B) U (A2

B) = (0,3).(0,2) = 0,06.

B)}, ento P(B) = P(A1

B) + P(A2

B).

Por outro lado, P(A1/B) = P(A1 B)/ P(B). Logo, P(A1/B) = 0,63/0,69 = 0,90.
Ento, a probabilidade de haver petrleo no Paran, dado o resultado positivo do teste, de 91%. Assim, a probabilidade de 70% de haver petrleo foi
atualizada para 91%.
Este material parte integrante do acervo do IESDE BRASIL S.A.,
mais informaes www.iesde.com.br

73

Probabilidades e distribuies de probabilidades

Esses clculos podem ser mais bem acompanhados atravs da tabela a


seguir:
Probabilidade a priori

Probabilidade
condicional

Probabilidade conjunta

Probabilidade a
posteriori

P(Ai)

P(x2/i)

P(i) P(x2/i)

P(i/x2)

A1 = tem petrleo

0,7

0,9

0,63

0,91

A2 = no tem petrleo

0,3

0,2

0,06

0,09

Total

1,0

0,69

1,0

Eventos Ai

Verifique que a distribuio conjunta dos eventos pode ser dada por:
Teste positivo
(B)

Teste negativo
(Bc)

Total

A1 = tem petrleo

0,63

0,07

0,7

A2 = no tem petrleo

0,06

0,24

0,3

Total

0,69

0,31

1,0

Confira na tabela a probabilidade P(B/A1) = P(B A1)/P(A1) = 0,63/0,7 = 0,9,


que o valor da sensibilidade de 90%. Todas as outras probabilidades podem
ser verificadas.
Como reforo, vamos deduzir uma expresso geral para o teorema de
Bayes, a partir da anlise do seguinte diagrama de Venn e da definio de
probabilidade condicional.
A2
B

A1
Pela definio de probabilidade condicional, temos que P(A 1/B) =
P(A1 B)/P(B).
74

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

Probabilidades e distribuies de probabilidades

Mas tambm P(B/A1) = P(A1 B)/P(A1). Ento P(A1 B) = P(A1) P(B/A1).


Substituindo essa ltima expresso na primeira, teremos:
P(A1/B) =
Como P(B) = P(A1

B) + P(A2

P(A1) P(B/A1)
P(B)
B) = P(A1)P(B/A1)+ P(A2)P(B/A2)

Temos a expresso geral do Teorema de Bayes para o caso de dois eventos:


P(A1/B) =

P(A1) P(B/A1)
P(A1) P(B/A1) + P(A2) P(B/A2)

Deduzimos, atravs de um exemplo de desenvolvimento matemtico, a


expresso do Teorema de Bayes quando temos dois eventos, cada um com
dois elementos. Uma expresso mais geral pode ser demonstrada, e sua expresso :
P(A1/B) =

P(Ai) P(B/Ai)
P(Ai) P(B/Ai)

Distribuies de probabilidades discretas


Varivel aleatria
Podemos definir aproximadamente varivel aleatria como uma varivel que assume valores numricos em funo do acaso. Rigorosamente, do
ponto de vista matemtico, uma varivel aleatria uma funo consistindo
de elementos de um espao amostral associados a nmeros reais relacionados a esses elementos.
So exemplos de variveis aleatrias: sair cara no lance de uma moeda,
a soma dos nmeros das faces superiores no lanamento de dois dados, o
faturamento de uma empresa no final de um perodo, o rendimento de aplicao de uma dada carteira e assim por diante.
Qualquer varivel que seja funo de resultados que dependem de incerteza podem ser consideradas como varivel aleatria.

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

75

Probabilidades e distribuies de probabilidades

Distribuio de probabilidades de uma varivel aleatria


Podemos associar os valores possveis de uma varivel aleatria a um
certo nvel de probabilidade. A tabela formada por esse conjunto chamada
de distribuio de probabilidades.
Por exemplo, distribuio de probabilidades dos preos de um determinado produto em estoque:
Preo dos produtos em R$ (X)

Probabilidade de X P(X = x)

67

0,10

68

0,25

69

0,50

70

0,10

71

0,05

A probabilidade de sortearmos um produto no estoque e que ele custe


R$69,00 igual a . Ou P(X = 69) = .
A representao grfica de uma varivel aleatria pode ser feita atravs
de um grfico de bastes.
0,6

Probabilidades

0,5
0,4
0,3
0,2
0,1
0

Preo dos produtos

76

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

Probabilidades e distribuies de probabilidades

Propriedades de uma varivel aleatria discreta


Uma varivel aleatria discreta X tem duas propriedades:
(I) P(X = x) 0
(II) P(X = x) =1
Tambm podemos representar P(X = x) por f(x), ento, as condies acima
poderiam tambm ser expressas da seguinte forma:
(I) f(x) 0
(II) f(x) =1

Funo de distribuio acumulada


Dada uma varivel aleatria X, o valor da funo de distribuio acumulada no ponto x, denotada por F(x), a probabilidade que X tome valores
menores ou iguais a x. Ou seja:
F(x) = P(X x)
No exemplo dos preos dos produtos em estoque teremos:
Preo dos produtos
(X) em R$

Probabilidade de X
P(X = x)

Probabilidade acumulada
P(X x) = F(x)

67

0,10

0,10

68

0,25

0,35

69

0,50

0,85

70

0,10

0,95

71

0,05

1,00

Esperana e varincia
de uma varivel aleatria discreta
A esperana de uma varivel aleatria discreta, tambm chamada de expectncia ou valor esperado, a mdia aritmtica ponderada pelas probabilidades. Ela pode ser definida como:
= E(X) = X P(X = x)
Este material parte integrante do acervo do IESDE BRASIL S.A.,
mais informaes www.iesde.com.br

77

Probabilidades e distribuies de probabilidades

A varincia de uma varivel aleatria discreta definida como:


2 = VAR(X) = (X )2 = E(X2) [E(X)]2
onde, E(X2) = X2 P(X = x).
Para o exemplo dos produtos em estoque, temos:
X

P(X = x)

X P(X = x)

67

0,10

6,70

4 489

448,90

68

0,25

17,00

4 624

1 156,00

69

0,50

34,50

4 761

2 380,50

70

0,10

7,00

4 900

490,00

71

0,05

3,55

5 041

252,05

Total

X2

X2 P(X = x)

68,75

4 727,45

E(X) = 68,75
VAR(X) = E(X2) [E(X)]2 = 4 727,45 (68,75)2 = 0,8875.
O valor mdio dos produtos em estoque de R$68,75 e sua varincia
igual a 0,8875.

Distribuio conjunta de probabilidades


Quando temos mais de uma varivel aleatria em considerao, podemos construir uma distribuio conjunta de probabilidades.
Seja, por exemplo, um distribuidor que vende seu produto para duas empresas. A tabela abaixo representa as vendas por dia para cada empresa e as
probabilidades associadas:
Empresa X

78

Empresa Y

P(Y = y)

0,1

0,1

0,0

0,2

0,1

0,5

0,0

0,6

0,0

0,0

0,2

0,2

P(X = x)

0,2

0,6

0,2

1,0

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

Probabilidades e distribuies de probabilidades

Definimos como distribuio de probabilidades marginais as distribuies


de Y e de X conforme tabelas a seguir:
Empresa Y

P(Y = y)

0,2

0,6

0,2

P(Y = y)

1,0

Empresa X

P(X = x)

0,2

0,6

0,2

P(X = x)

1,0

Podemos definir tambm distribuies de probabilidades condicionais. Por


exemplo, a distribuio de probabilidades de X dado que Y = 1.
Empresa X

P(X = x / Y = 1)

0,1/0,6 = 0,17

0,5/0,6 = 0,83

0,0

P(Y = y)

1,0

Dessas distribuies de probabilidades podemos calcular suas mdias e


suas varincias:
E(X) = XP(X = x) = (0).(0,2) + (1).(0,6) + (2).(0,2) = 0,6 + 0,4 = 1,0
Var(X) = E(X2)[E(X)]2 = (0)2.(0,2) + (1)2.(0,6) + (2)2.(0,2) (0,4)2 = 0,6 + 0,8
0,16 = 1,24
A esperana condicional de X dado Y = 1 ser:
E(X/Y=1) = (0).(0,17) + (1).(0,83) + (2).(0) = 0,83.

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

79

Probabilidades e distribuies de probabilidades

Covarincia e correlao
Definimos covarincia e correlao conforme segue:
Cov(X,Y) = E(X,Y) E(X)E(Y) e
Corr(X, Y) =

x, y

Cov(X, Y)
Var(X) Var(Y)

E(X,Y) XYP(X = x, Y = y) = 0.0.0,1+ 0.1.0,1+ 0.2.0 + 1.0.0,1 + 1.1.0,5 + 1.2.0 +


2.0.0 + 2.1.0 + 2.2.0,2 = 0,5 + 0,8 = 1,3
E(X) = E(Y) = 1
Cov (X,Y) = 1,3 1.1 = 1,3 1 = 0,3
X,Y

= 0,3 / 1,24 = 0,24

A correlao mede a fora do relacionamento das variveis X e Y. Pode variar


em mdulo de 0 a 1. Correlao igual a 0 significa que no h correlao entre as
variveis e correlao 1 resulta de relao muito forte entre X e Y.

Variveis aleatrias discretas


Existem algumas distribuies de probabilidades discretas que tm caractersticas especiais e so muito utilizadas na prtica. Faremos uma exposio de cada uma delas, evitando o desenvolvimento terico que exigiria
certa manipulao matemtica que temos evitado.
Estudaremos as distribuies uniforme, binomial, multinomial, hipergeomtrica e de Poisson.

Distribuio uniforme
Algumas vezes, todos os valores possveis da varivel aleatria assumem
o mesmo valor. Tal distribuio de probabilidades chamada de distribuio
uniforme e tem a seguinte distribuio de probabilidades:
P(X = x) = f(x) = 1 , x = 0 ,..., N
N
X
=
E(X) =
N
Var(X) = 1 [( X2) (X)2 ] = 2
N
80

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

Probabilidades e distribuies de probabilidades

Exemplo:
Lance de um dado no viciado. A funo de probabilidade (ou funo
densidade de probabilidades) dada por:
1
P (X = x) =
6
E(X) = 3,5
VAR(X) = 2,92
Exemplo:
Um voo internacional est escalado para chegar ao Aeroporto Internacional de Cumbica em So Paulo s 7h30min da manh. Um estudo mostrou
que a hora real de chegada uniformemente distribuda por minutos no
intervalo de 7h05min s 8h40min. Seja X = 1 a chegada s 7h05min, X = 2 a
chegada s 7h06min, e assim por diante.
a) Escreva a expresso matemtica de f(x) = P(X = x).
b) Qual a probabilidade que o voo se atrase?
c) Qual a probabilidade que o voo chegue depois das 8h00?
d) Qual a probabilidade que o voo chegue s 8h00 ou depois das
8h00?
e) Qual probabilidade que o voo chegue antes das 7h30min?
Entre 7h05min e 8h40min existem 96 minutos, ento:
a) f(x) =1/96, x = 1, ... , 96.
b) A probabilidade que o voo se atrase a probabilidade que ele chegue
depois das 7h30min. Entre 7h31min e 8h40min existem 70 minutos,
ento:
70
P(7h31min X 8h40min) = P(7h30min < X 8h40min) =
= 0,729.
96
c) A probabilidade que o voo chegue depois das 8h00 e P(X > 8h00) = 40
96
= 0,417.
d) A probabilidade que o voo chegue s 8h00 ou depois das oito
P(X 8h00) = 41 = 0,427.
96
e) Entre 07h05min e 07h30min existem 25 minutos.

Ento, P(7h05min X 7h30min) =

25
= 0,260.
96

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

81

Probabilidades e distribuies de probabilidades

Distribuio binomial
Na distribuio binomial h dois resultados possveis em cada experimento aleatrio. E uma das distribuies mais importantes por suas aplicaes na
rea de negcios e de cincias sociais. O processo que se utiliza da distribuio binomial conhecido como prova de Bernoulli ou processo de Bernoulli,
matemtico suo que pela primeira vez deu sentido ao uso da distribuio
binomial.
As seguintes suposies devem ser feitas para o uso da distribuio
binomial:
(I) em cada processo h dois possveis resultados mutuamente exclusivos,
que so chamados de sucesso ou fracasso;
(II) a probabilidade de sucesso, denotada por p, permanece constante durante todo o processo. A probabilidade de fracasso, denotada por q
igual a 1 p;
(III) cada passo do processo independente do anterior.
A distribuio binomial tem a seguinte distribuio de probabilidades:
P(X = x) = f(x) = Cn,x px qn-x
E(X) = n.p
VAR(X) = n.p.q
O exemplo clssico do uso da distribuio binomial o clculo da probabilidade de, por exemplo, sarem duas caras no lance de seis moedas hones1
tas. Nesta situao, n = 6, p = e X = 2. Ento:
2
2
4
P(X = 2) = C6,2 (1/2) .(1/2) = (15).(0,015625) = 0,2344
A tabela abaixo fornece toda a distribuio de probabilidades para o experimento acima:
X

P(X = x)

0,0156

0,0938

0,2344

0,3125

0,2344

0,0938

0,0156

E(X) = n.p = 6 . 1 = 3
2
V(X) = n.p.q = 6 . 1 . 1 = 1,5
2 2
82

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

Probabilidades e distribuies de probabilidades

A distribuio binomial aplicvel em situaes de amostragem de uma


populao finita com reposio ou de uma amostragem com uma populao
infinita com ou sem reposio.
Exemplo:
A gerncia de Atendimento ao Cliente dos Correios responsvel por
expedir a correspondncia atrasada. Da experincia passada, essa Gerncia
sabe que em 90% das vezes as correspondncias so entregues sem atraso.
Da tabela A da distribuio binomial acumulada retire os valores para determinar as probabilidades de que em 10 remessas:
a) trs ou menos correspondncias sero entregues com atraso.
b) entre trs e cinco correspondncias sero entregues com atraso.
c) trs ou mais correspondncias sero entregues em dia.
d) exatamente duas correspondncias sero entregues com atraso.
e) sete ou mais correspondncias sero entregues com atraso.
Seja X a varivel aleatria correspondente entrega com atraso da correspondncia. Ento, podemos estabelecer p = 0,10. Repare que a ao correspondente a sucesso a entrega com atraso. Ento, q = 0,90 e n = 10.
a) Da tabela A, temos que F(3) = 0,9872
Essa probabilidade corresponde a calcular P(X3) = F(3) =
(0,90)10 X

C10,X (0,10)X
x=0

Ou ainda P(X 3) = P(X = 0) + P(X = 1) + P(X =2) + P( X = 3), esses valores


podem ser encontrados na tabela B da distribuio de probabilidades binomial para n = 10, p = 0,10.
P(X 3) = 0,3487 + 0,3874 + 0,1937 + 0,0574 = 0,9872.
b) P(3 X 5) = P(X 5) P(X < 3) = P(X 5) P(X 2) = F(5) F(2) =

= 0,9999 0,9298 = 0,0701.

c) trs ou mais fracassos correspondem a sete ou menos sucessos.


Lembrando que fracasso aqui entregar a correspondncia em dia.
Ento, precisamos calcular P(X 7) = F(7) = 1,0000.
d) A probabilidade de exatamente dois sucessos P(X 2) P(X 1) =
F(2) F(1) = 0,9298 0,7361 = 0,1937, esse valor pode ser confirmado
na tabela B para P(X = 2).
e) P( X 7) = 1 P(X 6) = 1 F(6) = 1 1 = 0.
Este material parte integrante do acervo do IESDE BRASIL S.A.,
mais informaes www.iesde.com.br

83

Probabilidades e distribuies de probabilidades

Distribuio multinomial
No caso da distribuio binomial havia dois possveis resultados para o
processo, sucesso ou fracasso. No caso da distribuio multinomial, podemos ter mais do que dois resultados possveis. A sua distribuio de probabilidades dada pela expresso:
P(X1 = x1, X2 = x2, ..., Xn = xn) = f(x) = [n!/x1!x2!...xn!] p1x1 p2x2 ...pnxn
E(Xi) = ni.pi
VAR(Xi) = ni.pi.qi
Exemplo:
A loja ABC est liquidando o seu estoque, distribuindo roupas de tamanhos diferentes em trs salas. Uma sala para manequim pequeno, outra para
mdio e outra para grande. Uma pessoa entra na sala de roupas mdias e
escolhe 10 peas. Por causa de um erro de classificao das peas, 15% delas
na sala de roupas mdias eram grandes, e 5% eram pequenas, as demais
eram de fato roupas de tamanho mdio.
a) Qual a probabilidade de que a pessoa que escolheu as peas na sala de
roupas de tamanho mdio, tenha pegado exatamente cinco roupas de tamanho mdio, uma de tamanho grande e quatro de tamanho pequeno?
b) Qual a probabilidade de ela ter pego sete roupas de tamanho mdio,
duas de tamanho grande e uma de tamanho pequeno?
Aplicando a expresso da distribuio multinomial, teremos:
a) f(5,1,4) = [10!/5!1!4!].(0,80)5.(0,15).(0,05)4 = 0,0004
b) f(7,2,1) = [10!/7!2!1!].(0,80)7.(0,15)2.(0,05) = 0,0849.

Distribuio hipergeomtrica
A distribuio binomial foi utilizada para amostragens de populaes finitas com reposio. Em muitas situaes prticas, as amostragens so realizadas sem reposio e, nesse caso, o modelo adequado o da distribuio
hipergeomtrica.

84

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

Probabilidades e distribuies de probabilidades

Suponha que temos bolas de duas cores em uma caixa com N bolas,
sendo que N1 so brancas e N N1 so azuis. Uma amostra de tamanho n
retirada da caixa e desejamos saber qual a probabilidade que x dessas bolas
sejam brancas.
A expresso para o clculo de x sucessos na amostra aleatria de tamanho n sem reposio dada por:
f(x) = P(X = x) =

CN ,xC(N N1), (n, x)


1

CN, n

para x = 0,1, ...

O exemplo do incio do captulo que diz respeito probabilidade de cinco


pessoas que moram no mesmo quarteiro estarem em um mesmo nibus
uma aplicao da distribuio hipergeomtrica.

Distribuio de Poisson
A distribuio de Poisson tem uma grande aplicao em situaes como
demanda por produtos, nmero de telefonemas que chegam a uma central,
nmero de acidentes, nmeros de trfego de chegadas (como caminhes
em um terminal, avies em aeroportos, navios nos portos etc.) e nmero de
defeitos observados em linhas de produo.
Todas essas situaes tm dois pontos em comum:
(I) as ocorrncias podem ser descritas por uma varivel aleatria que
toma valores como 0, 1, 2 e assim por diante;
(II) existe um ndice do nmero de ocorrncias por intervalo de tempo ou
espao.
Algumas suposies so feitas para a utilizao dessa distribuio, que so:
(I) a probabilidade de exatamente uma ocorrncia acontecer em um subintervalo um nmero pequeno que constante em cada subintervalo;
(II) a probabilidade de duas ou mais ocorrncias em um subintervalo
to pequena que considerada igual a zero;
(III) o nmero de ocorrncias em um subintervalo no depende onde este
subintervalo est localizado;

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

85

Probabilidades e distribuies de probabilidades

(IV) o nmero de ocorrncias em um subintervalo no depende do nmero de ocorrncias em qualquer outro subintervalo.
A distribuio de Poisson pode ser descrita pela funo densidade de
probabilidade:
x

P(X = x) = f(x) = ( . e ) , ... para x = 0, 1, 2.......


x!

A esperana e a varincia de X so iguais. E(X) = VAR (X) = .


Exemplo:
Seja X a varivel aleatria nmero de chamadas telefnicas por minuto
durante um dado perodo de tempo. Ento = 0,4 chamadas por minuto
o parmetro da distribuio de probabilidades de Poisson. A probabilidade
que certo nmero de chamadas chegar central dada pela expresso da
funo densidade. Ento:
Para X = 0
P(X = 0) = f(0) =

(0,4)0.e0,4
= 0,670.
0!

Para X = 1
P(X = 1) = f(1) =

(0,4)1.e0,4
= (0,4)(0,670) = 0,268.
1!

Para encontrar esses e outros valores de f(x), pode-se consultar diretamente a tabela C dos valores da funo de distribuio acumulada para a distribuio de Poisson.
c

F(c) = P(X c) =

x=0

f(x)

A distribuio de Poisson
como aproximao da distribuio binomial
Quando n muito grande, o uso da distribuio binomial pode tornar--se tedioso. Para evitar essa situao podemos tomar a distribuio
de Poisson como uma aproximao da distribuio binomial, quando n
muito grande e p muito pequeno.

86

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

Probabilidades e distribuies de probabilidades

Se na distribuio binomial n cresce sem limites e p se aproxima de zero


de tal maneira que np permanea constante, podemos tomar n . p = como
o parmetro da distribuio de Poisson.
Exemplo:
Calcular a probabilidade de no se sortear nenhuma criana em uma
amostra de tamanho 5 de uma populao com 950 adultos e 50 crianas.
Os parmetros da distribuio binomial neste exemplo so p = 0,05 e n =
5, ento:
F(0) =

(0,25)0 . e0,25
= 0,779
0!

Resolvendo esse problema atravs da distribuio binomial teramos


P(X = 0) = 0,774, bem prximo ao encontrado pela distribuio de Poisson.

Atividades de aplicao
1. Determine o complemento para cada um dos seguintes eventos:

a) Obter 2 ou 3 na jogada de um dado.


b) Extrair uma carta de copas de um baralho de 52 cartas.
c) Retirar menos de 10 defeituosos.
d) Retirar pelo menos 5 defeituosos.
2. Considere o lanamento de dois dados. Considere os eventos A: soma
dos nmeros obtidos igual a 9, e B: nmero no primeiro dado maior
ou igual a 4.
a) Enumere os elementos de A e B.
b) Obtenha A B, A B e Ac.
3. Sejam P(A) = 0,30, P(B) = 0,80 e P(A e B) = 0,15.
a) A e B so mutuamente exclusivos? Explique.
b) Determine P(Bc).
c) Determine P(A ou B).

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

87

Probabilidades e distribuies de probabilidades

4. Um grupo de 12 homens e oito mulheres concorre a trs prmios atravs


de um sorteio, sem reposio de seus nomes. Qual a probabilidade de:

a) nenhum homem ser sorteado?


b) um prmio ser ganho por homem?
c) dois homens serem premiados?
5. Uma remessa de 1 500 componentes eletrnicos contm 400 defeituosos e 1 100 perfeitos. Duzentos componentes so escolhidos ao
acaso (sem reposio) e classificados.
a) Qual a probabilidade que sejam encontrados exatamente 90
componentes defeituosos?
b) Qual a probabilidade que se encontrem ao menos dois componentes defeituosos?
6. Certo curso de treinamento aumenta a produtividade de certa populao de funcionrios em 80% dos casos. De 10 funcionrios quaisquer que participam desse curso, encontre a probabilidade de:
a) exatamente sete funcionrios aumentarem a produtividade.
b) pelo menos trs no aumentarem a produtividade.
7. O processo de parametrizao no Aeroporto Internacional tem apresentado um ndice de 70% de ocorrncias de sinal verde (mercadoria
liberada sem a necessidade de vistoria fsica e documental), 20% de
sinal amarelo (vistoria documental) e 10% de sinal vermelho (necessidade de vistoria fsica e documental). Supondo num dia qualquer a
chegada de oito lotes de produtos, determine a probabilidade de:
a) todos serem liberados sem nenhuma vistoria.
b) pelo menos dois lotes sofrerem inspeo fsica e documental.
c) no mximo trs apenas passarem pela vistoria documental.
8. Est sendo planejado um novo hospital para uma cidade no interior
do Nordeste, dentro de uma comunidade que ainda no tem hospital
prprio. Sabe-se que essa cidade tem uma mdia de 2,3 nascimentos
por dia, determine a probabilidade de que, em um dia qualquer, o nmero de nascimentos seja:
88

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

Probabilidades e distribuies de probabilidades

a) nenhum.
b) exatamente 2.
c) pelo menos 1.
9. Num processo de fabricao de certo tipo de componentes, a taxa
de defeituosos de 6%. Esses componentes so acondicionados em
caixas com cinco unidades para a venda no mercado. A empresa fabricante paga uma multa de R$10 por caixa em que tenha algum componente defeituoso. Num lote de 5 000 caixas, qual o valor esperado
para pagamento de multas?
10. Certo departamento de uma empresa est dimensionado de forma a
poder atender, no perodo normal, at cinco pedidos de servios. Se
chegarem mais que cinco pedidos, o pessoal deve recorrer a horas extras para cumprir o atendimento. Sabendo-se que o nmero mdio de
pedidos que chegam diariamente de 4,2, calcular:
a) a probabilidade de ocorrncia de horas extras num dia qualquer.
b) sendo o custo dirio de horas extras de R$375,00, qual ser o custo
mdio mensal estimado com horas extras (considerar 22 dias)?

Gabarito
1.
a) O complemento ser {1,4,5,6}.
b) O complemento ser extrair uma carta de ouros ou de espadas ou
de paus.
c) O complemento ser retirar 10 ou mais defeituosos.
d) O complemento ser retirar no mximo quatro defeituosos (ou menos
de cinco).
2.
a) A:{(3,6)(4,5)(5,4)(6,3)}

B:{(4,1)(4,2)(4,3)(4,4)(4,5)(4,6)(5,1)(5,2)(5,3)(5,4)(5,5)(5,6)(6,1)(6,2)
(6,3)(6,4)(6,5)(6,6)}.
Este material parte integrante do acervo do IESDE BRASIL S.A.,
mais informaes www.iesde.com.br

89

Probabilidades e distribuies de probabilidades

b) Os elementos de A B sero os elementos de A mais os elementos de B A B={(3,6)4,1)(4,2)(4,3)(4,4)(4,5)(4,6)(5,1)(5,2)(5,3)(5,4)


(5,5)(5,6)(6,1)(6,2)6,3)(6,4)(6,5)(6,6)}

Ac =

Os elementos de A
tos, logo:

Os elementos do complemento de A sero aqueles que no pertencem a A, mas pertencem aos demais conjuntos do espao amostral:

B sero aqueles comuns aos dois conjun-

B = {(4,5) (5,4) (6,3)}.

(1,1)(1,2)(1,3)(1,4)(1,5)(1,6)(2,1)(2,2)(2,3)(2,4)(2,5)(2,6)(3,1)(3,2)(3,3)(3,4)
(3,5)(4,1)(4,2)(4,3)(4,4)(4,6)(5,1)(5,2)(5,3)(5,5)(5,6)(6,1)(6,2)(6,4)(6,5)(6,6)

3.
a) No so mutuamente exclusivos, pois existe A

B = 0,15.

b) O complemento de B dado por: P(Bc) = 1 P(B), logo P(Bc) =


1 0,80 = 0,20.
c) P(AUB) = P(A) + P(B) P(AB) ... P(AUB) = 0,30 + 0,80 0,15 = 0,95.
4.

C 83 .C120
= 0, 049
a)
3
C 20

1
C 82 .C12
= 0,295
b)
3
C 20

c)

C 81 .C122
= 0, 463
3
C 20

5.
90
110
C 400
.C1100
200
C1500
0
200
1
199
2
198
C 400

.C1100
+ C 400
.C1100
+ C 400
.C1100
b) 1

200
C1500

a)

90

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

Probabilidades e distribuies de probabilidades

6.
a) Esse um caso de uma distribuio binomial, em que p = 0,80 e
n = 10, sendo assim:

P(X = 7) = C10.7(0,8)7.(0,2)3 P(X = 7) C10,7(0,8)7.(0,2)3 =

120.(0,2097).(0,008) = 0,2013

b) Nesse caso, o valor de p = 0,20 (probabilidade de no aumentar),


ento pelo menos 3 no aumentarem a P(X 3) = 1 P(X < 3),
ou seja, P(X 3) = 1 [P(X = 0) + P(X = 1) + P(X = 2) P(X 3) = 1
[C10,0 (0,2)0.(0,8)10 + C10,1(0,2)1.(0,8)9 + C10,2 (0,2)2.(0,8)8] P(X 3) =
1 [0,1074 + 0,2684 + 0,3020] P(X 3) = 1 [0,6778] = 0,3222
7. Esse problema um caso de distribuio binomial em que o valor de p
se altera em funo do evento solicitado e n = 8, sendo assim em:
a) P(todos receberem o sinal verde) com p = 0,7 e n = 8, logo,

P(X = 8) = C8,8 (0,7)8.(0,3)0 = 0,0576.

b) P(pelo menos 2 lotes receberem o sinal vermelho) com p = 0,10


en=8

P(X 2) = 1 P(X < 2) = 1 [P (X = 0) + P(X = 1)]

P(X 2) = 1 [C8,0 (0,1)0.(0,9)8 + C8,1 (0,1)1.(0,9)7]

P(X 2) = 1 [0,4305 + 0,3826] = 0,1869.

c) P(no mximo 3 receberem o sinal amarelo) com p = 0,2 e n = 8


P(X 3) = P(X = 0) + P(X = 1) + P(X = 2) + P(X = 3)

P(X 3) = [C8,0 (0,2)0.(0,8)8 + C8,1 (0,2)1.(0,8)7 + C8,2 (0,2)2.(0,8)6 + C8,3


(0,2)3.(0,8)5]

P(X 3) = [0,1678 + 0,3355 + 0,2936 + 0,1468] = 0,9437.

8. Esse problema trata de uma distribuio de Poisson, com mdia de 2,3


ocorrncias por dia. Sendo assim, temos que:
(2,30 . 2,3)
= 0,1002 ou 10,02%.
a) P(X = 0) =
0!

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

91

Probabilidades e distribuies de probabilidades

b) P(X = 2) =

(2,32 . 2,3)

= 0,2652 ou 26,52%.
2!
c) P(X 1) = 1 P(X < 1) = 1 P(X = 0) P(X 1) = 1 0,1002 = 0,8998
ou 89,98%.
9. uma aplicao da distribuio binomial. Inicialmente, devemos obter a probabilidade de ocorrer algum componente defeituoso numa
caixa, ou seja:

P(X 1) com n = 5 e p = 0,06 P(X 1) = 1 P(X < 1) = 1 P(X = 0). Logo:

P(X 1) = 1 [C5,0 (0,06)0 (0,94)5] P(X 1) = 1 [0,7339] = 0,2661


ou 26,61%.

Como a empresa paga R$10,00 por caixa com algum componente defeituoso e o lote contempla 5 000 caixas, ento a multa esperada ser
dada por:

E(multa) = P(caixa com algum componente defeituoso) x total de caixas x R$10,00

E(multa) = 0,2661 x 5.000 x R$ 10,00 em que E(multa) = R$13.305,00.

10. um caso de aplicao de uma distribuio de Poisson, com mdia de


4,2 pedidos/dia.
a) P(X 5) = 1 P(X < 5) = 1 [P(X = 0) + P(X = 1) + P(X = 2) + P(X = 3) +
P(X = 4)]
4,20 e-4 ,3 4,21 e-4 ,3 4,22 e-4 ,3 4,23 e-4 ,3 4,24 e-4 ,3

1
=
+
+
+
+

0!
1!
2!
3!
4 !

= 1 [0,5704] = 0,4296 ou 42,96%.


b) E(custo horas extras/ms) = P(realizar horas extras) x custo/dia x
nmero de dias/ms em que E(custo horas extras/ms) = 0,4296 x
R$375,00 x 22 = R$3.544,20.

92

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

Amostragem

Problema
A empresa ABC tem uma administrao participativa e decidiu que os
funcionrios devem eleger os chefes de seo. No almoxarifado, dois candidatos apresentam-se. Joo parece ter a preferncia de seus pares, mas
Pedro acredita que pode superar Joo se fizer uma boa campanha. Resolve ento fazer uma pesquisa de opinio para compreender quais so os
principais anseios de seus colegas e quer aproveitar a pesquisa para ver o
nvel de aceitao de seu nome. Como o nmero de empregados do almoxarifado muito grande, opta por fazer um levantamento atravs de um
processo de amostragem.
Para tanto, elabora um plano amostral e um questionrio para realizar o
seu levantamento. Faz parte de seu planejamento a determinao do tipo de
sorteio que realizar, a determinao do tamanho da amostra e a estratgia
do trabalho de campo.
Ele sabe que o tamanho da amostra depender fundamentalmente de duas
determinaes; a preciso do resultado e o erro amostral. Resolve, ento, que
deseja ter uma grande preciso que implique um desvio de mais ou menos 3%
com um nvel de confiana de 95%, ou seja, um erro amostral de 5%.
Assim, se ele tiver 40% das intenes de voto, saber, ento, com 95% de
confiana, que em uma eleio com todos os funcionrios, sua proporo de
votos estar entre 37% e 43%. Ou, de outra forma, a proporo de votos que
ele ter na populao estar dentro desse intervalo e, uma vez que a pesquisa foi feita por amostragem, esse intervalo ser construdo atravs de uma
amostra que poder ser representativa da populao ou no, e a chance que
esse sorteio retire uma amostra no representativa de 5%, porque o nvel
de confiana e o erro amostral representam probabilidades complementares, ou seja, a sua soma sempre 100%. Se o levantamento for realizado com
um erro amostral de 2%, ento o nvel de confiana ser de 98%.
Comumente os resultados de pesquisas como essa falam em margem de
erro de mais ou menos 2 ou 3%. O que se publica como margem de erro
Este material parte integrante do acervo do IESDE BRASIL S.A.,
mais informaes www.iesde.com.br

95

Amostragem

na verdade o desvio. O desvio est relacionado com a preciso que se deseja


obter. Quanto menor o desvio, maior a preciso.
Essa declarao pode ser escrita em termos matemticos atravs do seguinte intervalo de confiana:
Pr ( 37% < P < 43%) = 0,95
Pr (40 3 < P < 40 + 3) = 1 0,05
De forma genrica, o intervalo de confiana de uma proporo dado
pela seguinte expresso:
Pr ( p d < P < p + d ) = 1
Nessa expresso, Pr significa probabilidade, P (p maisculo) a proporo
de votos de Pedro na populao, p (p minsculo) a proporo de votos de
Pedro na amostra, d o desvio e o erro amostral. Portanto, (1 ) definido como o nvel de confiana.
Rigorosamente, segundo a Teoria Estatstica Clssica, uma vez que P um
parmetro da populao, portanto, um valor exato, no se pode falar em
probabilidade de um parmetro estar dentro de um intervalo. E mais, a interpretao de um intervalo de confiana a de que, se fossem retiradas 100
amostras, em 95 delas o parmetro deveria pertencer ao intervalo. Mas essa
simplificao no atrapalha o raciocnio realizado.

Conceitos fundamentais
Um levantamento amostral ou atravs de amostragem uma pesquisa realizada em parte de uma populao com o objetivo de calcular uma
medida na amostra que sirva de estimativa dessa medida na populao.
No exemplo acima, a proporo de votos de Pedro na amostra serve como
uma estimativa da proporo de seus votos na populao. Alm da proporo, outras medidas muito comuns realizadas na amostra como estimadores dos parmetros populacionais so a mdia e o desvio-padro.
Formalizando alguns conceitos:

96

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

Amostragem

Populao
Populao um conjunto de pessoas, animais, objetos ou coisas que tm
uma caracterstica em comum e que sejam objeto de investigao.
Exemplos:
populao de pessoas que habitam uma cidade;
populao de eleitores de uma cidade. Nesse caso, so consideradas
somente as pessoas cadastradas no tribunal regional eleitoral das
zonas eleitorais do municpio em questo. No importa se a pessoa de
fato reside na cidade ou no. Muitos eleitores de curitiba residem nas
cidades da regio metropolitana;
populao de empregados de uma empresa, ou de um setor de uma
empresa;
populao de cachorros de rua de uma cidade;
populao de refrigeradores produzidos por uma indstria no ano y;
populao das carteiras de uma escola.
As medidas observadas em uma populao so chamadas de parmetros.
No geral, so apresentadas por caracteres maisculos ou por letras gregas.
Tamanho da populao N.
Media da populao (letra grega mi).
Desvio-padro da populao (letra grega sigma).
Um levantamento realizado com todos os elementos de uma populao
chamado de censo. Os primeiros censos de que se tem notcia foram realizados na China. Mais tarde ficaram famosos os censos do Imprio Romano,
cujo objetivo era conhecer o tamanho de seu domnio. Um desses censos foi
realizado no ano do nascimento de Jesus Cristo. Os cristos acreditam que
esse censo foi realizado justamente para identificar a figura de uma criana
que mais tarde se tornaria o filho de Deus.

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

97

Amostragem

Os censos populacionais so realizados em todo o mundo, de dez em


dez anos, por recomendao da Organizao das Naes Unidas. No Brasil,
o primeiro censo foi organizado pelo estatstico Italiano Giorgio Mortara, em
1940, que tambm foi o fundador do IBGE (Instituto Brasileiro de Geografia e
Estatstica). Hoje, o IBGE considerado um dos maiores e mais competentes
institutos do gnero ao redor do mundo. O IBGE trabalha com tcnicas estatsticas complexas e sofisticadas.
Na realizao do censo, existem dois questionrios. Um questionrio
bsico que todas as famlias brasileiras respondem e um questionrio completo que respondido por uma amostra de 10% da populao. Ou seja, uma
em cada 10 famlias deve responder o questionrio completo. At o censo de
1991 essa amostra era de 25%. Mas com a evoluo das tcnicas estatsticas
de estimao pode-se diminuir o tamanho da amostra. Na maioria dos pases
com tradio em realizao de levantamentos amostrais, como, por exemplo,
os Estados Unidos, o censo serve somente para a contagem da populao,
todas as outras determinaes so realizadas atravs de amostragens.
Observe-se que os censos devem ser realizados nos anos de final zero. O
censo de 1990 foi realizado com um ano de atraso por dificuldades operacionais durante o governo de Fernando Collor de Melo. Essa defasagem causa
problemas de ordem tcnica bastante graves quando se deseja realizar estimativas baseadas nos resultados do censo. As sries temporais que deveriam ter uma mesma amplitude de dez em dez anos passaram a ter nesse
perodo uma defasagem de onze e depois nove anos.
Curiosidade
Giorgio Mortara dizia que os estatsticos so como os msicos. Onde todos
veem cifras musicais, o msico escuta uma cano. Da mesma forma onde
todos veem nmeros, os estatsticos enxergam a realidade.

Amostra
Amostra um subconjunto de uma populao que pretende represent-la.
As medidas realizadas em uma amostra so chamadas de estatsticas.
Como elas pretendem estimar o valor da mesma medida na populao, os
seus valores calculados so chamados de estimativa. A expresso utilizada
para calcular a medida chamada de estimador.
98

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

Amostragem

No exemplo anterior, a proporo de votos de Pedro na populao um parmetro. A proporo de votos na amostra um estimador desse parmetro. O
seu valor, no caso em tela, 40% uma estimativa do valor do parmetro.
A mdia da amostra um estimador da mdia da populao, mas no o
nico estimador possvel. A mediana da amostra, por exemplo, pode ser um
estimador da mdia da populao. Ocorre que a mdia da amostra um estimador da mdia da populao que tem certas propriedades que a tornam
um estimador melhor do que a mediana amostral.
As medidas realizadas na amostra so representadas por letras minsculas ou atravs de caracteres especiais. Quando um estimador, tambm
podem ser representadas atravs da mesma letra do parmetro que desejam
estimar acrescentada de um acento circunflexo que chamado de chapu.
Tamanho da amostra n.
^
Mdia da amostra X,
.

Desvio-padro da amostra S, s, .

Tipos de amostragem
Quanto repetio de elementos da amostra
Uma amostra pode ser retirada da populao podendo os elementos
dessa populao aparecerem mais de uma vez na amostra, ou no. Se todos
os elementos da amostra so diferentes, ou seja, um mesmo elemento no
pode participar duas vezes da amostra, a amostragem dita ser amostra sem
reposio. Caso contrrio, a amostra dita ser com reposio.
No processo de sorteio da loteria federal, por exemplo, quando so sorteados seis nmeros de 0 a 9 para formar uma centena de milhar, a amostragem com reposio. Sorteia-se de um globo uma bola que representar a
unidade. Esse nmero verificado e colocado novamente no globo para o
sorteio da dezena e assim por diante at o sorteio da bola correspondente
centena de milhar. Na verdade, o sorteio feito com seis globos, o que equivale ao processo descrito acima. Ento esse sorteio com reposio.
No processo de sorteio da mega-sena, por outro lado, o processo sem
reposio, porque se sorteiam seis bolas de um globo que tem um total de
60 bolas numeradas.
Este material parte integrante do acervo do IESDE BRASIL S.A.,
mais informaes www.iesde.com.br

99

Amostragem

Em um processo sem reposio, a probabilidade de um nmero ser sorte1


ado de uma populao de tamanho N . Em um processo com reposio,
N
a probabilidade de n nmeros especiais participarem da amostra 1 .
CN, n
Curiosidade
Se um vendedor de bilhetes da loteria federal tiver somente duas opes
de bilhetes para a venda, a cobra 333 333 ou o cachorro 234 320, qual deles
tem maior probabilidade de ser o bilhete vencedor? Qual voc compraria?
A tendncia imediata de qualquer apostador seria que intuitivamente o
segundo bilhete tem maior chance de ocorrer. No entanto, como em muitos
outros casos, a intuio da probabilidade enganosa. A chance de ocorrer
3 ou 0 no sorteio da unidade idntica e igual a 1/10. Da mesma forma, a
chance de ocorrer 3 ou 2 no sorteio da dezena tambm idntica e igual
a 1/10. Os sorteios so com reposio e independentes. A chance final dos
dois bilhetes serem vencedores idntica e igual a (1/10)6, ou uma chance
em 1 000 000 (um milho). De fato uma probabilidade bem pequena.
1
que igual a 1 em
A probabilidade de se ganhar na mega-sena C
60, 6
50 063 860, ou seja, uma chance em cinquenta milhes, uma probabilidade bem menor que a da loteria federal. E se jogar dois bilhetes na mega-sena? A probabilidade ento ser 2 em 50 milhes, ou uma chance em 25
milhes. Ainda muito difcil de ganhar. Ento seria melhor jogar em sete
nmeros? Bom, a a probabilidade de se acertar seis nmeros de uma
chance em 7 151 980, aproximadamente uma em 7 milhes. Exatamente
sete vezes maior do que jogar somente em seis nmeros. Por isso se o bilhete de aposta com seis nmeros custa R$1,50 o bilhete de apostas com
sete nmeros custa R$10,50, exatamente sete vezes mais.

Quanto representatividade
Uma amostra pode ser probabilstica ou no probabilstica. Para efeito
de inferncia, isto , se o propsito o de estimar valores de parmetros
da populao, somente amostras probabilsticas conseguem ser teis. Ou
seja, s possvel fazer inferncias para a populao atravs de observaes da amostra se os elementos forem escolhidos atravs de algum processo de sorteio.
100

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

Amostragem

Em um processo de amostragem probabilstico h que se poder calcular


o valor da probabilidade de um elemento da populao que participa da
amostra.
Amostragens no probabilsticas servem para se fazer sondagens sem
propsitos inferenciais. Nesses casos, os procedimentos que envolvem comparaes estatsticas que impliquem clculos cientficos no so vlidos.

Processos de amostragem no probabilsticos


Amostragem por cotas
Esse procedimento muito utilizado e s vezes confundido com o processo de amostragem estratificada proporcional, que ser estudado mais
adiante. Consiste em buscar repetir na amostra a proporo de elementos
de cada estrato da populao. Ento, se a populao composta de 50%
de homens, 20% de jovens e assim por diante, a amostra ter tambm essa
composio. O que diferencia a amostragem por cotas da amostragem estratificada proporcional que, no primeiro caso, os elementos da amostra no
so selecionados atravs de sorteio.
Muitos institutos de pesquisa utilizam esse tipo de levantamento. Fazem
entrevistas na rua, por exemplo, em que o agente de campo vai escolhendo as pessoas at que complete cada uma das cotas. O processo no serve
para propsitos de inferncia porque pode ser contaminado pela escolha
realizada pelo agente. No geral, pessoas com pressa ou mais sisudas acabam
no participando da amostra, embora possam representar uma parcela importante de opinio, dependendo do objeto da pesquisa. Pesquisas de mercado, por exemplo, podem ter resultados completamente tendenciosos em
razo da escolha da amostra.
Por outro lado, em pesquisas eleitorais, candidatos podem forar a participao de assessores ou cabo eleitorais em pesquisas de rua com o propsito de fazer da pesquisa uma pea de campanha. Embora no se tenha
comprovao cientfica ainda, supe-se que eleitores indecisos votem em
candidatos com maior chance de vitria para no perderem o seu voto. No
processo de eleio americana, bastante diferente do brasileiro, o Instituto
Gallup verificou que os resultados das pesquisas eleitorais no afetam de
forma importante o resultado final da eleio. bom lembrar, no entanto,

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

101

Amostragem

que o voto nos Estados Unidos no obrigatrio e que as eleies so realizadas de forma indireta atravs de delegados partidrios.

Amostragem de voluntrios
Nesse tipo de amostragem, os elementos da amostra so definidos pela
opo do prprio elemento em participar do processo. Ele muito comum
em publicaes de revistas ou jornais ou ento na opinio de usurios de
certos servios, como restaurantes, por exemplo.
Muitas revistas colocam em determinados nmeros encartes em que
o leitor deve opinar sobre a qualidade da revista e de certas sees especficas. O que ocorre no geral que a grande maioria das pessoas que
respondem ao questionrio, o fazem porque no esto satisfeitas com a
publicao ou pelo menos com parte dela. Essa sondagem pode ser til
para os editores da revista porque tero uma ideia do que podem melhorar,
mas no h como se fazer estimativas acerca do que a maioria dos leitores
pensa da publicao. O mesmo ocorre em restaurantes ou em conferncias
quando os comensais ou os participantes das conferncias so instados a
responderem questionrios.

Amostragem intencional
Aqui o pesquisador busca na populao uma parte dela que lhe interessa. Os participantes da amostra so escolhidos por terem alguma caracterstica que interessa ao pesquisador. Da mesma forma que os outros
processos no probabilsticos, nesse caso no h como se fazer inferncias
para toda a populao.
Uma pesquisa sobre qualidade de atendimento hospitalar pode ser realizada em um setor do hospital. Podem ser escolhidos para participarem
da amostra pacientes desse setor. Naturalmente os resultados obtidos dessa
forma no podem ser estendidos para todo o hospital.

Amostragem a esmo
Muitas vezes este processo confundido com uma amostragem aleatria.
A palavra aleatria vem de alea (de sorte do latim todos lembram de alea

102

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

Amostragem

jacta est, a sorte est lanada, de Jlio Csar ao invadir Roma). No contexto
da estatstica, a palavra aleatria est relacionada com processo de escolha
por sorteio. Em contextos especficos a palavra aleatria substituda pela
palavra estocstica.
Escolher a esmo, portanto, no processo cientfico de escolha de elementos da populao para participarem da amostra.

Processos de amostragem probabilsticos


As amostragens que tm valor cientfico so aquelas em que se consegue de alguma forma determinar a probabilidade de um elemento da populao em participar da amostra. No necessariamente todos os elementos
da populao devam ter a mesma chance de participar da amostra, como
no caso da amostragem estratificada proporcional (por exemplo, como ser
visto logo a seguir), mas, repetindo, h que se conseguir determinar qual a
probabilidade de participao na amostra.
As principais tcnicas de amostragem probabilstica sero estudadas na
seo que segue. So elas: amostragem aleatria simples, amostragem estratificada proporcional, amostragem sistemtica, amostragem por conglomerados e amostragem em dois estgios. Antes, porm, ser conveniente a
apresentao da Tabela de Nmeros Aleatrios.

Tabela de nmeros aleatrios


As tabelas de nmeros aleatrios so tabelas de algarismos geradas em
computador para auxiliar o pesquisador a sortear nmeros de elementos
da populao que devero participar da amostra. Na verdade, elas simulam
uma urna na qual bolas ou papis so colocados com nmeros de 1 a N,
onde N o ltimo elemento numerado de uma populao.
Essas tabelas podem ser geradas em programas simples, como o Excel,
por exemplo. Elas so especialmente teis quando se deve fazer o sorteio
sem que se tenha um computador em mos ou mesmo uma mquina de
calcular cientfica. Muitas delas tm um mdulo para sorteio de nmeros aleatrios. Um exemplo de tabela a apresentada a seguir:

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

103

Amostragem

104

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

Amostragem

A tabela gerada possui 30 linhas e 9 colunas. Suponhamos que se deseje


sortear um nmero de um componente de uma populao com 80 elementos numerados de 1 a 80. Primeiramente, devemos escolher uma linha e uma
coluna para incio do processo. Vamos tomar uma data qualquer para iniciar o
processo. Dia 16 de abril, data de nascimento de Charles Chaplin e do Cardeal
Ratzinger, atual Papa Bento 16. Quando olhamos a tabela verificamos na linha
16 e coluna 4 que o dgito sorteado foi o zero. Mas como precisamos de um
nmero com dois dgitos tomaremos o 0 e o seu vizinho imediatamente direita para compor o nmero sorteado. Ento o nmero sorteado foi o 06. Como
a populao est numerada de 01 a 80, tomamos o elemento de nmero 6 e
verificamos o valor da varivel de interesse correspondente quele elemento.
Se for a idade, por exemplo, verificamos qual a idade do elemento 6.

Principais tcnicas de amostragem


Amostra aleatria simples
O processo de amostragem aleatria simples (AAS) o processo mais
simples. Nele, todos os elementos da populao tm a mesma probabilidade em participar da amostra. No exemplo em tela, se a populao tem 80
elementos, ento a probabilidade de um elemento da populao vir a participar da amostra de 1/80.
Se desejamos tomar uma amostra maior e o processo for com reposio,
essa probabilidade permanece 1/80 para cada etapa do sorteio. Se for sem
reposio, na segunda etapa a probabilidade de 1/79, a seguinte 1/78 e
assim por diante. Mas a chance de que cada elemento participe da amostra
a mesma.
Supondo agora que desejamos sortear uma amostra de tamanho 10,
ento, teremos que tomar 10 elementos da populao numerada de 1 a 80.
Utilizando a mesma entrada, linha 16 e coluna 4, j tnhamos verificado que
o primeiro elemento a participar da amostra era o de nmero 6. Estabelecendo o critrio de tomar os nmeros a seguir para baixo na tabela, o prximo
nmero sorteado o 05. O nmero seguinte o 94, que maior que 80 e,
portanto, no serve. No h ningum da populao com esse nmero.
Selecionamos, ento, o prximo, que o nmero 43, e assim por diante
at completar os dez nmeros. J temos trs nmeros, mas ainda faltam sete
Este material parte integrante do acervo do IESDE BRASIL S.A.,
mais informaes www.iesde.com.br

105

Amostragem

para completarmos o tamanho estabelecido para a amostra. Continuando


na tabela, os prximos nmeros menores que 80 so 74, 64, 34, 03, 44 e 51,
quando termina a tabela. Ainda nos falta um nmero. Retomamos o processo da linha 1, colunas 5 e 6. Aparecem os nmeros 81, 91 e 17. Os dois
primeiros no servem, ento o ltimo nmero sorteado o 17. Dessa forma,
completamos o processo e os nmeros sorteados foram:
06, 05, 43, 74, 64, 34, 03, 44, 51 e 17.
Como no h nenhum nmero repetido, no precisamos nos preocupar
se o sorteio era com ou sem reposio. No geral, essa determinao feita
antes do sorteio e, na maior parte das vezes, nos interessam sorteios sem
reposio. Quando nada dito a respeito, supe-se que o sorteio seja sem
reposio, ou seja, todos os elementos devem ser diferentes.
O trabalho agora consiste em verificar o valor da varivel ou do atributo
de interesse de cada um dos elementos. Sua idade, seu sexo e sua inteno
de voto, por exemplo.

Amostra estratificada proporcional


Esse tipo de amostragem semelhante ao processo de amostragem por
cotas, com a diferena de que nesse caso os elementos so escolhidos atravs de algum tipo de sorteio. Assim, se a populao pode ser dividida em
estratos e estes se constituem em diferenas de caractersticas que podem
afetar o resultado da pesquisa, a proporo que cada estrato tem na composio da populao deve ser repetida na amostra.
O cuidado que se deve tomar aqui o de que a diviso em estratos deve
fazer sentido para a pesquisa que se deseje realizar. Se, por exemplo, o objetivo fazer uma pesquisa sobre a inteligncia de um grupo, que ser mensurada atravs da medida do QI (quoeficiente de inteligncia), e, supondo que
essa possa ser uma boa medida, apesar das crticas que recebe, no parece
razovel dividir a populao em estratos por sexo. No h nenhuma comprovao cientfica de que as mulheres sejam mais inteligentes do que os
homens, muito embora essa seja a impresso geral.
Por outro lado, se desejamos fazer um estudo antropomtrico de uma
populao atravs da medida da altura mdia dessa populao, parece bastante razovel dividi-la em estratos segundo o sexo. E por que devemos fazer
isso? Suponha que somente 20% da populao em questo seja de mulheres.
106

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

Amostragem

Como sabido, os homens so, de uma forma geral, mais altos do que as mulheres, e se fizermos um sorteio atravs de uma amostra aleatria simples,
poderemos correr o risco de termos na amostra 40% de mulheres ou mais, o
que nos levaria ao final a subestimar a altura mdia daquela populao.
Suponha que tal pesquisa seja realizada em uma populao com 60 pessoas e que uma amostra de tamanho 10 deva ser retirada de uma populao
com 12 mulheres e 48 homens.
Primeiramente, verifica-se a proporo de homens e mulheres na populao. A proporo de mulheres (pm) dada por:
Pm =

Nm
N

onde Nm o numero de mulheres e N o total da populao. Assim:


Pm = 12 . 100 = 20%
60
Se a amostra de tamanho 10, ento o nmero de mulheres na amostra
ser dado por:
nm = n . pm

= 10 . 20% = 10 . (20/100) = 2

Ento, o nmero de homens ser de 8. De fato, 8 representa 80% da amostra, da mesma forma que 48 representa 80% de 60. Em uma tabela, teramos:
Sexo

Populao

Amostra

Homens

Nh

nh

Mulheres

Nm

nm

Total

Para uma populao com a composio acima, o nmero de mulheres na


amostra determinado por:
nm = (Nm/N) . n
E o nmero de homens por:
nh = (Nh/N) . n
Este material parte integrante do acervo do IESDE BRASIL S.A.,
mais informaes www.iesde.com.br

107

Amostragem

Exemplo:
Deseja-se fazer uma estimativa do salrio mdio dos empregados de uma
empresa atravs de uma amostra de tamanho 10, em um sorteio sem reposio, utilizando a tabela de nmeros aleatrios a partir da linha 29 coluna 3,
correspondente a 29 de maro, dia do aniversrio de Curitiba.
A tabela a seguir corresponde diviso dos funcionrios segundo os seus
cargos na empresa:
Setor

Empregados

Tcnico

20

Administrativo

60

Operacional

120

Total

200

Supondo que os valores dos salrios dos tcnicos sejam maiores do que
o de pessoal administrativo, que por sua vez maior do que o dos empregados do setor de operaes, faz sentido fazer uma amostragem estratificada proporcional.
O primeiro passo determinar o nmero de funcionrios de cada setor
que ir compor a amostra de tamanho 10, respeitadas as propores de cada
setor na populao. Ento:
Setor

Populao

Amostra

Tcnico

20

(20/200) . 10 = 1

Administrativo

60

(60/200) . 10 = 3

Operacional

120

(120/200) . 10 = 6

Total

200

10

Determinado o tamanho de cada estrato na amostra, procede-se o


sorteio. Antes, porm, necessrio numerar os empregados de 1 at 200.
Pode-se, ento, atribuir aos empregados do setor tcnico a numerao de
1 a 20. Para os do setor administrativo, de 21 a 80 e para os do setor operacional, de 81 a 200.

108

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

Amostragem

Setor

Amostra

Nmeros sorteados

Tcnico [1;20]

015

Administrativo [21;80]

031, 068, 056

Operacional [81;200]

181,173,174,138,117,176

Total

10

Sorteados os nmeros dos empregados, deve-se verificar qual o salrio


de cada um deles e depois calcular a mdia salarial da amostra, cujo valor
estimar a mdia salarial de todos os empregados da empresa.

Amostra sistemtica
A amostra sistemtica utilizada quando a populao j se encontra organizada em alguma forma de arquivo.
Suponha que desejamos fazer uma reviso tipogrfica em um livro de
400 pginas atravs de uma amostra de tamanho 10. O processo consiste em
determinar o valor da frao amostral, que dada por:
f= N
n
O primeiro passo sortear o primeiro elemento da amostra atravs da
tabela de nmeros aleatrios. O segundo ser determinado pela soma do
primeiro nmero com a frao amostral. O terceiro o segundo mais a frao
amostral e assim por diante at completar o tamanho da amostra.
No exemplo dado, a frao amostral igual a 400/10 = 40. Vamos determinar a entrada pela linha 1 coluna 1, primeiro dia do ano, que corresponde
pgina 57.
A segunda pgina ser 57 + 40 = 97. A terceira, 137, e na sequncia as pginas 177, 217, 257, 297, 337, 377. A seguinte seria a pgina 417, mas ela supera o
nmero de pginas do livro. Subtramos ento 400 de 417 e a pgina sorteada
ser a de nmero 17. A prxima seria a pgina 57, mas que j foi sorteada, o
processo, ento, se completa com a determinao da dcima pgina, que a de
nmero 17. As pginas que sero verificadas so, ento, as de nmeros:
17, 57, 97, 137, 177, 217, 257, 297, 337 e 377.
Este material parte integrante do acervo do IESDE BRASIL S.A.,
mais informaes www.iesde.com.br

109

Amostragem

Observe que esse um processo circular no qual no importa onde seja


o incio. A amostra sistemtica um caso particular de uma amostra estratificada proporcional, em que cada estrato corresponde a um conjunto de 40
pginas e que de cada estrato se sorteia um elemento.
Esse processo o utilizado pelo IBGE na determinao de quem responder o questionrio completo com uma frao amostral igual a 10. Seleciona-se
uma casa para fazer o questionrio completo e a cada dez casas ele repassado para a famlia que o responder. Esse processo tambm utilizado para
a realizao de pesquisas eleitorais. Sorteia-se uma quadra, determina-se a
primeira residncia em que uma pessoa ser entrevistada (no geral, a que
atende a porta ou a de aniversrio mais prximo, desde que seja eleitor no
municpio), salta-se o nmero de casas correspondentes frao amostral e
a nova entrevista ser feita na casa determinada por esse processo.

Amostra por conglomerados


Na amostragem por conglomerados divide-se a rea a ser pesquisada em
setores bem definidos, sorteia-se uma certa quantidade desses setores atravs de uma amostra aleatria simples e pesquisa-se todos os elementos da
sua populao.
Na amostragem por conglomerados, quanto mais os elementos dentro
do setor forem parecidos com a populao como um todo, melhor ser o
resultado obtido. Isto , se a varincia interna dentro do setor for alta, a variabilidade total ser menor. Exatamente o oposto do que ocorre com a amostra estratificada proporcional, em que as varincias dentro de cada estrato
devem ser pequenas.
Amostragens por conglomerados so bastante utilizadas em pesquisas
de campo que envolvem a opinio de moradores de uma cidade. Os setores
podem ser as zonas eleitorais em uma pesquisa de inteno de votos ou os
setores censitrios do IBGE, que so reas bem definidas com cerca de 300
domiclios, os quais so utilizados para fazer o censo demogrfico.
A principal vantagem de uma amostra por conglomerados a facilidade
de realizao do trabalho de campo, que pode implicar uma economia bastante grande de recursos empregados para a realizao da pesquisa.

110

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

Amostragem

Amostragem em dois estgios


Quando os elementos de um setor tm grande homogeneidade, a eficincia da amostragem por conglomerados pode ficar comprometida. Uma
forma de se contornar esse problema a realizao de sorteio entre os elementos de cada setor j sorteado na amostragem por conglomerados. No
geral, ambos os sorteios so realizados atravs de uma amostra aleatria
simples, ou o primeiro atravs de uma amostra aleatria simples e o segundo
atravs de uma amostra sistemtica.
O procedimento de amostragem em dois estgios ou em duplo estgio
consiste em:
 organizao da populao em setores (conglomerados);
 sorteio de alguns conglomerados atravs de uma amostra aleatria
simples;
 dentro de cada setor, sorteio dos elementos que participaro da amostra atravs de um processo de amostragem aleatria simples ou amostragem sistemtica.

Tamanho da amostra
A determinao do tamanho da amostra uma das tarefas mais complexas em um processo de pesquisa e requer um trabalho bastante cuidadoso.
Vrios aspectos devem ser considerados no seu clculo e uma falcia deve
ser definitivamente abandonada, que a ideia de que se pode determinar
o tamanho da amostra atravs de uma determinao percentual em relao ao tamanho da populao. Por exemplo, tomar uma amostra de 5% da
populao ou de 10% da populao como representativa dela; esse procedimento s pode ter alguma validade se a partir dele forem determinados o
erro estatstico e o desvio dos valores dos parmetros obtidos.
De outra forma, vale dizer que uma amostra de 0,5% da populao pode
ser representativa dela e que uma amostra de 10% pode no ser, dependendo do tamanho da populao e da tcnica de amostragem utilizada.
Outra considerao fundamental na determinao do tamanho da amostra
o limite imposto pela quantidade de recursos disponveis para a realizao

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

111

Amostragem

do levantamento amostral. Esse fator limitante pode inclusive inviabilizar o


trabalho de pesquisa, como veremos um pouco mais adiante.
Trs fatores tcnicos so considerados no clculo do tamanho da amostra: a preciso, o nvel de confiana e a variabilidade da amostra.
A preciso determinada pelo desvio do valor da estimativa na amostra
em relao ao verdadeiro valor do parmetro na populao, tambm conhecido como margem de erro.
O nvel de confiana um valor de probabilidade complementar ao erro
estatstico. O erro estatstico, por sua vez, a probabilidade em que a amostra sorteada no represente a populao.
Em relao variabilidade da amostra, podemos dizer que, quanto mais
homognea a populao, menor ser a necessidade de uma amostra grande.
Poucos elementos representam bem a amostra.
Uma ltima considerao dever ser feita com relao ao tamanho da
amostra, que diz respeito ao tamanho da populao. Para populaes pequenas, h que se fazer uma correo na determinao do tamanho da
amostra, chamada de correo para populaes finitas.

A margem de erro
O que chamado de margem de erro ou erro mximo da estimativa
na verdade a diferena mxima provvel entre a medida do estimador
observado na amostra e o verdadeiro valor do parmetro da populao.
Trata-se, portanto, do desvio entre o valor calculado na amostra e o verdadeiro valor do parmetro da populao.
Na pesquisa amostral do exemplo da eleio do chefe do setor, se Pedro
tem 40% da inteno de votos, mais ou menos 3% esses 3% so o desvio do
valor central de 40% que a pesquisa se props a admitir com certa probabilidade de que a amostra selecionada no represente a populao, chamada
de erro estatstico.
Reforando, a margem de erro ou desvio tem natureza absolutamente
diferente do chamado erro estatstico. Enquanto o desvio uma percentagem, ou uma medida na unidade em que se est observando os valores (cm,
anos, m2 etc), o erro estatstico uma medida de probabilidade.
112

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

Amostragem

No exemplo da eleio de Pedro, temos 95% de confiana (erro estatstico


de 5%) que ele ter entre 37% e 43% dos votos, se a eleio fosse realizada
no momento da pesquisa, contra 57% a 63% de Joo. Qualquer resultado
dentro deste intervalo pode acontecer. preciso que se compreenda isso
para no cometer erros de interpretao dos resultados.
Suponha que a estimativa da proporo de votos de Pedro fosse de 48%
e, portanto; a de Joo 52%. Ser que realmente Joo est na frente de Pedro?
A resposta tem que ser um peremptrio no.
De fato, o que a pesquisa amostral informa que a proporo de votos de
Pedro na populao, salvo o erro amostral, estar dentro do intervalo [45%,
51%] e que a proporo de Joo estar no intervalo [49%, 55%]. Assim, qualquer resultado dentro desses intervalos admissvel, como, por exemplo,
51% para Pedro e 49% para Joo, e, embora aparentemente Joo estivesse na
frente, ele pode perder a eleio. Esse fato conhecido como empate tcnico ou empate estatstico. Convm a Joo saber fazer a leitura da pesquisa.
Mas ser que Joo no est ao menos um pouquinho frente de Pedro?
Com base no resultado da pesquisa, pode-se afirmar categoricamente que
no necessariamente.
Uma pesquisa que antecedeu uma eleio para prefeito de Curitiba
trouxe como resultado as seguintes intenes de voto com um nvel de
confiana de 95%:
Candidato A 58%
Candidato B 09%
Candidato C 08%
Candidato D 07%
Candidato E 07%
Candidato F 05%
Candidato G 05%
Candidato H 01%
O instituto que realizou a pesquisa afirmou que entrevistou 405 eleitores
em um certo dia e que a margem de erro de sua pesquisa foi de mais ou
menos 5%. O que se pode concluir da pesquisa?
Este material parte integrante do acervo do IESDE BRASIL S.A.,
mais informaes www.iesde.com.br

113

Amostragem

Em primeiro lugar, o Candidato A seria virtualmente eleito no primeiro


turno com no mnimo 53% dos votos.
E mais, no h como se saber qual dos seis candidatos teria mais votos se
a eleio fosse realizada naquele dia. O candidato B, por exemplo, poderia
ter 4% dos votos e o candidato H poderia ter 6% dos votos. Essa a leitura correta do resultado da pesquisa de inteno de votos realizada. No h
outra leitura possvel.
O que aconteceu ento? A amostra de 405 muito pequena para garantir
melhor preciso.
Um resultado como esse pode ser til para informar que no momento
o Candidato A seria eleito no primeiro turno. S isso. Em momentos mais
prximos da eleio essa margem de erro ter que ser necessariamente
diminuda, com o consequente aumento do tamanho da amostra.
Tambm em situaes em que os candidatos esto mais prximos, uma
pesquisa como essa pode ser no informativa. Um candidato com 55% dos
votos pode perder para um candidato com 45% dos votos, por exemplo.
Quanto maior a preciso desejada, maior deve ser o tamanho da amostra.
De outra forma, quanto menor a margem de erro, maior ser o tamanho
da amostra.
A determinao da margem de erro feita antes da realizao da pesquisa para se calcular o tamanho da amostra. A margem de erro escolhida
pelo pesquisador e ser do tamanho necessrio para que possa discriminar
as medidas que sero realizadas. No adianta tomar uma amostra pequena
que no consiga ser sensvel de observar pequenas diferenas. No entanto,
se essa escolha implicar em uma amostra muito grande em que no se tenha
recursos para a realizao da pesquisa, ela pode ficar inviabilizada.
Porque dizer que um candidato ter 60% dos votos, mais ou menos
30% de preciso, significa dizer que o candidato pode ter entre 30% e 90%
dos votos. Esse um resultado que realmente no interessa porque no
informativo.

114

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

Amostragem

Matematicamente pode-se dizer que o desvio inversamente proporcional ao tamanho da amostra, lembrando, no entanto, que essa no uma
relao linear. Se d o desvio e n o tamanho da amostra, temos a relao:
d

O erro estatstico
O erro estatstico a probabilidade de sortear uma amostra que no seja
representativa da populao. Toda vez que se faz um sorteio o risco de que a
amostra no represente a populao est presente.
Para ilustrar essa ideia, suponha uma populao de tamanho quatro,
composta pelos elementos A, B, C e D, colocados assim em ordem crescente
de medida. Suponha que estes quatro elementos so pessoas em que A o
mais novo e D, o mais velho.
Quantas amostras de dois elementos so possveis de serem sorteadas?
Esse nmero pode ser calculado atravs da determinao da combinao
de quatro elementos dois a dois: C4,2 = 6.
As possveis combinaes so:
AB, AC, AD, BC, BD, CD
Qual a probabilidade de cada uma delas serem sorteadas? de 1 em
6, ou 1/6. As amostras derivadas das combinaes AB e CD parecem no representarem bem a populao. A primeira subestimaria a mdia de idade da
populao e a segunda a superestimaria. As melhores combinaes seriam
possivelmente AD e BC, mas tambm AC e BD poderiam trazer resultados
bastante razoveis.
Ento, qual seria a probabilidade de tomar-se uma amostra ruim, que
no representa a populao? Seriam 2/6, correspondentes s amostras AB e
CD. Essa probabilidade de 1/3 = 0,33. Ento, o nvel de confiana associado
a essa amostragem de 67% (100 33) e o erro estatstico de 0,33.

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

115

Amostragem

Um erro estatstico de 33% muito alto. claro que isso s uma simulao para ilustrar o significado de erro estatstico. Com uma populao to
pequena no faz qualquer sentido fazer um procedimento de amostragem.
No entanto, a informao que se tira dessa discusso a de que quanto
menor for o erro estatstico, maior dever ser o tamanho da amostra. Ou,
ainda, quanto maior for a confiana desejada, maior dever ser o tamanho
da amostra.
O erro estatstico est relacionado com o escore z da tabela da distribuio normal padro. Quanto menor o erro, maior ser z e, por consequncia,
maior ser o tamanho da amostra. Se o erro estatstico for designado por , o
nvel de confiana ser (1 )x 100%. Maior confiana implica maior tamanho
da amostra. Matematicamente, podemos estabelecer a seguinte relao:

(1 )

Que valor deve ser estabelecido para o erro estatstico? Essa determinao depende da gravidade de cometer-se tal erro. Em uma pesquisa de
verificao da qualidade de componentes de avio em uma fbrica, pode-se fazer uma inspeo de qualidade nas mesinhas de lanche do avio com
um erro estatstico mais dilatado do que de um componente de vedao da
janela. Nesse ltimo caso, o erro deve ser igual a zero e, portanto, a inspeo
deve ser realizada em todas as unidades. Nesse caso, a amostra dever ser do
tamanho da populao.
Em pesquisas eleitorais muito comum trabalhar-se com um erro de 5%
ou uma probabilidade de 1/20 de que a amostra no seja boa, o que representa uma probabilidade muito pequena. Para construir uma ideia intuitiva
por comparao, a probabilidade de acertar o nmero na face superior de
um dado de 1/6. Imagine um dado de 20 lados.
Mas ainda com um erro to pequeno, possvel tomar uma amostra ruim
ou no representativa da populao? possvel sim, mas muito raro. O pesquisador mais experiente percebe nas primeiras determinaes dos resultados da amostragem se a amostra pode ser ruim. Se em uma pesquisa eleitoral, a grande maioria dos entrevistados for muito jovem, ou se, por exemplo,
a amostra contemplou um nmero excessivamente grande de homens ou
de mulheres, por exemplo, em torno de 80%, deve-se desconfiar do processo amostral, haja vista que sabido que as mulheres so somente um pouco
mais do que 50% da populao.
116

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

Amostragem

A variabilidade
A variabilidade um componente importante na determinao do tamanho da amostra. Talvez o mais simples processo de amostragem seja o
de exame de sangue. Tira-se uma pequena amostra do sangue e determinaes completas sobre o tipo de sangue, o fator RH, a sade da pessoa, entre
outras verificaes, podem ser feitas. Isso porque o sangue uma substncia homognea e uma simples gota representa todo o volume de sangue
do corpo humano.
Por outro lado, populaes heterogneas exigiro maior nmero de elementos da amostra para que ela possa captar as diferenas entre esses componentes da populao.
A variabilidade pode ser medida atravs da varincia ou do desvio-padro, sua raiz quadrada. Matematicamente pode-se estabelecer uma relao
direta entre o tamanho da amostra e o desvio-padro, ou seja:

O problema aqui est em determinar um valor estimativo para o desvio-padro, porque uma vez que a pesquisa ainda no foi feita e precisaremos
dessa medida para o clculo do tamanho da amostra, enfrentamos um problema circular. Existem algumas solues de contorno para esse problema.
A primeira emprestar o resultado de uma pesquisa anterior semelhante
a que se est realizando. A segunda buscar uma estimativa para o desvio-padro atravs da realizao de uma amostra piloto. E a terceira obter essa
informao atravs de algum tipo de simulao. H varias possibilidades
para isso. Apresentaremos duas.
A primeira simulao consiste em considerar um intervalo onde aproximadamente 95% dos elementos da populao estariam concentrados. Esse
intervalo pode ser associado quantidade 1,96 da tabela normal padro.
Ento, o comprimento desse intervalo seria de aproximadamente 4 . Teramos a ento uma forma indireta de obter um valor aproximado para .
Uma outra simulao possvel quando se trata de obter uma estimativa
para o desvio-padro ou a varincia em uma pesquisa que envolve propores. Nesse caso, a varincia dada pelo produto de p por (1p). O maior
valor possvel para esse produto quando p for igual a 0,5. Observe, por
Este material parte integrante do acervo do IESDE BRASIL S.A.,
mais informaes www.iesde.com.br

117

Amostragem

exemplo, que se p for igual a 0,3, ento (1p) = 0,7 e o produto ser 0,21.
Assim, quando tomamos 0,5 . 0,5 = 0,25 obtemos maior valor possvel para a
varincia, garantindo ento que no mnimo o tamanho da amostra calculado
ter os valores de desvio e erro de amostragem estabelecidos a priori.
Essa simulao vale para o caso em que o confronto ocorre entre dois
candidatos, pois a se tem uma distribuio Bernoulli, cuja expresso da varincia dada pelo produto de p por (1p). Quando se tem um maior nmero
de candidatos, esse clculo pode ser aprimorado pela determinao da varincia mxima de uma distribuio multinomial. Mas essa aproximao pela
distribuio Bernoulli pode ser realizada se for feita a considerao de um candidato contra todos os demais. No geral, no h uma mudana muito grande
na determinao do tamanho da amostra ao se fazer essa considerao.

Determinao do tamanho da amostra


Estabelecidos os principais componentes para a determinao do tamanho da amostra, podemos construir uma expresso matemtica de forma
intuitiva a partir das relaes de proporcionalidade verificadas.
Vimos que o tamanho da amostra diretamente proporcional ao nvel de
confiana (que pode ser expresso atravs do valor z da distribuio normal
padro), tambm diretamente proporcional ao desvio-padro () e inversamente proporcional ao valor estabelecido pelo desvio (d). Dessa forma,
uma possvel expresso para o tamanho da amostra seria:
n = (z.)
d
Mas essa relao no linear e , portanto, necessria uma determinao
mais tcnica da expresso para o clculo do tamanho da amostra.
Partiremos do intervalo de confiana estabelecido inicialmente:
Pr ( p d < P < p + d ) = 1
Essa expresso conhecida da inferncia estatstica, em que o desvio
pode ser expresso como:
d= z.
n
118

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

Amostragem

Isolando o valor de n da expresso anterior, teremos


n=

z.
d

Essa a expresso inicial para o clculo do tamanho da amostra.


Exemplo:
Calcular o tamanho de uma amostra para uma pesquisa eleitoral na
cidade do Rio de Janeiro, com nvel de confiana de 95% e desvio de mais
ou menos 5%.
Ento, z = 2; 2 = 0,5 e d = 0,05
n = 2 . 0,5
0,05

= 400

A rigor para exatos 5% de erro estatstico o valor de z igual a 1,96, portanto, o tamanho da amostra poderia ser de 385 pessoas que as margens
estabelecidas estariam asseguradas.
Como havia sido afirmado anteriormente, a relao entre o tamanho da
amostra e o erro estatstico, a margem de erro e a variabilidade no so linearmente proporcionais. Pode-se verificar essa propriedade atravs de exemplos
em que a margem de erro ou o erro estatstico variem nas diferentes direes.
Exemplo:
Calcular o tamanho da amostra para margens de erro de 1%, 2%, 3%, 5%
e 10% e erros estatsticos de 1%, 5% e 10%.
Aplicando a expresso acima para esses dados e tendo os valores de z
correspondentes a 1%, 5% e 10%, respectivamente, 2,58, 1,96 e 1,64, obtemos os seguintes valores para o tamanho da amostra:
Margem
de erro

Erro estatstico
0,01

0,05

0,1

0,01

16641

9604

6724

0,02

4160

2401

1681

0,03

1849

1067

747

0,05

666

384

269

0,10

166

96

67

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

119

Amostragem

Observe na tabela o valor encontrado anteriormente de 384 eleitores


para margem de erro de 5% e nvel de confiana de 95% e compare com os
resultados vizinhos.

Custo da pesquisa
Supondo que a produo de cada entrevista seja em torno de R$10,00,
sendo j inseridos todo o trabalho de campo, seguros para os pesquisadores,
planejamento, anlise dos dados, impresso e impostos. Uma pesquisa com
384 eleitores, 5% de desvio e nvel de confiana de 95% custaria em torno
de R$3.840,00.
Em uma situao mais adequada, mudando somente a margem de erro
para 2% de desvio, o custo da pesquisa subiria para R$24.000,00. Mesmo
que se pudesse admitir um erro estatstico de 10%, ou seja, uma confiana
de 90%, o custo da pesquisa para um desvio de 2% seria de R$16.810,00.
De fato, o fator custo extremamente limitante da potencialidade da pesquisa. Mas essa discusso chama a ateno para que a leitura da pesquisa
seja feita sempre olhando o nvel de confiana e a margem de erro e no s
a estimativa pontual das percentagens.
No caso da pesquisa eleitoral discutida anteriormente, com a margem de
erro de 5% e nvel de confiana de 95%, justifica-se pelo acerto do instituto
em verificar que a eleio se resolveria no primeiro turno. Para os demais
candidatos, que no o vencedor Candidato A, a pesquisa no informa com
preciso as suas situaes.
Em datas mais prximas da eleio, quando o quadro pode tender a
uma aproximao dos demais candidatos, o instituto dever modificar
sua estratgia, melhorando a preciso e consequentemente o volume da
amostra, resultando fatalmente num aumento do custo da pesquisa.
H expresses estatsticas apropriadas que j embutem o custo da pesquisa no prprio clculo do tamanho da amostra, mas uma sofisticao
que pode ser contornada com um estudo comparativo como o que foi feito.
H livros de estatstica terica que apresentam essas circunstncias para o
caso de necessidade de aprofundamento da discusso.

Correo para populaes finitas


As consideraes realizadas at o momento no tomam em conta o tamanho da populao. Ocorre que esses clculos no mudam substancialmente
120

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

Amostragem

quando as populaes so muito grandes. Os clculos realizados para Fortaleza ou para So Paulo indicaro que no haver mudana significativa no
clculo do tamanho das amostras. Para efeito de clculos estatsticos, essas
populaes so consideradas infinitas.
A estratgia de campo pode sim ser modificada e dependendo do tipo de
amostragem a ser realizada o tamanho da amostra pode mudar um pouco.
Essa forma de clculo do tamanho da amostra adequada para quando
se realiza uma amostra aleatria simples, muito embora as mudanas para
outros tipos de amostragem possam no modificar de forma importante
essa determinao, ao menos de estudos particulares sobre a variabilidade
interna de estratos ou de conglomerados. Porm, esse estudo est fora do
escopo do presente livro.
Para populaes finitas e sem reposio, necessrio que se proceda uma
correo. Ela chamada de correo para populaes finitas. A expresso do
desvio modificada para
d=

z.
n

Nn
N1

Nn
, a correo para a populao finita. Pode-se
N1
verificar que o clculo de n pode ento ser determinado por:
Esse ltimo fator,

n=

[N . 2 . z2]
[(N 1) . d2 + 2 . z2]

De outra forma, pode-se determinar pela expresso original n e depois


corrigi-la multiplicando o valor obtido pela correo para populao
finita. Ento:
n =

z.
d

n = n .

Nn
N1

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

121

Amostragem

Exemplo:
Calcular o tamanho da amostra para uma pesquisa com 95% de confiana
e margem de erro de 5% para uma populao de eleitores de (a) 5 000 e (b)
1 000 000:
O calculo de n para os dois casos ser de 384 eleitores. A correo para
uma populao de 5 000 eleitores ser de 0,9898 e o tamanho da amostra
corrigido ser de 380 eleitores. Para a populao de 1 000 000 a correo ser
de 0,999 e o novo clculo do tamanho da amostra ser de 383,62, ou aproximadamente 384 eleitores, no implicando, portanto, nenhuma modificao
no tamanho da amostra, uma vez que o fator de correo para populaes
infinitas praticamente igual unidade.

Atividades de aplicao
1. Foi encomendado um estudo para avaliao de uma instituio de
Ensino Superior. Para isso, aplicou-se um questionrio e foram obtidas
as respostas de 110 alunos.

Indique:
a) a varivel em estudo;
b) a populao em estudo;
c) a amostra escolhida.

2. Supondo que a varivel escolhida de uma pesquisa seja nominal e a


populao finita de 600 indivduos (em que 60% dos indivduos so
mulheres), e deseja-se trabalhar com um alfa () 5% e um erro amostral de 7%. Calcule o tamanho da amostra.
3. Indique o tipo de amostragem realizada em cada um dos casos a seguir:
a) um fornecedor de peas para automveis obtm uma amostra
de todos os itens de cada um de 12 fornecedores selecionados
aleatoriamente;

122

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

Amostragem

b) um fabricante de automveis faz um estudo de mercado compreendendo testes de direo feitos por uma amostra de 30 homens
em quatro diferentes faixas etrias;
c) num processo de fabricao de certo componente de refrigeradores, o inspetor retira os 20 primeiros componentes fabricados e
os inspeciona.
4. Um jornal americano realizou uma pesquisa solicitando a resposta dos
leitores a esta questo: Voc apoia o desenvolvimento de armas atmicas que poderiam matar milhes de pessoas inocentes? Relata-se que 20
pessoas responderam pergunta, sendo 87% com no e 13% com sim.

Identifique as 4 maiores falhas da pesquisa.

5. Retirada uma amostra sistemtica de 35 elementos a partir de uma populao ordenada formada de 2 590 elementos, qual ou quais dos elementos a seguir seria escolhido para pertencer amostra, sabendo-se
que o elemento de ordem 1 546 (1 546.) a ela pertence?

242. 636. 2 323. 1 028. 1 841. 592.

6. Uma populao se encontra dividida em trs estratos, com tamanhos,


respectivamente, N1 = 80, N2 = 120 e N3 = 60. Realizada uma amostragem estratificada proporcional, 12 elementos foram retirados do primeiro estrato. Qual o nmero total de elementos da amostra?
7. Uma indstria especializada em montagens de equipamentos industriais recebeu 70 dispositivos de controle do fornecedor A e outros 30
dispositivos do mesmo tipo do fornecedor B. O aspecto relevante, que
se deseja controlar nesses dispositivos, a resistncia eltrica de certo
componente crtico. Vamos admitir que os 100 dispositivos recebidos
foram numerados de 1 a 100 ao darem entrada no almoxarifado, e
que os 70 primeiros foram aqueles recebidos do fornecedor A. Vamos
admitir, tambm, que os valores reais da varivel de interesse (a resistncia eltrica do componente crtico) dos 100 dispositivos recebidos
sejam os seguintes, respectivamente na ordem de entrada no almoxarifado (l-se seguindo as linhas, tal como se l um livro):

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

123

Amostragem

33

38

34

34

34

31

36

35

32

37

35

34

30

37

36

33

34

34

32

39

35

33

33

34

31

32

36

33

29

36

34

35

34

33

31

35

35

35

37

32

34

34

36

35

34

33

32

38

34

33

33

32

34

35

37

35

35

30

35

34

36

36

33

34

33

32

31

37

35

34

39

40

40

42

39

38

40

40

40

40

40

41

45

41

40

39

41

41

40

42

39

40

41

40

40

42

39

39

38

40

a) Retire uma amostra aleatria simples de 10 dispositivos, sem reposio, utilizando a tabela de nmeros aleatrios (do livro) a partir
da interseo da quinta linha com a oitava coluna. A seguir, calcule
a resistncia eltrica mdia da amostra obtida.
b) Imagine que se pensasse em fazer uma amostragem estratificada.
Em sua opinio, seria isso razovel? Em caso afirmativo, indique
como voc procederia, ainda utilizando os nmeros aleatrios. Suponha que o total de dispositivos a examinar na amostra continue
sendo 10.
c) Considere agora que tivesse sido utilizada uma amostragem estratificada uniforme, num total ainda de 10 dispositivos examinados,
e que a mdia para o primeiro estrato foi 33,8 e para o segundo,
40,2. Em quanto voc estimaria a mdia da populao de 100 dispositivos?
d) Suponha agora que dos 70 dispositivos provenientes do fornecedor A tenha sido obtida uma amostra sistemtica de 10 dispositivos, sendo constante o perodo de retirada dos elementos para
a amostra e sendo conhecido que o segundo dispositivo a entrar
no almoxarifado (cujo valor da resistncia 38) pertencia a essa
amostra. Calcule a mdia para os valores observados.

124

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

Amostragem

Gabarito
1.
a) A avaliao da instituio.
b) Os alunos da instituio.
c) Os 110 alunos respondentes.
2. Como p = 0,6, N = 600, d = 0,07 e z = 1,96, ento como a populao
finita, temos:
2




3.

1, 96
z
n ' = p.(1 p ) n =
(0, 6)(0, 4) = 189 em que devemos
d
0, 07
aplicar o fator de correo para populaes finitas, de tal forma que:
( N n)
(600 189)
n = n '.
onde n = 189.
n 157.
(N 1)
(600 1)
a) Conglomerados.
b) Estratificada.
c) Convenincia.

4.
a) O texto da questo tendencioso e induz resposta negativa.
b) O tamanho da amostra pequeno (20 unidades).
c) Os entrevistados foram autosselecionados, ou seja, no houve
uma seleo aleatria por parte do jornal.
d) Como apenas 20 entrevistados responderam, os percentuais obrigatoriamente devem ser mltiplos de cinco. Logo, 87% e 13% no
so resultados possveis.

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

125

Amostragem

N
2.590
, ento f.a. =
= 74, isso significa
n
35
que os elementos da amostra foram retirados num intervalo de
74 unidades. Sendo assim, pertencer amostra o elemento Xi em

5. Como a frao amostral ser




1 546 - X
=nmero inteiro (corresponde ao nmero de intervalos
74
de 74 unidades distante do valor 1 546). Logo, o nico elemento que
satisfaz essa condio o 1 028, conforme se observa no clculo:

que

1 546 -1 028
=7
74

6. Existem vrias formas de soluo para essa questo, mas basicamente


a ideia que a amostra mantenha a representatividade da populao.
Sendo assim, temos que:
Populao

Amostra

N1 = 80

n1 =12

N2 = 120

n2 =?

N3 = 60

n3 =?

N = 260

n =?

12
80
= 39,
= 0,3077, logo n1 = 0,3077 de n n =
0,3077
260

Ento: PropN1 =

ento:

120
= 0, 4615, logo n2 = 0,4615 de n n = (0,4615).39
como PropN2 =
260
= 18.

Portanto, n2 = 18 e n3 = 39 12 18 = 9.

7.
a) Nmeros selecionados: 46 21 28 15 31 36 35 56 88 65.

126

Resistncias: 33 35 33 36 34 35 31 35 41 33.

Resistncia mdia =

33 + 35 + 33 + 36 + 34 + 35 + 31+ 35 + 41+ 33 346


=
= 34, 6.
10
10

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

Amostragem

b) Sim, pois os valores das resistncias correspondentes ao fornecedor B tm uma diferena clara em relao aos do fornecedor A, no
entanto, o comportamento homogneo dentro de cada um dos
fornecedores. Sendo assim, podemos tratar como dois estratos.

O procedimento para a estratificao seria manter na amostra


a representatividade observada na populao, ou seja, 70% de
componentes do fornecedor A e 30% de componentes do fornecedor B. Dessa forma, teramos numa amostra de tamanho 10 a
incluso de sete componentes do fornecedor A e trs componentes do fornecedor B. No processo de seleo por meio da tabela de
nmeros aleatrios, os componentes ordenados de 01 a 70 seriam
do fornecedor A e de 71 a 100 (00) do fornecedor B. Partindo da
quinta linha com a oitava coluna, obteramos a seguinte amostra:

Nmeros selecionados: 46(A) 21(A) 28(A) 15(A) 31(A) 36(A) 35(A).


Como j esto contemplados sete componentes do fornecedor A,
somente nos interessa, a partir de agora, a obteno dos componentes do fornecedor B. Logo, apenas participaro da amostra elementos que estejam entre 71 e 100 na sequncia da tabela de nmeros
aleatrios. Sendo assim, encontraremos os nmeros 88, 86 e 98.

Resistncias: : 33 35 33 36 34 35 31 41 39 39.

Resistncia mdia =

33 + 35 + 33 + 36 + 34 + 35 + 31+ 41+ 39 + 39 356


=
= 35, 6.
10
10
c) Nesse caso, foi utilizada uma amostra com cinco componentes de
A e 5 de B. O procedimento correto para realizar a estimativa da
mdia populacional seria corrigir os valores mdios em funo da
representatividade na populao, ou seja:

(33, 8).70 + (40,2).30


= 35,72 .
100
d) Como o 2. elemento pertence amostra e como a frao de amostragem sete , ento a amostra composta dos seguintes elementos:

Resistncia mdia ( X ) =

Nmeros selecionados: 02 09 16 23 30 37 44 51 58 65.

Resistncias: 38 32 33 33 36 35 35 33 30 33.

Resistncia mdia =

38 + 32 + 33 + 33 + 36 + 35 + 35 + 33 + 30 + 33 338
=
= 33, 8.
10
10

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

127

Amostragem

128

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

Estimao

Problema
A Empresa ABC de Engenharia, Construes e Empreendimentos prima
pela qualidade de seus edifcios. Entre outros padres, estabeleceu que a
resistncia do concreto utilizado em suas construes nunca dever ser inferior a 200 Kgf/cm2. Todo o concreto a ser utilizado dever ento ser submetido a um teste de resistncia.
Ocorre que os testes de resistncia do concreto so testes destrutivos e,
portanto, a nica forma de realiz-los atravs de um processo amostral em
que pequenas partes do concreto so submetidas a testes de ruptura. Para
cada betoneira so retiradas 10 quantidades de concreto que formaro os
corpos de prova. A mdia da resistncia desses corpos de prova determinada e se supe que o resultado encontrado seja representativo da mdia de
todo o concreto.
Como esse processo envolve certo nvel de incerteza, no se pode garantir
de forma absoluta que o valor encontrado para a mdia de resistncia dos
corpos de prova seja igual ao valor da resistncia de toda a populao.
Dois procedimentos podem ser realizados a partir do resultado amostral.
O primeiro construir um intervalo em torno do valor da mdia amostral no
qual se possa afirmar, com certo nvel de confiana, que o verdadeiro valor
da mdia populacional pertena a esse intervalo. O segundo procedimento
o de testar se, com base na mdia amostral, o valor mnimo estabelecido de
resistncia do concreto pode ser aceito.
Ento, trs procedimentos de estimao foram estabelecidos. O primeiro
chamado de estimao pontual, em que o valor da mdia amostral uma
estimativa da mdia populacional; a partir dele constroem-se os outros dois
procedimentos, um de estimao por intervalo, ou construo de um intervalo de confiana, e o ltimo de testagem de hipteses estatsticas.
De acordo com um importante conceito terico da Estatstica, o Teorema Central do Limite, a distribuio de probabilidade amostral da mdia para
Este material parte integrante do acervo do IESDE BRASIL S.A.,
mais informaes www.iesde.com.br

129

Estimao

tamanhos adequados das amostras pode ser assumida como tendo distribuio normal, independentemente da forma da distribuio populacional.
A distribuio normal joga ento um papel central para a realizao de testes
de hipteses. Ela tem a mesma importncia na construo de intervalos de
confiana.
O estudo das distribuies amostrais antecede ento o estudo da
estimao.

Conceitos fundamentais
No geral, estamos interessados em verificar como uma varivel de uma determinada populao se comporta. Em um estudo de mercado sobre a aceitao de
um novo artigo alimentar, pode ser interessante conhecer variveis que caracterizem o estado nutricional da populao a quem o produto possa estar destinado. O peso da populao, por exemplo, pode ser uma dessas variveis.
A caracterizao do peso da populao pode ser feita atravs de uma
distribuio de frequncias que pode aproximar uma distribuio de probabilidades. Essa distribuio tem algumas caractersticas importantes, como o
valor da mdia, do desvio-padro e da forma da distribuio, alm de poder
ser discreta ou contnua. No captulo anterior, estudamos as distribuies
discretas. Neste captulo, estudaremos algumas distribuies contnuas de
grande utilidade para se fazer inferncia. Vamos nos restringir s distribuies contnuas mais importantes para o propsito de estimao contido
neste captulo: a distribuio normal e a distribuio t de Student.
Quando fazemos um processo de amostragem, verificamos em uma
nica amostra o valor de uma estatstica, a mdia do peso dos elementos
da amostra, por exemplo, e tentamos inferir algo sobre o parmetro da populao, nesse caso, a mdia da populao. Ento, a mdia da amostra um
estimador da mdia da populao.
Para fazermos isso, precisamos conhecer algumas propriedades tericas do estimador e a forma de fazer esse estudo atravs de simulaes
de vrias amostragens. Reforando o conceito: na prtica, s retiramos uma
amostra, mas para construir um corpo terico que nos auxilie a inferir sobre
o parmetro, construmos teoricamente vrias amostragens.

130

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

Estimao

Se fizssemos vrias amostragens, cada amostra teria possivelmente um


valor diferente como sua mdia. Teramos, assim, uma populao de mdias
amostrais. Podemos calcular dessa populao de mdias amostrais a sua
mdia e o seu desvio-padro e tambm verificar qual a distribuio dessas
mdias. Construmos, assim, a distribuio de probabilidades das mdias
amostrais, que como toda distribuio tem sua mdia e seu desvio-padro.

Distribuio amostral
A distribuio amostral a distribuio de probabilidades de alguma estatstica de cada amostra. Assim, podemos determinar a distribuio amostral
das mdias, a distribuio amostral das propores e ainda a distribuio
amostral das varincias ou dos desvios-padres.

Mdia e varincia da
distribuio amostral das estimativas
Cada distribuio dessas tem uma mdia e uma varincia. A mdia da distribuio amostral das estimativas tambm conhecida como valor esperado da distribuio amostral das estimativas. O desvio-padro da distribuio
amostral das estimativas, que a raiz quadrada da varincia da distribuio
amostral das estimativas, conhecido como erro-padro das estimativas.
Essas estimativas podem ser os valores assumidos pelas mdias ou pelas
propores, por exemplo.

Estimao por ponto


Uma estimativa pontual um simples valor de um estimador utilizado para
estimar o verdadeiro valor do parmetro correspondente. A mdia amostral
um estimador da mdia populacional. Poderamos eventualmente usar a
mediana para estimar a mdia populacional, mas a mdia da amostra um
estimador com qualidades que a mediana da amostra no tem.

Estimao por intervalo


A estimativa intervalar de um parmetro populacional um intervalo
entre dois valores, o limite inferior e o limite superior do intervalo, entre os
quais temos certo nvel de confiana que o parmetro estar.

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

131

Estimao

Nvel de confiana e erro amostral


O erro amostral a probabilidade de que a amostra no represente a populao. No geral, representado pela letra grega . O nvel de confiana o
complemento do erro amostral, no geral dado em percentagem e, portanto, sua representao (1 ) . 100%. Um erro amostral de 0,05 tem como
correspondente de nvel de confiana o valor 95%.

Teste de hipteses estatsticas


O teste de hipteses realizado com o estabelecimento de duas hipteses
contrapostas. Cada hiptese constituda de uma declarao acerca do valor
do parmetro. Elas so chamadas de hiptese nula e hiptese alternativa.
A hiptese nula, denotada por H0, a hiptese de que o parmetro em
questo seja igual a certo valor. Por exemplo, H0 = Um automvel tem um
consumo mdio de 10km/litro, ou seja, H0: = 10km/litro. A hiptese alternativa, denotada de H1, pode ser bilateral, H1: 10km/litro, ou unilateral, H1:
> 10 km/litro. O teste ser unilateral ou bilateral dependendo do contexto
do problema. Se tivermos alguma informao sobre o comportamento dos
dados a partir de uma base terica, devemos realizar um teste unilateral.

Estatstica do teste
Os dados da amostra fornecero os valores das estimativas dos parmetros. A partir da determinao desses valores e utilizando-se a base terica
da distribuio amostral estabeleceremos uma estatstica para o teste. Verificaremos em que nvel de probabilidade poderemos rejeitar H0 ou no. Esse
procedimento ser explicado em detalhes mais adiante no captulo.

Erro tipo I e erro tipo II


A probabilidade de cometer-se erro tipo I associada ao erro estatstico, e,
portanto, chamada de . tambm a probabilidade de rejeitarmos H0 quando
a hiptese nula verdadeira. O erro tipo II, chamado de , a probabilidade de
aceitarmos H0 quando a hiptese nula falsa. No geral, controla-se o erro tipo
I por ser considerado o mais grave e por isto o mais utilizado para o clculo
do tamanho da amostra.
132

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

Estimao

Regio crtica e p-valor


Associado estatstica do teste, podemos estabelecer uma regio crtica
para a aceitao de H0 atravs do clculo de valores crticos associados a um
nvel preestabelecido do tamanho do erro aceitvel.
Alternativamente, podemos, depois de calcular o valor da estatstica do
teste, verificar o nvel de erro associado atravs da determinao do p-valor. Os
dois procedimentos se assemelham e sero discutidos mais tarde no captulo.

A distribuio normal
Como vimos no tratamento de dados, quando construmos uma distribuio de frequncias a partir de observaes, podemos aproxim-la a uma
distribuio de probabilidades. Os dados podem levar a diferentes tipos de
distribuio, uma delas exerce um papel central na teoria e na prtica estatsticas. a distribuio normal.

Propriedades da curva normal


A distribuio normal uma distribuio contnua. Enquanto as distribuies discretas assumem valores a partir de nmeros inteiros, as distribuies
contnuas assumem todos os valores entre os nmeros inteiros, ou seja, seu
domnio o dos nmeros reais. A distribuio normal, particularmente, tem
como domnio qualquer valor real entre menos infinito e mais infinito.
Uma caracterstica importante da distribuio normal que ela uma
funo de x que pode ser inteiramente determinada com o conhecimento dos valores da mdia e do desvio-padro. Fala-se que X tem distribuio
normal com mdia e desvio-padro . A sua expresso matemtica dada
pela funo:

f(x) =

1/2

1
.
2

,x

Nessa equao, a mdia e o desvio-padro , que determinam o ponto


central e a disperso da distribuio em torno da mdia, so os dois parmetros da distribuio normal. Ento, substituindo x por seus valores obtm-se
os valores de f(x) e pode-se, ento, traar o grfico da funo.
Este material parte integrante do acervo do IESDE BRASIL S.A.,
mais informaes www.iesde.com.br

133

Estimao

O seu aspecto o de um sino, por isso muitas vezes chamada de curva


do sino.
f(x)

O valor central o da mdia , e a curva simtrica em relao a . A rea


total sob a curva igual unidade. Nos pontos de inflexo de cada lado da
curva temos o valor de X igual a 1 e + 1. E a curva assinttica ao
eixo X, ou seja, ela se aproxima do eixo X em e em + . Representamos
essa distribuio como X ~ N(;). Em muitos livros, a representao leva em
conta o valor da varincia. Nesses casos, a notao fica X ~ N(;2).

reas abaixo da curva normal


Como a rea abaixo da curva igual a 1, podemos associar reas a valores
de probabilidade, a exemplo do que fizemos com o histograma. Assim, a probabilidade de sortearmos um elemento da populao cujo valor da varivel
seja maior do que e de 0,5 ou 50%. Da mesma forma que 50% da rea da
curva est associada a valores menores do que . Esses fatos podem ser descritos atravs das expresses:
P( X ) = 0,5 e P(X ) = 0,5
f(x)

+ 1

Observe que essas probabilidades so complementares.

134

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

Estimao

Dessa forma, se pudermos calcular as reas entre dois pontos da curva,


essa rea ser igual probabilidade de sortearmos um elemento cujo valor
esteja entre esses dois pontos.
Vejamos algumas probabilidades associadas a algumas reas particulares:
P( X + 1 ) = 0,8413, isto , a rea sob a curva entre e + 1
sempre de 84,13%, independente dos valores de e de .
f(x)

+ 1

Outras probabilidades particulares importantes:


P( X + 2 ) = 0,9772
f(x)

+ 2

P( X + 3 ) = 0,9987
f(x)

+ 3

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

135

Estimao

P( X + 4 ) = 0,9999
f(x)

+ 4

Observe que embora X varie de at + , praticamente 100% da rea


da curva est entre e + 4 . Observaremos mais tarde que, na verdade, o
intervalo ( 4 , + 4 ) abrange quase 100% de toda rea.
Exemplo:
Considerando o exemplo do estudo nutricional, se a varivel considerada
for o peso da populao com mdia 70kg e desvio-padro 10kg, ao sortearmos um elemento ao acaso dessa populao, poderemos calcular algumas
probabilidades, por exemplo:
Probabilidade de sortearmos uma pessoa com mais de 70kg, P(X
70) = 0,5.
f(x)

70

Probabilidade de sortearmos uma pessoa entre 60kg e 80kg, P(60 X


80) = P(70 10 X 70 + 10) = P( 1 X + 1) = P( X + 1)
P( X 1 ).

136

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

Estimao

Mas, P( X + 1) = 0,8413 e P( X 1) = 1 0,8413 =


0,1587, veja que as reas so simtricas ao ponto central .
P(60 X 80) = 0,8413 0,1587 = 0,6826
f(x)

60

80

Probabilidade de sortearmos uma pessoa entre 70kg e 80kg, P(70 X


80) = P(70 X 70 + 10) = P( X + 1) P( X ) = 0,8413 0,5
= 0,3413. Lembre-se novamente que as reas so simtricas em relao a ,
ento P( X ) = 0,5.
f(x)

70

80

Probabilidade de sortearmos uma pessoa com menos de 60kg, P(X 60)


= P(X 70 10) = P(X 1) = 1 0,8413 = 0,1587.
f(x)

60

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

137

Estimao

Probabilidade de sortearmos uma pessoa entre 60kg e 90kg, P(60 X


90) = P(70 10 X 70 + 20) = P( 1 X + 2) = P( X + 2 )
P( X 1) = 0,9772 0,1587 = 0,8185.
f(x)

60

90

Probabilidade de sortearmos uma pessoa entre 80kg e 100kg, P(80 X


100) = P(70 10 X 70 + 30) = P( + 1 X + 3) = P( X + 3)
P( X + 1) = 0,9987 0,8413 = 0,1574.
f(x)

80

100

Duas observaes devem ser feitas nesse ponto:


(I) A probabilidade em um ponto em uma distribuio contnua sempre
igual a zero. No h como calcularmos rea. Ento, por ser indiferente determinamos por conveno que no clculo dessas probabilidades, usaremos um intervalo aberto esquerda. Isto , P( 1 X + 1) = P(
1 < X + 1). E essa conveno vale para todos os intervalos.
(II) Precisamos sempre verificar a quantos desvios-padres est o valor de
X em relao mdia. Seja X ~ N(70,10). Ento em P(60 X 90) = P(70
10 X 70 + 20) = P(70 1 X 70 + 2 ). Para determinar o valor
z de quantos desvios-padres 90 est distante da mdia, fazemos 90
= + z. Isolando z, temos z = (90 )/. Como = 70 e = 10, temos
que z = (90 70)/10 = 2. Ou seja, z o nmero de desvios-padres
que separam a mdia do valor desejado.

138

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

Estimao

Normal padro
Vimos que se soubermos quantos desvios-padres separam a mdia dos
valores para os quais desejamos determinar as probabilidades, basta saber a
rea associada ao nmero de desvios-padro. Isso equivale a trabalhar com
uma distribuio normal com mdia 0 e desvio-padro 1. Essa distribuio
chamada de distribuio normal padro e a representamos por Z ~ N(O,1),
em que z = (X )/.
A forma como foram determinadas as probabilidades fornecidas anteriormente, entre e a mdia mais um desvio-padro, entre e a mdia mais
dois, trs e quatro desvios-padres a forma usual no clculo de reas de
funes, que o clculo da integral da funo entre e + 1 da funo
normal padro para o primeiro caso. O mesmo vale para os demais casos. A
rea entre e + 2 foi determinada pelo clculo da integral definida da
funo f(x) da expresso da distribuio normal padro, tendo como limites
e + 2.
Ento, a probabilidade P(X 60) = P(X 1 ) = P( X 1 ) =
P( Z 1) e a integral definida de f(x) de e 1 fornecero o valor exato
dessa probabilidade. Est claro que esse clculo seria tedioso, alm de envolver um procedimento altamente complexo de clculo de integrais.
Aqui vale ressaltar uma caracterstica importantssima da distribuio
normal. Independentemente dos valores da mdia e do desvio-padro,
essas reas so sempre as mesmas. Queremos dizer com isso que para qualquer populao normal a rea entre e 1 ser sempre a mesma. Se
temos duas populaes normais, a primeira X com mdia 70 e desvio-padro
10 e a segunda Y com mdia 20 e desvio-padro 2, as probabilidades P(X 60)
e P(Y 18) sero iguais, porque ambas representam P(X 1 ) = P(Z 1).
Se a rea entre e 1 0,8413, rea correspondente funo de distribuio acumulada, ento a rea entre e ( + 1 ) ser 0,8413 0,5 = 0,3413.
f(x)

+ 1

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

139

Estimao

Funo de distribuio
acumulada da distribuio normal
Como vimos, a rea acumulada entre e um certo valor de Z pode
ser utilizada para calcularmos as probabilidades correspondentes. Ento, se
queremos P( 1 X + 2 ), devemos calcular P(X + 2 ) P(X
1 ). Essa diferena igual a P(Z 2) P(Z 1) = F(2) F(1).
f(x)

A tabela D representa as reas de uma distribuio normal padro acumulada. No exemplo anterior temos que F(2) F(1) = 0,9772 0,1587 = 0,8185.
Refazendo o exemplo do estudo nutricional, se a varivel considerada for
o peso da populao com mdia 70kg e desvio-padro 10kg, e se sortearmos
um elemento ao acaso dessa populao, poderemos calcular probabilidades
utilizando a tabela D, por exemplo:
Probabilidade de sortearmos uma pessoa com mais de 70kg:
P(X 70) = 1 P(X 70) = 1 P[(X )/ 70 )/ ] = 1 P[Z 70 70)/
10] = P(Z 0) = F(0) = 0,5.
f(x)

70

140

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

Estimao

Probabilidade de sortearmos uma pessoa entre 60kg e 80kg:


P(60 X 80) = P[(60 )/ (X )/ 80 )/] = P[(60 70)/10 Z
(80 70)/10] = P( 1 Z 1) = F(1) F( 1) = 0,8413 0,1587 = 0,6826.
f(x)

60

80

Probabilidade de sortearmos uma pessoa entre 70kg e 80kg:


P(70 X 80) = P[(70 70)/10 Z (80 70)/10] = P(0 Z 1) = F(1)
F(0) = 0,8413 0,5 = 0,3413.
f(x)

70

80

Probabilidade de sortearmos uma pessoa com menos de 60kg:


P(X 60) = P[Z (60 70)/10] = P(Z 1) = 0,1587.
f(x)

60

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

141

Estimao

Probabilidade de sortearmos uma pessoa entre 60kg e 90kg: P(60 X


90) = P[(60 70)/10 Z (90 70)/10) = P( 1 Z 2) = F(2) F( 1) = 0,9772
0,1587 = 0,8185.
f(x)

60

90

Probabilidade de sortearmos uma pessoa entre 80kg e 100kg: P(80 X


100) = P[(80 70)/10 Z (100 70)/10] = P(1 Z 3) = F(3) F(1) = 0,9987
0,8413 = 0,1574
f(x)

80

100

Observe que podemos calcular qualquer probabilidade, mesmo que os


nmeros no sejam redondos. Por exemplo:
P(56,5 X 64,8) = P[(56,5 70)/10 Z (64,8 70)/10] = F( 0,52)
F(1,35) = 0,3015 0,0885 = 0,2130.
f(x)

56,5

142

64,8

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

Estimao

Distribuio amostral das mdias


Vamos utilizar, a partir de agora, o conhecimento adquirido no estudo
do clculo de probabilidades de uma distribuio normal na discusso da
distribuio amostral de algumas estatsticas, comeando pela distribuio
amostral das mdias.
Se em uma fbrica de lmpadas desejamos fazer inferncias para toda a
produo de lmpadas de um lote, retiramos uma nica amostra de lmpadas e verificamos alguma varivel de interesse, o tempo de vida mdia das
lmpadas, por exemplo.
Para fazermos estimativas acerca dessa varivel, utilizando uma s amostra, precisamos construir um corpo terico sobre o comportamento dessa
amostra. Se tirarmos vrias amostras de tamanho 10, por exemplo, e calcularmos a vida mdia de cada uma dessas amostras, poderemos construir uma
distribuio das mdias amostrais chamada de distribuio amostral emprica. No entanto, se retirarmos todas as amostras possveis de tamanho 10 e
calcularmos a mdia de cada amostra, poderemos determinar a distribuio
amostral terica. O estudo dessa distribuio amostral terica que nos ajudar a construir o corpo terico para a realizao da estimao do parmetro
vida mdia das lmpadas de todo o lote.

Amostragem de populaes normais


A primeira amostra de 10 elementos ter certa mdia de vida igual a X 1,
a segunda amostra, X 2, e assim por diante. Podemos calcular a mdia dessas
mdias e o desvio-padro delas. Se a varivel vida til das lmpadas for distribuda normalmente com mdia e desvio-padro , ento a varivel aleatria
mdia X de uma nica amostra aleatria de tamanho n ser tambm normalmente distribuda com mdia X = e desvio-padro igual a:
=
X

O desvio-padro da distribuio amostral da estimativa chamado de


erro-padro da estimativa.

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

143

Estimao

Observe que se o tamanho de cada amostra for 100 ao invs de 10, o erro
padro ter o seu valor diminudo, uma vez que o denominador da razo
X
que o caracteriza ficar aumentado. Isso ocorre porque amostras maiores
tendero a representar melhor a mdia da populao.

Amostragem de populaes no normais


Muitas das distribuies na rea de economia e negcios no tm distribuio normal. Qual , ento, a natureza da distribuio amostral de X?
Essa resposta pode ser estabelecida pelo talvez mais importante teorema da Estatstica, o Teorema Central do Limite (TCL). bom deixar claro que
embora muitas tradues falem em Teorema do Limite Central, quem central o teorema e no o limite, por isso a primeira denominao parece ser
a mais adequada.
Esse teorema estabelece que se uma varivel aleatria X, seja discreta ou
contnua, tem mdia e desvio-padro finito , ento a distribuio de probabilidades de X se aproxima da distribuio normal com mdia e desvio-padro / n medida que n cresa ilimitadamente.
Uma outra forma de estabelecer-se o teorema dizer que a distribuio de
z = (X )
tem distribuio normal padro medida que n cresa

X .
ilimitadamente, em que
n
Duas observaes so importantes nesse momento:
(I) para distribuies que no so extremamente assimtricas, valores de
n aproximadamente iguais a 30 j garantem a normalidade;
(II) estamos falando da distribuio de X quando n uma grande amostra e no de X, a varivel aleatria original. Muitas variveis aleatrias,
como j foi afirmado, nunca tero distribuio normal por mais que
a amostra cresa. Veja, por exemplo, o caso da distribuio de renda,
que tem uma distribuio exponencial negativa. Por mais que tomemos uma amostra imensa, a distribuio da varivel aleatria renda
nunca ter uma distribuio normal.

144

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

Estimao

Exemplo para populao normal:


Um gerente de produo de uma grfica est pensando em comprar
uma nova impressora para cartes. Em mdia, essas mquinas podem imprimir 1 900 cartes por dia com um desvio-padro de 200. Assuma que o
nmero de cartes impressos por dia tenha uma distribuio normal.
a) Determine a probabilidade em que uma mquina possa imprimir menos do que 1 850 cartes por dia.
b) Se 25 mquinas so escolhidas aleatoriamente da revendedora, determine a probabilidade que o nmero mdio de cartes impressos por
dia seja menor que 1 850.
Antes de calcularmos os valores das probabilidades acima, vamos tentar
verificar intuitivamente qual das duas probabilidades ser a menor. O valor do
desvio-padro conhecido, e no primeiro caso estamos trabalhando com ; no
segundo caso, trabalharemos com =
X

. Ento, a disperso em torno

n
da mdia no primeiro caso ser maior do que no segundo e a rea abaixo de
um dado valor de X ser maior do que para uma distribuio mais concentrada, como o segundo caso. Logo, esperamos que a primeira probabilidade
seja maior do que a segunda. Vejamos:
a) P(X 1 850) = P((X ) / (1 850 1 900) / 200) = P(Z 50/200) =
P(Z 0,25) = 0,4013.
b) P(X 1 850) = P((X ) / (/ 25) (1 850 1 900) / (200/5) = P(Z
50/40) = P(Z 1,25) = 0,1056.
De fato, a nossa intuio estava correta.
Exemplo para populao no normal:

Um gerente de vendas est considerando uma nova campanha de vendas.


sabido que a mdia de consumo por cliente de R$200,00 com desvio-padro de R$15,00. Sabe-se que a distribuio das vendas no se comporta segundo uma distribuio normal; uma amostra de 36 clientes foi escolhida
aleatoriamente. Determine a probabilidade em que a mdia de consumo
ser maior do que R$204,00.

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

145

Estimao

P(X > 204) = 1 P(X 204) = 1 P(Z (204 200) / (15/ 36 )) = 1 P(Z
1,6) = 1 0,9452 = 0,0548

Distribuio amostral das propores


Muitas vezes conveniente considerar a proporo de ocorrncias. Podemos converter o nmero de ocorrncias X para propores, dividindo-o pelo
tamanho da amostra. A proporo amostral ser denotada por p. Ento:
p= x
n
Suponha o seguinte exemplo: Em uma sorveteria entraram cinco pessoas. Elas podem comprar sorvetes com probabilidade p = 0,10, ou no comprar. Isso constitui um ensaio de Bernoulli. A distribuio de probabilidades
que associa o nmero de pessoas que podem comprar sorvete dada na
tabela a seguir, cujas probabilidades foram retiradas da tabela B da distribuio binomial:
X
f(X)

0,59

0,33

0,07

0,01

0,00

0,00

Ento, por exemplo, a probabilidade de que das cinco pessoas que entraram na sorveteria duas comprem sorvetes de 0,07, destacado na tabela
acima.
Essa mesma distribuio de probabilidades poderia ser apresentada pela
proporo de pessoas que compraram sorvetes. Verifique que duas em cinco
pessoas significa 40% das pessoas comprando sorvete, indicado por 0,40:
p
f(p)

0,20

0,40

0,60

0,80

1,00

0,59

0,33

0,07

0,01

0,00

0,00

Observe que o nmero de ocorrncias em uma amostra de tamanho n


dada por X = n. p. Vale chamar a ateno para a diferena de significado de
p da distribuio binomial e p a proporo na amostra.
Calculando a esperana (mdia) e o desvio-padro das duas distribuies
de probabilidades acima, temos:
146

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

Estimao

Para X = n . p
E(X) = E(n . p) = (1).(0,33) + (2).(0,07) + (3).(0,01) = 0,50
VAR(X) = VAR(n . p) = E(X2) (E(X))2 = (1)2.(0,33) + (2)2.(0,07) + (3)2.(0,01)
(0,5)2 = 0,67
Lembrando que E(X) = E(n . p) = n . p = (5).(0,1) = 0,5 e VAR(X) = VAR(n . p)
= n . p . q = 5 . (0,1).(0,9) = 0,67, conferindo com o resultado acima.
Para x = p
n
E(p) = (0,2).(0,33) + (0,4).(0,07) + (0,6).(0,01) = 0,10 = 10%
VAR(p) = (0,2)2.(0,3) + (0,4)2.(0,07) + (0,6)2.(0,01) (0,1)2 = 0,0168 = 1,68%
Podemos verificar tambm que E(p) = E x = 1 E(X) = 1/5(0,5) = 0,1 = p
n
n
p.q
e VAR(p) =
n
Podemos utilizar uma notao um pouco diferente que:
Varivel aleatria

Mdia

Desvio-padro

Nmero de ocorrncias np

np = n.p

np = n.p.q

Proporo de ocorrncias p

p=p

p =

p.q
n

Uma derivao do Teorema Central do Limite, considerando a aproximao


da distribuio binomial pela normal, pode ser estabelecida da seguinte forma:
Se X tem uma distribuio qualquer e o tamanho da amostra n for
grande, a estatstica Z dada a seguir tem distribuio normal padro:
z = X (np) = X (n.p)
np
n.p.q
Tambm tem distribuio normal padro a estatstica Z dada a seguir:
z=

(p p )
= pp
p
p.q
n

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

147

Estimao

Exemplo:
Segundo uma teoria que relaciona estoque e mercado, se em uma semana
o mercado como um todo declina, ento, na semana seguinte, 70% do estoque apresentar um crescimento de preo. Supondo que a teoria esteja
correta e que em uma determinada semana uma amostra aleatria dos estoques de 60 empresas foi observada, qual a probabilidade de 36 ou mais
deles apresentarem um crescimento de preo?
Considerando a proporo de sucessos soluo:
Pelos dados do problema: = p = 0,7, = p = p.q = (0,7).(0,3) =
n
60
0,05916, ento Z = (0,60 0,70)/0,05916 = 1,69. Na tabela da distribuio
normal verificamos que P (p 0,60) = P(Z 1,69) = 1 P(Z 1,69) = 1
0,0455 = 0,9545.
Considerando o nmero de sucessos soluo:
Pelos dados do problema: = n.p = (60).(0,7) e = = n.p.q =
60.(0,7).(0,3) = 3,55, ento Z = (36 42)/3,55 = 1,69. Na tabela da distribuio normal, verificamos que P(X 36) = P(Z 1,69) = 1 P(Z 1,69) =
1 0,0455 = 0,9545.

Estimao por ponto


Temos verificado at aqui alguns tpicos sobre como tirar informaes de
uma amostra para fazer declaraes sobre uma populao da qual a amostra
provm. Essas declaraes dizem respeito a estimativas de parmetros e
forma da distribuio de estatsticas e populaes.
Para a mdia populacional temos trabalhado com a mdia amostral,
como seu estimador.
Devemos reforar esse conceito. Estimador uma expresso matemtica. O
seu valor para uma particular amostra chamado de estimativa. Uma amostra
tambm chamada de uma particular realizao de uma varivel aleatria.
Quando falamos de forma genrica, costumamos designar o parmetro
por , e o seu estimador por ^ .
J comentamos que poderamos estimar a mdia da populao atravs
do clculo de uma outra medida como a mediana da amostra, por exemplo,
148

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

Estimao

ou mesmo atravs de um palpite. Mas qual desses estimadores o mais adequado? Qual deles rene melhores propriedades matemticas para o propsito de estimao?
Vamos verificar trs propriedades de um bom estimador, no vcio, consistncia e eficincia.

Estimador no viciado
Um estimador dito ser no viciado ou no tendencioso se E( ) = .
Vamos tomar uma simulao bem simples para mostrar sobre o que estamos falando. Seja uma populao com trs elementos, X1 = 2, X2 = 4 e X3 =
6. Essa populao com N = 3 tem como mdia E(X) = = 4 e com varincia
VAR(X) = 2 = 8/3.
Dessa populao podemos tomar as seguintes amostras com reposio
(2 = 9 amostras) e calcular os valores das mdias e das varincias de cada
uma dessas nove amostras, conforme mostrado na tabela a seguir:
3

Amostras

Mdias = X

Varincias = S2

(2,2)

(2,4)

(4,2)

(4,4)

(2,6)

(6,2)

(4,6)

(6,4)

(6,6)

N=9

X = E(X ) = 4

E(S2) = S2

Calculamos para a varivel X sua mdia, E(X) = 4 e VAR(X) 4/3. Para o clculo da VAR(X), utilizamos a frmula da varincia para a populao porque se
trata de uma populao de mdias. Dividimos, ento, a soma ao quadrado
dos desvios por N = 9.
Este material parte integrante do acervo do IESDE BRASIL S.A.,
mais informaes www.iesde.com.br

149

Estimao

2 4
Podemos verificar que E(X) = = 4 e que VAR(X) =
= . Usamos aqui
n 3
n = 2 porque o tamanho de cada amostra.
Calculamos para a varivel S2 cada varincia de uma amostra de tamanho
2. Dividimos, portanto, por n 1 , n = 2. S2 chamada de varincia amostral. A
mdia das nove medidas de S2 e a E(S2) = 8/3, valor igual ao de 2, a varincia
populacional.
Tiramos trs concluses dessa simulao:
(I) E(X) =
(II) VAR( X ) =

2
n

(III) E(S2) = 2
De (I) e de (III) conclumos que a mdia amostral X e que a varincia amostral S2 so estimadores no viciados para e para , respectivamente, em
que S2 dado por:
S2 =

1
( X X )2
(n 1)

Poderamos usar algum outro estimador para 2 a varincia populacional?


A resposta sim. Poderamos, por exemplo, utilizar o seguinte estimador:
2 =

1
( X X )2

Ocorre, no entanto, que esse ltimo estimador de 2 no um estimador


no viciado do parmetro 2. E est a a razo de utilizarmos o denominador
n 1 quando calculamos o valor da varincia amostral.
Para formalizar, se 1 = e E( 1) = 1, ento o estimador 1 dito ser no viciado para 1. O mesmo vale para 2 = 2 e o seu estimador no viciado 2 = S2.

Estimador consistente e eficientes


Um estimador dito consistente se o seu valor aproxima-se do valor do
parmetro medida que a amostra cresce.

150

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

Estimao

Um estimador mais eficiente do que outro se a sua varincia for menor


do que a varincia do estimador concorrente. O estimador eficiente o que
possui a menor varincia.
Pode-se demonstrar que alm de no viciado, a mdia amostral um estimador consistente e eficiente para estimar a mdia populacional.

Intervalo de confiana
Como verificado no estudo de amostragem, a estimativa pontual de um
parmetro nem sempre suficiente. Como se trata de um processo que envolve amostragem, e incerteza, muitas vezes queremos estimar um valor do
parmetro adicionando a essa estimativa um intervalo para o qual tenhamos
um certo nvel de confiana que o parmetro possa pertencer.
No caso de estarmos estimando a proporo da preferncia entre dois produtos que competem no mercado, podemos concluir, atravs de um processo de amostragem, que a proporo da preferncia pelo produto A pode ser
maior do que a do produto B, mas que, no entanto, essa diferena possa ocorrer
somente devido a variaes daquela amostra particular que foi tomada. Nesse
caso, caracterizamos o fenmeno do empate tcnico ou empate estatstico.
Devemos construir, ento, em torno do valor estimado pontualmente um
intervalo de confiana.
Fornecemos a seguir as expresses para o clculo de intervalos de confiana para diversas situaes que ocorrem na prtica, sem entrar nas consideraes matemticas que levam construo destes intervalos.

Intervalo de confiana para a


mdia com conhecido
Se o desvio-padro conhecido, utilizamos o seu valor para o clculo do
intervalo, alm do valor da mdia e da estatstica Z da distribuio normal.

P(X z . X X + z . X ) = 1
Em que o erro-padro X =
declarao.

e (1 ) o nvel de confiana da

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

151

Estimao

Exemplo:
Uma empresa fabricante de pneus deseja verificar, atravs de uma amostra de 100 pneus retirada de um grande lote, a vida mdia desse produto.
Sabe-se que o desvio-padro da populao de 3 000km. Para a amostra de
100 pneus, a vida til dos pneus foi verificada em 32 500km para rodar com
segurana.
Desejamos construir para todo o lote um intervalo de confiana de 95% no
sentido de que o verdadeiro valor da vida mdia possa estar nesse intervalo.
Para construir esse intervalo, que ter como limites X z. X , sabemos que

3 000
X = 32 500 e que X =
=
= 300 .
n
100
O valor de Z pode ser buscado na tabela D da distribuio normal padro.
Construiremos, ento, trs regies na curva normal, a primeira correspondendo probabilidade de 0,025, a segunda a 0,95 e a terceira tambm a
0,025. Buscando dentro da tabela da normal padro o valor 0,025, encontramos Z = 1,96. Como a curva simtrica, o valor de Z correspondendo a
0,975 ser Z = 1,96.
f(x)

1,96

95%

1,96

Portanto, o intervalo construdo ser: [32 500 (1,96).(300), 32 500 +


(1,96).(300)], cujo valor ento (31 912km, 33 088km).
Pode-se concluir, assim, que temos uma probabilidade de 0,95 de que o
verdadeiro valor da vida mdia dos pneus estar no intervalo (31 912km,
33 088km)? Rigorosamente no. O valor de um dado real, portanto no
uma varivel aleatria e, portanto, no contexto da estatstica clssica, um
parmetro no tem distribuio de probabilidade nem se pode atribuir uma
probabilidade a ele.
A interpretao de intervalo de confiana a de que se construirmos
100 intervalos baseados em 100 amostras, o valor do parmetro deve estar
dentro de 95 desses intervalos.
152

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

Estimao

Para efeitos prticos, no entanto, no estaremos muito errados ao afirmar


que temos uma confiana aproximada de 95% de que o parmetro esteja
dentro do intervalo construdo a partir de uma nica amostra. Essa interpretao mais do que suficiente para que possamos tomar as decises cabveis ao trabalho realizado.

Intervalo de confiana
para a mdia com desconhecido
Na maior parte das aplicaes prticas, o valor do desvio-padro no conhecido. A forma de se construir o intervalo de confiana da mdia feita atravs da
estimao do valor de . O desvio-padro populacional pode ser estimado pelo
valor do desvio-padro da amostra, S, que a raiz quadrada da varincia. J vimos
as boas propriedades da estatstica S2 como estimador de 2. Elas valem tambm
para S como estimador de .
X
Mas aqui surge um outro problema: vimos que
tem distribuio
n
normal padro e, por isso, quando conhecido, podemos utilizar a estatstica Z na determinao do intervalo de confiana.
At aqui nada sabemos sobre a distribuio de X .
S
X
n
S
Pode-se demonstrar teoricamente que a distribuio da estatstica
n
muito parecida com a distribuio normal e que chamada de distribuio t de Student que devida a um qumico e matemtico ingls chamado
Gosset que a desenvolveu trabalhando na cervejaria Guinness. Student era
o seu pseudnimo, porque a cervejaria no permitia que seus empregados
divulgassem qualquer tipo de estudo.
Quando a amostra for muito grande, os valores da distribuio t se aproximam muito da distribuio normal e, por isso, nessa situao, ser indiferente o uso de uma ou de outra. No caso de amostras menores, necessrio
calcular o valor de t que sempre referenciado pelos graus de liberdade do
erro-padro. No caso da mdia, trabalharemos sempre com n 1 graus de
liberdade. Ento, se a amostra tem tamanho 20, buscamos na tabela E da distribuio t o valor de t correspondente ao nvel de confiana do intervalo
(1 ) com os graus de liberdade correspondentes.
Este material parte integrante do acervo do IESDE BRASIL S.A.,
mais informaes www.iesde.com.br

153

Estimao

Na tabela t verificamos na parte superior as probabilidades chamadas


de bicaudal. Ento, se queremos um intervalo de 95% de confiana, buscamos na tabela o valor de 0,05. Para o caso de uma amostra de tamanho
20, o valor de t0,95 de 2 093. Esse valor pode ser verificado na tabela E.
Veja tambm que para amostras muito grandes o valor de t se aproxima
dos valores de Z da distribuio normal padro. Veja essa indicao na
prpria tabela.
Exemplo:
Vamos considerar o mesmo exemplo da empresa fabricante de pneus
que deseja verificar, atravs de uma amostra de 100 pneus retirada de um
grande lote, a vida mdia deles. No se conhece o desvio-padro da populao. Para a amostra de 100 pneus, a vida til foi determinada como 32 500km
para rodar com segurana, e o desvio-padro amostral foi calculado em
3 000km.
Desejamos construir para todo o lote um intervalo de confiana de 95% no
sentido de que o verdadeiro valor da vida mdia possa estar nesse intervalo.
Para construir esse intervalo que ter como limites X t . SX , sabemos que
S 3 000
X = 32 500 e que S X =
=
= 300. O valor de t pode ser buscado na
100
n
tabela E da distribuio t de Student com 99 graus de liberdade. Esse valor
ser de aproximadamente 1,98.
Portanto, o intervalo construdo ser: [32 500 (1,98).(300), 32 500 +
(1,98).(300)] cujo valor ento (31 906km, 33 094km). Veja que esses valores
no diferem muito do resultado obtido para conhecido.
Mas e se a amostra for pequena, digamos n = 36? Em primeiro lugar, o valor
S
3 000
de S X =
=
= 500. O valor de t para 95% e 35 graus de liberdade
n
36
aproximadamente igual a 2,030. Ento o intervalo ser determinado por:
[32 500 (2,03).(500), 32 500 + (2,03).(500)] = (31 485km, 33 515km).
Veja que nesse caso a preciso da estimativa dos limites do intervalo
ainda menor do que no caso de amostras de tamanho 100 e no caso do desvio-padro conhecido. bastante intuitivo perceber que quanto menor o
nosso nvel de informao menos precisas sero as estimativas.

154

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

Estimao

Intervalo de confiana para outros parmetros


Ficou claro da exposio anterior que para construirmos um intervalo de
confiana precisamos saber quem o estimador do parmetro, quem o
erro-padro da estimativa e qual a estatstica associada ao estimador.
Tendo essas informaes, podemos construir o intervalo de confiana para
o parmetro , sabendo quem , quem o seu erro-padro ou o seu estimador S e qual a estatstica associada. E o intervalo, no geral, ter como
limites:

z ou t S
O quadro seguinte apresenta os principais elementos para a construo
de intervalos de confiana:
Parmetro

Parmetro

Estimador

Erro-padro

Estatstica

Mdia
conhecido

s
n

Mdia desconhecido

S
n

tn-1

Proporo

pq
n

X1 X2

s12 s22
+

n
n

X1 X2

S12 S22
+

n
n

p1 p2

p1q1 p2q2

n + n
1
2

Diferena de
mdias com 1 e
2 conhecidos
Diferena de
mdias com 1
e 2 desconhecidos
Diferena de
propores

1 2

1 2

P1 P2

tn

1 + n2 2

Outros intervalos de confiana podem ser construdos como o intervalo de confiana para a varincia e para a razo de duas varincias, as distribuies de probabilidades associadas a esses intervalos so a distribuio
qui-quadrado e a distribuio F de Fisher-Snedecor, que pelo pouco uso no
contexto deste livro, no foram includas. Qualquer livro de estatstica intermediria traz esses intervalos para o caso de algum leitor necessitar.

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

155

Estimao

Testes de hipteses
Uma outra forma de se fazer inferncia sobre parmetros da populao
com base em dados da amostra atravs da escolha de uma entre duas possibilidades de ao, minimizando o risco na tomada de decises.

Hiptese nula versus hiptese alternativa


Um teste de hiptese estatstica consiste em fazer declaraes sobre o parmetro e submet-las s evidncias amostrais. Duas hipteses ento so
estabelecidas: a hiptese da nulidade ou hiptese nula versus uma hiptese
alternativa.
A hiptese nula denotada por H0, na qual se faz uma suposio sobre o
valor do parmetro, e na hiptese alternativa denotada de H1, que se contrape hiptese nula, podendo-se afirmar que o parmetro diferente, maior
ou menor que o valor estabelecido pela hiptese da igualdade. A representao formal de um teste dada por:
Teste bilateral:
H0: = c
H1: c
Teste unilateral direita:
H0: = c
H1: > c
Teste unilateral esquerda:
H0: = c
H1: < c
A escolha de qual dos trs tipos de teste deve proceder depende da quantidade e qualidade de informao que se tenha antes da coleta dos dados. No
caso de ter informao suficiente sobre a direo do teste, os testes unilaterais
so preferveis aos bilaterais pela maior fora de seu resultado.
No exemplo de abertura do captulo, quando o construtor deseja que
seu concreto tenha resistncia mnima de 200kgf/cm2, o mais adequado o
teste unilateral direita. Reflita sobre essa afirmao.
156

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

Estimao

Erro tipo I e erro tipo II


Como o teste est associado amostragem e, portanto, incerteza, existem quatro possveis resultados. Rejeitar H0 incorreta ou corretamente e no
rejeitar H0 incorreta ou corretamente. O quadro a seguir apresenta essas
quatro possibilidades:
Ao com relao a H0

H0 verdadeira

H0 falsa

No rejeitar H0

Deciso correta

Erro tipo II

Rejeitar H0

Erro tipo I

Deciso correta

O tamanho de cada tipo de erro dado pela sua probabilidade de ocorrncia. A probabilidade de se cometer o erro tipo I chamada de e a probabilidade de se cometer o erro tipo II chamada de .
Para o clculo do tamanho da amostra e para a tomada de decises, no
geral controla-se o erro tipo I por ser considerado o mais grave. Uma analogia pode ser feita em um julgamento. A hiptese nula a de que o ru
inocente. Pergunta-se: o que mais grave, rejeitar H0 quando H0 verdadeira,
que significa condenar um inocente, ou no rejeitar H0 quando ela falsa, que
significa absolver um culpado? Do ponto de vista tico parece ser mais grave
condenar um inocente.
O erro tipo I tambm chamado do erro do consumidor. Um laboratrio
testa um novo medicamento. Rejeitar H0 significa que esse medicamento
melhor do que o que est na praa. Se de fato ele no for, isto , H0 verdadeiro, o consumidor estar sendo prejudicado. O erro tipo II chamado de
erro do produtor, ele ocorre quando o novo medicamento melhor, deveria ser rejeitado o H0, mas, no entanto, os testes no permitem rejeitar H0,
ou seja, o fabricante ter prejuzo por no colocar um novo medicamento
melhor que o tradicional no mercado.

Procedimento de testagem
de hipteses para a mdia populacional
Vamos expor o procedimento de testagem de hipteses atravs de uma
aplicao.
Suponha que a renda mdia das famlias de certo municpio foi determinada atravs do Censo como sendo igual a R$2.000,00 para um particular
ano, e dois anos depois desejamos verificar se houve alguma mudana na
renda familiar atravs de um levantamento amostral.
Este material parte integrante do acervo do IESDE BRASIL S.A.,
mais informaes www.iesde.com.br

157

Estimao

No Brasil, as PNADs, Pesquisas Nacionais por Amostra de Domiclios, cumprem esse papel entre os Censos que so realizados a cada dez anos.
Devemos estabelecer as duas hipteses estatsticas. A hiptese nula de
que a renda mdia familiar continua sendo de R$2.000,00. A hiptese alternativa pode tomar uma de trs formas. Se no h qualquer informao adicional de que a renda mdia possa ter aumentado ou diminudo, toma-se
como alternativa a hiptese de que a renda mdia diferente de R$2.000,00.
Os dados diro se ela aumentou ou diminuiu e se esta mudana foi significativa ou se a diferena pode ter ocorrido por pequenas variaes do acaso.
Se algum novo empreendimento foi realizado no municpio, pode-se
supor que houve um aumento do nvel de emprego, gerando maior renda
mdia familiar. Ento a hiptese alternativa pode ser construda como: a
mdia maior do que R$2.000,00.
Por outro lado, se alguma indstria deixou a cidade ou se houve movimentos migratrios importantes, como a chegada de pessoas de municpios
mais pobres ou a sada de fora de trabalho para centros maiores, a hiptese
alternativa pode ser a de que a mdia menor do que R$2.000,00.
Vamos ficar inicialmente com a primeira possibilidade. Ento, o primeiro
passo o de estabelecer as hipteses estatsticas para um teste bilateral:
H0: = 2 000
H1: 2 000
Suponha ento que uma amostra de 25 famlias foi pesquisada e que a
mdia amostral da renda familiar foi calculada em R$2.200,00. Pergunta-se,
com base nesse dado e sabendo-se que o desvio-padro da renda familiar
foi determinado no censo como tendo o valor de R$500,00, se h uma diferena significativa da renda mdia familiar nesses dois anos.
X
Precisamos agora estabelecer a estatstica do teste. Sabemos que
n
tem distribuio normal padro, Z. Ento:
Z=

158

2.200 - 2.000 200


=
=2
500
100
25

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

Estimao

Precisamos agora verificar qual a rea sob a curva normal padro entre
2 e 2, por ser este um teste bilateral.
P( 2 < Z 2) = F(2) F( 2) = 0,9772 0,0228 = 0,9544. Essa probabilidade est associada a um valor de = 1 0,9544 = 0,0456. Ela chamada de
p-valor.
Para a tomada de deciso, precisamos compreender o significado desse
p-valor. O p-valor a probabilidade de rejeitarmos H0 quando ele verdadeiro. Ou seja, dizemos que 2 000 quando de fato no . Nesse caso temos
uma probabilidade de 4,56% de estarmos errando se afirmarmos que a renda
mdia familiar mudou nesses dois anos.
Por outro lado, podemos dizer que temos uma confiana de 95,44% de
que houve mudana na renda mdia familiar do municpio. O que decidir?
Tradicionalmente, quando o p-valor for menor do que 5%, decidimos por
H1. Nessas circunstncias diramos que houve sim uma mudana na renda.
Esse padro de 5%, porm, no deve ser tomado de forma absoluta. A deciso deve depender das consequncias da gravidade da admisso da possibilidade de se estar cometendo um erro. Se as consequncias forem graves,
talvez o tomador de decises resolva ser mais rigoroso e s admitir H1 se o
p-valor for menor do que 0,01, por exemplo. Isto , ele deseja uma confiana
de no mnimo 99% para rejeitar H0.
Mas se as consequncias da tomada de deciso incorreta forem menos
traumticas, ele pode admitir tomar a deciso com 90% de confiana. Portanto, somente se o p-valor for maior do que 0,10 ele no admitir a hiptese alternativa.
Esse o procedimento-padro para testagem de hipteses estatsticas.

Variaes no procedimento de testagem


de hipteses para a mdia populacional
Nesse procedimento adotado, duas variaes importantes podem acontecer: (I) pode-se supor no exemplo que haveria uma mudana para maior
na renda mdia mensal e um teste unilateral deveria ter sido feito e (II) no
se conhece o valor de .

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

159

Estimao

Analisando os dados para a suposio (I), devemos fazer o teste unilateral.


Ento, as hipteses estatsticas seriam estabelecidas como:
H0: = 2 000
H1: > 2 000
A estatstica do teste a mesma e o seu valor determinado com base nos
valores amostrais foi de Z = 2. Agora (1 ) compreende toda a rea da curva
normal de at 2, que corresponde P( Z 2) = 0,9772. Ento ou o p-valor = 1 0,9772 = 0,0228.
O tomador de decises tem agora um risco menor em afirmar que a renda
familiar aumentou. O seu nvel de confiana subiu para 97,7%. Por que isso
ocorreu no teste unilateral? O nvel de confiana cresceu porque foi agregada maior quantidade de informao atravs do direcionamento do teste. J
supnhamos que haveria aumento da renda.
Para o caso de no se conhecer o valor de , ele deve ser estimado a partir
dos dados da amostra, tendo como estimador o desvio-padro amostral, S.
Vamos supor que o valor calculado de S na amostra tenha sido de R$500,00.
Tomamos o mesmo valor dos primeiros dois exemplos s a ttulo de comparao. H que ficar bem claro que o valor de S da amostra no tem qualquer
correspondncia com algum valor determinado no Censo.
Vamos manter o teste unilateral, a exemplo do ltimo exerccio:
H0: = 2 000
H1: > 2 000

A estatstica do teste agora muda. A distribuio de


no mais
n
normal. Ela uma estatstica t com n 1 graus de liberdade. O valor de t
ser determinado com base em dados amostrais como:
t=

2.200 - 2.000 200


=
=2
500
100
25

O nvel de significncia de t = 2 com 24 graus de liberdade aproximadamente 0,028. Esse valor pode ser determinado por interpolao ou atravs
da ajuda de uma planilha eletrnica para a funo distribuio t.

160

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

Estimao

Com p-valor de 0,028, o nvel de confiana para a rejeio de H0 ser de


97,21%. Observe que esse valor a favor de H1, mas com menos fora do que
o 97,7% para o caso de conhecermos o valor de (ao conhecer o seu valor,
temos mais informao agregada).
Se o teste t tivesse sido realizado para a hiptese bilateral, o p-valor seria
igual a 0,057 e o nvel de confiana, de 94,3%, visto que no teramos nem a
informao de nem a informao fornecida pelo direcionamento do teste.

Testes de hipteses para outros parmetros


Estudamos como realizar testes de hipteses para a mdia populacional
. O procedimento passo a passo seguido foi:
(I) estabelecimento das hipteses estatsticas;
(II) clculo da estatstica do teste ( ) ;

(III) determinao do p-valor.


Esse procedimento vale para as testagens de hiptese sobre os parmetros estabelecidos na tabela a seguir, a exemplo do que foi realizado com
intervalos de confiana.
Parmetro

Parmetro

Estimador

Erro-padro

Estatstica

Mdia conhecido

s
n

Mdia desconhecido

S
n

tn-1

Proporo

pq
n

Diferena de mdias
com 1 e 2 conhecidos

1 2

X1 X2

s12 s22
+

n
n

Diferena de mdias
com 1 e 2 desconhecidos

1 2

X 1 X2

S12 S22
+

n
n

tn1 + n2 2

Diferena de propores

P1 P2

p1 p2

p1q1 p2q2

+
n
n

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

161

Estimao

Para efeito de ilustrao, construiremos um exemplo de testagem de hipteses para a diferena entre duas mdias.
Exemplo:
Uma firma de consultoria foi contratada para verificar se os nveis salariais de
trabalhadores no qualificados de uma indstria eram diferentes com relao
ao sexo. Suponhamos que as mulheres tivessem uma mdia salarial menor que
a dos homens. Uma amostra estratificada proporcional por sexo foi retirada e os
dados resultantes do levantamento amostral seguem na tabela abaixo:
Salrio mdio
amostral

Sexo

Desvio-padro
amostral

Tamanho da amostra

Feminino

X 1 = R$590,00

S1 = R$8,00

n1= 10

Masculino

X 2 = R$600,00

Ss = R$9,00

n2 = 20

Hipteses estatsticas:
H0: 1 = 2
H1: 1 < 2
Essas hipteses podem ser reescritas como:
H0: 1 2 = 0
H1: 1 2 < 0
Estatstica do teste:
t=

( X1 X 2 ) ( 1 2 )
S12 S22
n + n
1
2

Clculo do p-valor:

t com 10+202 = 28 g.l.

t=

(590 600) (1 2 )
82 92
10 + 20

10
= 3, 09
3,233

p-valor = 0,0022
Concluso: com nvel de confiana de 99,8%, podemos concluir que de
fato o nvel salarial das mulheres da indstria pesquisada menor que o
nvel salarial dos homens.
162

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

Estimao

Atividades de aplicao
1. Seja Z ~ N(0,1), calcule:
a) P(0 < Z 1,2)
b) P(0,9 Z 0)
c) P(1,21 Z < 1,75)
d) P(Z > 0,75)
e) P(Z 1,35)
f) P(1,44 < Z < 0)
2. Determinar z0 tal que:
a) P(Z > z0) = 0,5
b) P(Z < z0) = 0,8645
c) P(z0 Z z0) = 0,90
3. Suponha que a renda de uma comunidade possa ser razoavelmente
aproximada por uma distribuio normal com mdia de R$1.500,00 e
desvio-padro de R$300,00.
a) Que porcentagem da populao ter renda superior a R$1.860,00?
b) Em uma amostra de 50 pessoas dessa comunidade, quantos podemos esperar com renda inferior a R$1.050,00?
4. Uma fbrica de automveis calcula que os motores de sua fabricao
tm durao com distribuio normal de mdia 150 000km e desvio-padro de 10 000km.
a) Qual a probabilidade que um automvel, escolhido aleatoriamente entre os fabricados pela empresa, tenha um motor que
dure entre 140 000 e 165 000km?
b) Se a fbrica substitui o motor que apresenta durao inferior
garantia, qual deve ser essa garantia para que a percentagem de
motores substitudos seja inferior a 0,2%?

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

163

Estimao

5. Uma equipe de pesquisadores deseja estudar as condies de vida


dos habitantes dos 15 000 domiclios de uma cidade-dormitrio.
Devido dificuldade de pesquisar todos os domiclios, a equipe optou por selecionar aleatoriamente 36. Uma das variveis de interesse, no estudo em questo, era o nmero de pessoas que residem
em cada domiclio. Para os selecionados foram obtidas as seguintes
informaes sobre o nmero de residentes:

563323334

432743421

544334331

243424535
a) Os pesquisadores desejam saber o nmero mdio de pessoas que
residem em cada domiclio. Como eles podem utilizar as informaes obtidas para estimar esse valor? Determine a estimativa.
b) Qual o estimador utilizado e sua distribuio de amostragem?
c) Considerando que, pelo ltimo censo, o nmero mdio de pessoas
em cada domiclio 5 com varincia 12,96, determine:
I. P(X > 4)
II. P(X 6,5)
III. P(X = 2)
IV. P(3,5 < X 5)

6. Uma amostra consiste em 75 aparelhos de TV adquiridos h vrios


anos. Os tempos de substituio desses aparelhos tm mdia de 8,2
anos e desvio-padro de 1,1 ano.
a) Construa um intervalo de 90% de confiana para o tempo mdio
de substituio de todos os aparelhos de TV daquela poca.
b) Em sua opinio, o resultado poderia ser aplicado aos aparelhos de
TV que esto sendo vendidos atualmente? Justifique.

164

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

Estimao

7. Em um estudo sobre a aplicao do tempo em servios, constatou-se que para uma amostra de 20 administradores selecionados aleatoriamente, o tempo gasto em mdia por dia de trabalho em servios
burocrticos de 2,4 horas com desvio-padro de 1,3 horas. Os dados
apresentam uma distribuio normal. Construa um intervalo de confiana de 95% para o tempo mdio gasto com servios burocrticos
para todos os administradores.
8. Uma amostra aleatria de 625 pessoas, selecionadas de uma populao de 6 500 pessoas, revelou que 440 delas preferiam o detergente de marca X. Atravs dessas informaes, construa um intervalo de
confiana de 90% para a proporo de pessoas na populao que preferem o detergente da marca ABC.
9. Sabe-se que o consumo mensal per capita de um determinado produto tem distribuio normal, com desvio-padro de 2kg. A diretoria
de uma empresa que fabrica esse produto resolveu que o retiraria da
linha de produo se a mdia de consumo per capita fosse menor que
8kg. Caso contrrio, continuaria a fabric-lo. Foi realizada uma pesquisa de mercado tomando-se uma amostra de 36 indivduos e verificou-se que Xi = 284kg, onde Xi representa o consumo mensal do i-simo
indivduo da amostra.
a) Com base nos resultados da amostra e com um risco de 5%, qual
deveria ser a deciso da diretoria?
b) Se a diretoria tivesse fixado = 0,10, a deciso seria a mesma? Justifique sua resposta.
10. Uma companhia de cigarros anuncia que o ndice mdio de nicotina
dos cigarros que fabrica apresenta no mximo 23mg por cigarro. Um
laboratrio realiza 6 anlises, obtendo as seguintes quantidades de
nicotina: 27, 24, 21, 25, 26, 22. Sabe-se que o ndice de nicotina se distribui normalmente. Pode-se aceitar, ao nvel de 10% de significncia,
a afirmao do fabricante?

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

165

Estimao

Gabarito
1.
a) P(0 < Z < 1,2) = P(Z < 1,2) P(Z < 0) = 0,8849 0,50 = 0,4849 ou
48,49%.
b) P(0,9 Z 0) = P(Z < 0) P(Z < 0,9) = 0,50 0,1841 = 0,3159 ou
31,59%.
c) P(1,21 Z < 1,75) = P (Z < 1,75) P(Z < 1,21) = 0,9599 0,8869 =
0,073 ou 7,3%.
d) P(Z > 0,75) = 1 P(Z < 0,75) = 1 0,2266 = 0,7734 ou 77,34%.
e) P(Z 1,35) = 0,9115 ou 91,15%
f) P(1,44 < Z < 0) = P(Z < 0) P(Z < 1,44) = 0,50 0,0749 = 0,4251
ou 42,51%.
2.
a) Na tabela D, encontramos o valor z0 = 0
b) A rea abaixo de z0 0,8645. Logo, a rea entre 0 e z0 ser de 0,8645
0,50 = 0,3645. Sendo assim, na tabela encontraremos z0 = 1,1.
c) A rea abaixo de z0 0,95. Logo, a rea entre 0 e z0 ser de 0,95
0,50 = 0,45. Sendo assim, na tabela encontraremos z0 = + 1,645.
3.
a) = 1.500 e = 300, ento, desejamos encontrar a P(X > 1.860).

X = 1.860 1.500 = 1,2


.

300

Calculamos o valor de Z, em que Z =


Sendo assim, a

P(X >1.860) = P(Z >1,2) ... P(Z >1,2) = 1 P(Z < 1,2) = 1 0,8849 =
0,1151 ou 11,51%.

b) E (pessoas com renda inferior a R$1.050,00) = n. P(X<1.050).

166

A P(X < 1.050) = P( Z <

P Z<

X
), em que P(X<1.050) =

1.0501.500
. Sendo assim, a
300

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

Estimao

P(X < 1.050) = P(Z< 1,5) = 0,067. O nmero esperado de pessoas


com renda inferior a R$1.050,00 ser de 50 x 0,067 = 3,35, ou seja,
trs pessoas.

4. Sendo = 150 000 e = 10 000, ento:


a) P(140 000 X 165 000) + P(X 165 000) P(X 140 000), em que
140 000 150 000
165 000 150 000
z1 =
= 1 e z 2 =
= 1,5, logo a

10 000
10 000
P(140,00 X 165 000) = P(1 Z 1,5) P(Z 1) = 0,9332 0,1587
= 0,7745 ou 77,45%.

5.

b) rea abaixo do valor de X corresponde a 99,8%. rea entre


0 e z0= 0,998 0,50 = 0,498. Sendo assim, o valor de z0 = 2,88 e
dessa forma encontramos o valor de X por meio da expresso:
X 150 000 ou seja, X = 178 800km.
2, 88 =
10 000
a) Baseado no resultado obtido atravs da mdia amostral, essa estimativa ter como valor 3,44.
2
(

).
b) O estimador utilizado X com distribuio normal
n
c) Como 5 e 2 = 12,96, ento:
4 5
= 1, 67, logo, P(X > 4) =
I. P(X > 4) = 1 P(X < 4) z =
12, 96 / 36
P(z > 1,67) = 1 P(z 1,67) = 1 0,0475 = 0,9525 ou 95,25%.
6,5 5
= 2,5 , logo, P(X 6,5) = P(z 2,5)
12, 96 / 36
P(z 2,5) = 0,9938 ou 99,38%.

II. P(X 6,5) z =


III. P(X = 2) = 0, pois numa distribuio contnua no possvel calcular a probabilidade no ponto exato.
3,5 5
e
IV. P(3,5 < X 5) = P(X 5) P(X < 3,5) z1 =
12, 96 / 36
55
z2 =
, ento

12, 96 / 36
z1 = 2,5 e z2 = 0. Dessa forma, P(3,5 < X 5) = P(2,5 < Z 0) =
P(Z 0) P(Z < 2,5) = 0,50 0,0062 = 0,4938 ou 49,38%.

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

167

Estimao

6.
a) n = 75; X = 8,2; S = 1,1. Como o tamanho da amostra maior que
30, utilizaremos a estatstica z para a construo do intervalo de
confiana com 1 = 0,90. O valor de z ser 1,645. Ento:
P( X z.S X X + z.S X ) = 1
P(8,2 (1, 645)

1,1
1,1
8,2 + (1, 645)
) = 0, 90
75
75

P(8,2 0,21 8,2 + 0,21) = 0,90.


P(7,99 8,41) = 0,90

Com 90% de confiana podemos afirmar que os aparelhos de televiso dessa populao tm um tempo mdio para substituio
entre 7,99 anos e 8,41 anos.

b) No, pois o estudo foi restrito aos aparelhos adquiridos h vrios


anos.
7. n = 20; X = 2,4; S = 1,3. Sendo o tamanho da amostra menor do que 30
e o desvio-padro da populao desconhecido, utilizaremos a estatstica "t" de Student para a construo do intervalo de confiana com 1
= 0,95. Nesse caso, o valor de t ser dado por t1 ; n 1 = t0,95; 19 = 2,093. Dessa forma, o intervalo de confiana ser obtido por meio da expresso:
P( X t.S X X + t.S X ) = 1
1,3
1,3
2, 4 + (2, 093)
) = 0, 95
20
20
P(2,4 0,61 2,4 + 0,61) = 0,95

P(2, 4 (2, 093)

P(1,79 3,01) = 0,95.


168

Ou seja, com 95% de confiana podemos afirmar que o tempo mdio


gasto por dia com servios burocrticos dos administradores dessa
populao estar entre 1,79 horas e 3,01 horas.

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

Estimao

f 440
=
= 0,704 e
n 625
z = 1,645. O intervalo de confiana ser dado pela expresso:

8. N = 6.500, n = 625, f = 440 e 1 = 0,90, ento p =


P( p z . S p P p + z . S p ) = 1



p .(1 p ) (N n) . A incluso do fator de correo para


.
n
(N 1)
populaes finitas,. (N n) se deve ao fato de n > 5% da populao
(N 1)
(N). Sendo assim, o valor de S p ser 0,704.(0,296) . (6500 625) =
625
(6500 1)
Nela, Sp =

0,017. Portanto, o intervalo de confiana ser:


P[0,704 (1,645).(0,017) P 0,704 + (1,645).(0,017)] = 0,90
P[0,676 P 0,732] = 0,90.

Ou seja, com 90% de confiana podemos afirmar que, das pessoas dessa
populao, entre 67,6% e 73,2% preferem o detergente da marca ABC.

9.
a) = 5%, n = 36, X =

284
= 7, 89 e conhecido igual a 2.
36

Hipteses:

H0: = 8

H1: < 8

um teste unilateral esquerda, em que o valor crtico de z ser


1,645. A estatstica calculada ser obtida por:
X 7, 89 8
z calc =
=
= 0,33.

2
n
36

Deciso: como o valor de z calculado maior que z crtico, no se


rejeita H0, de maneira que a empresa deve continuar fabricando o
produto.

b) Caso tivssemos = 10%, o valor de z crtico seria igual a 1,282.


Logo, manteramos a deciso encontrada anteriormente para 5%,
ou seja, ainda assim no rejeitaramos H0.
Este material parte integrante do acervo do IESDE BRASIL S.A.,
mais informaes www.iesde.com.br

169

Estimao

10.

170

Dados:

27 + 24 + 21+ 25 + 26 + 22
= 24,17 e S =
6
Hipteses:

H0: 0 = 23

H1: 1 > 23

10%; Como n < 30 e desconhecido, ento utilizaremos a estatstica "t" de Student com cinco graus de liberdade e 90% de confiana
para um teste unilateral. Neste caso o valor de t ser 1,476.

O valor de t calculado ser dado por


24,17 23
t=
= 1,235 .
2,32
6

Deciso: como o valor de t calculado, 1,235, inferior ao valor do t


crtico, 1,476, no se rejeita H0. A afirmao do fabricante de cigarros
procede, portanto, ao nvel de 10% de significncia.

X=

(145)2
6
= 2,32.
5

3531

X 0 , em que
S
n

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

Anlise de regresso
e de correlao

Problema
A inovao tecnolgica tem tido papel central na economia de pases desenvolvidos e de pases que tm crescido a taxas em torno de 10% nas ltimas
dcadas. O investimento em pesquisa e desenvolvimento (p&d) nas empresas
de base tecnolgica tem sido apontado como fator determinante do crescimento desses pases em consequncia tambm da melhoria dos resultados de
produo das empresas de setores estratgicos.
Uma pesquisa foi realizada com 15 empresas que oferecem produtos de
informtica para o mercado. Pretende-se verificar se o resultado da aplicao
de recursos em p&d em um determinado ano implicou em ganhos significativos de receita no ano seguinte.
A tabela a seguir apresenta as aplicaes em milhes de reais dessas empresas e os resultados das receitas no ano seguinte:
Empresa

Faturamento (2007)
em milhes de reais

Gastos em p&d (2006)


em milhes de reais

221

15,0

83

8,5

147

12,0

69

6,5

41

4,5

26

2,0

35

0,5

40

1,5

125

14,0

97

9,0

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

173

Anlise de regresso e de correlao

Empresa

Faturamento (2007)
em milhes de reais

Gastos em p&d (2006)


em milhes de reais

53

7,5

12

0,5

34

2,5

48

3,0

64

6,0

Algumas questes so prontamente apresentadas para o estudo dessa


relao. A primeira verificao a ser realizada se de fato essa relao no
espria, ou seja, se a relao entre investimento em p&d e faturamento pode,
teoricamente, ter uma relao causal. Essa determinao pertence muito
mais ao campo da teoria econmica que ao da teoria estatstica.
Supondo que essa relao causal possa mesmo ser estabelecida, ento
uma srie de questes pode ser levantada para verificao atravs de procedimentos estatsticos como: (I) existe um modelo matemtico que possa
descrever analiticamente essa relao? (II) se o modelo existe, que modelo
melhor ajusta os dados de gastos com p&d e o faturamento de empresas
desse setor? (III) qual a fora dessa relao? Ou de outro modo, qual o
poder do modelo construdo com base nos dados amostrais, para se fazer
previses? (IV) uma vez construdo o modelo, qual a margem de erro das
previses? (V) possvel e necessrio incorporar novas variveis que possam
explicar o faturamento alm dos investimentos em p&d?

Conceitos fundamentais
A tarefa de fazer predies inerente a muitos dos aspectos do gerenciamento e do planejamento da produo de empresas com administrao
profissionalizada. Previses de vendas, compras, custos, produo, contratao de pessoal e aplicao de capital fazem parte dos fundamentos do
planejamento e controle atual das empresas.
Existe uma enormidade de tcnicas matemticas, estatsticas e economtricas para a realizao dessa tarefa de predio. Muitos modelos determinsticos e muitos modelos no determinsticos se propem a realizar essa tarefa.
Uma das ferramentas mais importantes para a construo de modelos que
envolvem certo grau de incerteza, inerente a levantamentos amostrais, o
174

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

Anlise de regresso e de correlao

modelo de regresso, cuja anlise est sempre associada a um processo de


verificao da fora da relao entre as variveis envolvidas e que chamado
de anlise de correlao.
A anlise de regresso consiste em construir uma funo matemtica a
partir de observaes amostrais que relacione uma ou mais variveis independentes a uma varivel dependente. As variaes da varivel dependente so
decorrentes em grande medida das variaes da varivel independente ou
das variveis independentes. Essa funo pode ser uma funo linear ou no,
dependendo da forma da relao entre as variveis.

Anlise de regresso
Consiste fundamentalmente em construir, a partir dos dados amostrais,
uma funo matemtica que relacione uma varivel independente a uma
outra varivel que dependa desta e que chamada de varivel dependente.
A forma geral adotada para descrever essa relao Y = f(X) + , em que X
a varivel independente, Y a varivel dependente e o erro estatstico. Essa
relao possui, portanto, uma componente determinstica f(X) e uma componente aleatria .

Anlise de regresso linear


Se a relao entre a varivel independente e a varivel dependente puder
ser expressa atravs de uma funo que descreva a equao de uma reta,
ento o modelo em questo um modelo de regresso linear. A expresso
geral desse modelo Y = + X + , e so os parmetros do modelo. Como
a construo do modelo baseada em observaes amostrais, esses parmetros nunca so conhecidos. Eles so os verdadeiros valores do modelo do
mundo real, mas, repetindo, nunca so conhecidos. Eles devem, portanto,
ser estimados atravs de estimadores estatsticos, cujas expresses so determinadas por algum critrio de minimizao do erro estatstico e cujos valores so calculados com base nos dados amostrais.

Anlise de regresso no linear


A relao entre duas ou mais variveis nem sempre pode ser expressa
atravs da equao de uma reta, porque essa relao pode ser no linear.
Este material parte integrante do acervo do IESDE BRASIL S.A.,
mais informaes www.iesde.com.br

175

Anlise de regresso e de correlao

Muitos outros modelos, como o exponencial, o potencial, o logstico, entre


outros, podem descrever melhor a relao entre as variveis.

Anlise de regresso simples


Quando somente duas variveis esto envolvidas na construo do modelo,
dizemos que ele um modelo de regresso simples. Assim, s participaro do
modelo uma varivel independente e outra varivel dependente, alm do erro
estatstico, claro. Um modelo de regresso simples pode ser linear ou no. Se
a relao entre as variveis puder ser bem descrita atravs da equao de uma
reta, eles so ditos lineares, conforme definio acima.

Anlise de regresso mltipla


Se a varivel dependente estiver relacionada a mais de uma varivel independente, ento o modelo de regresso conhecido como modelo de regresso mltipla. Da mesma forma que no caso anterior, a relao entre as
variveis independentes e a varivel dependente pode ser linear ou no. No
caso da relao ser linear, o modelo a ser construdo ser o de um plano, no
caso de estarem envolvidas duas variveis independentes, ou de hiperplanos, se mais de duas variveis independentes estiverem sendo utilizadas na
construo do modelo.
Um modelo de regresso linear mltipla, por exemplo, pode ser expresso
atravs da seguinte funo: Y = 0 + 1X1 + 2 X2 + ... + pXp + . A troca de
por 0 feita aqui somente por comodidade de notao. No caso de termos
somente duas variveis independentes, estaremos construindo a equao
de um plano.

Erro estatstico
O termo definido como o erro estatstico ou resduo e a componente
aleatria do modelo. Ele precisa ser bem compreendido. Vale sempre lembrar que esses modelos so construdos atravs de observaes amostrais, e
sempre que se faz um levantamento de dados atravs de amostra os resultados obtidos estaro associados a certo grau de impreciso, que nos modelos estatsticos so considerados de natureza aleatria, ou seja, associados a
certa distribuio de probabilidades.
176

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

Anlise de regresso e de correlao

Os modelos de regresso tm, portanto, uma parte aleatria e outra determinstica. Na parte determinstica esto todas as variveis independentes
que explicam as variaes da varivel dependente. Esse modelo deve ser o
mais esbelto possvel, desde que possa explicar bem a relao entre as variveis independentes e a varivel dependente. Na componente aleatria
esto, alm das variaes devidas ao acaso, todas aquelas variveis que tm
importncia reduzida na explicao da varivel dependente.
Alguns pressupostos so impostos ao erro para que se possa construir o
modelo de regresso atravs dos critrios propostos de reduo de funes
do erro, conforme ser visto mais adiante no captulo.

Critrio dos mnimos quadrados ordinrios


Existem vrios critrios propostos para a minimizao de funes do erro.
O mais comumente utilizado o chamado critrio dos mnimos quadrados ordinrios, que objetiva minimizar a funo 2 (soma dos erros ao quadrado),
conforme ser visto um pouco mais adiante.

Grfico de disperso
Os grficos de disperso apresentam os valores da varivel independente
no eixo (X) das abscissas e o valor da varivel dependente no eixo (Y) das ordenadas. O grfico a seguir o dos dados de investimento das 15 empresas
de informtica em planejamento e desenvolvimento em 2006 relacionados
com o faturamento de cada empresa no ano seguinte. Eles so muito teis
para uma impresso visual do relacionamento entre as variveis.
Grfico de disperso

Faturamento (y)

250
200
150
100
50
0
0

10

12

14

16

Gastos com p&d (x)

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

177

Anlise de regresso e de correlao

Variveis independente e dependente


Conforme exposto acima, a varivel dependente depende da varivel independente, que, a rigor, para a anlise em questo, no depende de ningum.
No caso em tela, o faturamento supostamente depende dos gastos em p&d.
A varivel independente recebe tambm o nome de preditor e sempre
apontado no eixo X das abscissas; a varivel dependente, que recebe o nome
de resposta, sempre plotada no eixo Y das ordenadas.
O que se pode observar inicialmente do grfico que a relao entre X e
Y pode ser aproximada por uma reta que passe pelo meio dos pontos, mas
que no uma relao perfeita, no sentido de que no possvel construirmos uma reta que passe por todos os pontos amostrais. Talvez uma curva
no linear possa tambm ser ajustada aos dados. O estudo da escolha da
forma da curva (ou reta) ser feito mais adiante.

Reta de regresso
Para o caso de um modelo de regresso linear simples, o objetivo ser o de se
construir uma reta que passe pelo meio dos pontos amostrais atravs de uma
expresso determinada pelas estimativas de e de no modelo Y = + X + .
Essa reta ser chamada de reta de regresso e ter como sua expresso analtica a
forma = a + bX, em que o coeficiente linear a o estimador de , o coeficiente
angular b o estimador de e (y chapu), e ser o valor da estimativa do
verdadeiro valor de Y observado na amostra para cada um dos pontos de X. Um
exemplo da construo da reta de regresso dado na figura a seguinte.
O significado desses estimadores e a forma de encontr-los sero estudados em seguida neste captulo.
Reta de regresso

Faturamento (y)

250
200
150
100
50
0
0

10

12

14

Gastos com p&d (x)


178

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

16

Anlise de regresso e de correlao

Construindo a reta de regresso


Como vimos at aqui, um dos objetivos da anlise de regresso a construo de um modelo matemtico que relacione a varivel dependente e a varivel independente. Se o modelo o de regresso linear simples, a tarefa
determinar a equao da reta que melhor aproxime os pontos observados dos
dados amostrais. Vale a pena fazer um pequeno estudo da equao de uma
reta para melhor compreendermos o significado do que iremos construir.

Equao da reta
Uma reta representada atravs da funo Y = a + bX em que a e b so,
respectivamente, o coeficiente linear e o coeficiente angular da reta em questo.
Suponha que a reta em discusso seja dada pela expresso Y = 2 + X. Ento, o
coeficiente linear da reta o valor 2 e o coeficiente angular da reta o valor 1.
Vamos fazer um estudo dessa reta comeando por verificar os valores de Y para
diferentes valores de X. Ento, se Y = 2 + X, os valores a seguir so pontos da reta:
X

O grfico correspondente a estes valores :


Reta y = 2 + x
7
6
5
y

4
3
2
1
0

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

179

Anlise de regresso e de correlao

Com base nesses dados e no grfico, podemos analisar agora o significado do coeficiente linear e o significado do coeficiente angular.
O coeficiente linear a o ponto em que a reta corta o eixo Y. Isso ocorre
para o valor de X = 0. Valores negativos de a implicam que a reta cruza o
eixo Y abaixo da origem enquanto valores positivos de a implicam que a
reta corta o eixo Y acima da origem.
O coeficiente angular b a inclinao da reta, ou seja, o valor da tangente do ngulo formado pelo eixo X e a reta. Ele representa tambm a variao
da varivel Y para cada variao de um ponto de X. Se tomarmos um pequeno
tringulo de base unitria, verificaremos que a altura desse tringulo definido pela reta Y = 2 + X tambm ser unitrio. Tomando ento a razo entre o
cateto oposto e o cateto adjacente desse tringulo retngulo, verificaremos
que a tg = 1. Ou seja, a inclinao da reta igual a 1 e o ngulo correspondente ser de 45.
Valores positivos de b significam que a reta crescer na medida em que
X cresce, e valores negativos de b significam que a reta decrescer em Y
quando X cresce. Ou seja, no primeiro caso a relao entre X e Y de proporcionalidade direta, enquanto no segundo caso a relao entre as variveis
de proporcionalidade indireta.

Significado dos elementos da reta na regresso


Os coeficientes da reta tm a mesma interpretao na regresso que na
geometria analtica adicionado da interpretao do fenmeno em estudo.
Supondo que a reta construda com os dados dos gastos em p&d versus
faturamento das empresas fosse a reta estudada acima, = 2 + X. Algumas
concluses imediatas poderiam ser tomadas, quais sejam:
 se o valor de a igual a 2, isso significa que se no houver qualquer
investimento em p&d, o faturamento esperado ser de duas unidades
monetrias, no nosso caso 2 milhes de reais;
 o valor positivo de a indica que, se no houver investimento em p&d,
ainda assim o faturamento ser positivo. Um valor negativo de a implicaria prejuzo. Vale a pena observar que a interpretao do coeficiente linear pode no ter sentido dependendo do problema tratado;

180

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

Anlise de regresso e de correlao

 para o valor de b, no coeficiente angular, teramos como resultado que


para cada variao de uma unidade de X teramos a variao de uma
unidade em Y. Ou seja, para o investimento de cada real em p&d, o retorno em termos de faturamento seria o do acrscimo de mais um real;
 como o valor de b positivo, significa que a relao entre as variveis
de proporcionalidade direta, isto , o aumento do investimento em
p&d implica aumento do faturamento;
 podemos calcular o valor esperado de faturamento () para certo investimento em p&d (X). Por exemplo, se aplicarmos trs milhes em
p&d, o faturamento esperado ser de = 2 + X, ou = 2 + 3 = 5, cinco
milhes de faturamento.
Um pouco mais adiante determinaremos o valor da reta de regresso para
os dados do problema em questo. Por ora, o objetivo o de compreender o
significado da reta de regresso e de seus elementos.

O mtodo dos mnimos quadrados ordinrios


No grfico a seguir verificamos que para cada valor do eixo X (Xi) h um
correspondente valor de Y (Yi) e um valor de i. Os valores Yi so os verdadeiros valores observados na amostra, os valores de i so os valores estimados
pela substituio do valor de Xi na reta de regresso. A diferena entre o valor
observado e o valor estimado chamado de erro estatstico ou resduo. Assim,
podemos definir cada erro de observao como:
i = Yi i
y

yi

i
yi

x
Este material parte integrante do acervo do IESDE BRASIL S.A.,
mais informaes www.iesde.com.br

181

Anlise de regresso e de correlao

Como a reta de regresso uma reta mdia, de acordo com o que veremos adiante, a soma dos desvios em relao reta de regresso igual a
zero. Isto , i = 0.
O critrio dos mnimos quadrados ordinrios sugere que a determinao
da expresso da reta mdia se d pela minimizao da soma dos quadrados
dos erros. Ou seja, o critrio expresso em termos matemticos :
Min i2
Com esse procedimento, encontra-se a expresso da reta que passa mais
perto do conjunto dos pontos amostrais.
O processo de minimizar a funo (Y )2 = [Y (a + bX)]2 consiste
em encontrar as derivadas parciais desta funo em relao aos coeficientes
a e b e igualar cada expresso resultante a zero. fcil demonstrar que o
resultado dessas derivadas parciais ser o sistema de duas equaes e duas
incgnitas apresentado a seguir:
Y = n a + b X
XY = a X + b X2
Assim, podemos verificar nas equaes supracitadas que os valores de Y,
n, X, XY, e X2 podem ser calculados diretamente dos valores da amostra,
ficando por determinar os valores das incgnitas a e b, que so os valores
dos coeficientes da reta = a + bX, resolvendo assim o nosso problema.
O ltimo sistema de equaes citado pode ser rearranjado de forma a
facilitar o clculo de a e de b atravs das expresses:
a = Y bX

X Y
XY
n

b=
2

(X )
X 2
n

Embora muitos pacotes estatsticos estejam disponveis para o clculo


direto da reta de regresso e mesmo alguns aplicativos do Excel possam
182

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

Anlise de regresso e de correlao

calcular a expresso da reta, conveniente mostrar esse processo para a


compreenso do engenhoso mtodo de construo da equao da reta de
regresso a partir dos dados amostrais.

Determinao da equao
da reta para o problema dos gastos em p&d
A partir dos dados das 15 empresas, vamos determinar atravs do mtodo
de mnimos quadrados ordinrios a equao da reta que explica a relao
entre os gastos em planejamento e desenvolvimento (X) e o faturamento de
empresas de informtica (Y).
A tabela a seguir apresenta os clculos necessrios para a determinao
de a e de b:
Empresa

XY

X2

Y2

15,00

221,00

3 315,00

225,00

48 841,00

8,50

83,00

705,50

72,25

6 889,00

12,00

147,00

1 764,00

144,00

21 609,00

6,50

69,00

448,50

42,25

4 761,00

4,50

41,00

184,50

20,25

1 681,00

2,00

26,00

52,00

4,00

676,00

0,50

35,00

17,50

0,25

1 225,00

1,50

40,00

60,00

2,25

1 600,00

14,00

125,00

1 750,00

196,00

15 625,00

9,00

97,00

873,00

81,00

9 409,00

7,50

53,00

397,50

56,25

2 809,00

0,50

12,00

6,00

0,25

144,00

2,50

34,00

85,00

6,25

1 156,00

3,00

48,00

144,00

9,00

2 304,00

6,00

64,00

384,00

36,00

4 096,00

93,00

1 095,00

10 186,50

Total

895,00 122 825,00

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

183

Anlise de regresso e de correlao

Assim, os valores de a e de b so determinados por:


a = Y bX
Y=

Y = 1 095 = 73
n

X=

15

X = 93 = 6,2
n

15

a = 73 (6,2).b
O clculo de a se completar aps o clculo do valor de b, que dado por:

X Y
XY
n

b=
2

(X )
X 2
n

(93) . (1 095)
15
(93)2
895
15

10 186,5
b)

b = 10,67054
Retornando ao clculo de a, teremos:
a = 73 (6,2).(10,67054) = 6,842651
Portanto, a reta de regresso calculada ter a forma:
= 6,84 + 10,67 X
A partir da qual se podem fazer predies para o valor do faturamento em
relao a um dado valor de investimento em p&d, bastando para isso substituir X pelo valor da aplicao em pesquisa e desenvolvimento. Por exemplo,
se uma empresa fizer um investimento de R$2 milhes em p&d, dever ter
um faturamento de = 6,84 + 10,67 . (2) = 28,18, ou R$28.180.000,00. Observe
que a empresa F que fez um investimento de R$2 milhes teve um faturamento de R$26.000.000,00, bem prximo do esperado.
184

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

Anlise de regresso e de correlao

Essa diferena entre o valor de faturamento estimado para a firma F e o realmente realizado devida ao acaso. Distores maiores poderiam acontecer.
Mais na frente, construiremos intervalos de confiana para essas previses.
Do modelo ainda podemos concluir que se no houver investimento
em p&d, uma empresa do ramo deve ter um faturamento aproximado de
R$6,84 milhes, no caso de X = 0. E ainda, para cada R$1 milho aplicado
em pesquisa e desenvolvimento, o retorno esperado no faturamento de
R$10,67 milhes.

Pressupostos da anlise
de regresso linear (base terica do modelo)
Existem fundamentalmente duas razes para se estudar os pressupostos do modelo de regresso linear simples: (I) quando falamos em erro estatstico, reta mdia, mtodo dos mnimos quadrados ordinrios e outros
termos, que j foram apresentados anteriormente, necessrio que saibamos que h algumas restries no seu uso. O modelo de regresso um
modelo matemtico que objetiva descrever um fenmeno real atravs de
uma expresso matemtica. Naturalmente isso implica em uma simplificao da realidade e por isso fazemos restries para que essa simplificao
funcione matematicamente; (II) a verificao da bondade do ajustamento,
ou de outra forma, da fora de representao do modelo com relao ao
fenmeno que se est estudando implica, entre outros procedimentos, a
realizao de testes de hipteses estatsticas, que s podem ser realizados
se conhecermos a forma da distribuio dos erros e dos valores de Y.

Reta de regresso populacional


O uso de uma varivel para predizer os valores de outra varivel deve ser
visto como um problema de inferncia estatstica. A populao consiste de
todos os pares de observaes das variveis independentes e varivel dependente. As estimativas so realizadas atravs de somente uma amostra
dessa populao. No nosso exemplo selecionamos apenas uma amostra de
15 empresas de informtica que investiram em planejamento e desenvolvimento, mas desejamos fazer predies para todas as empresas com caractersticas semelhantes e muitas delas no foram contempladas na amostra.

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

185

Anlise de regresso e de correlao

O grfico a seguir mostra a relao entre as duas variveis envolvidas:


P(X = x)
y

A figura mostra que a relao populacional entre as duas variveis linear.


Observe que quando o valor do investimento igual a R$2 milhes (X = 2), Y
pode assumir qualquer valor ao longo da reta paralela ao eixo Y. Da mesma
forma para X = 4 ou para outro qualquer valor.
A reta real passa exatamente pelo ponto que representa a mdia da distribuio de Y quando X assume um particular valor, seja ele 2, 4 ou algum outro
valor. Esse fato pode ser representado atravs de uma distribuio condicional de Y dado um particular X [ f(Y/X = 2) ], cuja mdia ou esperana matemtica dada por E(Y/X = 2), justamente o ponto em que a reta corta a paralela
ao eixo Y. Assim, o fenmeno real pode ser representado por uma srie de
distribuies condicionais paralelas.
Essa reta ento chamada de reta de regresso populacional ou reta de
regresso verdadeira.
Para cada valor de X temos ento uma distribuio de probabilidades
associada a esse valor, e como toda distribuio de probabilidades ela tem
uma determinada mdia e um determinado desvio-padro (tem tambm,
claro, uma varincia associada).
A mdia pode ser representada por E(Y/X = x) ou Y.X e o desvio-padro
pode ser representado por Y.X, cujo quadrado a varincia.
186

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

Anlise de regresso e de correlao

A reta Y = + X passa ento pelos diversos valores das mdias das distribuies e os seus parmetros populacionais e devem ser estimados
atravs de dados amostrais.
As distribuies condicionais de probabilidades descrevem a variao de
Y para cada valor de X. A reta que liga os pontos das mdias das distribuies
Y.X a reta de regresso populacional que pode ser mais adequadamente
apresentada como E[Y/X] = + X.

Pressupostos do modelo de regresso linear


Em adio suposio de relao linear entre as variveis, as seguintes
trs suposies esto envolvidas no modelo de regresso linear:
(I) os valores de Y so independentes entre si;
(II) as distribuies de probabilidades condicionais de Y dado X so normais;
(III) os desvios-padres Y.X so iguais para todos os valores de X.
A primeira suposio significa que existe independncia entre as observaes. Isso pode significar, por exemplo, que um baixo valor para Y na primeira observao no implique tambm em baixo valor de Y na segunda.
A segunda suposio significa que para cada valor de X estamos assumindo que os valores de Y so normalmente distribudos em torno de Y.X.
Como veremos adiante, essa suposio til para fazermos declaraes de
probabilidades acerca das estimativas da varivel dependente Y.
A terceira suposio implica que existe a mesma quantidade de variabilidade em torno da reta de regresso para cada valor da varivel independente X. Essa caracterstica chamada de homocedasticidade. Note que somente
Y considerada uma varivel aleatria enquanto X considerado como fixo.
Ento, o valor de Y que est sujeito a erro, uma vez que assumimos que X
conhecido.
Vale a pena observar que nem sempre essas trs suposies so encontradas no mundo real. Mas muitas vezes so aproximadamente verdadeiras,
o que permite o uso do modelo.

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

187

Anlise de regresso e de correlao

Verificao da bondade do modelo


Retornamos ao exemplo da aplicao de recursos em p&d e o faturamento de empresas de informtica. At aqui determinamos a equao da reta de
regresso, verificamos o significado dos coeficientes angular e linear e fizemos uma estimativa pontual de valores de faturamento (Y) para um certo
investimento em p&d (X).
conveniente neste ponto verificar se o modelo ajustado adequado para
descrever a relao entre X e Y. Para esse propsito necessitaremos que os pressupostos expostos acima sejam obedecidos. Faremos essa verificao atravs
de alguns procedimentos. Calcularemos os coeficientes de determinao e de
correlao e faremos testes de hipteses para verificar se o modelo estatisticamente significativo. Testaremos a significncia do coeficiente de correlao e do
coeficiente angular e faremos um teste F para verificar todo o modelo.

Coeficiente de determinao
O clculo do coeficiente de determinao ou coeficiente de explicao ser
til para dizer o quanto da variao de Y pode ser explicado pela variao de
X.
Vamos verificar exatamente de que forma o coeficiente de determinao
(r2) pode auxiliar na tarefa de verificao da bondade do modelo. A interpretao ser feita em termos da variao na varivel dependente Y. A figura
que se segue, em que somente um ponto ser considerado, fornece uma
interpretao grfica da situao.
Y
Y

Y
YY

YY
YY
Y

188

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

Anlise de regresso e de correlao

Nesse contexto, trs pontos e trs distncias sero considerados. O ponto


Y o valor real observado para um determinado X. O ponto o valor da estimativa de Y para o valor de X considerado. E o ponto Y a mdia dos valores de Y. Se o modelo no fosse significativo, a reta de regresso estaria muito
prxima da reta = Y, paralela ao eixo X. Ou seja, a mudana dos valores de X
no implicariam mudanas em Y. Esse conceito ser reforado no estudo do
coeficiente de correlao.
Para o ponto considerado, podemos pensar que a variao total (Y Y)
a soma das parcelas correspondentes variao devida regresso ( Y)
e a variao devida ao acaso (Y ).
A variao devida regresso ou explicada pela regresso pode ser expressa pela diferena ( Y) porque, se no houvesse regresso, o valor de
seria a prpria mdia de Y, Y.
A variao devida ao acaso o erro estatstico ou resduo, conforme
j apresentado anteriormente. Se o modelo fosse determinstico, todos os
pontos estariam sobre a reta de regresso e Y seria igual a , de forma que a
diferena Y seria igual a zero.
Se considerarmos todos os pontos amostrais, poderamos estabelecer
ento a seguinte relao:
(Y Y)2 = ( Y)2 + (Y )2
Variao total, variao explicada e variao no explicada.
2
Y Y

A razo
, entre a variao explicada pela regresso e a variao
2
(Y Y )
total, a proporo da variao que explicada pelo modelo. Esse valor
conhecido como coeficiente de explicao ou coeficiente de determinao.

( Y)2
r2 = Variao explicada =
(Y Y)2
Variao total
Pode-se observar que r2 varia de zero at um.
Se no houver regresso, todos os pontos estimados estaro sobre a reta
Y e, portanto, a soma ( Y)2 ser igual a zero. Se o denominador for igual

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

189

Anlise de regresso e de correlao

a zero, significa que r2 tambm ser igual a zero. Neste caso, a variao total
ser igual somente variao no explicada. Ou, ainda, qualquer variao na
observao de Y ser devida ao acaso e, portanto, o modelo matemtico no
explicar nada. Esse o menor valor possvel para r2. O modelo explica zero
por cento da variao de Y.
Por outro lado, se todos os pontos de Y observados estiverem sobre a
reta, no h nenhuma variao devida ao acaso. Toda variao explicada
pelo modelo e nesse caso a variao explicada igual variao total e assim
r2 = 1. Ou seja, 100% da variao total devida regresso.
Uma forma simplificada de realizar esse clculo atravs da expresso:
a Y + b XY n (Y )2

r2 =
2
2
Y n (Y )

No nosso exemplo,
(6, 84).(1 095) + (10, 67).(10 186,5) - (15).(73)2 36 244,75

=
= 0, 845
r =
2
(122 825) - (15).(73)
42 890

Assim, conclumos que 84,5% da variao de Y (faturamento) explicada por X (gastos em p&d). Os outros 15,5% da variao do faturamento so
explicados por outras variveis, como investimento em propaganda, concorrncia de empresas estrangeiras etc. Podemos tambm afirmar que o
modelo de regresso construdo tem alto poder de explicao. Esta ltima
afirmao pode ser confirmada atravs da Anlise de Correlao e da testagem de hipteses que sero feitas na sequncia.
Quando a populao pequena, o coeficiente de determinao pode ser
afetado pelo tamanho da amostra. Nesse caso, sugere-se o clculo do coeficiente de determinao ajustado. Lembrar que uma regresso realizada somente com dois pontos amostrais ter sempre coeficiente de determinao
igual a 1.
A expresso para o clculo do coeficiente de determinao ajustado
dada a seguir:

190

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

Anlise de regresso e de correlao

(n(n
* *
1)1)
2 2
r 2r 2= =11
. 11r r
2
2

n
n
)
)
(
(

No nosso problema, o valor do coeficiente de determinao ajustado igual


a 0,833, que no difere de forma substancial do primeiro valor encontrado.

Coeficiente de correlao
O coeficiente de correlao uma medida da relao entre as variveis X e
Y. Ele varia entre os valores 1 e 1, passando pelo zero.
Se no existe correlao entre as variveis X e Y, o coeficiente de correlao ser igual a zero. Se a relao entre X e Y for perfeita, isto , se todos
os pontos amostrais estiverem sobre a reta de regresso, o coeficiente de
variao ter valor igual a 1, no caso de a correlao ser perfeita e positiva,
ou seja, se o crescimento de X implicar crescimento de Y e ser igual a 1
se a correlao perfeita for negativa, ou seja, o crescimento de X implica em
decrescimento de Y.
No caso da correlao igual a zero, no haver tendncia da reta, ela ser
paralela ao eixo X. O diagrama de disperso se constituir de uma nuvem
de pontos em torno da reta de regresso paralela ao eixo X, conforme o
seguinte grfico.

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

191

Anlise de regresso e de correlao

Se a correlao for perfeita e positiva, o coeficiente de correlao ser


igual a 1.

Se a correlao for perfeita e negativa, o coeficiente de correlao ser


igual a 1.

O que ocorre na prtica, no entanto, que o coeficiente de correlao


assume valores intermedirios entre os extremos expostos acima. No h uma
regra nica para se avaliar a fora da relao atravs do coeficiente de correlao. No entanto, h indicativos que podem orientar a deciso sobre a fora de
uma relao. Uma proposta bem aceita a presente na seguinte tabela:
Coeficiente de correlao (r)

192

Fora da relao

r=0

No h correlao

0 < |r| 0,5

Correlao fraca

0,5 < |r| 0,75

Correlao moderada

0,75 < |r| 0,9

Correlao forte

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

Anlise de regresso e de correlao

Coeficiente de correlao (r)

Fora da relao

0,9 < |r| < 1

Correlao muito forte

r =1

Correlao perfeita

Os grficos a seguir apresentam algumas das situaes expostas na tabela:


Correlao forte e negativa

Correlao forte e positiva

Correlao no linear

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

193

Anlise de regresso e de correlao

Correlao fraca e positiva

Como vimos, o coeficiente de correlao pode ser calculado como a raiz


quadrada do coeficiente de determinao. Uma outra forma de determinar diretamente o valor do coeficiente de correlao atravs da expresso:

XY

r=

( X) . ( Y )

( X)
(X )

( Y)
(Y )

Uma forma tecnicamente mais avanada para verificar se existe relao


entre as variveis em estudo atravs da realizao de um teste de hipteses sobre o coeficiente de correlao populacional representado pela letra
grega ro (). O coeficiente de correlao amostral r.
As hipteses nula e alternativa podem ser expressas como segue:
H0: = 0 (no h correlao linear significativa)
H1: 0 (correlao linear significativa)
A estatstica do teste dada por:
t=

(1 r )
2

(n 2)

que tem distribuio t de Student com n-2 graus de liberdade.


194

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

Anlise de regresso e de correlao

Para o problema do investimento em planejamento e desenvolvimento


em estudo neste captulo, verificamos que o valor do coeficiente de correlao de 0,919, portanto, um valor que revela uma relao positiva e forte
entre as variveis em estudo. Uma observao importante a ser feita neste
ponto o de que o sinal do coeficiente angular tem que ser o mesmo do
coeficiente de correlao. Neste caso, ambos positivos indicando uma correspondncia direta entre as variveis investimento em p&d e faturamento
de empresas de informtica.
A estatstica do teste de significncia para o coeficiente de correlao :
t=

0, 919

(1 0, 845)
(15 2)

= 8, 42

Esse valor de t, com 13 graus de liberdade, est associado a um nvel de


significncia de 0,0000013. Ou seja, podemos afirmar com nvel de confiana
de praticamente 100% que o coeficiente de correlao diferente de zero,
ou ainda, a correlao entre as variveis X e Y altamente significativa.
Uma observao de ordem terica importante deve ser feita nesse ponto.
Embora na regresso somente a varivel Y seja uma varivel aleatria, portanto X fixo, na Anlise de Correlao supe-se que ambas as variveis
sejam variveis aleatrias. Se X de fato fixado de antemo, no se aplica
essa testagem de hipteses e a avaliao deve ser feita somente para o valor
de r e de r2.
Um outro alerta deve ser feito: a testagem de hipteses para o coeficiente
de correlao feita somente para a hiptese = 0, que pode ser bilateral
ou unilateral, mas no pode ser feita para qualquer outro valor diferente de
zero. Assim, muitas vezes o teste resulta em significncia do coeficiente de
correlao, mas ele pode ainda ser fraco e, portanto, dependendo de sua
dimenso, vale a pena fazer a anlise somente atravs do coeficiente de
determinao.

Teste de hipteses
para o coeficiente angular da reta ()
Para que o modelo de regresso seja significativo, o ngulo entre a reta de
regresso e o eixo X tem que ser bem maior do que zero, ou, de outra forma, a
Este material parte integrante do acervo do IESDE BRASIL S.A.,
mais informaes www.iesde.com.br

195

Anlise de regresso e de correlao

sua tangente representada pelo coeficiente angular tem que ser bem maior
que zero. Vimos que quando a reta de regresso paralela ao eixo X no h
correlao entre as variveis independente e dependente, isto , a variao
dos valores de X no implica nenhuma ou pouca variao dos valores de Y.
Dessa forma, uma maneira de verificar se o modelo de regresso significativo atravs da verificao da seguinte hiptese estatstica:
H0: = 0
H1: 0
A estatstica associada a esse teste :

t=

(b )
Sb

Esta tem distribuio t de Student com n 2 graus de liberdade, em que Sb


o erro-padro da estimativa do coeficiente de regresso e dado por:

Sb =

SY,X

(X X )

E Sy.x, o desvio-padro dos resduos o estimador de Y.X, o desvio-padro


da reta de regresso populacional. Sy.x o erro-padro da estimativa da varincia condicional dos valores de Y em torno da reta de regresso populacional. Sua expresso :

(Y Y )

SY,X =

n2

Ou de uma forma mais simples de clculo:


Y 2 a Y b XY
SY,X =
n2

196

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

Anlise de regresso e de correlao

importante distinguir a diferena entre SY.X de SY e de SX. O SY.X diz respeito disperso dos dados em relao reta de regresso e, portanto, envolve as
duas variveis Y e X. A soma (Y )2, pode ser expressa como (Y (a + bX))2
uma vez que = a + bX.
J SY diz respeito disperso dos valores de Y em torno de sua mdia e sua
expresso :

(Y Y )

SY =

n 1

Da mesma forma, SX diz respeito disperso dos valores de X em torno de


sua mdia e sua expresso :

(X X )

SX =

n 1

Para o problema do investimento em p&d buscaremos investigar se o


modelo proposto significativo atravs do teste de hipteses apresentado
anteriormente:
H0: = 0
H1: 0
Atravs da estatstica:
t=

(b )
Sb

Como vimos, a estatstica acima tem distribuio t de Student com


(n2) graus de liberdade.
Para determinao de t, devemos calcular o valor de Sb:
SbSS=
b b==

SY,X
SSY,XY,X

= ==

SY,X
SSY,XY,X

.X
n(n(
) X) )
X XX
Xn(
(X((XXXX)X))

2 22

2 22

2 22

Onde,
Y 2 a Y b XY
SY,X =
n2
Este material parte integrante do acervo do IESDE BRASIL S.A.,
mais informaes www.iesde.com.br

197

Anlise de regresso e de correlao

Retomando os dados originais, temos:


Empresa

XY

X2

Y2

15,00

221,00

3 315,00

225,00

48 841,00

8,50

83,00

705,50

72,25

6 889,00

12,00

147,00

1 764,00

144,00

21 609,00

6,50

69,00

448,50

42,25

4 761,00

4,50

41,00

184,50

20,25

1 681,00

2,00

26,00

52,00

4,00

676,00

0,50

35,00

17,50

0,25

1 225,00

1,50

40,00

60,00

2,25

1 600,00

14,00

125,00

1 750,00

196,00

15 625,00

9,00

97,00

873,00

81,00

9 409,00

7,50

53,00

397,50

56,25

2 809,00

0,50

12,00

6,00

0,25

144,00

2,50

34,00

85,00

6,25

1 156,00

3,00

48,00

144,00

9,00

2 304,00

6,00

64,00

384,00

36,00

4 096,00

93,00

1 095,00

10 186,50

Total

Y=

895,00 122 825,00

Y = 1 095 = 73

X=

15

X = 93 = 6,2
n

15

a = 6,842651
b = 10,67054

198

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

Anlise de regresso e de correlao

Assim,
122
122
122
122
825
825
825
825

(6,
(6,
(6,
842651).(1
(6,842651).(1
842651).(1
842651).(1
095)
095)
095)
095)

(10,
(10,
(10,
(10,
67054)(10
67054)(10
67054)(10
67054)(10
186,5)
186,5)
186,5)
. 186,5)
SY,X
SSY,X
SY,X
=
==
= ===510,53
510,53
510,53
510,53
= =22,59483
==22,59483
22,59483
22,59483
Y,X=
1515
15

15
2222
Sb =

t=

22,5949
895 15.(6,2)2

= 1,266

10, 67054
= 8, 427
1,266

O nvel de significncia (p valor) correspondente a t = 8,427 com 13


graus de liberdade igual a 0,00000126, altamente significativo.
Conclumos, ento, com 99,99% de confiana, que o modelo proposto
representa bem a relao entre as variveis investimento em p&d e faturamento de empresas de informtica.
Complementarmente podemos construir um intervalo de confiana para
o parmetro , escolhendo o nvel de confiana e o valor de t associado a
esse nvel fazendo b t Sb.
Se quisermos construir um intervalo de confiana de 95% para , verificamos que para 13 graus de liberdade o valor de t ser igual a 2,16, obtemos para
b t Sb os valores 10,67 (2,16)(1,266) =10,67 2,74. Assim, temos ento uma
confiana de 95% que o verdadeiro valor de estar entre 7,93 e 13,41.

Anlise de varincia da regresso


Um procedimento semelhante a testar a significncia de no modelo de
regresso linear simples a realizao da Anlise de Varincia da Regresso,
que consiste fundamentalmente em trabalhar com o modelo de variaes
dado pela expresso a seguir, j estudada no contexto do coeficiente de
determinao:

(Y Y ) = (Y Y ) + (Y Y )
2

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

199

Anlise de regresso e de correlao

Variao total/variao explicada/variao no explicada


Fonte de
variao

Graus de
liberdade

Modelo

Resduo

n2

Total

Soma de
quadrados

Y Y

Quadrados
mdios
2
(Y Y )

Q.M. Modelo
Q.M. Resduo

1
2

(Y Y )

2
Y Y

Estatstica F

n2

(Y Y )

n1

Os graus de liberdade do modelo correspondem ao nmero de variveis


independentes (no caso da regresso linear simples, um s X). Os graus de
liberdade total so sempre iguais a n 1 e o do resduo a diferena entre o
g.l. total e g.l. do modelo.
Substituindo os valores derivados dos dados na tabela, teremos:
Fonte de
variao

Graus de
liberdade

Soma de
quadrados

Quadrados
mdios

Modelo

36 253,16

36 253,16

Resduo

13

6 636,84

510,53

Total

14

42 890,00

Estatstica F
71,011

O nvel de significncia da estatstica F para 1 e 13 graus de liberdade de


0,00000126. Altamente significativo. Ento o teste F para o modelo conduz
concluso de que o modelo como um todo explica muito bem a relao
entre as duas variveis consideradas.
Nesse ponto, algumas observaes so pertinentes:
 o nvel de significncia para o teste t para o parmetro (0,00000126)
exatamente igual ao nvel de significncia para o teste F da Anlise
de Varincia;
 o valor de F = 71,011 o quadrado do valor de t = 8,427. Isso sempre
ocorre na regresso linear simples. Este um resultado terico de operaes entre distribuies de probabilidade, cuja complexidade est
fora do contexto do presente livro;

200

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

Anlise de regresso e de correlao

 o valor do Quadrado Mdio do Resduo, 510,53 igual ao quadrado


do valor do quadrado do erro-padro da estimativa SY,X = 22,59483.
Esse resultado no coincidncia. O quadrado de SY,X a estimativa
da variabilidade total.

Predio e intervalos de predio


Como vimos anteriormente, a reta de regresso um instrumento til
para se fazer predies. Ou seja, podemos, atravs da substituio de valores de X na equao da reta = a + bX, fazer previses para valores da
varivel dependente Y. No exemplo das empresas de informtica, podemos
fazer predies de faturamento tendo em conta os investimentos em pesquisa e desenvolvimento.
Como trabalhamos em um ambiente de incerteza, a estimativa pontual no
uma informao suficiente. Em torno dos valores estimados pontualmente
devemos construir intervalos nos quais os parmetros devam pertencer.
Duas situaes ento so postas. A primeira diz respeito construo
de um intervalo de confiana para a mdia populacional do faturamento das
empresas de informtica e a segunda, construo de um intervalo de confiana para uma empresa individual. A diferena que na primeira estimativa
estamos preocupados com o faturamento mdio de empresas que investem
certo valor fixado em p&d. No segundo caso, o foco para uma particular
empresa.

Intervalo de confiana da
estimativa da mdia populacional
Assumindo que a varivel dependente normalmente distribuda, podemos calcular os limites superior e inferior de um intervalo de confiana para a
mdia de Y atravs de:
Y tSY
SY
e t o valor da estatstica da distribuio t de Student
n
com n 1 graus de liberdade.
Em que SY =

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

201

Anlise de regresso e de correlao

(Y Y )

O valor de SY dado pela expresso SY =

, conforme visto
n 1
anteriormente. Esse valor pode ser calculado mais facilmente atravs da
Y 2 n . (Y )2
.
expresso SY =
n 1
No exemplo das empresas de informtica, temos:
Ybarra = 73
SY =

12 2825 15.(73)2
= 55,34954
14

Em que SY =

SY 55,34954
=
= 14,29
15
n

T13g.l. = 2,160
O intervalo de confiana de 95% ser ento:
73 (2,160) . (15,3512) = 73 33,16
Os limites inferior e superior para a predio da mdia sero, respectivamente, 39,84 e 106,16. O valor mdio esperado de faturamento ser de R$73
milhes, podendo-se afirmar com 95% de confiana que esse valor no ser
inferior a R$39,84 milhes nem superior a R$106,16 milhes.
Se substituirmos em = 6,842651 + 10,67054X a reta de regresso X pelo
valor de sua mdia X, teremos = 6,842651 + (10,67054)(6,2) = 73. Esse fato
decorre da propriedade que a reta de regresso passa pelo ponto (X, Y).
Esses so os limites da previso mdia de faturamento para todas as empresas do setor.
Mas se um grupo de empresas investe em p&d um outro valor de X0, digamos R$2 milhes, ou se uma empresa investe em mdia esse valor, o intervalo de confiana para o seu faturamento ser dado por:
t S
Em que o erro-padro da estimativa S, ser dado por:
2
1
+ (X 0 X )
n
SY = SY,X .
( X X )2

202

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

Anlise de regresso e de correlao

Aplicando os valores do problema das firmas de informtica para X0 = 2


nessas expresses, obteremos:
= 6,842651 + 10,67054X = = 6,842651 + 10,67054.(2) = 28,18373
Uma vez que SY,X = 22,59483 e que S pode ser expresso pela expresso
mais conveniente:

SY = SY,X

2
1
+ (X 0 X )
n
X 2 n . ( X )2

Temos que:

SY = 22,59483.

2
1
+ (2 6,2)
15

895 (15) . (6,2)2

= 5,328328

Sabendo que t13g.l. = 2,160, o intervalo de confiana de faturamento para a


mdia de investimento de R$2 milhes, ter como limites inferior e superior
os seguintes valores:
Limite inferior ser igual a 28,18 (2,160) . (6,64) = 28,18 14,34 =
13,84, e o limite superior ser igual a 28,18 + (2,160) . (6,64) = 28,18 +
14,34 = 42,52.
Conclumos, ento, que em mdia o faturamento das empresas que investirem R$2 milhes em p&d ser de aproximadamente R$28,18 milhes, e
ainda podemos afirmar com 95% de confiana que esse valor no ser inferior a R$13,84 milhes nem superior a R$42,52 milhes.

Intervalo de confiana
da estimativa de um valor individual de Y
Se estivermos interessados na estimativa de faturamento de uma nica
empresa que aplicou R$2 milhes em p&d, a forma de determinar o intervalo
de confiana muda um pouco. Na realidade, o que muda no procedimento
o clculo do erro-padro da estimativa, que ser dado por:

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

203

Anlise de regresso e de correlao

SY individual = SY,X

2
1
1+ + (X 0 X )
n
( X X )2

No nosso problema:
2
1
1+ + (2 6,2)
15
= 5, 4767
SY = 22,59483.
895 15.(6,2)2

Mais uma vez utilizando t13g.l. = 2,160, o intervalo de confiana de faturamento de uma empresa individual para um investimento de R$2 milhes
ter como limites inferior e superior os seguintes valores:
Limite inferior ser igual a 28,18 (2,160) . (5,4767) = 28,18 11,83 =
16,35, e o limite superior ser igual a 28,18 + (2,160) . (5,4767) = 28,18 +
11,83 = 40,01.
Observe que o intervalo de confiana para a estimativa do faturamento
de uma empresa individual muito mais extenso do que o intervalo para a
estimativa da mdia do investimento, isso porque para a mdia de investimento temos mais informao do que no caso de uma empresa individual.
O grfico a seguir ilustra as duas situaes.
y

y
mdia

uma empresa

Atividades de aplicao
1. Uma cadeia de supermercados financiou um estudo dos gastos com
mercadorias para famlias de quatro pessoas. A pesquisa se limitou a
famlias com renda entre R$10.000,00 e R$20.000,00. Obteve-se a seguinte equao:
Y = 400 + 0,10X
204

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

Anlise de regresso e de correlao

Suponha que a equao proporcione um ajustamento razoavelmente


bom e que os dados tenham sido obtidos por mtodos de amostragem aleatria.
a) Estime a despesa de uma famlia de quatro pessoas com renda
anual de R$15.000,00.
b) Um dos vice-presidentes da empresa ficou intrigado com o fato de
a equao aparentemente sugerir que uma famlia com R$4.000,00
de renda no gaste nada em mercadorias. Qual a explicao?

2. Uma determinada ao apresentou o seguinte comportamento durante a ltima semana:


Preo
Dia

21,00
Seg

20,94
Ter

20,78
Qua

20,56
Qui

20,49
Sex

a) Ajuste a equao de regresso linear para o valor da ao no decorrer da semana.


b) Determine estatisticamente qual o valor da ao para a tera-feira
da prxima semana.
3. Uma empresa, estudando como varia a demanda de certo produto (em
unidades) em funo do preo de venda (em R$), obteve a seguinte equao: = 1 028,07 2,90X . Por meio dessa informao, deseja-se saber:
a) Qual a influncia do preo sobre a demanda, ou seja, o que ocorre
com a demanda a cada R$1,00 de aumento no preo?
b) Ao preo atual de venda, a quantidade mensal absorvida pelo mercado de 80 unidades menos que a capacidade atual de produo
da empresa. Estime em quanto deve ser reduzido o preo de venda para que a empresa possa utilizar toda a capacidade total.
4. Um jornal quer verificar a eficcia de seus anncios na venda de carros
usados. A tabela a seguir mostra o nmero de anncios publicados e o
correspondente nmero de carros vendidos por seis companhias que
usaram apenas esse jornal como veculo de propaganda.

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

205

Anlise de regresso e de correlao

Companhia

Anncios

74

45

48

36

27

16

139

108

98

76

62

57

Carros vendidos

a) Ajuste a equao de regresso para o modelo.


b) Interprete o coeficiente de explicao R2.
c) Para uma venda de 200 carros, quantos anncios devem ser feitos,
segundo o modelo?
d) Como voc argumentaria com a companhia F para que ela aumentasse o nmero de anncios?
5. Num estudo realizado com famlias domiciliadas em So Paulo, verificou-se, para as variveis gastos com seguro de vida e nmero de filhos, uma correlao 0,92. Essa informao indica que:
a) a correlao forte entre os gastos com seguro e o nmero de filhos.
b) a correlao negativa entre os gastos com seguro e o nmero
de filhos.
c) no h correlao entre os gastos com seguro e o nmero de filhos.
d) a correlao moderada entre os gastos com seguro e o nmero
de filhos.
6. Uma grande rede de supermercados deseja determinar o efeito de
uma promoo sobre a concorrncia relativa. Para isso, obteve dados
de 15 estados sobre as despesas de promoes relativas de um concorrente vulto (despesas do concorrente = 100) e sobre as vendas desse concorrente (vendas do concorrente = 100).
a) Voc deve informar ao gerente se h alguma relao entre as despesas promocionais relativas e as vendas relativas.
b) Ajuste a equao de regresso das vendas com as despesas promocionais.
c) Se a companhia igualasse o concorrente em termos de despesas
promocionais (se as despesas promocionais fossem 100), qual seria a venda relativa da companhia?
d) Interprete o r2 resultante.
206

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

Anlise de regresso e de correlao

Tabela 1 Despesa promocional relativa e vendas relativas por estado


Estado Despesa promocional relativa

Vendas relativas

95

98

92

94

103

110

115

125

77

82

79

84

105

112

94

99

85

93

10

101

107

11

106

114

12

120

132

13

118

129

14

75

79

15

99

105

Gabarito
1.
a) P(0 < Z < 1,2) = P(Z < 1,2) P(Z < 0) = 0,8849 0,50 = 0,4849 ou
48,49%.
b) P(0,9 Z 0) = P(Z < 0) P(Z < 0,9) = 0,50 0,1841 = 0,3159 ou
31,59%.
c) P(1,21 Z < 1,75) = P (Z < 1,75) P(Z < 1,21) = 0,9599 0,8869 =
0,073 ou 7,3%.
d) P(Z > 0,75) = 1 P(Z < 0,75) = 1 0,2266 = 0,7734 ou 77,34%.
e) P(Z 1,35) = 0,9115 ou 91,15%
f) P(1,44 < Z < 0) = P(Z < 0) P(Z < 1,44) = 0,50 0,0749 = 0,4251
ou 42,51%.
Este material parte integrante do acervo do IESDE BRASIL S.A.,
mais informaes www.iesde.com.br

207

Anlise de regresso e de correlao

2.
a) Na tabela D, encontramos o valor z0 = 0
b) A rea abaixo de z0 0,8645. Logo, a rea entre 0 e z0 ser de 0,8645
0,50 = 0,3645. Sendo assim, na tabela encontraremos z0 = 1,1.
c) A rea abaixo de z0 0,95. Logo, a rea entre 0 e z0 ser de 0,95
0,50 = 0,45. Sendo assim, na tabela encontraremos z0 = + 1,645.
3.
a) = 1.500 e = 300, ento, desejamos encontrar a P(X > 1.860).

X = 1.860 1.500 = 1,2


.

300

Calculamos o valor de Z, em que Z =


Sendo assim, a

P(X >1.860) = P(Z >1,2) ... P(Z >1,2) = 1 P(Z < 1,2) = 1 0,8849 =
0,1151 ou 11,51%.

b) E (pessoas com renda inferior a R$1.050,00) = n. P(X<1.050).


A P(X < 1.050) = P( Z <

P Z<

X
), em que P(X<1.050) =

1.0501.500
. Sendo assim, a
300
P(X < 1.050) = P(Z< 1,5) = 0,067. O nmero esperado de pessoas
com renda inferior a R$1.050,00 ser de 50 x 0,067 = 3,35, ou seja,
trs pessoas.

4. Sendo = 150 000 e = 10 000, ento:


a) P(140 000 X 165 000) + P(X 165 000) P(X 140 000), em que
140 000 150 000
165 000 150 000
z1 =
= 1 e z 2 =
= 1,5, logo a

10 000
10 000
P(140,00 X 165 000) = P(1 Z 1,5) P(Z 1) = 0,9332 0,1587
= 0,7745 ou 77,45%.
b) rea abaixo do valor de X corresponde a 99,8%. rea entre
0 e z0= 0,998 0,50 = 0,498. Sendo assim, o valor de z0 = 2,88 e
dessa forma encontramos o valor de X por meio da expresso:
X 150 000 ou seja, X = 178 800km.
2, 88 =
10 000

208

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

Anlise de regresso e de correlao

5.
a) Baseado no resultado obtido atravs da mdia amostral, essa estimativa ter como valor 3,44.
2
b) O estimador utilizado X com distribuio normal ( ).
n
2
c) Como 5 e = 12,96, ento:
4 5
= 1, 67, logo, P(X > 4) =
I. P(X > 4) = 1 P(X < 4) z =
12, 96 / 36
P(z > 1,67) = 1 P(z 1,67) = 1 0,0475 = 0,9525 ou 95,25%.
6,5 5
= 2,5 , logo, P(X 6,5) = P(z 2,5)
12, 96 / 36
P(z 2,5) = 0,9938 ou 99,38%.

II. P(X 6,5) z =


III. P(X = 2) = 0, pois numa distribuio contnua no possvel calcular a probabilidade no ponto exato.
3,5 5
e
IV. P(3,5 < X 5) = P(X 5) P(X < 3,5) z1 =
12, 96 / 36
55
z2 =
, ento

12, 96 / 36
z1 = 2,5 e z2 = 0. Dessa forma, P(3,5 < X 5) = P(2,5 < Z 0) =
P(Z 0) P(Z < 2,5) = 0,50 0,0062 = 0,4938 ou 49,38%.
6.
a) n = 75; X = 8,2; S = 1,1. Como o tamanho da amostra maior que
30, utilizaremos a estatstica z para a construo do intervalo de
confiana com 1 = 0,90. O valor de z ser 1,645. Ento:
P( X z.S X X + z.S X ) = 1
P(8,2 (1, 645)

1,1
1,1
8,2 + (1, 645)
) = 0, 90
75
75

P(8,2 0,21 8,2 + 0,21) = 0,90.


P(7,99 8,41) = 0,90

Com 90% de confiana podemos afirmar que os aparelhos de televiso dessa populao tm um tempo mdio para substituio
entre 7,99 anos e 8,41 anos.
Este material parte integrante do acervo do IESDE BRASIL S.A.,
mais informaes www.iesde.com.br

209

Anlise de regresso e de correlao

b) No, pois o estudo foi restrito aos aparelhos adquiridos h vrios


anos.
7. n = 20; X = 2,4; S = 1,3. Sendo o tamanho da amostra menor do que 30
e o desvio-padro da populao desconhecido, utilizaremos a estatstica "t" de Student para a construo do intervalo de confiana com 1
= 0,95. Nesse caso, o valor de t ser dado por t1 ; n 1 = t0,95; 19 = 2,093. Dessa forma, o intervalo de confiana ser obtido por meio da expresso:
P( X t.S X X + t.S X ) = 1
1,3
1,3
2, 4 + (2, 093)
) = 0, 95
20
20
P(2,4 0,61 2,4 + 0,61) = 0,95

P(2, 4 (2, 093)

P(1,79 3,01) = 0,95.


Ou seja, com 95% de confiana podemos afirmar que o tempo mdio


gasto por dia com servios burocrticos dos administradores dessa
populao estar entre 1,79 horas e 3,01 horas.
f 440
=
= 0,704 e
n 625
z = 1,645. O intervalo de confiana ser dado pela expresso:

8. N = 6.500, n = 625, f = 440 e 1 = 0,90, ento p =


P( p z . S p P p + z . S p ) = 1



p .(1 p ) (N n) . A incluso do fator de correo para


.
n
(N 1)
populaes finitas,. (N n) se deve ao fato de n > 5% da populao
(N 1)
(N). Sendo assim, o valor de S p ser 0,704.(0,296) . (6500 625) =
625
(6500 1)
Nela, Sp =

0,017. Portanto, o intervalo de confiana ser:


P[0,704 (1,645).(0,017) P 0,704 + (1,645).(0,017)] = 0,90
P[0,676 P 0,732] = 0,90.

210

Ou seja, com 90% de confiana podemos afirmar que, das pessoas dessa
populao, entre 67,6% e 73,2% preferem o detergente da marca ABC.

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

Anlise de regresso e de correlao

9.
a) = 5%, n = 36, X =

284
= 7, 89 e conhecido igual a 2.
36

Hipteses:

H0: = 8

H1: < 8

um teste unilateral esquerda, em que o valor crtico de z ser


1,645. A estatstica calculada ser obtida por:
X 7, 89 8
z calc =
=
= 0,33.

2
n
36

Deciso: como o valor de z calculado maior que z crtico, no se


rejeita H0, de maneira que a empresa deve continuar fabricando o
produto.

b) Caso tivssemos = 10%, o valor de z crtico seria igual a 1,282.


Logo, manteramos a deciso encontrada anteriormente para 5%,
ou seja, ainda assim no rejeitaramos H0.
10.

Dados:

27 + 24 + 21+ 25 + 26 + 22
= 24,17 e S =
6
Hipteses:

H0: 0 = 23

H1: 1 > 23

10%; Como n < 30 e desconhecido, ento utilizaremos a estatstica "t" de Student com cinco graus de liberdade e 90% de confiana
para um teste unilateral. Neste caso o valor de t ser 1,476.

O valor de t calculado ser dado por X 0 , em que


S
24,17 23
t=
= 1,235 .
2,32
n
Deciso: 6como o valor de t calculado, 1,235, inferior ao valor do t
crtico, 1,476, no se rejeita H0. A afirmao do fabricante de cigarros
procede, portanto, ao nvel de 10% de significncia.

X=

(145)2
6
= 2,32.
5

3531

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

211

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

Teoria da deciso

Problema
A empresa ABC est fabricando um novo equipamento que deseja disponibilizar para o mercado. sabido que o investimento em propaganda pode
trazer um grande retorno se a vendagem do produto for alta. No entanto, o
investimento tem um custo elevado e se a quantidade vendida do produto
no for alta, esse investimento em propaganda pode trazer prejuzo para a
empresa. A questo colocada para a diretoria se ela deve ou no proceder
ao investimento em propaganda.
Duas aes, ento, so possveis de serem tomadas. A primeira no investir em propaganda e a segunda realizar o investimento. Uma pesquisa
extensiva foi realizada e os cenrios que foram apresentados para a diretoria
representavam trs possibilidades de venda (forte, moderada e fraca). Os resultados financeiros podiam variar como segue.
No caso de investimento em propaganda, se as vendas do novo produto forem fortes, o retorno financeiro pode chegar a R$90.000,00 por ms. Se
as vendas forem moderadas, o retorno pode chegar a R$30.000,00 e se as
vendas forem fracas a empresa, pode ter um prejuzo de R$4.000,00. Na hiptese de no se fazer o investimento em propaganda, os retornos esperados
para as trs situaes de venda sero R$60.000,00, R$10.000,00 e R$2.000,00,
dependendo de as vendas serem fortes, moderadas ou fracas.
Diante desse quadro de possibilidades, qual a ao que a diretoria deve
tomar de forma a potencializar as suas possibilidades de lucro?
A tabela abaixo resume as situaes de retorno expostas:
A1 = Investir em
propaganda (R$)

A2 = No investir
em propaganda (R$)

1 = venda forte

90

60

2 = venda moderada

30

10

3 = venda fraca

-4

Eventos

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

213

Teoria da deciso

Observa-se que nenhuma das aes prefervel em todos os eventos ou


estados da natureza. A ao de investir em propaganda prefervel nos casos
de futuras vendas fortes ou moderadas, mas se a venda for fraca a ao preferida no investir em propaganda.
Se a diretoria soubesse com certeza qual evento ocorreria, o processo de
deciso seria simples. Bastaria olhar para a linha que representasse maior
ganho e selecionar a ao que produzisse o melhor rendimento. No entanto,
a incerteza de que evento ocorrer torna o problema mais interessante.
Vrios diferentes critrios de seleo da melhor ao podem ser sugeridos. Se houvesse ainda a possibilidade de agregar mais informaes sobre
as probabilidades de ocorrncia de cada um dos eventos, a tomada de deciso poderia ser realizada com base nessas informaes, o que seria muito
desejvel.

Conceitos fundamentais
A tomada de deciso gerencial tem crescido em complexidade e os instrumentos da Teoria de Deciso Estatstica tm se tornado um importante
modelo para se fazer escolhas racionais entre aes alternativas quando a
informao incompleta e sob ambiente de incerteza. O problema de deciso sob estudo pode ser representado por um modelo que compreende
cinco elementos.

O tomador de deciso
o agente a quem cabe a responsabilidade por tomar as decises. O tomador de decises pode ser um indivduo, uma corporao, uma agncia
governamental e assim por diante.

Aes
A deciso envolve uma seleo entre duas ou mais alternativas de aes.
O problema escolher a melhor entre essas aes alternativas. Algumas
vezes o tomador de decises deve escolher a melhor das estratgias disponveis, em que cada estratgia uma regra de deciso que indica qual ao
deve ser tomada em resposta a um tipo especfico de informao amostral
ou experimental.
214

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

Teoria da deciso

Eventos
Os eventos esto fora do controle do tomador de decises, que no
sabe ao certo qual evento de fato ocorrer. Os eventos se constituem de
um conjunto de resultados mutuamente exclusivos, isto , um e somente
um deles ocorrer. Os eventos tambm so chamados de estados da natureza ou simplesmente resultados.

Ganho
a medida do resultado da opo por uma ao especfica. Os ganhos so
apresentados em tabelas de ganhos ou matrizes de ganho, que apresentam as
consequncias de cada ao selecionada e cada evento que possa ocorrer.

Incerteza
A falta de definio de qual evento ou estado da natureza ir ocorrer
definido como incerteza. Essa incerteza ser indicada em termos de probabilidades associadas aos eventos. Uma das caractersticas da Teoria Estatstica de Deciso o assinalamento de probabilidades para a ocorrncia
desses eventos. Entre os tipos de probabilidades utilizadas est a probabilidade subjetiva.
A tabela de ganhos expressa em termos genricos. Assumimos que
existem n aes alternativas A1, A2 ... An e m possveis eventos ou estados
da natureza denotados por 1, 2 ... m. Os resultados de ganhos possveis so
denotados pela letra u com os indicadores respectivos de aes e eventos.
A letra u est sendo usada por sua associao com utilidade, conforme
ser mais bem explicado adiante. A matriz a seguir resume as relaes acima
descritas:
Aes
Eventos

A1

A2

...

An

u11

u12

...

u1n

u21

u22

...

u2n

...

...

...

...

...

um1

um2

...

umn

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

215

Teoria da deciso

Como essas utilidades podem ser determinadas ser assunto para este
captulo. Em sntese, a utilidade de se selecionar ao A2 e ter o resultado
do evento 1 denotada por u12 e assim por diante. A utilidade uij se refere
ao j e o evento i.
Se de antemo for sabido com certeza que o evento que ir ocorrer o
3, ento basta ao tomador de decises olhar ao longo da linha correspondente qual a maior utilidade e assim definir que ao deve ser tomada. No
entanto, no mundo real, uma vez que o estado da natureza no de domnio
do tomador de decises, ele no sabe com certeza qual especfico evento ir
ocorrer. A escolha da melhor ao a ser tomada em face de um ambiente de
incerteza o problema central da tomada de deciso.

Critrios de escolha
utilizando distribuio a priori
Muitos diferentes critrios existem para selecionar a melhor ao. O critrio mais imediato conhecido como o critrio maximin de ganho. Outros trs
critrios simples tambm so bastante utilizados, so normalmente conhecidos como: ganho esperado sob incerteza, perda esperada de oportunidade e
critrio minimax da perda de oportunidade.

Critrio maximin de ganho


No mtodo chamado critrio maximin, o tomador de decises assume
que uma vez que uma ao seja escolhida, a natureza ser malevolente e
escolher o estado da natureza que minimize o rendimento de sua escolha.
O tomador de decises escolhe a ao que maximize o rendimento sob a
pior perspectiva.
Em outras palavras, o melhor do pior uma forma de proteo. No exemplo do investimento em propaganda, a matriz de rendimentos apresentada
a seguir:
A1 = Investir em
propaganda (R$)

A2 = No investir
em propaganda (R$)

1 = venda forte

90

60

2 = venda moderada

30

10

3 = venda fraca

Eventos

216

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

Teoria da deciso

Se os diretores escolherem a ao A1, a natureza provocar a ocorrncia


de 3 e o resultado ser um prejuzo de R$4.000,00. Se o tomador de decises
escolher a ao A2, tambm a natureza provocar a ocorrncia de 3 e o lucro
ser de R$2.000,00.
Sendo assim, o tomador de decises dever escolher a ao que produza
o maior rendimento, no caso a ao A2. Isto , a empresa no deve investir em propaganda. Ento, o objetivo desse processo de deciso escolher
aquela ao que produza o mximo entre os mnimos rendimentos, por isso,
o termo maximin.
Naturalmente, o critrio maximin um tipo de critrio pessimista. No
razovel supor que um executivo tomaria decises ou deveria tomar decises dessa forma. Na maioria das situaes o critrio maximin congelaria
o tomador de decises em completa paralisia e implicaria que seria melhor
que ele mudasse de ramo de atividade.
Parece ser razovel que um tomador de decises deva levar em conta
as probabilidades de ocorrncia dos diferentes possveis estados da natureza.
Se, no exemplo acima, a probabilidade de vendas fracas for muito pequena,
no h porque concentrar-se sobre a possibilidade dessa ocorrncia. Os prximos procedimentos procuraro dar conta dessa alternativa.

Ganho esperado sob incerteza


Em um problema real de tomada de deciso, deve-se esperar que o tomador de decises tenha alguma ideia sobre a probabilidade de ocorrncia dos
vrios estados da natureza e que esse conhecimento possa ajudar na escolha
da melhor ao a ser tomada.
No exemplo em questo, se a diretoria percebe que as vendas do novo
produto sero fracas e que no compensaro o investimento em propaganda, deve-se decidir pela ao A1. No entanto, se a diretoria percebe que o
produto pode ter uma boa aceitao, talvez valha a pena fazer um investimento em propaganda.
Se o nmero de eventos e o nmero de aes possveis passarem a ser
muito grandes, o problema pode tornar-se muito complexo, e o tomador
de decises necessitar de outro tipo de mtodo para processar as informaes relevantes. No entanto, os procedimentos apresentados neste captulo
cobrem uma grande gama de problemas de tomada de deciso.
Este material parte integrante do acervo do IESDE BRASIL S.A.,
mais informaes www.iesde.com.br

217

Teoria da deciso

Voltando ao problema do investimento em propaganda. Nesse caso, a maximizao consiste em selecionar a ao que produza o maior ganho esperado.
Vamos assumir que a diretoria da empresa ABC tome o seguinte procedimento de assinalamento de probabilidades para cada um dos eventos. Com
base em uma extensiva pesquisa da experincia passada com produtos semelhantes e de acordo com a opinio de especialistas, a diretoria conclui que as
vendas podem ser moderadas (evento 2) em uma razo de 50 para 50. E mais,
concluem que um pouco menos provvel que as vendas aumentem com
investimento em propaganda (evento 1) do que as vendas sejam pequenas
(evento 3). Com base nessa perspectiva, a diretoria estabelece a seguinte distribuio de probabilidades subjetivas para os eventos em questo:
Evento

Probabilidade

1 = venda forte

0,2

2 = venda moderada

0,5

3 = venda fraca

0,3

Total

Para determinar a base de escolha entre investir em propaganda (Ao


1) e no investir em propaganda (Ao 2), necessrio calcular o ganho esperado para cada ao. Como indicado na tabela a seguir, o ganho tratado
como uma varivel que toma diferentes valores dependendo de que evento
ocorra. O valor esperado de cada ao ser a mdia ponderada dos resultados
sob cada ato, em que os pesos so as probabilidades de que cada evento
possa ocorrer.

Evento

Ao 1: investir em
propaganda

Ao 2: no investir em
propaganda

Probabilidade

Resultado

Resultado
ponderado

Probabilidade

Resultado

Resultado
ponderado

0,2

90

18,0

0,2

60

12,0

0,5

30

15,0

0,5

10

50,

0,3

1,2

0,3

0,6

Total

1,0

31,8

1,0

Resultado esperado: R$31.800,00


218

Resultado esperado: R$17.600,00

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

17,6

Teoria da deciso

Verifica-se dos clculos realizados que a diretoria pode esperar um resultado de R$31.800,00 de retorno de vendas se investir em propaganda e de
R$17.600,00 caso no invista em propaganda. Para maximizar o ganho esperado, a diretoria deveria selecionar a ao A1 e investir em propaganda.

Perda de oportunidade esperada


Um conceito til na anlise de deciso sobre incerteza o da perda de
oportunidade. A perda de oportunidade a perda causada pela falha em escolher a melhor ao. As perdas de oportunidade so calculadas separadamente para cada evento que pode acontecer.
Da ocorrncia de um especfico evento pode-se determinar a melhor
ao possvel. Para um dado evento, a perda de oportunidade a diferena
entre o ganho daquele ato e o ganho para o melhor ato que poderia ter sido
selecionado.
No exemplo do investimento em propaganda, se o evento 3 ocorrer
(vendas fortes), a melhor ao a A1, para a qual o ganho de R$90.000,00.
A perda para esta ao 90 90 = 0. O ganho para a ao A2 R$30.000,00
e a perda de oportunidade da ao A2 a quantidade que o ganho para
a melhor ao, ou seja, R$90.000,00 excedem os R$30.000,00 de ganho da
ao A2, que , portanto, R$90.000,00 R$30.000,00 = R$60.000,00.
A tabela das perdas de oportunidade para o problema em questo :
Tabela de ganhos
(R$)

Tabela de perda de
oportunidades (R$)

Evento

A1

A2

A1

A2

1 = venda forte

90

60

30

2 = venda moderada

30

10

20

3 = venda fraca

Pode-se calcular agora as perdas de oportunidades esperadas, levandose em conta a distribuio de probabilidades subjetivas estimadas de maneira
anloga ao que foi feito com o ganho esperado sob incerteza. O objetivo
ser o de escolher aquela ao com menor perda de oportunidade esperada.
As seguintes quantidades podem ento ser definidas POE(A1) e POE(A2)
como perda de oportunidade esperada para a ao de investir em propaganda e a perda de oportunidade esperada ao no se investir em propaganda:
Este material parte integrante do acervo do IESDE BRASIL S.A.,
mais informaes www.iesde.com.br

219

Teoria da deciso

Ao : investir em propaganda
Evento

Ao 2: no investir em propaganda

Probabilidade

Resultado

Resultado
ponderado

Probabilidade

Resultado

Resultado
ponderado

0,2

0,0

0,2

30

6,0

0,5

0,0

0,5

20

10,0

0,3

1,8

0,3

0,0

Total

1,0

1,8

1,0

Resultado esperado: R$1.800,00

16,0

Resultado esperado: R$16.000,00

Se a diretoria escolher a ao que minimize a perda de oportunidade


esperada, escolher a ao A1, a mesma ao selecionada sob o critrio de
maximizar o ganho esperado. Pode ser demonstrado que esse resultado no
ocorreu por acaso. Sempre a ao escolhida pelo critrio da maximizao do
ganho esperado tambm ser o escolhido para a minimizao da perda de
oportunidade esperada.

Critrio minimax da perda de oportunidade


No mtodo do critrio minimax de perda de oportunidade, o tomador de
deciso seleciona a ao que minimiza a pior perda de oportunidade possvel. Como no critrio de maximin, de maximizar os piores ganhos, o critrio
minimax para a perda de oportunidade toma uma perspectiva pessimista. O
tomador de deciso determina para cada ao a maior perda de oportunidade que pode ocorrer.
No exemplo em discusso, para a ao A2 a maior perda de oportunidade
possvel de R$16.000,00, para a ao A1, R$1.800,00. Ento, o tomador de
decises opta pela ao A2, que a de no se investir em propaganda.
Nesse exemplo, a ao escolhida pelo processo minimax foi a mesma da escolhida para o processo maximim, ao A2, mas esse fato nem sempre ocorre.

Valor esperado da informao


perfeita (VEIP) ou o custo da incerteza
A quantidade perda de oportunidade esperada (POE) pode ser interpretada tambm atravs do valor esperado da informao perfeita (VEIP) ou do
custo da incerteza (CI).
220

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

Teoria da deciso

O valor esperado da informao perfeita (VEIP) a diferena entre o


ganho esperado com informao perfeita e o ganho esperado sob incerteza. Como foi visto acima, para o problema do investimento em propaganda, o ganho esperado sob incerteza foi de R$31.800,00, o ganho esperado
com informao perfeita pode ser determinado pela escolha do melhor
ganho para cada evento e as probabilidades aqui so consideradas como
aproximaes das frequncias relativas calculadas por vrias observaes
anteriores.
Ganhos
(R$)

Probabilidades

Ganhos
ponderados

1 = venda forte

90

0,2

18,0

2 = venda moderada

30

0,5

15,0

0,3

0,6

Evento

3 = venda fraca

33,6

Ento, o valor esperado da informao perfeita ser igual a R$33.600,00


R$31.800,00 = R$1.800,00. Exatamente o mesmo valor encontrado para a
perda de oportunidade esperada.
A expresso custo da incerteza destaca o custo associado tomada de
deciso sob incerteza, uma vez que o ganho esperado com perfeita informao subentende que esse seria o ganho esperado com o conhecimento de
eventos passados ou ganho esperado sob certeza.

Representao atravs de diagrama de deciso


Pode ser til para melhor visualizao representar a estrutura de um
problema de deciso sob incerteza atravs de um diagrama de rvore
de deciso, tambm chamado de diagrama de deciso ou diagrama de
rvore.
O problema do investimento em propaganda pode ser apresentado atravs do diagrama a seguir:

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

221

Teoria da deciso

1
2
A1

R$90,00
R$30,00
R$4,00

A2

2
2

R$60,00
R$10,00
R$2,00

Saindo do ponto 1, o tomador de decises pode seguir o ramo A1 ou


o ramo A2, correspondentes, respectivamente, s aes de investir em
propaganda e no investir em propaganda. No ponto 2, um novo ramo
pode ser aberto a partir da primeira deciso que corresponde aos possveis eventos, alcanando os valores de ganhos pela escolha da ao e o
acontecimento do evento.
Para a tomada de deciso, o diagrama precisa receber as novas informaes correspondentes ao valor das estimativas de probabilidade que cada
evento ocorra e a realizao da anlise retrospectiva ou de induo backward
(para trs). Multiplica-se, ento, os valores dos ganhos no final de cada ramo
pelo valor da probabilidade de cada um dos eventos somando os resultados destes produtos e retornando ao ponto 2, que assume o valor de ganho
esperado para cada uma das aes, A1 e A2, com valores de R$31.800,00 e
R$17.600,00, respectivamente.
O valor do ganho esperado para a ao 1 foi determinado pela seguinte
expresso:
31,8 = (0,2).(90) + (0,5).(30) + (0,3).(4)
O novo passo retornar do n 2 para o n 1 atravs da escolha do ganho
esperado de maior valor, no caso o ganho esperado correspondente da ao
1, conforme exposto no diagrama 2:

222

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

Teoria da deciso

R$31,8
A1
R$31,8

(0,2)
(0,5)
(0,3)

R$90,00
R$30,00
R$4,00

A2

R$23,0

(0,2)
(0,5)

R$60,00
R$10,00

(0,3)
2

R$2,00

Dessa forma, o diagrama de rvore reproduz de forma esquemtica


e compacta a anlise realizada atravs das tabelas. Um diagrama anlogo
pode ser construdo em termos de perdas de oportunidade.

Estabelecimento
de distribuies de probabilidades
Estabelecer as probabilidades de ocorrncia de cada estado da natureza
(eventos) uma tarefa fundamental para o equacionamento do esquema de
tomada de decises. At agora, o estabelecimento dessas probabilidades foi
realizado de forma subjetiva e simples. Se houver uma forma mais cientfica
de estabelecimento da distribuio de probabilidades dos possveis eventos,
o problema da tomada de decises pode ser mais bem equacionado.
Se a varivel aleatria que representa os estados da natureza for discreta e houver somente um nmero pequeno de resultados possveis, ento
o tomador de decises provavelmente ser capaz de assinalar diretamente
probabilidades para cada possvel resultado. No entanto, se a varivel aleatria tiver um nmero grande de valores possveis, o tomador de decises
ter que tratar a varivel aleatria como contnua e necessitar construir uma
funo de distribuio acumulada trabalhando com um nmero de intervalos selecionados da varivel aleatria.

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

223

Teoria da deciso

Duas situaes possveis so apresentadas ao tomador de decises:


 o tomador de decises estabelece diretamente uma distribuio de
probabilidades subjetivas sem um processamento formal dos dados;
 existe uma pequena quantidade de dados do passado, e o tomador de
decises processa essa informao para construir uma distribuio de
probabilidades acumulada ou cumulativa.
O problema agora encontrar meios para a construo dessas distribuies
de probabilidades. Trabalharemos com as duas possibilidades, a saber: (I) assinalamento subjetivo direto; e (II) assinalamento usando dados do passado.

Assinalamento subjetivo direto


Nesse caso, o estabelecimento de uma distribuio cumulativa de probabilidades subjetiva ser feito sem processamento formal de dados.
Tomemos por exemplo um caso em que o tomador de decises infere
que para o prximo ano as vendas de certo produto de sua companhia
devero ficar entre 100 000 e 500 000 unidades, e deseja estabelecer uma
distribuio de probabilidades cumulativas subjetivas sem usar explicitamente qualquer dado.
A base de procedimento focalizar a ateno em poucos pontos da distribuio. Uma proposta trabalhar com os percentis. Se pensarmos em trs
percentis, o mais adequado tomar o primeiro e o quarto quartil e a mediana. O primeiro quartil divide o rol de dados em duas partes, os primeiros 25%
e os ltimos 75%. A mediana divide o rol de dados em duas partes iguais, os
primeiros 50% e os ltimos 50%. E o terceiro percentil divide o rol tambm
em duas partes, os primeiros 75% e os ltimos 25%.
Observe que o primeiro quartil representa o vigsimo quinto percentil, a
mediana representa o quinquagsimo percentil e o terceiro quartil, o septuagsimo quinto percentil.
Comecemos pela mediana ou o quinquagsimo percentil. O tomador
de decises deve escolher, entre 100 000 e 500 000, um valor que acredite
que a probabilidade de ocorrer um valor menor ou igual a ele seja igual a
50%. Pode ser qualquer valor no intervalo inicialmente estabelecido. Vamos
supor que aps muita reflexo ele acredite que esse valor deve ser algo em
224

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

Teoria da deciso

torno de 350 000. Ou seja, o tomador de decises acredita que a chance de


se vender menos de 350 000 unidades do produto de 50%. Naturalmente,
a chance de vender mais de 350 000 tambm de 50%.
O raciocnio deve ser repetido para a determinao dos outros dois valores. Vamos supor que esses valores sejam 250 000 e 400 000. Ou seja, o tomador de decises acredita que a probabilidade de vender mais do que 250 000
produtos seja de 75% e que a probabilidade de vender mais do que
400 000 produtos seja de 25%.
Dessa forma, trs pontos da distribuio de probabilidades cumulativa
foram determinados. Os percentis de ordem 25, 50 e 75, ou equivalentemente o primeiro, o segundo e o terceiro quartis. Lembrando que o segundo
quartil coincide com a mediana.
O procedimento usual o de determinar mais dois pontos, preferencialmente mais prximos dos extremos e usar esses cinco pontos para a construo da funo que represente a distribuio de probabilidades cumulativa.
Uma proposta usar o primeiro e o nonagsimo nono percentis, ou os
percentis de ordem 1 e de ordem 99. Esses valores podem ser considerados
como os valores limites inferior e superior da primeira condio estabelecida. Ou seja, podemos escolher como primeiro percentil o valor de 100 000
unidades de venda e 500 000 como o valor do nonagsimo nono percentil.
Dessa forma, estabelecemos que a probabilidade de vender mais do que
100 000 unidades do produto em questo de 99% e que a probabilidade
de vender mais do que 500 000 unidades de somente 1%.
A figura seguinte representa a situao construda. O grfico pode ser
considerado como uma aproximao da distribuio de probabilidade cumulativa subjetiva da venda do produto no prximo ano.
Distribuio de probabilidade cumulativa

1
0,9
Probabilidade

0,8
0,7
0,6
0,5
0,4
0,3
0,2
0,1
0
0

100

200

300

400

500

600

Vendas

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

225

Teoria da deciso

A distribuio anterior, que representa uma distribuio de probabilidades


discreta, pode ser mais bem aproximada atravs de uma curva em forma de s
pela unio de seus pontos, para a construo de uma distribuio de probabilidades contnua.
Distribuio de probabilidade cumulativa

1
0,9
Probabilidades

0,8
0,7
0,6
0,5
0,4
0,3
0,2
0,1
0
0

100

200

300

400

500

600

Vendas

O assinalamento direto da distribuio de probabilidades cumulativa


subjetiva apropriada para as seguintes situaes: (I) quando existir um
nmero pequeno de dados e no houver dados do passado; e (II) quando,
apesar de existirem dados do passado, o tomador de decises no se sentir
confortvel para usar esses dados para o estabelecimento da distribuio de
probabilidade cumulativa. Este ltimo caso pode ocorrer em razo de mudanas da poltica da empresa ou de algum avano tecnolgico importante
implementado, por exemplo.

Assinalamento de probabilidades
usando dados do passado
Se existe uma grande quantidade de dados do passado, o tomador de decises pode us-los para estabelecer a distribuio de probabilidades atravs do uso das frequncias relativas dos dados. No entanto, se a quantidade
de dados for pequena, um procedimento deve ser realizado tomando a distribuio de frequncias destes dados para a construo de uma distribuio
de frequncias acumulada atravs de aproximaes.

226

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

Teoria da deciso

Vamos ilustrar a construo de uma distribuio cumulativa de probabilidades atravs de um exemplo simples. Certa loja vende, entre outros, um
produto A. Acompanhando a venda desse produto nos ltimos 20 meses,
observamos que em um determinado ms foram vendidos 33 unidades. Em
outros dois meses foram vendidos 38. Fazendo observaes dessa ordem,
pudemos construir a seguinte distribuio de frequncias que relaciona o
nmero de produtos vendidos com a quantidade de meses em que esse
nmero foi alcanado. Um possvel resultado o que segue:
Nmero de
produtos
vendidos

Nmero de meses em
que os produtos vendidos alcanaram a venda

Nmero de
produtos
vendidos

Frequncia relativa
do nmero de
produtos vendidos

33

33

1/20 = 0,05

34

35

35

4/20 = 0,20

36

36

5/20 = 0,25

37

38

38

2/20 = 0,10

39

39

3/20 = 0,15

40

41

41

1/20 = 0,05

42

42

2/20 = 0,10

43

43

2/20 = 0,10

Podemos, com base nos dados acima, construir a distribuio de frequncias acumuladas para o nmero de produtos vendidos:
Nmero de
produtos vendidos
33

Frequncia relativa do nmero


de produtos vendidos
0,05

34

Frequncia relativa
acumulada
0,05
0,05

35

0,20

0,25

36

0,25

0,50

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

227

Teoria da deciso

Nmero de
produtos vendidos

Frequncia relativa do nmero


de produtos vendidos

Frequncia relativa
acumulada

37

0,50

38

0,10

0,60

39

0,15

0,75

40

0,75

41

0,05

0,80

42

0,10

0,90

43

0,10

1,00

Considerando que a frequncia relativa uma aproximao de probabilidades e que, portanto, a frequncia relativa acumulada uma aproximao
da probabilidade acumulada, podemos construir o seguinte grfico da distribuio de frequncias relativas acumuladas, que representam as probabilidades de vender at certo nmero de produtos. Observando a tabela anterior ou o prximo grfico, podemos verificar que a probabilidade de vender
at 36 produtos em um determinado ms de 50%.
Distribuio de probabilidade cumulativa
1
0,9
Probabilidade

0,8
0,7
0,6
0,5
0,4
0,3
0,2
0,1
0
30

35

40

45

50

Nmero de produtos vendidos

Para aplicaes em tomada de decises sob incerteza, trabalhar com


dados contnuos pode dificultar enormemente a tarefa. At aqui trabalhamos com dados discretos. Existem tcnicas para transformar dados contnuos em dados discretos, mas que esto fora do escopo do presente texto.
228

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

Teoria da deciso

Tomada de decises
baseada na utilidade esperada
At agora as anlises de tomada de deciso tiveram por critrio a escolha
da ao tima como aquela que resultaria em maior ganho mdio a longo
prazo se a mesma deciso tivesse que ser tomada repetidamente sob idnticas condies. No entanto, algumas decises pessoais e nos negcios so
tomadas frente a um nico conjunto de condies. Em algumas dessas ocasies no seria realstico pensar em termos de muitas repeties da mesma
situao de deciso.
Sendo assim, til ter um aparato para lidar com tomada de deciso em
tempo nico. A Teoria da Utilidade fornece tal aparato e tambm um mtodo
lgico para tomada de decises repetitivas. Para ilustrar a ideia, vamos supor
trs situaes com duas aes alternativas para cada uma delas. Na primeira
(A) se contrapem duas decises que tm como consequncia para a ao A1
receber R$0 com certeza e, para a ao A2, receber R$0,60 com probabilidade
e perder R$0,40 com probabilidade . Na segunda situao, B1 implica
ganhar R$0,00 com certeza e B2, receber R$60.000,00 com probabilidade
e perder R$40.000,00 com probabilidade . A terceira situao, C1 implica
receber R$1 milho com certeza contra C2, que implica receber R$2 milhes
com probabilidade e receber R$0,00 com probabilidade .
O clculo do ganho esperado para a deciso colocada em A de R$0,10
[(1/2).(0,6)+(1/2).(0,4)]. Isso significa que a longo prazo o resultado dever
ser positivo. Ocorre, no entanto, que se a deciso tem que ser tomada para
somente uma realizao, a perda pode ser de R$0,40. A firma talvez possa
correr esse risco. Mas na situao B, o valor do ganho esperado a longo prazo
seria de R$10.000,00, o que levaria o tomador de decises a optar pelo risco,
ou seja, escolher a ao B2. Como a situao pontual, a firma pode perder
R$40.000,00. Ficando invibializado o tomador de decises pode optar por
no correr o risco e optar por ganho certo de R$0,00.
No caso da situao C, mesmo pensando a longo prazo, o valor do ganho
esperado seria R$1.050.000,00 se a opo fosse por C2, contra um ganho certo
de R$1.000.000,00 pela ao C1. Nesse caso, no resta muita dvida que, apesar
de a ao C2 poder resultar num ganho de R$2,1 milhes, a melhor ao seria
mesmo tomar a ao C1, com ganho certo de R$1 milho.
Fica claro que grandes e pequenas corporaes podem tomar diferentes
atitudes diante do risco. A questo que o tomador de decises deve responEste material parte integrante do acervo do IESDE BRASIL S.A.,
mais informaes www.iesde.com.br

229

Teoria da deciso

der : Qual a probabilidade para que a consequncia M1 se torne indiferente


para que se possa correr o risco de optar por ganhar M1 com certa probabilidade p ou M2 com probabilidade 1p?. Esse tipo de questo pode ser respondido
pela aplicao da metodologia da Teoria da Utilidade. No objeto de estudo
aqui o desenvolvimento mais aprofundado dessa teoria, seno o de apresent-la ilustrativamente, mesmo porque essa situao no muito comum na
prtica diria da tomada de decises. Maiores informaes sobre essa teoria
podem ser adquiridas atravs de bibliografia mais aprofundada, como o livro
de R. S. Schlaifer, Analysis of Decisions Under Uncertainty, McGraw Hill.

Tomada de deciso com


probabilidades a posteriori
As anlises feitas at agora podem ser consideradas como anlises a
priori, isto , a tomada de decises foi baseada em melhor ganho (ou menor
perda) com base em aes relacionadas com uma distribuio de probabilidades construda sem a utilizao de levantamento de dados amostrais
auxiliares. Aqui discutiremos a chamada anlise a posteriori, em que a distribuio de probabilidades envolvida na tomada de decises ser feita com
base em probabilidades a priori revisadas pela observao de dados amostrais complementares.

Probabilidades a posteriori
As probabilidades a posteriori so calculadas com base em duas informaes, as probabilidades a priori e a informao obtida atravs da observao
de um conjunto de dados. O meio de fazer essa atualizao o Teorema de
Bayes. Se uma nova atualizao for necessria, a atual probabilidade a posteriori ser utilizada como probabilidade a priori no novo contexto em que
uma nova tomada amostral seja realizada.
O propsito de incorporar mais evidncia atravs de processos amostrais
o de reduzir o custo esperado da incerteza.
Se o custo esperado da incerteza (ou de outra forma, o custo esperado da
perda de oportunidade) for elevado, ento o acrscimo de nova informao
atravs de um processo de amostragem pode se tornar desejvel. O mtodo
geral para se incorporar nova informao, ou nova evidncia amostral, pode
230

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

Teoria da deciso

ser ilustrado pelo uso de dois tipos de informao amostral: (I) atravs da
especificao da confiabilidade da informao amostral; e (II) atravs da especificao do tamanho da amostra.

Anlise a posteriori: uma ilustrao


da especificao da confiabilidade
Retomando o exemplo do investimento em propaganda, a situao colocada para o tomador de decises era a de decidir entre duas aes, A1 (investir em propaganda de um novo produto) e A2 (no investir em propaganda
de um novo produto).
Qual a ao que a diretoria deve tomar de forma a potencializar as suas
possibilidades de lucro, diante do quadro de retorno ou possveis ganhos?
A tabela a seguir resume a situao de retorno exposta, na qual os valores so expressos em milhares de reais, isto , 90 representa um ganho de
R$90.000,00:
Eventos

A1 = investir em
propaganda (R$)

A2 = no investir em
propaganda (R$)

1 = venda forte

90

60

2 = venda moderada

30

10

3 = venda fraca

-4

Com base em avaliaes subjetivas, a diretoria estabelece a seguinte distribuio de probabilidades para os eventos em questo:
Evento

Probabilidade

1 = venda forte

0,2

2 = venda moderada

0,5

3 = venda fraca

0,3

Total

1,0

Diante desses dados, foram determinados os valores esperados de ganhos


sob incerteza para a ao A1 de R$31.800,00 e para a ao A2 de R$17.600,00.

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

231

Teoria da deciso

Associado a esses clculos, foi determinado o custo da incerteza (ou valor


esperado da perda de oportunidade) em R$1.800,00, considerado alto pela
diretoria. Decide-se, ento, por proceder a um levantamento amostral no
sentido de verificar os ganhos esperados para cada ao de forma que o
custo da incerteza possa ser reduzido atravs da incorporao de evidncias
adicionais e, portanto, com a diminuio da incerteza.
Vamos assumir que a pesquisa possa resultar em trs resultados amostrais,
denotados por x1, x2 e x3, correspondentes aos trs estados da natureza (eventos) 1, 2 e 3. Especificamente, os resultados da pesquisa podem ser: a amostra indica vendas fortes (x1), vendas moderadas (x2) ou vendas fracas (x3).
A pesquisa foi realizada e a amostra indicou um nvel de venda moderada
para o produto, isto , x2 foi observado.
Suponha agora que, com base em pesquisas anteriores semelhantes, os
pesquisadores possam acessar a confiabilidade da evidncia amostral nos
seguintes termos: no passado, quando o nvel de venda real foi moderado,
a pesquisa amostral indicou corretamente venda moderada em 80% das
vezes. No entanto, quando o nvel real de vendas foi forte, em cerca de 20%
das pesquisas realizadas o nvel indicado foi erroneamente indicado como
moderado. E quando o nvel real de vendas foi baixo, cerca de 30% das pesquisas amostrais indicaram vendas moderadas.
Essas frequncias relativas representam probabilidades condicionais que as
evidncias indicassem nvel moderado de vendas, dados os trs possveis eventos de nvel de venda. Essas probabilidades podem ser representadas por:
P(x2/1) = 0,2
P(x2/2) = 0,8
P(x2/3) = 0,3
Com essa informao, a distribuio de probabilidades a priori original
pode ser revisada conforme indica a seguinte tabela:

232

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

Teoria da deciso

Probabilidade
a priori

Probabilidade
condicional

Probabilidade
conjunta

Probabilidade
a posteriori

Eventos i

P(i)

P(x2/i)

P(i) P(x2/i)

P(i/x2)

1 = venda forte

0,2

0,2

0,04

0,0755

2 = venda
moderada

0,5

0,8

0,40

0,7547

3 = venda fraca

0,3

0,3

0,09

0,1698

Total

1,0

0,53

1,0000

Observe a utilizao do Teorema de Bayes para cada um dos i:


P(1 / x2) =

P (1)P(x2 / 1)
P (i)P(x2 / i)

Na tabela, multiplicar cada probabilidade a priori P(i) pela sua correspondente probabilidade condicional P(x2/i), obtendo-se assim as probabilidades conjuntas, cuja soma P(i) P(x2/i). Para calcular as probabilidades a
posteriori associadas a cada um dos eventos i, basta dividir a probabilidade
conjunta de cada evento pela soma das probabilidades conjuntas. Essa
uma forma confortvel de calcular as probabilidades a posteriori atravs do
uso do Teorema de Bayes.
Fica bem ilustrativo a diminuio do espao amostral com a correspondente probabilidade de 0,53 e quanto dessa probabilidade ser destinada a cada
um dos eventos. Equivale, portanto, a considerar 0,53 como a totalidade (1,0)
e verificar quanto disso corresponde a cada um dos eventos.
Assim, com uma indicao amostral de vendas moderadas, a probabilidade a priori de 0,5 do evento vendas moderadas foi revisado e cresceu para
aproximados 0,75. Da mesma forma, as probabilidades 0,2 e 0,3, correspondentes aos eventos venda fraca e venda forte, foram revisados e declinaram
para 0,07 e 0,17.

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

233

Teoria da deciso

Essas probabilidades revisadas podem ser agora utilizadas para os clculos do ganho esperado a posteriori e da perda esperada de oportunidade a
posteriori ou custo esperado da incerteza. Ento, os resultados obtidos foram
de R$28.756,80 de ganho esperado para a ao A1 (investir em propaganda)
e R$12.416,60 para A2 (no investir em propaganda) e o custo esperado da
incerteza diminuiu de R$1.800,00 para R$1.018,80.
Tabela 1 Ganho esperado a posteriori
Ao 1: investir em propaganda
Evento

Probabilidade

Resultado

0,0755

90

0,7547

0,1698

Total

1,0000

Ao 2: no investir em propaganda

Resultado
ponderado

Probabilidade

Resultado

6,795

0,0755

60

4,53

30

22,641

0,7547

10

7,547

-4

-0,6792

0,1698

0,3396

28.756,80

1,0000

Resultado esperado: R$28.756,80

Resultado
ponderado

12.416,60

Resultado esperado: R$12.416,60

Tabela 2 Perda de oportunidade esperada a posteriori


Ao 1: investir em propaganda
Probabilidade

Resultado

0,0755

0,7547

0,1698

Total

1,0000

Evento

Ao 2: no investir em propaganda

Resultado
ponderado

Probabilidade

Resultado

0,0755

30

2,265

0,7547

20

15,094

1,0188

0,1698

1,0188

1,0000

Resultado esperado: R$1.018,80

Resultado
ponderado

17,3590

Resultado esperado: R$17.359,00

O diagrama de rvores a seguir descreve a situao para os ganhos esperados a posteriori.

234

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

Teoria da deciso

R$28.756,60
A1
R$28.756,60

)
755
(0,0
(0,7547)
(0,1
698
)

R$90,00
R$30,00
R$4,00

A2

R$12.416,60

)
755
(0,0
(0,7547)
(0,1
698
)

R$60,00
R$10,00
R$2,00

Como o ganho esperado sob A1 maior que o ganho esperado sob A2,
a melhor das duas aes continua sendo a de investir em propaganda. Observe, no entanto, que essa deciso poderia ter sido modificada aps o assinalamento da distribuio de probabilidades a posteriori, com a incluso de
novas evidncias devido ao processo de busca de dados na amostragem.
A amostragem indicada anteriormente indicou vendas moderadas, mas
se ela tivesse indicado vendas fracas ou vendas fortes, o mesmo procedimento poderia ser realizado para o clculo dos novos valores de ganhos esperados e de custos da incerteza.
O custo da incerteza teve uma diminuio de R$1.800,00 para R$1.088,00.
Esse custo significa o quanto o tomador de decises estaria disposto a pagar
para ter a informao perfeita. Se esse valor tivesse crescido ao invs de diminudo, como foi o caso, significaria que a evidncia amostral no resultou
em diminuio da dvida de que ao tomar e que a nova situao no traria
maior segurana na deciso.

Anlise a posteriori:
uma ilustrao da aceitao da amostragem
Como uma segunda ilustrao da anlise a posteriori, vamos considerar
o problema da aceitao da amostragem de um produto manufaturado.
Vamos assumir que a empresa ABC inspeciona artigos de componentes de

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

235

Teoria da deciso

seus produtos vindos de certo fornecedor. Observando dados de inspees


passadas, a empresa verifica que 10%, 20% e 30% dos componentes do fornecedor tinham defeitos.
Da experincia passada, a empresa ABC estabeleceu como critrio de
aceitao de lotes com at 10% peas de defeituosas para retrabalho, e rejeitar lotes com 20% e 30% de peas defeituosas. A questo consiste em decidir
se aceita ou no um novo lote atravs do exame de uma amostra sua.
Essa deciso dever ser tomada com base em algumas informaes que
a empresa tem. Primeiro, com base em frequncias relativas, lotes com essas
percentagens de peas defeituosas ocorreram 50%, 30% e 20% das vezes.
Ou seja, lotes com 10% de peas defeituosas ocorreram em 50% das entregas. Outra informao que ser utilizada ser a matriz de resultados baseada
na matriz de perda de oportunidades em tomar a ao A1, de rejeitar o lote,
e a ao A2, de aceitar o lote. Com base em resultados anteriores, essa matriz
dada por:
Tabela 3 Matriz de perda de oportunidade
Evento

Ao A1

Ao A2

Proporo de defeituosas

Rejeitar o lote

Aceitar o lote

0,10

R$30,00

R$0,00

0,20

R$0,00

R$15,00

0,30

R$0,00

R$20,00

Seria mais realstico tomar eventos com propores de defeituosas variando de 0%, 1% at 100%, ou mesmo considerar esta como uma varivel
contnua. Para efeito de simplificao de apresentao do mtodo, sero
consideradas somente essas trs possibilidades.
Com essas informaes e com base no resultado de uma amostra de, digamos, 10 elementos de uma nova entrega, em que ser verificado o nmero de
peas defeituosas entre essas 10, a empresa decidir se aceita ou no o lote.
A empresa pode usar as frequncias relativas (50%, 30% e 20%) como distribuio a priori e determinar a perda esperada de oportunidade para cada
uma das duas aes possveis:

236

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

Teoria da deciso

Evento
p

Ao A1 - rejeitar o lote
P0(p)

Perda de
oportunidade

0,10

0,50

0,20
0,30
Total

Ao A2 - aceitar o lote

Perda
ponderada

P0(p)

30

15,00

0,50

0,00

0,30

0,00

0,30

15

4,50

0,20

0,00

0,20

20

4,00

R$15,00

1,00

1,00

Perda de
oportunidade

Perda
ponderada

R$8,50

Quando ento utilizamos os dados do passado, verificamos que a perda


esperada de oportunidade a priori para ao A1 (R$15,00) supera a perda da
ao A2 (R$8,50). Assim, a ao tima a ao A2, de aceitar o lote.
Indo agora para a anlise a posteriori, quando uma amostra de tamanho
10 com reposio dos itens do lote retirada para anlise. Verifica-se que trs
peas so defeituosas. Qual ser agora a melhor ao?
As evidncias amostrais devem ser utilizadas para revisar as probabilidades a priori das propores de peas defeituosas. Para aplicar o Teorema de
Bayes, necessrio determinar as probabilidades condicionais P(X = 3/n =
10, p). Aqui ser necessria a aplicao do clculo de probabilidades de um
processo de Bernoulli atravs da distribuio binomial. Ento:
P(X = 3/n = 10, p) = Cn,xpx (1 p)n x
Essas probabilidades sero iguais a 0,0574, 0,2013 e 0,2668 para p igual
a 0,10, 0,20 e 0,30, respectivamente. Seno, vejamos para p = 0,10, o mesmo
pode ser feito para p = 0,20 e p = 0,30:
P(X = 3/n = 10, p) = Cn, xpx (1 p)n x = C10, 3 (0,10)3.(0,9)7
(120).(0,001).(0,478297) = 0,057396 0,0574
Dessa forma, as probabilidades a posteriori podem ser determinadas diretamente pelo Teorema de Bayes atravs de uma tabela auxiliar. Como j
realizado anteriormente, denotaremos a probabilidade a priori por P0 e a
probabilidade a posteriori por P1:

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

237

Teoria da deciso

Probabilidade
a priori

Probabilidade
condicional

Probabilidade
conjunta

Probabilidade
a posteriori

P0(p)

P(X=3/n=10,p)

P(p) P(X=3/n=10,p)

P1(p)

0,10

0,5

0,0574

0,02870

0,20147

0,20

0,3

0,2013

0,06039

0,42394

0,30

0,2

0,2668

0,05336

0,37459

0,14245

1,00000

Eventos p

Total

1,0

As perdas esperadas de oportunidade podem agora ser recalculadas utilizando essas probabilidades a posteriori. O novo clculo das perdas esperadas de oportunidade apresentado na tabela a seguir:

Evento
P

Ao A1: rejeitar o lote


P1(p)

Perda de
oportunidade

0,10

0,20147

30,00

0,20

0,42394

0,30

0,37459

Total

1,00000

Ao A2: aceitar o lote

Perda
ponderada

P1(p)

Perda de
oportunidade

Perda
ponderada

6,04

0,20147

0,00

0,00

0,00

0,00

0,42394

15,00

6,36

0,00

0,00

0,37459

20,00

7,49

R$6,04

1,00000

R$13,85

A ao tima agora a de rejeitar o lote, uma vez que a perda esperada de


oportunidade de A2 maior do que a perda esperada de oportunidade de A1.
Para efeito de comparao, pode-se verificar que se supusssemos que o
nmero de peas defeituosas na amostra de 10 itens fosse de 2 unidades, a
ao preferida seria A1 com perda de oportunidade de 12,41 contra 9,79 de
A2. E se houvesse uma nica defeituosa, a perda de oportunidade de A1 seria
de 19,47 contra 5,67 de A2.

Efeito do tamanho da amostra


Podemos analisar o efeito do tamanho da amostra no clculo das probabilidades a posteriori. Suponha que uma amostra de tamanho 100, e no
mais de tamanho 10, seja retirada. Vamos assumir a mesma proporo de
defeituosas, 30% como no caso da amostra pequena. Ento, um nmero de
30 peas defeituosas foi encontrado no lote.
238

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

Teoria da deciso

Probabilidade
a priori

Probabilidade
condicional

Probabilidade conjunta

Probabilidade
a posteriori

P0(p)

P(X=30/n=100,p)

P(p) P(X=30/n=100,p)

P1(p)

0,10

0,5

0,000000018

0,000000009

0,00000005

0,20

0,3

0,005189

0,0015567

0,082

0,30

0,2

0,086784

0,0173568

0,918

0,018913509

1,000

Eventos
p

Total

1,0

A maior probabilidade, 91,8%, foi encontrada para o evento p = 0,30


depois que foi acrescentada informao que na amostra de tamanho 100
havia 30% de defeituosas. Pode-se generalizar esse resultado da seguinte
forma: medida que o tamanho da amostra cresce, a distribuio de probabilidades a posteriori da varivel aleatria proporo de defeituosas
influenciada muito mais pelo tamanho da amostra do que pela distribuio
de probabilidades a priori.

Atividades de aplicao
As informaes a seguir devem ser utilizadas para a resoluo dos exerccios de 1 a 5. Um investidor tem R$50.000,00 e deve decidir entre trs portflios preparados por um especialista. Os portflios so caracterizados como de
alto risco, mdio risco e baixo risco, e os retornos dependem da situao econmica. Assumindo que somente duas situaes econmicas sejam consideradas (crescimento e recesso), a probabilidade de recesso de 30%. Dada
a seguinte matriz de resultados (dada em centenas de reais), qual portflio o
investidor deveria escolher?

Estados da natureza
Crescimento
Recesso

Portflio
Risco alto

Risco mdio

Risco baixo

10

-15

-2

1. Qual dos trs portflios deve ser escolhido se o critrio utilizado for
o maximim?
2. Para o problema em questo, qual a crtica ao uso desse critrio?
Este material parte integrante do acervo do IESDE BRASIL S.A.,
mais informaes www.iesde.com.br

239

Teoria da deciso

3. Para o critrio ganho esperado sob incerteza, qual a deciso a ser tomada?
4. Calcule as perdas de oportunidade esperada para cada portflio.
5. Faa a representao atravs do diagrama de deciso para o critrio
minimax.
6. Construa a distribuio de probabilidades acumulada atravs da utilizao de dados de vendas do passado com relao aos nmeros de
pedidos e ao nmero de semanas em que eles foram feitos, conforme
tabela a seguir:
Nmero de
equipamentos
vendidos

Nmero de semanas
que o nmero de
ordens foi recebido

Nmero de
equipamentos
vendidos

Nmero de semanas
em que o nmero de
ordens foi recebido

21

32

22

33

23

34

24

35

25

36

26

37

27

38

28

39

29

40

30

41

31

42

Dados para os exerccios 7 e 8. Um novo curso est sendo ofertado em


uma faculdade. Seja p a proporo de estudantes que tiveram notas inferiores mdia no trabalho final do curso. Os estados da natureza e suas respectivas probabilidades condicionais so as seguintes:

240

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

Teoria da deciso

P0(p)

0,05

0,30

0,10

0,40

0,15

0,20

0,20

0,10

7. Das informaes dadas, preencha as clulas em branco e interprete os


dados. O X o resultado da pesquisa de 1 000 empresas de construo.
Estados da natureza

P0()

1 = casas tero preos aumentados no prximo ano

0,80

P(X/)

1 = casas tero preos iguais


ou diminudos no prximo ano

P0() P(X/)

P1(/X)

0,60

8. So dados os seguintes resultados de um experimento em que 1


produto superior e 2 produto igual ou inferior. Calcule as probabilidades a priori.
Estados da natureza

P(X/)

P1(/X)

0,50

0,25

0,50

0,75

Gabarito
1. No critrio maximim, o tomador de deciso assume que uma vez que
uma ao seja escolhida a natureza escolher o estado da natureza
que minimize o rendimento sob a pior perspectiva.
Estados da
natureza
Crescimento
Recesso

Risco alto

Portflio
risco mdio

Risco baixo

10

15

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

241

Teoria da deciso

Possveis aes: A1 = risco alto, A2 = risco mdio e A3 = risco baixo.

Se o investidor escolher A1, a natureza provocar a ocorrncia de 2


(recesso) e o resultado ser um prejuzo de R$15.000,00. Para a ao
A2, o resultado ser um prejuzo de R$2.000,00, e para A3 o resultado
ser um lucro de R$1.000,00.

O investidor deve escolher a ao que produza o maior rendimento.


Nesse caso, a ao A3, escolher o portflio de risco baixo.

2. O critrio um critrio pessimista. No caso em questo, a deciso


pelo portflio de risco baixo d um retorno de R$2.000,00 se a situao for de crescimento da economia e de R$1.000,00 para o caso de
recesso. O investidor ganha nas duas situaes, mas ganha pouco.

Se houver uma situao de crescimento na economia, a aquisio dos


portflios de risco mdio e risco alto dariam resultados muito bons.
Valeria a pena ter informaes sobre as probabilidades de ocorrncia
dos vrios estados da natureza. Se houver uma boa probabilidade de
crescimento econmico, valer a pena outra opo.

3. Uma vez que a probabilidade de recesso de 30% ou 0,3, ento a


probabilidade de crescimento de 70% ou 0,7. Assim, a distribuio
de probabilidades pode ser expressa pela tabela:
Evento

Probabilidade

1 = crescimento

0,7

2 = recesso

0,3

Total

O valor esperado de cada ao ser a mdia ponderada dos resultados


para cada ao, tendo como peso as probabilidades de ocorrncia de
cada evento:
Prob.

Risco
alto

Resultado
ponderado

Risco
mdio

Resultado
ponderado

Risco
pequeno

Resultado
ponderado

0,7

10

70

2,8

1,4

0,3

15

45

0,6

0,3

Evento

242

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

Teoria da deciso

Evento

Prob.

Total

Risco
alto

1,0

Resultado
ponderado

Risco
mdio

35

Resultado
esperado

Risco
pequeno

Resultado
ponderado

2,2

R$35.000,00

Resultado
ponderado

1,7

R$2.200,00

R$1.700,00

Pelo critrio de ganho esperado sob incerteza, o tomador de decises


deve escolher aquela ao com maior resultado esperado. No problema, a ao a ser escolhida A1, ou seja, escolher o portflio de risco
alto, que deve ter como resultado o valor de R$35.000,00.

4. Para determinar as Perdas de Oportunidade Esperada, necessrio


inicialmente determinar a tabela de perda de oportunidades. Esse clculo o resultado da diferena entre o ganho daquele ato e o ganho
para o melhor ato que poderia ter sido selecionado.
Ganhos

Evento

Perda de oportunidade

A1

A2

A3

A1

A2

A3

10

15

16

A partir da determinao das perdas de oportunidade, podemos calcular agora as perdas de oportunidade esperada para cada ao.
Prob.

Risco
alto

Resultado
ponderado

Risco
mdio

Resultado
ponderado

Risco
pequeno

Resultado
ponderado

0,7

4,2

5,6

0,3

16

4,8

1,8

Total

1,0

Evento

Resultado
Esperado

4,8
R$4.800,00

6,0
R$6.000,00

5,6
R$5.600,00

As perdas de oportunidade esperada para cada portflio so: risco


alto POE(A1) = R$4.800,00; risco mdio POE(A2) = R$6.000,00; e risco
pequeno POE(A3) = R$5.600,00.

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

243

Teoria da deciso

5. A ao que minimiza a perda de oportunidade esperada a ao A1,


cuja perda de oportunidade esperada R$4.800,00, a menor das trs.
Portanto, a ao a ser tomada a de investir no portflio de risco alto.

6. So dados nmeros de aparelhos vendidos e a quantidade de ordens


recebidas. Ou seja, ocorreu somente em uma semana o pedido de 21
equipamentos. 24 equipamentos foram pedidos em duas semanas, e
assim por diante.

244

Nmero de
equipamentos
vendidos

Nmero de semanas
em que o nmero de
ordens foi recebido

Nmero de
equipamentos
vendidos

Nmero de semanas
em que o nmero de
ordens foi recebido

21

32

22

33

23

34

24

35

25

36

26

37

27

38

28

39

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

Teoria da deciso

Nmero de
equipamentos
vendidos

Nmero de semanas
em que o nmero de
ordens foi recebido

Nmero de
equipamentos
vendidos

Nmero de semanas
em que o nmero de
ordens foi recebido

29

40

30

41

31

42

Reorganizando a tabela e computando as frequncias relativas, teremos:

Nmero de
equipamentos vendidos

Frequncia de
ocorrncias

Frequncia relativa
de ocorrncias

21

0,05

24

0,10

25

0,10

26

0,15

27

0,15

28

0,05

31

0,05

32

0,05

33

0,05

34

0,05

37

0,05

38

0,05

39

0,05

42

0,05

Distribuio de frequncias relativas acumuladas:

Nmero de
equipamentos
vendidos

Nmero de semanas
em que o nmero de
ordens foi recebido

Nmero de
equipamentos
vendidos

Nmero de semanas
em que o nmero de
ordens foi recebido

21

0,05

32

0,70

22

0,05

33

0,75

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

245

Teoria da deciso

Nmero de
equipamentos
vendidos

Nmero de semanas
em que o nmero de
ordens foi recebido

Nmero de
equipamentos
vendidos

Nmero de semanas
em que o nmero de
ordens foi recebido

23

0,05

34

0,80

24

0,15

35

0,80

25

0,25

36

0,80

26

0,40

37

0,85

27

0,55

38

0,90

28

0,60

39

0,95

29

0,60

40

0,95

30

0,60

41

0,95

31

0,65

42

1,00

O grfico da distribuio de frequncias acumuladas a ogiva de


Galton a seguir:
Distribuio acumulada

1
0,9
Probabilidade

0,8
0,7
0,6
0,5
0,4
0,3
0,2
0,1
0

7. Preenchendo os vazios:
Estados da
natureza

P0()

P(X/)

P0() P(X/)

P1(/X)

1 = Casas tero
preos aumentados no prximo
ano

0,80

1,00 0,60 = 0,40

0,80 . 0,40 = 0,32

0,32/0,44 = 0,73

246

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

Teoria da deciso

Estados da
natureza

P0()

P(X/)

P0() P(X/)

P1(/X)

1 = Casas tero
preos iguais ou
diminudos no prximo ano

1,00 0,80 = 0,20

0,60

0,20 . 0,60 = 0,12

0,12/0,44 = 0,27

1,00

1,00

0,32 + 0,12 = 0,44

0,73 + 0,27 = 1,00

Total

Interpretao das probabilidades:

P0() probabilidades a priori dos estados da natureza. A probabilidade a priori de que as casas tero seus preos aumentados no prximo
ano de 80%. E de no terem seus preos aumentados de 20%.

P(X/) probabilidades determinadas atravs de observaes amostrais ou de dados do passado.

P1(/X) probabilidades a posteriori dos estados da natureza. So chamadas de probabilidades revisadas com base em observaes amostrais.

8. Encontrar os valores de a e de b.
Estados da natureza

P0()

P0()

P0() P0()

P1(/X)

0,50

0,5 a

0,25

0,50

0,5 b

0,75

Total

0,5a + 0,5b

Sabemos que:

0,5a
0,5a + 0,5b = 0,25

0,5b
= 0,75
0,5a + 0,5b

Resolvendo o sistema de duas equaes e duas incgnitas, chegamos


ao resultado que: a = P0(1) = 0,25 e que b = P0(2) = 0,75.

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

247

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

Anlise de sries temporais

Problema
A empresa ABC do ramo de informtica. Um dos carros-chefe da empresa um novo modem que est tendo muita aceitao no mercado. Os
diretores desejam fazer previses de vendas para os prximos meses com
base nos dados de venda dos ltimos 24 meses.
A tabela abaixo apresenta o resultado das vendas:
Tabela 1 nmero de modems vendidos
Ms

Vendas (R$)

48

53

46

51

47

50

49

55

55

10

51

11

54

12

52

13

51

14

55

15

47

16

51

17

53

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

249

Anlise de sries temporais

Ms

Vendas (R$)

18

56

19

52

20

50

21

50

22

48

23

51

24

53

Desejamos construir um modelo matemtico idealmente satisfatrio


dessa srie temporal. Idealmente deveramos procurar definir e medir os
muitos fatores que determinam as variaes da quantidade vendida e ento
estabelecer as relaes matemticas entre esses fatores e a particular srie
em questo. No entanto, as determinantes das mudanas de uma srie temporal como essa so mltiplas, incluindo fatores como concorrncia, preferncias do consumidor, tecnologia, investimentos, clima, costumes e mais
uma srie de variveis econmicas e no econmicas.
A enormidade e a impraticabilidade da tarefa de medir todos esses fatores e ento relacion-los matematicamente dificulta o enfoque chamado
direto. Assim, a opo por um enfoque mais prtico e indireto tem sido a
opo de contorno dessas dificuldades.

Conceitos fundamentais
A anlise de sries temporal clssica essencialmente um mtodo que
busca quebrar uma srie em distintos componentes que representam os
efeitos de fatores explanatrios. Esses componentes so: (I) tendncia; (II)
flutuaes cclicas; (III) variaes sazonais; e (IV) movimentos irregulares.

Srie temporal
Uma srie temporal um conjunto de observaes de uma varivel quantitativa coletada no tempo. A srie pode ser determinada em qualquer intervalo de tempo, hora, dia, semana, ms, trimestre ou ano, dependendo do

250

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

Anlise de sries temporais

interesse do tomador de decises ou das condies do estudo ou ainda da


disponibilidade de informaes.
Qualquer varivel quantitativa pode ser medida no tempo e na rea de
negcios pode interessar fazer medidas de vendas, preos, inventrios e
assim por diante.

Grfico de linhas
Como verificado no captulo de anlise de dados, o grfico adequado
para a apresentao dos dados de uma srie temporal um grfico de
linhas. Para o exemplo da venda dos modems, o grfico correspondente
o apresentado a seguir:
Grfico de linhas
58
56
54
52
50
48
46
44
42
40
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24

Mtodos de sries temporais


As tcnicas que analisam o comportamento de dados do passado e do
presente para predizer o futuro so chamadas de modelos de extrapolao. A
forma geral de tais modelos t+1 = f (Yt, Yt-1, Yt-2 ...), em que t+1 representa o valor
predito para a varivel em questo no perodo t + 1. Yt representa o valor da srie
no tempo t, Yt-1 representa o valor da srie no tempo t 1 e assim por diante.
O objetivo de um modelo de extrapolao identificar a funo f(.) que
produza previses de valores futuros da varivel da srie temporal.

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

251

Anlise de sries temporais

Tendncia
A tendncia se refere a movimentos crescentes ou decrescentes de uma
srie temporal em um longo perodo de tempo.
Antes que uma tendncia de uma particular srie possa ser determinada,
geralmente necessrio submeter os dados a algum tratamento preliminar, como, por exemplo, verificar a quantidade em relao a uma populao
determinada durante o perodo em que os dados foram coletados. Dessa
forma, caracteriza-se a quantidade per capita.
O grfico a seguir apresenta uma srie com tendncia crescente. Observe
que a linha de tendncia faz um ngulo significativamente maior que zero
com o eixo X.
1650
1500
1350
1200
1050
1

13

17

20

Srie temporal estacionria


Uma srie temporal dita estacionria se no h uma tendncia de crescimento ou decrescimento significativo nos dados atravs do tempo. Se a srie
temporal apresentar alguma dessas tendncias, ela dita no estacionria.
Em uma srie estacionria, os dados esto espalhados no tempo de forma
aleatria ao redor de uma reta paralela ao eixo X, que representa os valores da
mdia dos dados, apresentando um equilbrio estvel. Uma srie pode ser estacionria durante um perodo e no estacionria durante outro perodo.
A srie a seguir pode ser considerada estacionria. Observe que a linha de
tendncia da srie paralela ao eixo X.

252

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

Anlise de sries temporais

120

110

100

90

80
1

2 3

4 5

6 7

9 10 11 12 13 14 15 16

Erro Mdio Quadrtico (EMQ)


Vrios mtodos podem ser utilizados para modelar dados de uma srie
temporal. Uma forma de avaliar qual o melhor modelo estudar qual explica melhor o comportamento da srie em relao aos dados do passado.
Podemos fazer essa verificao atravs da comparao dos dados reais (Y)
com os dados decorrentes do ajuste do modelo ().
Com base nas observaes acima, podemos definir o Erro Mdio Quadrtico (EMQ) correspondente a cada um dos modelos propostos. Aquele modelo
com o menor erro mdio quadrtico ser considerado o mais adequado.
O EMQ definido como a soma da diferena entre os valores observados
e valores reais dividida por n.
EMQ =

(Y )2
n

O EMQ bastante prximo do critrio de mnimos quadrados ordinrios


utilizado na construo do modelo de regresso linear simples.

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

253

Anlise de sries temporais

Ciclo
Flutuaes cclicas ou movimentos cclicos so movimentos de crescimento ou decrescimento recorrentes em torno dos nveis de tendncia.

Sazonalidade
Variaes sazonais so ciclos que se completam dentro de um perodo de
calendrio regular, repetindo esse padro bsico ao longo de toda a srie. Os
maiores fatores que produzem esses padres repetidos ocorrem em sries
anuais que obedecem a variaes sazonais devido ao clima e aos costumes.
Todos os anos, no perodo que antecede o inverno, h um crescimento
da venda de roupas para o frio. Tambm h todo ano um crescimento de
vendas em datas como o Dia das Mes, Dia dos Pais, Dia das Crianas e no
perodo do Natal.

Movimentos irregulares
Movimentos irregulares so flutuaes nas sries temporais que tm durao curta, tm natureza errtica e no seguem nenhuma regularidade recorrente ou outro padro discernvel.

Mtodo dos mnimos quadrados ordinrios


Para situaes nas quais desejvel ter uma equao matemtica para
descrever a tendncia em uma srie temporal, o mtodo mais comumente
usado ajustar alguma forma de funo polinomial para os dados. Nesta
seo, vamos ilustrar o mtodo geral atravs de um exemplo simples, ajustando uma linha reta ao mtodo dos mnimos quadrados.

O mtodo dos mnimos quadrados


O mtodo dos mnimos quadrados, quando usado para ajustar linhas
retas de tendncia em dados de sries temporais, empregado principalmente porque simples e prtico e fornece o melhor ajustamento de acordo
com um critrio razovel.

254

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

Anlise de sries temporais

No entanto, devemos alertar que o mtodo de mnimos quadrados no


tem o mesmo tipo de suporte terico quando aplicado para ajustar retas na
anlise de regresso, conforme visto no captulo 6.
A maior dificuldade que as suposies probabilsticas feitas na anlise de
regresso simplesmente no so encontradas na anlise de sries temporais.
No exemplo que analisamos naquele captulo, verificamos como gastos em
pesquisa e desenvolvimento tecnolgico podem afetar positivamente o faturamento de empresas de informtica. Naquele caso, o faturamento era considerado uma varivel aleatria e o investimento uma varivel fixa ou controlada.
Para a varivel dependente, o modelo assumia distribuies de probabilidade condicional dessa varivel aleatria em torno de seus valores que
caiam na reta de regresso. Os valores Y eram as mdias das distribuies
de probabilidade condicional. Algumas suposies estavam implcitas nesse
tipo de modelo: os desvios em torno da reta eram considerados erros aleatrios descritos por uma distribuio de probabilidades. As sucessivas observaes da varivel dependente foram assumidas como independentes.
Por exemplo, os gastos da empresa B em p&d no dependiam dos gastos da
empresa A, e assim por diante.
Se uma reta ajustada, por exemplo, para uma srie de tempo anual
sobre vendas, o tempo tratado como a varivel independente X e as
vendas como a varivel independente Y. No razovel pensar que os desvios das vendas reais em um dado ano seja um erro aleatrio. De fato, se os
dados originais so anuais, os desvios em relao reta podem ser devido
a operaes cclicas ou fatores irregulares. Se a srie for de um ano, no faz
sentido pensar em fatores sazonais devidos ao clima ou costumes porque a
srie duraria um s perodo.
Finalmente, a suposio de independncia no encontrada em uma
srie temporal. As vendas de um determinado ms certamente no so independentes do que foi vendido no ms anterior.

Ajustamento de uma reta


Como exemplo, vamos ajustar uma reta pelo mtodo dos mnimos quadrados para as vendas de computadores de uma grande loja durante o perodo de 1993 a 2007, conforme tabela a seguir:

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

255

Anlise de sries temporais

Ano

Tempo

Vendas (R$)

1993

2.484

1994

2.767

1995

2.088

1996

3.611

1997

4.216

1998

4.665

1999

5.275

2000

5.616

2001

6.165

2002

10

6.720

2003

11

7.400

2004

12

7.975

2005

13

8.800

2006

14

9.520

2007

15

10.450

A reta de regresso pode ser expressa como = a + b t. Os valores de a


e b estimados atravs do mtodo de regresso so substitudos na reta e o
modelo linear que explica a relao.
O sistema de equaes normais dado ento por:
y=a+bt

tY = at + bt 2
Usualmente, quando uma equao de regresso utilizada para sries
temporais, os valores dos tempos so transformados para valores com
poucos dgitos. Ento, o ano 1993 ser transformado para 1, o de 1994 para 2
e assim por diante. Poderamos tambm transformar os dados fazendo o ano
central igual a 0, os anteriores 1, 2 ... e os posteriores 1, 2... Utilizaremos a
primeira opo. Dessa forma, o sistema de equaes normais ser:
88 752 = 15a + 120b
8 666 864 = 120a + 1 240b
256

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

Anlise de sries temporais

Resolvendo o sistema, encontraremos os valores de a = 1 435,43 e b =


560,17. A reta de regresso ser ento: = 1 435,43 + 560,17 t.
O grfico que se segue representa os dados originais e a reta de regresso
ajustada.
Grfico de vendas
12 000
10 000
8 000
6 000
4 000
2 000
0
0

10

15

20

O valor de r2, o coeficiente de determinao, igual a 0,987, ou seja, o ajuste


bastante bom para essa srie. O valor de a = 1 453,43 tem a mesma interpretao
que na reta de regresso. o valor de vendas para t = 0, ou seja, para o ano 1992.
Tambm b = 560,17 a variao de vendas para a variao de um ano.

Projeo no tempo
Projees na reta determinada podem ser obtidas se substituirmos t na
reta por valores apropriados. Por exemplo, a projeo para vendas de computador para o ano de 2008, por exemplo, pode ser realizada assumindo o
valor t = 16 na reta de tendncia. Ento, os valores das vendas seriam = 1
435,43 + 560,17 t = 1 435,43 + 560,17 . (16) = 10 398,2, ou simplesmente 10
398 computadores.
Essas estimativas podem ser feitas para mais um ou dois perodos, e ainda
assim h um alto grau de incerteza. Se predies para mais tempo forem
desejadas, estimativas de outros fatores teriam que ser acrescentados estimativa da tendncia.

Flutuaes cclicas
Como foi indicado previamente, quando uma srie temporal consistir de
dados anuais, ela poder conter tendncia, ciclo e elementos irregulares. As
Este material parte integrante do acervo do IESDE BRASIL S.A.,
mais informaes www.iesde.com.br

257

Anlise de sries temporais

variaes sazonais estaro ausentes, uma vez que elas ocorrem dentro de
um ano. Ento, desvios dos dados anuais em relao reta de tendncia so
atribuveis somente a fatores cclicos e irregulares.
Os desvios em relao tendncia so mais facilmente observados dividindo o valor dos dados originais pelos valores correspondentes na linha de
tendncia para o mesmo perodo. Por conveno, o resultado da diviso do
dado original pelo valor na linha de tendncia multiplicado por 100 para
expressar os resultados como percentuais de tendncia.
Assim, se o dado original exatamente igual ao valor estimado, a percentagem de tendncia ser igual a 100. Se o dado original maior do que
o valor estimado, o valor da percentagem de tendncia ser maior que 100,
caso contrrio ser menor.
A expresso para a percentagem de tendncia ento dada por:
Percentagem de tendncia = (Y/).100
Quando convertidos percentagem de tendncia, os dados contm somente os movimentos cclicos e irregulares, uma vez que a diviso pela tendncia elimina aquele fator. O modelo multiplicativo para a anlise fornece a
lgica desse procedimento. Isto , os dados originais so vistos como representando os efeitos combinados de tendncia, ciclo e fatores irregulares.
Em smbolos, T, C e I representam tendncia, ciclo e fatores irregulares,
respectivamente. Dividindo a srie temporal original pelos resultados obtidos dos valores da tendncia, produzem:

T.C.I
T

= C.I

As percentagens de tendncia da srie de vendas de computador mostrada no incio desta seo est apresentada na tabela e no grfico a seguir:
Tempo

258

Vendas (R$)

Yest.

%Tend.

2.484

1 995,6

124,5

2.767

2 555,8

108,3

3.088

3 115,9

99,1

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

Anlise de sries temporais

Tempo

Vendas (R$)

Yest.

%Tend.

3.611

3 676,1

98,2

4.216

4 236,3

99,5

4.665

4 796,5

97,3

5.275

5 356,6

98,5

5.616

5 916,8

94,9

6.165

6 477,0

95,2

10

6.720

7 037,1

95,5

11

7.400

7 597,3

97,4

12

7.975

8 157,5

97,8

13

8.800

8 717,7

100,9

14

9.520

9 277,8

102,6

15

10.450

9 838,0

106,2

Percentagem de tendncia
130
125
120
115
110
105
100
95
90
1

2 3

5 6

7 8
Tempo

9 10 11 12 13 14 15

Abaixo e acima da linha que representa 100% esto as percentagens que


podem mostrar picos e vales durante o perodo estudado. Esses grficos de
flutuaes cclicas so muito teis na rea de negcios e aparecem frequentemente em jornais e peridicos econmicos. Eles podem ainda ser utilizados
para verificar a amplitude das flutuaes, da durao dos perodos de expanso
e contrao e para outros itens de interesse dos ciclos de negcios.

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

259

Anlise de sries temporais

Modelo de mdias mveis


A tcnica conhecida como mdias mveis provavelmente o mtodo
de extrapolao mais simples para dados estacionrios. Com essa tcnica, o
valor predito para a srie temporal no perodo t + 1, denotado t+1, simplesmente a mdia das k observaes anteriores da srie, isto :
t+1 = (Yt + Yt-1 + ... + Yt-k+1)
K
O valor k determina quantas observaes prvias sero includas na mdia
mvel. No h um valor de k que seja teoricamente melhor que outro, sendo
assim devemos tentar vrios valores para escolher o melhor.
O primeiro exemplo do captulo forneceu informaes da quantidade de
modems vendidos durante um perodo de 24 meses. A tabela a seguir reproduz a quantidade das vendas. Observe que para k = 2, o valor 3 = 50,5 a
mdia entre Y1 = 48 e Y2 = 53. O valor 4 = 49,5 a mdia entre Y2 = 53 e Y3 =
46, e assim por diante.

Ms

260

Vendas (R$)

p/ mdia mveis

p/ mdia mveis

2 meses

4 meses

48

53

46

50,5

51

49,5

47

48,5

49,5

50

49

49,25

49

48,5

48,5

55

49,5

49,25

55

52

50,25

10

51

55

52,25

11

54

53

52,5

12

52

52,5

53,75

13

51

53

53

14

55

51,5

52

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

Anlise de sries temporais

Ms

Vendas (R$)

p/ mdia mveis

p/ mdia mveis

2 meses

4 meses

15

47

53

53

16

51

51

51,25

17

53

49

51

18

56

52

51,50

19

52

54,5

51,75

20

50

54

53

21

50

51

52,75

22

48

50

52

23

51

49

50

24

53

49,5

49,75

EMQ

9,55

9,35

Procedimento semelhante se aplica a outros valores de k. Para k = 4, em


que 5 = (Y1 + Y2 + Y3 + Y4)/4, os valores restantes so calculados com igual
procedimento. O grfico a seguir apresenta as trs sries. A srie 1 corresponde aos dados reais. A srie 2 e a srie 3 correspondem s mdias mveis
com k = 2 e k = 4, respectivamente.
Mdia mvel com k = 2 e k = 4
58
56
54
52

Srie 1
Srie 2
Srie 3

50
48
46
44
1

11

13

15

17

19

21

23

Os grficos mostram que os valores preditos tendem a ser menos volteis, ou mais suaves, do que os dados reais. Isso ocorre porque o mtodo
de mdias mveis retira os picos e os vales. Esse mtodo ento conhecido
como mtodo de suavizao ou alisamento. Quanto maior for o valor de k,
maior ser a suavizao, como pode ser observado no grfico anterior.
Este material parte integrante do acervo do IESDE BRASIL S.A.,
mais informaes www.iesde.com.br

261

Anlise de sries temporais

Podemos verificar a acurcia relativa das duas funes de previso atravs da comparao entre os erros mdios quadrticos. Os valores dos erros
mdios quadrticos para k = 2 e k = 4 so determinados pela expresso do
EMQ e so dados na tabela. O EMQ(k = 2) = 9,55 e EMQ(k = 4) = 9,35. O modelo
com quatro mdias um pouco melhor do que o modelo com duas mdias.

Previso com o modelo de mdias mveis


Supondo que o modelo com mdia mvel de 2 meses para a venda de
modems possa ser aceito como satisfatrio, a predio do nmero de modems
a ser vendido no vigsimo-quinto ms calculado como:
25 =

(Y24 + Y23)
2

(53 + 51)
2

= 52

Para fazer previses alm de um nico perodo e do conjunto de dados da


srie temporal usando a tcnica de mdias mveis, devemos substituir os valores previstos por valores reais no observados. Por exemplo, suponha que
ao final do perodo 24 desejamos prever o nmero de modems que sero
vendidos nos perodos 25 e 26. Usando a mdia mvel de dois perodos, a
previso para o perodo 26 ser:

26 =

(Y25 + Y24)
2

No entanto, no sabemos o valor real de Y25. Temos que substituir Y25 por
25 na equao passada, assim:
26 =

(25 + Y24) (52 + 53)


= 52,5
=
2
2

Mtodo de mdias mveis


para estudar sazonalidade
Para derivar um conjunto de ndices de uma srie caracterizada por um
padro sazonal estvel, cerca de cinco a nove anos de dados mensais ou trimestrais so necessrios. Um padro de sazonalidade estvel significa que picos e
vales geralmente ocorrem nos mesmos meses ou trimestres a cada ano.
262

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

Anlise de sries temporais

Um exemplo de valores de vendas de televisores em uma rede de lojas de


departamentos no pas durante um perodo de cinco anos; medidos a cada
trimestre, ser til para ilustrar o mtodo.
Tabela 2 Vendas de televiso
Vendas
(em milhares
de reais)

Ano

Trimestre

2003

942

2003

II

1355,4

2003

III

1168,8

2003

IV

1248,3

2004

998,5

2004

II

1470

2004

III

1297,1

2004

IV

1311,2

2005

1113,5

2005

II

1565,2

2005

III

1410,9

2005

IV

1484

2006

1152,4

2006

II

1653,5

2006

III

1442,6

2006

IV

1535,8

2007

1267,1

2007

II

1678,7

2007

III

1527

2007

IV

1625,3

O grfico a seguir representa a srie correspondente aos valores de venda


de televiso no perodo:

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

263

Anlise de sries temporais

Vendas de televiso
1 750
1 500
1 250
1 000
750
1

11

13

15

17

19

Os dados revelam que nos dois primeiros trimestres de cada semestre, ou


seja, no primeiro e no terceiro trimestres, h uma queda no valor das vendas
de televiso.
O processo de determinao das mdias mveis consistir em calcular
inicialmente a soma das vendas em 2003 (942; 1 355,4; 1 168,8 e 1 248,3) correspondentes aos quatro primeiros valores de venda. O resultado encontrado foi de 4 714,5, como pode ser observado na tabela a seguir:

264

Vendas
(em milhares
de reais)

Ano

Trimestre

Total 1

2003

942

2003

II

1.355,4

2003

III

1.168,8

4.714,5

2003

IV

1.248,3

4.771

2004

998,5

4.885,6

2004

II

1.470

5.013,9

2004

III

1.297,1

5.076,8

2004

IV

1.311,2

5.191,8

2005

1.113,5

5.287

2005

II

1.565,2

5.400,8

2005

III

1.410,9

5.573,6

2005

IV

1.484

5.612,5

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

Anlise de sries temporais

Vendas
(em milhares
de reais)

Ano

Trimestre

Total 1

2006

1.152,4

5.700,8

2006

II

1.653,5

5.732,5

2006

III

1.442,6

5.784,3

2006

IV

1.535,8

5.899

2007

1.267,1

5.924,2

2007

II

1.678,7

6.008,6

2007

III

1.527

6.098,1

2007

IV

1.625,3

Este processo deve ser continuado a partir do II trimestre de 2003. Ento


o valor R$4.771,00 o resultado da soma dos quatro valores subsequentes
(R$1.355,40; R$1.168,80; R$1.248,30 e R$998,50). Dessa forma, completa-se a
quarta coluna da tabela, Total 1, como resultado da soma de quatro valores.
A coluna seguinte, Total 2, ser o resultado da soma de dois em dois
valores. Assim, o total R$9.485,50 o resultado da soma de R$4.714,50 e
R$4.771,00. O Total 2 o resultado ento da soma de oito valores. Ver destaque na tabela a seguir:
Vendas
(em milhares
de reais)

Ano

Trimestre

Total 1

Total 2

2003

942

2003

II

1.355,4

2003

III

1.168,8

4.714,5

9.485,5

2003

IV

1.248,3

4.771

9.656,6

2004

998,5

4.885,6

9.899,5

2004

II

1.470

5.013,9

10.090,7

2004

III

1.297,1

5.076,8

10.268,6

2004

IV

1.311,2

5.191,8

10.478,8

2005

1.113,5

5.287

10.687,8

2005

II

1.565,2

5.400,8

10.974,4

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

265

Anlise de sries temporais

Vendas
(em milhares
de reais)

Ano

Trimestre

Total 1

Total 2

2005

III

1.410,9

5.573,6

11.186,1

2005

IV

1.484

5.612,5

11.313,3

2006

1.152,4

5.700,8

11.433,3

2006

II

1.653,5

5.732,5

11.516,8

2006

III

1.442,6

5.784,3

11.683,3

2006

IV

1.535,8

5.899

11.823,2

2007

1.267,1

5.924,2

11.932,8

2007

II

1.678,7

6.008,6

12.106,7

2007

III

1.527

6.098,1

2007

IV

1.625,3

Os outros valores da coluna Total 2 so calculados da mesma forma.


Agora, possvel calcularmos as mdias de vendas para cada perodo
de 8 trimestres, dividindo-se o Total 2 por 8. Essas determinaes esto
na seguinte tabela:

266

Vendas
(em milhares
de reais)

Ano

Trimestre

Total 1

Total 2

2003

942

2003

II

1.355,4

2003

III

1.168,8

4.714,5

9.485,5

1.185,69

2003

IV

1.248,3

4.771

9.656,6

1.207,08

2004

998,5

4.885,6

9.899,5

1.237,44

2004

II

1.470

5.013,9

10.090,7

1.261,34

2004

III

1.297,1

5.076,8

10268,6

1.283,58

2004

IV

1.311,2

5.191,8

10.478,8

1.309,85

2005

1.113,5

5.287

10.687,8

1.335,98

2005

II

1.565,2

5.400,8

10.974,4

1.371,8

2005

III

1.410,9

5.573,6

11.186,1

1.398,26

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

Mdia mvel

Anlise de sries temporais

Vendas
(em milhares
de reais)

Ano

Trimestre

Total 1

Total 2

Mdia mvel

2005

IV

1.484,00

5.612,50

11.313,30

1.414,16

2006

1.152,40

5.700,80

11.433,30

1.429,16

2006

II

1.653,50

5.732,50

11.516,80

1.439,60

2006

III

1.442,60

5.784,30

11.683,30

1.460,41

2006

IV

1.535,80

5.899,00

11.823,20

1.477,90

2007

1.267,10

5.924,20

11.932,80

1.491,60

2007

II

1.678,70

6.008,60

12.106,70

1.513,34

2007

III

1.527,00

6.098,10

2007

IV

1.625,30

O grfico a seguir apresenta a srie original das vendas e a nova srie de


mdias mveis sem a influncia da sazonalidade.
1 750
1 500
1 250
1 000
750
1

11

13

15

17

19

Observe que essa srie de mdias mveis no igual reta que se obteria
se utilizssemos o mtodo de mnimos quadrados, procedimento que resulta
na reta de regresso ou tendncia. A tabela que se segue apresenta os dois resultados para efeito de comparao. Pode-se observar que os valores so bem
prximos.
Ano

Trimestre

Mdia mvel

Regresso

2003

III

1.185,69

1.181,3

2003

IV

1.207,08

1.205,4

2004

1.237,44

1.229,6

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

267

Anlise de sries temporais

Ano

Trimestre

Mdia mvel

Regresso

2004

II

1.261,34

1.253,7

2004

III

1.283,58

1.277,9

2004

IV

1.309,85

1.302,0

2005

1.335,98

1.326,1

2005

II

1.371,80

1.350,3

2005

III

1.398,26

1.374,4

2005

IV

1.414,16

1.398,6

2006

1.429,16

1.422,7

2006

II

1.439,60

1.446,9

2006

III

1.460,41

1.471,0

2006

IV

1.477,90

1.495,2

2007

1.491,60

1.519,3

2007

II

1.513,34

1.543,5

til verificar algumas informaes reveladas no grfico dos dados originais e os dados das mdias mveis. Os dados originais foram estabelecidos
trimestralmente e contm todos os componentes dos movimentos de tendncia, ciclo, sazonal e movimentos irregulares.
Embora o perodo nesse exemplo seja um pouco curto para que a
tendncia seja revelada, podemos observar que as vendas de televiso
tendem a crescer durante todo o perodo. Movimentos irregulares esto
presentes. A mdia mvel, que passa suavemente entre os dados, segue
uma tendncia crescente. Se as flutuaes cclicas esto claramente indicadas, podemos ser capazes de observar como as mdias mveis as
descrevem bem.

Retirada da sazonalidade
A percentagem da mdia mvel dada pela razo entre os dados originais
e os das mdias mveis multiplicada por 100, como de costume.

268

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

Anlise de sries temporais

Ano

Vendas
Trimestre (em milhares
de reais)

Mdia mvel

Percentagem
m. mveis

2003

942

2003

II

1.355,4

2003

III

1.168,8

1.185,69

98,60

2003

IV

1.248,3

1.207,08

103,40

2004

998,5

1.237,44

80,70

2004

II

1.470

1.261,34

116,50

2004

III

1.297,1

1.283,58

101,10

2004

IV

1.311,2

1.309,85

100,10

2005

1.113,5

1.335,98

83,30

2005

II

1.565,2

1.371,80

114,10

2005

III

1.410,9

1.398,26

100,90

2005

IV

1.484

1.414,16

104,90

2006

1.152,4

1.429,16

80,60

2006

II

1.653,5

1.439,60

114,90

2006

III

1.442,6

1.460,41

98,80

2006

IV

1.535,8

1.477,90

103,90

2007

1.267,1

1.491,60

84,90

2007

II

1.678,7

1.513,34

110,90

2007

III

1.527

2007

IV

1.625,3

Esses valores podem ser apresentados atravs de um grfico com centro


no valor 100%. Podemos ver no grfico que os movimentos de tendncia
e de ciclo no esto mais presentes. A linha base 100 representa o nvel de
mdia mvel ou base tendncia-ciclo. As flutuaes acima e abaixo desta
linha revelam claramente o movimento sazonal repetitivo das vendas de televiso. Como notado antes, a componente irregular tambm est presente.
Verifique essas observaes no grfico a seguir:

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

269

Anlise de sries temporais

Percentagem de mdias mveis


120
110
100
90
80
1

2 3

9 10 11 12 13 14 15 16

O prximo passo no procedimento remover o efeito dos movimentos irregulares. Isso conseguido atravs do clculo de mdias das percentagens
das mdias mveis para o mesmo trimestre. Isto , calculamos as mdias de
todos os primeiros trimestres e depois de todos os segundos trimestres, e
assim por diante.

270

Ano

Trimestre

Percentagem m. mveis

2003

2003

II

2003

III

98,60

2003

IV

103,40

2004

80,70

2004

II

116,50

2004

III

101,10

2004

IV

100,10

2005

83,30

2005

II

114,10

2005

III

100,90

2005

IV

104,90

2006

80,60

2006

II

114,90

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

Anlise de sries temporais

Ano

Trimestre

Percentagem m. mveis

2006

III

98,80

2006

IV

103,90

2007

84,90

2007

II

110,90

2007

III

2007

IV

Percentagem de mdias mveis por trimestre:


Ano

Trimestre I

Trimestre II

Trimestre III

Trimestre IV

2003

98,60

103,40

2004

80,70

116,50

101,10

100,10

2005

83,10

114,10

100,90

104,90

2006

80,60

114,90

98,80

103,90

2007

84,90

110,90

82,02

114,48

99,84

103,67

Mdia

Quando dividimos o valor dos dados originais de valor de venda pelas percentagens mdias das mdias mveis por trimestre e multiplicamos por 100,
encontramos os valores estimados para trimestre, retirando a sazonalidade.
Ento, para o primeiro valor de vendas R$942 milhes pelo ndice sazonal de
82,02 e multiplicando-se esse resultado por 100, obtemos o valor de R$1.148,53
milhes. O mesmo procedimento realizado para todos os outros trimestres:

Ano

Vendas
Trimestre (em milhares
de reais)

ndice de
sazonalidade

Valores sem
sazonalidade

2003

942

82,02

1.148,50

2003

II

1.355,4

114,48

1.183,96

2003

III

1.168,8

99,84

1.170,67

2003

IV

1.248,3

103,67

1.204,11

2004

998,5

82,02

1.217,39

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

271

Anlise de sries temporais

Ano

Vendas
Trimestre (em milhares
de reais)

ndice de
sazonalidade

Valores sem
sazonalidade

2004

II

1.470

114,48

1.284,07

2004

III

1.297,1

99,84

1.299,18

2004

IV

1.311,2

103,67

1.264,78

2005

1.113,5

82,02

1.357,60

2005

II

1.565,2

114,48

1.367,23

2005

III

1.410,9

99,84

1.413,16

2005

IV

1.484

103,67

1.431,47

2006

1.152,4

82,02

1.405,02

2006

II

1.653,5

114,48

1.444,36

2006

III

1.442,6

99,84

1.444,91

2006

IV

1.535,8

103,67

1.481,43

2007

1.267,1

82,02

1.544,87

2007

II

1.678,7

114,48

1.466,37

2007

III

1.527

99,84

1.529,45

2007

IV

1.625,3

103,67

1.567,76

O grfico seguinte apresenta os valores sem sazonalidade.


Valores sem sazonalidade
1650
1500
1350
1200
1050
1

13

17

Podemos observar no grfico a tendncia subjacente e os movimentos


irregulares. Comparando com os dados originais, observamos que o movimento sazonal j no se encontra mais presente.
272

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

Anlise de sries temporais

Outros mtodos de previso


Alm dos mtodos apresentados, vrias outras propostas podem ser incrementadas para o estudo de sries temporais. Para os mtodos de mdias
mveis apresentados, podemos observar que todos os dados do passado
tm o mesmo peso. No entanto, muitas vezes os dados mais recentes podem
influenciar mais fortemente as previses. A tcnica conhecida como mdias
mveis ponderadas permite assinalar diferentes pesos para os dados que participaro como base de previses.
Tambm a tcnica conhecida como alisamento exponencial permite a ponderao de dados provenientes de dados estacionrios. Nesse caso, busca-se
a melhor combinao de pesos para os dados de tal forma que dados mais
recentes tenham maior peso e tambm buscando encontrar o melhor valor
dos ponderadores para obteno de menor erro mdio quadrtico. Uma srie
estacionria pode ter efeitos de sazonalidade tanto aditivos como multiplicativos. Essa considerao leva tambm construo de modelos particulares.
Para estudar tendncia, proposto um modelo de mdias mveis duplas.
Essa tcnica envolve tomar mdias de mdias. O alisamento exponencial
duplo uma derivao dessa tcnica que implica considerar tambm ponderaes. O mtodo de Holt faz parte dessas tcnicas. Alm de considerar
a tendncia, dados no estacionrios podem adicionalmente apresentar
sazonalidade. Aqui tambm os efeitos sazonais podem ser de natureza aditiva ou multiplicativa. O mtodo de Holt-Winter outra tcnica que
pode ser aplicada a sries temporais que exibem efeitos de tendncia e
sazonalidade.
Alguns modelos podem ser considerados como uma representao probabilstica de uma srie temporal. Nesse caso, o modelo caracterizado
como um processo estocstico ou uma funo aleatria. Esses modelos, considerados atravs do mtodo de Box & Jenkins, consistem em trs estgios.
O primeiro, de identificao, propicia verificar se a srie temporal pode ser
descrita atravs de uma combinao de mdias mveis e termos de autocorrelao. No segundo estgio, estimao, os dados da srie temporal so
usados para estimar os parmetros do modelo tentativa; e o terceiro estgio,
teste-diagnstico, consiste em testes para examinar os desvios do modelo
ajustado para determinar a adequao dos modelos.

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

273

Anlise de sries temporais

Atividades de aplicao

A tabela a seguir mostra os resultados da produo de um componente eletrnico em uma fbrica. Os dados serviro para a resoluo dos
exerccios de 1 a 4.
Ano

Produo (em 1 000)

Ano

Produo (em 1 000)

1994

1 286,40

2001

1 547,50

1995

1 324,40

2002

1 585,50

1996

1 368,70

2003

1 625,20

1997

1 426,90

2004

1 684,30

1998

1 478,60

2005

1 738,10

1999

1 511,10

2006

1 801,10

2000

1 533,40

2007

1 855,40

1. Determine a forma do modelo atravs do mtodo de mnimos quadrados.


2. Construa os grficos de linha e o grfico da regresso.
3. Quais os valores esperados de venda do componente eletrnico para
os anos de 2008 e 2009?
4. Faa uma anlise das flutuaes cclicas atravs do clculo da percentagem de tendncia.

274

As despesas em novas instalaes e equipamentos das indstrias manufatureiras no perodo de 1987 a 2006, em milhes de reais, so apresentadas na tabela a seguir. Faa as anlises propostas nos exerccios
de 5 a 7 acompanhadas dos respectivos grficos:
Ano

Despesas

Ano

Despesas

1987

11,44

1997

22,45

1988

14,97

1998

26,99

1989

15,96

1999

28,51

1990

11,44

2000

28,37

1991

12,08

2001

31,68

1992

14,48

2002

31,95

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

Anlise de sries temporais

Ano

Despesas

Ano

Despesas

1993

13,68

2003

29,99

1994

14,68

2004

31,35

1995

15,69

2005

38,01

1996

18,58

2006

46,10

5. Utilizar a tcnica de mdias mveis com k = 2 para fazer a previso de


vendas de automveis para os anos de 2007 e 2008.
6. Fazer as mesmas previses do exerccio 5 utilizando a tcnica de mdias mveis com k = 4.
7. Comparar os resultados obtidos nos exerccios 5 e 6 atravs da determinao do Erro Mdio Quadrtico (EMQ) de cada ano. Qual tcnica
mostrou-se mais adequada para a anlise proposta?
8. A tabela a seguir apresenta as vendas mensais em milhes de reais por
parte de fbricas de carros de passageiros para o perodo de janeiro
de 2003 a dezembro de 2007. Determinar uma nova srie utilizando a
primeira etapa do mtodo de mdias mveis para retirada da sazonalidade.
Ano
2004

Ms

Vendas

Janeiro

545,00

Fevereiro

Ano
2006

Ms

Vendas

Janeiro

666,00

528,40

Fevereiro

716,10

Maro

594,40

Maro

765,20

Abril

627,20

Abril

736,90

Maio

684,40

Maio

798,00

Junho

738,40

Junho

761,60

Julho

464,30

Julho

393,60

Agosto

254,00

Agosto

371,00

Setembro

454,20

Setembro

808,80

Outubro

365,40

Outubro

841,70

Novembro

341,10

Novembro

827,40

Dezembro

570,60

Dezembro

666,20

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

275

Anlise de sries temporais

Ano

Ms

2005

Vendas

Janeiro

678,10

Fevereiro

Ano
2007

Ms

Vendas

Janeiro

859,80

719,00

Fevereiro

815,50

Maro

815,90

Maro

882,80

Abril

736,60

Abril

786,60

Maio

716,70

Maio

880,10

Junho

761,30

Junho

873,30

Julho

468,00

Julho

677,50

Agosto

457,60

Agosto

415,70

Setembro

712,00

Setembro

666,10

Outubro

758,60

Outubro

887,20

Novembro

736,60

Novembro

827,10

Dezembro

593,20

Dezembro

745

Gabarito
1. Com o quadro a seguir, possvel determinar o sistema de equaes
normais da anlise de regresso:

Y = na + bX
XY = aX + bX2

Observe que os anos (X) podem ser reescritos de 1 a 14 ou da forma


como est na tabela, de dois em dois anos, para se fazer X = 0. Isso
facilita as contas e o sistema pode ser escrito como:

Y = na
XY = bX2
X

276

XY

X2

Yest

13

1 286,4

16 723,2

169

1 287,08

11

1 324,4

14 568,4

121

1 328,26

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

Anlise de sries temporais

X2

Yest

1 368,7

12 318,3

81

1 369,44

1 426,9

9 988,3

49

1 410,62

1 478,6

7 393,0

25

1 451,80

1 511,1

4 533,3

1 492,99

1 533,4

-1 533,4

1 534,17

1 547,5

1 547,5

1 575,35

1 585,5

4 756,5

1 616,53

1 625,2

8 126,0

25

1 657,71

1 684,3

11 790,1

49

1 698,89

1 738,1

15 642,9

81

1 740,07

11

1 801,1

19 812,1

121

1 781,25

13

1 855,4

24 120,2

169

1 822,43

21 766,6

18 737,4

910

Dessa forma:
a=
b=

XY

Y
n

XY
X2

Assim,

a=

21 766, 6
= 1 554,76
14

b=

18 737, 4
= 20,59
910

O modelo ser ento:

= a + bX = 1557,76 + 20,59X.

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

277

Anlise de sries temporais

2. O grfico adequado para representar uma srie temporal o chamado


grfico de linhas:
Grfico de linhas

1900
1800

Vendas

1700
1600
1500
1400
1300
1200

6
7
Tempo

10 11

12 13

14

Para a anlise de regresso entre os pontos, traa-se a reta de regresso


ou reta de tendncia:
Grfico de regresso

1900
1800

Vendas

1700
1600
1500
1400
1300
1200

Tempo

10

15

3. Os valores esperados de venda para os anos de 2008 e 2009 podem


ser obtidos substituindo os valores correspondentes a esses anos na
equao da reta de regresso. Para 2008, o valor de X ser igual a 15 e
para 2009 ser igual a 17. Assim:


278

Para X = 15,

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

Anlise de sries temporais

= 1 557,76 + 20,59X = 1 557,76 + 20,59(15) = 1 863,615.

Ou seja, o valor esperado de vendas para 2008 de 1 863 615 componentes.

Para X = 17,

= 1 557,76 + 20,59X = 1 557,76 + 20,59(17) = 1 904,796.

Ou seja, o valor esperado de vendas para 2009 de 1 904 796 componentes.

4. As flutuaes cclicas podem ser verificadas atravs da determinao


Y
da percentagem de tendncia, .100 .
Y
Y

Yest

(Y/Yest)100

1 286,4

1 287,08

99,95

1 324,4

1 328,26

99,71

1 368,7

1 369,44

99,95

1 426,9

1 410,62

101,15

1 478,6

1 451,80

101,85

1 511,1

1 492,99

101,21

1 533,4

1 534,17

99,95

1 547,5

1 575,35

98,23

1 585,5

1 616,53

98,08

1 625,2

1 657,71

98,04

1 684,3

1 698,89

99,14

1 738,1

1 740,07

99,89

1 801,1

1 781,25

101,11

1 855,4

1 822,43

101,81

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

279

Anlise de sries temporais

Percentagem de tendncia

110,00
108,00

% tendncia

106,00
104,00
102,00
100,00
98,00
96,00
94,00
92,00
90,00
0

10

15

Tempo

Observa-se que os dados oscilam em torno do valor 100%.

5. As mdias mveis para k = 2 so determinadas como as mdias dos


dois anos anteriores. O valor 13,21 a mdia entre 11,44 e 14,97. O
valor 15,47 a mdia entre 14,97 e 15,96, e assim por diante.

280

Ano

Despesas

k=2

1987

11,44

1988

14,97

1989

15,96

13,21

1990

11,44

15,47

1991

12,08

13,70

1992

14,48

11,76

1993

13,68

13,28

1994

14,68

14,08

1995

15,69

14,18

1996

18,58

15,19

1997

22,45

17,14

1998

26,99

20,52

1999

28,51

24,72

2000

28,37

27,75

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

Anlise de sries temporais

Ano

Despesas

k=2

2001

31,68

28,44

2002

31,95

30,03

2003

29,99

31,82

2004

31,35

30,97

2005

38,01

30,67

2006

46,10

34,68

Mdia mvel para k = 2

50
45

Despesas

40
35
30
25

Srie 1
Srie 2

20
15
10
5
0

9
11
Tempo

13

15

17

19

A previso para 2007 feita como a mdia entre os anos 2005 e 2006,
ento:
Y +Y
38, 01+ 46,10
Y2007 = 2005 2006 =
= 42, 06
2
2

O valor previsto de despesas para 2007 de R$42,06 milhes.

A previso para 2008 feita como a mdia entre os anos 2006 e 2007.
Como o valor para 2007 no conhecido, utiliza-se o valor calculado
da estimativa 2007 = 42,06:
Y + Y
46,10 + 42, 06
Y2008 = 2006 2007 =
= 44, 08
2
2

O valor previsto de despesas para 2008 de R$44,08 milhes.


Este material parte integrante do acervo do IESDE BRASIL S.A.,
mais informaes www.iesde.com.br

281

Anlise de sries temporais

6. As mdias mveis para k = 4 so determinadas como as mdias dos


quatro anos anteriores. O valor 13,45 a mdia entre 11,44, 14,97,
15,96 e 11,44. O valor 13,61 a mdia entre 14,97, 15,96, 11,44 e 12,08
e assim por diante.

282

Ano

Despesas

k=4

1987

11,44

1988

14,97

1989

15,96

1990

11,44

1991

12,08

13,45

1992

14,48

13,61

1993

13,68

13,49

1994

14,68

12,92

1995

15,69

13,73

1996

18,58

14,63

1997

22,45

15,66

1998

26,99

17,85

1999

28,51

20,93

2000

28,37

24,13

2001

31,68

26,58

2002

31,95

28,89

2003

29,99

30,13

2004

31,35

30,50

2005

38,01

31,24

2006

46,10

32,83

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

Anlise de sries temporais

Mdia mvel para k = 4

50

Despesas

40
30
Despesas
k=4

20
10
0

11
13
Tempo

15

17

19

A previso para 2007 feita como a mdia entre os anos 2003, 2004,
2005 e 2006, ento:

Y +Y +Y +Y
29, 99 + 31,35 + 38, 01+ 46,10
Y2007 = 2003 2004 2005 2006 =
= 36,36
4
4

O valor previsto de despesas para 2007 de R$36,36 milhes.

A previso para 2008 feita como a mdia entre os anos 2004, 2005,
2006 e 2007. Como o valor para 2007 no conhecido, utiliza-se o valor calculado da estimativa 2007 = 36,36.

Y + Y + Y + Y
31,35 + 38, 01+ 46,10 + 36,36
Y2008 = 2004 2005 2006 2007 =
= 37, 96
4
4

O valor previsto de despesas para 2008 de R$ 37,96 milhes.

7. Comparar o EMQ para k = 2 e para k = 4.


Ano

Despesas

k=2

k=4

EMQ k = 2 EMQ k = 4

1987

11,44

1988

14,97

1989

15,96

13,21

7,5900

1990

11,44

15,47

16,2006

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

283

Anlise de sries temporais

Ano

Despesas

k=2

k=4

EMQ k = 2 EMQ k = 4

1991

12,08

13,70

13,45

2,6244

1,8838

1992

14,48

11,76

13,61

7,3984

0,7526

1993

13,68

13,28

13,49

0,1600

0,0361

1994

14,68

14,08

12,92

0,3600

3,0976

1995

15,69

14,18

13,73

2,2801

3,8416

1996

18,58

15,19

14,63

11,5260

15,5828

1997

22,45

17,14

15,66

28,2492

46,1381

1998

26,99

20,52

17,85

41,9256

83,5396

1999

28,51

24,72

20,93

14,3641

57,4943

2000

28,37

27,75

24,13

0,3844

17,9564

2001

31,68

28,44

26,58

10,4976

26,0100

2002

31,95

30,03

28,89

3,7056

9,3789

2003

29,99

31,82

30,13

3,3306

0,0189

2004

31,35

30,97

30,50

0,1444

0,7268

2005

38,01

30,67

31,24

53,8756

45,7991

2006

46,10

34,68

32,83

130,4164

176,2256

EMQ =

19

30,53

EMQ(k = 2) = 19 e EMQ(k = 4) = 30,53.

Como o EMQ para mdia mvel com dois valores menor do que para
quatro, o mtodo mais adequado para duas mdias.

Observando os valores previstos para 2007, percebemos que o valor


previsto para as despesas para k = 2 de R$42,02 milhes, enquanto
para k = 4 o valor das despesas previstas de R$36,36 milhes. De fato, o
valor previsto para 2007 com duas mdias parece ser o mais adequado.

8. As mdias mveis calculadas a seguir correspondem a mdias que


envolvem 13 medidas cada uma e 24 valores, conforme tcnica
apresenta no texto.

284

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

Anlise de sries temporais

Ano
2004

2005

2006

Ms

Vendas

Total 1

Total 2

Mdia mvel

Janeiro

545,00

Fevereiro

528,40

Maro

594,40

Abril

627,20

Maio

684,40

Junho

738,40

Julho

464,30

Agosto

254,00

Setembro

454,20

Outubro

365,40

Novembro

341,10

6 167,40

12 467,90

519,50

Dezembro

570,60

6 300,50

12 791,60

532,98

Janeiro

678,10

6 491,10

13 203,70

550,15

Fevereiro

719,00

6 712,60

13 534,60

563,94

Maro

815,90

6 822,00

13 676,30

569,85

Abril

736,60

6 854,30

13 731,50

572,15

Maio

716,70

6 877,20

13 758,10

573,25

Junho

761,30

6 880,90

13 965,40

581,89

Julho

468,00

7 084,50

14 426,80

601,12

Agosto

457,60

7 342,30

15 077,80

628,24

Setembro

712,00

7 735,50

15 866,50

661,10

Outubro

758,60

8 131,00

16 284,60

678,53

Novembro

736,60

8 153,60

16 295,10

678,96

Dezembro

593,20

8 141,50

16 280,10

678,34

Janeiro

666,00

8 138,60

16 226,50

676,10

Fevereiro

716,10

8 087,90

16 176,10

674,00

Maro

765,20

8 088,20

16 257,70

677,40

Abril

736,90

8 169,50

16 339,30

680,80

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

285

Anlise de sries temporais

Ano

2007

286

Ms

Vendas

Total 1

Total 2

Mdia mvel

Maio

798,00

8 169,80

16 265,20

677,72

Junho

761,60

8 095,40

16 104,20

671,01

Julho

393,60

8 008,80

16 114,40

671,43

Agosto

371,00

8 105,60

16 294,30

678,93

Setembro

808,80

8 188,70

16 468,20

686,18

Outubro

841,70

8 279,50

16 632,00

693,00

Novembro

827,40

8 352,50

16 898,80

704,12

Dezembro

666,20

8 546,30

17 192,00

716,33

Janeiro

859,80

8 645,70

17 409,00

725,38

Fevereiro

815,50

8 763,30

17 576,30

732,35

Maro

882,80

8 813,00

17 708,10

737,84

Abril

786,60

8 895,10

17 901,90

745,91

Maio

880,10

9 006,80

18 297,50

762,40

Junho

873,30

9 290,70

18 626,10

776,09

Julho

677,50

9 335,40

18 528,10

772,00

Agosto

415,70

9 192,70

18 430,90

767,95

Setembro

666,10

9 238,20

18 476,10

769,84

Outubro

887,20

9 237,90

18 554,60

773,11

Novembro

827,10

9 316,70

Dezembro

745,00

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

Anlise de sries temporais

O grfico a seguir apresenta a retirada da sazonalidade propiciada


pelo mtodo:
Grfico de linhas

1000,00
900,00

Vendas

800,00
700,00
Srie 1
Srie 2

600,00
500,00
400,00
300,00

10

13

16

19 22
Tempo

25

28

31

34

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

287

Anlise de sries temporais

288

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

Anexos

Tabela A Distribuio acumulada binomial


F( c ) = P(X c) = X = 0,n Cn,X(p)x(1 p)nx
Exemplo: se p = 0,15, n = 5, c = 2, ento F(2) = P(X 2) = 0,9734.
n

0,05

0,1

0,15

0,2

0,25

0,3

0,35

0,4

0,45

0,5

0,9025

0,8100

0,7225

0,6400

0,5625

0,4900

0,4245

0,3600

0,3025

0,2500

0,9975

0,9900

0,9775

0,9600

0,9375

0,9100

0,8775

0,8400

0,7975

0,7500

0,8574

0,7290

0,6141

0,5120

0,4219

0,3430

0,2746

0,2160

0,1664

0,1250

0,9928

0,9720

0,9393

0,8960

0,8438

0,7840

0,7183

0,6480

0,5748

0,5000

0,9999

0,9990

0,9966

0,9920

0,9844

0,9730

0,9571

0,9360

0,9089

0,8750

0,8145

0,6561

0,5220

0,4096

0,3164

0,2401

0,1785

0,1296

0,0915

0,0625

0,9860

0,9477

0,8905

0,8192

0,7383

0,6517

0,5630

0,4752

0,3910

0,3125

0,9995

0,9963

0,9880

0,9728

0,9492

0,9163

0,8735

0,8208

0,7585

0,6875

1,0000

0,9999

0,9995

0,9984

0,9961

0,9919

0,9850

0,9744

0,9590

0,9375

0,7738

0,5905

0,4437

0,3277

0,2373

0,1681

0,1160

0,0778

0,0503

0,0313

0,9774

0,9185

0,8352

0,7373

0,6328

0,5282

0,4284

0,3370

0,2562

0,1875

0,9988

0,9914

0,9734

0,9421

0,8965

0,8369

0,7648

0,6826

0,5931

0,5000

1,0000

0,9995

0,9978

0,9933

0,9844

0,9692

0,9460

0,9130

0,8688

0,8125

1,0000

1,0000

0,9999

0,9997

0,9990

0,9976

0,9947

0,9898

0,9815

0,9688

0,7351

0,5314

0,3771

0,2621

0,1780

0,1176

0,0754

0,0467

0,0277

0,0156

0,9672

0,8857

0,7765

0,6554

0,5339

0,4202

0,3191

0,2333

0,1636

0,1094

0,9978

0,9842

0,9527

0,9011

0,8306

0,7443

0,6471

0,5443

0,4415

0,3438

0,9999

0,9987

0,9941

0,9830

0,9624

0,9295

0,8826

0,8208

0,7447

0,6563

1,0000

0,9999

0,9996

0,9984

0,9954

0,9891

0,9777

0,9590

0,9308

0,8906

1,0000

1,0000

1,0000

0,9999

0,9998

0,9993

0,9982

0,9959

0,9917

0,9844

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

289

Anexos

0,05

0,1

0,15

0,2

0,25

0,3

0,35

0,4

0,45

0,5

0,6983

0,4783

0,3206

0,2097

0,1335

0,0824

0,0490

0,0280

0,0152

0,0078

0,9556

0,8503

0,7166

0,5767

0,4449

0,3294

0,2338

0,1586

0,1024

0,0625

0,9962

0,9743

0,9262

0,8520

0,7564

0,6471

0,5323

0,4199

0,3164

0,2266

0,9998

0,9973

0,9879

0,9667

0,9294

0,8740

0,8002

0,7102

0,6083

0,5000

1,0000

0,9998

0,9988

0,9953

0,9871

0,9712

0,9444

0,9037

0,8471

0,7734

1,0000

1,0000

0,9999

0,9996

0,9987

0,9962

0,9910

0,9812

0,9643

0,9375

1,0000

1,0000

1,0000

1,0000

0,9999

0,9998

0,9994

0,9984

0,9963

0,9922

0,6634

0,4305

0,2725

0,1678

0,1001

0,0576

0,0319

0,0168

0,0084

0,0039

0,9428

0,8131

0,6572

0,5033

0,3671

0,2553

0,1691

0,1064

0,0632

0,0352

0,9942

0,9619

0,8948

0,7969

0,6785

0,5518

0,4278

0,3154

0,2201

0,1445

0,9996

0,9950

0,9786

0,9437

0,8862

0,8059

0,7064

0,5941

0,4770

0,3633

1,0000

0,9996

0,9971

0,9896

0,9727

0,9420

0,8939

0,8263

0,7396

0,6367

1,0000

1,0000

0,9998

0,9988

0,9958

0,9887

0,9747

0,9502

0,9115

0,8555

1,0000

1,0000

1,0000

0,9999

0,9996

0,9987

0,9964

0,9915

0,9819

0,9648

1,0000

1,0000

1,0000

1,0000

1,0000

0,9999

0,9998

0,9993

0,9983

0,9961

0,6302

0,3874

0,2316

0,1342

0,0751

0,0404

0,0207

0,0101

0,0046

0,0020

0,9288

0,7748

0,5995

0,4362

0,3003

0,1960

0,1211

0,0705

0,0385

0,0195

0,9916

0,9470

0,8591

0,7382

0,6007

0,4628

0,3373

0,2318

0,1495

0,0898

0,9994

0,9917

0,9661

0,9144

0,8343

0,7297

0,6089

0,4826

0,3614

0,2539

1,0000

0,9991

0,9944

0,9804

0,9511

0,9012

0,8283

0,7334

0,6214

0,5000

1,0000

0,9999

0,9994

0,9969

0,9900

0,9747

0,9464

0,9006

0,8342

0,7461

1,0000

1,0000

1,0000

0,9997

0,9987

0,9957

0,9888

0,9750

0,9502

0,9102

1,0000

1,0000

1,0000

1,0000

0,9999

0,9996

0,9986

0,9962

0,9909

0,9805

1,0000

1,0000

1,0000

1,0000

1,0000

1,0000

0,9999

0,9997

0,9992

0,9980

0,5987

0,3487

0,1969

0,1074

0,0563

0,0282

0,0135

0,0060

0,0025

0,0010

0,9139

0,7361

0,5443

0,3758

0,2440

0,1493

0,0860

0,0464

0,0233

0,0107

0,9885

0,9298

0,8202

0,6778

0,5256

0,3828

0,2616

0,1673

0,0996

0,0547

0,9990

0,9872

0,9500

0,8791

0,7759

0,6496

0,5138

0,3823

0,2660

0,1719

10

290

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

Anexos

11

12

0,05

0,1

0,15

0,2

0,25

0,3

0,35

0,4

0,45

0,5

0,9999

0,9984

0,9901

0,9672

0,9219

0,8497

0,7515

0,6331

0,5044

0,3770

1,0000

0,9999

0,9986

0,9936

0,9803

0,9527

0,9051

0,8338

0,7384

0,6230

1,0000

1,0000

0,9999

0,9991

0,9965

0,9894

0,9740

0,9452

0,8980

0,8281

1,0000

1,0000

1,0000

0,9999

0,9996

0,9984

0,9952

0,9877

0,9726

0,9453

1,0000

1,0000

1,0000

1,0000

1,0000

0,9999

0,9995

0,9983

0,9955

0,9893

1,0000

1,0000

1,0000

1,0000

1,0000

1,0000

1,0000

0,9999

0,9997

0,9990

0,5688

0,3138

0,1673

0,0859

0,0422

0,0198

0,0088

0,0036

0,0014

0,0005

0,8981

0,6974

0,4922

0,3221

0,1971

0,1130

0,0606

0,0302

0,0139

0,0059

0,9848

0,9104

0,7788

0,6174

0,4552

0,3127

0,2001

0,1189

0,0652

0,0327

0,9984

0,9815

0,9306

0,8389

0,7133

0,5696

0,4256

0,2963

0,1911

0,1133

0,9999

0,9972

0,9841

0,9496

0,8854

0,7897

0,6683

0,5328

0,3971

0,2744

1,0000

0,9997

0,9973

0,9883

0,9657

0,9218

0,8513

0,7535

0,6331

0,5000

1,0000

1,0000

0,9997

0,9980

0,9924

0,9784

0,9499

0,9006

0,8262

0,7256

1,0000

1,0000

1,0000

0,9998

0,9988

0,9957

0,9878

0,9707

0,9390

0,8867

1,0000

1,0000

1,0000

1,0000

0,9999

0,9994

0,9980

0,9941

0,9852

0,9673

1,0000

1,0000

1,0000

1,0000

1,0000

1,0000

0,9998

0,9993

0,9978

0,9941

10 1,0000

1,0000

1,0000

1,0000

1,0000

1,0000

1,0000

1,0000

0,9998

0,9995

0,5404

0,2824

0,1422

0,0687

0,0317

0,0138

0,0057

0,0022

0,0008

0,0002

0,8816

0,6590

0,4435

0,2749

0,1584

0,0850

0,0424

0,0196

0,0083

0,0032

0,9804

0,8891

0,7358

0,5583

0,3907

0,2528

0,1513

0,0834

0,0421

0,0193

0,9978

0,9744

0,9078

0,7946

0,6488

0,4925

0,3467

0,2253

0,1345

0,0730

0,9998

0,9957

0,9761

0,9274

0,8424

0,7237

0,5833

0,4382

0,3044

0,1938

1,0000

0,9995

0,9954

0,9806

0,9456

0,8822

0,7873

0,6652

0,5269

0,3872

1,0000

0,9999

0,9993

0,9961

0,9857

0,9614

0,9154

0,8418

0,7393

0,6128

1,0000

1,0000

0,9999

0,9994

0,9972

0,9905

0,9745

0,9427

0,8883

0,8062

1,0000

1,0000

1,0000

0,9999

0,9996

0,9983

0,9944

0,9847

0,9644

0,9270

1,0000

1,0000

1,0000

1,0000

1,0000

0,9998

0,9992

0,9972

0,9921

0,9807

10 1,0000

1,0000

1,0000

1,0000

1,0000

1,0000

0,9999

0,9997

0,9989

0,9968

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

291

Anexos

13

14

292

0,05

0,1

0,15

0,2

0,25

0,3

0,35

0,4

0,45

0,5

11 1,0000

1,0000

1,0000

1,0000

1,0000

1,0000

1,0000

1,0000

0,9999

0,9998

0,5133

0,2542

0,1209

0,0550

0,0238

0,0097

0,0037

0,0013

0,0004

0,0001

0,8646

0,6213

0,3983

0,2336

0,1267

0,0637

0,0296

0,0126

0,0049

0,0017

0,9755

0,8661

0,6920

0,5017

0,3326

0,2025

0,1132

0,0579

0,0269

0,0112

0,9969

0,9658

0,8820

0,7473

0,5843

0,4206

0,2783

0,1686

0,0929

0,0461

0,9997

0,9935

0,9658

0,9009

0,7940

0,6543

0,5005

0,3530

0,2279

0,1334

1,0000

0,9991

0,9925

0,9700

0,9198

0,8346

0,7159

0,5744

0,4268

0,2905

1,0000

0,9999

0,9987

0,9930

0,9757

0,9376

0,8705

0,7712

0,6437

0,5000

1,0000

1,0000

0,9998

0,9988

0,9944

0,9818

0,9538

0,9023

0,8212

0,7095

1,0000

1,0000

1,0000

0,9998

0,9990

0,9960

0,9874

0,9679

0,9302

0,8666

1,0000

1,0000

1,0000

1,0000

0,9999

0,9993

0,9975

0,9922

0,9797

0,9539

10 1,0000

1,0000

1,0000

1,0000

1,0000

0,9999

0,9997

0,9987

0,9959

0,9888

11 1,0000

1,0000

1,0000

1,0000

1,0000

1,0000

1,0000

0,9999

0,9995

0,9983

12 1,0000

1,0000

1,0000

1,0000

1,0000

1,0000

1,0000

1,0000

1,0000

0,9999

0,4877

0,2288

0,1028

0,0440

0,0178

0,0068

0,0024

0,0008

0,0002

0,0001

0,8470

0,5846

0,3567

0,1979

0,1010

0,0475

0,0205

0,0081

0,0029

0,0009

0,9699

0,8416

0,6479

0,4481

0,2811

0,1608

0,0839

0,0398

0,0170

0,0065

0,9958

0,9559

0,8535

0,6982

0,5213

0,3552

0,2205

0,1243

0,0632

0,0287

0,9996

0,9908

0,9533

0,8702

0,7415

0,5842

0,4227

0,2793

0,1672

0,0898

1,0000

0,9985

0,9885

0,9561

0,8883

0,7805

0,6405

0,4859

0,3373

0,2120

1,0000

0,9998

0,9978

0,9884

0,9617

0,9067

0,8164

0,6925

0,5461

0,3953

1,0000

1,0000

0,9997

0,9976

0,9897

0,9685

0,9247

0,8499

0,7414

0,6047

1,0000

1,0000

1,0000

0,9996

0,9978

0,9917

0,9757

0,9417

0,8811

0,7880

1,0000

1,0000

1,0000

1,0000

0,9997

0,9983

0,9940

0,9825

0,9574

0,9102

10 1,0000

1,0000

1,0000

1,0000

1,0000

0,9998

0,9989

0,9961

0,9886

0,9713

11 1,0000

1,0000

1,0000

1,0000

1,0000

1,0000

0,9999

0,9994

0,9978

0,9935

12 1,0000

1,0000

1,0000

1,0000

1,0000

1,0000

1,0000

0,9999

0,9997

0,9991

13 1,0000

1,0000

1,0000

1,0000

1,0000

1,0000

1,0000

1,0000

1,0000

0,9999

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

Anexos

0,05

0,1

0,15

0,2

0,25

0,3

0,35

0,4

0,45

0,5

15

0,4633

0,2059

0,0874

0,0352

0,0134

0,0047

0,0016

0,0005

0,0001

0,0000

0,8290

0,5490

0,3186

0,1671

0,0802

0,0353

0,0142

0,0052

0,0017

0,0005

0,9638

0,8159

0,6042

0,3980

0,2361

0,1268

0,0617

0,0271

0,0107

0,0037

0,9945

0,9444

0,8227

0,6482

0,4613

0,2969

0,1727

0,0905

0,0424

0,0176

0,9994

0,9873

0,9383

0,8358

0,6865

0,5155

0,3519

0,2173

0,1204

0,0592

0,9999

0,9978

0,9832

0,9389

0,8516

0,7216

0,5643

0,4032

0,2608

0,1509

1,0000

0,9997

0,9964

0,9819

0,9434

0,8689

0,7548

0,6098

0,4522

0,3036

1,0000

1,0000

0,9994

0,9958

0,9827

0,9500

0,8868

0,7869

0,6535

0,5000

1,0000

1,0000

0,9999

0,9992

0,9958

0,9848

0,9578

0,9050

0,8182

0,6964

1,0000

1,0000

1,0000

0,9999

0,9992

0,9963

0,9876

0,9662

0,9231

0,8491

10 1,0000

1,0000

1,0000

1,0000

0,9999

0,9993

0,9972

0,9907

0,9745

0,9408

11 1,0000

1,0000

1,0000

1,0000

1,0000

0,9999

0,9995

0,9981

0,9937

0,9824

12 1,0000

1,0000

1,0000

1,0000

1,0000

1,0000

0,9999

0,9997

0,9989

0,9963

13 1,0000

1,0000

1,0000

1,0000

1,0000

1,0000

1,0000

1,0000

0,9999

0,9995

14 1,0000

1,0000

1,0000

1,0000

1,0000

1,0000

1,0000

1,0000

1,0000

1,0000

0,4401

0,1853

0,0743

0,0281

0,0100

0,0033

0,0010

0,0003

0,0001

0,0000

0,8108

0,5147

0,2839

0,1407

0,0635

0,0261

0,0098

0,0033

0,0010

0,0003

0,9571

0,7892

0,5614

0,3518

0,1971

0,0994

0,0451

0,0183

0,0066

0,0021

0,9930

0,9316

0,7899

0,5981

0,4050

0,2459

0,1339

0,0651

0,0281

0,0106

0,9991

0,9830

0,9209

0,7982

0,6302

0,4499

0,2892

0,1666

0,0853

0,0384

0,9999

0,9967

0,9765

0,9183

0,8103

0,6598

0,4900

0,3288

0,1976

0,1051

1,0000

0,9995

0,9944

0,9733

0,9204

0,8247

0,6881

0,5272

0,3660

0,2272

1,0000

0,9999

0,9989

0,9930

0,9729

0,9256

0,8406

0,7161

0,5629

0,4018

1,0000

1,0000

0,9998

0,9985

0,9925

0,9743

0,9329

0,8577

0,7441

0,5982

1,0000

1,0000

1,0000

0,9998

0,9984

0,9929

0,9771

0,9417

0,8759

0,7728

10 1,0000

1,0000

1,0000

1,0000

0,9997

0,9984

0,9938

0,9809

0,9514

0,8949

11 1,0000

1,0000

1,0000

1,0000

1,0000

0,9997

0,9987

0,9951

0,9851

0,9616

12 1,0000

1,0000

1,0000

1,0000

1,0000

1,0000

0,9998

0,9991

0,9965

0,9894

16

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

293

Anexos

17

18

294

0,05

0,1

0,15

0,2

0,25

0,3

0,35

0,4

0,45

0,5

13 1,0000

1,0000

1,0000

1,0000

1,0000

1,0000

1,0000

0,9999

0,9994

0,9979

14 1,0000

1,0000

1,0000

1,0000

1,0000

1,0000

1,0000

1,0000

0,9999

0,9997

15 1,0000

1,0000

1,0000

1,0000

1,0000

1,0000

1,0000

1,0000

1,0000

1,0000

0,4181

0,1668

0,0631

0,0225

0,0075

0,0023

0,0007

0,0002

0,0000

0,0000

0,7922

0,4818

0,2525

0,1182

0,0501

0,0193

0,0067

0,0021

0,0006

0,0001

0,9497

0,7618

0,5198

0,3096

0,1637

0,0774

0,0327

0,0123

0,0041

0,0012

0,9912

0,9174

0,7556

0,5489

0,3530

0,2019

0,1028

0,0464

0,0184

0,0064

0,9988

0,9779

0,9013

0,7582

0,5739

0,3887

0,2348

0,1260

0,0596

0,0245

0,9999

0,9953

0,9681

0,8943

0,7653

0,5968

0,4197

0,2639

0,1471

0,0717

1,0000

0,9992

0,9917

0,9623

0,8929

0,7752

0,6188

0,4478

0,2902

0,1662

1,0000

0,9999

0,9983

0,9891

0,9598

0,8954

0,7872

0,6405

0,4743

0,3145

1,0000

1,0000

0,9997

0,9974

0,9876

0,9597

0,9006

0,8011

0,6626

0,5000

1,0000

1,0000

1,0000

0,9995

0,9969

0,9873

0,9617

0,9081

0,8166

0,6855

10 1,0000

1,0000

1,0000

0,9999

0,9994

0,9968

0,9880

0,9652

0,9174

0,8338

11 1,0000

1,0000

1,0000

1,0000

0,9999

0,9993

0,9970

0,9894

0,9699

0,9283

12 1,0000

1,0000

1,0000

1,0000

1,0000

0,9999

0,9994

0,9975

0,9914

0,9755

13 1,0000

1,0000

1,0000

1,0000

1,0000

1,0000

0,9999

0,9995

0,9981

0,9936

14 1,0000

1,0000

1,0000

1,0000

1,0000

1,0000

1,0000

0,9999

0,9997

0,9988

15 1,0000

1,0000

1,0000

1,0000

1,0000

1,0000

1,0000

1,0000

1,0000

0,9999

16 1,0000

1,0000

1,0000

1,0000

1,0000

1,0000

1,0000

1,0000

1,0000

1,0000

0,3972

0,1501

0,0536

0,0180

0,0056

0,0016

0,0004

0,0001

0,0000

0,0000

0,7735

0,4503

0,2241

0,0991

0,0395

0,0142

0,0046

0,0013

0,0003

0,0001

0,9419

0,7338

0,4797

0,2713

0,1353

0,0600

0,0236

0,0082

0,0025

0,0007

0,9891

0,9018

0,7202

0,5010

0,3057

0,1646

0,0783

0,0328

0,0120

0,0038

0,9985

0,9718

0,8794

0,7164

0,5187

0,3327

0,1886

0,0942

0,0411

0,0154

0,9998

0,9936

0,9581

0,8671

0,7175

0,5344

0,3550

0,2088

0,1077

0,0481

1,0000

0,9988

0,9882

0,9487

0,8610

0,7217

0,5491

0,3743

0,2258

0,1189

1,0000

0,9998

0,9973

0,9837

0,9431

0,8593

0,7283

0,5634

0,3915

0,2403

1,0000

1,0000

0,9995

0,9957

0,9807

0,9404

0,8609

0,7368

0,5778

0,4073

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

Anexos

19

0,05

0,1

0,15

0,2

0,25

0,3

0,35

0,4

0,45

0,5

1,0000

1,0000

0,9999

0,9991

0,9946

0,9790

0,9403

0,8653

0,7473

0,5927

10 1,0000

1,0000

1,0000

0,9998

0,9988

0,9939

0,9788

0,9424

0,8720

0,7597

11 1,0000

1,0000

1,0000

1,0000

0,9998

0,9986

0,9938

0,9797

0,9463

0,8811

12 1,0000

1,0000

1,0000

1,0000

1,0000

0,9997

0,9986

0,9942

0,9817

0,9519

13 1,0000

1,0000

1,0000

1,0000

1,0000

1,0000

0,9997

0,9987

0,9951

0,9846

14 1,0000

1,0000

1,0000

1,0000

1,0000

1,0000

1,0000

0,9998

0,9990

0,9962

15 1,0000

1,0000

1,0000

1,0000

1,0000

1,0000

1,0000

1,0000

0,9999

0,9993

16 1,0000

1,0000

1,0000

1,0000

1,0000

1,0000

1,0000

1,0000

1,0000

0,9999

17 1,0000

1,0000

1,0000

1,0000

1,0000

1,0000

1,0000

1,0000

1,0000

1,0000

0,3774

0,1351

0,0456

0,0144

0,0042

0,0011

0,0003

0,0001

0,0000

0,0000

0,7547

0,4203

0,1985

0,0829

0,0310

0,0104

0,0031

0,0008

0,0002

0,0000

0,9335

0,7054

0,4413

0,2369

0,1113

0,0462

0,0170

0,0055

0,0015

0,0004

0,9868

0,8850

0,6841

0,4551

0,2631

0,1332

0,0591

0,0230

0,0077

0,0022

0,9980

0,9648

0,8556

0,6733

0,4654

0,2822

0,1500

0,0696

0,0280

0,0096

0,9998

0,9914

0,9463

0,8369

0,6678

0,4739

0,2968

0,1629

0,0777

0,0318

1,0000

0,9983

0,9837

0,9324

0,8251

0,6655

0,4812

0,3081

0,1727

0,0835

1,0000

0,9997

0,9959

0,9767

0,9225

0,8180

0,6656

0,4878

0,3169

0,1796

1,0000

1,0000

0,9992

0,9933

0,9713

0,9161

0,8145

0,6675

0,4940

0,3238

1,0000

1,0000

0,9999

0,9984

0,9911

0,9674

0,9125

0,8139

0,6710

0,5000

10 1,0000

1,0000

1,0000

0,9997

0,9977

0,9895

0,9653

0,9115

0,8159

0,6762

11 1,0000

1,0000

1,0000

1,0000

0,9995

0,9972

0,9886

0,9648

0,9129

0,8204

12 1,0000

1,0000

1,0000

1,0000

0,9999

0,9994

0,9969

0,9884

0,9658

0,9165

13 1,0000

1,0000

1,0000

1,0000

1,0000

0,9999

0,9993

0,9969

0,9891

0,9682

14 1,0000

1,0000

1,0000

1,0000

1,0000

1,0000

0,9999

0,9994

0,9972

0,9904

15 1,0000

1,0000

1,0000

1,0000

1,0000

1,0000

1,0000

0,9999

0,9995

0,9978

16 1,0000

1,0000

1,0000

1,0000

1,0000

1,0000

1,0000

1,0000

0,9999

0,9996

17 1,0000

1,0000

1,0000

1,0000

1,0000

1,0000

1,0000

1,0000

1,0000

1,0000

18 1,0000

1,0000

1,0000

1,0000

1,0000

1,0000

1,0000

1,0000

1,0000

1,0000

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

295

Anexos

0,05

0,1

0,15

0,2

0,25

0,3

0,35

0,4

0,45

0,5

20

0,3585

0,1216

0,0388

0,0115

0,0032

0,0008

0,0002

0,0000

0,0000

0,0000

0,7358

0,3917

0,1756

0,0692

0,0243

0,0076

0,0021

0,0005

0,0001

0,0000

0,9245

0,6769

0,4049

0,2061

0,0913

0,0355

0,0121

0,0036

0,0009

0,0002

0,9841

0,8670

0,6477

0,4114

0,2252

0,1071

0,0444

0,0160

0,0049

0,0013

0,9974

0,9568

0,8298

0,6296

0,4148

0,2375

0,1182

0,0510

0,0189

0,0059

0,9997

0,9887

0,9327

0,8042

0,6172

0,4164

0,2454

0,1256

0,0553

0,0207

1,0000

0,9976

0,9781

0,9133

0,7858

0,6080

0,4166

0,2500

0,1299

0,0577

1,0000

0,9996

0,9941

0,9679

0,8982

0,7723

0,6010

0,4159

0,2520

0,1316

1,0000

0,9999

0,9987

0,9900

0,9591

0,8867

0,7624

0,5956

0,4143

0,2517

1,0000

1,0000

0,9998

0,9974

0,9861

0,9520

0,8782

0,7553

0,5914

0,4119

10 1,0000

1,0000

1,0000

0,9994

0,9961

0,9829

0,9468

0,8725

0,7507

0,5881

11 1,0000

1,0000

1,0000

0,9999

0,9991

0,9949

0,9804

0,9435

0,8692

0,7483

12 1,0000

1,0000

1,0000

1,0000

0,9998

0,9987

0,9940

0,9790

0,9420

0,8684

13 1,0000

1,0000

1,0000

1,0000

1,0000

0,9997

0,9985

0,9935

0,9786

0,9423

14 1,0000

1,0000

1,0000

1,0000

1,0000

1,0000

0,9997

0,9984

0,9936

0,9793

15 1,0000

1,0000

1,0000

1,0000

1,0000

1,0000

1,0000

0,9997

0,9985

0,9941

16 1,0000

1,0000

1,0000

1,0000

1,0000

1,0000

1,0000

1,0000

0,9997

0,9987

17 1,0000

1,0000

1,0000

1,0000

1,0000

1,0000

1,0000

1,0000

1,0000

0,9998

18 1,0000

1,0000

1,0000

1,0000

1,0000

1,0000

1,0000

1,0000

1,0000

1,0000

19 1,0000

1,0000

1,0000

1,0000

1,0000

1,0000

1,0000

1,0000

1,0000

1,0000

Tabela B Distribuio de probabilidades binomial


P(X = x) = Cn,x (px (1 p) n x
Exemplo se p = 0,15, n =4 e X =3 ento P(X = 3) = 0,0115.
n

0,05

0,10

0,15

0,20

0,25

0,30

0,35

0,40

0,45

0,50

0,9500

0,9000

0,8500

0,8000

0,7500

0,7000

0,6500

0,6000

0,5500

0,5000

0,0500

0,1000

0,1500

0,2000

0,2500

0,3000

0,3500

0,4000

0,4500

0,5000

296

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

Anexos

0,05

0,10

0,15

0,20

0,25

0,30

0,35

0,40

0,45

0,50

0,9025

0,8100

0,7225

0,6400

0,5625

0,4900

0,4225

0,3600

0,3025

0,2500

0,0950

0,1800

0,2550

0,3200

0,3750

0,4200

0,4550

0,4800

0,4950

0,5000

0,0025

0,0100

0,0225

0,0400

0,0625

0,0900

0,1225

0,1600

0,2025

0,2500

0,8574

0,7290

0,6141

0,5120

0,4219

0,3430

0,2746

0,2160

0,1664

0,1250

0,1354

0,2430

0,3251

0,3840

0,4219

0,4410

0,4436

0,4320

0,4084

0,3750

0,0071

0,0270

0,0574

0,0960

0,1406

0,1890

0,2389

0,2880

0,3341

0,3750

0,0001

0,0010

0,0034

0,0080

0,0156

0,0270

0,0429

0,0640

0,0911

0,1250

0,8145

0,6561

0,5220

0,4096

0,3164

0,2401

0,1785

0,1296

0,0915

0,0625

0,1715

0,2916

0,3685

0,4096

0,4219

0,4116

0,3845

0,3456

0,2995

0,2500

0,0135

0,0486

0,0975

0,1536

0,2109

0,2646

0,3105

0,3456

0,3675

0,3750

0,0005

0,0036

0,0115

0,0256

0,0469

0,0756

0,1115

0,1536

0,2005

0,2500

0,0000

0,0001

0,0005

0,0016

0,0039

0,0081

0,0150

0,0256

0,0410

0,0625

0,7738

0,5905

0,4437

0,3277

0,2373

0,1681

0,1160

0,0778

0,0503

0,0313

0,2036

0,3281

0,3915

0,4096

0,3955

0,3602

0,3124

0,2592

0,2059

0,1563

0,0214

0,0729

0,1382

0,2048

0,2637

0,3087

0,3364

0,3456

0,3369

0,3125

0,0011

0,0081

0,0244

0,0512

0,0879

0,1323

0,1811

0,2304

0,2757

0,3125

0,0000

0,0005

0,0022

0,0064

0,0146

0,0284

0,0488

0,0768

0,1128

0,1563

0,0000

0,0000

0,0001

0,0003

0,0010

0,0024

0,0053

0,0102

0,0185

0,0313

0,7351

0,5314

0,3771

0,2621

0,1780

0,1176

0,0754

0,0467

0,0277

0,0156

0,2321

0,3543

0,3993

0,3932

0,3560

0,3025

0,2437

0,1866

0,1359

0,0938

0,0305

0,0984

0,1762

0,2458

0,2966

0,3241

0,3280

0,3110

0,2780

0,2344

0,0021

0,0146

0,0415

0,0819

0,1318

0,1852

0,2355

0,2765

0,3032

0,3125

0,0001

0,0012

0,0055

0,0154

0,0330

0,0595

0,0951

0,1382

0,1861

0,2344

0,0000

0,0001

0,0004

0,0015

0,0044

0,0102

0,0205

0,0369

0,0609

0,0938

0,0000

0,0000

0,0000

0,0001

0,0002

0,0007

0,0018

0,0041

0,0083

0,0156

0,6983

0,4783

0,3206

0,2097

0,1335

0,0824

0,0490

0,0280

0,0152

0,0078

0,2573

0,3720

0,3960

0,3670

0,3115

0,2471

0,1848

0,1306

0,0872

0,0547

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

297

Anexos

10

298

0,05

0,10

0,15

0,20

0,25

0,30

0,35

0,40

0,45

0,50

0,0406

0,1240

0,2097

0,2753

0,3115

0,3177

0,2985

0,2613

0,2140

0,1641

0,0036

0,0230

0,0617

0,1147

0,1730

0,2269

0,2679

0,2903

0,2918

0,2734

0,0002

0,0026

0,0109

0,0287

0,0577

0,0972

0,1442

0,1935

0,2388

0,2734

0,0000

0,0002

0,0012

0,0043

0,0115

0,0250

0,0466

0,0774

0,1172

0,1641

0,0000

0,0000

0,0001

0,0004

0,0013

0,0036

0,0084

0,0172

0,0320

0,0547

0,0000

0,0000

0,0000

0,0000

0,0001

0,0002

0,0006

0,0016

0,0037

0,0078

0,6634

0,4305

0,2725

0,1678

0,1001

0,0576

0,0319

0,0168

0,0084

0,0039

0,2793

0,3826

0,3847

0,3355

0,2670

0,1977

0,1373

0,0896

0,0548

0,0313

0,0515

0,1488

0,2376

0,2936

0,3115

0,2965

0,2587

0,2090

0,1569

0,1094

0,0054

0,0331

0,0839

0,1468

0,2076

0,2541

0,2786

0,2787

0,2568

0,2188

0,0004

0,0046

0,0185

0,0459

0,0865

0,1361

0,1875

0,2322

0,2627

0,2734

0,0000

0,0004

0,0026

0,0092

0,0231

0,0467

0,0808

0,1239

0,1719

0,2188

0,0000

0,0000

0,0002

0,0011

0,0038

0,0100

0,0217

0,0413

0,0703

0,1094

0,0000

0,0000

0,0000

0,0001

0,0004

0,0012

0,0033

0,0079

0,0164

0,0313

0,0000

0,0000

0,0000

0,0000

0,0000

0,0001

0,0002

0,0007

0,0017

0,0039

0,6302

0,3874

0,2316

0,1342

0,0751

0,0404

0,0207

0,0101

0,0046

0,0020

0,2985

0,3874

0,3679

0,3020

0,2253

0,1556

0,1004

0,0605

0,0339

0,0176

0,0629

0,1722

0,2597

0,3020

0,3003

0,2668

0,2162

0,1612

0,1110

0,0703

0,0077

0,0446

0,1069

0,1762

0,2336

0,2668

0,2716

0,2508

0,2119

0,1641

0,0006

0,0074

0,0283

0,0661

0,1168

0,1715

0,2194

0,2508

0,2600

0,2461

0,0000

0,0008

0,0050

0,0165

0,0389

0,0735

0,1181

0,1672

0,2128

0,2461

0,0000

0,0001

0,0006

0,0028

0,0087

0,0210

0,0424

0,0743

0,1160

0,1641

0,0000

0,0000

0,0000

0,0003

0,0012

0,0039

0,0098

0,0212

0,0407

0,0703

0,0000

0,0000

0,0000

0,0000

0,0001

0,0004

0,0013

0,0035

0,0083

0,0176

0,0000

0,0000

0,0000

0,0000

0,0000

0,0000

0,0001

0,0003

0,0008

0,0020

0,5987

0,3487

0,1969

0,1074

0,0563

0,0282

0,0135

0,0060

0,0025

0,0010

0,3151

0,3874

0,3474

0,2684

0,1877

0,1211

0,0725

0,0403

0,0207

0,0098

0,0746

0,1937

0,2759

0,3020

0,2816

0,2335

0,1757

0,1209

0,0763

0,0439

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

Anexos

11

12

0,05

0,10

0,15

0,20

0,25

0,30

0,35

0,40

0,45

0,50

0,0105

0,0574

0,1298

0,2013

0,2503

0,2668

0,2522

0,2150

0,1665

0,1172

0,0010

0,0112

0,0401

0,0881

0,1460

0,2001

0,2377

0,2508

0,2384

0,2051

0,0001

0,0015

0,0085

0,0264

0,0584

0,1029

0,1536

0,2007

0,2340

0,2461

0,0000

0,0001

0,0012

0,0055

0,0162

0,0368

0,0689

0,1115

0,1596

0,2051

0,0000

0,0000

0,0001

0,0008

0,0031

0,0090

0,0212

0,0425

0,0746

0,1172

0,0000

0,0000

0,0000

0,0001

0,0004

0,0014

0,0043

0,0106

0,0229

0,0439

0,0000

0,0000

0,0000

0,0000

0,0000

0,0001

0,0005

0,0016

0,0042

0,0098

10 0,0000

0,0000

0,0000

0,0000

0,0000

0,0000

0,0000

0,0001

0,0003

0,0010

0,5688

0,3138

0,1673

0,0859

0,0422

0,0198

0,0088

0,0036

0,0014

0,0005

0,3293

0,3835

0,3248

0,2362

0,1549

0,0932

0,0518

0,0266

0,0125

0,0054

0,0867

0,2131

0,2866

0,2953

0,2581

0,1998

0,1395

0,0887

0,0513

0,0269

0,0137

0,0710

0,1517

0,2215

0,2581

0,2568

0,2254

0,1774

0,1259

0,0806

0,0014

0,0158

0,0536

0,1107

0,1721

0,2201

0,2428

0,2365

0,2060

0,1611

0,0001

0,0025

0,0132

0,0388

0,0803

0,1321

0,1830

0,2207

0,2360

0,2256

0,0000

0,0003

0,0023

0,0097

0,0268

0,0566

0,0985

0,1471

0,1931

0,2256

0,0000

0,0000

0,0003

0,0017

0,0064

0,0173

0,0379

0,0701

0,1128

0,1611

0,0000

0,0000

0,0000

0,0002

0,0011

0,0037

0,0102

0,0234

0,0462

0,0806

0,0000

0,0000

0,0000

0,0000

0,0001

0,0005

0,0018

0,0052

0,0126

0,0269

10 0,0000

0,0000

0,0000

0,0000

0,0000

0,0000

0,0002

0,0007

0,0021

0,0054

0,5404

0,2824

0,1422

0,0687

0,0317

0,0138

0,0057

0,0022

0,0008

0,0002

0,3413

0,3766

0,3012

0,2062

0,1267

0,0712

0,0368

0,0174

0,0075

0,0029

0,0988

0,2301

0,2924

0,2835

0,2323

0,1678

0,1088

0,0639

0,0339

0,0161

0,0173

0,0852

0,1720

0,2362

0,2581

0,2397

0,1954

0,1419

0,0923

0,0537

0,0021

0,0213

0,0683

0,1329

0,1936

0,2311

0,2367

0,2128

0,1700

0,1208

0,0002

0,0038

0,0193

0,0532

0,1032

0,1585

0,2039

0,2270

0,2225

0,1934

0,0000

0,0005

0,0040

0,0155

0,0401

0,0792

0,1281

0,1766

0,2124

0,2256

0,0000

0,0000

0,0006

0,0033

0,0115

0,0291

0,0591

0,1009

0,1489

0,1934

0,0000

0,0000

0,0001

0,0005

0,0024

0,0078

0,0199

0,0420

0,0762

0,1208

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

299

Anexos

13

14

300

0,05

0,10

0,15

0,20

0,25

0,30

0,35

0,40

0,45

0,50

0,0000

0,0000

0,0000

0,0001

0,0004

0,0015

0,0048

0,0125

0,0277

0,0537

10 0,0000

0,0000

0,0000

0,0000

0,0000

0,0002

0,0008

0,0025

0,0068

0,0161

11 0,0000

0,0000

0,0000

0,0000

0,0000

0,0000

0,0001

0,0003

0,0010

0,0029

12 0,0000

0,0000

0,0000

0,0000

0,0000

0,0000

0,0000

0,0000

0,0001

0,0002

0,5133

0,2542

0,1209

0,0550

0,0238

0,0097

0,0037

0,0013

0,0004

0,0001

0,3512

0,3672

0,2774

0,1787

0,1029

0,0540

0,0259

0,0113

0,0045

0,0016

0,1109

0,2448

0,2937

0,2680

0,2059

0,1388

0,0836

0,0453

0,0220

0,0095

0,0214

0,0997

0,1900

0,2457

0,2517

0,2181

0,1651

0,1107

0,0660

0,0349

0,0028

0,0277

0,0838

0,1535

0,2097

0,2337

0,2222

0,1845

0,1350

0,0873

0,0003

0,0055

0,0266

0,0691

0,1258

0,1803

0,2154

0,2214

0,1989

0,1571

0,0000

0,0008

0,0063

0,0230

0,0559

0,1030

0,1546

0,1968

0,2169

0,2095

0,0000

0,0001

0,0011

0,0058

0,0186

0,0442

0,0833

0,1312

0,1775

0,2095

0,0000

0,0000

0,0001

0,0011

0,0047

0,0142

0,0336

0,0656

0,1089

0,1571

0,0000

0,0000

0,0000

0,0001

0,0009

0,0034

0,0101

0,0243

0,0495

0,0873

10 0,0000

0,0000

0,0000

0,0000

0,0001

0,0006

0,0022

0,0065

0,0162

0,0349

11 0,0000

0,0000

0,0000

0,0000

0,0000

0,0001

0,0003

0,0012

0,0036

0,0095

12 0,0000

0,0000

0,0000

0,0000

0,0000

0,0000

0,0000

0,0001

0,0005

0,0016

13 0,0000

0,0000

0,0000

0,0000

0,0000

0,0000

0,0000

0,0000

0,0000

0,0001

0,4877

0,2288

0,1028

0,0440

0,0178

0,0068

0,0024

0,0008

0,0002

0,0001

0,3593

0,3559

0,2539

0,1539

0,0832

0,0407

0,0181

0,0073

0,0027

0,0009

0,1229

0,2570

0,2912

0,2501

0,1802

0,1134

0,0634

0,0317

0,0141

0,0056

0,0259

0,1142

0,2056

0,2501

0,2402

0,1943

0,1366

0,0845

0,0462

0,0222

0,0037

0,0349

0,0998

0,1720

0,2202

0,2290

0,2022

0,1549

0,1040

0,0611

0,0004

0,0078

0,0352

0,0860

0,1468

0,1963

0,2178

0,2066

0,1701

0,1222

0,0000

0,0013

0,0093

0,0322

0,0734

0,1262

0,1759

0,2066

0,2088

0,1833

0,0000

0,0002

0,0019

0,0092

0,0280

0,0618

0,1082

0,1574

0,1952

0,2095

0,0000

0,0000

0,0003

0,0020

0,0082

0,0232

0,0510

0,0918

0,1398

0,1833

0,0000

0,0000

0,0000

0,0003

0,0018

0,0066

0,0183

0,0408

0,0762

0,1222

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

Anexos

15

16

0,05

0,10

0,15

0,20

0,25

0,30

0,35

0,40

0,45

0,50

10 0,0000

0,0000

0,0000

0,0000

0,0003

0,0014

0,0049

0,0136

0,0312

0,0611

11 0,0000

0,0000

0,0000

0,0000

0,0000

0,0002

0,0010

0,0033

0,0093

0,0222

12 0,0000

0,0000

0,0000

0,0000

0,0000

0,0000

0,0001

0,0005

0,0019

0,0056

13 0,0000

0,0000

0,0000

0,0000

0,0000

0,0000

0,0000

0,0001

0,0002

0,0009

14 0,0000

0,0000

0,0000

0,0000

0,0000

0,0000

0,0000

0,0000

0,0000

0,0001

0,4633

0,2059

0,0874

0,0352

0,0134

0,0047

0,0016

0,0005

0,0001

0,0000

0,3658

0,3432

0,2312

0,1319

0,0668

0,0305

0,0126

0,0047

0,0016

0,0005

0,1348

0,2669

0,2856

0,2309

0,1559

0,0916

0,0476

0,0219

0,0090

0,0032

0,0307

0,1285

0,2184

0,2501

0,2252

0,1700

0,1110

0,0634

0,0318

0,0139

0,0049

0,0428

0,1156

0,1876

0,2252

0,2186

0,1792

0,1268

0,0780

0,0417

0,0006

0,0105

0,0449

0,1032

0,1651

0,2061

0,2123

0,1859

0,1404

0,0916

0,0000

0,0019

0,0132

0,0430

0,0917

0,1472

0,1906

0,2066

0,1914

0,1527

0,0000

0,0003

0,0030

0,0138

0,0393

0,0811

0,1319

0,1771

0,2013

0,1964

0,0000

0,0000

0,0005

0,0035

0,0131

0,0348

0,0710

0,1181

0,1647

0,1964

0,0000

0,0000

0,0001

0,0007

0,0034

0,0116

0,0298

0,0612

0,1048

0,1527

10 0,0000

0,0000

0,0000

0,0001

0,0007

0,0030

0,0096

0,0245

0,0515

0,0916

11 0,0000

0,0000

0,0000

0,0000

0,0001

0,0006

0,0024

0,0074

0,0191

0,0417

12 0,0000

0,0000

0,0000

0,0000

0,0000

0,0001

0,0004

0,0016

0,0052

0,0139

13 0,0000

0,0000

0,0000

0,0000

0,0000

0,0000

0,0001

0,0003

0,0010

0,0032

14 0,0000

0,0000

0,0000

0,0000

0,0000

0,0000

0,0000

0,0000

0,0001

0,0005

15 0,0000

0,0000

0,0000

0,0000

0,0000

0,0000

0,0000

0,0000

0,0000

0,0000

0,4401

0,1853

0,0743

0,0281

0,0100

0,0033

0,0010

0,0003

0,0001

0,0000

0,3706

0,3294

0,2097

0,1126

0,0535

0,0228

0,0087

0,0030

0,0009

0,0002

0,1463

0,2745

0,2775

0,2111

0,1336

0,0732

0,0353

0,0150

0,0056

0,0018

0,0359

0,1423

0,2285

0,2463

0,2079

0,1465

0,0888

0,0468

0,0215

0,0085

0,0061

0,0514

0,1311

0,2001

0,2252

0,2040

0,1553

0,1014

0,0572

0,0278

0,0008

0,0137

0,0555

0,1201

0,1802

0,2099

0,2008

0,1623

0,1123

0,0667

0,0001

0,0028

0,0180

0,0550

0,1101

0,1649

0,1982

0,1983

0,1684

0,1222

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

301

Anexos

17

302

0,05

0,10

0,15

0,20

0,25

0,30

0,35

0,40

0,45

0,50

0,0000

0,0004

0,0045

0,0197

0,0524

0,1010

0,1524

0,1889

0,1969

0,1746

0,0000

0,0001

0,0009

0,0055

0,0197

0,0487

0,0923

0,1417

0,1812

0,1964

0,0000

0,0000

0,0001

0,0012

0,0058

0,0185

0,0442

0,0840

0,1318

0,1746

10 0,0000

0,0000

0,0000

0,0002

0,0014

0,0056

0,0167

0,0392

0,0755

0,1222

11 0,0000

0,0000

0,0000

0,0000

0,0002

0,0013

0,0049

0,0142

0,0337

0,0667

12 0,0000

0,0000

0,0000

0,0000

0,0000

0,0002

0,0011

0,0040

0,0115

0,0278

13 0,0000

0,0000

0,0000

0,0000

0,0000

0,0000

0,0002

0,0008

0,0029

0,0085

14 0,0000

0,0000

0,0000

0,0000

0,0000

0,0000

0,0000

0,0001

0,0005

0,0018

15 0,0000

0,0000

0,0000

0,0000

0,0000

0,0000

0,0000

0,0000

0,0001

0,0002

16 0,0000

0,0000

0,0000

0,0000

0,0000

0,0000

0,0000

0,0000

0,0000

0,0000

0,4181

0,1668

0,0631

0,0225

0,0075

0,0023

0,0007

0,0002

0,0000

0,0000

0,3741

0,3150

0,1893

0,0957

0,0426

0,0169

0,0060

0,0019

0,0005

0,0001

0,1575

0,2800

0,2673

0,1914

0,1136

0,0581

0,0260

0,0102

0,0035

0,0010

0,0415

0,1556

0,2359

0,2393

0,1893

0,1245

0,0701

0,0341

0,0144

0,0052

0,0076

0,0605

0,1457

0,2093

0,2209

0,1868

0,1320

0,0796

0,0411

0,0182

0,0010

0,0175

0,0668

0,1361

0,1914

0,2081

0,1849

0,1379

0,0875

0,0472

0,0001

0,0039

0,0236

0,0680

0,1276

0,1784

0,1991

0,1839

0,1432

0,0944

0,0000

0,0007

0,0065

0,0267

0,0668

0,1201

0,1685

0,1927

0,1841

0,1484

0,0000

0,0001

0,0014

0,0084

0,0279

0,0644

0,1134

0,1606

0,1883

0,1855

0,0000

0,0000

0,0003

0,0021

0,0093

0,0276

0,0611

0,1070

0,1540

0,1855

10 0,0000

0,0000

0,0000

0,0004

0,0025

0,0095

0,0263

0,0571

0,1008

0,1484

11 0,0000

0,0000

0,0000

0,0001

0,0005

0,0026

0,0090

0,0242

0,0525

0,0944

12 0,0000

0,0000

0,0000

0,0000

0,0001

0,0006

0,0024

0,0081

0,0215

0,0472

13 0,0000

0,0000

0,0000

0,0000

0,0000

0,0001

0,0005

0,0021

0,0068

0,0182

14 0,0000

0,0000

0,0000

0,0000

0,0000

0,0000

0,0001

0,0004

0,0016

0,0052

15 0,0000

0,0000

0,0000

0,0000

0,0000

0,0000

0,0000

0,0001

0,0003

0,0010

16 0,0000

0,0000

0,0000

0,0000

0,0000

0,0000

0,0000

0,0000

0,0000

0,0001

17 0,0000

0,0000

0,0000

0,0000

0,0000

0,0000

0,0000

0,0000

0,0000

0,0000

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

Anexos

0,05

0,10

0,15

0,20

0,25

0,30

0,35

0,40

0,45

0,50

18

0,3972

0,1501

0,0536

0,0180

0,0056

0,0016

0,0004

0,0001

0,0000

0,0000

0,3763

0,3002

0,1704

0,0811

0,0338

0,0126

0,0042

0,0012

0,0003

0,0001

0,1683

0,2835

0,2556

0,1723

0,0958

0,0458

0,0190

0,0069

0,0022

0,0006

0,0473

0,1680

0,2406

0,2297

0,1704

0,1046

0,0547

0,0246

0,0095

0,0031

0,0093

0,0700

0,1592

0,2153

0,2130

0,1681

0,1104

0,0614

0,0291

0,0117

0,0014

0,0218

0,0787

0,1507

0,1988

0,2017

0,1664

0,1146

0,0666

0,0327

0,0002

0,0052

0,0301

0,0816

0,1436

0,1873

0,1941

0,1655

0,1181

0,0708

0,0000

0,0010

0,0091

0,0350

0,0820

0,1376

0,1792

0,1892

0,1657

0,1214

0,0000

0,0002

0,0022

0,0120

0,0376

0,0811

0,1327

0,1734

0,1864

0,1669

0,0000

0,0000

0,0004

0,0033

0,0139

0,0386

0,0794

0,1284

0,1694

0,1855

10 0,0000

0,0000

0,0001

0,0008

0,0042

0,0149

0,0385

0,0771

0,1248

0,1669

11 0,0000

0,0000

0,0000

0,0001

0,0010

0,0046

0,0151

0,0374

0,0742

0,1214

12 0,0000

0,0000

0,0000

0,0000

0,0002

0,0012

0,0047

0,0145

0,0354

0,0708

13 0,0000

0,0000

0,0000

0,0000

0,0000

0,0002

0,0012

0,0045

0,0134

0,0327

14 0,0000

0,0000

0,0000

0,0000

0,0000

0,0000

0,0002

0,0011

0,0039

0,0117

15 0,0000

0,0000

0,0000

0,0000

0,0000

0,0000

0,0000

0,0002

0,0009

0,0031

16 0,0000

0,0000

0,0000

0,0000

0,0000

0,0000

0,0000

0,0000

0,0001

0,0006

17 0,0000

0,0000

0,0000

0,0000

0,0000

0,0000

0,0000

0,0000

0,0000

0,0001

18 0,0000

0,0000

0,0000

0,0000

0,0000

0,0000

0,0000

0,0000

0,0000

0,0000

0,3774

0,1351

0,0456

0,0144

0,0042

0,0011

0,0003

0,0001

0,0000

0,0000

0,3774

0,2852

0,1529

0,0685

0,0268

0,0093

0,0029

0,0008

0,0002

0,0000

0,1787

0,2852

0,2428

0,1540

0,0803

0,0358

0,0138

0,0046

0,0013

0,0003

0,0533

0,1796

0,2428

0,2182

0,1517

0,0869

0,0422

0,0175

0,0062

0,0018

0,0112

0,0798

0,1714

0,2182

0,2023

0,1491

0,0909

0,0467

0,0203

0,0074

0,0018

0,0266

0,0907

0,1636

0,2023

0,1916

0,1468

0,0933

0,0497

0,0222

0,0002

0,0069

0,0374

0,0955

0,1574

0,1916

0,1844

0,1451

0,0949

0,0518

0,0000

0,0014

0,0122

0,0443

0,0974

0,1525

0,1844

0,1797

0,1443

0,0961

0,0000

0,0002

0,0032

0,0166

0,0487

0,0981

0,1489

0,1797

0,1771

0,1442

19

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

303

Anexos

20

304

0,05

0,10

0,15

0,20

0,25

0,30

0,35

0,40

0,45

0,50

0,0000

0,0000

0,0007

0,0051

0,0198

0,0514

0,0980

0,1464

0,1771

0,1762

10 0,0000

0,0000

0,0001

0,0013

0,0066

0,0220

0,0528

0,0976

0,1449

0,1762

11 0,0000

0,0000

0,0000

0,0003

0,0018

0,0077

0,0233

0,0532

0,0970

0,1442

12 0,0000

0,0000

0,0000

0,0000

0,0004

0,0022

0,0083

0,0237

0,0529

0,0961

13 0,0000

0,0000

0,0000

0,0000

0,0001

0,0005

0,0024

0,0085

0,0233

0,0518

14 0,0000

0,0000

0,0000

0,0000

0,0000

0,0001

0,0006

0,0024

0,0082

0,0222

15 0,0000

0,0000

0,0000

0,0000

0,0000

0,0000

0,0001

0,0005

0,0022

0,0074

16 0,0000

0,0000

0,0000

0,0000

0,0000

0,0000

0,0000

0,0001

0,0005

0,0018

17 0,0000

0,0000

0,0000

0,0000

0,0000

0,0000

0,0000

0,0000

0,0001

0,0003

18 0,0000

0,0000

0,0000

0,0000

0,0000

0,0000

0,0000

0,0000

0,0000

0,0000

19 0,0000

0,0000

0,0000

0,0000

0,0000

0,0000

0,0000

0,0000

0,0000

0,0000

0,3585

0,1216

0,0388

0,0115

0,0032

0,0008

0,0002

0,0000

0,0000

0,0000

0,3774

0,2702

0,1368

0,0576

0,0211

0,0068

0,0020

0,0005

0,0001

0,0000

0,1887

0,2852

0,2293

0,1369

0,0669

0,0278

0,0100

0,0031

0,0008

0,0002

0,0596

0,1901

0,2428

0,2054

0,1339

0,0716

0,0323

0,0123

0,0040

0,0011

0,0133

0,0898

0,1821

0,2182

0,1897

0,1304

0,0738

0,0350

0,0139

0,0046

0,0022

0,0319

0,1028

0,1746

0,2023

0,1789

0,1272

0,0746

0,0365

0,0148

0,0003

0,0089

0,0454

0,1091

0,1686

0,1916

0,1712

0,1244

0,0746

0,0370

0,0000

0,0020

0,0160

0,0545

0,1124

0,1643

0,1844

0,1659

0,1221

0,0739

0,0000

0,0004

0,0046

0,0222

0,0609

0,1144

0,1614

0,1797

0,1623

0,1201

0,0000

0,0001

0,0011

0,0074

0,0271

0,0654

0,1158

0,1597

0,1771

0,1602

10 0,0000

0,0000

0,0002

0,0020

0,0099

0,0308

0,0686

0,1171

0,1593

0,1762

11 0,0000

0,0000

0,0000

0,0005

0,0030

0,0120

0,0336

0,0710

0,1185

0,1602

12 0,0000

0,0000

0,0000

0,0001

0,0008

0,0039

0,0136

0,0355

0,0727

0,1201

13 0,0000

0,0000

0,0000

0,0000

0,0002

0,0010

0,0045

0,0146

0,0366

0,0739

14 0,0000

0,0000

0,0000

0,0000

0,0000

0,0002

0,0012

0,0049

0,0150

0,0370

15 0,0000

0,0000

0,0000

0,0000

0,0000

0,0000

0,0003

0,0013

0,0049

0,0148

16 0,0000

0,0000

0,0000

0,0000

0,0000

0,0000

0,0000

0,0003

0,0013

0,0046

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

Anexos

0,05

0,10

0,15

0,20

0,25

0,30

0,35

0,40

0,45

0,50

17 0,0000

0,0000

0,0000

0,0000

0,0000

0,0000

0,0000

0,0000

0,0002

0,0011

18 0,0000

0,0000

0,0000

0,0000

0,0000

0,0000

0,0000

0,0000

0,0000

0,0002

19 0,0000

0,0000

0,0000

0,0000

0,0000

0,0000

0,0000

0,0000

0,0000

0,0000

20 0,0000

0,0000

0,0000

0,0000

0,0000

0,0000

0,0000

0,0000

0,0000

0,0000

Tabela C Distribuio de Poisson acumulada


Exemplo: Se = 2, ento F(3) = 0,857.

0,02

0,980

1,000

0,04

0,961

0,999

1,000

0,06

0,942

0,998

1,000

0,08

0,923

0,997

1,000

0,10

0,905

0,995

1,000

0,15

0,861

0,990

0,999

1,000

0,20

0,819

0,982

0,999

1,000

0,25

0,779

0,974

0,998

1,000

0,30

0,741

0,963

0,996

1,000

0,35

0,705

0,951

0,994

1,000

0,40

0,670

0,938

0,992

0,999

1,000

0,45

0,638

0,925

0,989

0,999

1,000

0,50

0,607

0,910

0,986

0,998

1,000

0,55

0,577

0,894

0,982

0,998

1,000

0,60

0,549

0,878

0,977

0,997

1,000

0,65

0,522

0,861

0,972

0,996

0,999

1,000

0,70

0,497

0,844

0,966

0,994

0,999

1,000

0,75

0,472

0,827

0,959

0,993

0,999

1,000

0,80

0,449

0,809

0,953

0,991

0,999

1,000

0,85

0,427

0,791

0,945

0,989

0,998

1,000

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

305

Anexos

0,90

0,407

0,772

0,937

0,987

0,998

1,000

0,95

0,387

0,754

0,929

0,984

0,997

1,000

1,00

0,368

0,736

0,920

0,981

0,996

0,999

1,000

1,10

0,333

0,699

0,900

0,974

0,995

0,999

1,000

1,20

0,301

0,663

0,879

0,966

0,992

0,998

1,000

1,30

0,273

0,627

0,857

0,957

0,989

0,998

1,000

1,40

0,247

0,592

0,833

0,946

0,986

0,997

0,999

1,000

1,50

0,223

0,558

0,809

0,934

0,981

0,996

0,999

1,000

1,60

0,202

0,525

0,783

0,921

0,976

0,994

0,999

1,000

1,70

0,183

0,493

0,757

0,907

0,970

0,992

0,998

1,000

1,80

0,165

0,463

0,731

0,891

0,964

0,990

0,997

0,999

1,000

1,90

0,150

0,434

0,704

0,875

0,956

0,987

0,997

0,999

1,000

2,00

0,135

0,406

0,677

0,857

0,947

0,983

0,995

0,999

1,000

2,20

0,111

0,355

0,623

0,819

0,928

0,975

0,993

0,998

1,000

2,40

0,091

0,308

0,570

0,779

0,904

0,964

0,988

0,997

0,999

1,000

2,60

0,074

0,267

0,518

0,736

0,877

0,951

0,983

0,995

0,999

1,000

2,80

0,061

0,231

0,469

0,692

0,848

0,935

0,976

0,992

0,998

0,999

3,00

0,050

0,199

0,423

0,647

0,815

0,916

0,966

0,988

0,996

0,999

3,20

0,041

0,171

0,380

0,603

0,781

0,895

0,955

0,983

0,994

0,998

3,40

0,033

0,147

0,340

0,558

0,744

0,871

0,942

0,977

0,992

0,997

3,60

0,027

0,126

0,303

0,515

0,706

0,844

0,927

0,969

0,988

0,996

3,80

0,022

0,107

0,269

0,473

0,668

0,816

0,909

0,960

0,984

0,994

4,00

0,018

0,092

0,238

0,433

0,629

0,785

0,889

0,949

0,979

0,992

4,20

0,015

0,078

0,210

0,395

0,590

0,753

0,867

0,936

0,972

0,989

4,40

0,012

0,066

0,185

0,359

0,551

0,720

0,844

0,921

0,964

0,985

4,60

0,010

0,056

0,163

0,326

0,513

0,686

0,818

0,905

0,955

0,980

4,80

0,008

0,048

0,143

0,294

0,476

0,651

0,791

0,887

0,944

0,975

306

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

Anexos

5,00

0,007

0,040

0,125

0,265

0,440

0,616

0,762

0,867

0,932

0,968

5,20

0,006

0,034

0,109

0,238

0,406

0,581

0,732

0,845

0,918

0,960

5,40

0,005

0,029

0,095

0,213

0,373

0,546

0,702

0,822

0,903

0,951

5,60

0,004

0,024

0,082

0,191

0,342

0,512

0,670

0,797

0,886

0,941

5,80

0,003

0,021

0,072

0,170

0,313

0,478

0,638

0,771

0,867

0,929

6,00

0,002

0,017

0,062

0,151

0,285

0,446

0,606

0,744

0,847

0,916

6,20

0,002

0,015

0,054

0,134

0,259

0,414

0,574

0,716

0,826

0,902

6,40

0,002

0,012

0,046

0,119

0,235

0,384

0,542

0,687

0,803

0,886

6,60

0,001

0,010

0,040

0,105

0,213

0,355

0,511

0,658

0,780

0,869

6,80

0,001

0,009

0,034

0,093

0,192

0,327

0,480

0,628

0,755

0,850

7,00

0,001

0,007

0,030

0,082

0,173

0,301

0,450

0,599

0,729

0,830

7,20

0,001

0,006

0,025

0,072

0,156

0,276

0,420

0,569

0,703

0,810

7,40

0,001

0,005

0,022

0,063

0,140

0,253

0,392

0,539

0,676

0,788

7,60

0,001

0,004

0,019

0,055

0,125

0,231

0,365

0,510

0,648

0,765

7,80

0,000

0,004

0,016

0,048

0,112

0,210

0,338

0,481

0,620

0,741

8,00

0,000

0,003

0,014

0,042

0,100

0,191

0,313

0,453

0,593

0,717

8,50

0,000

0,002

0,009

0,030

0,074

0,150

0,256

0,386

0,523

0,653

9,00

0,000

0,001

0,006

0,021

0,055

0,116

0,207

0,324

0,456

0,587

9,50

0,000

0,001

0,004

0,015

0,040

0,089

0,165

0,269

0,392

0,522

10,00

0,000

0,000

0,003

0,010

0,029

0,067

0,130

0,220

0,333

0,458

10,50

0,000

0,000

0,002

0,007

0,021

0,050

0,102

0,179

0,279

0,397

11,00

0,000

0,000

0,001

0,005

0,015

0,038

0,079

0,143

0,232

0,341

11,50

0,000

0,000

0,001

0,003

0,011

0,028

0,060

0,114

0,191

0,289

12,00

0,000

0,000

0,001

0,002

0,008

0,020

0,046

0,090

0,155

0,242

12,50

0,000

0,000

0,000

0,002

0,005

0,015

0,035

0,070

0,125

0,201

13,00

0,000

0,000

0,000

0,001

0,004

0,011

0,026

0,054

0,100

0,166

13,50

0,000

0,000

0,000

0,001

0,003

0,008

0,019

0,041

0,079

0,135

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

307

Anexos

14,00

0,000

0,000

0,000

0,000

0,002

0,006

0,014

0,032

0,062

0,109

14,50

0,000

0,000

0,000

0,000

0,001

0,004

0,010

0,024

0,048

0,088

15,00

0,000

0,000

0,000

0,000

0,001

0,003

0,008

0,018

0,037

0,070

16,00

0,000

0,000

0,000

0,000

0,000

0,001

0,004

0,010

0,022

0,043

17,00

0,000

0,000

0,000

0,000

0,000

0,001

0,002

0,005

0,013

0,026

18,00

0,000

0,000

0,000

0,000

0,000

0,000

0,001

0,003

0,007

0,015

19,00

0,000

0,000

0,000

0,000

0,000

0,000

0,001

0,002

0,004

0,009

20,00

0,000

0,000

0,000

0,000

0,000

0,000

0,000

0,001

0,002

0,005

21,00

0,000

0,000

0,000

0,000

0,000

0,000

0,000

0,000

0,001

0,003

22,00

0,000

0,000

0,000

0,000

0,000

0,000

0,000

0,000

0,001

0,002

23,00

0,000

0,000

0,000

0,000

0,000

0,000

0,000

0,000

0,000

0,001

24,00

0,000

0,000

0,000

0,000

0,000

0,000

0,000

0,000

0,000

0,000

25,00

0,000

0,000

0,000

0,000

0,000

0,000

0,000

0,000

0,000

0,000

10

11

12

13

14

15

16

17

18

19

2,8

1,060

1,049

3,2

1,039

3,4

1,031

1,064

3,6

1,023

1,051

3,8

1,017

1,039

1,061

1,010

1,028

1,047

4,2

1,004

1,019

1,034

4,4

0,997

1,010

1,022

1,034

4,6

0,991

1,001

1,011

1,021

4,8

0,983

0,991

1,000

1,008

0,975

0,982

0,988

0,995

1,002

5,2

0,966

0,971

0,977

0,982

0,988

308

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

Anexos

10

11

12

13

14

15

16

17

18

5,4

0,956

0,960

0,965

0,969

0,974

5,6

0,945

0,948

0,952

0,956

0,959

0,963

5,8

0,932

0,935

0,938

0,941

0,944

0,947

0,919

0,921

0,924

0,926

0,928

0,931

0,933

6,2

0,904

0,906

0,908

0,910

0,912

0,914

0,916

6,4

0,887

0,889

0,891

0,892

0,894

0,896

0,897

6,6

0,870

0,871

0,873

0,874

0,875

0,877

0,878

0,880

6,8

0,851

0,852

0,854

0,855

0,856

0,857

0,858

0,859

0,831

0,832

0,833

0,834

0,835

0,836

0,837

0,838

7,2

0,810

0,811

0,812

0,813

0,813

0,814

0,815

0,816

7,4

0,788

0,789

0,790

0,790

0,791

0,791

0,792

0,793

0,793

7,6

0,765

0,766

0,766

0,767

0,767

0,768

0,768

0,769

0,769

7,8

0,742

0,742

0,742

0,743

0,743

0,744

0,744

0,744

0,745

0,717

0,717

0,718

0,718

0,718

0,719

0,719

0,719

0,720

0,720

8,5

0,653

0,653

0,654

0,654

0,654

0,654

0,654

0,655

0,655

0,655

0,588

0,588

0,588

0,588

0,588

0,588

0,588

0,588

0,589

0,589

9,5

0,522

0,522

0,522

0,522

0,522

0,522

0,522

0,522

0,522

0,523

10

0,458

0,458

0,458

0,458

0,458

0,458

0,458

0,458

0,458

0,458

10,5

0,397

0,397

0,397

0,397

0,397

0,397

0,397

0,397

0,397

0,397

11

0,341

0,341

0,341

0,341

0,341

0,341

0,341

0,341

0,341

0,341

11,5

0,289

0,289

0,289

0,289

0,289

0,289

0,289

0,289

0,289

0,289

12

0,242

0,242

0,242

0,242

0,242

0,242

0,242

0,242

0,242

0,242

12,5

0,201

0,201

0,201

0,201

0,201

0,201

0,201

0,201

0,201

0,201

13

0,166

0,166

0,166

0,166

0,166

0,166

0,166

0,166

0,166

0,166

13,5

0,135

0,135

0,135

0,135

0,135

0,135

0,135

0,135

0,135

0,135

14

0,109

0,109

0,109

0,109

0,109

0,109

0,109

0,109

0,109

0,109

14,5

0,088

0,088

0,088

0,088

0,088

0,088

0,088

0,088

0,088

0,088

15

0,070

0,070

0,070

0,070

0,070

0,070

0,070

0,070

0,070

0,070

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

19

309

Anexos

10

11

12

13

14

15

16

17

18

19

16

0,043

0,043

0,043

0,043

0,043

0,043

0,043

0,043

0,043

0,043

17

0,026

0,026

0,026

0,026

0,026

0,026

0,026

0,026

0,026

0,026

18

0,015

0,015

0,015

0,015

0,015

0,015

0,015

0,015

0,015

0,015

19

0,009

0,009

0,009

0,009

0,009

0,009

0,009

0,009

0,009

0,009

20

0,005

0,005

0,005

0,005

0,005

0,005

0,005

0,005

0,005

0,005

21

0,003

0,003

0,003

0,003

0,003

0,003

0,003

0,003

0,003

0,003

22

0,002

0,002

0,002

0,002

0,002

0,002

0,002

0,002

0,002

0,002

23

0,001

0,001

0,001

0,001

0,001

0,001

0,001

0,001

0,001

0,001

24

0,000

0,000

0,000

0,000

0,000

0,000

0,000

0,000

0,000

0,000

25

0,000

0,000

0,000

0,000

0,000

0,000

0,000

0,000

0,000

0,000

20

21

22

23

24

25

26

27

28

29

8,5

0,655

0,589

9,5

0,523

0,523

10

0,458

0,458

0,459

10,5

0,397

0,397

0,397

0,398

11

0,341

0,341

0,341

0,341

11,5

0,289

0,289

0,289

0,289

0,289

12

0,242

0,242

0,242

0,242

0,242

0,242

12,5

0,201

0,201

0,201

0,201

0,201

0,201

0,201

13

0,166

0,166

0,166

0,166

0,166

0,166

0,166

13,5

0,135

0,135

0,135

0,135

0,135

0,135

0,135

0,135

14

0,109

0,109

0,109

0,109

0,109

0,109

0,109

0,109

0,109

14,5

0,088

0,088

0,088

0,088

0,088

0,088

0,088

0,088

0,088

0,088

15

0,070

0,070

0,070

0,070

0,070

0,070

0,070

0,070

0,070

0,070

16

0,043

0,043

0,043

0,043

0,043

0,043

0,043

0,043

0,043

0,043

310

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

Anexos

17

0,026

0,026

0,026

0,026

0,026

0,026

0,026

0,026

0,026

0,026

18

0,015

0,015

0,015

0,015

0,015

0,015

0,015

0,015

0,015

0,015

19

0,009

0,009

0,009

0,009

0,009

0,009

0,009

0,009

0,009

0,009

20

0,005

0,005

0,005

0,005

0,005

0,005

0,005

0,005

0,005

0,005

21

0,003

0,003

0,003

0,003

0,003

0,003

0,003

0,003

0,003

0,003

22

0,002

0,002

0,002

0,002

0,002

0,002

0,002

0,002

0,002

0,002

23

0,001

0,001

0,001

0,001

0,001

0,001

0,001

0,001

0,001

0,001

24

0,000

0,000

0,000

0,000

0,000

0,000

0,000

0,000

0,000

0,000

25

0,000

0,000

0,000

0,000

0,000

0,000

0,000

0,000

0,000

0,000

30

31

32

33

34

35

36

37

38

39

15

0,070

16

0,043

0,043

17

0,026

0,026

0,026

18

0,015

0,015

0,015

0,015

0,015

19

0,009

0,009

0,009

0,009

0,009

0,009

20

0,005

0,005

0,005

0,005

0,005

0,005

0,005

0,005

21

0,003

0,003

0,003

0,003

0,003

0,003

0,003

0,003

0,003

22

0,002

0,002

0,002

0,002

0,002

0,002

0,002

0,002

0,002

0,002

23

0,001

0,001

0,001

0,001

0,001

0,001

0,001

0,001

0,001

0,001

24

0,000

0,000

0,000

0,000

0,000

0,000

0,000

0,000

0,000

0,000

25

0,000

0,000

0,000

0,000

0,000

0,000

0,000

0,000

0,000

0,000

40

41

42

23

0,001

0,001

24

0,000

0,000

0,000

25

0,000

0,000

0,000

43

0,000

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

311

Anexos

Tabela D Probabilidade sob a rea da curva normal padro


0,00

0,01

0,02

0,03

0,04

0,05

0,06

0,07

0,08

0,09

4,0 0,0000

0,0000

0,0000

0,0000

0,0000

0,0000

0,0000

0,0000

0,0000

0,0000

3,9 0,0000

0,0000

0,0000

0,0000

0,0000

0,0000

0,0000

0,0000

0,0000

0,0000

3,8 0,0001

0,0001

0,0001

0,0001

0,0001

0,0001

0,0001

0,0001

0,0001

0,0001

3,7 0,0001

0,0001

0,0001

0,0001

0,0001

0,0001

0,0001

0,0001

0,0001

0,0001

3,6 0,0002

0,0002

0,0001

0,0001

0,0001

0,0001

0,0001

0,0001

0,0001

0,0001

3,5 0,0002

0,0002

0,0002

0,0002

0,0002

0,0002

0,0002

0,0002

0,0002

0,0002

3,4 0,0003

0,0003

0,0003

0,0003

0,0003

0,0003

0,0003

0,0003

0,0003

0,0002

3,3 0,0005

0,0005

0,0005

0,0004

0,0004

0,0004

0,0004

0,0004

0,0004

0,0003

3,2 0,0007

0,0007

0,0006

0,0006

0,0006

0,0006

0,0006

0,0005

0,0005

0,0005

3,1 0,0010

0,0009

0,0009

0,0009

0,0008

0,0008

0,0008

0,0008

0,0007

0,0007

3,0 0,0013

0,0013

0,0013

0,0012

0,0012

0,0011

0,0011

0,0011

0,0010

0,0010

2,9 0,0019

0,0018

0,0018

0,0017

0,0016

0,0016

0,0015

0,0015

0,0014

0,0014

2,8 0,0026

0,0025

0,0024

0,0023

0,0023

0,0022

0,0021

0,0021

0,0020

0,0019

2,7 0,0035

0,0034

0,0033

0,0032

0,0031

0,0030

0,0029

0,0028

0,0027

0,0026

2,6 0,0047

0,0045

0,0044

0,0043

0,0041

0,0040

0,0039

0,0038

0,0037

0,0036

2,5 0,0062

0,0060

0,0059

0,0057

0,0055

0,0054

0,0052

0,0051

0,0049

0,0048

2,4 0,0082

0,0080

0,0078

0,0075

0,0073

0,0071

0,0069

0,0068

0,0066

0,0064

2,3 0,0107

0,0104

0,0102

0,0099

0,0096

0,0094

0,0091

0,0089

0,0087

0,0084

2,2 0,0139

0,0136

0,0132

0,0129

0,0125

0,0122

0,0119

0,0116

0,0113

0,0110

2,1 0,0179

0,0174

0,0170

0,0166

0,0162

0,0158

0,0154

0,0150

0,0146

0,0143

2,0 0,0228

0,0222

0,0217

0,0212

0,0207

0,0202

0,0197

0,0192

0,0188

0,0183

1,9 0,0287

0,0281

0,0274

0,0268

0,0262

0,0256

0,0250

0,0244

0,0239

0,0233

1,8 0,0359

0,0351

0,0344

0,0336

0,0329

0,0322

0,0314

0,0307

0,0301

0,0294

1,7 0,0446

0,0436

0,0427

0,0418

0,0409

0,0401

0,0392

0,0384

0,0375

0,0367

1,6 0,0548

0,0537

0,0526

0,0516

0,0505

0,0495

0,0485

0,0475

0,0465

0,0455

1,5 0,0668

0,0655

0,0643

0,0630

0,0618

0,0606

0,0594

0,0582

0,0571

0,0559

312

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

Anexos

0,00

0,01

0,02

0,03

0,04

0,05

0,06

0,07

0,08

0,09

1,4 0,0808

0,0793

0,0778

0,0764

0,0749

0,0735

0,0721

0,0708

0,0694

0,0681

1,3 0,0968

0,0951

0,0934

0,0918

0,0901

0,0885

0,0869

0,0853

0,0838

0,0823

1,2 0,1151

0,1131

0,1112

0,1093

0,1075

0,1056

0,1038

0,1020

0,1003

0,0985

1,1 0,1357

0,1335

0,1314

0,1292

0,1271

0,1251

0,1230

0,1210

0,1190

0,1170

1,0 0,1587

0,1562

0,1539

0,1515

0,1492

0,1469

0,1446

0,1423

0,1401

0,1379

0,9 0,1841

0,1814

0,1788

0,1762

0,1736

0,1711

0,1685

0,1660

0,1635

0,1611

0,8 0,2119

0,2090

0,2061

0,2033

0,2005

0,1977

0,1949

0,1922

0,1894

0,1867

0,7 0,2420

0,2389

0,2358

0,2327

0,2296

0,2266

0,2236

0,2206

0,2177

0,2148

0,6 0,2743

0,2709

0,2676

0,2643

0,2611

0,2578

0,2546

0,2514

0,2483

0,2451

0,5 0,3085

0,3050

0,3015

0,2981

0,2946

0,2912

0,2877

0,2843

0,2810

0,2776

0,4 0,3446

0,3409

0,3372

0,3336

0,3300

0,3264

0,3228

0,3192

0,3156

0,3121

0,3 0,3821

0,3783

0,3745

0,3707

0,3669

0,3632

0,3594

0,3557

0,3520

0,3483

0,2 0,4207

0,4168

0,4129

0,4090

0,4052

0,4013

0,3974

0,3936

0,3897

0,3859

0,1 0,4602

0,4562

0,4522

0,4483

0,4443

0,4404

0,4364

0,4325

0,4286

0,4247

0,0

0,5000

0,4960

0,4920

0,4880

0,4840

0,4801

0,4761

0,4721

0,4681

0,4641

0,0

0,5000

0,5040

0,5080 0,5120

0,5160

0,5199

0,5239

0,5279

0,5319

0,5359

0,1

0,5398

0,5438

0,5478 0,5517

0,5557

0,5596

0,5636

0,5675

0,5714

0,5753

0,2

0,5793

0,5832

0,5871 0,5910

0,5948

0,5987

0,6026

0,6064

0,6103

0,6141

0,3

0,6179

0,6217

0,6255 0,6293

0,6331

0,6368

0,6406

0,6443

0,6480

0,6517

0,4

0,6554

0,6591

0,6628 0,6664

0,6700

0,6736

0,6772

0,6808

0,6844

0,6879

0,5

0,6915

0,6950

0,6985 0,7019

0,7054

0,7088

0,7123

0,7157

0,7190

0,7224

0,6

0,7257

0,7291

0,7324 0,7357

0,7389

0,7422

0,7454

0,7486

0,7517

0,7549

0,7

0,7580

0,7611

0,7642 0,7673

0,7704

0,7734

0,7764

0,7794

0,7823

0,7852

0,8

0,7881

0,7910

0,7939 0,7967

0,7995

0,8023

0,8051

0,8078

0,8106

0,8133

0,9

0,8159

0,8186

0,8212

0,8264

0,8289

0,8315

0,8340

0,8365

0,8389

0,8238

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

313

Anexos

0,00

0,01

0,02

0,03

0,04

0,05

0,06

0,07

0,08

0,09

1,0

0,8413

0,8438

0,8461

0,8485

0,8508

0,8531

0,8554

0,8577

0,8599

0,8621

1,1

0,8643

0,8665

0,8686

0,8708

0,8729

0,8749

0,8770

0,8790

0,8810

0,8830

1,2

0,8849

0,8869

0,8888

0,8907

0,8925

0,8944

0,8962

0,8980

0,8997

0,9015

1,3

0,9032

0,9049

0,9066

0,9082

0,9099

0,9115

0,9131

0,9147

0,9162

0,9177

1,4

0,9192

0,9207

0,9222

0,9236

0,9251

0,9265

0,9279

0,9292

0,9306

0,9319

1,5

0,9332

0,9345

0,9357

0,9370

0,9382

0,9394

0,9406

0,9418

0,9429

0,9441

1,6

0,9452

0,9463

0,9474

0,9484

0,9495

0,9505

0,9515

0,9525

0,9535

0,9545

1,7

0,9554

0,9564

0,9573

0,9582

0,9591

0,9599

0,9608

0,9616

0,9625

0,9633

1,8

0,9641

0,9649

0,9656

0,9664

0,9671

0,9678

0,9686

0,9693

0,9699

0,9706

1,9

0,9713

0,9719

0,9726

0,9732

0,9738

0,9744

0,9750

0,9756

0,9761

0,9767

2,0

0,9772

0,9778

0,9783

0,9788

0,9793

0,9798

0,9803

0,9808

0,9812

0,9817

2,1

0,9821

0,9826

0,9830

0,9834

0,9838

0,9842

0,9846

0,9850

0,9854

0,9857

2,2

0,9861

0,9864

0,9868

0,9871

0,9875

0,9878

0,9881

0,9884

0,9887

0,9890

2,3

0,9893

0,9896

0,9898

0,9901

0,9904

0,9906

0,9909

0,9911

0,9913

0,9916

2,4

0,9918

0,9920

0,9922

0,9925

0,9927

0,9929

0,9931

0,9932

0,9934

0,9936

2,5

0,9938

0,9940

0,9941

0,9943

0,9945

0,9946

0,9948

0,9949

0,9951

0,9952

2,6

0,9953

0,9955

0,9956

0,9957

0,9959

0,9960

0,9961

0,9962

0,9963

0,9964

2,7

0,9965

0,9966

0,9967

0,9968

0,9969

0,9970

0,9971

0,9972

0,9973

0,9974

2,8

0,9974

0,9975

0,9976

0,9977

0,9977

0,9978

0,9979

0,9979

0,9980

0,9981

2,9

0,9981

0,9982

0,9982

0,9983

0,9984

0,9984

0,9985

0,9985

0,9986

0,9986

3,0

0,9987

0,9987

0,9987

0,9988

0,9988

0,9989

0,9989

0,9989

0,9990

0,9990

3,1

0,9990

0,9991

0,9991

0,9991

0,9992

0,9992

0,9992

0,9992

0,9993

0,9993

3,2

0,9993

0,9993

0,9994

0,9994

0,9994

0,9994

0,9994

0,9995

0,9995

0,9995

3,3

0,9995

0,9995

0,9995

0,9996

0,9996

0,9996

0,9996

0,9996

0,9996

0,9997

3,4

0,9997

0,9997

0,9997

0,9997

0,9997

0,9997

0,9997

0,9997

0,9997

0,9998

3,5

0,9998

0,9998

0,9998

0,9998

0,9998

0,9998

0,9998

0,9998

0,9998

0,9998

3,6

0,9998

0,9998

0,9999

0,9999

0,9999

0,9999

0,9999

0,9999

0,9999

0,9999

3,7

0,9999

0,9999

0,9999

0,9999

0,9999

0,9999

0,9999

0,9999

0,9999

0,9999

314

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

Anexos

0,00

0,01

0,02

0,03

0,04

0,05

0,06

0,07

0,08

0,09

3,8

0,9999

0,9999

0,9999

0,9999

0,9999

0,9999

0,9999

0,9999

0,9999

0,9999

3,9

1,0000

1,0000

1,0000

1,0000

1,0000

1,0000

1,0000

1,0000

1,0000

1,0000

4,0

1,0000

1,0000

1,0000

1,0000

1,0000

1,0000

1,0000

1,0000

1,0000

1,0000

Tabela E Distribuio t de Student


Exemplo: Para 19 graus de liberdade, rea de 0,05 (bicaudal).
t = 2,093
bicaudal
0,1

0,05

0,02

0,01

6,314

12,706

31,821

63,656

2,920

4,303

6,965

9,925

2,353

3,182

4,541

5,841

2,132

2,776

3,747

4,604

2,015

2,571

3,365

4,032

1,943

2,447

3,143

3,707

1,895

2,365

2,998

3,499

1,860

2,306

2,896

3,355

1,833

2,262

2,821

3,250

10

1,812

2,228

2,764

3,169

11

1,796

2,201

2,718

3,106

12

1,782

2,179

2,681

3,055

13

1,771

2,160

2,650

3,012

14

1,761

2,145

2,624

2,977

15

1,753

2,131

2,602

2,947

16

1,746

2,120

2,583

2,921

17

1,740

2,110

2,567

2,898

18

1,734

2,101

2,552

2,878

19

1,729

2,093

2,539

2,861

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

315

Anexos

bicaudal
0,1

0,05

0,02

0,01

20

1,725

2,086

2,528

2,845

21

1,721

2,080

2,518

2,831

22

1,717

2,074

2,508

2,819

23

1,714

2,069

2,500

2,807

24

1,711

2,064

2,492

2,797

25

1,708

2,060

2,485

2,787

26

1,706

2,056

2,479

2,779

27

1,703

2,052

2,473

2,771

28

1,701

2,048

2,467

2,763

29

1,699

2,045

2,462

2,756

30

1,697

2,042

2,457

2,750

40

1,684

2,021

2,423

2,704

60

1,671

2,000

2,390

2,660

120

1,658

1,980

2,358

2,617

1,645

1,960

2,326

2,576

0,050

0,025

0,010

0,005

Distribuio normal

Unicaudal

316

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

Referncias

Bussab, Wilton de O.; Morettin, Pedro A. Estatstica Bsica. 5. ed. So


Paulo: Saraiva, 2006.
Costa Neto, Pedro L. O. Estatstica. 2. ed. Rio de Janeiro: Edgard Blcher,
2002.
Hamburg, Morris. Statistical Analysis for Decison Making. University of
Pennsylvania, 1991.
Levine, David M. STEPHAN, David; KREHBIEL, Timothy; BERENSON, Mark.
Estatstica: teoria e aplicaes. 3. ed. Rio de Janeiro: LTC, 2005.
Ragsdale, Cliff T. Spread Sheet Making and Decision Analysis. SouthWestern College Publishing, 2001.
Spiegel, Murray R. Estatstica. Makron, 1994.
Stevenson, William U. Estatstica Aplicada Administrao. Harbra,
2001.
Triola, Mario F. Introduo Estatstica. LTC, 2008.

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

319

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

TO
D

OS

QU
APL
ICA ANTI
TAT
DO
IVO
SA
S
NEG
C
IOS

Mtodos Quantitativos Aplicados a Negcios

TO
D

OS

QU
APL
ICA ANTI
TAT
DO
IVO
SA
S
NEG
C
IOS

Fundao Biblioteca Nacional


ISBN 978-85-387-3091-0

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

Paulo Afonso Bracarense


Ubiratan Vieira Guimares