You are on page 1of 60

2 MTODOS

QUANTITATIVOS EM
GESTO
INTRODUO

Neste mdulo, veremos temas um pouco mais avanados


da Estatstica, focando prioritariamente Distribuies
Probabilsticas e tcnicas de Estatstica Inferencial.

Todos estes assuntos so amplamente utilizados em todas


as reas da cincia, e tambm dentro das empresas, para auxiliar
os gestores nas tomadas de deciso, no controle dos seus
processos produtivos, dentre tantas aplicaes possveis.

Aqui abordaremos temas que podem e devem ser


aprofundados para melhor compreenso e uso da Estatstica em

60 | Estatstica II
nosso cotidiano, tornando nossas decises mais confiveis,
pautadas em bases metodolgicas slidas.

O contedo aqui apresentado tem como base as obras


referenciadas na bibliografia, e os exemplos aqui utilizados foram
retirados destas mesmas obras, com algumas adaptaes.

CAPTULO I

CORRELAO E REGRESSO

Neste tpico, vamos estudar como podemos verificar a


relao entre duas variveis distintas, atravs de duas ferramentas
bastante conhecidas: a correlao e a regresso. Dentro de uma
empresa, por exemplo, compreender como duas variveis esto
relacionadas ajuda a predizer e possivelmente melhorar a
performance na rea, caso o gestor utilize estas informaes para
auxiliar no processo de tomada de deciso.

Podemos ento citar a relao entre investimento em


propaganda e retorno em vendas; tempo de entrega de produtos

Estatstica II | 61
agrcolas e porcentagem de produtos estragados; preos de leo
diesel e preos de gasolina; gasto com manuteno preventiva e
taxa de produtividade de manufaturas, entre outros. Assim, o
primeiro passo para compreender a relao entre as variveis
aprender a visualizar, descrever e quantificar relaes entre os
tipos de variveis, o que feito atravs da Estatstica Descritiva,
estudada no mdulo anterior.

O primeiro passo obter os pares ordenados das observaes (xi;


yi), e caso seja interessante, construir um grfico de disperso
(atravs do qual possvel observar se existe algum padro
evidente nos dados, se existe um padro linear ou no linear, se
existe pontos que no fazem parte do padro geral etc).

1.1 Coeficiente de Correlao

Correlao nada mais que uma relao entre duas


variveis. Alm de observarmos um grfico de disperso,
interessante tambm quantificar a intensidade de associao
(relao) de duas variveis, atravs do Coeficiente de Correlao
Amostral, o qual mede a intensidade da associao entre duas
variveis. Observe os possveis tipos de correlao atravs dos
diagramas de disperso a seguir:

62 | Estatstica II
Figura 0-1 Tipos de Correlao

Assim, o coeficiente de correlao mede a direo e a


fora de uma relao linear entre duas variveis X e Y, e
representado pela letra r. O resultado do coeficiente poder variar
entre -1 e +1. Quando o resultado de r est prximo de zero
significa que existe pouca ou nenhuma relao linear entre as
variveis X e Y, e no significa necessariamente que no existe
nenhum tipo de correlao entre as variveis. Um valor de r
prximo a +1 indica uma relao positiva forte entre as variveis,
enquanto que um valor de r prximo a 1 indica uma relao
negativa forte. Utilizamos o coeficiente de correlao, pois nem
sempre confivel observar apenas um diagrama de disperso
para verificar se h algum tipo de correlao entre as variveis. A
frmula para o clculo do Coeficiente de Correlao Amostral a
seguinte:

Estatstica II | 63
r= n xy(x)(y) nx (x) ny (y)
2 2 2 2

Onde: 1 r +1;

Em Palavras Em Smbolos

x
1. Encontre a soma dos
valores de x.

y
2. Encontre a soma dos
valores de y.
3. Multiplique cada valor x

xy
por seu valor y
correspondente e
encontre a soma.
4. Faa o quadrado de cada
valor x e encontre a
soma.
x 2

5. Faa o quadrado de cada


valor y e encontre a
soma.
y 2

6. Use essas cinco n xy(x)(y)


r= nx (x)
somas para calcular
ny2 (y)
2 2
o coeficiente de
correlao.

xi e yi so os valores individuais das variveis x e y;

Tabela 0-1 Calculando um Coeficiente de Correlao

EXEMPLO: Um gerente de marketing conduziu um estudo para


determinar se h uma relao entre o dinheiro gasto com

64 | Estatstica II
propaganda e as vendas da empresa. Vejamos o diagrama de
disperso para os dados coletados na tabela abaixo:

Tabela 0-2 Gastos com propaganda e as respectivas vendas no perodo

Gastos com Vendas da empresa


propaganda (em (em R$1.000), y

R$1.000), x
2,4 225
1,6 184
2,0 220
2,6 240
1,4 180
1,6 184
2,0 186
2,2 215

Estatstica II | 65
Grfico 0-1 Diagrama de Disperso

300

250

200

150

100

50

0
0 0,5 1 1,5 2 2,5 3
Gastos com propagandas (em R$1.000)

Podemos observar neste diagrama de disperso que parece


haver uma correlao linear positiva entre as variveis. Lendo da
esquerda para a direita, percebemos que conforme os gastos com
propaganda aumentam, as vendas tendem a aumentar. Podemos
ainda calcular o coeficiente de correlao para os dados dos
gastos com propaganda e vendas da empresa atravs das
informaes fornecidas na tabela de dados.

Tabela 0-3 Valores para calcular o coeficiente de correlao e tambm a reta da


regresso

Gastos com
Vendas da
Propaganda 2 2
empresa (em xy x y
(em
R$1.000), y
R$1.000), x
2,4 225 540 5,76 50625
1,6 184 294,4 2,56 33856

66 | Estatstica II
2,0 220 440 4 48400
2,6 240 624 6,76 57600
1,4 180 252 1,96 32400
1,6 184 294,4 2,56 33856
2,0 186 372 4 34596
2,2 215 473 4,84 46225

x=15,8 xy=3.289,8 x =32,44 y =337.


y=1.634
2 2

55

Um r 0,913 sugere uma correlao linear positiva forte, ou


seja, conforme aumenta o gasto com propaganda, as vendas da
empresa tambm aumentam.

1.2 Regresso
Os diagramas de disperso nos do algumas pistas sobre
como podem estar relacionadas duas variveis. Mas para poder
prever qual ser o valor de uma varivel y quando uma varivel x
se comportar de determinada maneira, utiliza-se a Regresso
Bivariada, ou seja, a regresso de duas variveis.

A Regresso Bivariada (regresso utilizando


duas variveis) uma maneira flexvel de analisar relaes entre

Estatstica II | 67
duas variveis quantitativas, ajudando a responder questes
prticas dentro das empresas. Uma empresa pode querer saber,
por exemplo:

Receita bruta das vendas trimestrais = f (gastos com


propaganda)

Custos com medicamentos por empregado = f (nmero de


dependentes)

Aluguel mensal = f (tamanho do apartamento)


Despesas desembolsadas em almoos de negcios = f
(nmero de pessoas no grupo)

Nmero de produtos defeituosos = f (velocidade da linha de


montagem em unidades de produto por hora)

Estes so modelos bivariados porque eles especificam uma


varivel dependente (algumas vezes chamado de varivel
resposta), e uma varivel independente (s vezes chamada
preditor). Se a forma exata dessas relaes fosse conhecida, as
empresas poderiam explorar questes de poltica de negcios, tais
como:

Quantas vendas extras seriam geradas, em mdia, se os


gastos em propaganda fossem aumentados em R$ 1
milho? Qual seria a venda esperada para o caso de
nenhum gasto em propaganda?

68 | Estatstica II
Quanto aumenta, em mdia, o custo em medicamento por
empregado com um dependente extra? Qual seria o custo
esperado por empregado (empregado sem dependentes)?
Quanto aumenta, em mdia, o preo do aluguel por unidade
de rea extra (em metros quadrados, por exemplo)?

Qual o custo mdio extra gerado por refeio de cada


membro adicional no grupo? Quanto se poderia economizar
restringindo-se os grupos de almoos/jantares para trs
pessoas?

Se a velocidade da linha de montagem aumentasse em 20


unidades por hora, o que aconteceria com o nmero mdio
de produtos defeituosos?

Existem vrios tipos de relao bivariada. Aqui vamos focar


o modelo linear simples (linha reta).

1.3 Interpretando uma reta de Regresso Ajustada

O intercepto (ou coeficiente linear) e o coeficiente angular


(ou inclinao) de uma reta de regresso ajustada podem
fornecer informao til. Por exemplo:

Vendas = 268 + 7,36 Propaganda

Cada R$1 milho extra gasto em propaganda gerar, em


mdia, R$7, 36 milhes em vendas. A empresa geraria, em mdia,

Estatstica II | 69
R$268 milhes em vendas no caso de no fazer propaganda.
Entretanto, o intercepto pode no ter sentido porque a Propaganda
= 0 pode estar fora do intervalo de observao dos dados.
Custo Medicamento = 410 + 550 Dependentes

Cada dependente extra aumenta o custo anual com


medicamentos, em mdia, em R$550. Um funcionrio gasta, em
mdia, R$410/ano em medicamentos.

Aluguel = 150 + 1,05 rea

Cada unidade de rea extra (em metros quadrados) aumenta o


preo do aluguel mensal, em mdia, em R$1,05 por apartamento.
No tem sentido interpretar o intercepto porque nenhum
apartamento tem rea = 0.

Custo = 15,22 + 19,96 Pessoa

Cada pessoa faz o custo mdio total da refeio aumentar


R$19,96. No tem sentido interpretar o intercepto porque Pessoas
= 0 no seria observvel.

Defeitos = 3,2 + 0,045 Velocidade

Cada aumento unitrio na velocidade da linha de montagem


adiciona uma mdia de 0,045 defeitos por milho. No tem sentido
interpretar o intercepto porque Velocidade = 0 implica nenhuma
produo.

70 | Estatstica II
Quando propomos um modelo de regresso, temos um
mecanismo de causa em mente, mas a relao de causa e efeito
no provada por uma regresso simples. No deveramos nos
basear apenas em uma reta de equao ajustada.

1.4 Predio usando Regresso

Uma das finalidades principais da regresso fazer


previses. Uma vez que temos uma equao de regresso
ajustada que mostra a relao estimada entre X e Y, podemos
inserir qualquer valor de X para obter uma previso de Y. Por
exemplo:

Vendas = 268 + 7,37


Se a empresa gastasse R$ 10 milhes em propaganda,
suas vendas esperadas seriam de R$ 341,7 milhes, pois
Vendas = 268 + 7,36 (10) = 341,7.

Custo Medicamento = 410 + 550 Dependentes


Se um empregado tivesse quatro dependentes, seu gasto
anual esperado com medicamentos seria de R$ 2.610, pois
Custo Medicamentos = 410 + 550(4) = 2.610.

Aluguel = 150 + 1,05 rea


O aluguel esperado por um apartamento de 800 m 2
R$ 990, pois Aluguel = 150 + 1,05(800) = 990.

Custo = 15,22 + 19,96 Pessoas

Estatstica II | 71
O custo esperado de um almoo para quatro pessoas
de R$ 95,06, pois Custo = 15,22 + 19,96(4) = 95,06.

Defeitos = 3,2 + 0,045 Velocidade


Se fossem produzidas 100 unidades por hora, a taxa
esperada de defeitos seria de 7,7 defeitos por milho, pois
Defeitos = 3,2 + 0,045(100) = 7,7.
Quando lidamos com uma amostra, e no com uma
populao, utilizamos o modelo ajustado (estimado) da regresso.
Da amostra, naturalmente, podemos estimar o modelo ajustado e
us-lo para prever o valor esperado provvel da populao. O
modelo de regresso linear ajustado pode ser descrito pela
seguinte frmula:

y =b0 +b1x i
Onde:
y a varivel resposta. O y chapu minsculo a varivel
dependente, pois seu valor vai depender da varivel
independente x. As letras minsculas indicam que estamos
lidando com uma amostra.

b0 o estimador do intercepto a ser calculado;


b1 estimador do coeficiente angular a ser calculado; e
xi a varivel preditora, que possibilitar prever o valor de y

. A varivel x independente.

72 | Estatstica II
Para calcular os valores do intercepto b0 e da inclinao da reta

b1 usamos as seguintes frmulas: b1 = n xy (x)(
2 2 y) nx

(x)

b0 = yb1x=y b 1 x
n n

EXEMPLO: Encontre a equao da reta de regresso para os


gastos com propaganda e dados sobre as vendas da empresa,
utilizando as informaes contidas no exemplo sobre correlao:

)
b1 = nxy2(x )( 2 y = 8(3.289,) (15,8)(12.634) = 501,2 50,728

nx (x) 8(32,44) 15,8 9,88

A equao da reta de regresso ser,

portanto: y =104,06+50,728x i

Para desenhar a linha de regresso, use quaisquer dois valores x


dentro da faixa de dados e calcule seus valores y correspondentes
a partir da reta da regresso. Ento, desenha uma reta atravs de

Estatstica II | 73
dois pontos. Para este exemplo, a reta de regresso pode ser vista
na figura a seguir:

Grfico 0.2 Grfico com a reta de regresso

300
250
200
150
100
50
0
0 1 2 3
Gastos com propagandas (em R
$1.000)

CAPTULO II

MODELOS DE DISTRIBUIES DISCRETAS DE


PROBABILIDADE

A probabilidade pode ser usada para analisar processos


aleatrios e, naturalmente, tambm explicar processos na rea de
negcios. Um processo aleatrio tambm chamado processo
estocstico e definido como um experimento aleatrio repetvel.
Desta maneira, podemos dizer que grande parte dos processos na
rea de negcios pode ser pensada como um processo
estocstico, ou seja, que pode se repetir de maneira aleatria.
Assim, usamos modelos probabilsticos para descrever as
caractersticas essenciais de um processo estocstico, para
orientar na tomada de decises ou fazer previses. Muitos

74 | Estatstica II
processos estocsticos podem ser descritos utilizando-se modelos
probabilsticos comuns, cujas propriedades j so bem
conhecidas. Descreveremos alguns modelos mais utilizados a
seguir.

2.1 Varivel Aleatria

Uma varivel aleatria uma funo ou regra que atribui


um valor numrico para cada resultado no espao amostral de um
experimento aleatrio. Usamos X quando nos referimos a uma
varivel aleatria em geral, enquanto valores especficos de X so
mostrados em letras minsculas (por exemplo, x1). A varivel
aleatria frequentemente um resultado direto de um experimento
de observao (por exemplo, a contagem do nmero de
decolagens em determinada hora em um aeroporto especfico).
Uma varivel aleatria DISCRETA tem um nmero CONTVEL
de valores distintos. Algumas variveis aleatrias tm um limite
superior claro (por exemplo, o nmero de ausncias em uma sala
com 40 estudantes), enquanto outras no (por exemplo, o nmero
de mensagens de texto que voc recebe em certa hora). Veja
alguns exemplos de problemas de deciso envolvendo variveis
aleatrias discretas:

Tabela 0.1 Variveis Aleatrias

Varivel Aleatria Discreta


Problema de deciso
(Intervalo de Variao)

Estatstica II | 75
Uma universidade tem vagas em seu programa de X = nmero de estudantes de
MBA especfico para 65 novos estudantes. No MBA admitidos que de fato se
passado, 75% daqueles que foram admitidos matriculam (X = 0, 1, 2, 3, ...,
efetivaram sua matrcula. Toma-se a deciso de admitir 80)
80 estudantes. Qual a probabilidade de que mais de 65
estudantes admitidos de fato se matricularo?

Ao final do turno da manh (9h s 12h), os funcionrios X = nmero de chamadas que


do centro de processamento de pedidos em um call chegam em um dado minuto
center de vendas conseguem atender at cinco pedidos ao centro de processamento
por minuto. A taxa mdia de chegada de 3,5 pedidos de pedido do call center de
por minuto. Qual a probabilidade de que mais do que vendas (X = 0, 1, 2, ...)
cinco pedidos cheguem em um dado minuto?

Um rolo de ao de certo fornecedor tem em mdia 0,01 X = nmero de defeitos em


de defeitos por metro linear. A Toyota rejeita uma 500 metros de um rolo de ao
encomenda de 500 metros lineares, se ela tiver mais de (X = 0, 1, 2...)
10 defeitos. Qual a probabilidade de que o pedido seja
rejeitado?

2.2 Distribuies de Probabilidade

Uma distribuio de probabilidade discreta atribui uma


probabilidade para cada valor de uma varivel aleatria discreta X.
Cada probabilidade est entre 0 e 1, e todas as probabilidades
devem somar 1. Se existem n valores distintos de X (x1, x2, x3, ...,
xn) ento:

0 P(xi) 1 (a probabilidade para qualquer dado valor de xi de X)


n

P(xi ) =1 (a soma sobre todos os valores de X)


i=1

EXEMPLO: LANAMENTO DE MOEDAS

76 | Estatstica II
Quando voc lana uma moeda honesta trs vezes, o espao
amostral tem oito eventos simples igualmente provveis: {HHH,
HHT, HTH, THH, HTT, THT, TTH, TTT}, H representa cara e T
representa coroa. Se X o nmero de caras, ento X uma
varivel aleatria cuja distribuio de probabilidade mostrada na
tabela e no grfico a seguir:

Tabela 0-2 Distribuio de Probabilidade para trs Lanamentos de Uma Moeda


Honesta

Eventos Possveis x P(x)


TTT 0 1/8
HTT, THT, TTH 1 3/8
HHT, HTH, THH 2 3/8
HHH 3 1/8
Total 1
Os valores de X no precisam ser igualmente provveis.
Neste exemplo, X=1 e X=2 so mais provveis que X=0 ou X=3.
Entretanto, as probabilidades somam 1, como em qualquer
distribuio de probabilidade.

Estatstica II | 77
Figura 0.1 Nmero de Caras (X)

0,4
0,35
0,3
0,25
0,2
0,15
0,1
0,05
0
0 1 2 3

Nmero de Caras
(X)

2.3 Valor Esperado

Como mostrado no grfico anterior, uma distribuio de


probabilidade discreta definida somente em pontos especficos
do eixo X. O valor esperado E(X) de uma varivel aleatria
discreta a soma de todos os valores de X ponderados pelas suas
correspondentes probabilidades. uma medida de tendncia
central. Se existem n valores distintos de X (x1, x2, ..., xn), o valor
esperado :

E(X)==xi P(xi )
i=1

O valor esperado uma mdia ponderada. Usualmente


chamamos E(X) de mdia e usamos o smbolo .

78 | Estatstica II
EXEMPLO: CHAMADAS DE ASSISTNCIA TCNICA
A distribuio de chamadas de emergncia dominicais
recebidas por uma assistncia tcnica mostrada na tabela a
seguir. As probabilidades somam 1, como deve ser para qualquer
distribuio de probabilidade.

Tabela 0.3 Distribuio de Probabilidade de Chamadas de Emergncia

x P(x) xP(x)
0 0,05 0,00
1 0,10 0,10
2 0,30 0,60
3 0,25 0,75
4 0,20 0,80
5 0,10 0,50
Total 1,00 2,75

A moda (valor de X mais comum) 2, mas o nmero


esperado E(X) de chamadas de emergncia 2,75, isto , =
2,75. Em outras palavras, o nmero mdio de chamadas de
emergncia em um domingo de 2,75:

Na figura a seguir, vemos que essa distribuio de


probabilidade em particular no simtrica em torno da mdia =
2,75. Entretanto, a mdia = 2,75 ainda o ponto de equilbrio ou
o centro de gravidade.

Estatstica II | 79
Figura 0-2 Nmero de Servios de Emergncia

0,35
0,3
0,25
0,2
0,15
0,1
0,05
0
0 1 2 3 4 5

Nmero de Servios de
Emergncia

Note que a E(X) no precisa ser um evento observvel. Por


exemplo, voc poderia ter duas ou trs chamadas de emergncia,
mas no 2,75 chamadas. Isso faz sentido porque E(X) uma
mdia. como dizer que uma famlia brasileira tem a mdia de
2,1 crianas (ainda que o tamanho das famlias seja sempre um
nmero inteiro de integrantes) ou o nmero mdio de gols em um
campeonato de futebol de 1,75 (ainda que o nmero de gols
deva ser um nmero inteiro).

2.4 Varincia e Desvio-Padro


A varincia V(X) de uma varivel aleatria discreta a soma
dos quadrados dos desvios em relao ao seu valor esperado,
ponderado pela probabilidade de cada valor de X. Se existem n
valores distintos de X, a varincia :

80 | Estatstica II
n

V(X) =2 =[xi ]2P(xi )


i=1
Da mesma forma que o valor esperado E(X) uma mdia
ponderada que mede a tendncia central da distribuio, a
varincia uma mdia ponderada que mede a disperso em torno
da mdia. Da mesma forma que usamos ou E(X) para denotar a
mdia, usamos 2 ou V(X) para denotar a varincia. O desvio-
padro a raiz quadrada da varincia e denotado por :

= 2 = V(X)

EXEMPLO: A Pousada Luz do Sol uma pousada com sete


quartos numa cidade ensolarada com praia. A demanda por
quartos maior, em geral, durante julho, um ms importante para
os turistas. Entretanto, a experincia mostra que a demanda
bastante varivel. A distribuio de probabilidade de locao de
quartos durante o ms de julho mostrada na tabela a seguir, na
qual X o nmero de quartos alugados (X = 0, 1, 2, 3, 4, 5, 6 e 7).

A planilha mostra o clculo de E(X) e V(X).


Tabela 0.4 Planilha para Aluguel de Quartos em Julho

Planilha para E(X) e V(X) para o Aluguel de Quartos em Julho


2 2
x P(x) xP(x) x [x ] [x ] P(x)
0 0,05 0,00 -4,71 22,1841 1,1092
1 0,05 0,05 -3,71 13,7641 0,6882
2 0,06 0,12 -2,71 7,3441 0,4406
3 0,10 0,30 -1,71 2,9241 0,2924
4 0,13 0,52 -0,71 0,5041 0,0655

Estatstica II | 81
5 0,20 1,00 +0,29 0,0841 0,0168
6 0,15 0,90 +1,29 1,6641 0,2496
7 0,26 1,82 +2,29 5,2441 1,3634
2
Total 1,00 = 4,71 = 4,2259

As frmulas so:

Figura 0-3 Nmero de Quartos Alugados

Nmero de Quartos
Alugados
0,3
0,25
0,2
0,15
0,1
0,05
0
0 1 2 3 4 5 6 7

Nmero de Quartos
Alugados

2.5 Distribuio Uniforme


A distribuio uniforme um dos modelos discretos mais
simples. Ela descreve uma varivel aleatria com um nmero finito
de valores inteiros de a e b. Isto , a distribuio inteira depende

82 | Estatstica II
somente de dois parmetros a e b. Cada valor igualmente
provvel. A tabela a seguir resume as caractersticas de uma
distribuio uniforme discreta.

Tabela 0-5 Caractersticas da distribuio uniforme

Parmetros a = limite inferior b


= limite superior
Funo de 1
Probabilidade P(X) =
(densidade)
ba+1
Intervalo de variao aXb
Mdia a+b

2
Desvio-Padro [(ba)+1]2 1

12
Comentrios Usada principalmente como
ponto de referncia para gerar
inteiros aleatrios ou para criar
outras distribuies.

2.6 Experimento de Bernoulli


Um experimento aleatrio que tem somente dois resultados
possveis chamado experimento de Bernoulli, em homenagem
a Jakob Bernoulli (1654-1705). Denominamos, de maneira
arbitrria, um dos eventos de sucesso (denotado X = 1) e o outro

Estatstica II | 83
de fracasso (denotado X = 0). A probabilidade de sucesso
denotada por (a letra grega pi, que no deve ser confundida
com a constante matemtica 3,14). A probabilidade de fracasso
1 , de modo que as probabilidades somem um, isto , P(0) +
P(1) = (1 ) + = 1.

Tabela 0-6 Experimentos de Bernoulli

Experimento de Probabilidade
Resultados Possveis
Bernoulli de Sucesso
Lanar uma moeda 1 = Cara = 0,50
honesta 0 = Coroa
Inspecionar uma 1 = encontrando uma = 0,001
lmina da turbina de fissura
um avio 0 = nenhuma fissura
Comprar um tanque 1 = pagar com carto de = 0,78
de gs crdito
0 = no pagar com carto
de crdito
Fazer uma 1 = testar positivo = 0,0004
mamografia 0 = testar negativo

Os exemplos da tabela anterior mostram que um sucesso


(X = 1) pode, de fato, representar alguma coisa indesejvel: os
metalrgicos procuram por sinais de fadiga no metal; os auditores
procuram por erros nos recibos de despesas; os agentes de
emprstimos bancrios procuram por inadimplncia em

84 | Estatstica II
emprstimos. Um sucesso, ento, meramente um evento de
interesse, na qual se deseja observar.

A probabilidade de sucesso pode ser qualquer valor entre


0 e 1. No lanamento de uma moeda honesta, 0,5. Mas em
outras aplicaes, poderia estar perto de 1 (por exemplo, a
probabilidade de uma compra de um cliente com carto Visa ser
aprovada). As definies de sucesso e fracasso so arbitrrias e
podem ser trocadas sem problemas, apesar de se usar
usualmente como sucesso o resultado menos provvel de ocorrer
(dizemos que um evento pouco provvel de acontecer quando
menor que 0,5). Um experimento de Bernoulli tem mdia e
varincia (1 ), como vemos nas definies de E(X) e V(X):

Mdia de Bernoulli:

E
i=1

Varincia de Bernoulli:

V
i=1

2.7 Distribuio Binomial


Os experimentos ou ensaios de Bernoulli levam a um
modelo importante e mais interessante, que a distribuio
binomial, que ocorre quando um ensaio de Bernoulli repetido n
vezes. Cada ensaio de Bernoulli independente e a probabilidade
de sucesso permanece constante em cada ensaio. Em um

Estatstica II | 85
experimento binomial estamos interessados em X = o nmero de
sucessos em n ensaios, tal que a varivel aleatria binomial X seja
a soma de n variveis aleatrias Xi de Bernoulli independentes.

X = X1 + X2 + ...+ Xn

Tabela 0-7 Caractersticas da Distribuio Binomial

Parmetros n = nmero de ensaios


Funo de Probabilidade n!
(densidade) P(X) = x(1)nx

x!(nx)!
Intervalo de valores X = 0, 1, 2, ..., n
Mdia n
Desvio-Padro n(1)
Distribuio assimtrica direita
se < 0,5, assimtrica
esquerda se > 0,5, e simtrica
Comentrios se = 0,5. Contudo, a assimetria
decresce conforme n aumenta,
independentemente do valor de
.

2.8 Distribuio de Poisson

86 | Estatstica II
A distribuio de Poisson descreve o nmero de
ocorrncias de um evento dentro de uma unidade de tempo
(minuto, hora etc.) ou espao (metros quadrados, quilmetros
lineares etc.). Para se usar a distribuio de Poisson, os eventos
devem ocorrer aleatria ou independentemente, no espao ou em
tempo contnuo, conforme ilustrado na figura abaixo. Ou seja, a
ocorrncia de evento (que se esteja observando) independente
da ocorrncia de um outro evento. Tempo contnuo a aplicao
mais comum da Poisson para modelar chegadas por unidade de
tempo. Por exemplo, a chegada de um cliente numa fila de caixa
de supermercado independente (em tese) da chegada de um
outro cliente na mesma fila. Neste caso, usaramos a distribuio
Poisson para calcular a probabilidade de se chegar um, dois, trs
clientes etc., em um minuto, ou uma hora, por exemplo. Na figura
abaixo cada pontinho preto ( ) representa uma ocorrncia de um
evento qualquer de interesse.

Figura 0-4 Eventos de Poisson ao longo do tempo

Seja X o nmero de eventos por unidade de tempo. O valor


de X uma varivel aleatria que depende de quando a unidade
de tempo foi observada. Se observarmos a figura anterior,
veremos que poderamos ter X = 3, X = 1 ou X = 5 eventos,

Estatstica II | 87
dependendo de onde a unidade de tempo escolhida
aleatoriamente cair. Em geral, chamamos a distribuio de
Poisson de modelo de chegadas (de clientes, de defeitos, de
acidentes). As chegadas podem ser adequadamente consideradas
como eventos de Poisson, se os eventos forem INDEPENDENTES
(isto , cada ocorrncia do evento no afeta a probabilidade de
outros eventos ocorrerem). Em algumas situaes, os eventos no
so independentes, ento no faria sentido utilizar a distribuio
Poisson. Suponhamos, por exemplo, que usurios do computador
sabem que uma interrupo na energia frequentemente implica em
outras dentro de segundos ou minutos. Consequentemente, uma
segunda queda de energia pouco tempo depois de uma primeira
no seria um evento independente. Mas o modelo da Poisson
pode ser til em diversas situaes:

X = nmero de clientes chegando ao caixa eletrnico de um


banco em um dado minuto.

X = nmero de infeces por vrus em servidores de um


centro de processamento de dados durante um perodo
de 24 horas.

X = nmero de chegadas de pacientes com asma em dada


hora em um consultrio.

X = nmero de panes em motores de aeronaves de uma


marca a cada 100.000 horas de voo.

88 | Estatstica II
X = nmero de imperfeies por folha de blocos de papel
branco.

O modelo de Poisson tem somente um parmetro denotado


por (a letra grega lambda) representando o nmero mdio de
eventos por unidade de tempo ou espao. A unidade de tempo
deve ser curta o suficiente para que a taxa mdia de chegadas
no seja muito grande (geralmente, < 20). Por essa razo, a
distribuio de Poisson chamada de modelo de eventos raros.
Se a mdia grande, podemos reformular as unidades de tempo
para obter uma mdia menor. Por exemplo, = 90 eventos por
hora o mesmo que = 1,5 eventos por minuto.

2.9 Caractersticas da Distribuio de Poisson


Todas as caractersticas do modelo de Poisson so
determinadas por sua mdia, representada pela letra grega ,
conforme mostrado na Tabela a seguir. A constante e (a base do
logartmico natural) utilizada na frmula da Poisson para se
encontrar as probabilidades aproximadamente 2,71828 (que
pode ser calculado em uma calculadora, usando a funo ex com x
= 1). A simplicidade das frmulas de Poisson torna o modelo
bastante atraente (mais fcil que a binomial, por exemplo). Ao
contrrio da binomial, X no tem um limite evidente, ou seja, o
nmero de eventos que podem ocorrer em uma dada unidade de
tempo no limitado. Entretanto, naturalmente as probabilidades

Estatstica II | 89
Poisson se aproximam de zero conforme aumenta X, de modo que
o intervalo de valores efetivo , em geral, pequeno.

A tabela 3.8 a seguir mostra as probabilidades para vrios


valores de . Indo para baixo em cada coluna, as probabilidades
devem somar 1 (exceto por arredondamento, uma vez que as
probabilidades so precisas somente para quatro decimais).

As distribuies de Poisson so sempre assimtricas


direita (cauda direita longa), mas se tornam menos assimtricas e
mais em forma de sino conforme o valor de aumenta.

Tabela 0-8 Caractersticas da Poisson

Parmetros = nmero mdio de chegadas por


unidade de tempo ou espao
Funo de P(X)= xe x!
Probabilidade
(densidade)
Variao x = 0, 1, 2, ... (sem limite superior)
Mdia
Desvio-Padro
Comentrios Sempre assimtrica direita, menos para
valores grandes de .

90 | Estatstica II
Tabela 0-9 Probabilidades (densidade) de Poisson para vrios valores de

x = 0,1 =0,5 = 0,8 = 1,6 =2,0


0 0,9048 0,6065 0,4493 0,2019 0,1353
1 0,0905 0,3033 0,3595 0,3230 0,2707
2 0,0045 0,0758 0,1438 0,2584 0,2707
3 0,0002 0,0126 0,0383 0,1378 0,1804
4 ---------- 0,0016 0,0077 0,0551 0,0902
5 ---------- 0,0002 0,0012 0,0176 0,0361
6 ---------- ---------- 0,0002 0,0047 0,0120
7 ---------- ---------- ---------- 0,0011 0,0034
8 ---------- ---------- ---------- 0,0002 0,0009
9 ---------- ---------- ---------- ---------- 0,0002
Soma 1,0000 1,0000 1,0000 1,0000 1,0000
Nota: Probabilidades menores do que 0,0001 foram omitidas. As colunas podem no somar 1 em
razo de arredondamentos.

EXEMPLO: Nas manhs de quinta-feira, entre 9 e 10 horas, em


uma agncia de banco especfica, chegam em mdia, 1,7 clientes
por minuto que entram na fila (se houver alguma) para o guich de
atendimento. Usando as frmulas da distribuio de Poisson com
= 1,7, temos as seguintes equaes para as probabilidades,
mdia e desvio-padro da chegada dos clientes ao guich de
atendimento:


e x (1,7)xe1,7
P(x) = = x! x!

Mdia : =1,7

Estatstica II | 91
Desvio padro:= = 1,7 =1,304
Assim, caso alguma tabela tenha as probabilidades prontas
disponveis para a mdia 1,7, basta olharmos, por exemplo, a
probabilidade de chegar 0 ou 1 ou 2 ou 3 etc. (ou seja, x = 0 ou 1
ou 2 ou 3...) na tabela. A tabela anterior no apresenta
probabilidades para a mdia 1,7, portanto, precisamos utilizar as
frmulas anteriores para calcular as probabilidades de chegada na
calculadora, no Excel, ou mo.

Portanto, se temos uma mdia de chegada igual a = 1,7,


ento:

1,70 e1,7
P(0) = = 0,1827

0!
(a probabilidade de chegar 0 clientes no prximo minuto de
0,1827, ou 18,27%)
1,71e1,7
P(1) = = 0,3106

1!
(a probabilidade de chegar 1 cliente no prximo minuto de
0,3106 ou 31,06%)
1,7 e1.7
1

P(2) = = 0,2640
(a probabilidade de chegarem 2 clientes no prximo minuto
0,2640 ou 26,40%)

1
!

92 | Estatstica II
1,73 e1,7
P(3) = = 0,1496

3!
(a probabilidade de chegarem 3 clientes no prximo minuto
0,1496 ou 14,96%)
1,74 e1,7
P(4) = = 0,0636

4!
(a probabilidade de chegarem 4 clientes no prximo minuto
0,0636 ou 6,36%)
1,75 e1,7
P(5) = = 0,0216

5!
(a probabilidade de chegarem 5 clientes no prximo minuto
0,0216 ou 2,16%)
1,76 e1,7
P(6) = = 0,0061

6!
(a probabilidade de chegarem 6 clientes no prximo minuto
0,0061 ou 0,61%)
1,77 e1,7
P(7) = = 0,0015

7!
(a probabilidade de chegarem 7 clientes no prximo minuto
0,0015 ou 0,15%)

Estatstica II | 93
1,7 e1,7
1

P(8) = = 2,0003
1,79 e1,7
P(9) = = 0,0001

9!
(a probabilidade de chegarem 9 clientes no prximo minuto
0,0001 ou 0,01%)

As probabilidades de Poisson devem somar 1 (exceto quando se


usa arredondamento) como com qualquer distribuio de
probabilidade discreta. Acima de X = 9, neste exemplo, as
probabilidades so menores do que 0,0001. Dentro das
probabilidades observadas acima, o evento mais provvel a
chegada de 1 cliente, pois apresenta a maior probabilidade, que
de 0,3106 ou 31,06%, apesar de que a chegada de 2 clientes
tambm bastante provvel (probabilidade de 0,2640 ou 26,4%),
pois os valores so prximos. Esta informao ajudaria o banco a
programar a quantidade de atendentes para o turno da manh das
quintas-feiras para que o atendimento fosse adequado para estas
probabilidades.

1
!
(a probabilidade de chegarem 8 clientes no prximo minuto
2
,0003 ou 0,03%)

94 | Estatstica II
CAPTULO III

MODELOS DE DISTRIBUIES CONTNUAS DE


PROBABILIDADE

3.1 Eventos como Intervalos

Se X uma varivel discreta, cada valor de X tem sua


prpria probabilidade P(X) e o grfico da funo de distribuio
tem a aparncia de uma escada. Mas quando X uma varivel
contnua, impossvel falar de probabilidade em um ponto,
porque os valores de X no so um conjunto de pontos discretos.
Em vez disso, os eventos so intervalos, e probabilidades so
reas sob curvas suaves. Por exemplo, se X representa a durao
de uma chamada telefnica (em segundos), poderamos estar
interessados em encontrar P (60 X 120), a probabilidade de
que uma chamada dure entre 60 e 120 segundos. O intervalo
poderia ser aberto, tal como X 45 (o evento que uma chamada
dure ao menos 45 segundos) ou X < 30 (o evento que uma
chamada dure menos que 30 segundos).

3.1.1 Probabilidades como reas

Estatstica II | 95
Com variveis discretas, tomamos somas de probabilidades
em grupos de pontos. Mas funes de probabilidade contnuas so
curvas suaves, de modo que a rea em qualquer ponto seria zero.
Em vez de somar probabilidades, consideramos reas sob curvas
e calculamos a probabilidade dos intervalos contnuos, ou seja, a
probabilidade de um valor x cair entre dois valores ou a
probabilidade de um valor x ser maior que outro valor.

Figura 0-1 Probabilidade como rea sob a curva

Vrios podem ser os formatos das distribuies contnuas de


probabilidade. Contudo, vamos aqui estudar brevemente dois tipos
principais de distribuies contnuas probabilsticas: a distribuio
normal e a distribuio normal padro.

3.2 Distribuio Normal

A distribuio normal ou Gaussiana assim chamada em


homenagem ao matemtico alemo Karl Gauss (1777-1855), e
uma distribuio bastante conhecida. Sua importncia se deve ao
seu papel principal na discusso de modelos contnuos e por ser a

96 | Estatstica II
distribuio de probabilidade mais importante para descrever uma
varivel aleatria. A distribuio normal de probabilidade (curva
em forma de sino) definida por apenas dois parmetros: e .

Uma varivel aleatria pode assumir qualquer valor


fracionrio dentro de um intervalo definido de valores. Como no
conseguimos enumerar todos os valores possveis de
probabilidade, usa-se a funo densidade de probabilidade, ou
curva de probabilidade, baseada na funo de probabilidade
correspondente f(x). A proporo da rea includa, ou frequncia
relativa, entre dois pontos quaisquer, abaixo da curva de
probabilidade, identifica a probabilidade de que a varivel aleatria
selecionada assuma um valor entre tais pontos.

importante lembrar que os parmetros populacionais e


possuem os seguintes significados:

= mdia populacional: indica a posio central da distribuio


= desvio-padro populacional: refere-se disperso da
distribuio

Esses dois parmetros determinam completamente o


formato da curva normal. A mdia d a localizao da linha de
simetria e o desvio-padro descreve o quanto os dados esto
estendidos.

Estatstica II | 97
Figura 0-2 Distribuies normais para diferentes valores de mdia e desvio-padro

3.2.1 Principais caractersticas da distribuio Normal:

Uma distribuio normal uma distribuio de probabilidade


contnua para uma varivel aleatria x. O grfico de uma
distribuio normal chamado de curva normal e apresenta as
seguintes caractersticas:

1. Para cada mdia e desvio-padro existe uma curva


diferente;

2. A curva normal tem forma de sino e simtrica em torno da


mdia;

3. A mdia, mediana e moda so iguais;


4. O ponto mais alto da curva est na mdia;
5. A curva simtrica em relao mdia: o lado esquerdo
igual ao lado direito;

6. O desvio-padro determina a largura da curva;

98 | Estatstica II
7. medida que a curva normal se distancia cada vez mais da
mdia, ela se aproxima do eixo x, mas nunca o toca; e

8. A rea total abaixo da curva igual a 1 ou 100%.


Figura 0-3 Distribuio Normal

3.3 Distribuio Normal Padro

Como qualquer distribuio contnua de probabilidade, o


valor da probabilidade pode somente ser determinado para
intervalos de valores da varivel, pois a probabilidade de um nico
valor zero. Cada combinao de mdia e desvio-padro gera
uma distribuio Normal diferente, o que requereria grandes
clculos matemticos para conhecer as probabilidades de cada
distribuio que possua uma mdia e um desvio-padro diferente.
Contudo, para evitar este trabalho, foi criada a Distribuio Normal
Padro. Esta distribuio apresenta = 0 e = 1. A partir desta
distribuio padro foi criada uma tabela com praticamente todas
as vrias probabilidades possveis para os intervalos a serem

Estatstica II | 99
observados nesta distribuio normal padro, que possui = 0 e
= 1. Assim, com base nesta nica distribuio padro, possvel
transformar qualquer distribuio normal com e diversas e
diferentes, em uma normal padro, e assim, saber as
probabilidades de uma atravs da outra.

Figura 0-4 Distribuio Normal Padro

3.3.1 Propriedades da Distribuio Normal Padro


1. A distribuio simtrica em torno da mdia (z = 0 ); 2. A
rea sob a curva normal padro esquerda de z = 0 0,5 e
direita de z = 0 0,5.

3. A rea sob a curva normal padro aumenta conforme


aumenta a distncia entre 0 e z.

Para transformar uma varivel aleatria X qualquer, que tem


distribuio Normal, em uma varivel Z, que representa a
distribuio normal padro, utilizamos a seguinte frmula:

100 | Estatstica II
x z=

Nesta frmula, Z ser o valor padronizado da varivel


normal X. Utilizaremos ento o valor da mdia e do desvio-padro
da varivel X. Se cada valor de uma varivel aleatria x distribuda
normalmente transformada em um valor z, o resultado ser a
distribuio normal padro, ou seja, a rea que cair no intervalo
sob a curva normal NO padro ser a mesma que aquela sob a
curva normal padro dentro das fronteiras z correspondentes. Com
o valor de Z em mos, podemos buscar o seu valor de
probabilidade em uma tabela j disponvel, a tabela da distribuio
Normal Padronizada, para determinar as probabilidades. A figura a
seguir mostra este procedimento de transformao:

Figura 0-5 Transformando um valor X em um valor Z

No Anexo, est disponvel a tabela das probabilidades


acumuladas da distribuio normal padro, para toda a rea da

Estatstica II | 101
curva. Olhando na tabela, procuraremos o valor de z
correspondente a 0,12, que 0,0438, ou seja, a probabilidade
entre z = 0 e e z = 0,12 igual a 0,0438. Contudo, se queremos
toda a probabilidade da parte sombreada, deveremos somar 0,5 a
este valor, que corresponde a toda a metade esquerda da curva.
Assim, a probabilidade total da rea sombreada ser
0,5+0,0438=0,5438. Ou seja, a probabilidade da varivel normal x

102 | Estatstica II
ser menor que 6,2 0,5438. De maneira simplificada,
transformamos a varivel normal x em uma varivel normal
padro z e encontramos a probabilidade equivalente da varivel x
atravs da tabela de probabilidades j existente para a varivel

normal padro z.

CAPTULO VI

Estatstica II | 103
INTERVALO DE CONFIANA

Uma mdia amostral x uma estimativa pontual da mdia


populacional . Como as amostras variam, necessrio indicar
nossa incerteza sobre o verdadeiro valor de . Baseado em nosso
conhecimento da distribuio amostral (usando o Teorema do
Limite Central), construmos um intervalo de confiana que tem
uma probabilidade especificada de conter . Um intervalo de
confiana para a mdia um intervalo

inf erior <<superior onde o limite inferior o menor valor de que


esperamos e o limite superior o maior valor de que
esperamos.

A probabilidade de que o intervalo de confiana contenha a


verdadeira mdia usualmente expressa como uma
porcentagem, chamada nvel ou coeficiente de confiana,
sendo 90%, 95% e 99% os valores mais utilizados. A frmula para
o intervalo de confiana depende da situao, e neste caso
usaremos uma frmula especfica para quando o desvio-padro
conhecido e a populao normal, ou pelo menos o tamanho
da amostra grande (ou seja, n maior que 30). O intervalo de
confiana para a mdia populacional baseado na distribuio

normal e o no erro padro da mdia: / n.

104 | Estatstica II

xz (intervalo de confiana para com conhecido) n
A tabela a seguir mostra os valores de z para os
coeficientes de confiana mais usados.

Tabela 0-1 Coeficientes de Confiana mais utilizados

Coeficiente de z
Confiana
90% 1,645
95% 1,960
98% 2,326
99% 2,576

Esse mtodo se aplica para uma amostra de uma


populao normal ou de uma populao no normal, no caso de a
amostra utilizada ser grande o suficiente para justificar o uso do
Teorema do Limite Central. Podemos utilizar a regra de n 30
para se assumir normalidade de uma populao simtrica, mas
sem valores discrepantes. Contudo, importante utilizar um valor
maior de n se voc tiver amostrando uma populao assimtrica
ou uma com valores discrepantes.

Exemplo: O volume envasado em garrafas de meio litro (500 ml)


de um refrigerante normalmente distribudo. De experincia
passada, o desvio-padro do processo conhecido, sendo igual a
= 1,20 ml. O volume mdio do envasamento pode ser ajustado.

Uma amostra de 10 garrafas fornece uma mdia amostral x =

503,4ml. Como a populao normal, a mdia amostral uma

Estatstica II | 105
varivel aleatria normalmente distribuda para qualquer tamanho
de amostra, de modo que podemos usar os valores z

obtidos daquela distribuio para construir um intervalo de


confiana.

Para uma estimativa intervalar para com 90% de confiana,

consideramos z = 1,645 na frmula junto com a mdia amostral x=

503,4e o desvio-padro conhecido = 1,20.

Intervalo de confiana de 90%:

1,20
xz = 503,4+1,645 = 503,4 0,62 n
10
O intervalo de confiana de 90% para a verdadeira mdia
502,78 < < 504,02. Um intervalo construdo dessa forma tem
uma probabilidade de 0,90 de conter . Para um intervalo de
confiana de 95% utilizaramos z = 1,960, mantendo o restante
igual:

Intervalo de confiana de 95%:

1,20
xz = 503,4+1,96 = 503,4 0,74 n
10
O intervalo de confiana de 95% para 502,66 < < 504,14.
Existe uma probabilidade de 0,95 de que um intervalo construdo

106 | Estatstica II
desta forma conter . Para um intervalo de confiana de 99%,
utilizaramos z = 2,576 na frmula, mantendo o restante igual:

Intervalo de confiana de 99%:

1,20
xz = 503,4+ 2,576 = 503,4 0,98 n
10
O intervalo de confiana de 99% para 502,42 < < 504,38.
Existe uma probabilidade de 0,99 que um intervalo criado dessa
maneira incluir .
CAPTULO V

TESTES DE HIPTESES

Todos os dias nas grandes ou pequenas empresas,


lucrativas ou no, os administradores tm de tomar decises. Os
gerentes atuais tambm tm, constantemente, de mostrar
melhorias nos seus negcios. Ser que uma estncia de esqui
diminuiu o tempo de atendimento em acidentes desde o ltimo
ano? Ser que um novo processo de manufatura produziu itens
com menos defeitos? Ser que os clientes esto mais satisfeitos
aps a instalao do sistema de telefonia automatizada?

Existem ferramentas estatsticas para responder a esses


tipos de perguntas. Os testes de hipteses so usados em todas
as cincias e tambm em negcios, para testar suposies e
teorias e orientar gerentes que precisam tomar decises.

Estatstica II | 107
Uma hiptese estatstica uma afirmao ou uma
pressuposio sobre um parmetro de uma populao.

5.1 Formulao de Hipteses


Ao formularmos afirmaes que queremos testar como
sendo verdadeiras ou falsas estabelecemos o que chamamos de
hipteses. A afirmao que queremos testar chamada hiptese
nula. J a hiptese alternativa aquela que aceitamos quando a
hiptese nula rejeitada. Ambas devem ser formuladas, pois
assim saberemos quando rejeitar a hiptese nula. fundamental
saber que apenas uma das afirmaes deve ser verdadeira, mas
ambas no podem ser verdadeiras.

H0: Hiptese nula


H1: Hiptese alternativa
As duas afirmaes so hipteses porque a verdade
desconhecida. Sero feitos esforos para rejeitar a hiptese nula
(algumas vezes chamada hiptese firmada). Se H0 representa a
teoria favorita, no deveramos desejar rejeit-la, mas tentamos a
qualquer modo para termos certeza que ela pode ser verdadeira.
Se rejeitarmos H0 concluiremos que a hiptese alternativa H1 seja
a verdadeira.

Uma hiptese nula H0 uma hiptese estatstica que contm


uma afirmao de igualdade tal como: , = ou .

108 | Estatstica II
A hiptese alternativa H1 o complemento da hiptese nula.
uma afirmao que deve ser verdadeira se H0 for falsa e contm
uma afirmao de desigualdade estrita, tal como: >, ou <.

Podemos traduzir uma afirmao verbal sobre algum


parmetro populacional em uma afirmao matemtica,
representando as hipteses. Por exemplo, se a afirmao for k e o
parmetro populacional for , alguns possveis pares de hipteses
nula e alternativa seriam:

H10 :k HH10 ::<kk HH10 ::=k k


H :>k

Independente do par de hipteses que voc use, dever


analisar a distribuio amostral com base na sua suposio. A
partir disso, dentro da distribuio amostral voc vai determinar se
a estatstica amostral ou no incomum.

EXEMPLO: Uma universidade publica que a proporo de seus


estudantes que se graduaram em 4 anos de 82%.

A afirmao a proporo... de 82% pode ser escrita como p =


0,82. Seu complemento p 0,82. Em razo de p = 0,82 conter a
igualdade, ela se torna a hiptese nula. Neste caso, a hiptese
nula representa a afirmao.

HH10 :: pp=00,,82 82

Estatstica II | 109
5.2 Hipteses podem ser provadas?
No, no podemos provar a hiptese nula podemos
apenas falhar em rejeit-la. Uma hiptese nula que sobreviva a
testes repetitivos sem rejeio verdadeira somente no sentido
limitado em que ela foi examinada minuciosamente. A hiptese
verdadeira pode ser falsa amanh. Se falharmos em rejeitar H0,
provisoriamente aceitamos H0. Contudo, uma hiptese aceita
pode e deve ser retestada, pois assim que se faz uma
investigao cientfica. Podemos citar as teorias de Einstein, as
quais tm mais de cem anos, mas ainda esto sujeitas a testes
rigorosos para saber se sob novas hipteses essas teorias
continuam verdadeiras. Justamente por resistir a testes
constantes, h mais de cem anos que poucos cientistas
acreditam que as teorias de Einstein estejam erradas. da
natureza da cincia tentar refutar teorias aceitas, especialmente
quando um novo teste possvel ou quando novos dados se
tornam disponveis. De maneira similar, a segurana de
medicamentos comumente usados continuamente estudada.
Algumas vezes, medicamentos considerados seguros revelam
efeitos colaterais srios somente aps o uso em larga escala e
por consumidores que o usam por muitos anos.

110 | Estatstica II
5.3 Papel da Evidncia
Uma hiptese testada quando a contrastamos
contraevidncias. Desta maneira, partimos do pressuposto que
que a hiptese nula seja verdadeira e a partir de ento
procuramos uma contradio. Fazendo uma analogia, assume-se
que um ru em um julgamento criminal seja inocente. A promotora
pblica coleta e apresenta evidncias de acordo com as regras da
lei na tentativa de convencer o jri a rejeitar a hiptese de
inocncia do ru. Se a evidncia contradiz suficientemente a
hiptese de inocncia, o jri votar pela condenao.
Similarmente, os estatsticos coletam e avaliam as evidncias
amostrais de acordo com as regras estatsticas. Uma evidncia
mais completa, como uma amostra maior, tornar uma deciso
correta mais provvel, mas nem sempre teremos informaes e
tempo suficientes para que isso seja feito, ento tomamos
decises com base nos dados disponveis.

5.4 Tipos de Erros

Se a deciso acerca da hiptese nula combina com a


verdadeira situao, ento no h erro. A rejeio da hiptese
nula quando ela verdadeira chamada erro Tipo I, com
probabilidade de acontecer. A falha em rejeitar a hiptese nula
quando ela falsa chamada erro Tipo II, com probabilidade
de acontecer. Como a verdadeira situao usualmente
desconhecida, os estatsticos no sabem se cometeram um erro.

Estatstica II | 111
Para os jurados, assim como para os estatsticos, no h maneira
de evitar erros, embora a probabilidade de cada tipo de erro
possa ser reduzida coletando-se mais evidncias.

Tabela 0-1. Tipos de erros

Deciso Se H0 for Se H0 for falsa


verdadeira
Rejeita H0 Erro Tipo I (risco ) Deciso correta

Falha em rejeitar H0 Deciso Correta Erro Tipo II (risco )

As consequncias desses dois erros so completamente


diferentes, e os custos so arcados por grupos diferentes.
Dependendo da situao, aqueles que tomam a deciso podem
temer cometer um erro mais que o outro. Seria bom se ambos os
tipos de erros pudessem ser evitados, mas como lidamos com
amostras, ou seja, uma quantidade limitada de evidncias, h
sempre a possibilidade de incorrermos em um risco ou outro.
Considere alguns poucos exemplos a seguir. Em cada caso, H0
o status quo, o normal, a situao esperada.

Julgamento Criminal: Em um julgamento criminal, as hipteses


so:

H0: O ru inocente
H1: O ru culpado

112 | Estatstica II
O erro Tipo I condenar um ru inocente, de modo que o
custo seja arcado pelo ru. O erro Tipo II falhar em condenar
um ru culpado, de modo que o custo seja arcado pela sociedade
se a pessoa culpada retornar s ruas.

Teste Antidoping: Quando um atleta olmpico testado sobre o


uso de drogas que melhoram o desempenho, como esteroides,
presume-se que ele esteja em conformidade com as regras. As
amostras de urina e sangue so tomadas como evidncias. As
hipteses so:

H0: Nenhum uso ilegal de esteroides


H1: Uso ilegal de esteroides
O erro Tipo I desqualificar injustamente um atleta que
esteja limpo. O erro Tipo II deixar um usurio de droga
escapar e ter uma vantagem competitiva injusta. O custo do erro
Tipo I a hostilidade e o embarao desnecessrio para o atleta. O
custo do erro Tipo II manchar a imagem olmpica e recompensar
aqueles que violam as regras. Com o tempo, o aperfeioamento
dos testes reduziu o risco de ambos os tipos de erro.

Segurana Biomtrica: Esta aplicao de teste de hiptese que


cresce rapidamente busca maneiras de identificar pessoas
autorizadas e no autorizadas para acesso computacional,
retiradas em caixas eletrnicos, entrada em instalaes com
acesso restrito e assim por diante, usando uma caracterstica
fsica da pessoa (por exemplo, impresses digitais, estrutura

Estatstica II | 113
facial, padro da ris). A inteno livrar-se de identidades de
papel ou plstico, que podem ser forjadas. As hipteses so:

H0: O usurio est autorizado


H1: O usurio no est autorizado
O erro Tipo I significa negar o acesso s instalaes ou aos
fundos a um usurio legtimo. O erro Tipo II permitir o acesso s
instalaes ou ao dinheiro por um usurio no autorizado. A
tecnologia tem progredido a ponto de os erros Tipo II tornarem-se
muito raros, embora os erros Tipo I continuem a ser um problema.
As taxas de erros dependem de quanto despendido em
equipamento e software.

CONCLUSO

Podemos concluir deste mdulo a importncia de


compreender as aplicaes das probabilidades e tambm das
tcnicas de Inferncia Estatstica no cotidiano das empresas.

114 | Estatstica II
A correlao e a regresso podem ser ferramentas para
observar a relao entre duas variveis e auxiliar na previso da
tendncia futura dos valores das variveis observveis.

J as distribuies de probabilidade so teis para


identificarmos as probabilidades de eventos nos quais estamos
interessados, e assim, tomar decises adequadas ao cenrio de
ocorrncia mais provvel.

Os Intervalos de Confiana nos auxiliam a identificar, com o


nvel de preciso desejado, dentro de qual intervalo uma medida
pode se encontrar, a assim podemos saber o que esperar de um
possvel resultado.

Os Testes de Hiptese so teis para testar as suposies


que queremos fazer para toda uma populao a partir de uma
amostra. Assim, os Testes de Hipteses podem ser utilizados
para testar intervalos de confiana, correlao e regresso, e
tambm as distribuies de probabilidade.

A importncia e utilidade dessas ferramentas so visveis,


portanto, aprofundar-se nas tcnicas estatsticas traz vantagens
para o administrador que as dominar e compreender as
informaes por trs dos dados obtidos.
REFERNCIAS

DOANE, D. P; SEWARD, L. E. Estatstica Aplicada


Administrao e Economia. So Paulo: McGraw-Hill, 2008.

Estatstica II | 115
FREUND, J. E. Estatstica Aplicada: Economia, Administrao
e Contabilidade. Porto Alegre: Bookman, 2006, 11 ed.
LARSON, R; FARBER, B. Estatstica Aplicada. So Paulo:
Prentice Hall, 2010, 4 ed.

116 | Estatstica II
ANEXO

Tabela 0-1 Tabela de Probabilidades da Distribuio Normal Padronizada para valores


de 0 a z.

No inclui intervalos de z a 0.

Estatstica II | 117
118 | Estatstica II

You might also like