You are on page 1of 99

Captulo I Teoria das Probabilidades

No dia a dia deparamo-nos com dois tipos de fenomenos:


Fen omenos determinsticos, os quais, quando realizados sob as mesmas condicoes, ocor-
rem sempre da mesma forma;
Fen omenos aleat orios, os quais, mesmo mantendo as condicoes de realizacao, e im-
possvel dizer a priori a forma como o fenomeno ira ser observado.
A Teoria das Probabilidades e a area da Matematica que tem por objectivo construir e estu-
dar modelos matematicos que permitam descrever fenomenos aleatorios.
I.1 Noc oes basicas
I.1.1 Experiencia aleat oria
O estudo dos fenomenos aleatorios e feito recorrendo ao conceito de experiencia aleatoria.
Experiencia: Todo o processo ou conjunto de circunstancias capaz de produzir resultados obser-
vaveis.
Experiencia aleat oria (e.a.): Toda a experiencia sujeita a factores casuais que impossibilitam
prever com exactidao o seu resultado e que, repetida em condicoes identicas, pode produzir
diferentes resultados. Usualmente representa-se por .
Caractersticas fundamentais de uma e.a.:
caracter imprevisvel dos resultados: cada realizacao da experiencia conduz a um
resultado individual pertencente a um conjunto (conhecido previamente) de resultados
possveis mas, antes de realizada a experiencia, nao ha conhecimento suciente para predizer
com exactidao qual sera o resultado obtido;
a possibilidade de repeticao: a e.a. pode ser repetida um grande n umero de vezes nas
mesmas condicoes ou em condicoes muito semelhantes;
a regularidade estatstica: embora os resultados individuais apresentem uma irregula-
ridade, apos um grande n umero de realizacoes da e.a. observa-se uma forte regularidade
nos resultados obtidos quando analisados em conjunto.
1
Exemplos:

1
Lancamento de uma moeda e registo da face exposta;

2
Lancamento de um dado e registo da face exposta;

3
Lancamento de uma moeda ate aparecer coroa e registo das faces expostas;

4
Lancamento conjunto de uma moeda e de um dado e registo das faces expostas;

5
Registo do n
o
chamadas telefonicas que chegam a uma central num determinado
perodo de tempo;

6
Registo da duracao das chamadas telefonicas recebidas numa central num certo perodo.
Note-se que, quando se realiza uma experiencia devemos sempre indicar quais as caractersticas
relevantes que estamos interessados em estudar.
1. No primeiro exemplo (
1
):
o lancamento pode repetir-se um grande n umero de vezes nas mesmas condicoes (conside-
rando que o desgaste da moeda e nulo);
em cada lancamento da moeda o resultado (cara ou coroa) e imprevisvel.
Para ilustrar a caracterstica da regularidade estatstica suponhamos que a moeda
e equilibrada; se efectuarmos um grande n umero de lancamentos constataremos que o
n umero de vezes que sai cara e aproximadamente igual ao n umero de vezes que sai
coroa (isto e, a proporcao de observacoes da face cara estara proxima de 50%).
A caracterstica da regularidade vai ser muito util na denicao de um quanticador do acaso, i.e.,
num n umero capaz de traduzir a possibilidade, por exemplo de obter cara quando efectuamos
um lancamento da moeda.
2. Sao tambem claras, em todos os outros exemplos, quer a possibilidade de repetir a ex-
periencia quer a impossibilidade de prever, com exactidao, os resultados individuais.
I.1.2 Espaco de resultados
Ao realizarmos uma e.a. obtemos um resultado individual, w.
Espaco de resultados ou espaco amostral: Conjunto formado por todos os resultados possi-
veis de uma e.a. e que denotaremos por . (Nota: e conhecido mesmo antes da e.a. se realizar.)
2
Consoante n umero de elementos de diremos:
e discreto, se tem um n umero nito ou innito numeravel de elementos;
e contnuo, se tem um n umero innito nao numeravel de elementos.
Exemplos:

1
= C, K onde C representa a face exposta e cara e K representa a face exposta e
coroa #
1
= 2
1
e nito, logo
1
e discreto;

2
= 1, 2, 3, 4, 5, 6 onde i representa a face exposta tem o n umero i, i = 1, ..., 6,
#
2
= 6
2
e nito, logo
2
e discreto;

3
= K, CK, CCK, CCCK, . . .
3
e innito numeravel, logo
3
e discreto;

4
= (C, i), (K, i), i = 1, 2, 3, 4, 5, 6 #
4
= 12
4
e nito, logo
4
e discreto;

5
= N
0

5
e innito numeravel, logo
5
e discreto;

6
= R
+
0

6
e innito nao numeravel, logo
6
e contnuo.
Note-se que o espaco de resultados pode conter elementos que nao sejam resultados possveis
da e.a. (nao havendo inconveniente neste procedimento). Grave e considerar como espaco de
resultados um conjunto que nao inclua algum dos resultados possveis da experiencia.
I.1.3 Acontecimentos
Ao enunciarmos uma propriedade comum a alguns resultados da experiencia estamos a denir
um subconjunto de a que chamaremos acontecimento. Assim,
Acontecimento: Qualquer subconjunto de .
Em relacao a uma dada e.a. diz-se que o acontecimento A se realiza (ou A ocorre) se e so se,
ao realizar a e.a., o resultado obtido, w, e um elemento de A, w A. Se w / A diremos que A
nao se realiza (ou A nao ocorre).
Note-se que:
e um acontecimento que se realiza sempre, da ser chamado de acontecimento certo;
3
o conjunto vazio, , e um acontecimento que nunca se realiza, da ser chamado de aconte-
cimento impossvel;
todo o acontecimento constitudo por um unico elemento de , w, e chamado de acon-
tecimento elementar.
Exemplos:
1. Na experiencia aleatoria

1
Lancamento de uma moeda e registo da face exposta
onde
1
= C, K, temos como acontecimentos:
C = sada de cara; K = sada de coroa, e ainda
C, K e .
O conjunto de todos os acontecimentos possveis desta e.a., i.e., o conjunto das partes de
1
,
e entao:
T(
1
) = , C, K, C, K,
2. Para as experiencias aleatorias:

2
Lancamento de um dado e registo da face exposta;

3
Lancamento de uma moeda ate aparecer coroa e registo das faces expostas;

4
Lancamento conjunto de uma moeda e de um dado e registo das faces expostas;

5
Registo do n
o
chamadas telefonicas que chegam a uma central num determinado
perodo de tempo;

6
Registo da duracao das chamadas telefonicas recebidas numa central num certo perodo
de tempo.
podemos denir, respectivamente, os seguintes acontecimentos:
A = sada de n umero par, i.e., A = 2, 4, 6;
B = sada de no maximo 3 caras, i.e., B = K, CK, CCK, CCCK;
C = sada de cara e n umero mpar, i.e., C = (C, 1), (C, 3), (C, 5);
D = o n umero de chamadas telefonicas que chegam `a central no referido perodo de tempo
esta entre 10 e 20, exclusive, i.e., D = 11, . . . , 19;
E = a duracao das chamadas telefonicas recebidas e superior a 50 horas, i.e.,
E =]50, +[.
4
I.2 Operac oes e relac oes entre acontecimentos
Uma vez que os acontecimentos sao conjuntos, toda a algebra de conjuntos e aplicavel aos
acontecimentos. Relembremos, pois, algumas operacoes e terminologia correspondente adaptada
aos acontecimentos.
Sejam um espaco de resultados e A e B dois subconjuntos quaisquer de .
1. Inclus ao de acontecimentos:
O acontecimento A esta contido no acontecimento B, e escrevemos
A B, se e so se:
Realizacao de A Realizacao de B;
Realizacao de A Realizacao de B.
S
B
A
2. Acontecimentos identicos:
A e B dizem-se acontecimentos identicos, e escrevemos A = B, se e so se A B e B A.
3. Acontecimentos interseccao, reuniao, diferenca e complementar:
Acontecimento Notacao Descricao verbal Diagrama de Venn
Interseccao de A e B
A B Realizacao simultanea de A e de B
A B
Reuniao de A e B A B Realizacao de A ou de B, i.e., de pelo
menos um dos acontecimentos
A B
Diferenca entre A e B A B Realizacao de A e nao realizacao de
B (A excepto B)
A B
Complementar de A A = A Nao realizacao de A
A
5
Acontecimentos incompatveis:
Dois acontecimentos A e B de dizem-se incompatveis (disjuntos
ou mutuamente exclusivos) se e so se
A B = ,
i.e., se a realizacao simultanea de A e B for impossvel.
S
A B
As operacoes sobre acontecimentos gozam de propriedades bem conhecidas como a associativi-
dade, comutatividade, etc., que passamos a recordar.
Propriedade Reuniao Interseccao
Associatividade A (B C) = (A B) C A (B C) = (A B) C
Comutatividade A B = B A A B = B A
Idempotencia A A = A A A = A
Distributividade A (B C) = (A B) (A C) A (B C) = (A B) (A C)
Absorcao A B A B = B A B A B = A
Elemento absorvente A = A =
Elemento neutro A = A A = A
Leis de Morgan A B = A B A B = A B
Complementaridade A A = A A =
Dupla negacao A = A
6
I.3 Probabilidade de um acontecimento
I.3.1 Denicao frequencista de probabilidade
Sejam um espaco de resultados e A . Baseada na propriedade da regularidade estatstica
de uma experiencia aleatoria, a teoria frequencista de probabilidade dene
P(A) = probabilidade do acontecimento A
= n
o
em torno do qual tende a estabilizar a frequencia relativa
de ocorrencias de A quando a experiencia aleatoria e realizada
um grande n umero de vezes sempre nas mesmas condicoes.
Por forma a apresentar uma denicao formal deste conceito, e conveniente relembrarmos a de-
nicao de frequencia relativa de um acontecimento. Sejam:
N o n
o
de realizacoes (nas mesmas condicoes) de certa e.a.;
n
N
(A) o n
o
de vezes que ocorreu o acontecimento A nas N realizacoes da e.a. (i.e., a
frequencia absoluta do acontecimento A).
Entao a frequencia relativa do acontecimento A e dada por
f
N
(A) =
n
N
(A)
N
.
Denicao frequencista de probabilidade:
A probabilidade do acontecimento A e igual ao limite da frequencia relativa da ocorrencia do
acontecimento A, i.e.,
P(A) = lim
N+
n
N
(A)
N
= lim
N+
f
N
(A).
Propriedades algebricas da frequencia relativa:
Para qualquer n
o
N de realizacoes de certa e.a. (nas mesmas condicoes),
0 f
N
(A) 1;
f
N
() = 1;
f
N
(A B) = f
N
(A) +f
N
(B), se A B = .
7
Por outro lado,
f
N
(A) estabiliza `a medida que N aumenta.
Consequentemente, a funcao de probabilidade goza das seguintes propriedades:
0 P(A) 1;
P() = 1;
P(A B) = P(A) +P(B), se A B = .
Limitac oes:
A denicao frequencista de probabilidade e pouco pratica de ser aplicada uma vez
que pode ser difcil explicitar a partir de que valor de N a frequencia relativa de um
acontecimento aproxima convenientemente a sua probabilidade.
Alem disso, quando a e.a. implica a destruicao do objecto em estudo a repeticao em larga
escala da e.a. nao e de todo conveniente.
I.3.2 Denicao classica de probabilidade
A primeira tentativa de construir um modelo matematico capaz de traduzir a medida do acaso,
data de 1812 e deve-se a Laplace. A denicao proposta e actualmente conhecida por:
Denicao classica de probabilidade:
Seja A um acontecimento de um espaco de resultados , nito e nao vazio, e tal que todos
os resultados da experiencia aleatoria tem a mesma possibilidade de ocorrer (acontecimentos
elementares equiprovaveis). Entao, a probabilidade de realizacao de A e dada por:
P(A) =
n
o
de casos favoraveis `a realizacao de A
n
o
de casos favoraveis `a realizacao de
=
#A
#
.
Formalmente, P e a aplicacao
P : T() [0, 1]
A P(A) =
#A
#
.
8
Limitac oes: Esta denicao so e valida quando:
e nito e nao vazio;
todos os acontecimentos elementares sao equiprovaveis.
Exemplos:
1. Em
1
,
1
= C, K, pelo que #
1
= 2 < .
Assim, admitindo que a moeda e equilibrada (por forma a termos equiprobabilidade),
P(A) = #A/2, para qualquer A
e
P(sada de cara) = P(C) = 1/2;
P(sada de coroa) = P(K) = 1/2;
P() = P(C, K) = 2/2 = 1 e P() = 0/2 = 0.
2. Em
2
,
2
= 1, 2, 3, 4, 5, 6, pelo que #
2
= 6 < .
Assim, admitindo que o dado e equilibrado (por forma a termos equiprobabilidade),
P(A) = #A/6, para qualquer A
e
P(sada de face par) = P(2, 4, 6) = 3/6 = 1/2;
P(sada de n
o
primo) = P(1, 2, 3, 5) = 4/6 = 2/3;
P(sada de m ultiplo de 7) = P() = 0/6 = 0.
3. Em
3
,
3
= (C, i), (K, i), i = 1, 2, 3, 4, 5, 6, pelo que #
3
= 12 < .
Assim, admitindo que o dado e moeda sao equilibrados,
P(A) = #A/12, para qualquer A
e
P(sada de cara e n
o
mpar) = P((C, 1), (C, 3), (C, 5)) = 3/6 = 1/2;
P(sada de coroa e m ultiplo de 3) = P((K, 3), (K, 6)) = 2/6 = 1/3;
P(sada de n
o
menor que 2) = P((C, 1), (K, 1)) = 2/6 = 1/3.
E se nao e nito? E se nao ha equiprobabilidade?
Kolmogorov, em 1933, propoe uma solucao denindo axiomaticamente a nocao de probabilidade!
9
I.3.3 Denicao axiomatica de probabilidade
Vejamos como tera surgido a proposta de Kolmogorov para denir a funcao de probabilidade
abrangendo espacos de resultados gerais nos quais pode ou nao haver equiprobabilidade.
1. Pretende-se associar a cada acontecimento A um n umero real P(A).
2. Assim, a funcao de probabilidade P sera uma aplicacao sobre um conjunto composto por
todos os subconjuntos aos quais seja possvel atribuir uma probabilidade (conjuntos resultado de
complementares, unioes, interseccoes, etc., de quaisquer acontecimentos).
Denicao axiomatica de probabilidade:
Seja um espaco de resultados associado a uma experiencia aleatoria. Uma probabilidade P e
toda a aplicacao que a cada acontecimento de faz corresponder um n umero real satisfazendo
os axiomas seguintes:
(A1) P(A) 0, A ;
(A2) P() = 1;
(A3) Se A
1
A
2
= (i.e., A
1
e A
2
sao acontecimentos incompatveis), entao
P (A
1
A
2
) = P(A
1
) +P(A
2
).
Os axiomas apresentados referem-se ao caso de ser nito. Quando e innito, o conjunto de
axiomas esta incompleto. Tera entao que se considerar a generalizacao do axioma A3 ao caso de
uma sucessao innita de acontecimentos. Teremos entao o axioma:
(A3) Se (A
n
)
nN
e uma sucessao de acontecimentos dois a dois incompatveis (i.e.,
A
i
A
j
= , i ,= j), entao
P
_
+
_
n=1
A
n
_
=
+

n=1
P(A
n
).
A denicao de probabilidade segundo Kolmogorov legitima a denicao classica correspondente
a uma e.a. com um n umero nito de resultados igualmente possveis. De facto, sendo um
10
conjunto nito, nao vazio, e com equiprobabilidade, a funcao P : T() [0, 1] denida por
P(A) =
#A
#
, A T() (ou equivalentemente A ),
e uma probabilidade, como facilmente se prova.
II.4 Propriedades de uma probabilidade
Propriedade: A probabilidade do acontecimento impossvel e nula, i.e., P() = 0.
Demonstracao: Consideremos os acontecimentos A
1
= e A
2
= . Note-se que estes aconte-
cimentos sao incompatveis, uma vez que A
1
A
2
= . Desta forma, pelo axioma (A3), vem
P(A
1
A
2
) = P(A
1
) +P(A
2
).
Mas A
1
A
2
= , logo
P () = P() +P(A
2
),
o que implica que P(A
2
) = P() = 0.
Note-se no entanto que P(A) = 0 nao implica que A = . Em particular, um acontecimento, tal
que P(A) = 0 mas A ,= diz-se um acontecimento quase-impossvel.
Por outro lado, um acontecimento tal que P(A) = 1, mas no entanto A ,= diz-se um aconte-
cimento quase-certo.
Propriedade (Aditividade de P): Se A
1
, A
2
, . . . , A
k
sao acontecimentos dois a dois incom-
patveis, entao
P
_
k
_
n=1
A
n
_
=
k

n=1
P(A
n
).
Demonstracao: Basta considerar a sucessao de acontecimentos
A
1
, A
2
, . . . , A
k
, , , . . . , , . . .
e ter em conta o axioma (A3) e a propriedade anterior.
11
Em particular, se A e B sao dois acontecimentos incompatveis (i.e., se A B = ), ent ao
P(A B) = P(A) +P(B).
Propriedade (Monotonia de P): Se A e B sao dois acontecimentos tais que A B, entao
P(A) P(B).
Demonstracao: Temos
B = A (B A) e A (B A) = .
Assim, pela aditividade de P (i.e., pelo resultado anterior),
P(B) = P(A) +P(B A) P(A)
uma vez que P e uma funcao nao negativa e portanto P(B A) 0.
Propriedade: Se A e B sao dois acontecimentos quaisquer, entao
P(B A) = P(B) P(A B).
Demonstracao: Note-se que
B = (B A) (A B), com (B A) (A B) = .
Assim, pela aditividade de P,
P(B) = P(B A) +P(A B).
Note-se, em particular, que se A B entao
P(B A) = P(B) P(A).
Propriedade (Probabilidade do acontecimento contrario): Se A e um acontecimento,
entao
P(A) = 1 P(A).
Demonstracao: P(A) = P( A) = P() P( A) = 1 P(A).
12
Propriedade: Se A e B sao acontecimentos quaisquer, entao
P(A B) = P(A) +P(B) P(A B).
Demonstracao: Tem-se
P(A B) = P[(A B) (A B) (B A)]
e A B, A B e B A sao acontecimentos 2 a 2 incompatveis.
Deste modo, pela aditividade de P,
P(A B) = P(A B) +P(A B) +P(B A)
= [P(A) P(A B)] +P(A B) + [P(B) P(A B)]
= P(A) +P(B) P(A B).
Propriedade (Reuniao de tres acontecimentos): Sejam A, B e C tres acontecimentos
quaisquer, entao
P(A B C) = P(A) +P(B) +P(C) P(A B) P(A C) P(B C) +P(A B C).
Exerccio: Na experiencia aleatoria

2
Lancamento de um dado e registo da face exposta
considere-se que o dado e viciado, sendo que, embora as faces numeradas de 1 a 5 tenham a
mesma probabilidade de ocorrer, a probabilidade de ocorrer a face 6 e o dobro da de qualquer
outra face.
(a) Calcule a probabilidade de obter a face 6. (i.e., P(6) =?)
(b) Calcule a probabilidade de obter um n umero mpar. (i.e., P(1, 3, 5) =?)
Solucao: Neste caso
2
= 1, 2, 3, 4, 5, 6, pelo que #
2
= 6. Tem-se que
2
,= e #
2
< .
No entanto, nao ha equiprobabilidade, logo a denicao classica de probabilidade nao
se aplica.
13
Recorremos entao `a denicao axiomatica de probabilidade.
1. As faces numeradas de 1 a 5 tem a mesma probabilidade de ocorrer:
P(1) = P(2) = P(3) = P(4) = P(5) = x.
2. A probabilidade de ocorrer a face 6 e o dobro da de qualquer outra face:
P(6) = 2x.
3. Assim
P() = P(1, 2, 3, 4, 5, 6) = P(1 2 3 4 5 6)
= P(1) +P(2) +P(3) +P(4) +P(5) +P(6), aditividade de P
= x +x +x +x +x + 2x = 7x,
pelo que,
P() = 1 x = 1/7 e P(6) = 2/7.
4. Por outro lado,
P(obter um n umero mpar) = P(1, 3, 5)
= P(1 3 5)
= P(1) +P(3) +P(5), aditividade de P
= 3x = 3/7.
I.5 Probabilidade condicionada
Exerccio: Suponhamos que dispomos de um baralho (nao viciado) de 52 cartas do qual ex-
tramos, ao acaso, uma carta registando a carta observada.
(a) Calcule a probabilidade de ter sado um rei.
(b) Calcule a probabilidade de ter sado um rei, sabendo `a partida que:
(i) a carta extrada e uma gura; (ii) a carta extrada e um as; (iii) a carta extrada e do
naipe vermelho.
Resolucao: (a) Neste caso,
= cartas do baralho, com # = 52.
14
Assim, como e nito (nao vazio) e ha equiprobabilidade,
P(A) =
#A
#
=
#A
52
, para todo o A .
Considerando o acontecimento
A = a carta extrada e um rei
tem-se
P(A) =
4
52
=
1
13
.
(b) (i) Suponhamos agora que, ao tirar a carta do baralho, conseguimos ver que a carta extrada
e uma gura. Seja entao
B = a carta extrada e uma gura.
Nestas condicoes torna-se mais provavel que A ocorra. De facto, a probabilidade de A e agora
dada por
Q
1
(A) =
4
12
=
1
3
=
#(A B)
#B
> P(A).
(b) (ii) Suponhamos agora que, ao tirar a carta do baralho, conseguimos ver que e um as. Seja
C = a carta extrada e um as.
Nestas condicoes sabemos que a sada de um rei e um acontecimento impossvel, sendo a proba-
bilidade de A dada por
Q
2
(A) =
0
4
= 0 =
#(A C)
#C
< P(A).
(b) (iii) Finalmente, admitamos agora que, ao tirar a carta, conseguimos ver que ela e do naipe
vermelho. Seja
D = a carta extrada e do naipe vermelho.
Nestas condicoes a probabilidade de ocorrer A mantem-se inalterada, sendo dada por
Q
3
(A) =
2
26
=
1
13
=
#(A D)
#D
= P(A).
15
No exemplo anterior, constatamos que a probabilidade de um acontecimento A pode (ou nao)
variar `a medida que nos e adiantada diferente informacao sobre a ocorrencia de outro aconteci-
mento.
A questao que se coloca e: de que forma a obtencao de informacao adicional (correspondente `a
ocorrencia de outros acontecimentos) pode vir a inuenciar o calculo das probabilidades?
Para abordar esta questao, munimo-nos de uma notacao mais sugestiva para as probabilidades
Q
1
, Q
2
e Q
3
:
Q
1
(A) = P
B
(A), Q
2
(A) = P
C
(A) e Q
3
(A) = P
D
(A),
as quais denotam a nova probabilidade do acontecimento A, quando se conhece a ocorrencia de
B, C e D, respectivamente.
Esta nova probabilidade P
B
(A), tambem denotada por P(A/B), `a qual chamaremos probabi-
lidade de A condicionada por B, pode ser expressa em funcao de P a partir de
P
B
(A) =
#(A B)
#B
=
#(A B)/#
#B/#
=
P(A B)
P(B)
.
A motivacao anterior foi feita no quadro classico (de Laplace) de probabilidade uma vez que
estavamos a trabalhar com nito e equiprobabilidade. Analogamente no caso geral,
Denicao de probabilidade condicionada
Seja o espaco de resultados associado a uma e.a. e sejam A e B dois acontecimentos de tais
que P(B) > 0. Chama-se probabilidade de A condicionada por B (ou probabilidade de
A dado B) a
P
B
(A) = P(A/B) =
P(A B)
P(B)
.
Note-se que, se B e tal que P(B) > 0, a aplicacao P
B
que faz corresponder a cada aconte-
cimento A o n umero real
P
B
(A) = P(A/B) =
P(A B)
P(B)
e uma probabilidade (no sentido de Kolmogorov). De facto,
P
B
e uma funcao com valores em [0, 1] uma vez que,
A , AB B, logo 0 P(AB) P(B) e portanto 0 P
B
(A) =
P(A B)
P(B)
1.
16
Tem-se tambem P
B
() = P(/B) =
P( B)
P(B)
=
P(B)
P(B)
= 1.
Se (A
n
)
nN
e uma sucessao de acontecimentos dois a dois incompatveis, entao
P
B
_
+
_
n=1
A
n
_
=
+

n=1
P
B
(A
n
).
Deste modo, P
B
(ou P(/B)) verica todas as propriedades de uma probabilidade. Em particular:
P
B
() = 0 (ou P(/B) = 0);
P
B
(A) = 1 P
B
(A) (ou P(A/B) = 1 P(A/B));
P
B
(A C) = P
B
(A) +P
B
(C) P
B
(A C)
(ou P((A C)/B) = P(A/B) +P(C/B) P((A C)/B)).
Dados dois acontecimentos A e B tais que P(B) > 0, da denicao da probabilidade condicionada
P
B
, decorre imediatamente que
P(A B) = P
B
(A)P(B).
Analogamente, dados dois acontecimentos A e B tais que P(A) > 0, da denicao da probabilidade
condicionada P
A
, decorre imediatamente que
P(A B) = P
A
(B)P(A).
Assim, da denicao de probabilidade condicionada, segue que
P(A B) = P
B
(A)P(B) = P
A
(B)P(A) i.e. , P(A B) = P(A/B)P(B) = P(B/A)P(A)
desde que P(A) > 0 e P(B) > 0.
A generalizacao deste resultado para a interseccao de n acontecimentos constitui o teorema da
probabilidade composta.
Teorema da probabilidade composta: Seja A
1
, A
2
, . . . , A
n1
, A
n
uma coleccao de n aconte-
cimentos tal que P(A
1
A
2
A
n1
) > 0. Entao
P(A
1
A
2
A
n1
A
n
) = P(A
1
) P
A
1
(A
2
) P
A
1
A
2
(A
3
) P
A
1
A
2
A
n1
(A
n
).
17
O teorema da probabilidade composta e de extrema utilidade quando pretendemos calcular a
probabilidade de sequencias de acontecimentos em experiencias aleatorias.
Particao de : A coleccao de n acontecimentos A
i
, i = 1, ..., n diz-se uma particao de se e
so se:
A
i
A
j
= , i ,= j (i.e., os acontecimentos sao dois a dois incompatveis);

n
_
i=1
A
i
= ;
P(A
i
) > 0, i = 1, ..., n.
As particoes com que lidaremos sao constitudas por um n umero nito de acontecimentos. Estes
tambem podem ser em n umero innito numeravel.
Teorema da probabilidade total: Sejam B um acontecimento e A
i
, i = 1, ..., n uma particao
de . Entao
P(B) =
n

i=1
P(B/A
i
)P(A
i
).
Este resultado e importante, pois permite calcular a probabilidade de um acontecimento B,
quando se dispoe das probabilidades de B condicionadas a acontecimentos A
i
(que constituem
uma particao de ) e das probabilidades os acontecimentos A
i
, i = 1, . . . , n.
Exerccios:
1. Uma das experiencias que Pavlov realizava, com o objectivo de estudar o comportamento dos
animais, consistia em introduzir um rato num compartimento com quatro portas. Embora as
portas fossem aparentemente iguais, so uma delas era considerada boa sendo as tres restantes
consideradas mas. De cada vez que o rato escolhia uma porta ma, recebia uma pequena descarga
electrica e regressava ao ponto de partida. Este processo repetia-se ate que o rato escolhesse a
porta boa sendo entao libertado do compartimento. Admitindo que o rato tem memoria perfeita,
isto e, que em cada nova tentativa ele nao escolhe as portas mas anteriormente escolhidas e
escolhe, de modo equiprovavel, uma das que restam, calcule a probabilidade de o rato ser libertado
do compartimento:
(a) ao m de 2 tentativas; (b) ao m de 3 tentativas; (c) ao m de 4 tentativas.
18
2. Numa f abrica de material electrico sao produzidas, diariamente, lampadas de tres tipos
diferentes: T
1
, T
2
e T
3
. As lampadas de tipo T
1
constituem 20% da producao diaria da fabrica,
enquanto que para as lampadas do tipo T
2
essa percentagem e de 30%. As lampadas produzidas
pela fabrica emitem luz branca ou amarela. Sabe-se ainda que todas as lampadas de tipo T
1
emitem luz branca, enquanto que apenas 30% da producao diaria de lampadas de tipo T
2
emitem
este tipo de luz. Alem disso, das lampadas produzidas diariamente, 40% das que emitem luz
amarela sao de tipo T
3
.
Extrai-se, ao acaso, uma lampada da producao da fabrica em determinado dia.
(a) Determine a probabilidade da lampada emitir luz amarela.
(b) Calcule a probabilidade da referida lampada ser de tipo T
2
ou emitir luz branca.
I.6 Acontecimentos independentes
Denicao: Dois acontecimentos A e B de um mesmo espaco de resultados dizem-se inde-
pendentes se
P(A B) = P(A)P(B).
Observacao: Nao confundir acontecimentos independentes com acontecimentos incompatveis.
A nocao de incompatibilidade e intrnseca dos acontecimentos, nao dependendo da probabilidade
A e B incompatveis A B = .
Por outro lado, a nocao de independencia esta directamente ligada `a probabilidade P denida
no espaco de resultados
A e B independentes P(A B) = P(A)P(B).
Consequencias:
1. Os acontecimentos e sao independentes de qualquer outro acontecimento.
2. Sejam A e B acontecimentos independentes e tais que P(A) > 0 e P(B) > 0. Entao:
P
B
(A) = P(A) e P
A
(B) = P(B).
Isto e, o conhecimento de B nao afecta a reavaliacao da probabilidade de A, e vice-versa.
19
Esta propriedade, traduz a ideia natural de independencia e alguns autores usam-na como de-
nicao de independencia de dois acontecimentos. Note-se no entanto, ela so aplicavel a aconte-
cimentos de probabilidade estritamente positiva.
3. Sejam A e B dois acontecimentos incompatveis (AB = ) e tais que P(A) > 0 e P(B) > 0.
Entao A e B nao sao independentes, i.e., P(A B) ,= P(A)P(B).
4. Sejam A e B dois acontecimentos independentes. Entao
A e B sao acontecimentos independentes;
A e B sao acontecimentos independentes;
A e B sao acontecimentos independentes.
Passemos agora `a denicao geral de uma famlia nita de acontecimentos independentes.
Denicao: Os acontecimentos A
1
, A
2
, . . . , A
n
dizem-se (completamente ou mutuamente)
independentes se e so se
k > 1 i
1
, i
2
, . . . , i
k
1, 2, . . . , n, P(A
i
1
A
i
2
. . . A
i
k
) = P(A
i
1
)P(A
i
2
) . . . P(A
i
k
),
i.e., se e so se o forem dois a dois, tres a tres, . . ., n a n.
Denicao: Os acontecimentos A
1
, A
2
, . . . , A
n
dizem-se dois a dois independentes se e so se
i, j 1, 2, . . . , n, i ,= j, P(A
i
A
j
) = P(A
i
)P(A
j
).
Caso particular: (Independencia completa de 3 acontecimentos) Os acontecimentos A,
B e C dizem-se (completamente ou mutuamente) independentes se e so se:
_

_
P(A B) = P(A)P(B)
P(A C) = P(A)P(C)
P(B C) = P(B)P(C)
P(A B C) = P(A)P(B)P(C)
.
Para os acontecimentos A, B e C serem dois a dois independentes basta vericarem as tres
primeiras igualdades.
20

E claro que se n acontecimentos sao mutuamente independentes entao eles sao dois a dois inde-
pendentes. No entanto, acontecimentos dois a dois independentes podem nao ser mutuamente
independentes.
Exerccio: Seja a e.a. que consiste em dois lancamentos sucessivos de um dado equilibrado
e registo das faces expostas. Considere-se os seguintes acontecimentos:
A = o resultado obtido no primeiro dado e um n umero par;
B = o resultado obtido no segundo dado e um n umero par;
C = a pontuacao total e um n umero par.
Neste caso, = (i, j) : i, j 1, . . . , 6 e # = 36. Assim, como e nito (nao vazio) e ha
equiprobabilidade,
P(A) =
#A
#
=
#A
36
, para todo o A .
Tem-se entao
P(A) = P((i, j) : i 2, 4, 6, j 1, . . . , 6) =
18
36
=
1
2
;
P(B) = P((i, j) : i 1, . . . , 6, j 2, 4, 6) =
18
36
=
1
2
;
P(C) = P((i, j), (k, l) : i, j 2, 4, 6, k, l 1, 3, 5) =
18
36
=
1
2
.

E imediato vericar que os acontecimentos A, B e C sao dois a dois independentes. De facto,


P(A B) = P((i, j) : i, j 2, 4, 6) =
#(A B)
36
=
9
36
=
1
4
= P(A)P(B);
P(A C) = P((i, j) : i, j 2, 4, 6) =
#(A C)
36
=
1
4
= P(A)P(C);
P(B C) = P((i, j) : i, j 2, 4, 6) =
#(B C)
36
=
1
4
= P(B)P(C).
No entanto, os tres acontecimentos sejam independentes, uma vez que
P(A B C) = P((i, j) : i, j 2, 4, 6) =
#(A B C)
36
=
1
4
,= P(A)P(B)P(C) =
1
2

1
2

1
2
=
1
8
.
21
Captulo IIVariaveis Aleatorias Reais
II.1 Variavel aleat oria real e sua lei de probabilidade
Em muitas situacoes, o concretismo do espaco de resultados pode, e com grande vantagem,
ser omitido em favor de uma, ou varias, quantidades numericas de interesse. Queremos com isto
dizer que, em muitos casos, ao realizar uma e.a. nao estamos interessados especicamente nos
seus resultados individuais, w, mas sim em certas quantidades numericas a eles associados.
Basta pensar, por exemplo, numa experiencia de controlo de qualidade na qual se classicam
2 artigos, seleccionados ao acaso da producao de uma fabrica, quanto a serem defeituosos (D)
ou nao defeituosos (N). Ao realizar esta e.a. o analista nao esta geralmente interessado nos
resultados detalhados da mesma (a saber, NN, ND, DN, DD) mas sim no n umero de artigos
defeituosos encontrados nos 2 inspeccionados (a saber, 0, 1, 2).
Neste caso, esta abstraccao do espaco e feita atraves de uma funcao real X denida sobre
na qual o analista faz corresponder a cada resultado individual da e.a., w, o n umero de artigos
defeituosos observados, X(w). Formalmente,
X : R
NN 0
ND 1
DN 1
DD 2
ou, mais precisamente, X : R denida por
X(w) =
_

_
0 se w = NN
1 se w ND, DN
2 se w = DD
.
Num outro exemplo, consideremos a e.a. que consiste em escolher ao acaso um aluno da
UTAD. O espaco de resultados associado a esta experiencia e, `a partida, = w
1
, w
2
, . . . , w
n
,
onde n e o n umero total de alunos e w
i
representa o aluno i, i = 1, 2, ..., n.
Para cada aluno, podemos estar interessados saber o n umero de matrculas, a idade, o n umero
de disciplinas em que ja obteve aprovacao, . . . . Em cada um destes casos e notoria a necessidade
de associar a cada resultado da experiencia os n umeros reais que descrevem o estudo em causa.
22
Neste caso, estaramos interessados em abstrair do espacoatraves de uma funcao do tipo
X : R
k
w X(w) = (X
1
(w), X
2
(w), . . . , X
k
(w)),
onde X
1
(w) =n
o
de matrculas de w, X
2
(w) =idade de w, X
3
(w) =n
o
de disciplinas em
que w ja obteve aprovacao, . . .
Dos exemplos anteriores observa-se que, em muitos casos, e de todo o interesse fazer corres-
ponder a cada resultado da e.a. um n umero real ou um vector de n umeros reais que o descreve.
Informalmente, a estas funcoes com caractersticas especiais que transformam acontecimentos
em n umeros reais (ou, mais genericamente, em vectores de n umeros reais) chamaremos variaveis
aleatorias reais.
Denicao: A funcao X diz-se uma variavel aleat oria real (v.a.r.) se possuir
domnio
conjunto de chegada R
k
, para algum k N.
e o seu valor for determinado pelo resultado de uma experiencia aleatoria.
Tipos de variaveis aleat orias reais: Dependendo do valor da constante k estaremos a lidar
com variaveis aleatorias reais (v.a.r.) com caracteres distintos:
se k = 1, a v.a.r. diz-se unidimensional;
se k = 2, a v.a.r. diz-se bidimensional;
se k > 2, a v.a.r. diz-se multidimensional.
Contudo, no ambito desta disciplina, debrucar-nos-emos apenas no caso unidimensional.
Exemplo: 1. Considere a e.a. que consiste em efectuar 2 lancamentos sucessivos de uma moeda
equilibrada e no registo das faces que cam voltadas para cima. Associado a esta e.a. temos o
espaco de probabilidade (, /, P) onde:
= (C, C), (C, K), (K, C), (K, K);
/ = T(), uma vez que e nito;
P(A) =
#A
#
=
#A
4
, porque ha equiprobabilidade.
23
2. Consideremos agora que so estavamos interessados em contar quantas caras obtivemos nos
2 lancamentos da moeda. Poderamos pensar que estamos agora a realizar uma outra e.a.,

,
consistindo em 2 lancamentos sucessivos de uma moeda equilibrada e no registo do n umero de
caras observadas. Neste caso, tem-se

= 0, 1, 2 e /

= T(

), uma vez que

e nito. No
entanto, como nao ha equiprobabilidade (o 1 ocorre com mais frequencia do que o 0 ou o 2), nao
podemos usar a denicao de classica de probabilidade para denir P.
Como proceder entao?
Usaremos uma v.a.r. X, olhando para e estabelecendo a correspondencia X : R onde,
para todo o w , X(w) =n
o
de caras em w, i.e.,

(K, K)
(C, K)
(K, C)
(C, C)
R
0
1
2
X : R
(K, K) 0
(C, K) 1
(K, C) 1
(C, C) 2
Procedendo deste modo poderemos usufruir da probabilidade denida sobre , na qual ha equi-
probabilidade, para construir a probabilidade denida sobre R. Como vimos o problema consiste
em denir a nova probabilidade Q. Contudo, de forma intuitiva, e facil ver que:
Q(2) = P(w : X(w) = 2) = P((C, C)) = 1/4;
Q(1) = P(w : X(w) = 1) = P((C, K), (K, C)) = 2/4 = 1/2;
Q(0) = P(w : X(w) = 0) = P((K, K)) = 1/4; e ainda que,
Q(x) = P(w : X(w) = x) = P() = 0, x R0, 1, 2.
Mais ainda, por exemplo,
Q([0, 1]) = P(w : X(w) [0, 1]) = P((K, K), (C, K), (K, C)) = 3/4;
Q(N
0
) = P(w : X(w) N
0
) = P((K, K), (C, K), (K, C), (C, C)) = P() = 1;
etc. . .
24
Assim, dado um subconjunto B de R (um elemento de B), para calcular Q(B) fomos procurar
em os elementos que transformados por X estao no conjunto B e, usando P, calculamos a
probabilidade desse subconjunto de (que e elemento de /).
Vimos portanto que, por forma a conseguir denir convenientemente Q `a custa da probabilidade
P, teremos de considerar funcoes X : R, por forma a que possamos calcular
P(w : X(w) B), dado o acontecimento B R.
Assim, se X : R e uma v.a.r., para todo o acontecimento B R, podemos sempre escrever
Q(B) = P(w : X(w) B).
Alem disso, pelo facto de P ser uma probabilidade denida sobre , tem-se que a aplicacao
Q : R [0, 1]
B Q(B) = P(w : X(w) B)
e uma probabilidade denida sobre R, a qual, para evidenciar o facto de que e denida `a custa
de P e de X, sera doravante denotada por P
X
e chamada de lei de probabilidade da v.a.r. X.
Notacao: Por forma a simplicar escreveremos
P(X B) = P
X
(B) = P(w : X(w) B),
P(X = x) = P
X
(x) = P(w : X(w) = x).
Vejamos agora uma outra forma de caracterizar P
X
.
II.2 Funcao de reparticao
II.2.1 Denicao
Denicao: Chamamos funcao de reparticao (ou funcao de distribuicao) da v.a.r. X `a
funcao
F
X
: R [0, 1]
x F
X
(x) = P
X
(] , x]) = P(X x),
i.e., a funcao que a cada ponto x R, faz corresponder a probabilidade P
X
associada ao intervalo
] , x].
25
Esta funcao tem propriedades interessantes e vai revelar-se fundamental para o conhecimento da
lei de probabilidade da v.a.r. X.
II.2.2 Propriedades da funcao de reparticao
1. F
X
(x) [0, 1], para todo o x R (pois e uma probabilidade).
2. F
X
e func ao monotona nao-decrescente:
x
1
< x
2
F
X
(x
1
) F
X
(x
2
).
De facto, x
1
< x
2
], x
1
] ], x
2
] P
X
(], x
1
]) P
X
(], x
2
])F
X
(x
1
) F
X
(x
2
).
3. lim
x
F
X
(x) = 0 e lim
x+
F
X
(x) = 1.
4. F
X
e uma funcao contnua `a direita sobre R, i.e.,
1
F
X
(x
+
) = F
X
(x), x R.
Por outro lado, o conhecimento de F
X
vem permitir o calculo de P
X
(B) = P(X B), para
qualquer acontecimento B de R:
5. P
X
(] , x[) = P(X < x) = F
X
(x

).
6. P
X
(]x, +[) = P(X > x) = 1 P(X x) = 1 F
X
(x).
7. P
X
([x, +[) = P(X x) = 1 P(X < x) = 1 F
X
(x

).
E ainda, para a < b,
8. P
X
(]a, b]) = P(a < X b) = F
X
(b) F
X
(a).
De facto,
P
X
(]a, b]) = P
X
(] , b]] , a])
= P
X
(] , b]) P
X
(] , a])
= P(X b) P(X a) = F
X
(b) F
X
(a).
1
Note-se que F
X
(a
+
) representa o limite `a direita da funcao de reparticao, num ponto real a arbitrario, i.e.,
F
X
(a
+
) = lim
xa
+
F
X
(x), e F
X
(a

) representa o limite `a esquerda da funcao de reparticao, num ponto real a


arbitrario, i.e., F
X
(a

) = lim
xa

F
X
(x).
26
9. P
X
(]a, b[) = P(a < X < b) = F
X
(b

) F
X
(a).
De facto,
P
X
(]a, b[) = P
X
(] , b[] , a])
= P
X
(] , b[) P
X
(] , a])
= P(X < b) P(X a) = F
X
(b

) F
X
(a).
10. P
X
([a, b[) = P(a X < b) = F
X
(b

) F
X
(a

).
De facto,
P
X
([a, b[) = P
X
(] , b[] , a[)
= P
X
(] , b[) P
X
(] , a[)
= P(X < b) P(X < a) = F
X
(b

) F
X
(a

).
11. P
X
([a, b]) = P(a X b) = F
X
(b) F
X
(a

).
De facto,
P
X
([a, b]) = P
X
(] , b]] , a[)
= P
X
(] , b]) P
X
(] , a[)
= P(X b) P(X < a) = F
X
(b) F
X
(a

).
Mais ainda,
12. P
X
(x) = P(X = x) = F
X
(x) F
X
(x

).
De facto,
P
X
(x) = P
X
(] , x]] , x[)
= P
X
(] , x]) P
X
(] , x[)
= P(X x) P(X < x) = F
X
(x) F
X
(x

).
Das propriedades anteriores observa-se que, embora sendo contnua `a direita, a funcao de re-
particao F
X
nao e, em geral, contnua. De facto, tem-se
F
X
(x

) = F
X
(x) P(X = x)
donde decorre imediatamente o seguinte resultado.
27
13. Seja x
0
um ponto arbitrariamente xo em R. Entao
F
X
e contnua em x
0
P(X = x
0
) = 0.
Deste modo, o conjunto dos pontos de descontinuidade de F
X
e
D = a R : P(X = a) > 0.
Prova-se que o conjunto D tem, quando muito, uma innidade numeravel de elementos. Con-
sequentemente, a funcao de reparticao de uma v.a.r. X ou e contnua sobre R ou tem, quando
muito, uma innidade numeravel de pontos de descontinuidade.
Os dois tipos de v.a.r. que vamos estudar (discretas e contnuas) diferem no que diz respeito `a
natureza dos valores que podem assumir e consequentemente no conjunto de pontos de descon-
tinuidade da correspondente funcao de reparticao. A diferenca pode ser ilustrada considerando
as seguintes v.a.r.:
X = n
o
de caras obtidas em 2 lancamentos sucessivos de uma moeda equilibrada.
Com X() = 0, 1, 2;
Y = n
o
de chamadas telefonicas registadas numa central num perodo de grande auencia.
Com Y () = 0, 1, 2, . . . = N
0
;
Z = duracao de uma chamada telefonica
Com Z() = [0, +[.
Nos dois primeiros casos, as grandezas em estudo so podem assumir valores naturais, i.e., X()
e Y () sao conjuntos discretos (nitos ou innitos numeraveis), pelo que X e Y se dizem v.a.r.
discretas. Contudo no caso da v.a.r. Z, esta pode assumir qualquer valor real nao negativo,
ou seja, Z() e um conjunto contnuo (innito nao numeravel), pelo que Z se diz uma v.a.r.
contnua.
Mais ainda, como veremos adiante, a funcao de reparticao de X tem 3 pontos de descontinui-
dade (o 1, o 2 e o 3), a funcao de reparticao de Y tem uma innidade numeravel de pontos de
descontinuidade (todos os naturais), sendo que a funcao de reparticao de Z e contnua em todo
o R.
28
II.3 Variaveis aleat orias reais discretas
II.3.1 Denicao e suporte
Seja o espaco de resultados associado a uma e.a. e seja X : R uma v.a.r.
Denicao: A v.a.r. X diz-se discreta se existir um conjunto discreto S R, tal que
P
X
(S) = P(X S) = 1.
O exemplo seguinte permite-nos notar que o subconjunto S nao e unico e realca o interesse de
retermos o menor subconjunto discreto de probabilidade 1.
Exemplo: Seja X =n
o
de caras obtidas em 2 lancamentos sucessivos de uma moeda equili-
brada. Ja vimos que,
X() = 0, 1, 2, P(X = 0) =
1
4
, P(X = 1) =
1
2
, e P(X = 2) =
1
4
.
Assim, existe S R, S discreto, tal que P(X S) = 1, pelo que X e uma v.a.r discreta. De
facto, podemos tomar S = 0, 1, 2 = X(), ou qualquer conjunto discreto contendo X(), por
exemplo, S = 0, 1, 2, 3, 4, 5; S = N
0
, ou . . . , dado que em qualquer dos casos P(X S) = 1.
Denicao: Chamamos suporte da v.a.r. X (discreta), e representamo-lo por S
X
, ao menor
subconjunto de S que verica P
X
(S
X
) = P(X S
X
) = 1.
Da denicao de S
X
decorre que P
X
(S
X
) = 1 P
X
(S
X
) = 0 e, consequentemente, para todo
C S
X
, P
X
(C) = 0.
Neste tipo de v.a.r., o conhecimento do suporte de X, S
X
, e das probabilidades dos seus elementos
P(X = x), x S
X
e suciente para o conhecimento completo da lei de X, P
X
. De facto, tal permitira calcular
P
X
(B) = P(X B), onde B e um acontecimento de R
29
uma vez que
P
X
(B) = P
X
(B (S
X
S
X
))
= P
X
(B S
X
) +P
X
(B S
X
), pois B S
X
e B S
X
sao ac. incompatveis
= P
X
(B S
X
), pois B S
X
S
X
= P
X
(B S
X
) = 0
=

aBS
X
P
X
(a), uma vez que B S
X
e discreto
=

aBS
X
P(X = a).
Esta informacao fundamental de P(X = x), x S
X
, e apresentada na funcao de probabilidade.
II.3.2 Funcao de probabilidade
Denicao: Chamamos funcao de probabilidade da v.a.r. (discreta) X `a funcao
f
X
: R [0, 1]
x f
X
(x) = P(X = x)
a qual satisfaz as seguintes condicoes:
f
X
(x) 0 (com f
X
(x) > 0 se x S
X
e f
X
(x) = 0 se x / S
X
); e

xS
X
f
X
(x) = 1.
Exerccio: Retomando o exemplo da e.a. que consiste em efectuar 2 lancamentos sucessivos de
uma moeda equilibrada e no registo das faces que cam voltadas para cima, determine:
(a) a funcao de probabilidade da v.a.r. X =n
o
de caras observadas, e represente-a gracamente;
(b) a probabilidade de ocorrerem pelo menos 2 caras;
(c) a probabilidade de ocorrer no maximo 1 cara.
Resolucao: (a) 1. Neste caso, o suporte de X e S
X
= X() = 0, 1, 2.
2. Calculo de f
X
(x) = P(X = x), x 0, 1, 2:
f
X
(0) = P(X = 0) = P((K, K)) = 1/4
f
X
(1) = P(X = 1) = P((C, K), (K, C)) = 2/4 = 1/2
f
X
(2) = P(X = 2) = P((C, C)) = 1/4
30
com

xS
X
f
X
(x) = f
X
(0) +f
X
(1) +f
X
(2) = 1.
Assim, a funcao de probabilidade da v.a.r.
X f
X
: R [0, 1] e dada por
f
X
(x) =
_

_
1/4 se x 0, 2
1/2 se x = 1
0 se x / 0, 1, 2
.
Representacao graca de f
X
:
-
6
0
1/4
1/2
f
X
0 1 2 x

(b) Considere-se o acontecimento B = ocorrerem pelo menos 2 caras= X 2. Tem-se,


P
X
(B) =

aBS
X
f
X
(a) =

a[2,+[{0,1,2}
f
X
(a) = f
X
(2) = 1/4
ou, equivalentemente,
P
X
(B) = P(X 2) = P(X 2 X S
X
) = P(X = 2) = f
X
(2) = 1/4.
(c) Considere-se o acontecimento C = ocorrer no maximo 1 cara= X 1. Tem-se,
P
X
(C) =

aCS
X
f
X
(a) =

a],1]{0,1,2}
f
X
(a) =

a{0,1}
f
X
(a)
= f
X
(0) +f
X
(1) = 1/4 + 1/2 = 3/4
ou, equivalentemente,
P
X
(C) = P(X 1) = P(X 1 X S
X
) = P(X 0, 1)
= P(X = 0) +P(X = 1) = 1/4 + 1/2 = 3/4.
II.3.3 Funcao de reparticao de uma v.a.r discreta
Recorde-se que, dada uma v.a.r. X, a funcao de reparticao de X e dada por
F
X
: R [0, 1]
x F
X
(x) = P(X x).
31
Assim, para calcular a funcao de reparticao de uma v.a.r X discreta, de suporte S
X
, `a custa da
funcao de probabilidade f
X
, basta ter em conta que
F
X
(x) = P(X x) =

a],x]S
X
f
X
(a).
Para calcular a funcao de probabilidade `a custa da funcao de reparticao basta ter em conta que:
o suporte de uma v.a.r. X discreta coincide com o conjunto dos pontos de descontinuidade
da sua funcao de reparticao, i.e., S
X
= D = x R : P(X = x) > 0;
f
X
(x) = F
X
(x) F
X
(x

), x S
X
e f
X
(x) = 0, x / S
X
.
Donde conclumos que
f
X
(x) =
_
_
_
F
X
(x) F
X
(x

) se x S
X
0 se x / S
X
.
Exerccio: Determine a funcao de reparticao da v.a.r. X que representa o n umero de caras
obtidas ao efectuar 2 lancamentos sucessivos de uma moeda equilibrada.
Resolucao: Ja vimos que X e uma v.a.r. discreta de suporte S
X
= 0, 1, 2 e funcao de
probabilidade f
X
: R [0, 1] tal que
f
X
(x) =
_

_
1/4 se x 0, 2
1/2 se x = 1
0 se x / 0, 1, 2
.
Assim, a funcao de reparticao de X, F
X
: R [0, 1], sera
F
X
(x) = P(X x) =

a],x]S
X
f
X
(a)
=
_

a
f
X
(a) se x < 0

a{0}
f
X
(a) se 0 x < 1

a{0,1}
f
X
(a) se 1 x < 2

a{0,1,2}
f
X
(a) se x 2
32
=
_

_
0 se x < 0
f
X
(0) se 0 x < 1
f
X
(0) +f
X
(1) se 1 x < 2
f
X
(0) +f
X
(1) +f
X
(2) se x 2
=
_

_
0 se x < 0
1/4 se 0 x < 1
3/4 se 1 x < 2
1 se x 2
.
Representac ao graca de F
X
:
-
6
0
1/4
1/2
3/4
1
F
X
(x)
0 1 2 x

Repare-se que, F
X
e de facto uma funcao em escada cujos pontos de descontinuidade sao os
pontos de S
X
.
2. Seja X uma v.a.r. discreta com a seguinte funcao de distribuicao:
F
X
(x) =
_

_
0 , x < 0
1/6 , 0 x < 2
a , 2 x < 4
1 , x 4
.
(a) Sabendo que P(X = 2) = 1/2, calcule o valor da constante real a.
(b) Construa a funcao de probabilidade de X.
(c) Calcule P(X < 4/X > 1).
(d) Determine a funcao de probabilidade da v.a.r. Y = [2 X
2
[.
Resolucao: (a) Sabemos que
f
X
(x) = F
X
(x) F
X
(x

), x R.
Assim, para x = 2, tem-se
f
X
(2) = F
X
(2) F
X
(2

) 1/2 = a 1/6 a = 2/3.


33
(b) Como o suporte de X coincide com os pontos de descontinuidade de F
X
, tem-se S
X
= 0, 2, 4.
Por outro lado,
f
X
(0) = F
X
(0) F
X
(0

) = 1/6 0 = 1/6,
f
X
(2) = 1/2,
f
X
(4) = F
X
(4) F
X
(4

) = 1 a = 1/3,
com

xS
X
f
X
(x) = f
X
(0) +f
X
(2) +f
X
(4) = 1.
Assim, a funcao de probabilidade de X, f
X
: R [0, 1], e tal que
f
X
(x) = P(X = x) =
_

_
1/6 , x = 0
1/2 , x = 2
1/3 , x = 4
0 , x / 0, 2, 4
.
(c) P(X < 4/X > 1) =
P(X < 4 X > 1)
P(X > 1)
=
P(1 < X < 4)
P(X > 1)
=
P(X < 4) P(X 1)
1 P(X 1)
=
F
X
(4

) F
X
(1)
1 F
X
(1)
=
2/3 1/6
1 1/6
= 3/5.
(e) Seja Y = [2 X
2
[. Entao,
X = 0 = Y = [2 0
2
[ = 2
X = 2 = Y = [2 2
2
[ = 2
X = 4 = Y = [2 4
2
[ = 14
pelo que o suporte da v.a.r. Y obtida a partir de X e S
Y
= 2, 14.
Assim,
f
Y
(2) = P(X 0, 2) = P(X = 0) +P(X = 2) = 1/6 + 1/2 = 2/3,
f
Y
(14) = P(X = 4) = 1/3,
com

yS
Y
f
Y
(y) = f
Y
(2) +f
Y
(14) = 1,
sendo a func ao de probabilidade de Y , f
Y
: R [0, 1], dada por
f
Y
(Y ) = P(Y = y) =
_

_
2/3 , y = 2
1/3 , y = 14
0 , y / 2, 14
.
34
II.4 Parametros de uma v.a.r.
Nas seccoes anteriores vimos que o comportamento probabilstico de uma v.a.r. X ca comple-
tamente conhecido uma vez conhecida a sua lei de probabilidade (funcao de reparticao ou funcao
de probabilidade (se X e discreta)).
No entanto, e de grande utilidade sumariar-se a informacao contida nestas distribuicoes de pro-
babilidade atraves de n umeros reais parametros capazes de evidenciar algumas das suas
caractersticas relevantes.
Deste modo, um parametro nao passa de um indicador ou medida sumaria capaz de caracterizar
embora parcialmente algum aspecto de uma v.a.r.
Os parametros que vamos introduzir nesta seccao fornecem informacao relevante sobre a locali-
zacao e dispersao dos valores da v.a.r. em estudo. Entre eles destacaremos os:
Parametros de localizacao:
valor esperado;
mediana;
quantil de probabilidade (ou quantil de ordem) p;
Parametros de dispersao:
amplitude interquartil;
variancia;
desvio-padrao.
II.4.1 Valor esperado de uma v.a.r. discreta
Comecamos por introduzir a denicao de valor esperado de uma v.a.r discreta.
Denicao: Dada uma v.a.r. discreta X de suporte S
X
, chamamos valor esperado de X ao
n umero real E(X) tal que
E(X) =

xS
X
x f
X
(x) =

xS
X
x P(X = x),
i.e., `a soma dos valores que a variavel pode assumir, ponderados pelas probabilidades de ocorrencia
de cada um desses valores.
35
Observac oes: 1. O valor esperado de uma v.a.r. X tambem se denomina valor medio, media
ou ainda esperanca matematica de X, sendo por vezes denotado por
X
, , ou simplesmente m.
2. Se S
X
e nito, E(X) existe sempre. No entanto, se S
X
e innito numeravel E(X) s o existe
quando

xS
X
[x[P(X = x) < +.
Exemplos:
1. Seja X a v.a.r. de suporte S
X
= 0, 1, 2 tal que f
X
(0) = f
X
(2) = 1/4 e f
X
(1) = 1/2. Tem-se
E(X) =

x{0,1,2}
x f
X
(x) = 0 f
X
(0) + 1 f
X
(1) + 2 f
X
(2) = 0
1
4
+ 1
1
2
+ 2
1
4
= 1.
Neste exemplo, o valor medio de X e um valor do suporte da v.a.r., contudo, como ilustra o
proximo exemplo, tal nao e forcoso que aconteca.
2. Considere-se agora a v.a.r. X de suporte S
X
= 1, 2, 3, 4 e tal que
f
X
(1) = f
X
(4) =
1
3
e f
X
(2) = f
X
(3) =
1
6
.
Tem-se
E(X) =

x{1,2,3,4}
x f
X
(x)
= 1 f
X
(1) + 2 f
X
(2) + 3 f
X
(3) + 4 f
X
(4)
= 1
1
3
+ 2
1
6
+ 3
1
6
+ 4
1
3
= 2.5
pelo que, como se ve, E(X) nao tem de ser (e nao e em geral) um valor do suporte da v.a.r.
Observacao: O valor medio de uma v.a.r. discreta X pode interpretar-se como sendo o centro
de gravidade ou centro de massas (de probabilidade) de X. Esta analogia fsica tem a sua razao
de ser na medida que, se considerarmos que cada valor x
i
, assumido pela variavel X, representa
a posicao de um ponto material de massa m
i
= P(X = x
i
), o conjunto de tais pontos forma um
sistema material que tem por centro de gravidade (ou de massas) E(X).
O valor esperado (medio) de X corresponde pois a um ponto de equilbrio da distribuic ao de X.
Dizemos por isso que o valor medio e um parametro de localizacao.
Denicao: Dizemos que uma v.a.r. X e centrada se E(X) = 0.
36
Propriedades do valor esperado:
1. Seja a um n umero real arbitrario. Se X e uma v.a.r. tal que P(X = a) = 1 entao E(X) = a.
2. Seja X uma v.a.r. para a qual E(X) existe. Entao
E(aX +b) = aE(X) +b, a, b R,
i.e., o valor esperado e um operador linear.
3. Seja X uma v.a.r. discreta de suporte S
X
e considere-se a funcao (mensuravel) : R R.
Deste modo, Y = (X) e uma v.a.r. discreta e tem-se
E(Y ) = E((X)) =

xS
X
(x)P(X = x).
Note-se que, em geral, E[(X)] ,= [E(X)].
A propriedade seguinte e a generalizacao natural da propriedade 2.
4. Linearidade da esperanca matematica: Sejam X
1
, X
2
, ..., X
n
v.a.r. denidas sobre um mesmo
espaco de probabilidade, tais que E(X
k
) existe para k = 1, 2, ..., n. Sejama
0
, a
1
, a
2
, ..., a
n
n umeros
reais arbitrarios e consideremos Y = a
0
+
n

k=1
a
k
X
k
. Entao E(Y ) existe e tem-se
E
_
a
0
+
n

k=1
a
k
X
k
_
= a
0
+
n

k=1
a
k
E(X
k
).
Em particular,
E
_
n

k=1
X
k
_
=
n

k=1
E(X
k
).
No que segue, apresentamos um resultado semelhante para o produto de v.a.r. quando as v.a.r.
intervenientes sao independentes.
Denicao: As v.a.r. X
1
e X
2
dizem-se independentes se
P(X
1
x
1
X
2
x
2
) = P(X
1
x
1
)P(X
2
x
2
),
para quaisquer reais x
1
e x
2
, ou seja, os acontecimentos X
1
x
1
e X
2
x
2
sao independentes
quaisquer que sejam os reais x
1
e x
2
. Mais geralmente, X
1
, X
2
, . . . , X
n
sao v.a.r. independentes
37
se
P(X
1
x
1
X
n
x
n
) = P(X
1
x
1
) P(X
n
x
n
),
para quaisquer reais x
1
, . . . , x
n
.
Propriedade: Sejam X
1
, X
2
, . . . , X
n
v.a.r. independentes, denidas sobre um mesmo espaco de
probabilidade, e tais que E(X
k
) existe para k = 1, 2, . . . , n. Entao
E (X
1
X
2
X
n
) = E(X
1
)E(X
2
) E(X
n
).
II.4.2 Mediana de uma v.a.r.
Como vimos, o valor medio de uma v.a.r. X pode nao existir. Interessa pois denir um outro
parametro que exista sempre e que nos de uma informacao semelhante a E(X), i.e., que nos
indique como as probabilidades se distribuem em torno de um valor central.
Denicao: Chamamos mediana da v.a.r. X a todo o n umero real me tal que
P(X me) 1/2 e P(X me) 1/2
i.e., tal que, a probabilidade de registarmos valores da v.a.r. X nao superiores (nao inferiores) `a
mediana e de pelo menos 50%. Ou, equivalentemente, a mediana de uma v.a.r. X e o n umero
real me tal que
F
X
(me

) 1/2 e F
X
(me) 1/2.
Observacao: Note-se que a mediana e um parametro que existe sempre. No entanto, a mediana
pode nao ser unica, passando nesse caso a falar-se em classe mediana.
Exemplos:
1. 2.
-
6
0
1/4
1/2
3/4
1
F
X
(x)
x 0 1 2

-
6
0
1/4
1/2
1
F
Y
(y)
0 1 2 y

38
No exemplo 1 vemos que a v.a.r. X tem um unico valor mediano: me
X
= 1. Por outro lado,
para a v.a.r. Y do exemplo 2, todos os n umeros reais me
Y
[1, 2] sao valores medianos de Y .
Neste caso dizemos que [1, 2] e classe mediana de Y e, caso necessitemos de um representante da
classe, tomamos por exemplo o seu ponto medio me
Y
= 3/2.
II.4.3 Quantil de probabilidade p de uma v.a.r.
A mediana e um caso particular de um outro parametro de localizacao nao central mais generico,
o quantil de probabilidade (ou quantil de ordem) p, p ]0, 1[, q
p
, o qual verica
P(X q
p
) p e P(X q
p
) 1 p.
Assim sendo a probabilidade de registarmos valores da v.a.r. X nao superiores [nao inferiores]
ao quantil de probabilidade p e de pelo menos p 100% [(1 p) 100%].
De modo equivalente, q
p
R e quantil de probabilidade p, p ]0, 1[, da v.a.r. X, se
F
X
(q

p
) p e F
X
(q
p
) p.
Observacao: Tal como a mediana, o quantil de probabilidade p e um parametro que existe
sempre, contudo, ele pode nao ser unico.
Exemplos de quantis importantes:
p = 1/4 - 1
o
quartil de X
_
notacao: q1
4
= Q
1
_
p = 1/2 - 2
o
quartil ou mediana de X
_
notacao: q1
2
= Q
2
= me
_
p = 3/4 - 3
o
quartil de X
_
notacao: q3
4
= Q
3
_
p = n/10 - n-esimo decil, n 1, 2, ..., 9
_
notacao: q
n
10
= D
n
_
p = n/100 - n-esimo percentil, n 1, 2, ..., 99
_
notacao: q
n
100
= P
n
_
Recorrendo aos quartis, podemos denir (em caso de unicidade) um coeciente que nos permite
ter uma ideia da dispersao dos valores de X relativamente `a mediana.
39
Denicao: A amplitude interquartil da lei da v.a.r. X e a amplitude do intervalo [q
1/4
, q
3/4
],
i.e.,
A = q
3/4
q
1/4
.
No intervalo [q
1/4
, q
3/4
], estao pelo menos 50% dos valores de X. Assim, se a amplitude A for
muito pequena, poderemos armar que os valores de X estao fortemente concentrados em torno
da mediana.
II.4.3 Variancia de uma v.a.r.
O valor medio indica-nos o centro de gravidade da lei de uma v.a.r. mas nao e suciente para a
caracterizar. De facto, a diferentes v.a.r. (sistemas materiais) pode corresponder o mesmo centro
de gravidade (cf. Exemplo 1). Torna-se entao pertinente denir um parametro que de ideia da
concentracao/dispersao dos valores da v.a.r. em torno do seu centro de gravidade.
Exemplo 1: Seja X a v.a.r. com suporte S
X
= 2, 1, 1, 2 e tal que
f
X
(x) =
1
4
, x S
X
,
e Y a v.a.r. com suporte S
Y
= S
X
e tal que
f
Y
(2) = f
Y
(2) =
1
8
e f
Y
(1) = f
Y
(1) =
3
8
.
Tem-se E(X) = E(Y ) = 0. Mas, no caso de Y , a concentracao de massa em torno da origem e
bem mais forte.
Para denir uma medida da dispersao da v.a.r. X em torno da sua media, consideremos a v.a.r.
(X) = (X E(X))
2
a qual mede o quadrado da distancia da v.a.r. X `a sua media E(X). De referir-se que esta funcao
(mensuravel) de X acentua os pesos associados a desvios elevados da media atenuando os
pesos associados a pequenos desvios da media.
Denicao: Chamamos variancia de uma v.a.r. X ao n umero real V (X) tal que
V (X) = E
_
(X E(X))
2

.
Notacao: A variancia de X e por vezes representada por V ar(X),
2
X
ou simplesmente
2
.
40
Observacao: A variancia corresponde, sicamente, ao momento de inercia de um sistema mate-
rial em relac ao a um eixo perpendicular ao eixo das abcissas e passando pelo centro de gravidade,
o qual mede a distribuicao da massa do sistema em torno do eixo de rotacao. Um momento de
inercia elevado signica que e preciso aplicar uma boa forca de frenagem para que o corpo pare
de girar. Contribui mais para isso a porcao de massa que esta afastada do eixo de giro.
Em particular, usando as propriedades do valor esperado, prova-se a seguinte propriedade de
grande utilidade para calcular a variancia de uma v.a.r.
F ormula de K oenig: Seja X uma v.a.r. tal que E(X
2
) existe. Tem-se
V (X) = E(X
2
) [E(X)]
2
.
De facto, considerando E(X) = m e usando a linearidade da esperanca matematica, tem-se
V (X) = E
_
(X m)
2

= E(X
2
+m
2
2mX)
= E(X
2
) +m
2
2mE(X) = E(X
2
) m
2
.
Assim, se X for uma v.a.r. discreta de suporte S
X
e media m = E(X), entao
V (X) =

xS
X
(x m)
2
f
X
(x)
ou, de modo equivalente,
V (X) = E(X
2
) [E(X)]
2
,
com
E(X) =

xS
X
xf
X
(x) e E(X
2
) =

xS
X
x
2
f
X
(x).
A variancia e expressa no quadrado das unidades de medida da v.a.r. X, pelo que e costume
recorrer a outra medida de dispersao absoluta, expressa nas unidades de medida da v.a.r. X.
Trata-se do desvio-padrao denido a seguir.
Denicao: Chamamos desvio-padrao da v.a.r. X (discreta ou contnua) ao n umero real
positivo
X
tal que

X
=
_
V (X),
o qual mede a dispersao dos valores de X em torno do seu valor medio.
41
Tal como para o valor esperado, apresentamos de seguida algumas propriedades da vari ancia.
Propriedades da variancia:
1. V (X) 0, qualquer que seja a v.a.r. X.
2. Seja a um n umero real arbitrario. Se X e uma v.a.r. tal que P(X = a) = 1, entao V (X) = 0.
3. Se X e uma v.a.r. tal que V (X) existe, entao
V (aX +b) = a
2
V (X), a, b R.
De facto,
V (a X +b) = E
_
(a X +b E(a X +b))
2

= E
_
(a X a E(X))
2

= a
2
E
_
(X E(X))
2

= a
2
V (X).
3. Sejam X
1
, X
2
, ..., X
n
v.a.r. independentes, denidas sobre um mesmo espaco de probabilidade,
tais que V (X
k
) existe para k = 1, 2, ..., n. Sendo a
0
, a
1
, a
2
, ..., a
n
n umeros reais arbitrarios, tem-se:
V
_
a
0
+
n

k=1
a
k
X
k
_
=
n

k=1
a
2
k
V (X
k
).
Em particular, se as v.a.r. envolvidas sao independentes
V
_
n

k=1
X
k
_
=
n

k=1
V (X
k
),
e
V (X
1
X
2
) = V (X
1
) +V (X
2
).
Denicao. A v.a.r. X diz-se reduzida se possui variancia unitaria, i.e., se V (X) = 1.
Propriedade: Seja X uma v.a.r. Entao
(i) a v.a.r. Y = X E(X) e centrada, i.e., e tal que E(Y ) = 0.
(ii) se X e tal que V (X) existe e V (X) > 0, a v.a.r.
Z =
X E(X)
_
V (X)
e centrada e reduzida, i.e., e tal que E(Z) = 0 e V (Z) = 1.
42
De facto, notando que E(X) = m R e
_
V (X) = R
+
, entao:
(i) E(Y ) = E(X m) = E(X) m = 0.
(ii) E(Z) = E
_
X m

_
=
E(X m)

= 0
e
V (Z) = V
_
X m

_
=
V (X m)

2
=
V (X)

2
= 1.
Exerccio: Considere a v.a.r. X com funcao de probabilidade resumida no seguinte quadro:
x 1 0 1
f
X
(x) p
1
p
2
p
3
onde p
1
, p
2
e p
3
sao constantes reais. Sabendo que E (X) = 0.1 e que E (X
2
) = 0.9, determine:
(a) p
1
, p
2
e p
3
;
(b) a funcao de reparticao de X;
(c) os quartis, a variancia e o desvio padrao de X;
(d) o valor esperado e a variancia de 2 3X
2
;
(e) o valor esperado e a variancia de [2X[;
(f) a funcao de reparticao de [2X[.
Resolucao: (a) Tem-se que 1, 0, e 1 sao candidatos a pontos com probabilidades positiva.
Assim, apontamos para S
X
= 1, 0, 1 e tem-se:
E (X) =

x{1,0,1}
xf
X
(x) = 1 f
X
(1) + 0 f
X
(0) + 1 f
X
(1)
= 1 p
1
+ 0 p
2
+ 1 p
3
= p
1
+p
3
e
E
_
X
2
_
=

x{1,0,1}
x
2
f
X
(x) = (1)
2
f
X
(1) + 0
2
f
X
(0) + 1
2
f
X
(1)
= 1 p
1
+ 0 p
2
+ 1 p
3
= p
1
+p
3
pelo que
_

_
E (X) = 0.1
E (X
2
) = 0.9

_
p
1
+p
3
= 0.1
p
1
+p
3
= 0.9

_
2p
3
= 1
p
1
+p
3
= 0.9

_
p
3
= 0.5
p
1
= 0.4
.
43
Finalmente, por denicao de funcao de probabilidade, tem-se

xS
X
f
X
(x) = 1 f
X
(1) +f
X
(0) +f
X
(1) = p
1
+p
2
+p
3
= 1 = p
2
= 0.1.
(b) A funcao de reparticao de X e dada por
F
X
(x) = P(X x) =

a],x]{1,0,1}
P(X = a), x R.
Ora, o conjunto ] , x] 1, 0, 1 depende da posicao de x na recta real. De facto,
] , x] 1, 0, 1 =
_

_
se x < 1
1 se 1 x < 0
1, 0 se 0 x < 1
1, 0, 1 se x 1
pelo que
F
X
(x) =
_

_
P() = 0 se x < 1
P(X = 1) = 0.4 se 1 x < 0
P(X = 1) +P(X = 0) = 0.5 se 0 x < 1
P(X = 1) +P(X = 0) +P(X = 1) = 1 se x 1
.
(c) Representando gracamente F
X
tem-se:
-
6
0.4
0.5
1
F
X
(x)
x
1 0 1

Assim, o 1
o
quartil de X e q
1/4
= 1 uma vez que
F
X
(1

) = 0 1/4 e F
X
(1) = 0.4 1/4.
44
O 2
o
quartil de X (ou mediana de X), i.e., o(s) ponto(s) q
1/2
tal que
F
X
(q

1/2
) 1/2 e F
X
(q
1/2
) 1/2
sao todos os pontos do intervalo [0, 1] uma vez que se tem
se q
1/2
= 0, entao F
X
(0

) = 0.4 1/2 e F
X
(0) = 0.5;
se q
1/2
]0, 1[, entao F
X
(x

) = F
X
(x) = 0.5;
se q
1/2
= 1, entao F
X
(1

) = 0.5 e F
X
(1) = 1 1/2.
Finalmente, o 3
o
quartil de X e q
3/4
= 1 uma vez que
F
X
(1

) = 0.5 3/4 e F
X
(1) = 1 3/4.
Por outro lado, a variancia de X e dada por
V (X) = E(X
2
) [E(X)]
2
= 0.9 (0.1)
2
= 0.89
pelo que, o desvio padrao de X e

X
=
_
V (X) =

0.89 = 0.9434.
(d) Pelas propriedades do valor esperado tem-se
E(2 3X
2
) = 2 3E(X
2
) = 2 3 0.9 = 0.7.
Por outro lado, pelas propriedades da variancia,
V (2 3X
2
) = 3
2
V (X
2
) = 9
_
E(X
4
) [E(X
2
)]
2
_
= 9
_
E(X
4
) 0.9
2
_
= 0.81
uma vez que
E(X
4
) =

x{1,0,1}
x
4
f
X
(x)
= (1)
4
f
X
(1) + 0
4
f
X
(0) + 1
4
f
X
(1)
= 1 0.4 + 0 0.1 + 1 0.5 = 0.9.
(e) Seja Y = [2X[ tem-se,
E(Y ) =

x{1,0,1}
[2x[f
X
(x)
= [2 (1)[ f
X
(1) +[2 0[ f
X
(0) +[2 1[ f
X
(1)
= 2 0.4 + 0 0.1 + 2 0.5 = 1.8.
45
Por outro lado,
V (Y ) = E(Y
2
) [E(Y )]
2
= 3.6 1.8
2
= 0.36,
uma vez que
E(Y
2
) =

x{1,0,1}
[2x[
2
f
X
(x)
= [2 (1)[
2
f
X
(1) +[2 0[
2
f
X
(0) +[2 1[
2
f
X
(1)
= 4 0.4 + 0 0.1 + 4 0.5 = 3.6 .
(f) Para calcular a funcao de reparticao de Y = [2X[ comecemos por calcular a sua funcao de
probabilidade. Para tal, vamos por determinar o suporte de Y . Como S
X
= 1, 0, 1 tem-se,
X = 1 = Y = [2 (1)[ = 2;
X = 0 = Y = [2 0[ = 0;
X = 1 = Y = [2 1[ = 2;
pelo que S
Y
= 0, 2. Tem-se entao
P(Y = 0) = P(X = 0) = 0.1;
P(Y = 2) = P(X = 1 X = 1) = P(X = 1) +P(X = 1) = 0.4 + 0.5 = 0.9
com P(Y = 0) +P(Y = 2) = 1, pelo que, a funcao de probabilidade de Y , f
Y
: R [0, 1], e
f
Y
(y) =
_

_
0.1 se y = 0
0.9 se y = 2
0 se y / 0, 2
.
Estamos agora em condicoes de calcular a funcao de reparticao de Y . Temos,
F
Y
(y) = P(Y y) =

a],y]{0,2}
P(Y = a), y R.
Ora,
] , y] 0, 2 =
_

_
se y < 0
0 se 0 y < 2
0, 2 se y 2
pelo que
F
Y
(y) =
_

_
P() = 0 se y < 0
P(Y = 0) = 0.1 se 0 y < 2
P(Y = 0) +P(Y = 2) = 1 se y 2
.
46
II.5 Distribuic oes Discretas
II.5.1 Distribuicao Uniforme Discreta

E a mais simples de todas as distribuicoes discretas e e adequada para modular o comportamento


probabilstico de uma v.a.r. cujos valores possveis tem todos o mesmo peso.
Assim, X e uma v.a.r. discreta de suporte S
X
= x
1
, x
2
, ..., x
n
e cuja lei de probabilidade e
caracterizada pela funcao de probabilidade
f
X
: R [0, 1]
x f
X
(x) =
_
_
_
1
n
se x x
1
, x
2
, ..., x
n

0 se x / x
1
, x
2
, ..., x
n

.
Nestas condicoes, dizemos que X temdistribuicao uniforme discreta no conjunto x
1
, x
2
, ..., x
n

e escrevemos
X Ux
1
, x
2
, ..., x
n
.
O caso mais importante e quando a variavel tem suporte 1, 2, ..., n, isto e, X U1, 2, ..., n.
Neste caso, temos
E(X) =
n + 1
2
e V (X) =
n
2
1
12
.
Exemplo: Seja X a v.a.r. que representa o n umero de pontos obtidos no lancamento de um
dado equilibrado, entao X U1, 2, 3, 4, 5, 6. Logo
f
X
(x) =
_
_
_
1
6
se x 1, 2, 3, 4, 5, 6
0 se x / 1, 2, 3, 4, 5, 6
.
Alem disso
E(X) =
6 + 1
2
= 3.5 e V (X) =
6
2
1
12
=
35
12
.
II.5.2 Distribuicao de Bernoulli
Seja o espaco de resultados associado a uma e.a. e seja A um determinado acontecimento
com P(A) = p ]0, 1[.
47
A distribuicao de Bernoulli aparece associada `a designada prova de Bernoullina qual regista-
mos a realizacao ou a nao realizacao de A. A realizacao de A, i.e., um sucesso, ocorre com
probabilidade p = P(A) enquanto que a nao realizacao de A, i.e., um insucesso, ocorre com
probabilidade 1 p, p ]0, 1[.
Denimos entao a v.a.r. X : R tal que
X() =
_

_
1 se A
0 se / A
,
com
P(X = 1) = P(A) = p, P(X = 0) = P(A) = 1 p
e
P(X 0, 1) = P(X = 0) +P(X = 1) = 1.
A v.a.r. X assim denida e uma v.a.r. discreta, de suporte S
X
= 0, 1, cuja lei de probabilidade
e caracterizada pela funcao de probabilidade
f
X
: R [0, 1]
x f
X
(x) =
_
_
_
p
x
(1 p)
1x
se x 0, 1
0 se x / 0, 1
.
Nestas condicoes, dizemos que X tem distribuicao de Bernoulli de parametro p e escrevemos
X B(p),
tendo-se
E(X) = p e V (X) = p(1 p).
De facto,
E(X) =

xS
X
xf
X
(x) = 0f
X
(0) + 1f
X
(1) = f
X
(1) = p
e
E(X
2
) =

xS
X
x
2
f
X
(x) = 0
2
f
X
(0) + 1
2
f
X
(1) = f
X
(1) = p,
pelo que
V (X) = E(X
2
) [E(X)]
2
= p p
2
= p(1 p).
48
II.5.3 Distribuicao Binomial
A distribuicao binomial e particularmente util na caracterizacao probabilstica do n umero de
ocorrencias de determinado acontecimento em n provas de Bernoulli realizadas de forma inde-
pendente e com probabilidade de sucesso comum p, p ]0, 1[.
Seja uma e.a. de espaco de resultados associado e seja A um determinado acontecimento
com probabilidade p.
Consideremos uma nova e.a. com espaco de resultados associado

=realizacao de n vezes sempre nas mesmas condicoes.


Dena-se a v.a.r.
X =n umero de vezes que A ocorre na realizacao de

=n umero de vezes que A ocorre nas n realizacoes de .


Note-se que, X e uma v.a.r. discreta de suporte S
X
= 0, 1, 2, ..., n.
Pretendemos determinar a lei de probabilidade de X. Para tal vamos ter de calcular P(X = k),
para k S
X
= 0, 1, 2, ..., n.
Denindo os acontecimentos
A
i
= o acontecimento A ocorre na iesima repeticao de , i = 1, ..., n,
tem-se que A
1
, A
2
, . . . , A
n
sao acontecimentos mutuamente independentes e
P(X = 0) = P(A
1
A
2
. . . A
n
) = P(A
1
)P(A
2
) P(A
n
) = (1 p)
n
e
P(X = 1) = P((A
1
A
2
. . . A
n
) (A
1
A
2
A
3
. . . A
n
)
(A
1
A
2
. . . A
n1
A
n
))
= P(A
1
)P(A
2
) P(A
n
) +P(A
1
)P(A
2
)P(A
3
) P(A
n
) + +
+P(A
1
)P(A
2
) P(A
n1
)P(A
n
)
= np
1
(1 p)
n1
.
Por outro lado, de um modo geral, para o acontecimento
B
1
= A
1
A
2
. . . A
k
A
k+1
. . . A
n
,
49
favoravel `a ocorrencia de X = k, i.e., tal que B
1
X = k, tem-se
P(B
1
) = P(A
1
A
2
. . . A
k
A
k+1
. . . A
n
) = p
k
(1 p)
nk
.
Analogamente para o acontecimento
B
2
= A
1
A
2
. . . A
k
A
k+1
A
k+2
. . . A
n
tambem favoravel `a ocorrencia de X = k, tem-se ainda
P(B
2
) = P(A
1
A
2
. . . A
k
A
k+1
A
k+2
. . . A
n
) = p
k
(1 p)
nk
.
Como o n umero de situacoes favoraveis `a realizacao de X = k e
n!
k!(n k)!
= C
n
k
tendo cada uma delas probabilidade de ocorrer igual a p
k
(1 p)
nk
, tem-se entao
P(X = k) = C
n
k
p
k
(1 p)
nk
, k 0, 1, 2, . . . , n.
Note-se que
P(X = k) > 0, k S
X
, e

kS
X
P(X = k) =
n

k=0
C
n
k
p
k
(1 p)
nk
= (p + 1 p)
n
= 1.
Assim, X e uma v.a.r. discreta de suporte S
X
= 0, 1, 2, ..., n e cuja lei de probabilidade e
caracterizada pela funcao de probabilidade
f
X
: R [0, 1]
x f
X
(x) =
_
_
_
C
n
x
p
x
(1 p)
nx
se x 0, 1, . . . , n
0 se x / 0, 1, . . . , n
.
Nestas condicoes, dizemos que X tem distribuicao Binomial de parametros n e p e escrevemos
X B(n, p),
tendo-se
E(X) = np e V (X) = np(1 p).
50
Na Figura 1 estao representados os gracos de algumas distribuicoes binomiais de parametros
n = 10 e varios valores de p.
0 2 4 6 8 10
0
.
0
0
.
1
0
.
2
0
.
3
0
.
4
0
.
5
0
.
6
p=0.05
P
r
o
b
0 2 4 6 8 10
0
.
0
0
0
.
1
0
0
.
2
0
0
.
3
0
p=0.2
P
r
o
b
0 2 4 6 8 10
0
.
0
0
0
.
0
5
0
.
1
0
0
.
1
5
0
.
2
0
0
.
2
5
p=0.4
P
r
o
b
0 2 4 6 8 10
0
.
0
0
0
.
0
5
0
.
1
0
0
.
1
5
0
.
2
0
0
.
2
5
p=0.5
P
r
o
b
0 2 4 6 8 10
0
.
0
0
0
.
0
5
0
.
1
0
0
.
1
5
0
.
2
0
0
.
2
5
p=0.7
P
r
o
b
0 2 4 6 8 10
0
.
0
0
.
1
0
.
2
0
.
3
0
.
4
0
.
5
0
.
6
p=0.95
P
r
o
b
Figura 1: Gracos da funcao de probabilidade de uma v.a.r. com distribuicao Binomial de
parametros n = 10 e p, para alguns valores de p.
Proposic oes:
1. A distribuicao B(1, p) coincide com a distribuicao B(p), i.e., X B(1, p) X B(p).
2. A soma de uma v.a.r. binomial e de uma v.a.r. de Bernoulli independentes com o mesmo
parametro p e uma v.a.r. binomial:
X B(n, p), Y B(p) e X e Y sao v.a.r. independentes = X +Y B(n + 1, p).
3. Uma v.a.r. binomial pode ser decomposta na soma de v.a.r. de Bernoulli independentes:
X B(n, p) = X = Y
1
+ +Y
n
, com parcelas Y
i
B(p) independentes.
4. A soma de v.a.r. binomiais independentes com o mesmo parametro p e uma v.a.r. binomial:
X B(n, p) e Y B(m, p)
X e Y sao v.a.r. independentes
_
_
_
= X +Y B(n +m, p).
5. Se o n
o
de vezes que ocorre A em n provas de Bernoulli e uma v.a.r., X, com distribuicao
binomial de parametros n e p entao, o n
o
de vezes que nao ocorre A em n provas de Bernoulli e
uma v.a.r., Y = n X, com distribuicao binomial de parametros n e 1 p
X B(n, p) = Y = n X B(n, 1 p).
51
O calculo manual das probabilidades usando a distribuicao binomial torna-se bastante trabalhoso,
mesmo para valores relativamente pequenos de n. Todavia, recorrendo a meios computacionais
adequados ou ao uso de tabelas desta lei, ja nao temos esta diculdade. As tabelas que usaremos
na disciplina para esta lei apresentam os valores da correspondente funcao de reparticao, F
X
,
para os parametros n de 1 a 20 e p de 0.05, 0.1, . . . , 0.9, 0.95, 0.99.
Por exemplo, se X B(3, 0.7) entao F
X
(2) = P(X 2) = 0.6570.
p
n x 0.6 0.7 0.8
.
.
.
.
.
.
3 0
1
2 0.6570
3
.
.
.
.
.
.
Exerccio 1. Um saco contem 12 bolas, das quais 3 sao verdes, 4 sao azuis e 5 sao vermelhas.
Seja X a v.a.r. que representa o n umero de bolas verdes extradas ao efectuar 4 tiragens sucessivas
de uma bola, sempre com reposicao da bola extrada em cada tiragem.
(a) Qual a funcao de probabilidade de X?
(b) Determine a probabilidade de pelo menos uma das bolas ser verde.
(c) Calcule a media e o desvio padrao de X.
Resolucao: (a) Considerando o acontecimento
A = sada de bola verde ao extrair uma bola do saco
notamos que a v.a.r. X pode reescrever-se na forma
X = n umero de vezes que ocorre A em 4 tiragens de uma bola do saco
(realizadas sempre nas mesmas condicoes)
Deste modo,
X B(4, p), com P(A) =
3
12
= 0.25 = p,
52
pelo que, a funcao de probabilidade de X e f
X
: R [0, 1] onde
f
X
(x) =
_
_
_
C
4
x
0.25
x
0.75
4x
se x 0, 1, 2, 3, 4
0 se x / 0, 1, 2, 3, 4
.
(b)
P(X 1) = f
X
(1) +f
X
(2) +f
X
(3) +f
X
(4)
= 4 0.25 0.75
3
+ 6 0.25
2
0.75
2
+ 4 0.25
3
0.75 + 0.25
4
= 0.6836
ou simplesmente,
P(X 1) = 1 P(X < 1) = 1 f
X
(0) = 1 0.75
4
= 0.6836.
(c) Se X B(4, 0.25) entao
E(X) = 4 0.25 = 1 e V (X) = 4 0.25 (1 0.25) = 0.75,
logo
X
=

0.75 = 0.866.
Exerccio 2. O Lus joga o seguinte jogo: escolhe, ao acaso, um n umero de 1 a 6 e em seguida
lanca 3 vezes um dado equilibrado com as faces numeradas de 1 a 6. Se o n umero escolhido pelo
Lus sai x vezes (num total de 3 lancamentos) ele ganha x euros. Em contrapartida, se o n umero
escolhido pelo Lus nunca ocorre entao ele perde 5 euros. Determine o ganho medio do Lus ao
jogar este jogo.
Resolucao: Seja X a v.a.r. que representa o n umero de vezes que o Lus obtem o n umero
escolhido em 3 lancamentos do dado. Pretende-se calcular o valor esperado da v.a.r. L que
representa o lucro (em euros) obtido pelo Lus ao realizar o jogo.
Considere-se o acontecimento
A =sada do n umero escolhido pelo Lus num lancamento do dado.
Sendo o dado equilibrado tem-se P(A) =
1
6
. Assim, a v.a.r.
X = n umero de vezes que o Lus obtem o n umero escolhido em 3 lancamentos do dado
(realizados sempre nas mesmas condicoes)
e tal que
X B
_
3,
1
6
_
.
53
Por outro lado, a v.a.r. L e tal que
L =
_

_
5 se X = 0
1 se X = 1
2 se X = 2
3 se X = 3
.
Assim, L e uma v.a.r. discreta de suporte S
L
= 5, 1, 2, 3 e
f
L
(5) = P(L = 5) = P(X = 0) =
_
1
1
6
_
3
= 0.5787
f
L
(1) = P(L = 1) = P(X = 1) = 3
_
1
6
__
1
1
6
_
2
= 0.3472
f
L
(2) = P(L = 2) = P(X = 2) = 3
_
1
6
_
2
_
1
1
6
_
= 0.0695
f
L
(3) = P(L = 3) = P(X = 3) =
_
1
6
_
3
= 0.0046.
Tem-se entao
E(L) =

aS
L
af
L
(a) = 5f
L
(5) + 1f
L
(1) + 2f
L
(2) + 3f
L
(3) = 2.3935
sendo que, em media, o Lus tem um prejuzo de 2.3937 euros neste jogo.
II.5.4 Distribuicao Hipergeometrica
A distribuicao Hipergeometrica usa-se na caracterizacao probabilstica do n umero de ocorrencias
de determinado acontecimento em n provas de Bernoulli realizadas de modo nao independente.
Antes de introduzir esta nova distribuicao retomemos o seguinte exemplo:
Um saco contem N bolas das quais M sao verdes. Sejam
=extraccao de uma bola do saco;
A =a bola extrada e verde.
Interessa-nos o n umero de vezes que A ocorre em n realizacoes de , em duas situacoes:
quando ha reposicao da bola apos cada extraccao;
quando nao ha reposicao da bola apos cada extraccao.
54
Consideremos, entao a e.a. de espaco de resultados associado

=realizacao de n vezes, com reposicao da bola apos cada extraccao.


Ja vimos que, neste caso, as n experiencias sao realizadas sempre nas mesmas condi coes e a
probabilidade de A ocorrer mantem-se constante em cada extraccao. Podemos entao armar que
a v.a.r.
X =n umero de vezes que A ocorre em n realizacoes de

(nas mesmas condicoes),


tem distribuicao B(n, p) , com p = P(A) =
M
N
.
Consideremos, agora de espaco de resultados associado

=realizacao de n vezes, sem reposicao da bola apos cada extraccao.

E claro que as n experiencias nao sao realizadas nas mesmas condicoes. A probabilidade de A
ocorrer varia de extraccao para extraccao. Neste caso, a v.a.r.
X = n umero de vezes que A ocorre em n realizacoes de (nao nas mesmas condic oes).
Recordemos que, o saco contem N bolas das quais M sao verdes e N M nao sao verdes. Alem
disso, o acontecimento X = k realiza-se se e so se, ao extrair uma a uma sem reposicao, n
bolas de um saco com N bolas, obtivermos uma sequencia de n bolas das quais k sao verdes e
n k nao sao verdes. Assim, tem-se necessariamente que k n e k M, o que implica que
k minn, M.
Por outro lado, n k n e n k N M, i.e., k 0 e k n (N M), o que implica que
k max0, n (N M).
Portanto X(

) = max0, n (N M), ..., minn, M = S


X
.
Por outro lado, e facil ver que o n umero de ocorrencias possveis, #

, e C
N
n
e que o n umero de
ocorrencias favoraveis a X = k e
C
M
k
C
NM
nk
.
Pelo que, usando a denicao classica de probabilidade se prova que
P(X = k) =
C
M
k
C
NM
nk
C
N
n
, para k S
X
.
55
Assim, X e uma v.a.r. discreta de suporte
S
X
= max0, n (N M), ..., minn, M
cuja lei de probabilidade e caracterizada pela seguinte funcao de probabilidade f
X
: R [0, 1]
com
f
X
(x) =
_

_
C
M
k
C
NM
nk
C
N
n
se x S
X
0 se x / S
X
.
Note-se que,
P(X = x) > 0, x S
X
, e

xS
X
P(X = x) = 1.
Nestas condicoes, dizemos que X tem distribuicao Hipergeometrica de parametros N, M e
n, e escrevemos
X H(N, M, n),
tendo-se
E(X) = np e V (X) = np (1 p)
N n
N 1
, com p =
M
N
.
Na Figura 2 estao representados os gracos de algumas distribuicoes hipergeometricas de parametros
N = 100, M = 40 e varios valores de n.
0 5 10 15
0
.
0
0
0
.
1
0
0
.
2
0
0
.
3
0
n=15
P
r
o
b
0 2 4 6 8 12
0
.
0
0
0
.
0
5
0
.
1
0
0
.
1
5
0
.
2
0
0
.
2
5
n=13
P
r
o
b
0 2 4 6 8 10
0
.
0
0
0
.
1
0
0
.
2
0
n=10
P
r
o
b
0 1 2 3 4 5 6 7
0
.
0
0
0
.
1
0
0
.
2
0
0
.
3
0
n=7
P
r
o
b
0 1 2 3 4 5
0
.
0
0
0
.
1
0
0
.
2
0
0
.
3
0
n=5
P
r
o
b
0 1 2 3 4
0
.
0
0
0
.
0
2
0
.
0
4
0
.
0
6
0
.
0
8
0
.
1
0
n=4
P
r
o
b
Figura 2: Gr acos da funcao de probabilidade de uma v.a.r. com distribuicao Hipergeometrica
de parametros N = 100, M = 40 e n, para alguns valores de n.
56
Exerccio 3. Resolva o exerccio 1 considerando 4 tiragens sucessivas de uma bola sem reposicao.
Resolucao: (a) Considerando
A = sada de bola verde ao extrair uma bola do saco
a v.a.r. X pode reescrever-se na forma
X =n umero de vezes que ocorre A em 4 tiragens de uma bola (realizadas sem reposicao).
Deste modo,
X H(12, 3, 4)
pelo que, a funcao de probabilidade de X e f
X
: R [0, 1] onde
f
X
(k) =
_

_
C
3
k
C
9
4k
C
12
4
se k 0, 1, 2, 3
0 se k / 0, 1, 2, 3
.
Note-se que S
X
= max0, 4 (12 3), ..., min4, 3 = 0, ..., 3.
(b)
P(X 1) = 1 P(X < 1) = 1 f
X
(0) = 1
C
3
0
C
9
40
C
12
4
= 0.7455 .
(c) Se X H(12, 3, 4), entao
E(X) = 4
3
12
= 1 e V (X) = 4
3
12

_
1
3
12
_

12 4
12 1
= 0.5455,
logo
X
=

0.5455 = 0.7386 .
Ja vimos que a distribuicao binomial de parametros n e p e a distribuicao Hipergeometrica
de parametros N, M e n estao associadas `a contagem do n umero de sucessos em n provas de
Bernoulli. A distribuicao binomial caso estejamos perante provas de Bernoulli independentes,
cada uma delas com probabilidade p de sucesso, e a distribuicao Hipergeometrica caso contrario.
No entanto, se estivermos interessados em contabilizar o n umero de provas de Bernoulli que e
necessario realizar ate ao registo do primeiro sucesso, passamos a lidar com uma v.a.r. discreta
com distribuicao distinta das anteriores e que apresentamos de seguida.
II.5.5 Distribuicao Geometrica
A distribuicao geometrica e usada para modelar o n umero de provas de Bernoulli (independentes
e com igual probabilidade de sucesso) realizadas ate que ocorra o primeiro sucesso.
57
Seja uma e.a. de espaco de resultados associado e seja A um determinado acontecimento
com probabilidade p, p ]0, 1[. Dena-se a v.a.r.
X =n umero de vezes que se realiza ate que A ocorra pela primeira vez.
Note-se que, X e uma v.a.r. discreta de suporte S
X
= 1, 2, . . . = N.
Alem disso, denindo os acontecimentos
A
i
= o acontecimento A ocorre na iesima repeticao de , i = 1, 2, . . .
tem-se
P(X = 1) = P(A
1
) = p,
P(X = 2) = P(A
1
A
2
) = P(A
1
)P(A
2
) = (1 p)p,
P(X = 3) = P(A
1
A
2
A
3
) = P(A
1
)P(A
2
)P(A
3
) = (1 p)
2
p,
e, de um modo geral, para todo o n umero natural k
P(X = k) = P(A
1
A
2
. . . A
k1
A
k
)
= P(A
1
)P(A
2
) P(A
k1
)P(A
k
) = (1 p)
k1
p.
Note-se que
P(X = k) > 0, k N, e

kS
X
P(X = k) = 1.
Assim, X e uma v.a.r. discreta de suporte S
X
= 1, 2, . . . = N e cuja lei de probabilidade e
caracterizada pela funcao de probabilidade
f
X
: R [0, 1]
x f
X
(x) =
_
_
_
(1 p)
x1
p se x N
0 se x / N
.
Nestas condicoes, dizemos que X tem distribuicao Geometrica de parametro p, e escrevemos
X G(p),
tendo-se
E(X) =
1
p
e V (X) =
1 p
p
2
.
A distribuicao geometrica recebe esta denominacao porque os seus valores sucessivos constituem
uma progressao geometrica. A distribuicao geometrica e tambem conhecida por distribuicao
58
discreta do tempo de espera pelo primeiro sucesso e e a unica v.a.r. discreta que goza da
propriedade de falta de memoria.
Propriedade: (Falta de mem oria da distribuicao geometrica)
Se X G(p), p ]0, 1[, entao, para todo os inteiros positivos m e n, com m > n,
P(X > m+n/X > m) = P(X > n).
Deste modo, se tiverem decorrido m provas sem que se tenha vericado um sucesso, a proba-
bilidade de se ter de esperar adicionalmente mais de n provas para se observar um sucessoe a
mesma que esperar mais de n provas caso se estivesse no incio da experiencia.
Observacao: Se X e v.a.r. discreta o recproco deste teorema tambem e verdadeiro.
Exerccio 4. Considerando o saco de bolas do exerccio 1, suponha que se efectuam tiragens
sucessivas de uma bola, com reposicao, ate extrair uma bola verde. Determine:
(a) a probabilidade de extrair uma bola verde na terceira tiragem;
(b) a probabilidade de ter de efectuar pelo menos duas tiragens ate extrair uma bola verde;
(c) o n umero esperado de tiragens a efectuar ate extrair uma bola verde.
Resolucao: Denam-se o acontecimento
A = sada de bola verde ao extrair uma bola do saco
e a v.a.r.
X =n umero de tiragens a efectuar ate que ocorra A pela primeira vez.
Tem-se que
X G(p), com p = P(A) =
1
4
= 0.25
pelo que, a funcao de probabilidade de X e f
X
: R [0, 1] onde
f
X
(x) = P(X = x) =
_
_
_
(1 0.25)
x1
0.25 se x N
0 se x / N
.
Assim,
(a) P(X = 3) = (1 0.25)
2
0.25 = 0.140625;
(b) P(X 2) = 1 P(X < 2) = 1 f
X
(1) = 1 0.25 = 0.75;
(c) E(X) =
1
p
= 4.
59
II.5.6 Distribuicao de Poisson
A distribuicao de Poisson e frequentemente usada para caracterizar probabilisticamente o n umero
de ocorrencias de determinado fenomeno em perodos xos de tempo (ou de espaco). As aplicacoes
sao m ultiplas, por exemplo, na contagem do:
n umero de chamadas telefonicas recebidas por uma empresa numa hora;
n umero de acidentes que ocorrem na A4 numa semana;
n umero de peixes doentes existentes num metro quadrado de um lago poludo.
Formalmente, dado um n umero real positivo , dizemos que X tem distribuicao de Poisson
de parametro , e escrevemos
X P()
se X e uma v.a.r. discreta de suporte S
X
= N
0
e funcao de probabilidade f
X
: R [0, 1] onde
f
X
(x) = P(X = x) =
_

_
e

x
x!
se x N
0
0 se x / N
0
.
Note-se que
P(X = x) > 0, x N
0
, e

xN
0
f
X
(x) = 1
e tem-se
E(X) = V (X) = .
O calculo das probabilidades usando a distribuicao de Poisson deve ser feito utilizando meios
computacionais adequados. Na ausencia desta facilidade, recorre-se a tabelas. As tabelas que
utilizaremos para esta lei apresentam os valores da correspondente funcao de repartic ao, F
X
,
para o parametro = 0.1, 0.2, . . . , 10, 11, . . . , 20.
Por exemplo, se X P(4.4) entao F
X
(2) = P(X 2) = 0.1851.

x 4.3 4.4 4.5


.
.
.
2 0.1851
.
.
.
60
Na Figura 3 estao representados os gracos de algumas distribuicoes de Poisson para varios
valores do parametro .
0 2 4 6 8 10
0
.
0
0
.
1
0
.
2
0
.
3
0
.
4
0
.
5
0
.
6
p=0.05
P
r
o
b
0 2 4 6 8 10
0
.
0
0
0
.
1
0
0
.
2
0
0
.
3
0
p=0.2
P
r
o
b
0 2 4 6 8 10
0
.
0
0
0
.
0
5
0
.
1
0
0
.
1
5
0
.
2
0
0
.
2
5
p=0.4
P
r
o
b
0 2 4 6 8 10
0
.
0
0
0
.
0
5
0
.
1
0
0
.
1
5
0
.
2
0
0
.
2
5
p=0.5
P
r
o
b
0 2 4 6 8 10
0
.
0
0
0
.
0
5
0
.
1
0
0
.
1
5
0
.
2
0
0
.
2
5
p=0.7
P
r
o
b
0 2 4 6 8 10
0
.
0
0
.
1
0
.
2
0
.
3
0
.
4
0
.
5
0
.
6
p=0.95
P
r
o
b
Figura 3: Gracos da funcao de probabilidade de uma v.a.r. com distribuicao de Poisson de
parametro , para alguns valores de .
Proposicao: (Aditividade da lei de Poisson)
Sejam X
1
, X
2
, . . . , X
n
v.a.r. independentes e tais que, X
i
P(
i
),
i
R
+
, para todo o
i = 1, 2, . . . , n. Entao
X
1
+X
2
+. . . +X
n
P (
1
+
2
+. . . +
n
) .
Exerccio 5. O n umero de indivduos atendidos durante uma manha num determinado servico
hospitalar e representado por uma v.a.r. X com distribuicao de Poisson de valor medio 6.
(a) Calcule a probabilidade de, numa manha, serem atendidos pelo menos 2 indivduos.
(b) Se ate `as 9 horas foram atendidos 2 indivduos, qual a probabilidade de, nessa manha, virem
a ser atendidos mais de 5 indivduos?
(c) Suponha que os n umeros de indivduos atendidos em diferentes manhas sao independentes.
Determine a probabilidade de,
(i) em 3 manhas consecutivas, serem atendidos no maximo 20 indivduos;
(ii) em 3 manhas consecutivas, existir alguma em que foram atendidos exactamente 4 indivduos;
61
(iii) decorrerem no maximo 3 manhas ate ocorrer a primeira manha na qual nao e atendido
nenhum indivduo.
Resolucao:
(a) Seja X a v.a.r. que representa o n
o
de indivduos atendidos durante uma manha no referido
servico hospitalar. Tem-se
X P(), com > 0.
Como = E(X) entao
X P(6).
Assim
P(X 2) = 1 P(X < 2) = 1 P(X 1) = 1 F
X
(1) = 1 0.0174 = 0.9826
ou
P(X 2) = 1 P(X < 2) = 1 [f
X
(0) +f
X
(1)] = 1
_
e
6
6
0
0!
+e
6
6
1
1!
_
= 0.9826
por consulta da tabela da funcao distribuicao da lei Poisson de parametro 6.
(b) Note-se que queremos calcular a probabilidade de X > 5 quando, `a partida, sabemos que,
ate `as 9 horas foram atendidos 2 indivduos nesse servico hospitalar. Tal equivale a dizer que, `a
partida, sabemos que durante a manha foram atendidos pelo menos 2 indivduos nesse servico
hospitalar. Assim, pretendemos calcular P(X > 5/X 2). Ora,
P(X > 5/X 2) =
P(X > 5 X 2)
P(X 2)
=
P(X > 5)
P(X 2)
=
0.5543
0.9826
= 0.5641
uma vez que
P(X > 5) = 1 P(X 5) = 1 F
X
(5) = 1 0.4457 = 0.5543
por consulta da tabela da funcao distribuicao da lei Poisson de parametro 6.
(c) Para i = 1, 2, 3, seja X
i
a v.a.r. que representa o n umero de indivduos atendidos na manha
i. Tem-se
X
i
P(6), i = 1, 2, 3 e X
1
, X
2
e X
3
sao v.a.r. independentes.
(i) Por outro lado, pela aditividade da lei de Poisson, a v.a.r. Y = X
1
+X
2
+X
3
, que representa
o n umero total de indivduos atendidos em 3 manhas, e tal que
Y = X
1
+X
2
+X
3
P(6 + 6 + 6) = P(18).
62
Donde,
P(Y 20) = F
Y
(20) = 0.7307
por consulta da tabela da funcao distribuicao da lei Poisson de parametro 18.
(ii) Considere-se a v.a.r. Z que representa o n umero de manhas (de entre as 3 manhas) nas
quais foram atendidos exactamente 4 indivduos. Tem-se
Z =n
o
de vezes que ocorre X = 4 em 3 repeticoes da experiencia .
onde
=contagem do n
o
de indivduos atendidos durante uma manha no servico hospitalar.
Assim,
Z B(3, p)
onde
p = P(X = 4) = P(X 4) P(X < 4)
= F
X
(4) P(X 3) = F
X
(4) F
X
(3) = 0.2851 0.1512 = 0.0339
por consulta da tabela da funcao distribuicao da lei Poisson de parametro 6 e a probabilidade
de existir alguma manha em que X = 4 e
P(Z > 0) = 1 P(Z 0) = 1 (1 p)
3
= 0.0983.
(iii) Finalmente, dena-se a v.a.r.
T =n
o
de manhas ate que ocorra X = 0 pela primeira vez.
Tem-se que
T G(p), com p = P(X = 0) = e
6
6
0
0!
= 0.0025, porque X P(6).
Assim, a probabilidade de decorrerem no maximo 3 manhas ate ocorrer a primeira manha na
qual nao e atendido nenhum indivduo e
P(T 3) = f
T
(1) +f
T
(2) +f
T
(3)
= 0.0025 + (1 0.0025) 0.0025 + (1 0.0025)
2
0.0025 = 0.0075.
Exerccio 6. O n umero de partculas radioactivas emitidas num minuto, por uma fonte radi-
oactiva A, e uma v.a.r. X com distribuicao de Poisson e tal que E(X
2
) = 12, enquanto que,
63
o n umero de partculas radioactivas emitidas num minuto, por uma outra fonte radioactiva B,
independente de A, e uma v.a.r. Y com distribuicao de Poisson de variancia 2.
(a) Determine a probabilidade de serem emitidas pela fonte A menos do que 3 partculas durante
1 minuto dado que de facto foram emitidas partculas por essa fonte durante esse minuto.
(b) Qual o n umero esperado de partculas radioactivas emitidas pela fonte A em 3 minutos?
(c) Calcule a probabilidade de serem emitidas pelas duas fontes pelo menos 8 partculas radio-
activas em 3 minutos.
(d) As partculas sao registadas num contador que ocasionalmente falha o registo. Supondo
que cada partcula emitida e, independentemente das restantes, registada pelo contador com
probabilidade 0.95. Determine a probabilidade de o contador registar menos de 17 partculas
num dado minuto em que sao emitidas 20 partculas.
Resolucao:
(a) Temos
X =n
o
de partculas radioactivas emitidas num minuto, pela fonte radioactiva A,
com
X P(), com > 0 e E(X
2
) = 12.
Assim, como = E(X) = V (X) e V (X) = E(X
2
) [E(X)]
2
, tem-se
= 12
2

2
+ 12 = 0
=
1

1 + 48
2
=
1 7
2
= = 3, porque > 0
pelo que
X P(3).
Deste modo,
P(X < 3/X > 0) =
P(X < 3 X > 0)
P(X > 0)
=
P(0 < X < 3)
P(X > 0)
=
P(X < 3) P(X 0)
1 P(X 0)
=
F
X
(2) F
X
(0)
1 F
X
(0)
=
0.4232 0.0498
1 0.0498
= 0.3930,
por consulta da tabela da funcao distribuicao da lei Poisson de parametro 3.
64
(b) Para i = 1, 2, 3, seja X
i
a v.a.r. que representa o n umero de de partculas radioactivas
emitidas pela fonte A no minuto i. Tem-se X
i
P(3), i = 1, 2, 3, e
X
T
=n
o
total de partculas radioactivas emitidas pela fonte A em 3 minutos.
= X
1
+X
2
+X
3
pelo que
E(X
T
) = E (X
1
+X
2
+X
3
) = E(X
1
) +E(X
2
) +E(X
3
) = 3 + 3 + 3 = 9.
(c) De modo analogo, para i = 1, 2, 3, seja Y
i
a v.a.r. que representa o n umero de partculas
radioactivas emitidas pela fonte B no minuto i. Tem-se Y
i
P(2), i = 1, 2, 3, e X
1
, X
2
, X
3
, Y
1
,
Y
2
e Y
3
sao v.a.r. independentes. Assim, pela aditividade da lei de Poisson, a v.a.r.
T =n
o
total de partculas radioactivas emitidas pelas duas fontes em 3 minutos
= X
1
+X
2
+X
3
+Y
1
+Y
2
+Y
3
e tal que
T P(3 + 3 + 3 + 2 + 2 + 2) = P(15).
Donde,
P(T 5) = 1 P(T < 5) = 1 P(T 4) = 1 F
T
(4) = 1 0.0009 = 0.9991
por consulta da tabela da funcao distribuicao da lei Poisson de parametro 15.
(d) Seja Z a v.a.r. que representa o n
o
de partculas efectivamente registadas pelo contador em
20 partculas emitidas. Tem-se,
Z =n
o
de vezes que o contador regista uma partcula em 20 tentativas de registo.
Assim,
Z B(20, p),
onde
P(o contador registar uma partcula) = 0.95 = p.
Deste modo, a probabilidade de o contador registar menos de 17 partculas nesse minuto em que
sao emitidas 20 partculas e
P(Z < 17) = P(Z 16) = F
Z
(16) = 0.0159,
por consulta da tabela da funcao distribuicao da lei Binomial de parametros 20 e 0.95.
65
II.6 Variaveis Aleat orias Reais Contnuas
Ate aqui estudamos as v.a.r. discretas cujo conjunto de valores possveis e discreto (nito ou
innito numeravel). Agora debrucar-nos-emos sobre o estudo de v.a.r. cujo conjunto de valores
possveis e contnuo (i.e., innito nao numeravel). Como exemplos deste tipo de variaveis tem-se:
a temperatura mnima registada numa noite em Vila Real;
o lucro obtido por uma empresa em determinado ano;
o tempo de reparacao de uma peca mecanica;
para as quais e perfeitamente razoavel assumir que o conjunto de valores possveis e, respectiva-
mente, um intervalo real [a, b], R, ou R
+
.
Ao lidarmos com uma v.a.r. discreta vimos que e util calcular a sua funcao de probabilidade. De
facto, esta d a-nos informacao de como a probabilidade se distribui ao longo das imagens possveis
da v.a.r. associando probabilidade zero aos valores que a variavel jamais pode assumir
X() = S
X
discreto = P(X = x) =
_

_
> 0 , x S
X
= 0 , x / S
X
.
No entanto, tal calculo nao faz qualquer sentido se X e uma v.a.r. contnua. Com efeito, ao
escolher ao acaso um ponto num intervalo real, a probabilidade desse ponto ser exactamente x e
nula (o acontecimento e quase-impossvel!). Assim, se o conjunto de valores possveis da v.a.r. e
contnuo entao a probabilidade associada a qualquer ponto e nula
X() contnuo = P(X = x) = 0, x R.
Note-se que, se assim nao fosse, i.e., se atribussemos uma quantidade positiva (por menor que
ela fosse) a cada probabilidade pontual, no nal, a soma de todas as probabilidades associadas
`as (innitas nao numeraveis) imagens da v.a.r. seria innita.
Neste caso, em vez de calcular probabilidades pontuais, P(X = x), e razoavel sim calcular a
probabilidade de X pertencer a um intervalo real, P(a < X < b), denindo o analogocontnuo
da funcao de probabilidade, a funcao densidade de probabilidade.
66
II.6.1 Funcao densidade de probabilidade de uma v.a.r. contnua
Para denir formalmente a lei de probabilidade de uma v.a.r. contnua e necessario introduzir a
funcao densidade de probabilidade, que nos indica a forma como a probabilidade se distribui ao
longo de intervalos reais.
Denicao: Uma funcao f : R R e uma densidade de probabilidade sobre R se
(i) f(x) 0, x R (i.e, f e nao negativa);
(ii)
_
+

f(x) dx = 1.
Denicao: Uma v.a.r. X diz-se contnua se existe uma densidade de probabilidade sobre R, f,
tal que
P
X
(]a, b[) = P(a < X < b) =
_
b
a
f(x) dx, a < b, a, b R.
Nestas condicoes, dizemos que a lei de X, P
X
, e contnua. Chamamos a f densidade de pro-
babilidade da v.a.r. X (ou simplesmente densidade de X) e denotamo-la f
X
. Reparemos que
nao impomos `a funcao f
X
qualquer hipotese de continuidade. Assim,
_
b
a
f
X
(x) dx pode ser um
integral impr oprio.
Interessa referir que P(a < X < b) e igual `a area, sob o graco da funcao densidade de X, f
X
,
entre a e b, como podemos observar na gura:

f
X
P(a<X<b)
b a
Analogamente ao que vimos no caso discreto, chamamos suporte de X ao subconjunto de R,
S
X
, onde f
X
e estritamente positiva.
67
Interpretacao da densidade de probabilidade
Note-se que
V
a
= P
_
a

2
< X < a +

2
_
=
_
a+

2
a

2
f
X
(x) dx
sendo que, `a medida que vamos considerando tao pequeno quanto queiramos,
V
a

aproxima-se
da densidade de probabilidade de v.a.r. X em torno de a, i.e.,
lim
0
P(a

2
< X < a +

2
)

= f
X
(a).
Deste modo, a densidade no ponto a, f
X
(a), da-nos a ideia da possibilidadede ocorrencia
de valores muito proximos de a. Esta nocao jamais deve confundir-se com a probabilidade de
ocorrer X = a, probabilidade esta que, como vimos, e nula para v.a.r. contnuas.
De salientar ainda que, de
X v.a.r. contnua = P(X = a) =
_
a
a
f
X
(x)dx = 0, a R
decorre imediatamente
P(a < X < b) = P(a X < b) = P(a X b) = P(a < X b),
uma vez que P(a X < b) = P(X = a) +P(a < X < b),
P(a < X b) = P(a < X < b) +P(X = b), e
P(a X b) = P(X = a) +P(a < X < b) +P(X = b).
Exerccio 1: O comprimento, em cm, das asas de determinada especie de insectos e uma v.a.r.,
X, com func ao densidade de probabilidade dada por:
f
X
(x) =
_
_
_
2(k x) , 0 < x k
0 , caso contrario
.
(a) Mostre que o valor da constante real k e 1.
(b) Qual a probabilidade do comprimento de asas de um desses insectos estar compreendido
entre 0.2 cm e 1.5 cm?
Resolucao: (a) Seja a v.a.r X = comprimento, em cm, das asas de uma determinada especie
de insectos. Dado que f
X
e a funcao densidade de probabilidade da v.a.r. X, entao
f
X
(x) 0, x R e
_
+

f
X
(x) dx = 1.
68
Assim,
_
+

f
X
(x) dx = 1
_
0

0 dx +
_
k
0
2(k x) dx +
_
+
k
0 dx = 1 k > 0
2
_
k
0
(k x) dx = 1 k > 0 2
_
kx
x
2
2
_
k
0
= 1 k > 0
2
_
k
2

k
2
2
_
= 1 k > 0 (k = 1 k = 1) k > 0 k = 1.
Por outro lado, se k = 1, entao f
X
(x) 0, x R, uma vez que
f
X
(x) = 0, x / ]0, 1[ e f
X
(x) = 2(1 x) > 0, x ]0, 1[.
(b) Queremos calcular P(0.2 < X < 1.5). Assim,
P(0.2 < X < 1.5) =
_
1.5
0.2
f
X
(x) dx =
_
1
0.2
2(1 x) dx +
_
1.5
1
0 dx
=
_
2x x
2

1
0.2
= (2 1)
_
0.4 0.2
2
_
= 0.64.
II.6.2 Funcao de reparticao de uma v.a.r. contnua
Conhecida a funcao densidade de probabilidade, f
X
, de uma v.a.r. X contnua, tal como no caso
discreto, justica-se o calculo da correspondente funcao de reparticao, F
X
. Neste caso, tem-se
F
X
: R [0, 1] com
F
X
(x) = P(X x) =
_
x

f
X
(t) dt, x R.
Deste modo, F
X
(a) e igual `a area sob o graco da funcao densidade de X, f
X
, entre e a,
como apresentado na gura:
a a
f
X
a
F
X
(a) = P(Xa)
69
Propriedades da funcao de reparticao
A funcao de reparticao de uma v.a.r. contnua X goza de todas as propriedades ja apresentadas
para a funcao de reparticao de uma v.a.r. discreta (e que recordamos de seguida) sendo que, em
adicao, F
X
e uma funcao contnua em R.
1. F
X
(x) [0, 1], para todo o x R (pois e uma probabilidade).
2. F
X
e uma funcao monotona nao-decrescente, i.e., x
1
< x
2
F
X
(x
1
) F
X
(x
2
).
3. lim
x
F
X
(x) = 0 e lim
x+
F
X
(x) = 1.
4. F
X
e uma funcao contnua sobre R, logo contnua quer `a direita (como nas v.a.r. discretas),
quer `a esquerda, de qualquer ponto x R, i.e.,
F
X
(x) = F
X
(x

) = F
X
(x
+
), x R.
De facto, a continuidade adicional `a esquerda, decorre de
X v.a.r. contnua = P(X = x) = 0, x R
= F
X
(x) = F
X
(x

) +P(X = x) = F
X
(x

), x R.
Deste modo, o conjunto dos pontos de descontinuidade de F
X
D = a R : P(X = a) > 0
e o conjunto vazio.
5. P(X < x) = P(X x) = F
X
(x).
6. P(X x) = P(X > x) = 1 P(X x) = 1 F
X
(x).
E ainda, como ja referimos, para a < b,
7. P(a < X < b) = P(a X b) = P(a X < b) = P(a < X b) = F
X
(b) F
X
(a).
Exerccio 2. Seja X uma v.a.r. contnua com funcao densidade denida por:
f
X
(x) =
_

_
0 se x 1
2
x
3
se x > 1
.
70
(a) Prove que f
X
e, efectivamente, uma densidade de probabilidade.
(b) Determine a funcao de reparticao de X.
(c) Calcule P([X 1[ 1).
Resolucao: (a) Queremos provar que
(i) f
X
(x) 0, x R e (ii)
_
+

f
X
(x) dx = 1.
A vericacao de (i) e trivial uma vez que
f
X
(x) = 0, x ] , 1] e f
X
(x) =
2
x
3
> 0, x ]1, +[.
Quanto a (ii) tem-se,
_
+

f
X
(x) dx =
_
1

0 dx +
_
+
1
2
x
3
dx = 0 + lim
N+
_
N
1
2x
3
dx
= lim
N+
_
x
2

N
1
= lim
N+
(N
2
) (1
2
) = 1.
(b) A funcao de reparticao de X, F
X
: R [0, 1], e dada por
F
X
(x) = P(X x) =
_
x

f
X
(t) dt =
_

_
_
x

0 dt se x 1
_
1

0 dt +
_
x
1
2
t
3
dt se x > 1
=
_
_
_
0 se x 1
0 +
_
t
2

x
1
se x > 1
=
_

_
0 se x 1

1
x
2
+ 1 se x > 1
.
(c)
P([X 1[ 1) = P(1 X 1 1) = P(0 X 2) =
_
2
0
f
X
(x) dx
=
_
1
0
0 dx +
_
2
1
2
x
3
dx = 0 +
_
x
2

2
1
=
3
4
,
ou ainda,
P([X 1[ 1) = P(0 X 2) = F
X
(2) F
X
(0) =
_

1
2
2
+ 1
_
0 =
3
4
.
Exerccio 3. Seja X uma v.a.r. contnua com a seguinte funcao densidade de probabilidade:
f
X
(x) =
_

_
x
4
+k , 0 < x < 2
0 , caso contrario
, k R.
71
(a) Determine o valor da constante real k.
(b) Construa a funcao de reparticao de X.
(c) Calcule P (X > 1/X < 2.5).
Resolucao: (a) Se f
X
e funcao densidade de probabilidade entao
(i) f
X
(x) 0, x R e (ii)
_
+

f
X
(x) dx = 1.
Ora,
_
+

f
X
(x) dx =
_
0

0 dx +
_
2
0
_
x
4
+k
_
dx +
_
+
2
0 dx
= 0 +
_
x
2
8
+kx
_
2
0
+ 0
=
2
2
8
+ 2k =
1
2
+ 2k,
pelo que, de (ii) segue que
1
2
+ 2k = 1, i.e., que k =
1
4
.
Por outro lado, se k =
1
4
entao verica-se que f
X
(x) 0, x R, uma vez que
f
X
(x) = 0, x / ]0, 2[ e f
X
(x) =
x
4
+
1
4
> 0, x ]0, 2[.
(b) A funcao de reparticao de X, F
X
: R [0, 1], e dada por
F
X
(x) = P(X x) =
_
x

f
X
(t) dt
=
_

_
_
x

0 dt se x 0
_
0

0 dt +
_
x
0
_
t
4
+
1
4
_
dt se 0 < x < 2
_
0

0 dt +
_
2
0
_
t
4
+
1
4
_
dt +
_
x
2
0 dt se x 2
=
_

_
0 se x 0
0 +
_
t
2
8
+
t
4
_
x
0
se 0 < x < 2
0 +
_
t
2
8
+
t
4
_
2
0
+ 0 se x 2
=
_

_
0 se x 0
x
2
8
+
x
4
se 0 < x < 2
1 se x 2
.
72
(c)
P (X > 1/X < 2.5) =
P(X > 1 X < 2.5)
P(X < 2.5)
=
P(1 < X < 2.5)
P(X < 2.5)
=
F
X
(2.5) F
X
(1)
F
X
(2.5)
=
1
_
1
2
8
+
1
4
_
1
=
5
8
.
Analisemos o problema inverso, isto e, conhecida a funcao de reparticao de uma v.a.r. contnua,
F
X
, vejamos como determinar a correspondente densidade, f
X
. Relembremos que, sendo
F
X
(x) =
_
x

f
X
(t) dt,
se x
0
e um ponto de continuidade de f
X
, entao F
X
e derivavel em x
0
e tem-se F

X
(x
0
) = f
X
(x
0
).
Prova-se tambem que a funcao de reparticao, F
X
, e derivavel sobre R ou sobre R E com E um
conjunto discreto (nito ou innito numeravel).

E claro que se duas funcoes densidade diferirem
apenas num conjunto discreto elas vao denir a mesma funcao de reparticao. Assim, a uma
mesma v.a.r. X podemos associar varias densidades. Quando dissermos a densidade de X
estaremos a referir-nos a uma delas, concretamente a
f
X
(x) =
_
_
_
dF
X
(x)
dx
, nos pontos x onde F
X
e derivavel
0 , nos outros pontos (por convencao)
.
Exerccio 4. Seja X uma v.a.r. cuja funcao de reparticao e dada por:
F
X
(x) =
_
_
_
2k e

x
2
4
, x 0
0 , x < 0
.
(a) Calcule o valor da constante real k.
(b) Determine o valor da constante real a tal que P(X > a) = 0.75.
(c) Calcule P(X
2
> 2X).
(d) Calcule a funcao densidade de probabilidade de X.
Resolucao: (a) Se F
X
e a funcao de reparticao de uma v.a.r. contnua X entao, em particular,
lim
x
F
X
(x) = 0 e lim
x+
F
X
(x) = 1;
F
X
e uma funcao contnua sobre R, i.e.,
F
X
(x) = F
X
(x

) = F
X
(x
+
), x R.
73
Ora,
lim
x+
F
X
(x) = 1 lim
x+
_
2k e

x
2
4
_
= 1 2k = 1 k =
1
2
.
De modo an alogo, poderamos ter obtido o valor de k com base na continuidade de F
X
no ponto
0. De facto, da continuidade `a esquerda de 0 tem-se que
F
X
(0) = F
X
(0

) 2k e

0
2
4
= 0 2k 1 = 0 k =
1
2
.
(b) Comecamos por notar que
P(X > a) = 0.75 1 P(X a) = 0.75 F
X
(a) = 0.25.
O valor de a, tal que F
X
(a) = 0.25, tem que ser maior ou igual a 0, uma vez que, se a < 0, entao
F
X
(a) = 0. Assim,
F
X
(a) = 0.25 1 e

a
2
4
= 0.25 a 0 e

a
2
4
= 0.75 a 0

a
2
4
= ln(0.75) a 0
a =
_
4 ln(0.75) a 0
= a =
_
4 ln(0.75) 1.072.
(c)
P(X
2
> 2X) = P(X
2
2X > 0) = P (X < 0 X > 2)
= P(X < 0) +P(X > 2), X < 0 e X > 2 sao ac. incompatveis
= F
X
(0

) + (1 F
X
(2)) = 0 + 1 (1 e

2
2
4
) =
1
e
.
Note-se que:
X
2
2X > 0 X(X 2) > 0
(X < 0 X 2 < 0) (X > 0 X 2 > 0) X < 0 X > 2.
(d) Se X e uma v.a.r. contnua com funcao de reparticao F
X
entao uma densidade de X e
f
X
(x) =
_
_
_
dF
X
(x)
dx
, nos pontos x onde F
X
e derivavel
0 , nos outros pontos
.
Ora, a funcao F
X
e derivavel em R 0 por se tratar de uma funcao constante ou exponencial
ao longo dos seus ramos. Assim
dF
X
(x)
dx
=
_
_
_
1
2
x e

x
2
4
, x > 0
0 , x < 0
.
74
No ponto x = 0 de mudanca de ramo (no qual teramos de calcular a derivada caso exista
por denicao) consideramos por convencao um qualquer valor para f
X
(x), geralmente 0. Deste
modo, uma densidade de X e
f
X
(x) =
_
_
_
1
2
x e

x
2
4
, x > 0
0 , x 0
.
II.7 Parametros de uma v.a.r. contnua
Tal como para as v.a.r. discretas tambem para as v.a.r. contnuas e de grande utilidade
sumariar-se a informacao contida nestas distribuicoes de probabilidade atraves de n umeros reais
parametros capazes de evidenciar algumas das suas caractersticas relevantes.
Como anteriormente focar-nos-emos em
Parametros de localizacao:
valor esperado;
mediana;
quantil de probabilidade (ou quantil de ordem) p;
Parametros de dispersao:
variancia;
desvio-padrao.
A denicao de qualquer destes parametros e analoga
2
ao caso discreto:
onde tnhamos

xS
X
ou P(X = x)
passamos a ter
_
S
X
dx ou f
X
(x), respectivamente.
2
Ao invocar esta analogia escusar-nos-emos a fazer qualquer tipo de motivacao adicional a estes parametros
ou repetir comentarios ja efectuados sobre os mesmos.
75
II.7.1 Valor esperado de uma v.a.r. contnua
Denicao: Dada uma v.a.r. contnua X com funcao densidade de probabilidade f
X
, e suporte
S
X
, chamamos valor esperado de X ao n umero real E(X) tal que
E(X) =
_
+

x f
X
(x) dx =
_
S
X
x f
X
(x) dx.
Observac oes: E(X) existe (i.e., e nito) se e so se o integral for absolutamente convergente,
i.e., se e so se
_
+

[x[f
X
(x) dx < +.
Exerccio 5. Seja X uma v.a.r com funcao densidade de probabilidade denida por:
f(x) =
_

_
x + 2 , 0.5 x 0
1.5 x , 1 < x < 1.5
0 , caso contrario
.
Como o suporte de X e S
X
= [0.5, 0] [1, 1.5[,
E(X) =
_
+

xf
X
(x) dx =
_
0
0.5
x(x + 2) dx +
_
1.5
1
x(1.5 x) dx
=
_
0
0.5
(x
2
+ 2x) dx +
_
1.5
1
(1.5x x
2
) dx
=
_
x
3
3
+x
2
_
0
0.5
+
_
1.5
x
2
2

x
3
3
_
1.5
1
= 0
_
(0.5)
3
3
+ (0.5)
2
_
+
_
1.5
(1.5)
2
2

(1.5)
3
3
_

_
1.5
1
2

1
3
_
=
0.125
3
0.25 +
(1.5)
3
6
0.75 +
1
3
= 0.125.
Como apresentaremos de seguida, o valor esperado de uma v.a.r. contnua X goza de propriedades
analogas`as apresentadas no caso discreto.
Propriedades do valor esperado:
1. Seja X uma v.a.r. para a qual E(X) existe. Entao
E(aX +b) = aE(X) +b, a, b R,
i.e., o valor esperado e um operador linear.
76
2. Seja X uma v.a.r. contnua com funcao densidade f
X
e suporte S
X
, e considere-se a funcao
(mensuravel) : R R. Deste modo, Y = (X) e uma v.a.r. contnua e tem-se
E(Y ) = E((X)) =
_
+

(x)f
X
(x) dx =
_
S
X
(x)f
X
(x) dx.
Tal como no caso discreto, a propriedade seguinte e a generalizacao natural da propriedade 1.
3. Linearidade da esperanca matematica: Sejam X
1
, X
2
, ..., X
n
v.a.r. denidas sobre um
mesmo espaco de probabilidade, tais que E(X
k
) existe para k = 1, 2, ..., n. Sejam a
0
, a
1
, a
2
, ..., a
n
n umeros reais arbitrarios. Entao E
_
a
0
+
n

k=1
a
k
X
k
_
existe e tem-se
E
_
a
0
+
n

k=1
a
k
X
k
_
= a
0
+
n

k=1
a
k
E(X
k
).
II.7.2 Mediana de uma v.a.r. contnua
Denicao: Chamamos mediana da v.a.r. X (discreta ou contnua) ao n umero real me tal que
F
X
(me

) 1/2 e F
X
(me) 1/2.
Contudo, como no caso contnuo F
X
e contnua, de
F
X
(me

) = F
X
(me) 1/2 e F
X
(me) 1/2
segue que a mediana de uma v.a.r. contnua X e o n umero real me tal que
F
X
(me) = 1/2.
Observacao: Como no caso discreto, a mediana de uma v.a.r. contnua e um parametro que
existe sempre. No entanto, a mediana pode nao ser unica, passando nesse caso a falar-se em
classe mediana.
77
Exemplos:
1. 2.
-
6
0
1/2
1
F
X
(x)
x 0 2 4

-
6
0
1/2
1
F
Y
(y)
0 1 2 3 y

No exemplo 1 vemos que a v.a.r. X tem um unico valor mediano: me


X
= 2. Por outro lado,
para a v.a.r. Y do exemplo 2, todos os n umeros reais me
Y
[1, 2] sao valores medianos de Y .
Neste caso dizemos que [1, 2] e classe mediana de Y e, caso necessitemos de um representante da
classe, tomamos por exemplo o seu ponto medio me
Y
= 1.5.
II.7.3 Quantil de probabilidade p de uma v.a.r. contnua
Denicao: Chamamos quantil de probabilidade (ou quantil de ordem) p, p ]0, 1[, da v.a.r. X
(discreta ou contnua), ao n umero real q
p
tal que
F
X
(q

p
) p e F
X
(q
p
) p.
Como no caso contnuo F
X
e contnua, em particular, o quantil de probabilidade p de uma v.a.r.
contnua X e o n umero real q
p
tal que
F
X
(q
p
) = p.
Exerccio 6. Seja X uma v.a.r com funcao densidade de probabilidade denida por:
f(x) =
_

_
x + 2 , 0.5 x 0
1.5 x , 1 < x < 1.5
0 , caso contrario
.
(a) Calcule a funcao de reparticao de X.
(b) Determine a mediana, o 3
o
quartil e o 9
o
decil.
78
Resolucao: (a) A funcao de reparticao de X, F
X
: R [0, 1], e dada por
F
X
(x) = P(X x) =
_
x

f
X
(t) dt
=
_

_
_
x

0 dt se x 0.5
_
0.5

0 dt +
_
x
0.5
(t + 2) dt se 0.5 < x < 0
_
0.5

0 dt +
_
0
0.5
(t + 2) dt +
_
x
0
0 dt se 0 x 1
_
0.5

0 dt +
_
0
0.5
(t + 2) dt +
_
1
0
0 dt +
_
x
1
(1.5 t) dt se 1 < x < 1.5
_
0.5

0 dt +
_
0
0.5
(t + 2) dt +
_
1
0
0 dt +
_
1.5
1
(1.5 t) dt +
_
x
1.5
0 dt se x 1.5
=
_

_
0 se x 0.5
0 +
_
t
2
2
+ 2t
_
x
0.5
se 0.5 < x < 0
0 +
_
t
2
2
+ 2t
_
0
0.5
+ 0 se 0 x 1
0 +
_
t
2
2
+ 2t
_
0
0.5
+ 0 +
_
1.5t
t
2
2
_
x
1
dt se 1 < x < 1.5
0 +
_
t
2
2
+ 2t
_
0
0.5
+ 0 +
_
1.5t
t
2
2
_
1.5
1
+ 0 se x 1.5
=
_

_
0 se x 0.5
x
2
2
+ 2x + 0.875 se 0.5 < x < 0
0.875 se 0 x 1
1.5x
x
2
2
0.125 se 1 < x < 1.5
1 se x 1.5
.
(b) Como X e v.a.r. contnua, a mediana de X e o n umero real me tal que F
X
(me) =
1
2
. Sabemos
que F
X
(0.5) = 0 < 1/2, F
X
(0) = 0.875 > 1/2 e F
X
e nao decrescente, entao me ] 0.5, 0[.
79
Assim,
me ] 0.5, 0[
me
2
2
+ 2me + 0.875 =
1
2
me ] 0.5, 0[
me
2
2
+ 2me + 0.375 = 0
me ] 0.5, 0[
_
me = 2

3.25 me = 2 +

3.25
_
= me = 0.197.
Analogamente, o 3
o
quartil de X e o n umero real Q
3
tal que F
X
(Q
3
) =
3
4
. Sabemos que
F
X
(0.5) = 0 < 3/4, F
X
(0) = 0.875 > 3/4 e F
X
e nao decrescente, entao Q
3
] 0.5, 0[. Assim,
Q
3
] 0.5, 0[
Q
2
3
2
+ 2Q
3
+ 0.875 =
3
4
Q
3
] 0.5, 0[
Q
2
3
2
+ 2Q
3
+ 0.125 = 0
Q
3
] 0.5, 0[
_
Q
3
= 2

3.75 Q
3
= 2 +

3.75
_
= Q
3
= 0.064.
Do mesmo modo, o 9
o
decil de X e o n umero real D
9
tal que F
X
(D
9
) =
9
10
. Sabemos que
F
X
(1) = 0.875 < 9/10, F
X
(1.5) = 1 > 9/10 e F
X
e nao decrescente, entao D
9
]1, 1.5[. Assim,
D
9
]1, 1.5[ 1.5D
9

D
2
9
2
0.125 =
9
10
D
9
]1, 1.5[
D
2
9
2
+ 1.5D
9
1.025 = 0
D
9
]1, 1.5[
_
D
9
= 1.5

0.2 D
9
= 1.5 +

0.2
_
= D
9
= 1.053.
II.7.4 Variancia de uma v.a.r. contnua
Denicao: Chamamos variancia de uma v.a.r. X (discreta ou contnua) ao n umero real V (X)
tal que
V (X) = E
_
(X E(X))
2

,
ou equivalentemente
V (X) = E(X
2
) [E(X)]
2
.
80
Assim, se X for uma v.a.r. contnua com funcao densidade f
X
, suporte S
X
e media m = E(X),
entao
V (X) =
_
S
X
(x m)
2
f
X
(x) dx
ou, de modo equivalente,
V (X) = E(X
2
) [E(X)]
2
,
com
E(X) =
_
S
X
xf
X
(x) dx e E(X
2
) =
_
S
X
x
2
f
X
(x) dx.
Rera-se que a variancia de uma v.a.r. contnua goza das mesmas propriedades que a variancia
de uma v.a.r. discreta, que recordamos de seguida.
Propriedades da variancia:
1. V (X) 0, qualquer que seja a v.a.r. X.
2. Se a um n umero real arbitrario, entao V (a) = 0.
3. Se X e uma v.a.r. tal que V (X) existe, entao V (aX +b) = a
2
V (X), a, b R.
4. Sejam X
1
, X
2
, ..., X
n
v.a.r. independentes, denidas sobre um mesmo espaco de probabilidade,
tais que V (X
k
) existe para k = 1, 2, ..., n. Sendo a
0
, a
1
, a
2
, ..., a
n
n umeros reais arbitrarios, tem-se:
V
_
a
0
+
n

k=1
a
k
X
k
_
=
n

k=1
a
2
k
V (X
k
).
Em particular, se as v.a.r. envolvidas sao independentes
V
_
n

k=1
X
k
_
=
n

k=1
V (X
k
), e V (X
1
X
2
) = V (X
1
) +V (X
2
).
II.7.5 Desvio-padrao de uma v.a.r. contnua
Denicao: Chamamos desvio-padrao da v.a.r. X (discreta ou contnua) ao n umero real
positivo
X
tal que

X
=
_
V (X),
o qual mede a dispersao dos valores de X em torno do seu valor medio.
81
Exerccio 7. Determine a media, a variancia e o desvio padrao da v.a.r. denida no exerccio 1.
Resolucao: Comecemos por notar que X e v.a.r. contnua de suporte S
X
=]0, 1[. Assim, por
denicao de valor medio de X,
E(X) =
_
+

xf
X
(x) dx =
_
S
X
xf
X
(x) dx =
_
1
0
x 2(1 x) dx
= 2
_
1
0
(x x
2
) dx = 2
_
x
2
2

x
3
3
_
1
0
= 2
_
1
2

1
3
_
=
1
3
.
Por outro lado,
E(X
2
) =
_
+

x
2
f
X
(x) dx =
_
S
X
x
2
f
X
(x) dx =
_
1
0
x
2
2(1 x) dx
= 2
_
1
0
(x
2
x
3
) dx = 2
_
x
3
3

x
4
4
_
1
0
= 2
_
1
3

1
4
_
=
1
6
.
Deste modo,
V (X) = E(X
2
) [E(X)]
2
=
1
6

_
1
3
_
2
=
1
18
e
X
=
_
V (X) = 0.2357.
Exerccio 8. Seja X uma v.a.r. contnua cuja funcao de reparticao e dada por:
F
X
(x) =
_

_
0 , x < 0
x
2
, 0 x < 1
1 , x 1
.
(a) Calcule a funcao de probabilidade de X.
(b) Determine o 1
o
quartil e o 7
o
decil de X.
(c) Calcule E
_
3X+2
4
_
.
Resolucao: (a) Se X e uma v.a.r. contnua com funcao de reparticao F
X
entao uma densidade
de X e dada por
f
X
(x) =
_
_
_
dF
X
(x)
dx
, nos pontos x onde F
X
e derivavel
0 , nos outros pontos
.
A funcao F
X
e derivavel em R 0, 1, por se tratar de uma funcao constante ou polinomial em
cada ramo, e tem-se
dF
X
(x)
dx
=
_
_
_
0 , x < 0 ou x > 1
2x , 0 < x < 1
.
82
Nos pontos x de mudanca de ramo (nos quais teramos de calcular as derivadas caso existam
por denicao) consideramos por convencao um qualquer valor para f
X
(x), geralmente 0. Deste
modo, uma densidade de X e dada por
f
X
(x) =
_
_
_
0 , x 0 ou x 1
2x , 0 < x < 1
.
(b) Como X e v.a.r. contnua, o 1
o
quartil de X e o n umero real Q
1
= q1
4
tal que F
X
(Q
1
) =
1
4
.
Assim,
Q
1
]0, 1[ Q
2
1
=
1
4
= Q
1
=
1
2
= 0.5.
Analogamente, o 7
o
decil de X e o n umero real D
7
= q 7
10
tal que F
X
(D
7
) =
7
10
. Assim,
D
7
]0, 1[ D
2
7
=
7
10
= D
7
=
_
7
10
= 0.8367.
(c) Uma vez que X e v.a.r. contnua de suporte S
X
=]0, 1[, o valor medio de X e
E(X) =
_
+

xf
X
(x) dx =
_
S
X
xf
X
(x) dx =
_
1
0
x 2x dx
=
_
1
0
2x
2
dx = 2
_
x
3
3
_
1
0
=
2
3
.
Finalmente,
E
_
3X + 2
4
_
= E
_
3
4
X +
1
2
_
=
3
4
E(X) +
1
2
=
3
4

2
3
+
1
2
= 1.
83
II.8 Distribuic oes Contnuas
II.8.1 Distribuicao Uniforme
A distribuicao uniforme e adequada para modular o comportamento probabilstico de uma v.a.r.
cujos valores possveis se cre terem todos o mesmopeso, para alem de constiturem um intervalo
real conhecido e limitado (quer `a esquerda, quer `a direita).
Denicao: Dizemos que a v.a.r. X tem uma distribuicao uniforme no intervalo [a, b],
a, b R, a < b, e escrevemos
X U([a, b])
se X e uma v.a.r. contnua com funcao densidade de probabilidade
f
X
(x) =
_
_
_
1
ba
, x [a, b]
0 , x / [a, b]
.
Neste caso, tem-se
E(X) =
a +b
2
e V (X) =
(b a)
2
12
.
Exerccio 9. Seja X uma v.a.r. com distribuicao uniforme no intervalo [a, b].
(a) Deduza o valor esperado e a variancia de X.
(b) Construa a funcao de reparticao de X.
Resolucao: (a) Tem-se que X e uma v.a.r. contnua de suporte S
X
= [a, b]
E(X) =
_
+

x f
X
(x) dx =
_
b
a
x f
X
(x) dx =
_
b
a
x
b a
dx
=
1
b a
_
x
2
2
_
b
a
=
1
b a
_
b
2
2

a
2
2
_
=
1
b a
(b a)(b +a)
2
=
a +b
2
.
Por outro lado,
E(X
2
) =
_
+

x
2
f
X
(x) dx =
_
b
a
x
2
f
X
(x) dx =
_
b
a
x
2
b a
dx
=
1
b a
_
x
3
3
_
b
a
=
1
b a
_
b
3
3

a
3
3
_
=
1
b a
(b a)(b
2
+ab +a
2
)
3
=
b
2
+ab +a
2
3
.
84
Assim,
V (X) = E(X
2
) [E(X)]
2
=
b
2
+ab +a
2
3

_
a +b
2
_
2
=
(b a)
2
12
.
(b) A funcao de reparticao de X e dada por F
X
: R [0, 1] tal que
F
X
(x) = P(X x) =
_
x

f
X
(t)dt
=
_

_
_
x

0 dt se x < a
_
a

0 dt +
_
x
a
_
1
b a
_
dt se a x b
_
a

0 dt +
_
b
a
_
1
b a
_
dt +
_
x
b
0 dt se x > b
=
_

_
0 se x < a
0 +
1
b a
[t]
x
a
se a x b
0 +
1
b a
[t]
b
a
+ 0 se x > b
=
_

_
0 se x < a
x a
b a
se a x b
1 se x > b
.
Exerccio 10: O peso de um saco de um quilo de cafe de certa marca e uma v.a.r. X com
distribuicao uniforme no intervalo [0.8, 1.05].
(a) Indique a funcao densidade de probabilidade de X.
(b) Construa a funcao de reparticao de X.
(c) Determine os quartis da distribuicao de X.
(d) Calcule a media e a variancia de X.
(e) Determine P(1 < X < 1.2).
Resolucao: (a) Seja a v.a.r. X = peso de um saco de um quilo de cafe. Dado que
X U([0.8, 1.05]) a funcao densidade de probabilidade de X e dada por:
f
X
(x) =
_
_
_
1
1.05 0.8
, x [0.8, 1.05]
0 , x / [0.8, 1.05]
=
_
_
_
4 , x [0.8, 1.05]
0 , x / [0.8, 1.05]
.
85
(b) Da resolucao do exerccio anterior podemos armar que a funcao de reparticao de X e
F
X
(x) =
_

_
0 se x < 0.8
x 0.8
1.05 0.8
se 0.8 x 1.05
1 se x > 1.05
=
_

_
0 se x < 0.8
4x 3.2 se 0.8 x 1.05
1 se x > 1.05
.
Contudo, nao tendo presente a formula geral da funcao de reparticao de X, tem-se
F
X
(x) = P(X x) =
_
x

f
X
(t)dt
=
_

_
_
x

0 dt se x < 0.8
_
0.8

0 dt +
_
x
0.8
4 dt se 0.8 x 1.05
_
0.8

0 dt +
_
1.05
0.8
4 dt +
_
x
1.05
0 dt se x > 1.05
=
_

_
0 se x < 0.8
0 + 4 [t]
x
0.8
se 0.8 x 1.05
0 + 4 [t]
1.05
0.8
+ 0 se x > 1.05
=
_

_
0 se x < 0.8
4x 3.2 se 0.8 x 1.05
1 se x > 1.05
.
(c) Como X e uma v.a.r. contnua, os quartis da distribuicao de X sao os n umeros reais Q
n
= q
n
4
tais que F(Q
n
) =
n
4
, n = 1, 2, 3. Deste modo,
F(Q
n
) = 4Q
n
3.2 =
n
4
Q
n
=
n
16
+
3.2
4
, n = 1, 2, 3
e tem-se Q
1
=
1
16
+
3.2
4
= 0.8625, Q
2
=
2
16
+
3.2
4
= 0.9250, e Q
3
=
3
16
+
3.2
4
= 0.9875.
Notemos que na distribuicao uniforme existe equiprobabilidade em subintervalos de [0.8, 1.05]
com a mesma amplitude. Deste modo, tambem podemos determinar os quartis considerando
a amplitude do intervalo [0.8, 1.05] e dividindo-a por 4, da seguinte forma: Q
1
= 0.8 + 0.25/4,
Q
2
= Q
1
+ 0.25/4 e Q
3
= Q
2
+ 0.25/4.
(d) A media e variancia da v.a.r. X sao dadas por
E(X) =
0.8 + 1.05
2
= 0.925 e V (X) =
(1.05 0.8)
2
12
= 0.0052.
86
(e) Utilizando a funcao de reparticao da v.a.r. X, temos que
P(1 < X < 1.2) = F
X
(1.2) F
X
(1) = 1 (4 3.2) = 0.2.
Ou, utilizando a funcao densidade temos,
P(1 < X < 1.2) =
_
1.2
1
f
X
(x)dx =
_
1.05
1
4 dx +
_
1.2
1.05
0 dx = 4 [x]
1.05
1
= 4(1.05 1) = 0.2.
II.8.2 Distribuicao Normal (ou Gaussiana)
A distribuicao normal surge associada `a modelacao de observacoes relativas a medicoes de tem-
peraturas, de velocidades, de erros, de volumes de rudo, etc. Surge tambem
3
como distribuicao
aproximada de algumas distribuicoes discretas ou ainda de somas de v.a.r. independentes. A
utilizacao da distribuicao normal no domnio da Inferencia Estatstica
4
reveste-se de extrema
importancia e deve-se a uma serie de propriedades matematicas interessantes desta distribuicao.
Denicao: Dizemos que a v.a.r. X tem a distribuicao normal de parametros e , R e
R
+
, e escrevemos
X N(, ),
se X e uma v.a.r. contnua com funcao densidade de probabilidade
f
X
(x) =
1

2
exp
_

1
2
_
x

_
2
_
, x R.
Nestas condicoes, tem-se
E(X) = me = e V (X) =
2
.
Diz-se tambem que X e uma v.a.r. normalmente distribuda com parametros e , ou X e uma
v.a.r. gaussiana de parametros e .
A funcao densidade de probabilidade da distribuicao normal e simetrica em torno de
f
X
( x) = f
X
( +x), x R
+
3
Como teremos ocasiao de ver no Captulo V
4
Assunto que abordaremos a partir do Captulo VI
87
e tem a forma de sino com um maximo no ponto e dois pontos de inexao em e +,
como podemos observar na gura:
Para alem disso, o valor de determina o achatamento da densidade desta v.a.r. (ou nao se
tratasse de uma medida de dispersao).
Caso particular: Se Z N(0, 1), i.e., se Z e uma v.a.r. normalmente distribuda de media
= 0 e desvio padrao = 1, entao a sua densidade de probabilidade e
f
Z
(z) =
1

2
exp
_

z
2
2
_
, z R
e dizemos que Z tem distribuicao normal centrada e reduzida ou distribuicao normal padrao.
A distribuicao normal padrao goza de algumas propriedades interessantes. Nomeadamente, se
Z N(0, 1) entao Z e uma v.a.r. simetrica, de centro de simetria 0. Desta propriedade decorre
imediatamente que
P(Z z) = P(Z z), z R,
ou equivalentemente,
F
Z
(z) = 1 F
Z
(z), z R.
88
A funcao de reparticao de uma v.a.r. X N(, ) e da forma
F
X
(x) =
_
x

2
exp
_

1
2
_
t

_
2
_
dt, x R,
pelo que so pode ser obtida numericamente ou por consulta de tabelas existentes. A consulta
da tabela ( unica) da funcao de reparticao da lei N(0, 1) encontra justicacao nos seguintes
resultados.
Propriedade: Se X N(, ), R, R
+
, entao
Y = aX +b N(a +b, [a[),
onde a e b sao constantes reais com a ,= 0.
Consequencia da propriedade anterior:
Se X N(, ), R, R
+
entao Z =
X

N(0, 1).
Basta tomar na propriedade anterior a =
1
e b =
1
.
Dada a sua relevancia para efeitos de calculos, a funcao de reparticao da lei normal padrao
F
Z
(z) =
_
z

2
e

1
2
t
2
dt
esta tabelada para um grande n umero de valores nao negativos z.
Importa reforcar que nao constam da tabela valores de F
Z
(z) para z < 0. No entanto, gracas `a
simetria da funcao densidade da lei normal padrao em torno da origem pode concluir-se que
F
Z
(z) = 1 F
Z
(z), z R.
Assim, por exemplo, F
Z
(1.52) = 0.9357 e F
Z
(1.52) = 1 F
Z
(1.52) = 1 0.9357 = 0.0643.
z 0.00 0.01 0.02 0.03
.
.
.
1.5 0.9357
.
.
.
89
De salientar que, e `a custa da funcao de reparticao da lei N(0, 1) que se obtem a funcao de
reparticao de qualquer v.a.r. X N(, ), R, R
+
. Com efeito:
F
X
(x) = P(X x) = P
_
X

_
= P
_
Z
x

_
= F
Z
_
x

_
, com Z =
X

N(0, 1).
Propriedade: (Estabilidade da lei normal)
Sejam a
1
, . . . , a
n
(n 1) constantes reais, tais que pelo menos uma delas e nao nula e b R.
Sejam X
1
, . . . , X
n
v.a.r. independentes, tais que
X
i
N(
i
,
i
), i = 1, . . . , n
i
R,
i
R
+
.
Entao
Y = b +
n

i=1
a
i
X
i
N
_
_
b +
n

i=1
a
i

i
,

_
n

i=1
a
2
i

2
i
_
_
,
uma vez que
E
_
b +
n

i=1
a
i
X
i
_
= b+
n

i=1
a
i
E(X
i
) = b+
n

i=1
a
i

i
e V
_
b +
n

i=1
a
i
X
i
_
=
n

i=1
a
2
i
V (X
i
) =
n

i=1
a
2
i

2
i
.
Casos particulares:
1. Se X
1
, . . . , X
n
sao v.a.r. independentes tais que X
i
N(
i
,
i
), i = 1, . . . , n, com
i
R e

i
R
+
, entao, a variavel soma, T
n
, e tal que
T
n
=
n

i=1
X
i
N
_
_
n

i=1

i
,

_
n

i=1

2
i
_
_
,
uma vez que
E
_
n

i=1
X
i
_
=
n

i=1
E(X
i
) =
n

i=1

i
e V
_
n

i=1
X
i
_
=
n

i=1
V (X
i
) =
n

i=1

2
i
.
2. Se X
1
, . . . , X
n
sao v.a.r. independentes tais que X
i
N(, ), i = 1, . . . , n, com R e
R
+
, entao, a variavel soma, T
n
, e tal que
T
n
=
n

i=1
X
i
N
_
n,

n
_
,
90
uma vez que
E
_
n

i=1
X
i
_
=
n

i=1
E(X
i
) = n E(X) = n e V
_
n

i=1
X
i
_
=
n

i=1
V (X
i
) = n V (X) = n
2
.
3. Se X
1
, . . . , X
n
sao v.a.r. independentes tais que X
i
N(, ), i = 1, . . . , n, com R e
R
+
, entao, a variavel media, X
n
, e tal que
X
n
=
1
n
n

i=1
X
i
N
_
,

n
_
,
uma vez que
E(X
n
) = E
_
1
n
n

i=1
X
i
_
=
1
n
n

i=1
E(X
i
) =
1
n
n E(X) = E(X) =
e
V (X
n
) = V
_
1
n
n

i=1
X
i
_
=
1
n
2
n

i=1
V (X
i
) =
1
n
2
n V (X) =
V (X)
n
=

2
n
.
Exerccio 13: Em determinada fabrica existe apenas um elevador cuja carga maxima e de 1080
kg e que pode transportar no maximo 16 pessoas de cada vez. Com base no ultimo exame medico
dos trabalhadores desta fabrica, constatou-se que o seu peso e uma v.a.r. gaussiana de media 60
kg e desvio padrao 10 kg.
(a) Calcule a probabilidade de um trabalhador pesar pelo menos 55 kg.
(b) Escolhidos ao acaso 16 trabalhadores da referida fabrica e considerando que os pesos dos
trabalhadores sao independentes entre si, determine a probabilidade:
(i) do trabalhador mais pesado pesar menos de 55 kg;
(ii) do trabalhador menos pesado pesar menos de 55 kg;
(iii) do peso total destes trabalhadores exceder a carga maxima do elevador;
(iv) do peso medio destes trabalhadores exceder 60 kg;
(v) de pelo menos um dos trabalhadores pesar menos de 55 kg.
Resolucao: (a) Seja a v.a.r. X = peso, em kg, de um trabalhador da fabrica. Tem-se que
X N(60, 10) = Z =
X 60
10
N(0, 1).
91
Entao
P(X 55) = P
_
X 60
10

55 60
10
_
= P(Z 0.5) = 1 P(Z < 0.5) = 1 F
Z
(0.5)
= 1 (1 F
Z
(0.5)), pela simetria da lei N(0, 1)
= F
Z
(0.5) = 0.6915,
ou simplesmente
P(X 55) = P
_
X 60
10

55 60
10
_
= P(Z 0.5) = P(Z 0.5), pela simetria da lei N(0, 1)
= F
Z
(0.5) = 0.6915.
(b) (i) Para i = 1, . . . , 16, seja a v.a.r. X
i
= peso, em kg, do trabalhador i. Tem-se que
X
i
N(60, 10), i = 1, . . . , 16, e que X
1
, X
2
, , X
16
sao v.a.r. independentes. Assim, os
acontecimentos X
1
< 55,. . . , X
16
< 55 sao independentes, e tem-se que
P (maxX
1
, X
2
, , X
16
< 55) = P(X
1
< 55 X
2
< 55 X
16
< 55)
= P(X
1
< 55)P(X
2
< 55) P(X
16
< 55)
= P(X < 55)
16
= (1 P(X 55))
16
= (1 0.6915)
16
.
(ii) Uma vez que os acontecimentos X
1
55,. . . , X
16
55 sao independentes, vem
P (minX
1
, X
2
, , X
16
< 55) = 1 P (minX
1
, X
2
, , X
16
55)
= 1 P(X
1
55 X
2
55 X
16
55)
= 1 P(X
1
55)P(X
2
55) P(X
16
55)
= 1 P(X 55)
16
= 1 0.6915
16
.
(iii) Seja a v.a.r. Y = peso total dos 16 trabalhadores, em kg. Como a carga maxima do
elevador e de 1080 kg, pretendemos calcular P(Y > 1080). Ora,
Y = peso total dos 16 trabalhadores =
16

i=1
X
i
,
com X
1
, . . . , X
16
v.a.r. independentes e normalmente distribudas de media E(X
i
) = 60 e
variancia V (X
i
) = 10
2
, i = 1, . . . , 16. Assim, pela estabilidade da lei normal, vem que
Y N
_
E(Y ),
_
V (Y )
_
,
92
com
E(Y ) = E
_
16

i=1
X
i
_
=
16

i=1
E(X
i
) = 16 60 = 960
e
V (Y ) = V
_
16

i=1
X
i
_
=
16

i=1
V (X
i
) = 16 10
2
= 1600
uma vez que X
1
, . . . , X
16
sao v.a.r. independentes. Tem-se entao que Y N(960, 40). Logo
Y N(960, 40) = Z =
Y 960
40
N(0, 1)
pelo que
P(Y > 1080) = P
_
Y 960
40
>
1080 960
40
_
= P(Z > 3)
= 1 P(Z 3) = 1 F
Z
(3) = 1 0.9987 = 0.0013.
(iv) Seja a v.a.r. X
16
= peso medio dos 16 trabalhadores, em kg. Tem-se,
X
16
=
1
16
16

i=1
X
i
,
com X
1
, . . . , X
16
sao v.a.r. independentes e normalmente distribudas de media E(X
i
) = 60 e
variancia V (X
i
) = 10
2
. Assim, pela estabilidade da lei normal, vem que
X
16
N (60, 2.5) ,
uma vez que
E(X
16
) = E(X
i
) = 60 e
_
V (X
16
) =
_
V (X
i
)
16
=

16
=
10

16
= 2.5.
Ora,
X
16
N(60, 2.5) = Z =
X
16
60
2.5
N(0, 1)
pelo que
P(X
16
60) = P
_
X
16
60
2.5

60 60
2.5
_
= P(Z 0) = 0.5.
(v) Seja a v.a.r. T = n umero de trabalhadores da fabrica que pesam menos de 55 kg, de entre
os 16 em estudo.
Note-se que, se considerarmos a experiencia de Bernoulli
93
= escolha ao acaso de um trabalhador e registo se pesa ou nao menos de 55 kg,
e o acontecimento
A = o trabalhador pesa menos de 55 kg = X < 55,
tem-se
T = n umero de vezes que ocorre A em 16 repeticoes de , em condicoes de independencia
pelo que
T B(16, 0.3085).
Assim,
P(T 1) = 1 P(T < 1) = 1 P(T = 0), uma vez que S
T
= 0, 1, 2, , 16
= 1 C
16
0
(0.3085)
0
(1 0.3085)
160
= 1 (1 0.3085)
16
= 1 0.6915
16
.
Resolucao alternativa: Considerando a notacao da alneas anteriores, e o facto dos acontecimentos
X
1
55,. . . , X
16
55 serem independentes
P(X
1
< 55 X
2
< 55 X
16
< 55) =
= 1 P(X
1
55 X
2
55 X
16
55)
= 1 P(X
1
55)P(X
2
55) P(X
16
55)
= 1 0.6915
16
.
Exerccio 14: A resistencia real de cada uma das resistencias produzidas por certa maquina, e
uma v.a.r. X com distribuicao normal de media 1000 (Ohms) e variancia 100
2
. Admita a
independencia da resistencia real das resistencias produzidas pela maquina.
(a) Qual a probabilidade da resistencia real de uma resistencia produzida pela maquina ser
superior a 1020 ? E de ser exactamente 1020 ?
(b) O fabricante ganha 20 euros com a venda de cada resistencia produzida cujo valor da re-
sistencia real difere da media menos de 20 perdendo 10 euros no caso contrario. Determine
a funcao de probabilidade e o valor medio do lucro obtido pelo fabricante com a venda de uma
resistencia.
(c) Resistencias dessas sao sucessivamente escolhidas `a sorte e sao medidas. Qual a probabilidade
de se terem de medir 4 resistencias para se encontrar pela primeira vez uma com um valor superior
a 1020 ?
Resolucao: (a) Seja a v.a.r. X = valor real, em Ohms, de uma resistencia produzida por
94
certa maquina. Tem-se que X N(, ) onde = E(X) = 1000 e =
_
V (X) = 10. Como
X N(1000, 10) = Z =
X 1000
10
N(0, 1)
tem-se entao
P(X > 1020) = P
_
X 1000
10
>
1020 1000
10
_
= P(Z > 2)
= 1 P(Z 2) = 1 F
Z
(2) = 1 0.9772 = 0.0228.
Dado que X e uma v.a.r contnua, a probabilidade associada a qualquer ponto e nula, i.e.,
P(X = 1020) = 0.
(b) Seja a v.a.r. L = lucro obtido pelo fabricante com a venda de uma resistencia, em euros.
1. Sabemos que
[X 1000[ < 20 = L = 20
caso contrario = L = 10
Como o fabricante tem apenas 2 lucros possveis com a venda de uma resistencia, nomeadamente,
L = 20 euros e L = 10 euros, L e uma v.a.r. discreta de suporte S
L
= 10, 20.
2. Calculemos entao P(X = a), a S
L
. Tem-se entao
P(L = 20) = P ([X 1000[ < 20) = P (20 < X 1000 < 20)
= P
_

20
10
<
X 1000
10
<
20
10
_
= P(2 < Z < 2)
= F
Z
(2) F
Z
(2) = 0.9772 (1 F
Z
(2)), pela simetria da lei N(0, 1)
= 0.9772 1 + 0.9772 = 0.9544
e
P(L = 10) = P ([X 1000[ 20) = 1 P ([X 1000[ < 20) = 1 0.9544 = 0.0456,
com P(L = 20) +P(L = 10) = 1. Assim, a funcao de probabilidade de L, f
L
: R [0, 1], e
f
L
(l) =
_

_
0.0456 , l = 10
0.9544 , l = 20
0 , l / 10, 20
.
95
Dado que L e uma v.a.r. discreta, entao o valor medio do lucro obtido pelo fabricante com a
venda de uma resistencia e
E(L) =

l{10,20}
l f
L
(l) = 10 f
L
(10) + 20 f
L
(20)
= 10 0.0456 + 20 0.9544 = 18.632.
(c) Consideremos a e.a.
= escolha ao acaso de uma resistencia e registo da ocorrencia ou nao do acontecimento A
onde
A = a resistencia tem um valor superior a 1020 = X > 1020.
Seja a v.a.r.
Y = n umero de resistencias escolhidas ate que A ocorra pela 1
a
vez.
Uma vez que P(A) = 0.0228 se mantem constante nas diversas repeticoes de , tem-se que
Y G(p), com p = P(A) = 0.0228.
Assim, Y tem funcao de probabilidade, f
Y
: R [0, 1], tal que
f
Y
(y) =
_
_
_
(1 0.0228)
y1
0.0228 , y N
0 , y / N
,
pelo que,
P(Y = 4) = (1 0.0228)
3
0.0228 = 0.0213.
Resolucao alternativa: Consideremos os acontecimentos
A
i
= a resistencia i tem um valor superior a 1020 , i = 1, ..., 4,
para os quais P(A
i
) = P(A) = 0.0228 e P(A
i
) = P(A) = 1 0.0228, i = 1, 2, 3, 4.
Entao, a probabilidade de se terem de medir 4 resistencias para se encontrar pela 1
a
vez uma
vericando A e
P(A
1
A
2
A
3
A
4
) = P(A
1
)P(A
2
)P(A
3
)P(A
4
) pois os ac. sao independentes
= P(A)P(A)P(A)P(A) = (1 0.0228)
3
0.0228 = 0.0213.
Exerccio 15: O diametro interior, emcm, de um tubo cilndrico e uma v.a.r. X com distribuicao
normal de media m cm e desvio padrao 0.02 cm e a espessura do mesmo tubo e uma v.a.r. Y
com distribuicao normal de media 0.3 cm e desvio padrao cm, independente de X.
96
(a) Mostre que m = 3 e = 0.05 sabendo que P(X > 2.972) = 0.9192 e P(Y < 0.322) = 0.67.
(b) Calcule E(V (X) + (Y + 1)
2
).
(c) Determine o valor medio e o desvio padrao do diametro exterior do tubo.
(d) Qual a probabilidade de que o diametro exterior do tubo seja pelo menos 3.62 cm?
Resolucao: (a) Comecemos por provar que m = 3. Seja a v.a.r. X = diametro interior de um
tubo cilndrico, em cm. Tem-se que X N(m, 0.02) e P(X > 2.972) = 0.9192. Assim, como
X N(m, 0.02) = Z =
X m
0.02
N(0, 1),
tem-se,
P(X > 2.972) = 0.9192 P
_
X m
0.02
>
2.972 m
0.02
_
= 0.9192
P
_
Z >
2.972 m
0.02
_
= 0.9192
1 P
_
Z
2.972 m
0.02
_
= 0.9192
F
Z
_
2.972 m
0.02
_
= 0.0808.
Ora, valores de funcao de reparticao da lei normal inferiores a 0.5 nao estao tabelados. De facto,
F
Z
_
2.972 m
0.02
_
= 0.0808 < 0.5 = z =
2.972 m
0.02
< 0 = F
Z
(z) nao esta tabelado!
Contornamos este problema usando a simetria da lei N(0, 1), a qual garante que
F
Z
(z) = 1 F
Z
(z), z R.
Assim,
F
Z
_
2.972 m
0.02
_
= 0.0808 1 F
Z
_

2.972 m
0.02
_
= 0.0808
F
Z
_
m2.972
0.02
_
= 0.9192.
Consultando agora a tabela da lei N(0, 1), vericamos que o ponto z que tem probabilidade
0.9192 e o 1.40.
z 0.00 0.01
.
.
.
1.4 0.9192
.
.
.
97
Assim,
m2.972
0.02
= 1.40 m = 1.40 0.02 + 2.972 m = 3.
De modo an alogo, provemos, agora, que = 0.05. Seja a v.a.r. Y = espessura do mesmo tubo
cilndrico, em cm. Tem-se que Y N(0.3, ) e P(Y < 0.322) = 0.67. Como
Y N(0.3, ) = Z =
Y 0.3

N(0, 1)
tem-se,
P(Y < 0.322) = 0.67 P
_
Y 0.3

<
0.322 0.3

_
= 0.67
P
_
Z <
0.022

_
= 0.67 F
Z
_
0.022

_
= 0.67.
Consultando a tabela da lei N(0, 1) vericamos que o ponto z para o qual a funcao de reparticao
F
Z
tem imagem 0.67 e o 0.44.
z 0.00 0.04 0.05
.
.
.
0.4 0.6700
.
.
.
Logo
0.022

= 0.44 =
0.022
0.44
= 0.05.
(b) Para calcular E(V (X) + (Y + 1)
2
) vamos usar as propriedades do valor esperado. Como
desvio padrao de X e 0.02, entao V (X) = (0.02)
2
= 0.0004. Assim,
E(V (X) + (Y + 1)
2
) = E(0.0004 +Y
2
+ 2Y + 1) = 0.0004 +E(Y
2
) + 2E(Y ) + 1.
Sabemos que E(Y ) = 0.3 e V (Y ) = (0.05)
2
. Assim, como V (Y ) = E(Y
2
) [E(Y )]
2
, tem-se
(0.05)
2
= E(Y
2
) (0.3)
2
E(Y
2
) = (0.05)
2
+ (0.3)
2
= 0.0925.
Portanto
E(V (X) + (Y + 1)
2
) = 0.0004 + 0.0925 + 2 0.3 + 1 = 1.6929.
98
(c) Seja a v.a.r. T = diametro exterior do tubo cilndrico, em cm. Queremos determinar E(T)
e
T
=
_
V (T).
Notemos que a v.a.r. T pode ser construda `a custa das v.a.r. X e Y do seguinte modo:
T = X + 2Y.
Usando a linearidade do valor esperado temos que
E(T) = E(X + 2Y ) = E(X) + 2E(Y ) = 3 + 2 0.3 = 3.6.
Uma vez que as v.a.r. X e Y sao independentes, temos
V (T) = V (X + 2Y ) = V (X) + 2
2
V (Y ) = (0.02)
2
+ 4 (0.05)
2
= 0.0104.
Logo
T
=
_
V (T) =

0.0104 = 0.10198.
(d) Queremos calcular P(T 3.62). Para tal temos de conhecer a lei de T. Como X e Y sao
v.a.r. independentes, e tais que X N(3, 0.02) e Y N(0.3, 0.05) entao, pela estabilidade da
lei Normal,
T = X + 2Y N(E(T),
_
V (T)), i.e., T N(3.6, 0.10198).
Deste modo, como
T N(3.6, 0.10198) = Z =
T 3.6
0.10198
N(0, 1)
tem-se que
P(T 3.62) = P
_
T 3.6
0.10198

3.62 3.6
0.10198
_
= P(Z 0.1961)
= 1 P(Z < 0.1961) = 1 F
Z
(0.1961) = 1 F
Z
(0.20) = 1 0.5793 = 0.4207.
z 0.00 0.01
.
.
.
0.2 0.5793
.
.
.
99