Professional Documents
Culture Documents
Probabilidade e Estatística
Probabilidade e Estatística
Conceitos:
17 9 9 18 18
18 22 31 44 62
19 7 38 14 76
20 4 42 8 84
21 3 45 6 90
23 2 47 4 94
24 1 48 2 96
25 2 50 4 100
Total 50 100
• No caso da variável discreta assumir muitos
valores e no caso das variáveis contínuas, os
dados serão classificados em grupos,
possuindo diversos valores numa classe.
Exemplo:
ሾ44;52ሻ ≡ 44 |- 52 11 11 22 22 0,0275
ሾ52;60ሻ ≡ 52 |- 60 19 30 38 60 0,0475
60 |- 68 7 37 14 74 0,0175
68 |- 76 7 44 14 88 0,0175
76 |- 84 1 45 2 90 0,0025
84 |- 92 4 49 8 98 0,01
92 |- 100 1 50 2 100 0,0025
Total 50 100
Procedimento para construção de tabelas
- se 𝑛 ≤ 25 → 𝑘 = 5
- se 𝑛 > 25 → 𝑘 ≈ 𝑛
15
10 9
7
5 4
3
2 2
1
0
17 18 19 20 21 23 24 25
Idade
• Diagrama circular, disco ou pizza: Tipo de gráfico
muito utilizado para representação de variáveis
qualitativas.
2% 14%
Ruim
6%
Boa
Média
78% Não sabe
• Histograma: Este é um gráfico que parte de uma
tabela de frequência de dados agrupados.
𝑑1 = 0,22Τ8 = 0,0275.
0.04
0.03
Densidades
38%
0.02
22%
0.01
14% 14%
8%
0.00
2% 2%
44 52 60 68 76 84 92 100
Pesos (kg)
Medidas
Média
Moda
Medidas de
posição
Quartis
Medidas Separatrizes
Percentis
• Média amostral (𝑿 ഥ ): É um valor que representa o
centro de massa ou ponto de equilíbrio da
distribuição. É calculado por:
𝑋1 + 𝑋2 + ⋯ + 𝑋𝑛 σ𝑛𝑖=1 𝑋𝑖
𝑋ത = =
𝑛 𝑛
Média = 5,5
• Se os dados estiverem dispostos em tabela de
frequência como no exemplo abaixo,
Variável fi
X1 f1
X2 f2
... ...
... ...
Xk fk
Total n
fazemos:
𝑋1 𝑓1 + 𝑋2 𝑓2 + ⋯ + 𝑋𝑘 𝑓𝑘 σ𝑘𝑖=1 𝑋𝑖 𝑓𝑖
𝑋ത = =
𝑛 𝑛
X fi fr
1 3 0,3
2 4 0,4
3 2 0,2
5 1 0,1
Total 10 1
• Pelos dados brutos:
1 + 1 + 1 + 2 + 2 + 2 + 2 + 3 + 3 + 5 22
𝑋ത = = = 2,2
10 10
1. Ordenar os dados.
2. Localizar a posição central. Para isto calcula-se:
n +1
2
3. Se o número de observações (n) for ímpar, a
mediana será a observação central; e se n for par, a
mediana será a média entre as duas observações
centrais.
Exemplos:
1. {1; 1; 1; 2; 2; 3; 3; 3; 3 ;5};
1 1 1 2 2 3 3 3 3 5
2+3
𝑚𝑑 = = 2,5
2
b) quando n é ímpar: { 1; 1; 1; 3; 3; 4; 4; 5; 5}.
1 1 1 3 3 4 4 5 5
Neste caso, 𝑚𝑑 = 3.
• Exemplo 1: { 1; 1; 3; 3; 5; 3; 3; 2}.
17 9 9
18 22 31
19 7 38
20 4 42
21 3 45
22 0 45
23 2 47
24 1 48
25 2 50
Total 50
𝑚𝑜 = 18 anos
50 + 1
Posição da mediana : = 25,5
2
18+18
𝑚𝑑 = 2
= 18 anos
𝑋ത = 17 ∙ 9 + 18 ∙ 22 + 19 ∙ 7 + 20 ∙ 4 + 21 ∙ 3
+ 23 ∙ 2 + 24 ∙ 1 + 25 ∙ 2ሻ/50
𝑋ത = 18,9 anos
Percentil (Pα):
α% (100 - α)%
Pα
• A mediana é o percentil de ordem 50.
• Os percentis de ordem 25, 50 e 75 dividem o conjunto de
dados ordenados em 4 partes iguais e são chamados
respectivamente de 1º Quartil (Q1), 2º Quartil (Q2) e 3º
Quartil (Q3).
• Como calcular o percentil Pα para dados agrupados:
X
fraa %
α% frα %
(α - fraa) %
𝐻 𝑋
=
𝑓𝑟𝛼 𝛼 − 𝑓𝑟𝑎𝑎ሻ
lα Pα Lα
H
1. A partir da análise das frequências relativas
acumuladas, localizar a classe a qual pertence o
percentil Pα (lα |- Lα).
𝐿𝛼 − 𝑙𝛼 → 𝑓𝑟𝛼
𝑃𝛼 − 𝑙𝛼 → 𝛼 − 𝑓𝑟𝑎𝑎
𝐿𝛼 − 𝑙𝛼 ሻ 𝛼 − 𝑓𝑟𝑎𝑎
𝑃𝛼 = 𝑙𝛼 +
𝑓𝑟𝛼
Exemplo: As notas de 40 estudantes de uma classe estão
descritas a seguir. Encontre os três quartis.
Total 40 100
• 1º quartil (P25): Analisando as frequências
relativas acumuladas fornecidas na tabela de
frequências observa-se que 25% dos alunos
tiraram nota inferior à 3,0. Assim,
P25 = 3,0
• Mediana (P50):
3. 𝑓𝑟𝑎𝑎 = 0,425.
4. 𝛼 − 𝑓𝑟𝑎𝑎 = 0,5 − 0,425 = 0,075.
0,075 ሻ
5. 𝑃50 = 4,5 + 6,0 − 4,5ሻ 0,30
≅ 4,88
2. 𝑓𝑟75 = 0,2.
3. 𝑓𝑟𝑎𝑎 = 0,725.
- Aluno 2: 𝑅 = 81 − 38 = 43.
Variância amostral (𝑺𝟐 ):
σ𝑛
(𝑋
𝑖=1 𝑖 − ത
𝑋 )2
2
𝑆 =
𝑛−1
• Ou de forma equivalente:
𝑛 2
1 𝑛 σ 𝑋
𝑖=1 𝑖 ሻ
2
𝑆 = 𝑋𝑖2 −
𝑛−1 𝑖=1 𝑛
Ex: - Aluno 1:
𝑆 2 = ሾ 55 − 60 2
+ 57 − 60 2
+ 60 − 60 2
2
+ 62 − 60 + 66 − 60 2 ]/4
2
25 + 9 + 0 + 4 + 36 74
𝑆 = = = 18.5
4 4
Ex: - Aluno 2:
𝑆 2 = ሾ 38 − 60 2 + 49 − 60 2
+ 60 − 60 2
2
+ 72 − 60 + 81 − 60 2 ]/4
2
484 + 121 + 0 + 144 + 441 1190
𝑆 = = = 297.5
4 4
• Inconvenientes da variância:
σ𝑛𝑖=1 𝑋𝑖 − 𝑋ത 2
𝑆= 𝑆2 = ,
𝑛−1
que mostra a variabilidade medida na unidade original
da variável analisada.
ത × 100
Amostra – 𝐶𝑉 = 𝑆Τ𝑋ሻ
• O coeficiente de variação também pode ser utilizado
para medir o efeito da variação ou dispersão em
relação à média.
2,25
𝐶𝑉𝑝 = ∗ 100 = 2,5%
60
Variável fi
X1 f1
X2 f2
... ...
... ...
Xk fk
Total n
fazemos:
k
(X − X ) fi
2
= i =1
2 i
S
n −1
• Ou ainda,
1 k ( k
X i fi )
2
S =
2
n −1
i =1
X i fi −
2 i =1
n
Exemplo: Calcule a variância e o desvio padrão da variável
idade (em anos completos).
17 9 153 2601
18 22 396 7128
19 7 133 2527
20 4 80 1600
21 3 63 1323
23 2 46 1058
24 1 24 576
25 2 50 1250
Total 50 945 18063
Temos que: 𝑋ത = 18,9 anos
S =
2 1
−
(945 ) 202 ,5
2
= = 2
18063 4,13 anos
49 50 49
• Dessa forma,
𝐶𝑉 = 𝜎Τ𝜇ሻ × 100
3. Probabilidade
Conceitos iniciais
2. Ω = (0; ∞);
4. Ω = {1, 2, 3, 4, 5, 6}
• Evento: é qualquer subconjunto do espaço amostral
(Ω). São representados por letras maiúsculas do
alfabeto. Exemplos:
𝐴 ∪ 𝐵 = {1, 2, 3, 4, 6}
• Interseção de eventos ( 𝑨 ∩ 𝑩 ): representa a
ocorrência simultânea de A e B.
𝐴 ∩ 𝐵 = {2ሽ
• Eventos disjuntos ou mutuamente exclusivos: São
eventos que não podem ocorrer simultaneamente. A e B
são disjuntos se e somente se 𝐴 ∩ 𝐵 = ∅.
Ω
• No lançamento de um dado, se A é o evento
“ocorrer face par”, então o evento complementar de
A é o evento “ocorrer face ímpar”.
A = {2, 4, 6ሽ e Aሜ = {1 , 3 , 5ሽ
𝐴 ∪ 𝐵ሻ = 𝐴 ∩ 𝐵ത e 𝐴 ∩ 𝐵ሻ = 𝐴 ∪ 𝐵ത
Definição de probabilidade
• Para 𝐴 ⊂ Ω defini-se:
# 𝑒𝑙𝑒𝑚𝑒𝑛𝑡𝑜𝑠 𝑑𝑒 𝐴 𝑛 𝐴ሻ
𝑃 𝐴 = =
# 𝑒𝑙𝑒𝑚𝑒𝑛𝑡𝑜𝑠 𝑑𝑒 Ω 𝑛 Ωሻ
A = extrair um ás de um baralho.
n(A) = 4; n(Ω) = 52
4 1
𝑃 𝐴 = = ≅ 0,08
52 13
2. Experimento: lançar duas moedas e observar a
configuração obtida. c = cara; k = coroa.
1. P Ω = 1.
2. P ∅ = 0.
4. 𝑃 𝐴 ∪ 𝐵 = 𝑃 𝐴 + 𝑃 𝐵 − 𝑃 𝐴 ∩ 𝐵
Sexo
Curso Total
Homens (H) Mulheres (M)
110 30 140
𝑃 𝑃∪𝐸 =𝑃 𝑃 +𝑃 𝐸 = + = = 0,7
200 200 200
𝑃 𝐴 ∪ 𝑀 = 𝑃 𝐴 + 𝑃 𝑀 − 𝑃 𝐴 ∩ 𝑀ሻ
30 85 15 100
= + − = = 0,5
200 200 200 200
30 170
𝑃 𝐶 =1−𝑃 𝐶 =1− = = 0,85
200 200
Probabilidade condicional
𝑃 𝐴 ∩ 𝐵ሻ
𝑃 𝐴𝐵 = 𝑝𝑎𝑟𝑎 𝑃 𝐵ሻ ≠ 0
𝑃 𝐵ሻ
• A probabilidade condicional de A dado B revela a
incerteza que se tem sobre o evento A supondo
conhecida a verdade sobre o evento B. Podemos
interpretá-la como a chance relativa de A restrita ao
fato de que B ocorreu.
Exemplos:
𝑃 𝑀 ∩ 𝐵ሻ 0,3
𝑃 𝑀|𝐵 = = = 0,75
𝑃 𝐵ሻ 0,4
𝑃 𝐴 ∪ 𝐿ሻ ∩ 𝐶ሻ
• 𝑃 𝐴∪𝐿 𝐶 =
𝑃 𝐶ሻ
1. 𝑃 Ω|𝐶 = 1
2. 𝑃 ∅|𝐶 = 0
6. 𝑃 𝐴|𝐵 = 1 − 𝑃 𝐴|𝐵ሻ
Regra da multiplicação
𝑃 𝐴 ∩ 𝐵 = 𝑃 𝐴 𝐵 𝑃 𝐵 = 𝑃 𝐵 𝐴 𝑃 𝐴ሻ
• Exemplo 1: Acredita-se que na população do ES 20%
de seus habitantes sofrem algum tipo de alergia,
sendo classificados como alérgicos (A) para fins de
saúde pública. Sendo alérgico, a probabilidade de ter
reação a certo antibiótico (B) é de 0,5. Para os não
alérgicos esta probabilidade é de apenas 0,05.
Escolhendo-se uma pessoa ao acaso da população do
ES, qual a probabilidade de que ela:
a. Seja do grupo dos alérgicos e tenha alergia ao
ingerir o antibiótico?
𝑃 𝐴 ∩ 𝐵 = 𝑃 𝐵 𝐴 𝑃 𝐴 = 0,5 × 0,2 = 0,10
𝑃 𝐴 ∩ 𝐵ത = 𝑃 𝐵ത 𝐴 𝑃 𝐴
= 1−𝑃 𝐵 𝐴 1−𝑃 𝐴
= 1 − 0,05 1 − 0,2
= 0,95 × 0,8 = 0,76
Exemplo 2: Considere uma urna contendo três bolas
pretas (P) e cinco bolas vermelhas (V).
3 2 6
𝑃 𝑃𝑃 = 𝑃 𝑃1 ∙ 𝑃 𝑃2 |𝑃1 = ∙ =
8 7 56
5 4 20
𝑃 𝑉𝑉 = 𝑃 𝑉1 ∙ 𝑃 𝑉2 |𝑉1 = ∙ =
8 7 56
6 20 26
𝑃 𝑃𝑃 ∪ 𝑉𝑉 = + = = 0,46
56 56 56
b. Ω = 𝑃𝑃𝑃; 𝑃𝑃𝑉; 𝑃𝑉𝑃; 𝑉𝑃𝑃; 𝑉𝑉𝑃; 𝑉𝑃𝑉; 𝑃𝑉𝑉; 𝑉𝑉𝑉
3 2 5 30
𝑃 𝑃𝑃𝑉 = 𝑃 𝑃1 ∙ 𝑃 𝑃2 |𝑃1 ∙ 𝑃 𝑉3 |𝑃1 ∩ 𝑃2 = ∙ ∙ =
8 7 6 336
3 5 2 30
𝑃 𝑃𝑉𝑃 = 𝑃 𝑃1 ∙ 𝑃 𝑉2 |𝑃1 ∙ 𝑃 𝑃3 |𝑃1 ∩ 𝑉2 = ∙ ∙ =
8 7 6 336
5 3 2 30
𝑃 𝑉𝑃𝑃 = 𝑃 𝑉1 ∙ 𝑃 𝑃2 |𝑉1 ∙ 𝑃 𝑃3|𝑉1 ∩ 𝑃2 = ∙ ∙ =
8 7 6 336
30
𝑃 𝑃𝑃𝑉 ∪ 𝑃𝑉𝑃 ∪ 𝑉𝑃𝑃 = 3 × = 0,268
336
n!
Pn
n1 ,, nk
=
n1! nk !
Independência
• Definição: Dois eventos A e B são independentes se a
ocorrência de um não afeta a probabilidade de
ocorrência do outro. Assim, tem-se que:
P AB =P A e P B A = P Bሻ
𝑃 𝐴 ∩ 𝐵 = 𝑃 𝐴ሻ × 𝑃 𝐵ሻ
Exemplos:
P( F ) = P( A1 A2 ) = P( A1 ) + P( A2 ) − P( A1 A2 ) = p1 + p2 − p1 p2
3. Sejam A e B dois eventos mutuamente exclusivos com
P(A) > 0. Por exemplo, para um automóvel escolhido
aleatoriamente, seja A = {o carro possui um motor de 4
cilindros} e B = {o carro possui um motor de 6 cilindros}.
Como 𝐴 ∩ 𝐵 = ∅, se B ocorrer, A necessariamente não
pode ocorrer, de forma que
𝑃 𝐴 𝐵 = 0 ≠ 𝑃 𝐴ሻ
A mensagem aqui é: se dois eventos forem mutuamente
exclusivos, não podem ser independentes. Quando A e B
são mutuamente exclusivos, a informação da ocorrência
de A indica algo sobre B (não pode ter ocorrido), de
forma que a independência é excluída.
Regra da probabilidade total
• A regra da multiplicação é útil para determinarmos a
probabilidade de um evento que depende de outros
eventos.
ራ 𝐴𝑖 = Ω 𝑒 𝐴𝑖 ∩ 𝐴𝑗 = ∅ 𝑝𝑎𝑟𝑎 𝑖 ≠ 𝑗
𝑖=1
𝑃 𝐵ሻ = 𝑃 𝐵 𝐴1 𝑃 𝐴1 + 𝑃 𝐵 𝐴2 𝑃 𝐴2 + ⋯ + 𝑃 𝐵 𝐴𝑛 𝑃 𝐴𝑛
𝑛
𝑃 𝐵ሻ = 𝑃 𝐵 𝐴𝑖 𝑃 𝐴𝑖
𝑖=1
• Exemplo 2: Suponha que um fabricante de sorvetes
recebe 20% de todo o leite que consome da fazenda F1,
30% da fazenda F2 e o restante da F3.
𝑃 𝐴 = 𝑃 𝐴 ∩ 𝐹1 + 𝑃 𝐴 ∩ 𝐹2 + 𝑃 𝐴 ∩ 𝐹3
𝑃 𝐴ሻ = 𝑃 𝐴 𝐹1 𝑃 𝐹1 + 𝑃 𝐴 𝐹2 𝑃 𝐹2 + 𝑃 𝐴 𝐹3 𝑃 𝐹3
𝑃 𝐹1 ∩ 𝐴ሻ
𝑃 𝐹1 𝐴 =
𝑃 𝐴ሻ
𝑃 𝐴 𝐹1 𝑃 𝐹1 ሻ
𝑃 𝐹1 𝐴 =
𝑃 𝐴 𝐹1 𝑃 𝐹1 + 𝑃 𝐴 𝐹2 𝑃 𝐹2 + 𝑃 𝐴 𝐹3 𝑃 𝐹3
0,2 × 0,2
𝑃 𝐹1 𝐴 = ≅ 0,615
0,065
4. Variáveis Aleatórias
1; 1 … 1; 6
Ω= ⋮ ⋱ ⋮
6; 1 … 6; 6
Classificação:
X 𝑥1 𝑥2 𝑥3 ...
𝑝𝑖 𝑝1 𝑝2 𝑝3 ...
𝑋 2 3 4 5 6 7 8 9 10 11 12
𝑃 𝑋 = 𝑥ሻ 136 2 36 3 36 4 36 5 36 6 36 5 36 4 36 3 36 2 36 136
• Exemplo 3: Considere uma v.a. discreta X com função de
probabilidade dada abaixo. Encontre a constante k que
faz de 𝑃 𝑋 = 𝑥 uma f.p.
5
5! 1
𝑃 𝑋=𝑥 = , 𝑥 = 0 , 1, 2, 3, 4, 5
𝑥! 5 − 𝑥 ! 𝑘
5
1
1 + 5 + 10 + 10 + 5 + 1 = 1
𝑘
5
1 1 1 5 1 1 1
= → = 5 → =
𝑘 32 𝑘 2 𝑘 2
∴𝑘=2
Fábrica A Fábrica B
Componente
(cilindro) (esfera)
Dentro das especificações - bom (B) 0,80 0,70
Maior que as especificações - longo (L) 0,10 0,20
Menor que as especificações - Curto (C) 0,10 0,10
• O preço de cada componente, cilindro ou esfera, é de R$
5,00.
X P(x)
-5 0,19
5 0,02
10 0,23
15 0,56
Total 1
Média, variância e desvio padrão de uma
variável aleatória discreta
• A média ou valor esperado de uma v.a. discreta X é dada
por:
𝜇=𝐸 𝑋 = 𝑥𝑖 𝑝𝑖
𝑖
𝜎2 = 𝑉 𝑋 = 𝑥𝑖 − 𝜇 2 𝑝𝑖 = 𝑥𝑖2 𝑝𝑖 − 𝜇2
𝑖 𝑖
𝜎 = 𝐷𝑃 𝑋ሻ = 𝜎2
• Exemplo: Para o último exemplo, tem-se que o lucro
esperado por unidade montada é igual a:
𝜇 = 𝐸 𝑋ሻ = −5ሻ ⋅ 0,19 + 5 ⋅ 0,02 + 10 ⋅ 0,23 + 15 ⋅ 0,56 = 9,85.
Distribuição Bernoulli
Muitos experimentos são tais que os resultados
apresentam ou não uma determinada característica.
Por exemplo:
• Notação: X ~ Bernoulli(p)
• A função de probabilidade de X é:
𝑃 𝑋 = 𝑥 = 𝑝𝑥 1 − 𝑝 1−𝑥
, 𝑥 = 0 𝑜𝑢 1
• Assim temos:
1
𝐸 𝑋 = 𝑥𝑃 𝑋 = 𝑥 = 𝑃 𝑋 = 1 = 𝑝
𝑥=0
𝑉 𝑋 = σ1𝑥=0 𝑥 2 𝑃 𝑋 = 𝑥 − 𝐸 𝑋 2
𝑉 𝑋 = 12 𝑃 𝑋 = 1 − 𝑝2 = 𝑝 − 𝑝2 = 𝑝 1 − 𝑝ሻ
Distribuição Binomial
• Se realizarmos n experimentos de Bernoulli de forma
independente e se cada experimento tem
probabilidade de sucesso igual a p (fixo), então a
variável aleatória que conta o número de sucessos
nestes n experimentos tem distribuição binomial. Por
exemplo:
𝑠𝑢𝑐𝑒𝑠𝑠𝑜 → 𝑝
𝐸 = ቊ𝑓𝑟𝑎𝑐𝑎𝑠𝑠𝑜 → 1 − 𝑝
k n-k
𝑛 𝑥
𝑃 𝑋 = 𝑥ሻ = 𝑝 (1 − 𝑝)𝑛−𝑥 , 𝑥 = 0, 1, 2, ⋯ , 𝑛.
𝑥
• Notação X~Binomial(n; p)
Exemplos:
4!
𝑃 𝑋=3 = × 0,008 × 0,8 ≅ 0,026
3! 4 − 3 !
𝑃 𝑋 ≥2 = 1−𝑃 𝑋 < 2
𝑃 𝑋 <2 =𝑃 𝑋 =0 +𝑃 𝑋=1
30 0 30
30 1 29
𝑃 𝑋<2 = 0,06 0,94 + 0,06 0,94
0 1
∴ 𝑃 𝑋 ≥ 2 = 1 − 0,455469 ≅ 0,545
• Média e variância de uma distribuição binomial:
𝐸 𝑋 = 𝑛𝑝 e 𝑉𝑎𝑟 𝑋 = 𝑛𝑝 1 − 𝑝ሻ
𝐷𝑃 𝑋 = 1,692 = 1,3
• As figuras a seguir mostram exemplos de distribuições
binomiais. Para n fixo (no exemplo n = 20) à medida que
p aumenta de 0 a 0,5 a distribuição se torna mais
simétrica. O mesmo acontece se p diminui de 1 a 0,5.
Distribuição de Poisson
• É útil para descrever as probabilidades do número de
ocorrências num campo ou intervalo contínuo (em geral
tempo ou espaço). Por exemplo, a v.a. de interesse pode ser:
– Nº de peças defeituosas substituídas num veículo durante o
primeiro ano de vida;
– Nº de erros tipográficos por página, em um material
impresso;
– Nº de acidentes por mês, em determinada rodovia;
– Número de clientes que chegam ao caixa de um
supermercado por hora;
• A utilização da distribuição de Poisson baseia-se nas
seguintes hipóteses:
𝑒 −𝜆 ∙ 𝜆𝑥
𝑃 𝑋=𝑥 =
𝑥!
Onde,
𝐸 𝑋ሻ = 𝜆
𝑉 𝑋ሻ = 𝜆
Exemplos:
• Portanto,
𝑒 −2 ∙ 21
𝑃 𝑌 = 1ሻ = = 0,2707
1!
𝜆 = 6 ∗ 0,2 = 1,2
𝑃 𝑋 ≥2 =1−𝑃 𝑋<2
=1− 𝑃 𝑋 =0 +𝑃 𝑋 =1
a b x
𝑃 𝑎 ≤ 𝑋 ≤ 𝑏 = á𝑟𝑒𝑎 ℎ𝑎𝑐ℎ𝑢𝑟𝑎𝑑𝑎
• Para que uma função 𝑓 𝑥 seja uma f.d.p., ela deve
satisfazer as seguintes propriedades:
𝑃 𝑋 = 𝑥 = 𝑃 𝑥 = 0, ∀𝑥
• Dessa forma, em se tratando de v.a. contínuas, a
probabilidade de ocorrência de um valor específico é
sempre igual a zero.
1 𝑐
+ 𝑘 , se 0 < c ≤ 20
𝑓 𝑐ሻ = ൞40 10
0, caso contrário
• Determine o valor da k tal que 𝑓 𝑐ሻ seja, de fato,
uma f.d.p.
20
1 𝑐
න + 𝑘 𝑑𝑐 = 1
0 40 10
20 20
𝑐 𝑘
න 𝑑𝑐 + න 𝑑𝑐 = 1
0 400 0 40
20 20
2
𝑐 𝑘𝑐
อ + ቤ = 0,5 + 0,5𝑘 = 1
800 40 0
0
∴𝑘=1
• Calcule a probabilidade de um fóssil, escolhido ao
acaso nessa região, apresentar comprimento
inferior a 8 cm.
8
1 𝑐
𝑃 𝐶<8 =න + 1 𝑑𝑐
0 40 10
8 8
𝑐 1
=න 𝑑𝑐 + න 𝑑𝑐
0 400 0 40
8
2
𝑐 𝑐 8
= อ + ฬ = 0,08 + 0,2 = 0,28
800 40 0
0
• Determine o valor k tal que 𝑃 𝐶 > 𝑘 = 0,8, ou seja,
de tal forma que a área definida por f(c) à direita de K
seja igual a 0,8.
20
1 𝑐
𝑃 𝐶>𝑘 =න + 1 𝑑𝑐
𝑘 40 10
20 20
𝑐 1
=න 𝑑𝑐 + න 𝑑𝑐
𝑘 400 𝑘 40
20
2
𝑐 𝑐 20 𝑘2 𝑘
= อ + ฬ = 0,5 − + 0,5 − = 0,8
800 40 𝑘 800 40
𝑘
𝑘 2 + 20𝑘 − 160 = 0
− b b − 4ac − 20 32,25
2
k= =
2a 2
k1 = 6,125 e k 2 = −26,125
k = 6,125 cm
Média, variância e desvio padrão de uma
variável aleatória contínua
• A média ou valor esperado de uma variável aleatória
discreta X é dada pela expressão:
𝜇 = 𝐸 𝑋ሻ = න𝑥 𝑓 𝑥ሻ 𝑑𝑥
𝜎 2 = 𝑉 𝑋ሻ = න 𝑥 − 𝜇ሻ2 𝑓 𝑥ሻ 𝑑𝑥 = න𝑥 2 𝑓 𝑥ሻ 𝑑𝑥 − 𝜇2
𝜎= 𝜎2
Exemplo: O tempo em minutos de digitação de um
texto por datilógrafos experientes (T) é considerado
uma v.a. contínua com f.d.p. apresentada a seguir.
Determine:
1Τ4 , 𝑠𝑒 0 ≤ 𝑡 < 2
𝑓 𝑡 = ቐ1Τ8 , 𝑠𝑒 2 ≤ 𝑡 < 6
0, 𝑐. 𝑐.
a) P 1 < T < 4 T > 1ሻ.
2 4 2 4
1 1 𝑡 𝑡
P 1<T<4 =න 𝑑𝑡 + න 𝑑𝑡 = ቤ + ቤ
1 4 2 8 41 82
2 1 4 2 4
= − + − = = 0,5
4 4 8 8 8
2 6 2 6
1 1 𝑡 𝑡
P T>1 =න 𝑑𝑡 + න 𝑑𝑡 = ቤ + ቤ
1 4 2 8 41 82
2 1 6 2 6
= − + − = = 0,75
4 4 8 8 8
0,5
∴ P 1 < T < 4 T > 1ሻ = = 0,66
0,75
2 6 2 6
1 1 𝑡 𝑡
P T>𝑘 =න 𝑑𝑡 + න 𝑑𝑡 = ቤ + ቤ = 0,6
𝑘 4 2 8 4𝑘 82
2 𝑘 6 2 𝑘
− + − = 1 − = 0,6
4 4 8 8 4
∴ 𝑘 = 1,6
2 6
𝑡2 𝑡2
4 36 4 5
= อ + อ = + − = = 2,5 min
8 16 8 16 16 2
0 2
6 2 6
2 2
1 2
1
න 𝑡 𝑓 tሻ𝑑𝑡 = න 𝑡 𝑑𝑡 + න 𝑡 𝑑𝑡
0 0 4 2 8
2 6
𝑡3 𝑡3
8 216 8 28
= อ + อ = + − =
12 24 12 24 24 3
0 2
2
28 5
𝜎2 = − = 3,08 𝑚𝑖𝑛2
3 2
Distribuição Uniforme
1
𝑓 𝑥 = ቐ2 , 𝑠𝑒 50 ≤ 𝑥 ≤ 52
0, 𝑐𝑎𝑠𝑜 𝑐𝑜𝑛𝑡𝑟á𝑟𝑖𝑜
a) Calcule a probabilidade de uma aula durar mais de 51,5
minutos.
𝑃 𝑋 > 51,5 = á𝑟𝑒𝑎 𝑑𝑎 𝑟𝑒𝑔𝑖ã𝑜 𝑠𝑜𝑚𝑏𝑟𝑒𝑎𝑑𝑎
𝑃 𝑋 > 51,5 = 0,5 × 0,5 = 0,25
b) Calcule a média e o desvio padrão do tempo de
aula.
52 + 50
𝐸 𝑋 = = 51 𝑚𝑖𝑛
2
52 − 50ሻ2 4
𝑉 𝑋 = = ≅ 0,333 𝑚𝑖𝑛2
12 12
𝐷𝑃 𝑋 = 0,333 ≅ 0,578 𝑚𝑖𝑛
Distribuição Exponencial
• Uma v.a. contínua X, assumindo valores não negativos,
segue o modelo Exponencial com parâmetro 𝛼 > 0 se
sua densidade é dada por:
𝛼𝑒 −𝛼𝑥 , 𝑠𝑒 𝑥 ≥ 0
𝑓 𝑥 =ቊ
0, 𝑐𝑎𝑠𝑜 𝑐𝑜𝑛𝑡𝑟á𝑟𝑖𝑜
Notação: X ~ Exp(α).
• Para calcular probabilidades com a exponencial,
precisamos resolver a integral correspondente ao
intervalo de interesse. Assim,
𝑏 𝑏
𝑃 𝑎 ≤ 𝑋 ≤ 𝑏 = න 𝛼𝑒 −𝛼𝑥 𝑑𝑥 = − 𝑒 −𝛼𝑥 ቚ = 𝑒 −𝛼𝑎 − 𝑒 −𝛼𝑏
𝑎 𝑎
𝐸 𝑋 = 1Τ𝛼 e 𝑉 𝑋 = 1Τ𝛼 2
1 −t
𝑓 𝑡 = ቐ 8000 𝑒 8000 , 𝑠𝑒 𝑡 ≥ 0
0, 𝑐𝑎𝑠𝑜 𝑐𝑜𝑛𝑡𝑟á𝑟𝑖𝑜
∞
1 −𝑡
𝑃 𝑇 > 2000 = න 𝑒 8000 𝑑𝑡
2000 8000
−𝑡 −1
𝑢= ⟹ 𝑑𝑢 = 𝑑𝑡
8000 8000
∞
−𝑡
𝑃 𝑇 > 2000 = −𝑒 8000 ቚ2000
−𝑘 −𝑘
𝑒 8000 = 1 − 0,005 → = ln 0,995
8000
∴ 𝑘 ≈ 40 ℎ𝑜𝑟𝑎𝑠
Distribuição Normal
• Dizemos que uma variável aleatória contínua X tem
distribuição Normal com parâmetros e 2, se sua
função densidade de probabilidade é dada por:
1 1 2
𝑓 𝑥 = 𝑒𝑥𝑝 − 2 𝑥 − 𝜇 , −∞ < 𝑥 < ∞
𝜎 2𝜋 2𝜎
x
µ
• Notação: X ~ N(𝜇, 𝜎 2).
• Propriedades da Normal:
1. 𝑓 𝑥 é simétrica em relação a .
2. 𝑓 𝑥 → 0 quando 𝑥 → ±∞.
0.6
N(0; 1) N(2; 1)
f(x)
0.4
0.2
N(6; 2)
0.0
-4 -2 0 2 4 6 8 10 12
x
• Como calcular Probabilidades para distribuição
Normal?
z
• Exemplo 1: Uma empresa de instrumentos científicos de
precisão fabrica termômetros que devem informar
temperaturas de 0°C no ponto de congelamento da água.
Testes em uma grande amostra desses instrumentos
revelam que, no ponto de congelamento da água, alguns
termômetros indicam temperaturas superiores ou
inferiores a 0°C.
0 1,58
b) Superior a -1,23°C.
𝑃 𝑍 > −1,23
= 1 − 𝑃 𝑍 ≤ −1,23
= 1 − 0,1093 = 0,8907
-1,23 0
c) Entre -2,00°C e 1,50°C.
95%
P95
• Procurando a área mais próxima de 0,95 no corpo da
tabela de probabilidades da Normal Padrão, observamos
que a área de 0,95 está exatamente entre as áreas
0,9495 e 0,9505.
80%
20%
c 0
𝑐 = −0,84 °𝐶
Como calcular probabilidades para uma N(μ,σ2)?
𝑋−𝜇
𝑍=
𝜎
• Resultado Importante:
𝑋−𝜇
Se X~N 𝜇, 𝜎 2 ሻ, então, 𝑍 = ~ 𝑁 0, 1ሻ
𝜎
𝑥−𝜇
∴𝑃 𝑋≤𝑥 =𝑃 𝑍≤
𝜎
X ~ N(𝜇, 𝜎 2 ) 𝑍~ 𝑁 0, 1ሻ
𝜇 𝑥 0 𝑥−𝜇
𝜎
• Exemplo 4: Pessoas sofrendo de certa doença são
submetidas a um tratamento intensivo cujo tempo de cura
(X), em dias, foi modelado por uma densidade N(15, 4).
Calcule a probabilidade do tempo de cura:
X ~ N(15, 4) 𝑍~ 𝑁 0, 1ሻ
15 20 20 − 15
0
2
20−15
𝑃 𝑋 < 20 = 𝑃 𝑍 < 2
= 𝑃 𝑍 < 2,5 = 0,9938
15 17 0 1
17 − 15
𝑃 𝑋 > 17 = 𝑃 𝑍 > =𝑃 𝑍>1
2
𝑃 𝑋 > 17 = 1 − 𝑃 𝑍 ≤ 1 = 1 − 0,8413 = 0,1587
14 15 17 -0,5 0 1
14 − 15 17 − 15
𝑃 14 < 𝑋 < 17 = 𝑃 <𝑍<
2 2
𝑃 14 < 𝑋 < 17 = 𝑃 −0,5 < 𝑍 < 1
𝑥 − 15
𝑃 𝑋≤𝑥 =𝑃 𝑍≤ = 0,40
2
40%
𝑥 15
Amostra
Amostragem
Inferência Estatística
Parâmetros Estatísticas
µ - média 𝑋ത - média
σ2 - variância S2 - variância
𝑝 - proporção 𝑝Ƹ - proporção
𝑀𝑑 - mediana
m𝑑 - mediana
• Todas as técnicas de Inferência apresentadas nesse
curso baseiam-se no uso do método de Amostragem
Aleatória Simples (AAS), com reposição, para
selecionar amostras representativas da população.
𝑋 1 3 5 7
𝑃 𝑋 = 𝑥ሻ 1/5 1/5 2/5 1/5
𝑋ത 1 2 3 4 5 6 7
𝑃 𝑋ത = 𝑥ሻ 1 25 2 25 5 25 6 25 6 25 4 25 1 25
• Onde,
𝜇𝑋ത = 𝐸 𝑋ത = 𝑥𝑖 𝑝𝑖 = 4,2
𝑖
𝑋ത − 𝜇
𝑍= ~𝑁 0, 1ሻ
𝜎Τ 𝑛
• Exemplo 1: Em uma certa cidade, a duração de conversas
telefônicas, originárias de telefones públicos, é uma
variável aleatória com média igual a 3 minutos e
variância igual a 9 (minutos)2. Observando-se uma
amostra aleatória de 50 dessas chamadas, qual será a
probabilidade delas, em média, não ultrapassarem 4
minutos?
3,5 − 4 3,8 − 4
𝑃 3,5 ≤ 𝑋ത ≤ 3,8 = 𝑃 ≤𝑍≤
1,5Τ5 1,5Τ5
= 𝑃 −1,67 ≤ 𝑍 ≤ −0,67
= P Z ≤ −0,67 − P Z ≤ −1,67ሻ
Definições:
Estimação Pontual
• Um único valor amostral é usado como estimativa de
um parâmetro da população. A seguir encontram-se
alguns exemplos de estimadores pontuais.
Parâmetro Estimador
𝑋1 + 𝑋2 + ⋯ + 𝑋𝑘
µ 𝜇Ƹ = 𝑋ത =
𝑛
σ𝑛
𝑖=1 (𝑋𝑖 − ത )2
𝑋
𝜎2 𝜎2 = 𝑆2 =
𝑛−1
𝜎 𝜎ො = 𝑆 = 𝑆2
Intervalos de Confiança
𝜎2
𝑋ത ~ N 𝜇, 𝑛
ത
𝑋−𝜇
ത temos que: Z =
• Padronizando a v.a. 𝑋,
𝜎Τ 𝑛
• Daqui podemos determinar qual a probabilidade de
cometermos erros de determinadas magnitudes.
𝑃 𝑋ሜ − 𝜇 < 𝐸 = 1 − 𝛼
𝑃 −𝐸 < 𝑋ሜ − 𝜇 < 𝐸 = 1 − 𝛼
𝐸 𝑛 𝑋ത − 𝜇 𝐸 𝑛
𝑃 − < < =1−𝛼
𝜎 𝜎Τ 𝑛 𝜎
𝑋ത − 𝜇
𝑃 −𝑧𝛼Τ2 < < 𝑧𝛼Τ2 = 1 − 𝛼
𝜎Τ 𝑛
𝜎 𝜎
𝑃 𝑋ሜ − 𝑧𝛼Τ2 < 𝜇 < 𝑋ሜ + 𝑧𝛼Τ2 =1−𝛼
𝑛 𝑛
1−𝛼
𝛼 Τ2 𝛼Τ2
−𝑧𝛼Τ2 0 𝑧𝛼Τ2
• Exemplo 1: Uma máquina enche pacotes de café segundo
uma distribuição Normal com variância igual a 100 g2. Ela
estava regulada para encher os pacotes com 500 g, em
média. Agora ela se desregulou e queremos saber qual é
a nova média µ. Uma amostra de 25 pacotes apresentou
uma média igual a 485 g. Construa um IC com 95% de
confiança para µ.
𝑛 = 25
Intervalos de Confiança para µ com
variância populacional desconhecida
• Considere uma AAS 𝑋1 , ⋯ , 𝑋𝑛 obtida de uma
população com distribuição Normal, com média e
variância 𝜎 2 desconhecidas. Desejamos construir um
IC para a média populacional.
Sim
Sim Utilizar a dist. Normal com
𝐸 = 𝑧𝛼Τ2 ∙ 𝜎Τ 𝑛.
𝜎é
conhecido?
Utilizar a dist. t-Student com
Não g.l = n – 1 e 𝐸 = 𝑡𝛼Τ2 ∙ 𝑆Τ 𝑛
• Exemplo 1: O tempo de reação de um novo
medicamento, em minutos, pode ser considerado
como tendo distribuição Normal. Vinte pacientes
foram sorteados e tiveram seu tempo de reação
anotado, os resultados obtidos são apresentados a
seguir. Determine um intervalo de 95% de confiança
para o tempo de reação médio desse novo
medicamento .
2.9 3.4 3.5 4.1 4.6 4.7 4.5 3.8 5.3 4.9
4.8 5.7 5.8 5.0 3.4 5.9 6.3 4.6 5.5 6.2
• Solução: Primeiramente determinamos os valores dos
estimadores de μ e σ.
σ 𝑋𝑖 94,9
𝑋ത = = = 4,48
𝑛 20
1 σ 𝑋𝑖 2
2 2
𝑆 = 𝑋𝑖 −
𝑛−1 𝑛
1 94,92
𝑆= 469,15 − = 0,996
19 20
1 − 𝛼 = 0,95
Para ቊ → 𝑡𝛼Τ2 = 2,093
𝑔. 𝑙. = 𝑛 − 1 = 19
𝑆 0,996
𝐼𝐶 𝜇; 0,95 = 𝑋ത ± 𝑡𝛼Τ2 ∙ = 4,48 ± 2,093
𝑛 20
𝑋ത = 26.227 e 𝑆 = 15.873
𝑆 15.873
𝐼𝐶 𝜇; 0,9 = 𝑋ത ± 𝑡𝛼Τ2 ∙ = 26.227 ± 1,796
𝑛 12
𝐻0 : 𝜇 = 𝜇0
𝐻1 : 𝜇 ≠ 𝜇0 → ℎ𝑖𝑝ó𝑡𝑒𝑠𝑒 𝑏𝑖𝑙𝑎𝑡𝑒𝑟𝑎𝑙
𝑉𝑠 ൞𝐻1 : 𝜇 > 𝜇0 → ℎ𝑖𝑝. 𝑢𝑛𝑖𝑙𝑎𝑡𝑒𝑟𝑎𝑙 à 𝑑𝑖𝑟𝑒𝑖𝑡𝑎
𝐻1 : 𝜇 < 𝜇0 → ℎ𝑖𝑝. 𝑢𝑛𝑖𝑙𝑎𝑡𝑒𝑟𝑎𝑙 à 𝑒𝑠𝑞𝑢𝑒𝑟𝑑𝑎
𝛼 = 𝑃 𝑟𝑒𝑗𝑒𝑖𝑡𝑎𝑟 𝐻0 𝐻0 é 𝑣𝑒𝑟𝑑𝑎𝑑𝑒𝑖𝑟𝑎
Sim
Sim Utilizar a dist. Normal com
𝜎é Z = 𝑋ത − 𝜇ሻ/ 𝜎Τ 𝑛ሻ.
conhecido?
Utilizar a dist. t-Student com n – 1
Não g.l. e T = 𝑋ത − 𝜇ሻ/ 𝑆Τ 𝑛ሻ.
Passo 3: Fixar 𝛼 (nível de significância) e obter a região
crítica (ou região de rejeição), de tal forma que:
𝛼 = 𝑃 𝑋ത ∈ 𝑅𝐶 𝐻0 é 𝑣𝑒𝑟𝑑𝑎𝑑𝑒𝑖𝑟𝑎
𝑥𝑐 𝜇0
𝑅𝐶 = 𝑥 ∈ ℝ| 𝑥 < 𝑥𝑐
• Para 𝐻1 : 𝜇 > 𝜇0 , temos que:
𝜇0 𝑥𝑐
𝑅𝐶 = 𝑥 ∈ ℝ| 𝑥 > 𝑥𝑐
• Para 𝐻1 : 𝜇 ≠ 𝜇0 , temos que:
H1 H0 H1
𝛼Τ2 𝛼Τ2
𝑥𝑐1 𝜇0 𝑥𝑐2
75,2 77,3 75,4 73,7 71,6 77,4 74,7 69,2 72,3 73,2
• Presuma que o desvio padrão seja o mesmo que antes do
ajuste. Podemos concluir que o ajuste mudou a
resistência à tração do aço? Adote um nível de
significância de 5%.
𝐻0 : 𝜇 = 73
• Passo 1: ቊ
𝐻1 : 𝜇 ≠ 73
𝑥𝑜𝑏𝑠 − 𝜇𝑠𝑜𝑏 𝐻0 74 − 73
𝑧𝑜𝑏𝑠 = 𝜎 = = 1,58
2
𝑛 10
𝑧𝑐1 0 𝑧𝑐2
𝛽 𝜇ሻ = 𝑃 𝑋ത ∈ 𝑅𝐴 𝐻0 é 𝑓𝑎𝑙𝑠𝑎
71,76 − 74 74,24 − 74
=𝑃 ≤𝑍≤
2Τ 10 2Τ 10
= 𝑃 −3,54 ≤ 𝑍 ≤ 0,38 = 0,648 − 0,0002 = 0,6478
448 − 450
𝛼∗ =𝑃 𝑍< = 𝑃 𝑍 < −1,79 = 0,0367
10Τ 80
𝛼 3,67%
3,67% 𝛼
𝐻0 : 𝜇 = 73
ቊ
𝐻1 : 𝜇 ≠ 73
ത
• Vimos que, sob 𝐻0 , 𝑋~𝑁 73; 4Τ10 . Colhida a amostra
obtivemos 𝑥𝑜𝑏𝑠 = 74. Dessa forma o p-valor é dado por:
74 − 73
𝛼∗ = 2 × 𝑃 𝑋ത > 74| 𝜇 = 73 = 2 × 𝑃 𝑍 >
2Τ 10
𝛼 ∗ = 2 × 𝑃 𝑍 > 1,58 = 2 × 1 − 𝑃 𝑍 ≤ 1,58
RC RC
• Exemplo 5: Um fabricante afirma que seus cigarros
contêm não mais que 30mg de nicotina. Suponha
que o nível de nicotina nos cigarros siga uma
distribuição Normal com média e variância
desconhecidas. Uma amostra de 25 cigarros fornece
média de 31,5mg e desvio padrão de 3mg. No nível
de 5%, os dados refutam ou não a afirmação do
fabricante?
𝐻0 : 𝜇 = 30
• Passo 1: ቊ
𝐻1 : 𝜇 > 30
5%
0 𝑡𝑐
• Consultando a tabela da t-Student, para g.l = 24 e
área nas duas caudas de 0,1, temos que
𝑡𝑐 = 1,711. Dessa forma,
𝑅𝐶 = 𝑡 ∈ ℝ| 𝑡 > 1,711 .
31,5 − 30
𝛼∗ =𝑃 𝑇> = 𝑃 𝑇 > 2,5
3Τ 25
1%
𝑡𝑐
0
• Consultando a tabela da t-Student, para g.l = 15 e
área nas duas caudas de 0,02, temos que
𝑡𝑐 = −2,602. Dessa forma,
𝑅𝐶 = 𝑡 ∈ ℝ| 𝑡 < −2,602 .
88 − 100
𝛼∗ =𝑃 𝑇< = 𝑃 𝑇 < −4
12Τ 16