Professional Documents
Culture Documents
1a NOTA DE AULA
1 Introdução à Estatística
Dentro dessa idéia, podemos considerar a Ciência Estatística como dividida basica-
mente em duas partes:
1
1.2 Estatística: Uma Visão Sistêmica
(Desenhar figura representando uma visão sistêmica da estatística)
2
A População pode ser:
Podemos citar como exemplo de população finita o conjunto formado pelos alunos
que cursam a disciplina de estatística num determinado semestre da UFCG. Um exemplo de
população infinita seria o conjunto formado por todos os alunos de estatística do Brasil,
pois este conjunto é composto por um número incontável de elementos.
Definição 1.4 (Parâmetro). é uma medida numérica que descreve uma característica
da população, ou ainda, que é obtida a partir de todos os dados populacionais (através
de um censo).
Definição 1.5 (Estatística). é uma medida numérica que descreve uma característica
da amostra, ou ainda, que é obtida a partir de dados amostrais (de uma parte da
população).
Exemplos de algumas medidas numéricas são: proporção, média, moda, índices, etc.
3
1.3.3 Variáveis (ou Dados) e Tipos de Variáveis
Definição 1.6 (Variável). Uma Variável nada mais é que uma característica (ou
dado) associada a cada elemento da população ou amostra. A variável apresenta dife-
rentes valores, quando sujeita a mensurações sucessivas, e, em geral, é denotada pelas
letras maiúsculas: X, Y ou Z.
Tipos de Variáveis
Basicamente, as variáveis podem ser classificadas como sendo Qualitativas ou Quan-
titativas.
1. Variáveis Qualitativas - quando os valores que elas podem receber são referentes
à qualidade, atributo ou categoria. Exemplos são:
2. Variáveis Quantitativas - quando os valores que ela pode assumir são numéricos,
os quais podem ser obtidos através de uma contagem ou mensuração.
As variáveis quantitativas podem ser classificadas de acordo com o processo de ob-
tenção; podendo ser: Discreta ou Contínua.
4
(b) As variáveis quantitativas contínuas - são variáveis numéricas cujos valores
são obtidos por um procedimento de mensuração, podendo assumir quaisquer
valores num intervalo dos números reais, como por exemplo, a temperatura,
altura, salário, etc..
Observação 1. O fato de uma variável poder ser expressa por números não significa
que ela seja necessariamente quantitativa, por que a classificação da variável depende
de como foi medida. Por exemplo, para a variável peso de um lutador de boxe, se
for anotado o peso marcado na balança, a variável é quantitativa contínua; por outro
lado, se esse peso for classificado segundo as categorias do boxe, a variável é qualitativa
ordinal.
5
1a LISTA DE EXERCÍCIOS
1 - Defina e/ou explique com suas próprias palavras, o que você entende por Ciência
Estatística e quais os principais ramos (partes) da Estatística.
1) Em uma pesquisa, feita pela EMPETUR com 1015 pousadas escolhidas aleato-
riamente, 269 (ou 26,5%) possuíam Home-page na Internet para divulgação e
prestação de serviços ao turista.
2) Outra pesquisa feita entre as 50 Agências de Viagens de uma certa localidade
mostra que 42 (ou 84%) prestam serviços pela Internet.
4 - O que você entende por variável? Justifique a sua resposta por intermédio de um
exemplo.
5 - Como você diferencia uma variável discreta de uma variável contínua? Utilize um
exemplo para melhor ilustrar.
6 - Defina e/ou explique com suas próprias palavras, o que você entende por amostragem.
9 - Para que uma amostra seja representativa, é necessário apenas que a mesma tenha
um tamanho apropriado? Justifique a sua resposta.
11 - Classifique cada uma das informações (variáveis) abaixo, de acordo com os tipos de
variáveis.
a) Nome b) Nível de satisfação
c) Idade d) Número de dias hospedado
6
UNIVERSIDADE FEDERAL DE CAMPINA GRANDE - Campus I
UNIDADE ACADÊMICA DE MATEMÁTICA E ESTATÍSTICA
Disciplina: Probabilidade e Estatística (6 créditos) Período 2009.2
Prof. Gilberto Matos e Areli Mesquita
Aluno(a): .
2a NOTA DE AULA
2.1 Introdução
A estatística pode ser considerada como um instrumento ou um conjunto de métodos
matemáticos que devem ser utilizados quando se pretende transformar dados em informação.
Para ilustrar este processo, veja a Figura 1:
12 15 18 Média
15 12 18 Moda
18 15 18 ⇒ Mediana
17 19 20 Proporção
Quantis
Conjunto de dados
Conjunto de informações
Figura 1:
No primeiro retângulo, tem-se um conjunto de observações da variável idade de um
grupo de 12 pessoas e, no segundo retângulo, as estatísticas (informações) que podem
representar esses números.
7
Desta maneira, fica fácil verificar a freqüência com que cada um dos dados foi obser-
vado, por exemplo: o valor 12 ocorreu 2 vezes; o valor 15 ocorreu 3 vezes, e assim por
diante.
Uma maneira adequada de apresentar os dados e suas respectivas freqüências é através
de uma Tabela de Freqüências, a qual é constituída por uma coluna referente aos
dados e outra referente às freqüências associadas a cada valor observado (ni ). Veja
como fica para o conjunto de dados da Figua 1:
8
forma, os pares (12, 2), (15, 3), (17, 1), (18, 4), (19, 1) e (20, 1) representam a distribuição
de freqüências da variável idade para esse grupo de pessoas.
Representação Gráfica
Neste gráfico, cada valor observado é representado por retângulos de mesma base
e alturas proporcionais às freqüências. Para ilustrar, veja como fica este gráfico para a
distribuição de freqüências da variável idade, utilizando a freqüência absoluta e relativa em
termos de porcentagem:
Figura 1:
3
3
2.5
2
2
1.5
1 1 1
1
0.5
0
12 15 17 18 19 20
Idade (anos)
Figura 2:
35.0% 33.3%
30.0%
25.0%
25.0%
20.0% 16.7%
15.0%
10.0% 8.3% 8.3% 8.3%
5.0%
0.0%
12 15 17 18 19 20
Idade (anos)
9
Exercício de Fixação
2 0 1 2 3 1 6 1 0 0
1 2 2 1 2 0 1 4 2 3
0 1 0 2 1 2 4 1 1 1
Código do aluno 1 2 3 4 5 6 7 8 9 10
Nota 7,5 8,0 9,0 7,3 6,0 5,8 10,0 3,5 4,0 6,0
Código do aluno 11 12 13 14 15 16 17 18 19 20
Nota 7,5 7,0 8,5 6,8 9,5 9,8 10,0 4,8 5,5 7,0
Note que, não haverá vantagem alguma se organizarmos estes dados numa tabela de
freqüências, uma vez que os dados pouco se repetem. Assim, torna-se útil o agrupamento
dos dados, que, de um modo geral, pode ser feito de acordo com os seguintes passos:
10
2. Estabelecer o Número de Intervalos (categorias ou classes) para se dividir o con-
junto de dados.
A escolha do número de classes é arbitrária, a qual pode ser estabelecida de acordo
com o bom senso do pesquisador ou obtido por alguma fórmula matemática
construída para este fim. Uma sugestão prática é a escolha entre 5 e 15 classes com
a mesma amplitude e duas fórmulas matemáticas que podem orientar na escolha do
número de classes, são:
√
(a) k = n
(b) k = 1 + 3, 3 × log(n)
AT ot = xmáx − xmín
(a) li −−−−| Li - para indicar que o valor extremo inferior (li ) não pertence
à i-ésima classe, enquanto que o valor extremo superior (Li ) pertence.
(b) li |−−−− Li - para indicar que o valor extremo inferior (li ) pertence à
i-ésima classe, enquanto que o valor extremo superior (Li ) não pertence.
De acordo com estes passos, o conjunto de dados anterior pode ser organizado como:
11
(Construir a tabela de freqüências para dados agrupados)
12
Exercícios de Fixação
32,3 62,2 10,3 22,0 13,1 9,9 11,9 20,0 36,4 23,5
18,0 22,6 20,3 38,3 19,6 27,2 28,9 18,4 27,3 21,7
23,7 13,9 36,3 32,9 29,7 25,4 23,8 15,7 17,0 39,2
22,7 29,9 18,3 33,0
21 44 27 323 99 90 20 66 39 16
47 96 127 74 82 92 69 43 33 12
41 84 02 61 35 74 02 83 03 13
41 10 24 24 80 87 40 14 82 58
16 35 114 120 67 37 126 31 56 04
13
UNIVERSIDADE FEDERAL DE CAMPINA GRANDE - Campus I
UNIDADE ACADÊMICA DE MATEMÁTICA E ESTATÍSTICA
Disciplina: Probabilidade e Estatística (6 créditos) Período 2009.2
Prof. Gilberto Matos e Areli Mesquita
Aluno(a): .
3a NOTA DE AULA
3 2 1 2 5
5 3 2 1 2 5
(a) PM d = n+12
, se o total de observações, n, é ímpar. Assim, a mediana será
o valor observado na posição PM d ;
(b) P 1M d = n2 e P 2M d = n2 + 1, se o total de observações, n, é par. Pois, neste
caso, existem duas posições centrais e a mediana será a média aritmética dos
valores observados nestas duas posições.
Notação: Md ou Md(X).
14
Exemplo 1: A partir do conjunto de dados 1, pode-se obter o seguinte rol de dados:
1 2 2
|{z} 3 5
mediana
1 2 2|{z}3 5 5
dois valores centrais
15
2. Moda - é o valor (ou os valores) no conjunto de dados que ocorre(m) com maior
freqüência.
Notação: Mo ou Mo (X).
Exemplo 5: O primeiro conjunto de dados, 1 2 2 3 5, é dito ser unimodal,
tendo em vista que um único valor ocorre com maior frequência. Assim, a moda é
Mo = 2.
Exemplo 6: O segundo conjunto de dados, 1 2 2 3 5 5, é dito ser bimodal,
tendo em vista que, neste caso, dois valores ocorrem com maior frequência, assim,
os valores modais são: Mo = 2 e Mo = 5.
3. Média Aritmética (Média) - é obtida a partir da razão entre a soma dos valores
observados e o total de observações:
k
x1 + x2 + . . . + xk 1X
Me(X) = x = = xi
k k i=1
k
x1 .n1 + x2 .n2 + . . . + xk .nk 1X
Me(X) = x = = xi .ni (1)
n n i=1
k
X ni
= xi . (2)
i=1
n
Xk
= xi .fi . (3)
i=1
Onde:
16
• ni é freqüência absoluta do valor observado xi ,
P
• n = ki=1 ni é o total de observações, e,
• fi é freqüência relativa do valor observado xi .
k
1X 1 18
Me(X) = x = xi .ni = (1 × 1 + 2 × 2 + 3 × 1 + 5 × 2) = = 3.
n i=1 6 6
Exercícios de Fixação
12 12 15 15 15 17 18 18 18 18 19 20
17
2.3.2 Medidas de Posição: Quartis, Decis e Percentis
Assim como a mediana divide os dados em duas partes iguais, os três quartis, denota-
dos por Q1 , Q2 e Q3 , dividem as observações ordenadas (em ordem crescente) em quatro
partes iguais. A grosso modo:
- Q1 separa os 25% inferiores dos 75% superiores dos valores ordenados;
- Q2 separa os 50% inferiores dos 50% superiores, ou seja, é a mediana; e
- Q3 separa os 75% inferiores dos 25% superiores dos dados;
Analogamente, há nove decis, denotados por D1 , D2 , . . . , D9 , que dividem os dados
em 10 grupos com cerca de 10% deles em cada grupo. Finalmente, há 99 percentis que
dividem os dados em 100 grupos com cerca de 1% em cada grupo.
Basicamente, dois passos são necessários para se encontrar as medidas em questão.
Primeiro deve-se identificar a sua posição, e, em seguida, determinar o seu valor.
Veja a seguir, como obter os valores referentes aos percentis, quando se está traba-
lhando com dados brutos ou em distribuição de freqüências para dados não agrupados:
1 ◦ ) Identificar a posição do percentil que se deseja encontrar, através da seguinte
expressão:
k
L= ×n
100
Onde:
- L é o valor que indica a posição do percentil de interesse;
- k é o k − ésimo percentil; e
- n é o total de dados observados.
2 ◦ ) Utilizar a seguinte regra:
Uma vez dominados os cálculos para os percentis, pode-se seguir o mesmo processo
para calcular
os quartis e decis, tendo-se
o cuidado de calcular o valor de L, pelas fórmulas
L = k4 × n, k = 1, 2, 3 e L = 10 k
× n, k = 1, 2, . . . , 9, respectivamente. Pode-se,
ainda, obter os quartis e decis pelas seguintes relações existentes entre estas medidas e os
percentis:
18
Quartis Decis
Q1 = P25 D1 = P10
Q2 = P50 D2 = P20
..
Q3 = P75 .
D9 = P90
Exercícios de Fixação
12 12 15 15 15 17 18 18 18 18 19 20
Determine os Quartis.
Solução:
19
2.3.3 Medidas de Dispersão ou de Variabilidade
Variável X : 3 4 5 6 7
Variável Y : 4 5 5 6
Variável Z : 5 5 5 5
Note que a média Me(X) = Me(Y ) = Me(Z) = 5, a qual nada informa sobre a
variação dos valores nos dois grupos. Assim, torna-se importante o conhecimento de uma
medida que forneça este tipo de informação.
Na prática, existem várias medidas que expessam a variabilidade de um conjunto de
dados, sendo que as mais utilizadas baseam-se na idéia que consiste em verificar a distância
de cada valor observado em relação à média. Estas distâncias são denominadas de desvios
em relação à média.
Definição 2.1 (Variância). - é uma medida que representa a variabilidade de um
conjunto de dados e, é obtida pelo cálculo da média dos quadrados dos desvios em
relação à média:
V ar(X) = s2
k
1X
= (xi − x)2 × ni
n i=1
k
X ni
= (xi − x)2 ×
i=1
n
Xk
= (xi − x)2 × fi
i=1
Exercício
1. Mostre que:
k
X k
X
2
(xi − x) × ni = x2i ni − nx2
i=1 i=1
E, por isso, a variância também pode ser obtida pela seguinte fórmula:
k
1X 2
V ar(X) = s2 = xi ni − x2
n i=1
20
Vejamos, agora, como fica a variância para as variáveis X, Y e Z:
Assim, de acordo com a variância, podemos dizer que a variável X apresenta ...
v
u k
√ uX
D.P.(X) = s = s2 = t (xi − x)2 × fi
i=1
O uso do desvio padrão como medida de variabilidade é preferível pelo fato de ser
expresso na mesma unidade de medida dos valores observados. Pois, a variância pode
causar problemas de interpretação por ser expressa em termos quadráticos.
s
CV (X) = × 100 (expresso em porcentagem (%))
x
A utilidade imediata do coeficiente de variação é a possibilidade de avaliar o grau
de representatividade da média. Esta medida também é bastante útil na comparação
entre conjunto de dados, em relação à variabilidade; ainda que as unidades de medida nos
conjuntos de dados sejam distintas. Por exemplo, comparar a variabilidade das distribuições
da variável peso expressa em quilogramas (Kg) e altura expressa em metros (m).
Um critério de decisão sobre a representatividade ou não da média, pode ser dada pela
seguinte linha de corte:
Se CV ≥ 50%, a média não é representativa.
Se CV < 50%, a média é representativa.
21
Exemplos:
Exercícios de Fixação
12 12 15 15 15 17 18 18 18 18 19 20
22
2.3.4 Medidas Resumo para Dados Agrupados
Salário ni
4, 00 ⊢ 8, 00 10
8, 00 ⊢ 12, 00 12
12, 00 ⊢ 16, 00 8
16, 00 ⊢ 20, 00 8
20, 00 ⊢ 24, 00 2
Solução:
23
2.4 Outra Estratégia de Análise de Dados
Em algumas situações a média e o desvio padrão podem não ser adequados para
representar um conjunto de dados, pois:
ii - Apenas com estes dois valores não temos a idéia da assimetria dos valores, ou seja,
sobre o quanto os dados se distribuem em torno dos valores inferiores, medianos e
superiores.
Para contornar estes problemas, 5 medidas foram sugeridas por Tukey (1977):
1 ◦ ) A mediana (Md);
2 ◦ ) Os extremos: o menor e o maior valor observado no conjunto de
dados (xmín e xmáx , respectivamente);
3 ◦ ) O primeiro e o terceiro quartil (ou junta).
As informações obtidas pelas 5 medidas podem ser representadas por um gráfico co-
nhecido por "Box-Plot"ou diagrama em caixa. Para construir este diagrama, consideremos
um retângulo onde estão representados a mediana e os quartis. A partir do retângulo,
para cima, segue uma linha até o ponto mais remoto que não exceda LS = Q3 + (1, 5)dq ,
chamado limite superior, onde dq representa a distância entre o primeiro e o terceiro quartil.
De modo similar, da parte inferior do retângulo, para baixo, segue uma linha até o ponto
mais remoto que não seja menor do que LI = Q1 − (1, 5)dq , chamado limite inferior.
Os valores compreendidos entre esses dois limites são chamados valores adjacentes. As
observações que estiverem acima do limite superior ou abaixo do limite inferior estabelecidos
serão chamadas pontos exteriores e representadas por asteriscos. Essas são observações
destoantes das demais e podem ou não ser o que chamamos de outliers ou valores
atípicos.
O box plot dá uma idéia da posição, dispersão, assimetria, caudas e dados discrepan-
tes. A posição central é dada pela mediana e a dispersão por dq . As posições relativas de
Q1 , Q2 , Q3 dão uma noção da assimetria da distribuição.
Veja, como fica o box-plot da variável Peso apresentado na Figura 3.
Gráficos tipo box-plot também são úteis para detectar, descritivamente, diferenças
nos comportamentos de grupos de variáveis. Por exemplo, podemos considerar gráficos da
variável Peso para cada sexo. O resultado é apresentado na Figura 4, em que podemos
notar que os homens apresentam peso mediano superior ao das mulheres, além de uma
maior variabilidade.
24
Figura 3: Box-plot para a variável Peso
25
UNIVERSIDADE FEDERAL DE CAMPINA GRANDE - Campus I
UNIDADE ACADÊMICA DE MATEMÁTICA E ESTATÍSTICA
Disciplina: Probabilidade e Estatística (6 créditos) Período 2009.2
Prof. Gilberto Matos e Areli Mesquita
Aluno(a): .
2a LISTA DE EXERCÍCIOS
Mostre
Pk que a soma dos desvios em relação à média é igual zero, ou seja, que
i=1 i − x) × ni = 0.
(x
20 30 40
165 164 151 160 155 169 153 156 165 160
170 157 162 162 155 154 151 155 162 150
168 160 154 151 168 155 156 158 166 155
154 152 163 156 170 158 171 159 175 154
159 158 153 158 156 162 165 156 161 157
4 - As taxas de juros recebidas por 10 ações durante certo período foram (medidas em
porcentagem): 2.59; 2.64; 2.60; 2.62; 2.57; 2.55; 2.61; 2.50; 2.63; 2.64. Calcule a
média e a mediana.
26
5 - Dados os conjuntos de números: A = {1000; 1001; 1002; 1003; 1004; 1005} e B =
{0, 1, 2, 3, 4, 5} podemos afirmar que:
a) o desvio-padrão de A é igual a 100 vezes o desvio-padrão de B.
b) o desvio-padrão de A é igual ao desvio-padrão de B.
c) o desvio-padrão de A é igual ao desvio-padrão de B multiplicado pelo quadrado de
1000.
d) o desvio-padrão de A é igual ao desvio-padrão de B dividido por 1000.
e) o desvio-padrão de A é igual ao quadrado do desvio-padrão de B.
27
UNIVERSIDADE FEDERAL DE CAMPINA GRANDE - Campus I
UNIDADE ACADÊMICA DE MATEMÁTICA E ESTATÍSTICA
Disciplina: Período
Aluno(a): .
4a NOTA DE AULA
3 Análise Bidimensional
3.1 Introdução
Em algumas análises de dados pode surgir a necessidade de se fazer um estudo sobre
o comportamento conjunto de duas ou mais variáveis e para isso a distribuição conjunta de
freqüências é de grande utilidade.
Na presente nota de aula estudaremos apenas o caso de duas variáveis e, sendo assim, é
possível observar a ocorrência de três situações distintas que requerem técnicas estatísticas
também distintas. As três situações distintas que podem ocorrer são:
28
Observações:
4. Assim como no caso de uma única variável, as freqüências absolutas podem ser
expressas em termos de freqüências relativas e/ou porcentagens, sendo que, estas
medidas podem ser obtidas em relação ao total geral, em relação ao total de cada
linha ou em relação ao total de cada coluna, de acordo com o objetivo de cada
análise;
Exercício de Fixação
Para responder estas e outras questões, torna-se útil a construção de tabelas de dupla
entrada contendo as freqüências relativas em termos de porcentagem, tendo como referência
o total geral, os totais de cada linha ou coluna, de acordo com a questão a ser respondida.
Vejamos como ficam estas tabelas:
29
Tabela 3 - Freqüências percentuais da distribuição conjunta das variáveis X e Y , em
relação ao total de linha (freqüência marginal de X).
Y 1 ◦ Grau 2 ◦ Grau Superior Total marginal de X
X
Capital 100%
Interior 100%
Outra 100%
Total marginal de Y 100%
30
r X s
2
X (oij − eij )2
χ = ,
i=1 j=1
eij
s
χ2 /n
T = .
(r − 1)(s − 1)
Neste caso, pode-se aplicar um procedimento análogo ao realizado para a análise de variáveis
qualitativas. E, por se tratar de variáveis quantitativas, antes de construir uma tabela de
dupla entrada, os dados marginais podem ser agrupados em intervalos de classe, assim como
no caso de uma única variável. Em análises de associação entre variáveis quantitativas, são
possíveis procedimentos analíticos mais refinados, como veremos a seguir.
Diagrama de Dispersão
O diagrama (ou gráfico) de dispersão nada mais é que a representação de pares dos
valores observados (x, y) num sistema cartesiano. Vejamos a ilustração de alguns gráficos
que podem surgir na prática:
31
Coeficiente de Correlação (Linear)
Ao ser observada uma associação entre variáveis quantitativas, seria muito útil saber-
mos sobre a intensidade desta associação. Aqui, veremos apenas uma medida referente
ao tipo de associação linear, ou seja, ao tipo de relação em que os pontos do gráfico de
dispersão aproximam-se de uma reta.
Definição: Dados n pares de valores (x1 , y1 ), (x2 , y2), ..., (xn , yn ), chama-se coefici-
ente de correlação entre as variáveis X e Y o valor obtido por
n
1 X (xi − x)(yi − y)
corr(X, Y ) =
n i=1 dp(X)dp(Y )
ou seja, a média dos produtos dos valores reduzidos (ou padronizados) das variáveis.
Enquanto o coeficiente T para variáveis qualitativas só assume valores ente 0 e 1, o
coeficiente de correlação pode assumir qualquer valor entre -1 e 1. Uma fórmula alternativa
e mais operacional para o coeficiente de correlação é dada por
P
xi yi − nxy
corr(X, Y ) = p P P
( xi − nx2 )( yi2 − ny 2 )
2
O numerador da expressão acima, que mede o total de concentração dos pontos pelos
quatro quadrantes, dá origem à covariância que é uma medida bastante usada.
Definição: Dados n pares de valores (x1 , y1), (x2 , y2), ..., (xn , yn ), chamamos de co-
variância entre as variáveis X e Y à medida dada por
n
X (xi − x)(yi − y)
cov(X, Y ) = .
i=1
n
cov(X, Y )
corr(X, Y ) = .
dp(X)dp(Y )
Exercício de Aplicação
Numa amostra de cinco operários de uma dada empresa foram observadas duas variá-
veis. X: anos de experiência num dado cargo e Y: tempo, em minutos, gasto na execução de
uma tarefa relacionada com esse cargo. As observações são apresentadas na tabela abaixo.
X 1 2 4 4 5
Y 7 8 3 2 2
P P 2 P P 2 P
Obs.: x = 16, x = 62, y = 22, y = 130, xy = 53.
Você diria que a variável X pode ser usada para explicar a variação de Y? Justifique.
32
UNIVERSIDADE FEDERAL DE CAMPINA GRANDE - Campus I
UNIDADE ACADÊMICA DE MATEMÁTICA E ESTATÍSTICA
Disciplina: Probabilidade e Estatística (6 Créditos) Período 2009.2
Professores: Gilberto Matos e Areli Mesquita
33
UNIVERSIDADE FEDERAL DE CAMPINA GRANDE - Campus I
UNIDADE ACADÊMICA DE MATEMÁTICA E ESTATÍSTICA
Disciplina: Probabilidade e Estatística (6 créditos) Período 2009.2
Prof. Gilberto Matos e Areli Mesquita
Aluno(a): .
5a NOTA DE AULA
4 Introdução à Probabilidade
Objetivo: Definir um modelo matemático probabilístico que seja conveniente a descrição
e interpretação de fenômenos aleatórios.
4.1 Introdução
Ao jogarmos uma moeda para o ar, de modo geral, não podemos afirmar se ocorrerá
cara ou coroa. Da mesma forma, quando lançamos um dado não sabemos qual das faces
1, 2, 3, 4, 5, ou 6 ocorrerá. No campo dos negócios e do governo há numerosos exemplos
de tais situações. Por exemplo, a incerteza existe quando desejamos realizar uma previsão
sobre a procura de um novo produto, a opinião pública em relação a determinado assunto,
o sucesso de um novo plano econômico, etc - tudo isso contém algum elemento de acaso.
Na Estatística, a incerteza existe quando se quer fazer alguma afirmação a respeito de
alguma característica populacional baseada em informações extraídas de dados amostrais.
Neste caso, a aplicação da Teoria das Probabilidades é de fundamental importância
para a solução de problemas de Inferência Estatística.
Independente de qual seja a aplicação em particular, a utilização das probabilidades
indica que existe um elemento de acaso, ou de incerteza, quanto à ocorrência ou não de um
evento futuro. Assim é que em muitos casos, pode ser impossível afirmar com antecipação
o que ocorrerá. No entanto, é possível dizer o que pode ocorrer.
O ponto central em todas essas situações é a possibilidade de quantificar quão provável
é determinado evento.
Em suma, podemos dizer que, as probabilidades são utilizadas para exprimir a chance
de ocorrência de determinado evento.
34
4.2 Definições Básicas
Definição 4.1 (Experimentos Aleatórios ou Fenômenos Aleatórios). são aque-
les onde o processo de experimentação está sujeito a influências de fatores casuais e
conduz a resultados incertos.
Notação: E.
Exemplos:
E1 : Jogar uma moeda e observar a face superior.
E2 : Lançar um dado e observar o número da face superior.
E3 : Uma lâmpada é fabricada. Em seguida é testada a duração da vida útil dessa
lâmpada.
Observações:
a) Cada experimento poderá ser repetido um grande número de vezes sob as mesmas
condições;
b) Não podemos afirmar que resultado particular ocorrerá, porém podemos descrever
o conjunto de todos os possíveis resultados do experimento;
c) Quando o experimento é repetido um grande número de vezes, surgirá uma regula-
ridade nos resultados. Esta regularidade, chamada de regularidade estatística, é que torna
possível construir um modelo matemático preciso com o qual se analisará o experimento.
Notação: S ou Ω.
Exemplos:
Os espaços amostrais associados aos experimentos aleatórios E1 , E2 e E3 são:
S1 =
S2 =
S3 =
35
Definição 4.3 (Evento). Dado um espaço amostral S associado a um experimento E,
definimos como evento, qualquer subconjunto desse espaço amostral, ou seja, é qualquer
coleção de resultados do experimento E.
Notação: A, B, C, D, etc.
Exemplos:
Observação:
36
Definição 4.4 (Eventos Mutuamente Excludentes). Dois eventos, A e B, são
denominados, mutuamente excludentes, se eles não puderem ocorrer simultaneamente,
ou seja, A ∩ B = φ.
(i) A ∪ B = A ∩ B
(ii) A ∩ B = A ∪ B
Exemplos:
37
4.3 Abordagens para Definir Probabilidade
4.3.1 Aproximação da Probabilidade pela Freqüência Relativa - (Lei dos
Grandes Números)
Observação: Esta aproximação será tanto melhor quanto maior for o número de
repetições do experimento.
Exemplos:
1 - Ao lançar uma moeda honesta 5 vezes, ocorreram 4 caras. Baseado neste resultado,
qual a probabilidade (aproximada) do evento A : ocorrer cara?
2 - Considere as seguintes situações:
(i) Numa pesquisa de mercado, 5 pessoas foram entrevistadas das quais 4 disseram
que comprariam um novo produto a ser lançado.
(ii) Numa outra pesquisa de mercado, 300 pessoas foram entrevistadas das quais
140 disseram que comprariam um novo produto a ser lançado.
38
4.3.2 Definição Clássica de Probabilidade
Exemplo: Ao lançar um dado, os eventos simples serão: {1}, {2}, {3}, {4}, {5} e {6}
e um evento composto seria A : número par = {2, 4, 6}.
Observações:
(1) Nesta definição é fundamental que os eventos simples sejam igualmente prováveis,
e, neste caso, é evidente que:
(2) Espaços amostrais com as características acima descritas são conhecidos como
Espaços Amostrais Finitos e Equiprováveis.
Exemplos:
39
4.3.2.2 Noções Básicas de Técnicas de Contagem
Suponha que um experimento possa ser realizado em k etapas, de modo que, para a
primeira etapa existem n1 resultados possíveis, para a segunda etapa n2 resultados possíveis,
e assim sucessivamente, até que para a k − ésima etapa existem nk resultados possíveis.
Então, existe um total de
n1 × n2 × .... × nk
resultados possíveis para este experimento.
Exemplos:
1 - Ao lançar um dado e uma moeda, quantos resultados possíveis podem ser obtidos?
Resp.: 12
2 - Uma companhia produz fechaduras que usam segredos numéricos para serem abertas.
Se cada segredo consiste de três números distintos, escolhidos dentre os inteiros de
0 a 9, quanto segredos diferentes poderão ser fabricados? Resp.: 720
4.3.2.2.2 Combinação
Quando uma amostra de k elementos for retirada (sem importar a ordem entre si) de
um
conjunto de n elementos. O número de diferentes amostras possíveis é denotado por
n
e é igual a:
k
n n!
=
k k!(n − k)!
onde o símbolo ! significa que:
Por exemplo, 5! = 5.4.3.2.1 [Nota: A quantidade 0! é definida como sendo igual a 1.]
40
Exemplos:
2 - Suponha que num lote com 20 peças existem cinco defeituosas. Escolhemos 4 peças
do lote ao acaso, ou seja, uma amostra de 4 elementos, de modo que a ordem dos
elementos seja irrelevante:
41
4.3.3 Definição Axiomática de Probabilidade
P (A ∪ B) = P (A) + P (B) .
Principais Teoremas:
T1. Se φ denota o conjunto vazio (Evento Impossível), então
P (φ) = 0.
P (A) = 1 − P (A) .
P (A ∪ B) = P (A) + P (B) − P (A ∩ B) .
42
4.4 Eventos Independentes
A probabilidade da ocorrência de dois eventos simultaneamente, P (A ∩ B), depende
da natureza dos eventos, ou seja, se eles são independentes ou não.
Dois ou mais eventos são independentes quando a ocorrência ou não-ocorrência de um
não influencia a ocorrência do(s) outro(s).
Exemplo 1: Se duas moedas equilibradas (sem vício) são lançadas, determine qual a
probabilidade de ambas darem cara? E se três moedas fossem lançadas, qual a probabilidade
de ocorrer três caras?
Exemplo 2: Uma urna contém duas bolas brancas e cinco pretas. Qual a probabilidade
de sair duas bolas pretas se os sorteios são feitos com reposição?
Exemplo:
43
UNIVERSIDADE FEDERAL DE CAMPINA GRANDE - Campus I
UNIDADE ACADÊMICA DE MATEMÁTICA E ESTATÍSTICA
Disciplina: Probabilidade e Estatística (6 créditos) Período 2009.2
Prof. Gilberto Matos e Areli Mesquita
Aluno(a): .
3a LISTA DE EXERCÍCIOS
Introdução à Probabilidade
1 - De uma linha de produção são retirados três (3) artigos e cada um é classificado
como bom (B) ou defeituoso (D). Determine o espaço amostral deste experimento
aleatório e expresse também o evento A: obter dois artigos defeituosos.
2 - Pedro tem dois automóveis velhos. Se nas manhãs frias, há 20% de probabilidade de
um deles não funcionar e 30% de outro não funcionar,
44
6 - Um terço dos eleitores de certa comunidade é constituido de mulheres, e 40% dos
eleitores votaram na última eleição presidencial. Supondo que esses dois eventos
sejam independentes, determine a probabilidade de escolher um eleitor da lista geral,
que seja mulher e que tenha votado na última eleição presidencial.
7 - Uma urna contém duas bolas brancas e cinco pretas. Qual a probabilidade de sair
duas bolas pretas supondo que os sorteios são feitos com reposição?
10 - Uma urna contém duas bolas brancas, três pretas e cinco azuis.
45
4.5 Probabilidade Condicional
Em algumas situações, a probabilidade de ocorrência de um certo evento pode ser
afetada se tivermos alguma informação sobre a ocorrência ou não de um outro evento.
Considere, por exemplo, o seguinte experimento:
E : Lançar um dado.
Seja o evento A: sair o no 3 =
Então, P (A) =
Considere, agora, o seguinte evento:
B: sair um número ímpar =
Logo, P (B) =
Suponha, agora, que soubéssemos da ocorrência de B e que quiséssemos calcular a
probabilidade de A. Iremos denotar essa probabilidade como P (A | B). Assim,
P (A | B) =
a) P (A) c) P (A ∩ B) e) P (B | A)
b) P (B) d) P (A | B)
46
4.5.1 Teorema do Produto
Exemplos:
1 - Em um lote de 12 peças, 4 são defeituosas. Se duas peças são retiradas uma após a
outra sem reposição, qual a probabilidade de que:
2 - Uma urna contém duas bolas brancas, três vermelhas e cinco azuis. Qual a pro-
babilidade de se retirar sem reposição uma bola azul, uma branca e uma vermelha
exatamente nessa ordem?
P (A | B) = P (A).
P (B | A) = P (B).
47
4.7 Teorema da Probabilidade Total
Definição 4.11 (Partição do Espaço Amostral). Dizemos que os eventos B1 , B2 , ..., Bk
representam uma partição do espaço amostral S, quando
a) Bi ∩ Bj = φ, para todo i 6= j,
b) ∪ki=1 Bi = S,
c) P (Bi ) > 0, para todo i.
A = (A ∩ B1 ) ∪ (A ∩ B2 ) ∪ (A ∩ B3 ) ∪ ... ∪ (A ∩ Bk ).
Logo,
P (A) = P (A ∩ B1 ) + P (A ∩ B2 ) + P (A ∩ B3 ) + ... + P (A ∩ Bk ).
Exemplos:
1 - A proporção de peças produzidas pelas máquinas I, II e III é 30%, 30% e 40%, res-
pectivamente. Dentre estas peças, 4%, 3% e 2%, respectivamente, são defeituosas.
Uma peça escolhida aleatoriamente, foi testada e verificou-se ser defeituosa. Qual é
aprobabilidade de que a peça tenha sido produzida pela máquina I? E pela máquina
II? E pela III?
48
2 - Suponha três urnas com as seguintes configurações: a urna 1 contém 3 bolas pretas,
1 branca e 5 vermelhas; a urna 2 contém 4 bolas pretas, 3 brancas e 2 vermelhas; a
urna 3 contém 2 bolas pretas, três brancas e 3 vermelhas. Escolheu-se uma urna ao
acaso e dela extraiu-se uma bola ao acaso, verificou-se que a bola é branca. Qual a
probabilidade da bola ter vindo da urna 1, 2? E da 3?
49
UNIVERSIDADE FEDERAL DE CAMPINA GRANDE - Campus I
UNIDADE ACADÊMICA DE MATEMÁTICA E ESTATÍSTICA
Disciplina: Probabilidade e Estatística (6 créditos) Período 2009.2
Prof. Gilberto Matos e Areli Mesquita
Aluno(a): .
4a LISTA DE EXERCÍCIOS
Independência Estatística, Probabilidade Condicional, Teorema da
Probabilidade Total e de Bayes
1 - Suponha que a probabilidade de que ambas crianças gêmeas sejam meninos é 0,30 e
que a probabilidade de que sejam meninas é 0,26. Dado que a probabilidade de uma
criança seja menino é 0.52, qual é a probabilidade de que:
2 - Uma urna contém duas bolas brancas, três verdes e cinco azuis. Se três bolas são
retiradas ao acaso, sem reposição, determine a probabilidade de:
6 - Suponhamos que seja p a probabilidade de que o tempo (com sol ou nublado) seja o
mesmo do dia anterior. Se hoje for dia de sol, qual a probabilidade de que depois de
amanhã tenhamos também um dia de sol? Resp.: 2p2 − 2p + 1
50
Teorema de Bayes
7 - Um saco contém três moedas, uma das quais foi cunhada com duas caras, enquanto
as outras duas são normais e não viciadas. Uma moeda é retirada ao acaso e jogada.
Dado que o resultado foi cara, qual a probabilidade de que essa seja a moeda de duas
caras? Resp.: 0,5.
51
UNIVERSIDADE FEDERAL DE CAMPINA GRANDE - Campus I
UNIDADE ACADÊMICA DE MATEMÁTICA E ESTATÍSTICA
Disciplina: Probabilidade e Estatística (6 créditos) Período 2009.2
Prof. Gilberto Matos e Areli Mesquita
Aluno(a): .
6a NOTA DE AULA
5.1 Introdução
Ao descrever um espaço amostral S associado a um experimento E, podemos obser-
var que os resultados possíveis não são, necessariamente, núméricos. Consideremos, por
exemplo, o seguinte experimento:
E1 : Lançar duas moedas e observar a face superior de cada uma.
Neste experimento, temos S = {CC, CK, KC, KK} e, na prática, o que realmente
podemos estar interessados em observar é, por exemplo, o número de vezes que ocorre
cara (K), ou seja, temos interesse num número real que está associado a cada resultado do
espaço amostral S.
Notação: X, Y , Z, etc.
Esquematicamente, temos:
52
Exemplo 1: Considere o experimento
E1 : Lançar duas moedas e observar a seqüência de caras (K) e coroas (C).
Se X é a variável aleatória que representa o número de vezes que ocorre cara (K):
Solução:
A = {s ∈ S; X(s) ∈ B}.
53
Exemplo: A partir do exemplo anterior, temos RX = {0, 1, 2}, onde cada um desses
valores ocorre com as seguintes probabilidades:
Notação:
X x1 x2 x3 ...
P (X = xi ) = p(xi ) p(x1 ) p(x2 ) p(x3 ) . . .
1. p(xi ) ≥ 0, ∀i;
2. Σ∞
i=1 p(xi ) = 1.
54
a ) Mostre que X tem realmente uma distribuição de probabilidades.
b ) Faça um gráfico representando o comportamento desta distribuição.
c ) Obtenha:
i . P (X ser par)
ii . P (X ≥ 3)
iii . P (X ser múltiplo de 3)
P (a ≤ X ≤ b) = P (a < X ≤ b)
= P (a ≤ X < b)
= P (a < X < b)
Z b
= f (x)dx.
a
Probabilidade essa, que pode ser representada pela área sob o gráfico da função f no
intervalo [a, b], tal como ilustrado abaixo:
55
Rb
(Esboçar o gráfico representando a área definida por P (a < X < b) = a
f (x)dx)
Exemplos:
1 - Suponha que estamos atirando dardos em um alvo circular de raio de 10 cm, e seja
X a distância do ponto atingido pelo dardo ao centro do alvo. A f.d.p. de X é
kx, 0 ≤ x ≤ 10
f (x) =
0, c.c
a) Qual a probabilidade de acertar a mosca, se ela é um círculo de raio 1 cm?
b) Mostre que a probabilidade de acertar qualquer círculo concêntrico é proporci-
onal a sua área.
2 - Uma variável aleatória contínua X é dita ter distribuição uniforme se a sua f.d.p. é
da forma
k, se a < x < b
f (x) =
0, caso contrário
a) Encontre o valor de k para que a função f seja realmente uma f.d.p.
b) Esboce o gráfico da distribuição de X.
Observação:
a) Se a variável aleatória X for discreta, então a função de distribuição será dada por
X
F (x) = P (X ≤ x) = p(xi ),
i ; xi ≤x
b) Se a variável aleatória X for contínua, então a função de distribuição será dada por
Z x
F (x) = P (X ≤ x) = f (t)dt.
−∞
56
Exemplos:
1 - Suponhamos que a variável aleatória X tome os três valores 0,1 e 2, com proba-
bilidades 1/3, 1/6 e 1/2, respectivamente. Encontre a função de distribuição F e
represente-a graficamente.
57
5.4.1 Propriedades da Função de Distribuição
Teorema 5.1. Seja X uma variável aleatória discreta, com valores possíveis x1 , x2 , ...,
e suponha-se que esses valores tenham sido indexados de modo que x1 < x2 < .... Seja
F a função de distribuição de X. Então,
onde F (x−
i ) ≡ limh→0− F (xi + h).
Observações:
58
UNIVERSIDADE FEDERAL DE CAMPINA GRANDE - Campus I
UNIDADE ACADÊMICA DE MATEMÁTICA E ESTATÍSTICA
Disciplina: Probabilidade e Estatística (6 créditos) Período 2009.2
Prof. Gilberto Matos e Areli Mesquita
Aluno(a): .
5a LISTA DE EXERCÍCIOS
Variáveis Aleatórias: Discretas e Contínuas
1 - Sabendo-se que a v.a. X assume os valores 1,2 e 3 e que sua função de distribuição
F (x) é tal que
F (1) − F (1− ) = 1/4,
F (2) − F (2− ) = 1/2,
F (3) − F (3− ) = 1/4.
Obter a distribuição de X, a função de distribuição acumulada e seu respectivo
gráfico.
2 - Dada a seguinte função de distribuição
0, x < 0,
F (x) =
1 − e−x , x > 0.
a ) Encontre a probabilidade da variável X assumir os seguintes valores:
i . P (X = 1);
ii . P (0.5 < X < 1);
iii . P (X > 1);
d ) Esboçe um gráfico ilustrando cada uma das situações descritas acima.
e ) Determine o valor de α tal que F (α) = 1/4.
f ) Encontre a f.d.p. da variável X.
7 - Suponhamos que uma válvula eletrônica seja posta em um soquete e ensaiada. Ad-
mitamos que a probabilidade de que o teste seja positivo seja 34 ; daí, a probabilidade
de que seja negativo é igual a 14 . Adimitamos também que estejamos ensaiando uma
partida grande dessas válvulas. Os ensaios continuam até que a primeira válvula
positiva apareça. Considere a variável aleatória X: no de testes necessários para
concluir o experimento. Assim
S=
P (X = n) =
8 - Seja X o tempo até a desintegração de alguma partícula radioativa e suponha que a
função de distribuição de X seja dada por
0, x < 0,
F (x) =
1 − e−λx , x > 0.
Suponha que λ seja tal que P (X ≥ 0, 01) = 1/2. Obtenha um número t tal que
P (X ≥ t) = 0, 9.
59
UNIVERSIDADE FEDERAL DE CAMPINA GRANDE - Campus I
UNIDADE ACADÊMICA DE MATEMÁTICA E ESTATÍSTICA
Disciplina: Probabilidade e Estatística (6 créditos) Período 2009.2
Prof. Gilberto Matos e Areli Mesquita
Aluno(a): .
7a NOTA DE AULA
6.1 Introdução
De maneira análoga ao que acontece na estatística descritiva (resumo de dados),
no estudo de variáveis aleatórias precisamos de algumas características numéricas que
possam nos fornecer uma idéia sobre o comportamento da distribuição de probabilidade.
A estas características denominamos de parâmetros da distribuição.
Dois dos principais parâmetros são: o valor esperado e a variância. O valor esperado
de uma distribuição de probabilidades nos dá uma idéia de um valor médio ou central da
distribuição. Por outro lado, a medida que nos dá o grau de dispersão (ou de concentração)
dos valores assumidos pela variável em torno da média é a variância.
E(X) = Σ∞
i=1 xi p(xi ),
Σ∞
i=1 |xi | p(xi ) < ∞.
60
Caso 2: Variável Aleatória Contínua
Seja X uma variável aleatória contínua com f.d.p. f . Então, o valor médio de X ou
o valor esperado de X é definido como
Z +∞
E(X) = xf (x)dx.
−∞
Pode acontecer que esta integral (imprópria) não convirja. Conseqüentemente, diremos
que E(X) existirá se, e somente se,
Z +∞
|x| f (x)dx
−∞
for finita.
Exemplos:
1 - Um fabricante produz peças tais que 10% delas são defeituosas e 90% delas são
não-defeituosas. Se uma peça defeituosa for produzida, o fabricante perde R$ 1,
enquanto uma peça não-defeituosa lhe dá um lucro de R$ 5. Se X for o lucro líquido
por peça, qual o valor esperado de X?
2 - Uma variável aleatória contínua X definida num intervalo [a, b] é dita ter distribuição
uniforme se possui a seguinte f.d.p.
1
b−a
, a ≤ x ≤ b,
f (x) =
0, c.c.
3 - Seja a variável aleatória X definida como segue. Suponha que X seja o tempo (em
minutos) durante o qual um equipamento elétrico seja utilizado em carga máxima,
em um certo período de tempo especificado. Suponha ainda, que X seja uma variável
aleatória contínua com a seguinte f.d.p.:
x
15002 , 0 ≤ x ≤ 1500,
−(x−3000)
f (x) = , 1500 < x ≤ 3000,
15002
0, c.c.
61
6.3 Esperança de uma Função de uma Variável Aleatória
É intuitivamente evidente a idéia de que qualquer função de uma variável aleatória X,
Y = H(X), também é uma variável aleatória, pois qualquer resultado aleatório, X = x,
resultará num resultado também aleatório Y = h(x) = y. Desta forma, terá sentido
calcular E(Y ).
Para se obter o valor esperado de Y = H(X) existem duas maneiras que se mostram
equivalentes. A primeira requer que se obtenha primeiramente a distribuição de Y ; problema
este que será abordado posteriormente. Uma segunda maneira requer, simplesmente, o
conhecimento da distribuição de probabilidade de X.
Definição 6.2 (Esperança de uma Função de uma de uma Variável Aleatória). Seja
X uma variável aleatória e seja Y = H(X). Então,
(a) Se Y for uma variável aleatória discreta com valores possíveis y1 , y2, ... e se
q(yi ) = P (Y = yi), o valor esperado de Y é definido por
E(Y ) = Σ∞
i=1 yi q(yi ).
(b) Se Y for uma variável aleatória contínua com f.d.p. g, o valor esperado de Y
é definido por Z +∞
E(Y ) = yg(y)dy.
−∞
E(Y ) = E[H(X)] = Σ∞
j=1 H(xj )p(xj ).
(b) Se X for uma variável aleatória contínua com f.d.p. f , tem-se que o valor
esperado de Y será dado por
Z +∞
E(Y ) = E[H(X)] = H(x)f (x)dx.
−∞
62
6.4 Propriedades do valor esperado
Se X é uma v.a. e k é um valor qualquer, constante, então:
1. E[k] = k.
2. E[X + k] = E(X) + k.
3. E[kX] = kE(X).
Demonstrações:
Exemplos:
1 - Um fabricante produz peças tais que 10% delas são defeituosas e 90% delas são
não-defeituosas. Se uma peça defeituosa for produzida, o fabricante perde R$ 1,0,
enquanto uma peça não-defeituosa lhe dá um lucro de R$ 5,0. Se X for o lucro
líquido por peça, determine:
a) O valor esperado de X.
b) Se houver um aumento de 10% nos valores de X, qual será o lucro líquido
esperado?
c) E Se houver um acréscimo de R$ 0,10 nos valores de X, em média, quanto será
o lucro líquido?
63
6.5 A Variância de uma Variável Aleatória
Definição 6.3 (Variância de uma Variável Aleatória).
onde µ = E(X).
Exercício:
1 - Mostre que
V ar(X) = E(X 2 ) − E 2 (X),
onde E(X 2 ) = Σ∞ 2
i=1 xi p(xi ).
Exemplos:
1 - Um fabricante produz peças tais que 10% delas são defeituosas e 90% delas são
não-defeituosas. Se uma peça defeituosa for produzida, o fabricante perde R$ 1,0,
enquanto uma peça não-defeituosa lhe dá um lucro de R$ 5,0. Se X for o lucro
líquido por peça, determine o desvio padrão da v.a. X.
2 - Se X é uma variável aleatória uniforme num intervalo [a, b], ou seja, X ∼ U(a, b),
qual é o valor de V (X)?
3 - Seja V a velocidade do vento (em milhas por hora) e suponha-se que V seja unifor-
memente distribuída sobre o intervalo [0, 10]. A pressão, digamos W (em libras/pé
quadrado), na superfície da asa de um avião é dada pela relação: W = 0, 003V 2 .
Encontre o valor esperado de W .
64
4 - Se X é uma variável aleatória contínua com f.d.p.
1 + x, −1 ≤ x ≤ 0,
f (x) =
1 − x. 0 ≤ x ≤ 1.
Obtenha a variância de X.
1. V ar(k) = 0.
2. V ar(X + k) = V ar(X).
3. V ar(kX) = k 2 V ar(X).
Demonstrações:
65
UNIVERSIDADE FEDERAL DE CAMPINA GRANDE - Campus I
UNIDADE ACADÊMICA DE MATEMÁTICA E ESTATÍSTICA
Disciplina: Probabilidade e Estatística (6 créditos) Período 2009.2
Prof. Gilberto Matos e Areli Mesquita
Aluno(a): .
6a LISTA DE EXERCÍCIOS
Valor Esperado e Variância de Variáveis Aleatórias
1 - Uma urna contém 4 bolas brancas e 6 pretas. 3 bolas são retiradas com reposição.
Seja X o número de bolas brancas. Calcular E(X) e D.P.(X). Resp.: E(X) = 1, 2.
a) E(X + 3)2 ;
b) V ar(3X − 2).
4 - Uma seguradora paga R$30.000,00 em caso de acidente de carro e cobra uma taxa
de R$1.000,00. Sabe-se que a probabilidade de que um carro sofra acidente é de 3%.
Quanto espera a seguradora ganhar por carro segurado? Resp.: E(L) = 100, 00
66
6 - Um banco pretende aumentar a eficiência de seus caixas. Para isto, o banco está
oferecendo um prêmio de R$ 150,00 para cada cliente atendido, além de 42 clientes
por dia. O banco tem um ganho operacional de R$ 100,00 para cada cliente atendido
além de 41. As probabilidades de atendimento são:
no de clientes Até 41 42 43 44 45 46
Probabilidade 0,88 0,06 0,04 0,01 0,006 0,004
Qual o ganho esperado do banco, se este novo sistema for implantado? O sistema é
vantajoso para o banco? Resp.: E(X) = 7, 30.
7 - Suponhamos que dez cartas estejam numeradas de 1 até 10. Das dez cartas, retira-se
uma de cada vez, ao acaso e sem reposição, até retirar-se o primeiro número par. Se
X é uma variável aleatória que expressa o número de retiradas necessárias.
T =t 2 3 4 5 6 7
P (T = t) 0,1 0,1 0,3 0,2 0,2 0,1
67
Resp.: a) E(T ) = 4, 6 b) E(G) = 2, 75 e V ar(G) = 0, 4125
X=x 0 1 2 3 4 5 6 7 8 9 10
P (X = x) 0,05 0,15 0,15 0,06 0,06 0,06 0,06 0,06 0,15 0,15 0,05
12 - A percentagem de álcool (100X) em certo composto pode ser considerada uma va-
riável aleatória, onde X, tem a seguinte função densidade:
68
Respostas
1)
2 ) E(X) = 1, 2 e V ar(X) =
3) a) 38 ou 36?
b) 18.
4 ) E(X) = 7, 30
5)
7)
8) a) E(T ) = 4, 6
b) E(G) = 2, 75 e V ar(G) = 0, 4125
9)
69
UNIVERSIDADE FEDERAL DE CAMPINA GRANDE - Campus I
UNIDADE ACADÊMICA DE MATEMÁTICA E ESTATÍSTICA
Disciplina: Probabilidade e Estatística (6 créditos) Período 2009.2
Prof. Gilberto Matos e Areli Mesquita
Aluno(a): .
Capítulo 5 (Probabilidades):
Problema Página
1e2 105
5e6 106
8, 10 e 12 110
15, 16, 18, 19 e 21 115
25 121
26, 27, 28 e 30 122
34 e 36 123
40 e 41 124
70
UNIVERSIDADE FEDERAL DE CAMPINA GRANDE - Campus I
UNIDADE ACADÊMICA DE MATEMÁTICA E ESTATÍSTICA
Disciplina: Probabilidade e Estatística (6 créditos) Período 2009.2
Prof. Gilberto Matos e Areli Mesquita
Aluno(a): .
8a NOTA DE AULA
3. Uma pessoa é escolhida ao acaso dentre 1000: ou ela é do sexo masculino ou não (é
do sexo feminino);
71
Definição 7.1 (Distribuição de Bernoulli). Uma variável aleatória X, que assume
apenas os valores 0 e 1; é dita ter distribuição de Bernoulli com parâmetro p, 0 < p < 1,
se sua função de probabilidade é dada por
p, se x = 1
P (X = x) =
1 − p, se x = 0
Notação: X ∼ Ber(p).
Observação: Experimentos que resultam numa v.a. de Bernoulli são chamados en-
saios de Bernoulli.
Propriedades:
E(X) = p
V ar(X) = p(1 − p)
Exemplo:
Propriedades:
E(X) = np
V ar(X) = np(1 − p)
72
Exemplo:
1 - Dos estudantes de um certo colégio, 41% fumam cigarro. Numa pesquisa, pretende-
se escolher seis estudantes ao acaso para darem sua opinião sobre o fumo. Nesta
pesquisa, qual é a probabilidade de
Propriedades:
E(X) = np
V ar(X) = np(1 − p) N −n
N −1
,
73
Exemplo:
1. Durante o intervalo de uma hora, observar o número de carros que passam numa
rodovia;
2. Ao inspecionar a pintura de um carro, deseja-se observar o número de falhas;
3. Ao realizar o controle de qualidade de um produto alimentício, deseja-se conhecer o
número de bactérias.
Propriedades:
E(X) = λ
V ar(X) = λ
74
1 - Num livro de 800 páginas há 800 erros de impressão. Qual a probabilidade de que
uma página contenha pelo menos 3 erros?
75
UNIVERSIDADE FEDERAL DE CAMPINA GRANDE - Campus I
UNIDADE ACADÊMICA DE MATEMÁTICA E ESTATÍSTICA
Disciplina: Probabilidade e Estatística (6 créditos) Período 2009.2
Prof. Gilberto Matos e Areli Mesquita
Aluno(a): .
7a LISTA DE EXERCÍCIOS
Modelos Probabilísticos Discretos
2 - Sabendo-se que doze por cento dos que reservam lugar num vôo sistematicamente
faltam ao embarque e que o avião comporta 15 passageiros:
4 - Um fabricante de peças de automóvel garante que uma caixa de suas peças conterá,
no máximo, duas defeituosas. Se a caixa contém 20 peças, e a experiência tem
demonstrado que, em seu processo de fabricação, 6% das peças são defeituosas, qual
é a probabilidade de que uma caixa satisfaça a garantia?
76
UNIVERSIDADE FEDERAL DE CAMPINA GRANDE - Campus I
UNIDADE ACADÊMICA DE MATEMÁTICA E ESTATÍSTICA
Disciplina: Probabilidade e Estatística (6 créditos) Período 2009.2
Prof. Gilberto Matos e Areli Mesquita
Aluno(a): .
8a LISTA DE EXERCÍCIOS
Distribuição Binomial
a) De uma urna com dez bolas brancas e 20 pretas, vamos extrair, com reposição,
cinco bolas. X é o número de bolas brancas nas cinco extrações.
b) Refaça o problema anterior, mas dessa vez as n extrações são sem reposição.
c) Temos cinco urnas com bolas pretas e brancas e vamos extrair uma bola de
cada urna. Suponha que X seja o número de bolas brancas obtidas no final.
d) Vamos realizar uma pesquisa em dez cidades brasileiras, escolhendo ao acaso
um habitante de cada uma delas e classificando-o em pró ou contra um certo
projeto federal. Suponha que X seja o número de indivíduos contra o projeto
no final da pesquisa.
e) Em uma indústria existem 100 máquinas que fabricam determinada peça. Cada
peça é classificada como boa ou defeituosa. escolhemos ao acaso um instatnte
de tempo e verificamos uma peça de cada uma das máquinas. Suponha que X
seja o número de peças defeituosas.
2 - Numa certa cidade, nascem por ano 40% de crianças do sexo masculino. Nas famílias
com 4 crianças, qual a probabilidade de:
a) Se muitos dos segurados vivem em casas adjacentes, por que tal circunstância
pode invalidar o uso da distribuição binomial?
b) Suponha que os segurados morem em casas distantes umas das outras. Qual a
probabilidade de:
77
i) 0 incêndio?
ii) 1 incêndio?
6 - Em Campina Grande, nascem por ano 52% de crianças do sexo masculino. Nas
famílias com 4 crianças, qual a probabilidade de:
7 - Uma prova é composta de 10 questões objetivas, onde cada questão possui 5 alterna-
tivas com apenas uma correta. Sabendo-se que um estudante não sabe respondê-las
e irá apelar inteiramente pela sorte. Qual a probabilidadede que:
a) acerte 5 questões;
b) erre todas as questões;
c) acerte no mínimo 3 e, no máximo 5 questões;
d) qual o número esprerado de questões corretas?
78
9 - Num determinado processo de fabricação 10% das peças são consideradas defeituosas.
As peças são armazenadas em caixas com 5 unidades cada uma.
79
UNIVERSIDADE FEDERAL DE CAMPINA GRANDE - Campus I
UNIDADE ACADÊMICA DE MATEMÁTICA E ESTATÍSTICA
Disciplina: Probabilidade e Estatística (6 créditos) Período 2009.2
Prof. Gilberto Matos e Areli Mesquita
Aluno(a): .
9a NOTA DE AULA
Propriedades:
(b−a)2
E(X) = a+b
2
e V ar(X) = 12
Exemplo: Suponha que uma pane pode ocorrer em qualquer ponto de uma rede
elétrica de 10 Km. Obtenha a probabilidade de que uma pane ocorra em um ponto cuja
distância seja no máximo 1 Km das extremidades.
80
8.2 Distribuição Exponencial
Definição 8.2 (Distribuição Exponencial). Uma variável aleatória contínua X, as-
sumindo todos os valores não negativos, terá distribuição exponencial com parâmetro
α > 0, se sua f.d.p. é dada por
αe−αx , x > 0
f (x) =
0, c.c.
Notação: X ∼ Exp(α).
Propriedades:
1 1
(i) E(X) = α
e V ar(X) = α2
Exemplo: O tempo de vida (em horas) de um transistor pode ser considerado uma
variável aleatória com distribuição exponencial cuja média é igual a 500 horas. De acordo
com essas características, qual é a probabilidade de que um determinado transistor dure
mais do que a média?
81
8.3 Distribuição Normal (Gaussiana)
A distribuição Normal é talvez a mais importante das distribuições de probabilidade,
por razões que possivelmente ficarão claras ao longo deste curso. Erros de mensuração de
fenômenos físicos ou econômicos são freqüentemente modelados pela distribuição Normal,
mas esta não é a única aplicação desta densidade. Por exemplo, a distribuição dos pesos,
alturas e QI’s das pessoas numa população também já foram modelados com sucesso por
esta distribuição. A distribuição Normal tem a forma de um sino, e possui dois parâmetros,
µ e σ2 .
A distribuição Normal é também chamada de Gaussiana em homenagem ao matemático
Carl Friederich Gauss (1777 - 1855), que a utilizou pela primeira vez na modelagem de erros
de medida. A distribuição Normal também funciona como uma boa aproximação para outras
densidades. Por exemplo, sob algumas condições pode-se provar que a densidade Binomial
pode ser aproximada pela Normal.
Notação: X ∼ N(µ, σ 2 )
Devemos dizer que o primeiro parâmetro, µ (lê-se: mi), é a média ou o valor esperado
de X, enquanto que o segundo parâmetro, σ 2 (lê-se: sigma dois), é a variância de X. A
seguir exibimos gráfico das distribuições Normais com média zero e variâncias 1, 2 e 4.
82
8.3.1 Propriedades da Distribuição Normal
(1) f (x) dada pela expressão acima integra a 1, ou seja, a área sob a curva da normal é
igual a 1.
X −µ
Z= ∼ N(0, 1),
σ
tem distribuição normal reduzida ou normal padrão.
Observações:
83
3) Uma outra Tabela da distribuição Normal Padrão apresenta a seguinte proba-
bilidade: Z z
1 x2
P (−∞ < Z < z) = √ e− 2 dx
−∞ 2π
onde z é um valor real qualquer.
A probabilidade dada por P (−∞ < Z < z) corresponde a seguinte área:
a) P (100 ≤ X ≤ 106)
b) P (89 ≤ X ≤ 107)
c) P (112 ≤ X ≤ 116)
d) P (X ≥ 108)
a) P (X ≤ xα ) = 0, 05
b) P (X ≥ xα ) = 0, 99
84
UNIVERSIDADE FEDERAL DE CAMPINA GRANDE - Campus I
UNIDADE ACADÊMICA DE MATEMÁTICA E ESTATÍSTICA
Disciplina: Probabilidade e Estatística (6 créditos) Período 2009.2
Prof. Gilberto Matos e Areli Mesquita
Aluno(a): .
9a LISTA DE EXERCÍCIOS
Distribuição Normal
a) P (0 ≤ Z ≤ 1, 96);
b) P (Z < 1, 64);
c) P (Z < −2, 57);
d) o valor z, na tabela da normal padrão, tal que, P (Z < z) = 0, 025.
Resp.: a)
a) P (X ≥ 108);
b) P (X = 100);
c) P (89 ≤ X ≤ 107);
d) P (12 < X − µ < 16);
e) P (112 < X < 116);
f) P (X < 100 ou X > 106);
Resp.: a)
3 ) Uma v.a X tem Distribuição Normal, com média 50 e desvio padrão 10, i.é, X ∼
N(50; 102 ), determine o valor de A, B e C, nos seguintes casos:
Resp.: a)
85
4 ) Uma fábrica de carros sabe que a duração (X) dos motores de sua fabricação tem
distribuição aproximadamente normal, com média de 150.000 km e desvio padrão de
5.000 km, ou seja, X ∼ N(150.000; 5.0002). Qual a probabilidade de que um carro,
escolhido ao acaso, dos fabricados por essa firma, tenha um motor que dure:
Resp.: a)
5 ) Foi feito um estudo sobre a altura (X) dos alunos de uma faculdade, observando-se
que ela se distribuia com média 160 cm e variância 64 cm2 . Determinar:
a) P (X ≤ 176) ;
b) P(|X − 160| ≤ 8) ;
c) a porcentagem dos alunos com altura acima de 180 cm.
Resp.: a)
86
8 ) Numa fábrica foram instaladas 1.000 lâmpadas novas. Sabe-se que a duração média
das lâmpadas é de 800 horas e desvio padrão de 100 horas, com distribuição normal.
Qual a quantidade de lâmpadas que durarão:
Resp.: a)
Resp.: a)
11 ) Mostre que, em qualquer distribuição normal, a área sob a curva, determinada pelos
intervalos abaixo, é sempre a mesma e independe dos parâmetros da distribuição:
a) (µ − σ; µ + σ);
b) (µ − 2σ; µ + 2σ);
c) (µ − 3σ; µ + 3σ);
87
Respostas a serem confirmadas
1) a) 0, 0547 = 5, 47%
b) 0%
c) 0, 9053 = 90, 53%
d) 0, 0075 = 0, 75%
e) 0, 6151 = 61, 51%
2) a) A = 70;
b) B = 35;
c) C = 10.
4) a) 97, 72%
b) 68, 26%
c) 0, 62%
5) a) 1, 4 ∼
=1
b) 841, 3 ∼
= 841
c) 553, 4 ∼
= 553
88
UNIVERSIDADE FEDERAL DE CAMPINA GRANDE - Campus I
UNIDADE ACADÊMICA DE MATEMÁTICA E ESTATÍSTICA
Disciplina: Probabilidade e Estatística (6 créditos) Período 2009.2
Prof. Gilberto Matos e Areli Mesquita
Aluno(a): .
X não sim não não não sim sim não sim sim
Y 1 1 2 1 1 2 3 1 1 1
X não não sim não sim não não não sim não
Y 2 2 1 3 2 2 2 1 3 2
Podemos coletar as freqüências de ocorrência dos possíveis pares, construindo uma tabela
de freqüência conjunta de X e Y .
(X, Y ) freqüência
Total
Esta mesma tabela pode ser apresentada de maneira mais conveniente através da
tabela de dupla entrada, da seguinte forma:
89
X |Y Total
Total
Dessa forma, fica facilitada a tarefa de obter a tabela de freqüência individual para
cada variável que, pela posição em que seus valores aparecem na tabela de dupla entrada, é
chamada de tabela marginal de freqüência da variável X (ou Y ), ou simplesmente marginal
de X (ou Y ). Temos então para as variáveis X e Y , do exemplo anterior, as seguintes
tabelas de freqüência:
Y freqüência
X freqüência
Total
Total
Iremos considerar agora o caso de variáveis aleatórias discretas, definidas a partir das suas
funções de probabilidades. Iniciamos estendendo a definição de função de probabilidade
para o caso de duas variáveis.
90
A distribuição conjunta de probabilidades da variável (X, Y ) pode ser representada,
também, através de uma tabela de dupla entrada.
Exemplo 3. Uma região foi subdividida em 10 sub-regiões. Em cada uma delas, foram
observadas duas variáveis: número de poços artesianos (X) e número de riachos ou
rios presentes na sub-região (Y ). Os resultados são apresentados na tabela a seguir:
Sub-região 1 2 3 4 5 6 7 8 9 10
X 0 0 0 0 1 2 1 2 2 0
Y 1 2 1 0 1 0 0 1 2 2
Considerando que escolhemos uma das sub-regiões ao acaso, isto é, cada sub-região
tem mesma probabilidade 1/10 de ser escolhida, podemos construir a distribuição de
probabilidades conjunta de (X, Y ), tal como:
(X, Y ) P (X, Y )
Total
X|Y Total
Total
Quando trabalhamos com uma variável aleatória bidimensional podemos ter o interesse em
estudar o comportamento de uma única variável; ou seja; em conhecer a distribuição de
probabilidade de X ou de Y . Para isto precisamos considerar a distribuição de probabilidades
conjunta de (X, Y ) representada em uma tabela de dupla entrada, tal como:
91
Tabela 1: tabela de dupla entrada para apresentar a distribuição conjunta de (X,Y).
Y y1 ... yn
X Total
x1 p(x1 , y1) ... p(x1 , yn ) p(x1 )
x2 p(x2 , y1) ... p(x2 , yn ) p(x2 )
... ... ... ... ...
... ... ... ... ...
xm p(xm , y1 ) ... p(xm , yn ) p(xm )
Total p(y1 ) ... p(yn ) 1,0
(F, M) p(f, m)
(8,3) 3/10
(8,4) 1/10
(8,5) 1/10
(9,3) 2/10
(9,4) 1/20
(9,5) 1/10
(10,4) 1/10
(10,5) 1/20
Total 1
92
Suponha agora que exista o interesse em estudar as variáveis F + M e F.M. Para
isto, podemos acrescentar, à tabela anterior, algumas colunas correspondentes aos valores
dessas novas variáveis. Vejamos:
Z =z 11 12 13 14 15
P (Z = z)
W =w 24 27 32 36 40 45 50
P (W = w)
P (X = x, Y = y)
P (X = x | Y = y) = , se P (Y = y) > 0.
P (Y = y)
93
Definição 9.4 (Variáveis aleatórias independentes). Duas variáveis aleatórias
discretas são independentes, se a ocorrência de qualquer valor de uma delas não altera
a chance de ocorrência de valores da outra. Ou seja,
P (X = x | Y = y) = P (X = x),
para todos os possíveis valores (x, y) das variáveis (X, Y ). Como definição alternativa
podemos usar:
P (X = x, Y = y) = P (X = x)P (Y = y),
para quaisquer (x, y).
X |Y 1 2 3
1 0 1/5 0
2 1/5 1/5 1/5
3 0 1/5 0
Quando as variáveis não são independentes isto quer dizer que existe uma certa relação entre
as variáveis. Esta relação pode ser de qualquer tipo, como por exemplo uma relação linear,
quadrática, exponencial, etc. Nosso objetivo aqui não será o de determinar qual o tipo
de relação que existe entre as variáveis em questão e sim o de medir o grau de correlação
entre as variáveis. Neste curso iremos medir o grau de correlação linear entre variáveis
quantitativas discretas. Na literatura existem outras medidas de correlação, inclusive entre
variáveis qualitativas, porém este não será o nosso objetivo neste curso.
Antes de definirmos a medida de correlação linear entre as variáveis vamos enunciar
algumas propriedades envolvendo o valor esperado de funções de variáveis aleatórias.
94
Propriedade 1: Para variáveis aleatórias X e Y , vale sempre que
No caso do produto de duas variáveis aleatórias nem sempre é válido que o valor
esperado do produto é o produto dos valores esperados. Neste caso temos o seguinte
resultado:
Propriedade 2: Se X e Y são duas variáveis aleatórias independentes, então
E(XY ) = E(X)E(Y ).
E(XY ) = E(X)E(Y ),
X |Y 2 3 4
-1 2/12 0 3/12
0 0 1/12 1/12
1 1/12 2/12 2/12
Definição 9.5. Uma medida de dependência linear entre X e Y é dada pela covari-
ância:
Cov(X, Y ) = E[(X − E(X))(Y − E(Y ))].
95
Definição 9.6 (Coeficiente de correlação linear). O coeficiente de correlação
linear entre as variáveis aleatórias X e Y é calculado pela seguinte expressão:
Cov(X, Y )
ρX,Y = .
σX σY
Onde, σX e σY são respectivamente os desvios-padrão das variáveis X e Y .
96
UNIVERSIDADE FEDERAL DE CAMPINA GRANDE - Campus I
UNIDADE ACADÊMICA DE MATEMÁTICA E ESTATÍSTICA
Disciplina: Probabilidade e Estatística (6 créditos) Período 2009.2
Prof. Gilberto Matos e Areli Mesquita
Aluno(a): .
3 - Uma moeda equilibrada é lançada duas vezes de forma independente. Ao final dos
lançamentos, duas variáveis aleatórias são anotadas: o número total de caras (C) e
o número de coroas no 2ž lançamento (K).
a) Construa uma tabela com a distribuição conjunta das variáveis C e K.
b) Determine o valor esperado de C.
97
a) Complete a tabela.
b) X e Y são independentes?
c) Obtenha as marginais de X e Y.
d) Calcule a distribuição da variável W = XY.
e) Calcule ρ(X, Y ).
6 - Na caixa I existem duas bolas numeradas 0 e 1, enquanto que a caixa II contêm duas
bolas numeradas -1 e 0. Uma bola é retirada aleatoriamente de cada caixa, de forma
independente uma da outra. A esse experimento, associamos as variáveis aleatórias:
número da bola retirada na caixa I (X), soma dos valores das duas bolas retiradas
(Y ) e a diferença, em módulo, desses valores (Z).
a) Determine a distribuição de probabilidade conjunta entre Xe Y e entre Y e Z.
b) Verifique se Xe Y são independentes. Idem para Y e Z.
c) Calcule a Cov(X, Y ) .
d) Obtenha V ar (X + Y ) .
98
UNIVERSIDADE FEDERAL DE CAMPINA GRANDE - Campus I
UNIDADE ACADÊMICA DE MATEMÁTICA E ESTATÍSTICA
Disciplina: Probabilidade e Estatística (6 créditos) Período 2009.2
Prof. Gilberto Matos e Areli Mesquita
Aluno(a): .
99
EXERCÍCIOS EXTRAS
1 - Por engano 3 peças defeituosas foram misturadas com peças boas formando um lote
de 12 peças no total. Escolhendo, ao acaso, 4 dessas peças, determine a probabilidade
de encontrar:
a) Pelo menos 2 defeituosas.
b) No máximo 1 defeituosa.
c) No mínimo uma boa.
a) Todos da espécie A.
b) Nem todos serem da espécie B.
c) A maioria ser da espécie A.
3 - Admite-se que uma pane pode ocorrer em qualquer ponto de uma rede elétrica de 10
quilômetros.
4 - Suponha que o valor esperado de uma variável aleatória com distribuição Uniforme
contínua é igual a 1 e a variância é 1/12. Encontre a probabilidade da variável assumir
valores menores que 3/4.
5 - O tempo necessário para um medicamento contra dor fazer efeito foi modelado de
acordo com a densidade Uniforme no intervalo de 5 a 15 minutos, tendo por base
experimentos conduzidos em animais. Um paciente, que esteja sofrendo dor, recebe o
remédio e, supondo válido o modelo mencionado acima, pergunta-se a probabilidade
da dor:
100
a) P(T < 1).
b) P(T > 1 | T > 2).
c) Um número a tal que P(T < a) = 0,4.
101