Estat´ıstica

Heyder Diniz Silva
Sum´ario
1 Introdu¸c˜ao 7
2 Estat´ıstica descritiva 9
2.1 Organiza¸ c˜ ao e apresenta¸ c˜ ao de dados. . . . . . . . . . . . . . . . . . . . . . 9
2.1.1 Apresenta¸ c˜ ao tabular . . . . . . . . . . . . . . . . . . . . . . . . . . 11
2.1.1.1 Distribui¸ c˜ oes de freq¨ uˆencias . . . . . . . . . . . . . . . . . 11
2.1.1.2 Distribui¸ c˜ oes de freq¨ uˆencias acumuladas . . . . . . . . . . 16
2.1.2 Apresenta¸ c˜ ao gr´ afica . . . . . . . . . . . . . . . . . . . . . . . . . . 19
2.1.2.1 Histogramas . . . . . . . . . . . . . . . . . . . . . . . . . . 19
2.1.2.2 Pol´ıgonos de freq¨ uˆencia . . . . . . . . . . . . . . . . . . . 20
2.1.2.3 Gr´ afico de setores (pizza) . . . . . . . . . . . . . . . . . . 21
2.1.2.4 Ogivas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
2.2 Medidas de Posi¸ c˜ ao e dispers˜ ao . . . . . . . . . . . . . . . . . . . . . . . . 25
2.2.1 Medidas de Posi¸ c˜ ao . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
2.2.1.1 M´edia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
2.2.1.2 Mediana . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
2.2.1.3 Moda . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
2.2.1.4 Separatrizes (Quantis) . . . . . . . . . . . . . . . . . . . . 38
2.2.2 Medidas de disperss˜ ao . . . . . . . . . . . . . . . . . . . . . . . . . 40
2.2.2.1 Amplitude Total (A) . . . . . . . . . . . . . . . . . . . . . 41
2.2.2.2 Variˆ ancia e desvio padr˜ ao . . . . . . . . . . . . . . . . . . 42
2.2.2.3 Coeficiente de varia¸ c˜ ao . . . . . . . . . . . . . . . . . . . . 47
2
3
2.2.2.4 Erro padr˜ ao da m´edia . . . . . . . . . . . . . . . . . . . . 48
2.2.2.5 Momentos, Assimetria e Curtose . . . . . . . . . . . . . . 48
3 Probabilidades 54
3.1 Processo aleat´ orio: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54
3.2 Espa¸ co amostral e Eventos . . . . . . . . . . . . . . . . . . . . . . . . . . 55
3.3 Probabilidade . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
3.4 Probabilidade Condicionada . . . . . . . . . . . . . . . . . . . . . . . . . . 58
3.5 Independˆencia de eventos. . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
3.6 Teorema de Bayes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60
4 Vari´aveis aleat´ orias 63
4.1 Vari´ aveis Aleat´ orias Unidimensionais. . . . . . . . . . . . . . . . . . . . . . 63
4.1.1 Distribui¸ c˜ oes de Probabilidades . . . . . . . . . . . . . . . . . . . . 63
4.1.2 Fun¸ c˜ ao Reparti¸ c˜ ao ou Distribui¸ c˜ ao Acumulada F(x) . . . . . . . . . 64
4.2 Vari´ aveis Aleat´ orias Bidimensionais . . . . . . . . . . . . . . . . . . . . . . 65
4.2.1 Distribui¸ c˜ ao Conjunta de duas vari´ aveis aleat´ orias . . . . . . . . . . 66
4.2.2 Distribui¸ c˜ ao Marginal . . . . . . . . . . . . . . . . . . . . . . . . . 67
4.2.3 Vari´ aveis Aleat´ orias Independentes . . . . . . . . . . . . . . . . . . 68
4.2.4 Esperan¸ ca Matem´ atica . . . . . . . . . . . . . . . . . . . . . . . . . 68
4.2.4.1 Propriedades da Esperan¸ ca Matem´ atica . . . . . . . . . . 69
4.2.5 Variˆ ancia de uma vari´ avel aleat´ oria. . . . . . . . . . . . . . . . . . . 70
4.2.5.1 Propriedades da variˆ ancia . . . . . . . . . . . . . . . . . . 71
4.2.6 Covariˆ ancia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72
4.3 Distribui¸ c˜ oes de vari´ aveis aleat´ orias discretas . . . . . . . . . . . . . . . . . 72
4.3.1 Distribui¸ c˜ ao Uniforme Discreta . . . . . . . . . . . . . . . . . . . . 72
4.3.2 Distribui¸ c˜ ao de Bernoulli . . . . . . . . . . . . . . . . . . . . . . . 73
4.3.3 Distribui¸ c˜ ao Binomial. . . . . . . . . . . . . . . . . . . . . . . . . . 74
4.3.4 Distribui¸ c˜ ao de Poison . . . . . . . . . . . . . . . . . . . . . . . . . 78
4.3.4.1 Aproxima¸ c˜ ao da distribui¸ c˜ ao Binomial a Poisson. . . . . . 80
4
4.3.5 Distribui¸ c˜ ao Geom´etrica . . . . . . . . . . . . . . . . . . . . . . . . 81
4.3.6 Distribui¸ c˜ ao Pascal (Binomial Negativa) . . . . . . . . . . . . . . . 83
4.3.7 Distribui¸ c˜ ao Hipergeom´etrica . . . . . . . . . . . . . . . . . . . . . 85
4.3.8 Distribui¸ c˜ ao Multinomial . . . . . . . . . . . . . . . . . . . . . . . . 86
4.4 Distribui¸ c˜ oes de vari´ aveis aleat´ orias cont´ınuas . . . . . . . . . . . . . . . . 87
4.4.1 Distribui¸ c˜ ao Uniforme . . . . . . . . . . . . . . . . . . . . . . . . . 87
4.4.2 Distribui¸ c˜ ao Normal . . . . . . . . . . . . . . . . . . . . . . . . . . 88
4.4.2.1 Distribui¸ c˜ ao Normal Reduzida ou Padronizada. . . . . . . 90
4.4.3 Distribui¸ c˜ ao Exponencial . . . . . . . . . . . . . . . . . . . . . . . . 93
4.4.4 Distribui¸ c˜ ao Qui-Quadrado . . . . . . . . . . . . . . . . . . . . . . 95
4.4.5 Distribui¸ c˜ ao t de Student . . . . . . . . . . . . . . . . . . . . . . . . 96
4.4.6 Distribui¸ c˜ ao F de Snedcor . . . . . . . . . . . . . . . . . . . . . . . 97
4.4.7 Aproxima¸ c˜ ao da Distribui¸ c˜ ao Binomial ` a Normal . . . . . . . . . . 97
5 Amostragem 100
5.1 Introdu¸ c˜ ao. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100
5.1.1 Defini¸ c˜ oes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100
5.1.2 Importˆ ancia do uso de amostras. . . . . . . . . . . . . . . . . . . . 101
5.1.3 Vantagens do processo de amostragem em rela¸ c˜ ao ao censo. . . . . 102
5.2 T´ecnicas de amostragem. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103
5.2.1 Principais t´ecnicas de amostragem probabil´ısticas. . . . . . . . . . . 104
5.2.1.1 Amostragem Simples ao Acaso . . . . . . . . . . . . . . . 104
5.2.1.2 Amostragem Sistem´ atica . . . . . . . . . . . . . . . . . . . 104
5.2.1.3 Amostragem por Conglomerados . . . . . . . . . . . . . . 104
5.2.1.4 Amostragem Estratificada . . . . . . . . . . . . . . . . . . 104
5.2.2 Principais t´ecnicas de amostragem n˜ ao probabil´ısticas. . . . . . . . 106
5.2.2.1 Inacessibilidade a toda popula¸ c˜ ao . . . . . . . . . . . . . . 106
5.2.2.2 Amostragem sem norma (a esmo) . . . . . . . . . . . . . . 106
5.2.2.3 Popula¸ c˜ ao formada por material cont´ınuo. . . . . . . . . . 106
5.2.2.4 Intencional . . . . . . . . . . . . . . . . . . . . . . . . . . 106
5
5.3 Distribui¸ c˜ oes Amostrais . . . . . . . . . . . . . . . . . . . . . . . . . . . . 106
5.3.1 Distribui¸ c˜ ao amostral da m´edia . . . . . . . . . . . . . . . . . . . . 107
5.3.1.1 Amostragem com reposi¸ c˜ ao . . . . . . . . . . . . . . . . . 107
5.3.1.2 Amostragem sem reposi¸ c˜ ao . . . . . . . . . . . . . . . . . 110
6 Inferˆencia 112
6.1 Teoria da estima¸ c˜ ao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 112
6.1.1 Defini¸ c˜ oes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 112
6.1.2 Propriedades dos Estimadores . . . . . . . . . . . . . . . . . . . . . 113
6.1.2.1 N˜ ao tendenciosidade . . . . . . . . . . . . . . . . . . . . . 113
6.1.2.2 Consistˆencia. . . . . . . . . . . . . . . . . . . . . . . . . . 115
6.1.2.3 Eficiˆencia . . . . . . . . . . . . . . . . . . . . . . . . . . . 115
6.1.3 Intervalos de confian¸ ca . . . . . . . . . . . . . . . . . . . . . . . . . 116
6.1.3.1 Intervalo de confian¸ ca para a m´edia µ . . . . . . . . . . . 116
6.1.3.1.1 Variˆ ancia conhecida . . . . . . . . . . . . . . . . 116
6.1.3.1.2 Variˆ ancia desconhecida . . . . . . . . . . . . . . . 118
6.1.3.2 Diferen¸ ca entre duas m´edia (µ
a
−µ
b
) . . . . . . . . . . . . 119
6.1.3.2.1 Variancias Conhecidas: . . . . . . . . . . . . . . . 119
6.1.3.2.2 Variancias Desconhecidas: . . . . . . . . . . . . . 120
6.1.3.3 Intervalo de confian¸ ca para propor¸ c˜ ao . . . . . . . . . . . 121
6.1.3.3.1 Amostras grandes (n > 30) . . . . . . . . . . . . 121
6.1.3.3.2 Amostras pequenas (n ≤ 30) . . . . . . . . . . . . 122
6.1.3.4 Intervalo de confian¸ ca para a diferen¸ ca entre propor¸ c˜ oes . 122
6.1.3.4.1 Amostras grandes (n > 30) . . . . . . . . . . . . 122
6.1.3.4.2 Amostras pequenas (n ≤ 30) . . . . . . . . . . . . 123
6.1.3.5 Intervalo de confian¸ ca para a variˆ ancia (σ
2
) . . . . . . . . 123
6.2 Teoria da decis˜ ao (Testes de Hip´ oteses) . . . . . . . . . . . . . . . . . . . . 123
6.2.1 Metodologia de um teste de hip´ otese . . . . . . . . . . . . . . . . . 124
6.2.2 Tipos de erros . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 126
6.2.3 Tipos de testes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127
6
6.2.4 Algoritmo para realiza¸ c˜ ao de um teste de hip´ otese . . . . . . . . . . 128
6.2.5 Estat´ıstica apropriadas para os testes de hip´ oteses . . . . . . . . . . 130
6.2.6 Teste de Qui-Quadrado (χ
2
) . . . . . . . . . . . . . . . . . . . . . . 131
6.2.6.1 Teste de aderˆencia . . . . . . . . . . . . . . . . . . . . . . 131
6.2.6.2 Teste de independencia . . . . . . . . . . . . . . . . . . . . 133
7 Regress˜ao e Correla¸c˜ao linear 136
Cap´ıtulo 1
Introdu¸c˜ao
O cidad˜ ao comum pensa que a estat´ıstica se resume apenas a apresentar
tabelas de n´ umeros em colunas esportivas e ou econˆ omicas de jornais e revistas, ilustradas
com gr´ aficos, pilhas de moedas, etc. ou quando muito associam a estat´ıstica ` a previs˜ ao de
resultados eleitorais. Mas estat´ıstico de hoje n˜ ao se limita a compilar tabelas de dados e
os ilustrar graficamente. Pois ` a partir de 1925, com os trabalhos de Fisher, a estat´ıstica
iniciou-se como m´etodo cient´ıfico, ent˜ ao, o trabalho do estat´ıstico passou a ser o de ajudar
a planejar experimentos, interpretar e analisar os dados experimentais e apresentar os re-
sultados de maneira a facilitar a tomada de decis˜ oes razo´ aveis. Deste modo, podemos ent˜ ao
definir estat´ıstica como sendo a ciˆencia que se preocupa com a coleta, organiza¸ c˜ ao, apre-
senta¸ c˜ ao, an´ alise e interpreta¸ c˜ ao de dados. Didaticamente podemos dividir a estat´ıstica
em duas partes a estat´ıstica descritiva e a inferˆencia estat´ıstica. A estat´ıstica descritiva
se refere a maneira de apresentar um conjunto de dados em tabelas e gr´ aficos, e ao modo
de resumir as informa¸ c˜ oes contidas nestes dados a algumas medidas. J´ a a inferˆencia es-
tat´ıstica baseia-se na teoria das probabilidades para estabelecer conclus˜ oes sobre todo um
grupo (chamado popula¸ c˜ ao), quando se observou apenas uma parte (amostra) desta pop-
ula¸ c˜ ao.
´
E necess´ ario ter em mente que a estat´ıstica ´e uma ferramenta para o pesquisador,
nas respostas dos “por quˆes” de seus problemas. E que para ela ser bem usada ´e necess´ ario
conhecer os seus fundamentos e princ´ıpios, e acima de tudo que o pesquisador desenvolva
um esp´ırito cr´ıtico e jamais deixe de pensar. Pois ”em ciˆencia ´e f´ acil mentir usando a
7
8
estat´ıstica, o dif´ıcil ´e falar a verdade sem usar a estat´ıstica”.
Cap´ıtulo 2
Estat´ıstica descritiva
2.1 Organiza¸c˜ao e apresenta¸c˜ao de dados.
As observa¸ c˜ oes s˜ ao o material b´ asico com que o pesquisador trabalha. Es-
tas observa¸ c˜ oes podem ser por exemplo a produtividade de uma planta, a velocidade de
processamento de um computador, a resistˆencia ` a ruptura de determinado cabo, suscetibil-
idade ou n˜ ao de um indiv´ıduo a determinada doen¸ ca, cor de uma flor, sexo do primeiro
filho de um casal, opini˜ ao dos alunos quanto a did´ atica de um professor, etc. Estas ob-
serva¸ c˜ oes apresentam uma caracter´ıstica em comum que ´e a varia¸ c˜ ao ou variabilidade, ou
seja assumem diferentes valores de indiv´ıduo para indiv´ıduo.
Uma caracter´ıstica que pode assumir diferentes valores de indiv´ıduo para
indiv´ıduo ´e denominada vari´ avel. Caso contr´ ario ´e denominada constante. As vari´ aveis
s˜ ao classificadas em:
• QUALITATIVAS: S˜ ao aquelas para as quais uma medi¸ c˜ ao num´erica n˜ ao ´e poss´ıvel.
Ex: Cor de flor, sexo, sabor.
• QUANTITATIVAS: S˜ ao aquelas para as quais ´e poss´ıvel se realizar-se uma medi¸ c˜ ao
num´erica, subdivide-se em:
– DISCRETAS: Pr´ oprias de dados de contagem, ou seja s´ o assumem valores in-
teiros. Ex: n´ umero de filhos, n´ umero de acidentes de trˆ ansito ocorridos num
9
10
certo per´ıodo, etc.
– CONT
´
INUAS: S˜ ao aquelas origin´ arias de medi¸ c˜ oes, deste modo, podem assumir
qualquer valor real entre dois extremos. Ex: Peso corporal, altura, resistˆencia
a ruptura, volume, etc.
Os dados coletados no campo e trazidos para o laborat´ orio (escrit´ orio), na
forma em que se encontram, como os apresentados na Tabela 2.1, s˜ ao denominados dados
brutos. Normalmente este tipo de dados tr´ as pouca ou nenhuma informa¸ c˜ ao ao leitor,
sendo necess´ ario uma elabora¸ c˜ ao (organiza¸ c˜ ao) destes dados, afim de aumentar sua ca-
pacidade de informa¸ c˜ ao.
Tabela 2.1: Diˆ ametro ` a altura do peito (DAP), em mm de 40 p´es de Eucalyptus citriodora
aos 6 anos de idade em Lavras - MG
104 122 129 144 183
108 142 138 151 138
138 106 122 146 115
101 201 161 82 179
163 169 167 137 142
141 120 189 132 111
90 210 132 172 140
154 98 127 87 136
A mais simples organiza¸ c˜ ao num´erica ´e ordena¸ c˜ ao dados em ordem crescente
ou decrescente (ROL). Como pode-se observar na Tabela 2, a simples organiza¸ c˜ ao dos
dados em um Rol, aumenta muito a capacidade de informa¸ c˜ ao destes. Pois enquanto a
Tabela 2.1 nos informava apenas que t´ınhamos 40 p´es de Eucalipto, e alguns D.A.P., na
Tabela 2.2, verificamos que o menor diˆ ametro observado foi 82 mm e o maior 210 mm, o
que nos fornece uma amplitude total de varia¸ c˜ ao da ordem de 128 mm.
Amplitude total
11
A = maior valor observado −menor valor observado (2.1)
A = 210mm−82mm = 128mm
Pode-se observar ainda que alguns diˆ ametros como 122 mm, 132 mm 138
mm e 142 mm s˜ ao mais comuns.
Tabela 2.2: Tabela 2. Diˆ ametro ` a altura do peito (DAP), em mm de 40 p´es de Eucalyptus
citriodora aos 6 anos de idade em Lavras - MG
82 111 132 142 167
87 115 136 142 169
90 120 137 144 172
98 122 138 146 179
101 122 138 151 183
104 127 138 154 189
106 129 140 161 201
108 132 141 163 210
2.1.1 Apresenta¸c˜ao tabular
2.1.1.1 Distribui¸c˜ oes de freq¨ uˆencias
Ap´ os esta primeira organiza¸ c˜ ao dos dados, podemos ainda agrupa-los em
classes de menor tamanho, afim de aumentar sua a capacidade de informa¸ c˜ ao.
Distribuindo-se os dados observados em classes e contando-se o numero de in-
div´ıduos contidos em cada classe, obt´em-se a freq¨ uˆencia de classe. A disposi¸ c˜ ao tabular dos
dados agrupados em classes, juntamente com as freq¨ uˆencias correspondentes denomina-se
distribui¸ c˜ ao de freq¨ uˆencia.
Para identificar uma classe, deve-se conhecer os valores dos limites inferior
e superior da classe, que delimitam o intervalo de classe. Por exemplo, para o caso dos
12
DAP dos eucaliptos, pode-se desejar incluir em uma ´ unica classe todos os indiv´ıduos que
possuam DAP entre 120 e 138 mm assim, o intervalo de classe seria de 120 mm a 138 mm.
Neste ponto surge uma d´ uvida fundamental. Indiv´ıduos que apresentem
DAP exatamente iguais a 120 mm ou a 138 mm pertencem ou n˜ ao a esta classe? Deste
modo surge a necessidade de definir a natureza do intervalo de classe, se ´e aberto ou
fechado. Quando o intervalo de classe ´e aberto, os limites da classe n˜ ao pertencem a ela, e
quando o intervalo ´e fechado, os limite de classe pertencem a classe em quest˜ ao. Nota¸ c˜ ao:
• Intervalos abertos
]128mm - 138mm[
• Intervalos fechados
[128mm - 138mm]
(128mm - 138mm)
• Intervalos mistos
S˜ ao fechados em um extremo e abertos no outro, como por exemplo:
[128mm - 138mm[
para este tipo de intervalo pode-se utilizar ainda a seguinte nota¸ c˜ ao:
128mm ¬ 138mm
Constru¸ c˜ ao de uma distribui¸ c˜ ao de freq¨ uˆencia
Para montar uma distribui¸ c˜ ao de freq¨ uˆencia ´e necess´ ario que primeiramente
se determine o n´ umero de classes (k) em que os dados ser˜ ao agrupados. Por quest˜ oes de
ordem pr´ atica e est´etica sugere-se utilizar de 5 a 20 classes. Uma indica¸ c˜ ao do n´ umero de
classes a ser utilizado, em fun¸ c˜ ao do n´ umero de dados (n) ´e:
1. n ≤ 100
k =

n. (2.2)
13
2. n > 100
k = 5log(n). (2.3)
3. Crit´erio de SCOTT (1979), baseado na normalidade dos dados:
k =
An
1
3
3.49s
(2.4)
em que:
A ´e a amplitude total;
s ´e o desvio padr˜ ao;
n ´e o n´ umero de observa¸ c˜ oes.
Ap´ os determinado o n´ umero de classes (k) em que os dados ser˜ ao agrupados,
deve-se ent˜ ao determinar o intervalo de classe (c ), que ´e dado pela seguinte express˜ ao:
c =
A
k −1
(2.5)
em que:
c ´e amplitude de classe;
A ´e a amplitude total;
k ´e o n´ umero de classes.
Conhecida a amplitude de classes, determina-se ent˜ ao os intervalos de classe.
Os limites inferior e superior das classes devem ser escolhidos de modo que o menor valor
observado esteja localizado no ponto m´edio da primeira classe, que ´e dado por:
PM =
L
inf
−Lsup
2
(2.6)
em que:
L
inf
´e o limite inferior da classe;
L
sup
´e o limite superior da classe;
Assim, o limite inferior da primeira classe ser´ a:
L
inf1
= menorvalor −
c
2
(2.7)
14
E os demais limites s˜ ao obtidos somando-se c ao limite anterior.
A t´ıtulo de ilustra¸ c˜ ao agruparemos os dados referentes ao DAP de eucaliptos
em classes
1
o
Amplitude total (A)
A = maior valor observado - menor valor observado = 210 -82 =128 mm.
2
o
Determinar o n´ umero de classes (k)
n = 40
K =

40 = 6, 32
, como o n´ umero de classes ´e inteiro usaremos 6 classes.
3
o
Determinar a amplitude de classe (c)
c =
128
6 −1
= 25, 6mm
4
o
Determinar o limite inferior da primeira classe (Li)
L
inf1
= menorvalor −
c
2
L
inf1
= 82 −
25.6
2
= 69, 2
5
o
Determinar os intervalos de classe
69, 2 ¬ 94, 8
94, 8 ¬ 120, 4
120, 4 ¬ 146, 0
146, 0 ¬ 171, 6
171, 6 ¬ 197, 2
197, 2 ¬ 222, 8
6
o
Montar a distribui¸ c˜ ao de freq¨ uˆencia.
Para montar a distribui¸ c˜ ao de freq¨ uˆencia, basta apresentar as classes obtidas
na forma tabular e contar quantos indiv´ıduos existem em classe.
Apresentando os dados na forma de distribui¸ c˜ ao de freq¨ uˆencia, sintetiza-se a
informa¸ c˜ ao contida nos mesmos, al´em de facilitar sua visualiza¸ c˜ ao. Pois pode-se verificar
claramente na Tabela 2.3 que os DAP dos 40 p´es de Eucalyptus citriodora em quest˜ ao est˜ ao
concentrados entorno dos valores centrais, decrescendo em dire¸ c˜ ao aos valores extremos.
A apresenta¸ c˜ ao dos dados em forma de distribui¸ c˜ ao de freq¨ uˆencia facilita ainda o c´ alculo
15
Tabela 2.3: Distribui¸ c˜ ao de freq¨ uˆencias dos DAP de 40 p´es de Eucalyptus citriodora aos 6
anos de idade em Lavras - MG.
Classes (mm) Tabula¸ c˜ ao Freq¨ uˆencia
69, 2 ¬ 94, 8 [[[ 3
94, 8 ¬ 120, 4 [[[[[[[[ 8
120, 4 ¬ 146, 0 [[[[[[[[[[[[[[[[ 16
146, 0 ¬ 171, 6 [[[[[[[ 7
171, 6 ¬ 197, 2 [[[[ 4
197, 2 ¬ 222, 8 [[ 2
Total 40
de v´ arias medidas estat´ısticas de interesse, al´em de permitir a apresenta¸ c˜ ao gr´ afica dos
mesmos.
Freq¨ uˆencia Absoluta e Freq¨ uˆencia Relativa.
As freq¨ uˆencias apresentadas na Tabela 2.3 s˜ ao denominadas freq¨ uˆencias ab-
solutas, pois indicam o n´ umero de observa¸ c˜ oes pertencentes a cada classe, este tipo de
freq¨ uˆencia apresenta a limita¸ c˜ ao de sua interpreta¸ c˜ ao ser dependente do n´ umero total de
observa¸ c˜ oes. Para solucionar este problema utiliza-se a freq¨ uˆencia relativa, que expressa
a quantidade de observa¸ c˜ oes pertencentes a uma classe, em rela¸ c˜ ao ao n´ umero total de
observa¸ c˜ oes, e ´e dada por:
Fr
i
=
F
i
¸
k
i=1
F
i
(2.8)
e que,
Fr
i
´e a freq¨ uˆencia relativa da i-´essima classe;
F
i
´e a freq¨ uˆencia absoluta da i-´essima classe;
Assim a Tabela 2.3 pode ser apresentada do seguinte modo:
16
Tabela 2.4: Distribui¸ c˜ ao de freq¨ uˆencias dos DAP de 40 p´es de Eucalyptus citriodora aos 6
anos de idade em Lavras - MG.
Classes (mm) Freq¨ uˆencia Absoluta Freq¨ uˆencia Relativa Freq¨ uˆencia Relativa (%)
69, 2 ¬ 94, 8 3 0,075 7,5
94, 8 ¬ 120, 4 8 0,200 20,0
120, 4 ¬ 146, 0 16 0,400 40,0
146, 0 ¬ 171, 6 7 0,175 17,5
171, 6 ¬ 197, 2 4 0,100 10,0
197, 2 ¬ 222, 8 2 0,050 5,0
Total 40 1,000 100,0
2.1.1.2 Distribui¸c˜ oes de freq¨ uˆencias acumuladas
Muitas vezes pode-se estar interessado n˜ ao em saber a quantidade de ob-
serva¸ c˜ oes que existe numa determinada classe, mas sim a quantidade de observa¸ c˜ oes acima
ou abaixo de um determinado ponto na distribui¸ c˜ ao.
Deste modo, a soma das freq¨ uˆencias de todos os valores abaixo do limite
superior de uma determinada classe ´e definida como freq¨ uˆencia acumulada para baixo
deste ponto, assim como a soma das freq¨ uˆencias de todos os valores acima do limite
inferior de uma classe ´e denominada freq¨ uˆencia acumulada para cima.
A t´ıtulo de ilustra¸ c˜ ao, est˜ ao apresentadas nas Tabelas 2.5 e 2.6, respec-
tivamente, as freq¨ uˆencias acumuladas para cima e para baixo dos DAP dos 40 p´es de
Eucalyptus citriodra o em quest˜ ao.
Aplica¸ c˜ oes das distribui¸ c˜ oes de freq¨ uˆencias acumuladas
Para verificar qual a porcentagem de p´es de Eucalyptus citriodra que pos-
suem DAP inferior a 146 mm basta consultar diretamente a Tabela 2.5 e verificar a
freq¨ uˆencia acumulada abaixo deste valor (6,75%), pois o valor 146 mm ´e um dos lim-
ites de classe apresentados nesta tabela. Mas como proceder para obter as freq¨ uˆencias
acumuladas para valores intermedi´ arios aos apresentados na tabela? Como por exemplo a
17
Tabela 2.5: Distribui¸ c˜ ao de freq¨ uˆencia acumulada para baixo dos DAP de 40 p´es de
Eucalyptus citriodra aos 6 anos de idade em Lavras - MG.
Freq¨ uˆencia Acumulada
Diˆ ametro (mm) Absoluta Relativa
Abaixo de 69,2 0 0,000
Abaixo de 94,8 3 0,075
Abaixo de 120,4 11 0,275
Abaixo de 146,0 27 0,675
Abaixo de 171,6 34 0,850
Abaixo de 197,2 38 0,950
Abaixo de 222,8 40 1,000
freq¨ uˆencia acumulada abaixo de 150 mm?
Para este tipo de c´ alculo, pressup˜ oe-se que os diˆ ametros estejam uniforme-
mente distribu´ıdos dentro das classes, e procede-se do seguinte modo:
Freq. acumulada abaixo, da classe imediatamente inferior a 150 (abaixo de
146)= 0,675;
Freq. acumulada abaixo, da classe imediatamente superior a 150 (abaixo de
171,6) = 0,850;
Freq. abaixo de 146,0 mm = 0,675
Freq. abaixo de 171,6 mm = 0,850
Assim,
Freq. entre 146,0 e 171,6 mm =0, 850 −0, 675 = 0, 175
de 146,0 a 171,6 mm s˜ ao 25,6 mm de 146,0 a 150,0 mm s˜ ao 4,0 mm
ent˜ ao,
para uma diferen¸ ca de 25,6 mm existem 0,175 dos DAP;
para uma diferen¸ ca de 4,0 mm existir˜ ao x dos DAP;
ou seja
18
Tabela 2.6: Distribui¸ c˜ ao de freq¨ uˆencia acumulada para cima dos DAP de 40 p´es de Euca-
lyptus citriodra aos 6 anos de idade em Lavras - MG.
Freq¨ uˆencia Acumulada
Diˆ ametro (mm) Absoluta Relativa
Acima de 69,2 40 1,000
Acima de 94,8 37 0,925
Acima de 120,4 29 0,725
Acima de 146,0 13 0,325
Acima de 171,6 6 0,150
Acima de 197,2 2 0,050
Acima de 222,8 0 0,000
25,6 mm → 0,175
4,0 → x
de onde verifica-se que x = 0, 0273.
Como abaixo de 140,0 mm existem 0,675 dos DAP, e entre 140,0 e 150 mm
existem 0,0273, conclui-se que abaixo de 150 mm existam 0,675 + 0,0273 = 0,7023 dos
DAP.
Obs. Para vari´ aveis qualitativas n˜ ao se faz necess´ ario a distribui¸ c˜ ao dos
dados em classes pois cada “valor” da vari´ avel j´ a representa uma classe distinta como
pode ser observado na tabela 7, o mesmo ocorrendo com as vari´ aveis quantitativas discretas
(Exemplo 2).
Exemplo 2.: Realizou-se num grande hospital um estudo referente ao n´ umero
de vitimas fatais de acidentes de transito, atendidas diariamente, durante um certo mˆes,
obtendo os seguintes resultados:
0 2 1 5 3 2 1 2 2 3 0 3 0 0 1 2 3 5 1 0 0 2 0 4 0 3 4 0 2 1
Dispondo estes dados em um Rol tem-se:
0 0 0 0 0 0 0 0 0 1 1 1 1 1 2 2 2 2 2 2 2 3 3 3 3 3 4 4 5 5
19
Tabela 2.7: Distribui¸ c˜ ao de Freq¨ uˆencias do N´ umero de Funcion´ arios da Empresa Tabajara
Classificado Quanto ao Sexo em 1996.
SEXO Fa Fr
MASCULINO 20 0,40
FEMININO 30 0,60
TOTAL 50 1,00
Tabela 2.8: N´ umero de v´ıtimas fatais de acidentes de trˆ ansito atendidas diariamente em
um grande hospital, durante um certo mˆes
Vitimas fatais (X/dia) N´ umero de dias
0 9
1 5
2 7
3 5
4 2
5 2
Total 30
2.1.2 Apresenta¸c˜ao gr´afica
As mesmas informa¸ c˜ oes fornecidas pelas distribui¸ c˜ oes de freq¨ uˆencias podem
ser obtidas, e mais facilmente visualizadas atrav´es de gr´ aficos, tais como histogramas,
pol´ıgonos de freq¨ uˆencia, ogivas, gr´ aficos de setores, pictogramas e outros.
2.1.2.1 Histogramas
Os histogramas s˜ ao constitu´ıdos por um conjunto de retˆ angulos, com as
bases assentadas sobre um eixo horizontal, tendo o centro da mesma no ponto m´edio da
classe que representa, e cuja altura ´e proporcional ` a freq¨ uˆencia da classe. Se as amplitudes
20
de classe forem todas iguais, as alturas ser˜ ao numericamente iguais as freq¨ uˆencias das
classes. Por´em, se os intervalos de classe n˜ ao tiverem todos a mesma amplitude, as alturas
dos retˆ angulos dever˜ ao ser convenientemente ajustadas, afim de que as ´ areas dos mesmos
sejam proporcionais ` as freq¨ uˆencias das classes.
Figura 2.1: Diˆ ametro ` a altura do peito de 40 p´es de Eucalyptus citriodora aos 6 anos de
idade em Lavras-MG.
2.1.2.2 Pol´ıgonos de freq¨ uˆencia
Pol´ıgono de freq¨ uˆencia ´e um gr´ afico de an´ alise no qual as freq¨ uˆencias das
classes s˜ ao localizadas sobre perpendiculares levantadas nos ponto m´edios das classes.
E pode ser obtido pela simples uni˜ ao dos pontos m´edios dos topos dos retˆ angulos de um
histograma. Completa-se o pol´ıgono unindo-se as extremidades da linha que une os pontos
representativos das freq¨ uˆencias de classe aos pontos m´edios das classes imediatamente
anterior e posterior as classes extremas, que tˆem freq¨ uˆencia nula.
21
Figura 2.2: Diˆ ametro ` a altura do peito de 40 p´es de Eucalyptus citriodora aos 6 anos de
idade em Lavras-MG.
Figura 2.3: Diˆ ametro ` a altura do peito de 40 p´es de Eucalyptus citriodora aos 6 anos de
idade em Lavras-MG.
2.1.2.3 Gr´afico de setores (pizza)
O processo de constru¸ c˜ ao de um gr´ afico de setores ´e simples pois sabe-se que
setor de circunferˆencia formado por um ˆ angulo de 360
o
equivale a 100% da ´ area da cir-
cunferˆencia, assim para obter-se o setor cuja ´ area representa uma determinada freq¨ uˆencia,
basta resolver uma regra de trˆes simples, como a apresentada a seguir:
22
360
o
→ 100%
x
o
→ Fr
Figura 2.4: Diˆ ametro ` a altura do peito de 40 p´es de Eucalyptus citriodora aos 6 anos de
idade em Lavras-MG.
2.1.2.4 Ogivas
Ogiva ´e o nome dado a um pol´ıgono de freq¨ uˆencias acumuladas, nas quais
as freq¨ uˆencias acumuladas s˜ ao localizadas sobre perpendiculares levantadas nos limites
inferiores ou superiores das classes, dependendo se a ogiva representar as freq¨ uˆencias acu-
muladas abaixo ou acima, respectivamente.
Histogramas com classes de diferentes tamanhos
Como foi comentado, as ´ areas dos retˆ angulos de um histograma s˜ ao propor-
cionais ` a freq¨ uˆencia da classe que representam. Deste modo, quando as classes apresentam
diferentes amplitudes , torna-se necess´ ario fazer um ajuste na altura dos retˆ angulos, afim
de que suas ´ areas permane¸ cam fieis ‘a sua freq¨ uˆencia.
23
Figura 2.5: Diˆ ametro ` a altura do peito de 40 p´es de Eucalyptus citriodora aos 6 anos de
idade em Lavras-MG.
Figura 2.6: Diˆ ametro ` a altura do peito de 40 p´es de Eucalyptus citriodora aos 6 anos de
idade em Lavras-MG.
Para realizar esta corre¸ c˜ ao utilizamos como altura dos retˆ angulos a dfr (den-
sidade de freq¨ uˆencia relativa), dada por
dfr =
Fr
c
(2.9)
em que,
24
Fr = freq¨ uˆencia relativa da classe
c = amplitude de classe
Para ilustrar o uso da dfr na constru¸ c˜ ao de histogramas utilizaremos os
dados da tabela 2.9.
Tabela 2.9: Distribui¸ c˜ ao de Freq¨ uˆencias da
´
Areas em ha de 900 Propriedades Rurais em
uma Regi˜ ao de MG.
´
Area Fa Fr
0 ¬ 50 500 0,5000
50 ¬ 150 250 0,250
150 ¬ 400 250 0,250
Total 1000 1,0000
Caso constru´ıssemos um histograma utilizando as Fr obter´ıamos a figura
2.7. Como pode-se observar,na tabela 2.9 nas classes 50 ¬ 150 e 150 ¬ 400 existem o
mesmo n´ umero de propriedades. Por´em ao observar-se a figura 2.7, nota-se que ´ area do
histograma, que deveria representar a % de propriedades com ´ area entre 150 ¬ 400 ha,
´e 2,5 vezes maior que a ´ area referente ` a classe 50 ¬ 150. Quando deveriam ser iguais.
Construindo o histograma, tendo como coordenadas do eixo Y as dfr, apresentadas na
tabela 2.10, esta distor¸ c˜ ao ´e corrigida, como pode ser verificado na figura 2.8.
Os histogramas e pol´ıgonos de freq¨ uˆencias podem indicar ainda qual ´e o tipo
de distribui¸ c˜ ao que os dados seguem, como pode ser visto a seguir:
25
Figura 2.7: Distribui¸ c˜ ao do N´ umero de Propriedades Rurais Segundo suas
´
Areas, Num
Certo Munic´ıpio de MG.
Figura 2.8: Distribui¸ c˜ ao de Freq¨ uˆencias do
´
Areas, em ha de 900 Propriedades Rurais em
uma Regi˜ ao de MG.
2.2 Medidas de Posi¸c˜ao e dispers˜ao
2.2.1 Medidas de Posi¸c˜ao
As medidas de posi¸ c˜ ao ou de tendˆencia central constituem uma forma mais
sint´etica de apresentar os resultados contidos nos dados observados, pois representam um
26
Tabela 2.10: Distribui¸ c˜ ao de Freq¨ uˆencias do
´
Areas, em ha de 900 Propriedades Rurais em
uma Regi˜ ao de MG.
´
Area Fr c dfr
0 ¬ 50 0,500 50 0,0100
50 ¬ 150 0,250 100 0,0025
150 ¬ 400 0,250 250 0,0010
Total 1,000
Figura 2.9: Distribui¸ c˜ ao sim´etrica.
Figura 2.10: Distribui¸ c˜ ao assim´etrica a esquerda.
valor central, em torno do qual os dados se concentram. As medidas de posi¸ c˜ ao mais
empregadas s˜ ao a m´edia, a mediana e a moda.
27
Figura 2.11: Distribui¸ c˜ ao assim´etrica a direita.
Figura 2.12: Distribui¸ c˜ ao em jota.
Figura 2.13: Distribui¸ c˜ ao em jota invertido.
Figura 2.14: Distribui¸ c˜ ao distribui¸ c˜ ao bimodal.
28
Figura 2.15: Distribui¸ c˜ ao multimodal.
2.2.1.1 M´edia
´
E a mais usada das trˆes medidas de posi¸ c˜ ao mencionadas, por ser a mais
comum e compreens´ıvel delas, bem como pela relativa simplicidade do seu c´ alculo, al´em
de prestar-se bem ao tratamento alg´ebrico.
- M´edia Aritm´etica:
A m´edia aritm´etica ou simplesmente m´edia de um conjunto de n observa¸ c˜ oes,
x
1
, x
2
, . . . , x
n
´e definida como:
¯ x =
¸
n
i=1
x
i
n
(2.10)
Ex.: Dados os pesos ao nascer (kg) de cinco leit˜ oes da ra¸ ca Large White;
1,350; 1,500; 1,800; 1,800; 1,900.
Temos que o peso m´edio ao nascer destes leit˜ oes ´e
¯ x =
1, 350 + 1, 500 + 1, 800 + 1, 800 + 1, 900
5
= 1, 670kg
Interpreta¸ c˜ ao: O peso m´edio ao nascer dos cinco leit˜ oes foi de 1, 670kg, isto
quer dizer que alguns leit˜ oes pesaram menos de 1, 670kg, outros pesaram mais, mas em
m´edia, o peso ao nascer dos leit˜ oes foi 1, 670kg. Ou seja 1, 670kg ´e um valor em torno do
qual os pesos ao nascer destes cinco leit˜ oes se concentra.
Se os dados estiverem agrupados na forma de uma distribui¸ c˜ ao de freq¨ uˆencia,
lan¸ ca-se m˜ ao da Hip´ otese tabular b´ asica, para o c´ alculo da m´edia.
29
Hip´ otese Tabular B´ asica
“Todas as observa¸ c˜ oes contidas numa classe s˜ ao consideradas iguais ao ponto
m´edio da classe.”
Que ´e realizado atrav´es da seguinte express˜ ao:
¯ x =
¸
k
i=1
x
i
Fa
i
¸
k
i=1
Fa
i
=
k
¸
i=1
x
i
Fr
i
(2.11)
em que,
x
i
= ponto m´edio da classe i;
Fa
i
= freq¨ uˆencia absoluta da classe i;
Fr
i
= freq¨ uˆencia relativa da classe i.
Ex.: Calcular a m´edia dos dados apresentados a seguir:
Tabela 2.11: Durabilidade (horas) de 400 v´ alvulas ensaiadas na Tabajara Inc.
Dura¸ c˜ ao (horas) Fa Fr
300 ¬ 400 14 0,035
400 ¬ 500 46 0,115
500 ¬ 600 58 0,145
600 ¬ 700 76 0,190
700 ¬ 800 68 0,170
800 ¬ 900 62 0,155
900 ¬ 1000 48 0,120
1000 ¬ 1100 22 0,055
1100 ¬ 1200 6 0,015
TOTAL 400 1,000
¯ x =
(350)(14) + (450)(46) + + (1150)(6)
14 + 46 + + 6
=
286200
400
= 715, 5horas
Propriedades da M´edia
30
i. A soma dos desvios de um conjunto de dados em rela¸ c˜ ao a sua m´edia ´e nula
Ex.: Dados ,1,2,3;
¯ x = 2
(1 −2) + (2 −2) + (3 −2) = 0
Prova:
n
¸
i=1
[x
i
− ¯ x] =
n
¸
i=1
x
i
−n¯ x
=
n
¸
i=1
x
i
−n
¸
n
i=1
x
i
n
=
n
¸
i=1
x
i

n
¸
i=1
x
i
= 0
ii. A soma dos quadrados dos desvios de um conjunto de dados em rela¸ c˜ ao a uma con-
stante k ´e m´ınima quando k for a m´edia.
Ex.: Dados 1,2,3, ¯ x = 2
k Soma dos quadrados dos desvios
1,0 5,00
1,5 2,75
2,0 2,00
2,5 2,75
3,0 5,00
Prova:
Seja
S =
n
¸
i=1
[x
i
−θ]
2
,
Ent˜ ao o valor de θ que minimiza S ´e obtido solucionando-se o sistema:
31
dS

= 0
Assim
2
n
¸
i=1
[x
i
−θ] = 0
n
¸
i=1
x
i
−nθ = 0
θ =
¸
n
i=1
x
1
n
θ = ¯ x
iii. A m´edia de um conjunto de dados acrescidos ou subtra´ıdos em cada elemento de uma
constante k ´e igual ´ a m´edia original somada ou subtra´ıda desta constante.
Ex.: Dados 1, 2, 3 ¯ x = 2
k=2 novos dados: 3, 4, 5 ¯ x∗ = 4 = 2 + 2 = ¯ x +k
Prova: ¯ x =

n
i=1
x
i
n
fazendo x

i
= (x
i
±+k)
tem-se:
¯ x

=
¸
n
i=1
x

i
n
=
¸
n
i=1
(x
i
±k)
n
=
¸
n
i=1
x
i
±nk
n
=
¸
n
i=1
x
i
n
±k
¯ x

= ¯ x ±k
iv. Multiplicando-se todos os dados por uma constante k, a nova m´edia fica multiplicada
por k.
Ex.: Dados: 1, 2, 3 ¯ x = 2
32
k=3 novos dados: 3, 6, 9 ¯ x∗ = 6 = (3)(2) = k¯ x
Prova: ¯ x =

n
i=1
x
i
n
fazendo x

i
= (kx
i
)
tem-se:
¯ x

=
¸
n
i=1
x

i
n
=
¸
n
i=1
(kx
i
)
n
=
k
¸
n
i=1
x
i
n
¯ x

= k¯ x
Caracter´ısticas e importˆ ancia:
i.
´
E muito influenciada pelos valores extremos da distribui¸ c˜ ao;
ii. Localiza-se, em geral, na classe de maior freq¨ uˆencia;
iii. Na sua determina¸ c˜ ao s˜ ao considerados todos os dados da distribui¸ c˜ ao;
iv. A sua precis˜ ao est´ a na raz˜ ao direta do n´ umero de observa¸ c˜ oes com que ´e calculada;
v.
´
E ´ unica para um conjunto de dados.
vi. N˜ ao pode ser calculada para dados agrupados que apresentam classes extremas aber-
tas.
Ex.:
Classe Fa
0 a 500 5
mais de 500 6
- M´edia Ponderada
`
As vezes associa-se ` as observa¸ c˜ oes x
1
, x
2
, . . . , x
n
determinadas pondera¸ c˜ oes
ou pesos w
1
, w
2
, . . . , w
n
que dependem da importˆ ancia atribu´ıda a cada uma das ob-
serva¸ c˜ oes, neste caso a m´edia ´e dada por:
33
¯ x
p
=
¸
n
i=1
x
i
w
i
¸
n
i=1
w
i
(2.12)
Ex.: Se o exame final de um curso tem peso 3, e as provas correntes peso 1.
Qual a nota m´edia de um aluno que obteve 85 no exame final e 70,90 nas provas correntes?
Aplicando-se a equa¸ c˜ ao2.12 tem-se:
¯ x
p
=
(3)(85) + (1)(70) + (1)(90)
3 + 1 + 1
=
415
5
= 85 pontos
- M´edia Geom´etrica
A m´edia geom´etrica de um conjunto de n observa¸ c˜ oes, x
1
, x
2
, , x
n
, ´e dada
pela raiz de ordem n do produto dessas observa¸ c˜ oes, ou seja:
¯ x
G
=
n

x
1
X
2
x
n
=
n

n
¸
i=1
x
i
(2.13)
ou ainda:
ln ¯ x
G
=
1
n
n
¸
i=1
ln x
i
(2.14)
A m´edia geom´etrica ´e utilizada para representar vari´ aveis assim´etricas a
direita, pois, nestes casos, m´edia aritm´etica, por ser muito influenciada pelos valores ex-
tremos, n˜ ao representa bem a vari´ avel. Como exemplos de vari´ aveis, para as quais a m´edia
geom´etrica ´e um melhor localizador do que a m´edia aritm´etica pode sitar-se a distribui¸ c˜ ao
de renda da popula¸ c˜ ao brasileira, a condutividade hidr´ aulica de um solo e o diˆ ametro de
torr˜ oes de solo.
- M´edia Harmˆ onica
A m´edia harmˆ onica de um conjunto de n observa¸ c˜ oes, x
1
, x
2
, . . . , x
n
, ´e a
rec´ıproca da m´edia aritm´etica dos rec´ıprocos das observa¸ c˜ oes:
¯ x
H
=
1
1
n
¸
n
i=1
1
x
i
=
n
¸
n
i=1
1
x
i
(2.15)
Este tipo de m´edia ´e utilizado para vari´ aveis que apresentem periodicidade,
ou seja uma varia¸ c˜ ao harmˆ onica, como por exemplo ondas de r´ adio, varia¸ c˜ ao de pre¸ cos de
produtos agr´ıcolas no decorrer do ano (safra/entre safra), sinais de TV, etc.
34
2.2.1.2 Mediana
Para um conjunto de dados ordenados (Rol) a mediana ´e o valor que ´e
precedido e seguido pelo mesmo n´ umero de dados (observa¸ c˜ oes). Isto ´e 50% dos dados s˜ ao
superiores ` a mediana e 50% s˜ ao inferiores.
C´ alculo da mediana
i. Quando o n´ umero de dados (n) for ´ımpar, a mediana ´e dada por:
Md = x
(
n+1
2
)
(2.16)
Ex.: 0, 1, 2, 3, 4 ⇒ n = 5 (
´
impar)
Md = x
(
5+1
2
)
= x
(3)
= 2
ii. Quando o n´ umero de dados for par, a mediana ser´ a dada por:
Md =
x
(
n
2
)
+x
(
n+2
2
)
2
(2.17)
Ex.: 0, 1, 2, 3 ⇒ n = 4 (par)
Md =
x
(
4
2
)
+x
(
4+2
2
)
2
=
x
(2)
+x
(3)
2
=
1+2
2
= 1, 5
iii. Dados agrupados:
Md = L
i
+
¸
n
2
−F
a
F
Md
+

c, (2.18)
em que,
L
i
= e o limite inferior da classe mediana;
F
a
= ´e a freq¨ uˆencia acumulada das classes anteriores a classe mediana;
F
Md
´e a freq¨ uˆencia da classe mediana; e
c ´e amplitude da classe mediana.
Ex.: Para os dados da Tabela2.11 (Durabilidade das v´ alvulas) temos:
35
n = 400 observa¸ c˜ oes. o valor da mediana encontra-se entre a posi¸ c˜ ao 200 e 201 x
n
2
e
xn+2
2
, que pertencem ` a 5
a
classe [700 −800[ Aplicando-se a f´ ormula da mediana vem:
Md = L
i
+
¸
n
2
−F
a
F
Md
+

c
= 700 +
¸
400
2
−194
68
+

100
= 708, 82 horas
Interpreta¸ c˜ ao: A mediana igual a 708,82 horas indica que 50% das v´ alvulas duram
menos que 708,82 horas e 50% duram mais que 708,82 horas.
Propriedades da Mediana:
i. A soma dos m´ odulos dos desvios dos dados em rela¸ c˜ ao ` a mediana ´e m´ınima.
n
¸
i=1
[x
i
−Md[ = m
´
inimo
ii. Somando-se ou subtraindo-se uma constante (k) a todas as observa¸ c˜ oes, a mediana
fica somada ou subtra´ıda desta constante (k).
x

= X ±k ⇒ Md

= Md ±k
iii. Multiplicando-se todas as observa¸ c˜ oes por uma constante (k), a mediana fica multi-
plicada por esta constante (k).
x

= kx ⇒ Md

= kMd
Caracter´ısticas e Importˆ ancia:
i. Pode ser obtida em distribui¸ c˜ oes de freq¨ uˆencias que apresentem classes com limites
indefinidos;
ii.
´
E muito empregada em pesquisas nas quais os valores extremos tˆem pouca im-
portˆ ancia;
36
iii. N˜ ao ´e influenciada por valores extremos e sim pelo n´ umero de observa¸ c˜ oes;
iv.
´
E mais realista do que a m´edia para representar certas vari´ aveis, como o n´ıvel salarial
de uma empresa.
2.2.1.3 Moda
A moda de um conjunto de dados ´e o valor que ocorre com maior freq¨ uˆencia,
isto ´e, o valor mais comum. Para um conjunto de dados a moda pode n˜ ao ser ´ unica, bem
como pode n˜ ao existir.
Ex.:
2, 3, 4, 5, 7, 7, 7, 8, 9 Mo = 7;
1, 2, 3, 4, 7, 9, 10, 13, 20 n˜ ao possui moda;
1, 2, 3, 4, 4, 8, 10, 10 13 Mo = 4 e Mo = 10.
Dados Agrupados
Quando os dados est˜ ao agrupados, na forma de uma distribui¸ c˜ ao de
freq¨ uˆencias, a moda ´e o ponto do eixo x, correspondente ` a ordenada m´ axima da dis-
tribui¸ c˜ ao. O processo para c´ alculo da moda em dados agrupados ´e o geom´etrico, a partir
do histograma de freq¨ uˆencias (M´etodo de Czuber). Este m´etodo ´e baseado na influˆencia
que as classes adjacentes exercem sobre a moda, deslocando-a no sentido da classe de
maior freq¨ uˆencia.
No histograma acima, marca-se, na classe modal, os v´ertices A, B, C e D.
Tra¸ ca-se as retas AC e BD. No ponto de intersec¸ c˜ ao destas retas (E) tra¸ ca-se uma perpen-
dicular ao eixo das classes, localizando o ponto Mo, valor da moda. O ponto Mo divide
o intervalo da classe modal (c) em duas partes, cujos comprimentos s˜ ao proporcionais a

1
e ∆
2
. Sendo ∆
1
a diferen¸ ca entre a freq¨ uˆencia da classe modal e da classe imediata-
mente anterior,e ∆
2
a diferen¸ ca entre as freq¨ uˆencias da classe modal e da imediatamente
posterior.
Por E tra¸ ca-se a reta FF

, paralela ao eixo das classes, obtendo assim, os
segmentos EF e EF

, que representam as alturas dos triˆ angulos ABE e CDE.
37
Figura 2.16: Esquema para obten¸ c˜ ao da moda pelo m´etodo de Czuber
Sendo Li o limite inferior da classe modal, Ls o limite superior e x a distˆ ancia
entre Li e a moda (Mo), verificasse na figura 2.16 que:
Mo = Li +x (2.19)
Sendo os triˆ angulos ABE e CDE semelhantes (pois possuem dois ˆ angulos
iguais) tem-se que:
EF
EF

=
AB
CD
x
c −x
=

1

2
x∆
2
= c∆
1
−x∆
1
x =

1

1
+ ∆
2
c (2.20)
Substituindo 2.20 em 2.19 tem-se:
Mo = L
i
+

1

1
+ ∆
2
c, (2.21)
em que:
L
i
´e o limite inferior da classe modal;
38

1
´e a diferen¸ ca entre a freq¨ uˆencia da classe modal e da imediatamente
anterior;

2
´e a diferen¸ ca ente a freq¨ uˆencia da classe modal e da imediatamente
anterior;
c ´e a amplitude da classe modal.
Caracter´ısticas e Importˆ ancia
i. N˜ ao ´e afetada por valores extremos, a n˜ ao ser que estes constituam a classe modal;
ii.
´
E uma medida bastante utilizada em Estat´ıstica Econˆ omica;
iii. N˜ ao apresenta boas propriedades alg´ebricas; d) Maximiza o n´ umero de desvios iguais
a zero.
Propriedades da Moda
i. Somando-se ou subtraindo uma constante a todos os dados, a moda fica somada ou
subtra´ıda da mesma constante.
x

= x ±k ⇒ Mo

= Mo ±k
ii. Multiplicando-se todos os dados por uma constante k, a moda fica multiplicada por
esta constante.
x

= kx ⇒ Mo

= kMo
2.2.1.4 Separatrizes (Quantis)
Quartis
Os quartis separam um conjunto de dados ordenados (Rol) em quatro partes
iguais. Assim:
Q
1
´e o 1
o
quartil, deixa 25% dos elementos abaixo dele;
39
Q
2
= 2
o
quartil, coincide com a mediana, deixa 50% dos elementos abaixo
dele;
Q
3
= 3
o
quartil, deixa 75% dos elementos abaixo dele.
Determina¸ c˜ ao de Q
1
Q
1
= Li
Q
1
+
¸
n
4
−Fa
Q
1
F
Q
1

c (2.22)
em que:
Li
Q
1
´e o limite inferior da classe que cont´em Q
1
;
Fa
Q
1
´e a freq¨ uˆencia acumulada das classes anteriores ` a classe que cont´em
Q
1
;
F
Q
1
´e a freq¨ uˆencia da classe que cont´em Q
1
e
c ´e a amplitude da classe que cont´em Q
1
.
Determina¸ c˜ ao de Q
3
Q
3
= Li
Q
3
+
¸
3n
4
−Fa
Q
3
F
Q
3

c (2.23)
em que:
Li
Q
3
´e o limite inferior da classe que cont´em Q
3
;
Fa
Q
3
´e a freq¨ uˆencia acumulada das classes anteriores ` a classe que cont´em
Q
3
;
F
Q
3
´e a freq¨ uˆencia da classe que cont´em Q
3
e
c ´e a amplitude da classe que cont´em Q
3
.
Decis
S˜ ao valores que dividem uma s´erie de dados ordenados em dez partes iguais.
O i −´ esimo decil, (i = 1, 2, . . . , 10), de um conjunto de observa¸ c˜ oes organizadas na forma
de uma distribui¸ c˜ ao de freq¨ uˆencias pode ser obtido por:
D
i
= Li
D
i
+
¸
in
10
−Fa
D
i
F
D
i

c (2.24)
em que:
40
Li
D
i
´e o limite inferior da classe que cont´em D
i
;
Fa
D
i
´e a freq¨ uˆencia acumulada das classes anteriores ` a classe que cont´em
D
i
;
F
D
i
´e a freq¨ uˆencia da classe que cont´em D
i
e
c ´e a amplitude da classe que cont´em D
i
.
Percentis
S˜ ao valores que dividem uma s´erie de dados ordenados em 100 partes iguais.
Dada uma distribui¸ c˜ ao de freq¨ uˆencias, o valor do i − ´ esimo percentil, (i = 1, 2, . . . , 10) ´e
obtido por:
P
i
= Li
P
i
+
¸
in
100
−Fa
P
i
F
P
i

c (2.25)
em que:
Li
P
i
´e o limite inferior da classe que cont´em P
i
;
Fa
P
i
´e a freq¨ uˆencia acumulada das classes anteriores ` a classe que cont´em P
i
;
F
P
i
´e a freq¨ uˆencia da classe que cont´em P
i
e
c ´e a amplitude da classe que cont´em P
i
.
Rela¸ c˜ oes emp´ıricas entre m´edia, mediana, moda e as distribui¸ c˜ oes de dados:
Distribui¸ c˜ ao Rela¸ c˜ ao
Sim´etrica ¯ x = Md = Mo
Assim´etrica a direita (assim´etrica positiva) ¯ x > Md > Mo
Assim´etrica a esquerda (assim´etrica negativa) ¯ x < Md < Mo
2.2.2 Medidas de disperss˜ao
A utiliza¸ c˜ ao de uma medida de posi¸ c˜ ao para substituir um conjunto de dados
´e insuficiente para sintetizar a informa¸ c˜ ao nele contida, como pode ser observado a seguir:
A = 10, 10, 10, 10, 10, 10, 10
B = 1, 8,10, 10, 11, 12, 18
C = 1, 2, 10, 10, 10, 13, 24
41
Calculando a m´edia (eq 2.10), mediana (eq 2.16 e moda desses trˆes conjuntos
tem-se:
¯ x
A
= ¯ x
B
= ¯ x
c
= 10 unidades
Md
A
= Md
B
= Md
c
= 10 unidades
Mo
A
= Mo
B
= Mo
c
= 10 unidades
Assim, verifica-se que os trˆes conjuntos (A,B,C) apresentam m´edias, me-
dianas e modas iguais a 10unidades, por´em observando-os, percebe-se que eles s˜ ao bem
diferentes entre si, pois enquanto no conjunto A os dados s˜ ao todos iguais, os demais
apresentam uma certa varia¸ c˜ ao, sendo que esta varia¸ c˜ ao ´e maior no conjunto C. Deste
modo, para sintetizarmos eficientemente a informa¸ c˜ ao de um conjunto de dados temos que
associar ` a medida de posi¸ c˜ ao utilizada, uma medida de dispers˜ ao, que vai informar como
estes dados se comportam em torno da medida de posi¸ c˜ ao em quest˜ ao.
2.2.2.1 Amplitude Total (A)
A amplitude total ´e a diferen¸ ca entre o maior e o menor valor observado
A = MV O −mvo, (2.26)
em que:
MV O ´e o maior valor observado, e
mvo ´e o menor valor observado.
Para os conjuntos A,B e C tem-se:
A
A
= 10 −10 = 0 unidades
A
B
= 18 −1 = 17 unidades e
A
C
= 24 −1 = 23 unidades.
Nota-se, ent˜ ao, que a amplitude do conjunto C ´e bem maior que nos demais.
A amplitude ´e uma medida de dispers˜ ao f´ acil de ser calculada e ´e certamente a maneira
mais natural e comumente utilizada para descrever a variabilidade de um conjunto de
42
dados. Por´em sua interpreta¸ c˜ ao depende do n´ umero de observa¸ c˜ oes, mas, no seu c´ alculo
n˜ ao s˜ ao consideradas todas as observa¸ c˜ oes, pois s´ o utiliza os valores extremos.
2.2.2.2 Variˆancia e desvio padr˜ao
Uma boa medida de dispers˜ ao deve basear-se em todos os dados, ser facil-
mente calcul´ avel e compreens´ıvel, al´em de prestar-se bem ao tratamento alg´ebrico. Uma
medida com todas estas caracter´ısticas ´e obtida considerando-se os desvios de cada ob-
serva¸ c˜ ao em rela¸ c˜ ao a m´edia (chamados erros) :
e
i
= x
i
− ¯ x (2.27)
Para obter um ´ unico n´ umero que represente a dispers˜ ao dos dados, pensou-se inicialmente
em obter-se a m´edia destes desvios, mas deve-se lembrar que a soma dos desvios de um
conjunto de dados em rela¸ c˜ ao a sua m´edia ´e nula. Ent˜ ao, optou-se por utilizar a soma
dos quadrados dos desvios, pois elevando-se cada desvio ao quadrado elimina-se o sinal
negativo, que estava trazendo complica¸ c˜ oes, e dividindo-se a soma dos quadrados dos
desvios pelo n´ umero de observa¸ c˜ oes obt´em-se a variˆ ancia populacional que ´e uma medida
quantitativa da dispers˜ ao de um conjunto de dados entorno da sua m´edia, al´em do fato,
de esta soma de quadrados de desvios ser m´ınima, como j´ a foi visto em propriedades da
m´edia.
V (x) = σ
2
=
SQD
N
=
1
N
n
¸
i=1
(x
i
− ¯ x)
2
(2.28)
Para os exemplos anteriores tem-se:
σ
2
A
=
(10 −10)
2
+ (10 −10)
2
+ + (10 −10)
2
7
= 0 unidades
2
σ
2
B
=
(1 −10)
2
+ (8 −10)
2
+ + (18 −10)
2
7
= 22 unidades
2
σ
2
A
=
(1 −10)
2
+ (2 −10)
2
+ + (24 −10)
2
7
= 50 unidades
2
Obs. Quando estiver trabalhando com amostras, a variˆ ancia ´e dada pela
soma dos quadrados dos desvios dividida por n − 1 (n´ umero de observa¸ c˜ oes menos um)
43
que ´e denominado graus de liberdade. Assim:
s
2
=
SQD
n −1
=
1
n −1
n
¸
i=1
(x
i
− ¯ x)
2
(2.29)
Formulas computacionais para o c´ alculo da variˆ ancia
σ
2
=
1
N
¸
n
¸
i=1
x
2

(
¸
n
i=1
x)
2
N
¸
(2.30)
s
2
=
1
n −1
¸
n
¸
i=1
x
2

(
¸
n
i=1
x)
2
n
¸
(2.31)
prova:
SQD =
n
¸
i=1
(x
i
− ¯ x)
2
=
n
¸
i=1
(x
2
i
−2¯ xx
i
+ ¯ x
2
)
=
n
¸
i=1
x
2
i
−2¯ x
n
¸
i=1
x
i
+n¯ x
2
=
n
¸
i=1
x
2
i
−2
¸
n
i=1
x
i
n
n
¸
i=1
x
i
+n
¸¸
n
i=1
x
i
n

2
=
n
¸
i=1
x
2
i

(
¸
n
i=1
x
i
)
2
n
Para dados tabulados o c´ alculo da variˆ ancia ´e realizado por meio das
seguintes express˜ oes:
σ
2
=
1
N
¸
n
¸
i=1
x
2
i
F
i

(
¸
n
i=1
x
i
F
i
)
2
N
¸
(2.32)
s
2
=
1
n −1
¸
n
¸
i=1
x
2
i
F
i

(
¸
n
i=1
x
i
F
i
)
2
n
¸
(2.33)
em que:
x
i
´e o ponto m´edio da i-´esima classe, e
F
i
´e a freq¨ uˆencia absoluta da i-´esima classe.
Propriedades da variˆ ancia
44
i. A variˆ ancia de uma constante k ´e nula
V (k) = 0, k = constante.
prova
Dado que:
x
1
= x
2
= = x
n
= k ⇒ ¯ x = k, portanto:
V (x) =
1
N
n
¸
i=1
(x
i
− ¯ x)
2
=
1
N
n
¸
i=1
(k −k)
2
= 0
ii. A variˆ ancia de uma soma ou diferen¸ ca entre vari´ aveis ´e a soma das variˆ ancias das
vari´ aveis se estas forem independentes.
V (X ±Y ) = V (X) +V (Y ) se X e Y forem independentes
45
Prova: w = x ±y
V (W) =
1
N
n
¸
i=1
(w
i

¯
W)
2
=
1
N
n
¸
i=1

(x
i
−y
i
) −(
¯
X −
¯
Y )

2
=
1
N
n
¸
i=1

(x
i
−y
i
)
2
−2(x
i
−y
i
)(
¯
X −
¯
Y ) + (
¯
X −
¯
Y )
2

2
=
1
N
n
¸
i=1

x
2
i
−2x
i
y
i
+y
2
i
−2(x
i
¯
X −x
i
¯
Y −y
i
¯
X +y
i
¯
Y ) + (
¯
X
2
−2
¯
X
¯
Y +
¯
Y
2

2
=
1
N
n
¸
i=1

(x
2
i
−2x
i
¯ x + ¯ x
2
) + (y
2
i
−2y
i
¯
Y +
¯
Y
2
) −2(x
i
y
i
−x
i
¯
Y −y
i
¯
X +
¯
X
¯
Y )

2
=
1
N
n
¸
i=1

(x
i

¯
X)
2
+ (y
2
i

¯
Y )
2
−2(x
i

¯
X)(y
i

¯
Y )

2
= V (X) +V (Y ) −2cov(X, Y )
para W = X +Y tem-se:V (W) = V (X) +V (Y ) + 2cov(X, Y )
iii. Somando-se ou subtraindo-se uma constante k a todos os dados a variˆ ancia n˜ ao se
altera.
X

= X ±k ⇒ V (X

) = V (X)
Prova:
V (X

) =
1
N
n
¸
i=1
(x

i

¯
X

)
2
=
1
N
n
¸
i=1

(x
i
±k) −
¯
X ±k)

2
=
1
N
n
¸
i=1
(x
i

¯
X)
2
= V (X)
iv. Multiplicando-se todos os dados por uma constante k, a variˆ ancia fica multiplicada
por k
2
46
X

= X.k ⇒ V (X

) = k
2
V (X)
Prova:
V (X

) =
1
N
n
¸
i=1
(x

i

¯
X

)
2
=
1
N
n
¸
i=1
(kx
i
) −k¯ x)
2
=
1
N
n
¸
i=1
(k
2
x
2
i
−2k
2
x
i
¯ x +k
2
¯ x)
=
1
N
n
¸
i=1
k
2
(x
2
i
−2x
i
¯ x + ¯ x)
= k
2
V (X)
Desvio Padr˜ ao
Um inconveniente da variˆ ancia ´e que ela ´e expressa em unidades ao quadrado,
ou seja, caso esteja-se trabalhando com o peso corporal de indiv´ıduos, tomados em kg,
a variˆ ancia destes pesos ´e expressa em kg2 , o que causa algumas dificuldades de inter-
preta¸ c˜ ao. No intuito de resolver este problema trabalha-se com o desvio padr˜ ao que ´e
definido como a raiz quadrada positiva da variˆ ancia, o qual ´e expresso na mesma unidade
em que os dados foram coletados.
σ =

σ
2
(2.34)
s =

s
2
(2.35)
Para o exemplo em quest˜ ao tem-se:
σ
A
=

0 = 0 unidades
σ
B
=

22 = 4, 6 unidades
σ
A
=

50 = 7, 07 unidades
47
Propriedades do desvio padr˜ ao
i. Somando-se ou subtraindo-se uma constante k a todos os dados o desvio padr˜ ao n˜ ao
se altera.
X

= X ±k ⇒ s(X

) = s(X)
ii. Multiplicando-se todos os dados por uma constante k, o desvio padr˜ ao fica multipli-
cada por k
X

= kX

⇒ s(X

) = ks(X)
2.2.2.3 Coeficiente de varia¸c˜ao
A variˆ ancia e o desvio padr˜ ao s˜ ao medidas de dispers˜ ao absolutas, deste
modo s´ o podem ser utilizadas para comparar a variabilidade de dois ou mais conjuntos
de dados quando estes apresentarem a mesma m´edia, mesmo n´ umero de observa¸ c˜ oes e
estiverem expressos nas mesmas unidades. Ent˜ ao para comparar qualquer conjunto de
dados quanto ` a sua variabilidade deve-se lan¸ car m˜ ao de uma medida de dispers˜ ao relativa
como o coeficiente de varia¸ c˜ ao (CV ), que expressa a variabilidade dos dados em rela¸ c˜ ao ` a
sua m´edia.
CV =
σ
¯
X
100 (2.36)
Ex.1:
CV
A
=
0
10
100 = 0%
CV
B
=
4, 69
10
100 = 46, 9%
CV
A
=
7, 07
10
100 = 70, 7%
Ex.2.
48
Estat´ıstica Temperatura (
o
C) Precipita¸ c˜ ao (mm)
M´edia 22 800
s 5 100
CV % 22,7 12,5
Os dados acima referem-se ` a temperatura ambiental e precipita¸ c˜ ao de uma
certa regi˜ ao. Caso deseje-se saber qual das duas vari´ aveis possui maior dispers˜ ao, e para
tanto utilizar-se o desvio padr˜ ao (S), concluiria-se erroneamente que a precipita¸ c˜ ao ´e mais
vari´ avel que a temperatura, al´em de cometer o disparate de comparar numericamente duas
vari´ aveis que est˜ ao expressas em unidades diferentes.
2.2.2.4 Erro padr˜ao da m´edia
´
E uma medida que fornece uma id´eia da precis˜ ao com que a m´edia foi esti-
mada.
s ¯
X
=
s

n
(2.37)
2.2.2.5 Momentos, Assimetria e Curtose
Momentos
Se x
1
, x
2
, . . . , x
n
s˜ ao os n valores assumidos pela vari´ avel X, define-se a
quantidade
¯
X
r
=
x
r
1
+x
r
2
+ +x
r
n
n
=
¸
n
i=1
x
r
i
n
, (2.38)
como o momento de ordem r em rela¸ c˜ ao a origem. Nota-se que o primeiro
momento em rela¸ c˜ ao a origem (
¯
X
1
) ´e a m´edia de X.
O momento de ordem r em rela¸ c˜ ao a uma origem k, qualquer, ´e dado por:
M

r
(k) =
¸
n
i=1
(x
i
−k)
r
n
, (2.39)
49
O momento de ordem r em rela¸ c˜ ao a m´edia
¯
X ´e dado por:
M

r
(
¯
X) =
¸
n
i=1
(x
i

¯
X)
r
n
, (2.40)
Nota-se que o segundo momento em rela¸ c˜ ao a m´edia ´e a variˆ ancia.
Para o caso dos dados encotrarem-se agrupados, na forma de uma dis-
tribui¸ c˜ ao de freq¨ uˆencias, as express˜ oes para o c´ alculo dos momentos ser˜ ao:
M

r
(k) =
¸
n
i=1
(x
i
−k)
r
F
i
¸
n
i=1
F
i
, (2.41)
em que:
x
i
´e o ponto m´edio da i-´esima classe, e
F
i
= freq¨ uˆencia absoluta da i-´esima.
Coeficiente de Assimetria (Cs).
Assimetria ´e o grau de desvio, ou afastamento da simetria, de uma dis-
tribui¸ c˜ ao. Se a curva de freq¨ uˆencia (pol´ıgono de freq¨ uˆencia suavizado) de uma distribui¸ c˜ ao
tem uma “cauda” mais longa ` a direita da ordenada m´ axima do que ` a esquerda, diz-se que
a distribui¸ c˜ ao ´e assim´etrica ` a direita ou assim´etrica positiva. Se o inverso ocorre, diz-se
que ela ´e assim´etrica ` a esquerda ou negativa.
O coeficiente de assimetria (Cs) ´e dado por:
Cs =
M

3

2
)
1,5
(2.42)
Classifica¸ c˜ ao das distribui¸ c˜ oes quanto a assimetria:
Cs = 0 distribui¸ c˜ ao ´e sim´etrica perfeita.
Cs > 0 a distribui¸ c˜ ao ´e assim´etrica ` a direita.
Cs < 0 a distribui¸ c˜ ao ´e assim´etrica ` a esquerda.
Existem ainda o primeiro e segundo coeficientes de assimetria de Pearson
dados respectivamente por:
Cs =
¯
X −Mo
s
(2.43)
e
Cs =
3(
¯
X −Md)
s
(2.44)
50
Tipos de distribui¸ c˜ oes quanto a assimetria
Figura 2.17: Distribui¸ c˜ ao sim´etrica.
Figura 2.18: Distribui¸ c˜ ao assim´etrica a esquerda.
Figura 2.19: Distribui¸ c˜ ao assim´etrica a direita.
Coeficiente de Curtose.
Curtose ´e o grau de achatamento de uma distribui¸ c˜ ao, considerado usual-
mente em rela¸ c˜ ao a distribui¸ c˜ ao normal. A distribui¸ c˜ ao que tem um pico relativamente
alto ´e chamada leptoc´ urtica, enquanto a distribui¸ c˜ ao que possui o topo achatado ´e denom-
inada platic´ urtica e a distribui¸ c˜ ao que n˜ ao ´e muito pontiaguda, nem muito achatada, como
51
acontece com a distribui¸ c˜ ao normal ´e denominada mesoc´ urtica. O coeficiente de curtose ´e
dado por:
Ck =
M

4

2
)
2
(2.45)
Tipos de distribui¸ c˜ ao quanto ` a curtose:
Figura 2.20: Distribui¸ c˜ ao leptoc´ urtica.
Figura 2.21: Distribui¸ c˜ ao mesoc´ urtica.
Figura 2.22: Distribui¸ c˜ ao platic´ urtica.
Ex.: Os dados a seguir referem-se ao n´ umero de partos/dia ocorrido num
determinado hospital durante o mˆes de mar¸ co de 1997
52
X (partos/dia) F (n´ umero de dias)
12 1
14 4
16 6
18 10
20 7
22 2
Total 30
a) Obter o primeiro momento em rela¸ c˜ ao a origem
M

1
=
¸
n
i=1
(x
i
)F
i
¸
n
i=1
F
i
=
12.1 + 14.4 + + 22.2
30
= 17, 6
b) segundo, terceiro e quarto momentos em rela¸ c˜ ao a m´edia
M

2
(
¯
X) =
¸
n
i=1
(x
i

¯
X)
2
F
i
¸
n
i=1
F
i
=
(12 −17, 6)
2
1 + (14 −17, 6)
2
4 + + (22 −17, 6)
2
2
30
= 5, 97
M

3
(
¯
X) =
¸
n
i=1
(x
i

¯
X)
3
F
i
¸
n
i=1
F
i
=
(12 −17, 6)
3
1 + (14 −17, 6)
3
4 + + (22 −17, 6)
3
2
30
= −3, 96
M

4
(
¯
X =
¸
n
i=1
(x
i

¯
X)
4
F
i
¸
n
i=1
F
i
=
(12 −17, 6)
4
1 + (14 −17, 6)
3
4 + + (22 −17, 6)
4
2
30
= 89, 22
c) Obter os coeficientes de assimetria e curtose
Cs =
M

3

2
)
1,5
=
−3, 96
5, 97
1,5
= −0, 27
53
Ck =
M

4

2
)
2
=
89, 22
5, 97
2
= 2, 50
Cap´ıtulo 3
Probabilidades
3.1 Processo aleat´ orio:
Qualquer fenˆ omeno que gere resultado incerto ou casual.
Ex.:
• Jogar uma moeda e observar a sua face superior;
• Sexo do primeiro filho de um casal;
• N´ umero de chips defeituosos encontrados num lote de 100 chips;
• Peso de uma pessoa.
Caracter´ısticas de um processo (experimento) aleat´ orio
• Cada experimento pode ser repetido indefinidamente sob as mesmas condi¸ c˜ oes;
• N˜ ao se conhece a priori o resultado do experimento, mas pode-se descrever todos os
poss´ıveis resultados;
• Quando o experimento for repetido um grande n´ umero de vezes, surgir´ a uma regular-
idade do resultado, isto ´e, haver´ a uma estabilidade da fra¸ c˜ ao
r
n
(freq¨ uˆencia relativa)
da ocorrˆencia de um particular resultado.
54
55
Figura 3.1: Freq¨ uˆencia relativa de sucessos em fun¸ c˜ ao do n´ umero de repeti¸ c˜ oes (r) para
um experimento com p = 0, 5
3.2 Espa¸co amostral e Eventos
O conjunto formado por todos os poss´ıveis resultados de um processo
aleat´ orio ´e denomiado espa¸co amostral (Ω).
Ex1.: Processo aleat´ orio: Conforma¸ c˜ ao dos dos filhos de um casal com trˆes
filhos quanto ao sexo,
Ω = MMM, MMF, MFM, FMM, MFF, FMF, FFM, FFF,
em que , F = sexo feminino e M = sexo masculino.
Ex2.: Processo aleat´ orio: Verificar a idade de uma pessoa,
Ω = x ∈ R : 0 ≤ x ≤ 120
Ex3.: Processo aleat´ orio: Verificar a cor das flores de uma planta fe feijoeiro,
Ω = ¦branca, roxa, amarela¦.
Qualquer sub-conjunto do espa¸ co amostral (Ω ) ´e denominado evento.
Como exemplo tem-se:
56
E
1
: Trˆes filhos do sexo feminino E
1
= ¦FFF¦.
E
2
: Dois filhos do sexo feminino E
2
= ¦FFM, FMF, MFF¦.
E
3
: Uma pessoa ter entre 20 e 25 anos E
3
= ¦20 ≤ x ≤ 25¦.
Eventos especiais:
Evento certo E
4
= Ω;
Evento imposs´ıvel ou vazio E
5
= φ.
Eventos mutuamente exclusivos.
Dois eventos, A e B, s˜ ao mutuamente exclusivos se eles n˜ ao puderem ocorrer
simultaneamente.
Ex.: A = primeiro filho ser do sexo feminino.
B = primeiro filho ser do sexo masculino.
3.3 Probabilidade
A chamada defini¸ c˜ ao cl´ assica de probabilidade ´e: Dado um conjunto de N
eventos equiprov´ aveis, a probabilidade de ocorrˆencia de um determinado evento A, ´e dada
pela raz˜ ao:
P(A) =
n
N
,
em que:
n ´e o n´ umero de eventos de interesse, e
N o n´ umero total de eventos.
Exemplos:
P(E
1
) =
1
8
= 0, 125
P(E
1
) =
3
8
= 0, 375
Deste modo, a probabilidade pode ser vista como uma medida da possi-
bilidade de ocorrˆencia de um particular evento. Um problema da defini¸ c˜ ao cl´ assica de
probabilidade reside no fato de em sua defini¸ c˜ ao lan¸ car-se m˜ ao do conceito de eventos
equiprov´ aveis, e portanto da express˜ ao a qual deseja-se definir.
57
Modernamente adota-se uma defini¸ c˜ ao axiom´ atica, dada pelos seguintes ax-
iomas, atribu´ıdos ` a Kolmogorov:
Axiomas de Kolmogorov.
• A1 : P(A) ≥ 0;
• A2 : P(Ω) = 1;
• A3 : P(A ∪ B) = P(A) +P(B) se os eventos A e B forem mutuamente exclusivos.
A partir dos axiomas A1, A2 e A3, pode-se enunciar e demonstrar os
seguintes teoremas, que ser˜ ao muito ´ uteis no c´ alculo de probabilidades
T1. P(φ) = 0 Prova:
Ω = Ω ∪ φ
P(Ω) = P(Ω ∪ φ) ← A3
P(Ω) = P(Ω) +P(φ) ← A2
1 = 1 +P(φ)
P(φ) = 0
T2. P(A
c
) = 1 −P(A), A
c
= Acomplementar. Prova:
Ω = A ∪ A
c
P(Ω) = P(A ∪ A
c
) ← A3
P(Ω) = P(A) +P(A
c
) ← A2
1 = P(A) +P(A
c
)
P(A
c
) = 1 −P(A)
58
T3. P(A∪B) = P(A) +P(B) −P(A∩B) Prova: Os eventos A e A
c
∪B s˜ ao mutuamente
exclusivos.
P(A ∪ B) = P[A ∪ (A
c
∩ B)]
= P(A) +P(A
c
∩ B)
B = (B ∩ A) ∪ (A
c
∩ B)
P(B) = P(B ∩ A) +P(A
c
∩ B)
P(A
c
∩ B) = P(B) −P(B ∩ A)
Logo, P(A ∪ B) = P(A) +P(B) −P(A ∩ B)
T4. 0 ≤ P(A) ≤ 1
3.4 Probabilidade Condicionada
Ex: Seja o processo aleat´ orio de se lan¸ car um dado de seis faces, e observar
o valor num´erico da face superior deste.
Ω = 1, 2, 3, 4, 5, 6
Sejam ainda os seguintes eventos:
Evento A : (face superior par) A = 2, 4, 6;
Evento B : (face superior maior ou igual a 4) B = 4, 5, 6;
Tem-se que: P(A) =
1
2
; P(B) =
1
2
e P(A ∩ B) =
1
3
.
Qual a probabilidade de que a face superior do dado seja maior ou igual 4,
sabendo-se que ela ´e par? Neste caso quer saber-se qual a probabilidade do evento B,
sabendo-se que o evento A j´ a ocorreu, P(B/A). Se j´ a sabemos que o evento A ocorreu
(que a face superior ´e par), isto implica numa redu¸ c˜ ao ou restri¸ c˜ ao no espa¸ co amostral Ω,
59
que passa a ser: ω

= ¦2, 4, 6¦ e evento em quest˜ ao, (face superor maior ou igual a 4)
passa a ser: B

= ¦4, 6¦. Ent˜ ao P(B

) =
2
3
.
P(B/A) =
P(A∩B)
P(A)
=
1
3
1
2
=
2
3
Defini¸ c˜ ao:
P(B/A) =
P(A ∩ B)
P(A)
e P(A/B) =
P(A ∩ B)
P(B)
(3.1)
3.5 Independˆencia de eventos.
Dois eventos, A e B s˜ ao considerados independentes (a ocorrˆencia de um,
n˜ ao altera a probabilidade de ocorrˆencia do outro) se e somente se:
P(A/B) = P(A) ou P(B/A) = P(B)
Deste modo, se A e B forem independentes tem-se:
P(A/B) =
P(A ∩ B)
P(B)
P(A ∩ B) = P(A/B)P(B) ∴
P(A ∩ B) = P(A)P(B)
Ex. Considere o quadro a seguir, representativo da distribui¸ c˜ ao dos alunos
matriculados num determinado Instituto de matem´ atica:
sexo
Curso Masculino Feminino total
Mat. pura 70 40 110
Mat. aplicada 15 15 30
Estat´ıstica 10 20 30
Computa¸ c˜ ao 20 10 30
Total 115 85 200
60
Observando-se os dados acima verifica-se que a probabilidade de um aluno
aleatoriamente escolhido ser:
a. do sexo masculino ´e
P(M) =
115
200
= 0, 575
b. do sexo feminino ´e
P(F) =
85
200
= 0, 425
c. do curso de Mat. Pura ´e
P(P) =
110
200
= 0, 550
d. do sexo feminino e fazer Mat. Pura ´e
P(F ∩ P) =
40
200
= 0, 200
e. do curso de Mat. Pura, dado que ´e do sexo feminino ´e
P(P/F) =
40
85
= 0, 4706 ou
P(P/F) =
P(F∩P)
P(F)
=
0,200
0,425
= 0, 4706
Como P(P) = P(P/F) conclui-se que os eventos sexo e curso no qual o aluno esta
matriculada n˜ ao s˜ ao independentes.
3.6 Teorema de Bayes
Ex. Considere 5 urnas exatamente iguais, cada uma com 6 bolas. Duas
destas urnas, (tipo C
1
) tˆem 3 bolas brancas, duas outras, (tipo C
2
) tˆem 2 bolas brancas e
a ´ ultima, (tipo C
3
) tem 6 bolas brancas. Escolhe-se uma urna ao acaso, e retira-se uma
bola desta. Qual a probabilidade de que a urna escolhida seja do tipo C
3
, sabendo-se que
a bola retirada era branca? Esquema:
Quer se obter P(C
3
/B), sabendo-se que:
P(C
1
) =
2
5
; P(B/C
1
) =
1
2
; P(C
2
) =
2
5
; P(B/C
2
) =
1
3
; P(C
3
) =
1
5
;
P(B/C
3
) = 1;
61
Figura 3.2: Representa¸ c˜ ao esquem´ atica das urnas contendo 6 bolas cada
Da defini¸ c˜ ao de probabilidade condicionada, tem-se:
P(C
3
/B) =
P(C
3
∩ B
P(B)
=
P(C
3
)P(B/C
3
)
P(B)
(1)
Como o numerador ´e conhecido, necessita-se conhecer P(B). E como C
1
, C
2
e C
3
s˜ ao eventos mutuamente exclusivos, e reunidos formam o espa¸ co amostral completo,
pode-se decompor o evento B em 3 eventos mutuamente exclusivos:
B = (C
1
∩ B) ∪ (C
2
∩ B) ∪ (C
3
∩ B),
ent˜ ao,
P(B) = P(C
1
∩ B) +P(C
2
∩ B) +P(C
3
∩ B)
= P(C
1
)P(B/C
1
) +P(C
2
)P(B/C
2
) +P(C
3
)P(B/C
3
)
=

2
5

1
2

+

2
5

1
2

+

1
5

(1)
= 8/15(2)
Substituindo (2) em (1)
P(C
3
/B) =
P(C
3
)P(B/C
3
)
P(B)
=
1
5
(1)
8
5
=
3
8
Generalizando este resultado, tem-se o teorema de Bayes:
P(C
i
/A) =
P(C
i
)P(A/C
i
)
¸
n
i=1
P(C
i
)P(A/C
i
)
(3.2)
62
Ex. Uma companhia produz circuitos integrados em trˆes f´ abricas I, II e III.
A f´ abrica I produz 40% dos circuitos, enquanto que as f´ abricas II e III produzem 30% cada.
A probabilidade de que um circuito produzido por estas f´ abricas n˜ ao funcione ´e de 0, 01,
0, 04 e 0, 03, respectivamente. Pegando-se um circuito, ao acaso, da produ¸ c˜ ao conjunta
desta companhia, e verificando-se que ele n˜ ao funciona, qual a probabilidade dele ter sido
produzido na f´ abrica I?
P(I/defeito) =
P(I)P(defeito/I)
P(I)P(defeito/I) +P(II)P(defeito/II) +P(III)P(defeito/III)
=
(0, 40)(0, 01)
(0, 40)(0, 01) + (0, 30)(0, 04) + (0, 30)(0, 03)
= 0, 16
Cap´ıtulo 4
Vari´aveis aleat´ orias
4.1 Vari´aveis Aleat´ orias Unidimensionais.
Uma fun¸ c˜ ao que associa valores reais aos eventos de um espa¸ co amostral ´e
definida como uma vari´ avel aleat´ oria, que pode ser discreta ou cont´ınua.
Ex1. Se um experimento consiste em verificar o n´ umero de componentes
defeituosos, num sistema formado por trˆes componentes, a fun¸ c˜ ao:
X = “n´ umero de componentes defeituosos”, define uma vari´ avel aleat´ oria
discreta, que pode assumir os valores 0, 1, 2 ou 3.
Ex2. Se um experimento consiste em verificar as alturas de 30 universit´ arios,
a fun¸ c˜ ao:
Y = “Altura de um universit´ ario”, define uma vari´ avel aleat´ oria cont´ınua,
que pode assumir quaisquer valores entre 130 e 220cm.
4.1.1 Distribui¸ c˜ oes de Probabilidades
Se uma vari´ avel aleat´ oria X pode assumir os valores x
1
, x
2
, . . . , x
n
com pro-
babilidades respectivamente iguais a p
1
, p
2
, . . . , p
n
, tais que
¸
n
i=1
= 1 , tem-se definida
uma distribui¸c˜ao de probabilidade.
Se a vari´ avel X em quest˜ ao, for discreta, sua distribui¸ c˜ ao ´e caracterizada
por uma fun¸c˜ao de probabilidade P(X = x), que associa probabilidades n˜ ao nulas aos
63
64
poss´ıveis valores da vari´ avel aleat´ oria.
Ex. Para o exemplo do n´ umero de componentes defeituosos em um sistema
composto por trˆes componentes tem-se:
X 0 1 2 3
P(X = x)
1
8
3
8
3
8
1
8
¸
= 1, 00
Se, a vari´ avel X for cont´ınua, somente haver´ a interesse na probabilidade de
que a vari´ avel assuma valores dentro de determinados intervalos, sendo sua distribui¸ c˜ ao de
probabilidades caracterizada por uma fun¸c˜ao densidade probabilidade (f.d.p.), f(x),
a qual dever´ a possuir as seguintes propriedades:
i. f(x) ≥ 0, ∀x ∈ '.
ii.


−∞
f(x)dx = 1.
Ex. Para o caso as alturas dos universit´ arios tem-se
f(x) =
1

2πσ
e

1
2
(x−µ)
2
σ
2
,
que ´e a distribui¸ c˜ ao normal.
4.1.2 Fun¸c˜ao Reparti¸c˜ao ou Distribui¸ c˜ao Acumulada F(x)
F(x) =
x
¸
i=1
P(X = x), (4.1)
para vari´ aveis aleat´ orias discretas, e
F(x) =

x
−∞
f(x)dx, (4.2)
para vari´ aveis aleat´ orias cont´ınuas.
Exemplos:
65
Seja a seguinte vari´ avel aleat´ oria cont´ınua, definida pela fun¸ c˜ ao densidade
de probabilidade (f.d.p):

f(x) = 0 para x < 0
f(x) = kx para 0 ≤ x ≤ 2
f(x) = 0para x > 2
graficamente tem-se:
Figura 4.1: Representa¸ c˜ ao gr´ afica da fun¸ c˜ ao F(x) anteriormente definida
a) Obter o valor de k.
Como f(x) ´e uma fdp tem-se que:


−∞
f(x)dx = 1, portanto:

0
−∞
0dx +

2
0
kxdx +


2
0dx = 1,
0 +k

2
0
xdx + 0 = 1,
k =
1
2
b) calcular F(1)
F(1) = P(X ≤ 1) =

1
−∞
f(x)dx
=

1
−∞
x
2
dx =
1
4
4.2 Vari´aveis Aleat´ orias Bidimensionais
Para o estudo de vari´ aveis aleat´ orias, at´e este ponto, considerou-se que o
resultado do experimento em quest˜ ao seria registrado como um ´ unico valor x. Todavia,
66
existem casos em que h´ a interesse por dois resultados simultˆ aneos, como por exemplo
observar o peso e altura de uma pessoa, o sexo e peso de um rec´em-nascido, etc. Para
tanto, faz-se necess´ ario a seguinte defini¸ c˜ ao:
Sejam E um experimento aleat´ orio, e S o espa¸ co amostral associado a E.
Sejam X e Y duas vari´ aveis aleat´ orias. Ent˜ ao (X, Y ) define uma vari´ avel aleat´ oria bidi-
mensional, que pode ser discreta, cont´ınua ou mista.
4.2.1 Distribui¸ c˜ao Conjunta de duas vari´aveis aleat´ orias
Se (X, Y ) ´e uma vari´ avel aleat´ oria bidimensional discreta, sua fun¸ c˜ ao de
probabilidade, representada por P(X = x
i
; Y = y
i
) que associa um valor p(x
i
, y
i
) a cada
valor do par (X, Y ) deve satisfazer as seguintes condi¸ c˜ oes:
i. P(x
i
, y
i
) ≥ 0∀(x
i
, y
i
).
ii.
¸¸
P(x
i
, y
i
) = 1.
Exemplo: Seja o experimento de se lan¸ car simultaneamente um dado e uma
moeda, observando o resultado da face superior de ambos. Teremos ent˜ ao a seguinte
fun¸ c˜ ao de probabilidade, onde :
X= face superior do dado, e Y= face superior da moeda
X`Y Cara Coroa
1
1
12
1
12
2
1
12
1
12
3
1
12
1
12
4
1
12
1
12
5
1
12
1
12
6
1
12
1
12
1
Se (X, Y ) for uma vari´ avel aleat´ oria bidimensional cont´ınua, diz-se que
f(x, y) ´e uma fun¸ c˜ ao densidade de probabilidade conjunta se:
67
i. f(x, y) ≥ 0, ∀(x, y) ∈ '.
ii.


−∞


−∞
f(x, y)dxdy = 1.
4.2.2 Distribui¸ c˜ao Marginal
Dada uma vari´ avel aleat´ oria bidimensional, e sua distribui¸ c˜ ao de probabili-
dade conjunta, pode-se obter a distribui¸ c˜ ao da vari´ avel X, sem considerar Y ou vice-versa,
que s˜ ao denominadas distribui¸ c˜ oes marginais de X e Y respectivamente.
Distribui¸ c˜ ao marginal de X
P(X = x
i
) =
¸
j
P(x
i
, y
j
), (4.3)
para vari´ aveis aleat´ orias discretas e
g(x) =


−∞
f(x, y)dy, (4.4)
para vari´ aveis aleat´ orias cont´ınuas.
Distribui¸ c˜ ao marginal de Y
P(Y = y
j
) =
¸
i
P(x
i
, y
j
), (4.5)
para vari´ aveis aleat´ orias discretas e
h(y) =


−∞
f(x, y)dx, (4.6)
para vari´ aveis aleat´ orias cont´ınuas.
Exemplo no exemplo do lan¸ camento simultˆ aneo de um dado e uma moeda
teremos: X= face superior do dado, e Y= face superior da moeda
X= face superior do dado, e Y= face superior da moeda
68
X`Y Cara Coroa P(X = x
i
)
1
1
12
1
12
1
6
2
1
12
1
12
1
6
3
1
12
1
12
1
6
4
1
12
1
12
1
6
5
1
12
1
12
1
6
6
1
12
1
12
1
6
P(Y = y
j
)
1
2
1
2
1
4.2.3 Vari´aveis Aleat´ orias Independentes
Seja (X, Y ) uma vari´ avel aleat´ oria bidimendional, ent˜ ao as vari´ aveis X e Y
s˜ ao independentes se e somente se
P(x
i
, y
j
) = P(x
i
).P(y
j
)∀ i e j,
para vari´ aveis aleat´ orias discretas, ou
f(x, y) = g(x).h(y)∀ i e j,
para vari´ aveis aleat´ orias cont´ınuas
4.2.4 Esperan¸ca Matem´atica
A esperan¸ ca matem´ atica de uma vari´ avel aleat´ oria ou valor esperado, E(X),
e definida por:
E(X) = µ =
¸
i
x
i
P(X = x
i
), (4.7)
para vari´ aveis aleat´ orias discretas, e
E(X) = µ =


−∞
xf(x)dx, (4.8)
69
para vari´ aveis aleat´ orias cont´ınuas
Ex1: Para a vari´ avel aleat´ oria cont´ınua definida por:

f(x) = 0 para x < 0
f(x) =
x
2
para 0 ≤ x ≤ 2
f(x) = 0para x > 2
tem-se
E(X) =


−∞
xf(x)dx
=

0
−∞
0dx +

2
0
x
2
2
dx +


2
0dx
=
4
3
unidade
Ex2: Para a vari´ avel aleat´ oria discreta n´ umero de componentes pifados tem-
se:
X 0 1 2 3
P(X = x)
1
8
3
8
3
8
1
8
¸
= 1, 0
E(X) =
¸
i
x
i
P(X = x
i
)
= 0
1
8
+ 1
3
8
+ 2
3
8
+ 3
1
8
= 1, 5 componentes pifados por sistema.
4.2.4.1 Propriedades da Esperan¸ca Matem´atica
i. E(k) = k, k = constante;
ii. E(kX) = k.E(X);
iii. E(X ±Y ) = E(X) ±E(Y );
iv. E(X ±k) = E(X) ±k;
v. E(XY ) = E(X)E(Y ) se X e Y forem independentes.
70
4.2.5 Variˆancia de uma vari´avel aleat´ oria.
V (X) = E[X −E(X)]
2
= E[X −µ]
2
. (4.9)
Aplicando-se a defini¸ c˜ ao de esperan¸ ca matem´ atica (eq 4.7 e 4.8 verifica-se
que a variˆ ancia pode ser ent˜ ao definida como:
V (X) =
¸
i
(x
i
−µ)
2
P(X = x
i
), (4.10)
para vari´ aveis aleat´ orias discretas, e
V (X) =


−∞
(x
i
−µ)
2
f(x)dx, (4.11)
para vari´ aveis aleat´ orias cont´ınuas.
Obs.
V (X) = E[X −E(X)]
2
= E¦X
2
−2XE(X) + [E(X)]
2
¦
= E(X
2
) −2E(X)E(X) + [E(X)]
2
= E(X
2
) −[E(X)]
2
com,
E(X
2
) =
¸
i
x
2
i
P(X = x
i
),
no caso discreto, e
E(X
2
) =


−∞
x
2
f(x)dx,
no caso cont´ınuo.
Ex1. Para a vari´ avel aleat´ oria cont´ınua definida por:

f(x) = 0 para x < 0
f(x) =
x
2
para 0 ≤ x ≤ 2
f(x) = 0para x > 2
71
tem-se:
V (X) = E(X
2
) −[E(X)]
2
E(X
2
) =


−∞
x
2
f(x)dx
=

0
−∞
0dx +

2
0
x
3
2
dx +


2
0dx
= 2 unidade
V (X) = 2 −

4
3

2
=
2
9
unidade
2
Ex2: Para a vari´ avel aleat´ oria discreta n´ umero de componentes pifados tem-
se:
X 0 1 2 3
P(X = x)
1
8
3
8
3
8
1
8
¸
= 1, 0
V (X) = E(X
2
) −[E(X)]
2
E(X
2
) =
¸
i
x
2
i
P(X = x
i
)
= (0
2
)
1
8
+ (1
2
)
3
8
+ (2
2
)
3
8
+ (3
2
)
1
8
= 3
V (X) = 3 −

3
2

2
=
3
4
(componentes pifados por sistema)
2
4.2.5.1 Propriedades da variˆancia
i. V (k) = 0, k = constante;
ii. V (k.X) = k
2
V (X);
iii. V (k ±X) = V (X);
iv. V (X ±Y ) = V (X) ±V (Y ) se X e Y forem independentes;
72
4.2.6 Covariˆancia
A covariˆ ancia mede o grau de dispers˜ ao conjunta de duas vari´ aveis aleat´ orias.
Cov(X, Y ) = E ¦[X −E(X)][Y −E(Y )]¦ = E(XY ) −E(X)E(Y ), (4.12)
com,
E(XY ) =
¸
i
¸
j
x
i
y
j
P(X = x
i
)(Y = y
j
),
para vari´ aveis aleat´ orias discretas, e
E(XY ) =


−∞


−∞
xyf(xy)dxdy,
para vari´ aveis aleat´ orias continuas.
Obs. Para duas vari´ aveis aleat´ orias quaisquer tem-se:
V (X +Y ) = V (X) +V (Y ) + 2Cov(X, Y ).
Se X e Y forem independentes, Cov(X, Y ) = 0, voltando-se a propriedade
iv. das variˆ ancias. Por´em o fato de Cox(X, Y ) = 0 n˜ ao implica que X e Y sejam
independentes.
4.3 Distribui¸c˜ oes de vari´aveis aleat´ orias discretas
4.3.1 Distribui¸ c˜ao Uniforme Discreta
Enquadram-se aqui as distribui¸ c˜ oes em que os poss´ıveis valores da vari´ avel
aleat´ oria tenham todos a mesma probabilidade de ocorrˆencia. Logo, se existem n valores
poss´ıveis, cada um ter´ a probabilidade igual a
1
n
.
Ex. Seja o lan¸ camento de um dado e a vari´ avel aleat´ oria X = “face superior
do dado”, tem-se que:
X 1 2 3 4 5 6
P(X = x)
1
6
1
6
1
6
1
6
1
6
1
6
¸
= 1
73
ou P(X = x) = 1/6
4.3.2 Distribui¸ c˜ao de Bernoulli
Seja um experimento onde s´ o podem ocorrer dois poss´ıveis resultados,
“sucesso” e “fracasso”, como por exemplo:
• Um jogador de basquete converter ou n˜ ao converter um arremesso,
• Um indiv´ıduo portador de certa doen¸ ca morrer ou n˜ ao,
• Uma pe¸ ca produzida por uma Cia. Ser perfeita ou defeituosa,
• O sexo do primeiro filho de um casal ser masculino ou feminino,
• Um consumidor que entra numa loja comprar ou n˜ ao comprar um produto.
Associando-se uma vari´ avel aleat´ oria X aos poss´ıveis resultados do experi-
mento, de forma que:
X = 1 se o resultado for “sucesso” e
X = 0 se o resultado for “fracasso”.
Ent˜ ao, a vari´ avel aleat´ oria X, assim definida tem distribui¸ c˜ ao Bernoulli, com
p sendo a probabilidade de ocorrer “sucesso”, e q = (1 − p) a probabilidade de ocorrer
“fracasso”.
Fun¸ c˜ ao de probabilidade
A fun¸ c˜ ao de probabilidade da Distribui¸ c˜ ao de Bernoulli ´e dada por:
P(X = x) =

q = (1 −p) para x = 0
p para x = 1
0 para outros valores de x.
(4.13)
Parˆ ametros caracter´ısticos
E(X) = p
74
Prova:
E(X) =
¸
x
i
P(X = x
i
)
= 1p + 0(1 −P)
= p
V (X) = pq
Prova:
V (X) = E(X
2
) −[E(X)]
2
E(X
2
) =
¸
x
2
i
P(X = x
i
)
= p

V (X) = p −p
2
= P(1 −p)
= pq
4.3.3 Distribui¸ c˜ao Binomial.
´
E a mais importante das distribui¸ c˜ oes de probabilidades discretas. Sendo
que, para um experimento se enquadrar na distribui¸ c˜ ao Binomial, deve-se atender as
seguintes condi¸ c˜ oes:
i. S˜ ao realizadas n provas (tentativas) independente;
ii. Cada tentativa ´e uma prova de Bernoulli (s´ o podem ocorrer dois poss´ıveis resultados);
iii. A probabilidade p de sucesso em cada prova ´e constante.
Se um experimento atende a todas as condi¸ c˜ oes acima, ent˜ ao a vari´ avel aleat´ oria X =
n´ umero de sucessos obtidos nas n tentativas ter´ a uma distribui¸ c˜ ao Binomial, com n ten-
tativas e p (probabilidade de sucesso). Simbolicamente : X ∼ B(n, p)
75
Fun¸ c˜ ao de Probabilidade
P(X = x) = C
x
n
p
x
q
n−x
, (4.14)
com
C
x
n
=
n!
x!(n−x)!
;
p = probabilidade de “sucesso”;
q = 1 −p = probabilidade de “fracasso”
Parˆ ametros caracter´ısticos
E(X) = np
V (X) = npq
prova:
E(X) =
n
¸
x=0
xP(X = x)
=
n
¸
x=0
xC
x
n
p
x
q
n−x
=
n
¸
x=0
x
n!
x!(n −x)!
p
x
q
n−x
=
n
¸
x=1
n!
(x −1)!(n −x)!
p
x
q
n−x
fazendo s = x −1
=
n−1
¸
s=0
n
(n −1)!
s!(n −1 −s)!
p
(s+1)
q
n−(s+1)
= n
n−1
¸
s=0
C
s
(n−1)
p
(s+1)
q
n−(s+1)
= np
n−1
¸
s=0
C
s
(n−1)
p
s
q
(n−1)−s
= np
Exemplos:
Ex1. Sabendo-se que a probabilidade de um determinado casal gerar um
filho com olhos azuis ´e de
1
4
, qual a probabilidade de que dentre trˆes filhos deste casal,
76
a) Nenhum tenha olhos azuis.
b) Um tenha olhos azuis.
c) Dois tenham olhos azuis.
d) Os Trˆes tenham olhos azuis.
Ser˜ ao considerados dois m´etodos para resolu¸ c˜ ao deste exemplo:
1
o
M´etodo - pela defini¸ c˜ ao de probabilidades:
Espa¸ co amostral:
Ω =

EEE EAA
EEA AEA
EAE AAE
AEE AAA

Uma vez que a cor dos olhos de um filho independe da cor dos olhos dos demais (s˜ ao
eventos independentes), a probabilidade de cada um dos eventos do espa¸ co amostral ´e:
P(EEE) =
27
64
P(EAA) =
3
64
P(EEA) =
9
64
P(AEA) =
3
64
P(EAE) =
9
64
P(AAE) =
3
64
P(AEE) =
9
64
P(AAA) =
1
64
Assim,
a. P(Nenhum com olhos azuis) = PEEE =
27
64
;
b. P(um com olhos azuis) = P(EEA ∪ EAE ∪ AEE) =
9
64
+
9
64
+
9
64
=
27
64
;
c. P(dois com olhos azuis) = P(EAA ∪ AAE ∪ AEA) =
3
64
+
3
64
+
3
64
=
9
64
;
d. P(trˆ es com olhos azuis) = P(AAA) =
1
64
;
2
o
M´etodo - utilizando a fun¸ c˜ ao de probabilidade binomial:
X ∼ B(3,
1
4
)
77
a. P(Nenhum com olhos azuis) = P(X = 0) = C
0
3

1
4

0

3
4

3
=
27
64
;
b. P(um com olhos azuis) = P(X = 1) = C
1
3

1
4

1

3
4

2
=
27
64
;
c. P(dois com olhos azuis) = P(X = 2) = C
2
3

1
4

2

3
4

1
=
9
64
;
d. P(trˆ es com olhos azuis) = P(X = 3) = C
3
3

1
4

3

3
4

0
=
1
64
;
Deste modo, verifica-se que a probabilidade total ´e dada por: C
0
3
p
0
q
3
+
C
1
3
p
1
q
2
+ C
2
3
p
2
q
1
+ C
3
3
p
3
q
0
que corresponde a expans˜ ao do binˆ omio (p + q)
3
da´ı o nome
distribui¸ c˜ ao binomial.
Ex2. Num determinado processo de fabrica¸ c˜ ao, 10% das pe¸ cas produzidas
s˜ ao consideradas defeituosas. As pe¸ cas s˜ ao acondicionadas em caixas com 5 unidades cada
uma.
a) Qual a probabilidade de haverem exatamente 3 pe¸ cas defeituosas numa caixa?
X ∼ B(5, 0, 1)
P(X = 3) = C
3
5
(0, 1)
3
(0, 9)
2
= 0, 0081
b) Qual a probabilidade de haverem duas ou mais pe¸ cas defeituosas em uma caixa?
P(X ≥ 2) = P(X = 2) + P(X = 3) + P(X = 4) + P(X = 5) = 1 −
[P(X = 0) +P(X = 1)] = 0, 0815
c) Qual a probabilidade de uma caixa n˜ ao apresentar nenhuma pe¸ ca defeituosa?
P(X = 0) = C
0
5
(0, 1)
0
(0, 9)
5
= 0, 5905
d) Supondo que a empresa pague uma multa de R$10,00 por caixa que apresente pe¸ cas
defeituosas, qual o valor esperado desta multa em um lote de 1000 caixas?
P(uma caixa ter pe¸ ca defeituosa) = 1 −P(X = 0) = 0, 4095.
O n´ umero de caixas com pe¸ cas defeituosas em um lote de 1000 caixas segue uma
distribui¸ c˜ ao binomial com n = 1000 e p = 0, 4095. Assim,
E(Y ) = np = 1000.0, 4095 = 409, 5 caixas. e o valor esperado da multa:
E(Multa) = 10E(Y ) = (10)(409, 5) = R$4095, 00
78
4.3.4 Distribui¸ c˜ao de Poison
A distribui¸ c˜ ao de Poison ´e empregada em experimentos nos quais n˜ ao se
esta interessado no n´ umero de sucessos obtido em n tentativas, como ocorre no caso da
distribui¸ c˜ ao Binomial, mas sim no n´ umero de sucessos ocorridos durante um intervalo
cont´ınuo, que pode ser um intervalo de tempo, espa¸ co, etc. Como por exemplo:
• O n´ umero de suic´ıdios ocorridos em uma cidade durante um ano;
• O n´ umero de acidentes automobil´ısticos ocorridos numa rodovia em um mˆes;
• O n´ umero de defeitos encontrados em um rolo de arame ovalado, de 500m;
Note que nos exemplos acima, n˜ ao h´ a como determinar-se a probabilidade
de ocorrˆencia de um sucesso, mas sim a freq¨ uˆencia m´edia de sua ocorrˆencia, como por
exemplo dois suic´ıdios por ano, a qual ser´ a que denominada λ. Em um experimento
com estas caracter´ısticas, e assumindo-se que os sucessos sejam independˆentes, a vari´ avel
aleat´ oria
X = n´ umero de sucessos em um intervalo,
ter´ a uma distribui¸ c˜ ao Poisson, com parˆ ametro λ. Simbolicamente : X ∼
P(λ)
Fun¸ c˜ ao de Probabilidade
P(X = x) =
e
−λ
λ
x
x!
, (4.15)
com
e = 2, 7182 (base dos logaritimos neperianos).
Parˆ ametros Caracter´ısticos
E(X) = V (X) = λ
79
Prova:
E(X) =
n
¸
x=0
xP(X = x)
=
n
¸
x=0
x
e
−λ
λ
x
x!
=
n
¸
x=0
e
−λ
λ
x
(x −1)!
fazendo s=x-1 tem-se:
=
n
¸
x=0
e
−λ
λ
s+1
s!
= λ
n
¸
x=0
e
−λ
λ
s
s!
= λ
E(X
2
) =
n
¸
x=0
x
2
P(X = x)
=
n
¸
x=0
x
2
e
−λ
λ
x
x!
=
n
¸
x=0
x
e
−λ
λ
x
(x −1)!
fazendo s=x-1 tem-se:
=
n
¸
x=0
(s + 1)
e
−λ
λ
s+1
s!
= λ
n
¸
x=0
(s + 1)
e
−λ
λ
s
s!
= λ
¸
n
¸
x=0
s
e
−λ
λ
s
s!
+
n
¸
x=0
e
−λ
λ
s
s!
¸
= λ[λ + 1]
= λ
2

80
V (X) = E(X
2
) −[E(X)]
2
= λ
2
+λ −λ
2
= λ
Exemplo: O Corpo de Bombeiros de uma determinada cidade recebe, em
m´edia, 3 chamadas por dia. Qual a probabilidade de receber:
a) 4 chamadas num dia X P(3)
P(X = 4) =
e
−3
3
4
4!
= 0, 1680.
b) Nenhuma chamada em um dia
P(X = 0) =
e
−3
3
0
0!
= 0, 0498.
c) 20 chamadas em uma semana. X = n´ umero de chamadas por dia
Y = n´ umero de chamadas por semana
E(X) = λ = 3 chamadas por dia → E(Y ) = λ

= 7E(X) = 21 chamadas por semana
P(Y = 20) =
e
−21
21
2
0
20!
= 0, 0867.
4.3.4.1 Aproxima¸c˜ao da distribui¸c˜ao Binomial a Poisson.
Pode-se demonstrar que uma distribui¸ c˜ ao Binomial, cujo evento de interesse
´e raro (p muito pequeno e n muito grande), tende para uma distribui¸ c˜ ao de Poisson. Na
pr´ atica, a aproxima¸ c˜ ao ´e considerada boa quando n ≥ 50 e p ≤ 0, 10.
Aproxima¸ c˜ ao: Sabe-se que se X ∼ B(n, p), E(X) = np, ent˜ ao λ = E(X) =
np
Exemplo: A probabilidade de um indiv´ıduo sofrer uma rea¸ c˜ ao al´ergica, re-
sultante da inje¸ c˜ ao de determinado soro ´e de 0,01. Determinar a probabilidade de entre
200 indiv´ıduos, submetidos a este soro, nenhum sofrer esta rea¸ c˜ ao al´ergica.
X ∼ B(200, 0, 01) → E(X) = n.p = 200x0, 01 = 2 = λ
P(X = 2) ·
e
−2
2
0
0!
= 0, 1353.
81
4.3.5 Distribui¸ c˜ao Geom´etrica
Suponha-se um experimento, no qual esteja-se interessado apenas na
ocorrˆencia ou n˜ ao de um determinado evento, como por exemplo o sexo do filho de uma
determinada mulher ser feminino. E, assim como na distribui¸ c˜ ao binomial, que esse exper-
imento seja repetido um n´ umero n de vezes, que em cada repeti¸ c˜ ao seja independente das
demais e que a probabilidade de sucesso p em cada repeti¸ c˜ ao seja constante. Suponha-se
que o experimento seja repetido at´e que ocorra o primeiro sucesso (o sexo do filho seja
feminino).
Ent˜ ao a vari´ avel aleat´ oria: X = n´ umero de tentativas at´e que se obtenha
o primeiro sucesso, seguir´ a uma distribui¸ c˜ ao geom´etrica, com parˆ ametro p (probabilidade
de sucesso) . Simbolicamente X ∼ G(p).
Fun¸ c˜ ao de Probabilidade
Como o experimento ser´ a repetido at´e que se obtenha o primeiro sucesso, e
considerando que esse ocorra na k-´esima repeti¸ c˜ ao, dever˜ ao ocorrer k − 1 fracassos antes
que o experimento seja encerrado. Assim, a a probabilidade de que a vari´ avel aleat´ oria
X = n´ umero de repeti¸ c˜ oes at´e se obter o primeiro sucesso ´e
P(X = x) = pq
x−1
, (4.16)
com
p = probabilidade de “sucesso”;
q = 1 −p = probabilidade de “fracasso”
Parˆ ametros caracter´ısticos
E(X) =
1
p
V (X) =
q
p
2
Prova:
82
E(X) =

¸
x=1
xP(X = x)
=

¸
x=1
xpq
x−1
= p

¸
x=1
xq
x−1
= p

¸
x=1
d
dq
q
x
= p
d
dq

¸
x=1
q
x
= p
d
dq
(q
1
+q
2
+. . . ) = p
d
dq
¸
q
1 −q

= p
dq(1 −q) −d(1 −q)q
(1 −q)
2
= p
1(1 −q) −(−1)q
(1 −q)
2
= p
1
(1 −q)
2
= p
1
p
2
=
1
p
Obs: a permuta da deriva¸ c˜ ao e do somat´ orio ´e v´ alida aqui, porque a s´erie
converge quando [q[ < 1.
E(X
2
) =

¸
x=1
x
2
P(X = x)
=

¸
x=1
x
2
pq
x−1
= p

¸
x=1
x
2
q
x−1
= p

¸
x=1
d
dq
q
x
= p
d
dq

¸
x=1
q
x
= p
d
dq
(q
1
+q
2
+. . . ) = p
d
dq
¸
q
1 −q

= p
dq(1 −q) −d∂(1 −q)q
(1 −q)
2
= p
1(1 −q) −(−1)q
(1 −q)
2
= p
1
(1 −q)
2
= p
1
p
2
=
1
p
Exemplo:
83
Um casal com problemas para engravidar, recorreu a uma t´ecnica de insem-
ina¸ c˜ ao artificial no intuito de conseguir o primeiro filho. A eficiˆencia da referida t´ecnica ´e
de 0, 20 e o custo de cada insemina¸ c˜ ao U$2000, 00.
a) Qual a probabilidade de que o casal obtenha ˆexito na terceira tentativa?
P(X = k) = pq
k−1
= (0, 2)(0, 8)
2
= 0, 128
b) Qual o custo esperado deste casal para obter o primeiro filho?
E(X) =
1
p
=
1
0, 2
= 5
Custo esperado = 5 ∗ 2000, 00 = U$10000, 00
4.3.6 Distribui¸ c˜ao Pascal (Binomial Negativa)
Nas mesmas condi¸ c˜ oes em que foi definida a distribui¸ c˜ ao geom´etrica, e con-
siderando que o experimento ser´ a repetido at´e que se obtenha o r-´esimo sucesso, ent˜ ao a
vari´ avel X = n´ umero de tentativas at´e se obter o r-´esimo sucesso seguir´ a a distribui¸ c˜ ao
de Pascal.
Fun¸ c˜ ao de Probabilidade:
Para que o r-´esimo sucesso ocorra na k-´esima tentativa, ´e necess´ ario que
ocorra um sucesso nesta tentativa (repeti¸ c˜ ao do experimento) e que tenham ocorrido r −1
sucessos nas k−1 repeti¸ c˜ oes anteriores. Dado que a probabilidade de ocorrˆencia de sucesso,
numa dada repeti¸ c˜ ao do experimento ´e dada por p e a probabilidade de ocorrerem r − 1
sucessos em k −1 repeti¸ c˜ oes, e sendo estes dois eventos independentes, a probabilidade de
que o r-´esimo sucesso ocorra na k-´esima repeti¸ c˜ ao do experimento ´e dada por:
84
P(X = k) = pC
(r−1)
(k−1)
p
r−1
q
(k−1)−(r−1)
;
= C
(r−1)
(k−1)
p
r
q
k−r
, k ≥ r; (4.17)
em que:
p = probabilidade de “sucesso”;
q = 1 −p = probabilidade de “fracasso”
Parˆ ametros caracter´ısticos
E(X) =
r
p
V (X) =
rq
p
2
Prova:
De acordo com Meyer (1969) a esperan¸ ca e variˆ ancia da distribui¸ c˜ ao Pascal
podem ser obtidas do seguinte modo:
Sejam as vari´ aveis:
Z
1
= n´ umero de repeti¸ c˜ oes necess´ arias at´e o primeiro sucesso
Z
2
= n´ umero de repeti¸ c˜ oes necess´ arias entre o primeiro sucesso
e o segundo, inclusive
.
.
.
.
.
.
Z
r
= n´ umero de repeti¸ c˜ oes necess´ arias entre o (r-1) sucesso e o r-´esimo sucesso,
inclusive
´
E imediato verificar que todas as vari´ aveis Z
i
s˜ ao independentes e possuem
distribui¸ c˜ ao geom´etrica. Assim,
85
E(Y ) = E(Z
1
+Z
2
+ +Z
r
)
= E(Z
1
) +E(Z
2
) + +E(Z
r
)
=
1
p
+
1
p
+ +
1
p
=
r
p
de modo an´ alogo:
V (Y ) = V (Z
1
+Z
2
+ +Z
r
)
= V (Z
1
) +V (Z
2
) + +V (Z
r
)
=
q
p
2
+
q
p
2
+ +
q
p
2
=
rq
p
2
4.3.7 Distribui¸ c˜ao Hipergeom´etrica
Considere um conjunto de N elementos, r dos quais tˆem uma determinada
caracter´ıstica (r ≤ N), e que destes N elementos ser˜ ao extra´ıdos n elementos sem reposi¸ c˜ ao
(n ≤ N). A vari´ avel aleat´ oria X = n´ umero de elementos com a referida caracter´ıstica,
que estar˜ ao entre os n retirados, segue uma distribui¸ c˜ ao hipergeom´etrica, cuja fun¸ c˜ ao de
probabilidade ´e derivada diretamente da defini¸ c˜ ao cl´ assica de probabilidade.
Fun¸ c˜ ao de probabilidade:
P(X = x) =
C
x
r
C
n−x
N−r
C
n
N
(4.18)
Parˆ ametros caracter´ısticos:
Fazendo
r
N
= p e
N−r
N
= q tem-se:
E(X) = np (4.19)
V (X) = npq
N −n
N −1
(4.20)
86
Exemplo:
No fich´ ario de um hospital, est˜ ao arquivados os prontu´ arios dos de 20 pa-
cientes, que deram entrada no PS apresentando algum problema card´ıaco. Destes 5 sofr-
eram infarto. Retirando-se uma amostra ao acaso de 3 destes prontu´ arios, qual a proba-
bilidade de que dois deles sejam de pacientes que sofreram infarto?
P(X = 2) =
C
2
5
C
3−2
20−5
C
2
0
3
=
C
2
5
C
1
15
C
2
0
3
=
(10)(15)
1140
= 0, 1315
4.3.8 Distribui¸ c˜ao Multinomial
Considere um experimento com as seguintes caracter´ıticas:
i. S˜ ao realizadas n provas independentes;
ii. Cada prova admite um ´ unico resultado entre r poss´ıveis;
iii. As probabilidades p
i
de ocorrer um determinado resultado s˜ ao constantes para todas
as repeti¸ c˜ oes do experimento.
Associando a este experimento r vari´ aveis aleat´ orias (X
1
, X
2
, . . . , X
r
) cada
uma indicando o n´ umero de vezes que ocorreu o resultado nas n repeti¸ c˜ oes. Ent˜ ao, a
distribui¸ c˜ ao da vari´ avel multi dimensional (X
1
, X
2
, . . . , X
r
) ´e chamada distribui¸ c˜ ao multi-
nomial.
Fun¸ c˜ ao de probabilidade
P(X
1
= x
1
; X
2
= x
2
; . . . ; X
r
= x
r
) =
n!
x
1
!x
2
! . . . x
n
!
p
x
1
1
p
x
2
2
. . . p
x
n
n
(4.21)
Exemplo:
87
Em um determinado cruzamento entre duas plantas de milho, a probabili-
dade de se obter uma planta com gen´ otipo MM ´e igual a 0, 25, com gen´ otipo Mm, 0, 50
e com gen´ otipo mm 0, 25. De 10 descendentes deste cruzamento, qual a probabilidade de
que se obtenham respectivamente 2, 5 e 3 indiv´ıduos com gen´ otipos MM, Mm e mm?
P(MM = 2; Mm = 5; mm = 3) =
10!
2!5!3
(0, 25)
2
(0, 50)
5
(0, 25)
3
= 0, 0769
4.4 Distribui¸c˜ oes de vari´aveis aleat´ orias cont´ınuas
4.4.1 Distribui¸ c˜ao Uniforme
A fun¸ c˜ ao densidade probabilidade da distribui¸ c˜ ao uniforme cont´ınua ´e dada
por:
f(x) =

1
b−a
para a ≤ x ≤ b
0 para outos valores de x (pov)
(4.22)
´
E f´ acil verificar que que a equa¸ c˜ ao 4.22 e uma fun¸ c˜ ao densidade probabilidade
pois:


−∞
f(x)dx =

a
−∞
0dx +

b
a
1
b −a
dx +


b
0dx
= 0 +
1
b −a
x

b
a
+ 0
=
1
b −a
(b −a) = 1
Parˆ ametros caracter´ısticos
E(X) =
a +b
2
(4.23)
V (X) =
(b −a)
2
12
(4.24)
88
Prova:
E(X) =


−∞
xf(x)dx
=

a
−∞
x0dx +

b
a
x
1
b −a
dx +


b
x0dx
= 0 +
1
b −a
x
2
2

b
a
+ 0
=
b
2
−a
2
2(b −a)
=
(b −a)(b +a)
2(b −a)
=
b +a
2
E(X
2
) =


−∞
x
2
f(x)dx
=

a
−∞
x
2
0dx +

b
a
x
2
1
b −a
dx +


b
x
2
0dx
= 0 +
1
b −a
x
3
3

b
a
+ 0
=
b
3
−a
3
3(b −a)
V (X) = E(X
2
) −[E(X)]
2
=
b
3
−a
3
3(b −a)

¸
b +a
2

2
=
b
3
−a
3
3(b −a)

(b +a)
2
4
=
4(b
3
−a
3
) −3(b +a)
2
12(b −a)
=
b
3
−3ab
2
+ 3a
2
b −a
3
12(b −a)
=
(b −a)
3
12(b −a)
=
(b −a)
2
12
4.4.2 Distribui¸ c˜ao Normal
´
E a mais importante das distribui¸ c˜ oes de probabilidades cont´ınuas, tendo
grande aplica¸ c˜ ao em pesquisas cient´ıficas e tecnol´ ogicas. Pois, a maioria das vari´ avies
89
cont´ınuas de interesse pratico, seguem esta distribui¸ c˜ ao, aliado ao fato da facilidade e boa
precis˜ ao que ´e obtida na aproxima¸ c˜ ao de outras distribui¸ c˜ oes, como a Binomial, para esta,
e o Teorema do Limite Central (TLC) que ´e a base das estimativas e testes de hip´ oteses,
realizados sobre a m´edia de uma popula¸ c˜ ao qualquer, que garante que a distribui¸ c˜ ao
amostral das m´edias segue uma distribui¸ c˜ ao normal, independentemente da distribui¸ c˜ ao
da vari´ avel em estudo, como ser´ a visto mais adiante.
Fun¸ c˜ ao Densidade Probabilidade
A fun¸ c˜ ao densidade probabilidade normal ´e dada por:
f(x) =
1

2πσ
e

1
2
(
x−µ
σ
)
2
(4.25)
em que:
µ e σ s˜ ao os parˆ ametros m´edia e desvio padr˜ ao respectivamente,
π e e s˜ ao as constantes 3,1415 e 2,7182 respectivamente.
Gr´ afico.
O gr´ afico da fun¸ c˜ ao normal ´e dado por:
Figura 4.2: Distribui¸ c˜ ao normal.
Propriedades.
i.
´
E sim´etrica em rela¸ c˜ ao ao ponto x = µ;
90
ii. Tem forma campanular (sino);
iii. As trˆes medidas de posi¸ c˜ ao, m´edia, mediana e moda se confundem no ponto de m´ aximo
da curva (x = µ);
iv. Fica perfeitamente definida conhecendo-se a m´edia e o desvio padr˜ ao;
v. Tem dois pontos de inflex˜ ao em x = µ ±σ;
vi.
´
E assint´ otica em rela¸ c˜ ao ao eixo das abicissas.
Sendo a fun¸ c˜ ao 4.25 uma fun¸ c˜ ao densidade de probabilidade (fdp), ´ area
compreendida entre a curva e eixo x ´e igual a 1, ou seja


−∞
f(x)dx = 1.
Portanto, a ´ area sob a curva entre os pontos a e b, em que a ¡ b, dada por

b
a
f(x)dx = 1 representa a probabilidade da vari´ avel X assumir um valor entre a e b.
Deste modo, ´e imediato verificar que probabilidade de um ponto qualquer ´e
nula, pois

a
a
f(x)dx = 0.
Nota¸ c˜ ao
X ∼ N(µ, σ
2
)
4.4.2.1 Distribui¸c˜ao Normal Reduzida ou Padronizada.
Como pode-se notar, o c´ alculo de probabilidades via distribui¸ c˜ ao normal
envolve a solu¸ c˜ ao de integrais que n˜ ao s˜ ao nada triviais. Em virtude da grande aplica¸ c˜ ao
da distribui¸ c˜ ao normal, procurou-se tabelar os valores de probabilidade, que seriam obti-
dos por meio da integra¸ c˜ ao da fun¸ c˜ ao densidade probabilidade normal num determinado
intervalo. A dificuldade para se processar esse tabelamento se prendeu na infinidade de
valores que µ e σ poderiam assumir. Nestas condi¸ c˜ oes teria que se dispor de uma tabela
para cada uma das infinitas combina¸ c˜ oes de µ e σ. Procurou-se, por isso, obter uma
nova forma para a distribui¸ c˜ ao normal, que n˜ ao sofresse a influencia destes parˆ ametros (µ
e σ). O problema foi solucionado mediante o emprego de uma nova vari´ avel,z definida
por:z =
x−µ
σ
, que transforma todas as distribui¸ c˜ oes normais, em uma distribui¸ c˜ ao nor-
mal reduzida, ou padronizada, de m´edia zero e desvio padr˜ ao um, z ∼ N(0, 1). Assim,
91
utilizamos apenas uma tabela para o c´ alculo de probabilidades, para qualquer que seja a
curva correspondente a uma distribui¸ c˜ ao normal. Desta forma, para um valor de x = µ
numa distribui¸ c˜ ao normal qualquer, corresponde o valor:z = 0, na distribui¸ c˜ ao normal
reduzida. Para x = µ +σ tem-se z = 1, e assim por diante.
Exemplo:
1. A dura¸ c˜ ao de um certo tipo de pneu, em quilˆ ometros rodados, ´e uma vari´ avel normal
com dura¸ c˜ ao m´edia 60000Km e desvio padr˜ ao 10000Km.
a) Qual a probabilidade de um pneu aleatoriamente escolhido durar mais de
75000Km?
Sabe-se que X ∼ N(60000; 10000
2
) e deseja-se obter: P(X ≥ 75000) =?
Figura 4.3:
Utilizando-se a transforma¸ c˜ ao:
z =
x −µ
σ
tem-se:
que o valor x = 75000 equivale a z =
75000−60000
10000
=
15000
10000
= 1, 5,
portanto,
P(X ≥ 75000) = P(z ≥ 1, 5) = 0, 5 −0, 4332 = 0, 0668
b) Qual a probabilidade de um pneu aleatoriamente escolhido durar entre 50000km
e 70000km? P(50000 ≤ X ≤ 70000) =?
P(50000 ≤ X ≤ 70000) = P(−1 ≤ z ≤ 1) = 0, 3413 + 0, 3413 = 0, 6826
92
Figura 4.4:
Figura 4.5:
c) Qual a probabilidade de um pneu aleatoriamente escolhido durar entre 63000km
e 70000km?
P(63000 ≥ X ≥ 70000) = P(0, 30 ≥ z ≥ 1) = 0, 3413 + 0, 1179 = 0, 2234
d) Qual a probabilidade de um pneu aleatoriamente escolhido durar exatamente
70000km?
P(X = 70000) = P(z = 0) = 0
e) O fabricante deseja fixar prazo de garantia, em quilˆ ometros, de tal modo que,
se a dura¸ c˜ ao do pneu for inferior ` a garantia, o pneu seja trocado. De quantos
quilˆ ometros deve ser este prazo, para que somente 1% dos pneus sejam trocados?
Figura 4.6:
x : P(X ≤ x) = 0, 01
z : P(Z ≤ z) = 0, 01 = −2, 33
z =
x−µ
σ
⇒ −2, 33 =
x−60000
10000
⇒ x = 36700km
93
4.4.3 Distribui¸ c˜ao Exponencial
Em um processo de Poison, com parˆ ametro λ (isto ´e, tal que o n´ umero de
sucessos em um determinado intervalo t segue uma distribui¸ c˜ ao de Poison com m´edia
µ = λt), como por exemplo contar o n´ umero de carros que passam por um determinado
ponto de uma estrada, num certo per´ıodo de tempo. A distribui¸ c˜ ao da vari´ avel T, que
representa o intervalo decorrido entre dois sucessos consecutivos, ´e conhecida como Dis-
tribui¸ c˜ ao Exponencial. Cuja fun¸ c˜ ao densidade probabilidade ´e dada por:
f(t) = λe
−λt
, t ≥ 0 (4.26)
Figura 4.7: Distribui¸ c˜ ao exponencial.
Prova:
Por defini¸ c˜ ao a vari´ avel T representa o tempo decorrido entre dois sucessos
em um processo de Poison. Ent˜ ao para que T seja maior que um t qualquer ´e preciso que
o pr´ oximo sucesso demore mais do que t para ocorrer. Assim,
P(t > t) = P(0 sucessos em t) = e
−λt
a fun¸ c˜ ao parti¸ c˜ ao no ponto t ser´ a:
94
F(t) = P(T ≤ t) = 1 −e−λt
Derivando-se a fun¸ c˜ ao parti¸ c˜ ao em rela¸ c˜ ao a t, obt´em-se a fun¸ c˜ ao densidade
probabilidade:
f(t) =
dF(t)
dt
= λe
−λt
para t ≥ 0
= 0 para t < 0
Parˆ ametros caracter´ısticos:
M´edia:
E(t) =
1
λ
(4.27)
Variˆ ancia
V (t) =
1
λ
2
(4.28)
Prova:
E(t) =


−∞
tf(t)dt =


0
tλe
−λt
dt
=
1
λ
Exemplo:
Certo tipo de fus´ıvel tem dura¸ c˜ ao de vida que segue uma distribui¸ c˜ ao expo-
nencial com vida m´edia de 100 horas. Cada fus´ıvel tem um custo de R$10,00, e se durar
menos de 200 horas, existe um custo adicional de R$8,00. a) Qual a probabilidade de um
fus´ıvel, aleatoriamente escolhido, dura mais de 150 horas?
l=? M´edia :m(t)=
b) Qual o custo esperado dos fus´ıveis custo=
P(T ¡ 200) = 1 - E(custo) = 10.0,1353 + 18.0,8647 = R$ 16,92
95
4.4.4 Distribui¸ c˜ao Qui-Quadrado
A distribui¸ c˜ ao de χ
2
(lˆe-se qui-quadrado) ´e um caso particular da distribui¸ c˜ ao
gama, sendo muito empregada em estat´ıstica n˜ ao param´etrica, uma vez que a estat´ıstica
χ
2
, utilizada para verifica¸ c˜ ao od ajuste de modelos probabil´ısticos te´ oricos a um conjunto
de dados observados segue tal distribui¸ c˜ ao.
A fun¸ c˜ ao densidade de probabilidade ´e dada por:
f(x) =
1
2
(
v
2
)
Γ(
v
2
)
x
(
v
2
−1)
e
−(
x
2
)
(4.29)
em que:
v s˜ ao os graus de liberdade;
Γ(n) ´e a fun¸ c˜ ao gama. Para n inteiro positivo, Γ(n) = (n −1)!
Figura 4.8: Distribui¸ c˜ oes Qui-Quadrado com 1, 5 e 10 graus de liberdade
Esperan¸ ca:
E(χ
v
) = v;
Variˆ ancia:
V (χ
v
) = 2v
96
4.4.5 Distribui¸ c˜ao t de Student
Viu-se que a vari´ avel z =
x−µ
σ
∼ N(0, 1). De modo semelhante, pode-se
demonstrar que:
Z =
¯ x −µ
σ

n
∼ N(0, 1) (4.30)
Suponha-se que o parˆ ametro σ em 4.30 seja substitu´ıdo por seu estimador
n˜ ao tendencioso
s
2
=
¸
(x
i
− ¯ x)
n −1
.
Assim a eq.4.30 ficar´ a:
t =
¯ x −µ
s

n
(4.31)
Pode-se demonstrar que que a vari´ avel t, 4.31 segue uma distribui¸ c˜ ao t de
student com v = n −1 graus de liberdade, cuja fun¸ c˜ ao densidade probabilidade ´e:
f(x) =
Γ

v+1
2

Γ(
v
2
)

πv

1 +
x
2
v


v+1
2
(4.32)
em que:
v s˜ ao os graus de liberdade;
Γ() ´e a fun¸ c˜ ao Gama.
Esperan¸ ca:
E(t) = 0;
Variˆ ancia:
V (t) =
v
v+2
Caracter´ısticas:
i. ´e sim´etrica em rela¸ c˜ ao ao ponto x = 0 (m´edia)
ii. se v tende para infinito, t tende para z, como pode ser observado na figura 4.9
lim
v→inf
f(t) = z
97
Figura 4.9: Distribui¸ c˜ oes t de student com 5 e 30 graus de liberdade e distribui¸ c˜ ao normal
padronizada.
4.4.6 Distribui¸ c˜ao F de Snedcor
f(x) =
Γ(
v1+2
2
)
Γ(
v1
2
)Γ(
v2
2
)

v1
v2

(
v1
2
)
x
(
v1−2
2
)

1 + (
v1
v2
)y

(
v1+v2
2
)
(4.33)
Esperan¸ ca:
E(F) =
v2
v2−2
;
Variˆ ancia:
V (F) =
2v2
2
(v1+v2−2)
v1(v2−4)(v2
2
)
4.4.7 Aproxima¸c˜ao da Distribui¸ c˜ao Binomial `a Normal
Os problemas relacionados com a distribui¸ c˜ ao Binomial s˜ ao f´ aceis de serem
resolvidos desde que o n´ umero de repeti¸ c˜ oes (n) n˜ ao seja grande, pois, quando n for grande,
tais c´ alculos tornam-se demorados e tedioso e uma boa aproxima¸ c˜ ao torna-se ´ util. Quando
se utiliza a aproxima¸ c˜ ao da distribui¸ c˜ ao Binomial ` a Normal, o erro cometido ser´ a tanto
menor quanto maior for n e mais pr´ oximo de
1
2
for p (probabilidade de sucesso). Alguns
autores afirmam que a aproxima¸ c˜ ao ´e considerada boa quando np 5. Como a Distribui¸ c˜ ao
98
Figura 4.10: Distribui¸ c˜ ao F, com 10 graus de liberdade para o numerador e 20 para o
denominador.
Binomial ´e discreta, e a Normal cont´ınua , ao realizar-se a aproxima¸ c˜ ao deve-se fazer
uma corre¸ c˜ ao, chamada corre¸ c˜ ao para descontinuidade da curva, que consiste em supor
distribu´ıda entre x
i
+ 0, 5 e x
i
−0, 5 a probabilidade concentrada em x
i
. Assim,
P(X = x
i
) pela Binomial ´e aproximada para P(x−i −0, 5 ≤ X ≤ x
i
+0, 5)
na Distribui¸ c˜ ao Normal
Exemplo.
Em um determinado processo de produ¸ c˜ ao de chips para computador, 5%
dos chips produzidos s˜ ao considerados defeituosos. Sabendo-se que a produ¸ c˜ ao di´ aria
da f´ abrica em quest˜ ao ´e de 1000 chips, qual a probabilidade de que em um dia sejam
produzidos:
a) 50 chips defeituosos?
X B(1000, 0, 05)
M´edia =E(X) = n.p = (1000)(0, 05) = 50 chips
Variˆ ancia =V (X) = npq = (1000)(0, 05)(0, 95) = 47, 5 chip
2
P(X = 50) · P(49, 5 ≤ X ≤ 50, 5) = P(−0, 07 ≤ z ≤ 0, 07) = 0, 0558
b) menos que 50 chips defeituosos
99
P(X ≤ 50) · P(X ≤ 50, 5) = P(z ≤ 0, 07) = 0, 5279
Cap´ıtulo 5
Amostragem
5.1 Introdu¸c˜ao.
5.1.1 Defini¸c˜ oes
i. Popula¸c˜ao: conjunto de indiv´ıduos com pelo menos uma caracter´ıstica observ´ avel
em comum.
ii. Amostra: por¸ c˜ ao ou fra¸ c˜ ao da popula¸ c˜ ao, retirada segundo algumas t´ecnicas es-
pec´ıficas, que matem as mesmas caracter´ısticas de interesse da popula¸ c˜ ao.
iii. Parˆametro: ´e uma medida associada ` a uma caracter´ıstica populacional Ex: M´edia
(µ), variˆ ancia (σ
2
), etc.
iv. Estat´ıstica: ´e uma medida associada ` a uma caracter´ıstica amostral. Ex: M´edia (¯ x),
variˆ ancia (s
2
).
Um dos principais problemas apresentados na estat´ıstica ´e o de se fazer
afirma¸ c˜ oes sobre os parˆ ametros populacionais (geralmente desconhecidos), como por exem-
plo saber qual o tempo necess´ ario para o organismo humano degradar certo composto
qu´ımico, qual a produ¸ c˜ ao total de gr˜ aos de um pa´ıs num determinado ano, qual a altura
m´edia da popula¸ c˜ ao brasileira, afirmar se um novo composto ´e carciniogˆenico ou n˜ ao. E
para respondermos a estas quest˜ oes, muitas das vezes, temos que lan¸ car m˜ ao do processo
100
101
de amostragem, que consiste em estudar apenas uma fra¸ c˜ ao da popula¸ c˜ ao (a amostra) e a
partir desta fazer inferˆencias sobre a popula¸ c˜ ao. Esquematicamente tem-se:
Figura 5.1: Representa¸ c˜ ao esquem´ atica do processo de amostragem e inferˆencia.
Para que o processo anteriormente descrito seja confi´ avel, ´e necess´ ario que
a amostra utilizada seja representativa da popula¸ c˜ ao, e para isso, ela deve ser retirada
segundo determinadas t´ecnicas de amostragem. De posse de uma amostra, representativa
da popula¸ c˜ ao, para fazermos a inferˆencia sobre os parˆ ametros populacionais, a partir desta
amostra, ´e necess´ ario o conhecimento das rela¸ c˜ oes existentes entre as estimativas obtidas
e os valores dos parˆ ametros populacionais, ou seja, ´e necess´ ario conhecer a distribui¸ c˜ ao
amostral do estimador utilizado, para que se possa fazer uma inferˆencia segura sobre um
parˆ ametro qualquer.
5.1.2 Importˆancia do uso de amostras.
i. Conveniente no estudo de popula¸ c˜ oes grandes.
ii. Indispens´ avel no estudo de popula¸ c˜ oes infinitas.
iii. Indispens´ avel em estudos nos quais a coleta de dados implica na destrui¸ c˜ ao do material
utilizado.
102
5.1.3 Vantagens do processo de amostragem em rela¸c˜ao ao
censo.
As principais vantagens do processo de amostragem, em rela¸ c˜ ao a observa¸ c˜ ao
de todos os indiv´ıduos da popula¸ c˜ ao (censo) s˜ ao:
i. Custo reduzido: Sendo os dados obtidos apenas de uma fra¸ c˜ ao da popula¸ c˜ ao, as
despesas s˜ ao menores do que as oriundas de um censo. Tratando-se de grandes
popula¸ c˜ oes, pode-se obter resultados suficientemente precisos, para serem ´ uteis,
de amostras que representam apenas uma pequena fra¸ c˜ ao da popula¸ c˜ ao. Se-
gundo COCHRAN (1977), nos Estados Unidos, os mais importantes levantamentos
peri´ odicos, realizados pelo governo, usavam amostras de cerca de 100.000 pessoas, ou,
aproximadamente uma pessoa em cada 1800.
ii. Maior rapidez: Os dados podem ser apurados e sintetizados mais rapidamente em
uma amostragem do que em uma contagem completa. Este ´e um fator primordial,
quando se necessita urgentemente das informa¸ c˜ oes. O objetivo de uma investiga¸ c˜ ao,
´e o de conhecer a situa¸ c˜ ao de um determinado fenˆ omeno, no momento da coleta da
informa¸ c˜ ao, para que de acordo com a informa¸ c˜ ao obtida, se possa tomar as medidas
poss´ıveis para resolver algum problema. Se o resultado dessa pesquisa for conhecida
muito tempo depois, ´e bem poss´ıvel que a situa¸ c˜ ao que se pretendia resolver, seja
nesse momento, completamente diferente da que existia no momento da coleta dos
dados.
iii. Maior amplitude e flexibilidade: Em certos tipos de investiga¸ c˜ ao, tem-se que
utilizar pessoal bem treinado e equipamento altamente especializado, cuja disponibil-
idade ´e limitada para a obten¸ c˜ ao de dados. O censo completo torna-se impratic´ avel e
resta a escolha entre obter as informa¸ c˜ oes por meio de uma amostra, ou n˜ ao consegui-
las de todo. Dessa forma, os levantamentos que se fundamentam na amostragem tem
maior amplitude e flexibilidade, relativamente as informa¸ c˜ oes que podem ser obtidas.
iv. Maior exatid˜ao: Em virtude de se poder empregar pessoal de melhor qualidade
103
e intensivamente treinado, e por se tornar exequ´ıvel a supervis˜ ao mais cuidadosa
do campo de trabalho e do processamento de dados, dada a redu¸ c˜ ao no volume de
trabalho, uma amostragem pode, na realidade, proporcionar resultados mais exato
que o censo.
5.2 T´ecnicas de amostragem.
Ao coletarmos uma amostra podemos faze-la com reposi¸ c˜ ao ou sem
reposi¸ c˜ ao, caso a amostragem seja realizada com reposi¸ c˜ ao, um mesmo indiv´ıduo tem
chance de pertencer mais de uma vez a amostra, o que n˜ ao acontece, no caso da amostragem
ser sem reposi¸ c˜ ao. Independentemente da maneira como a amostra ´e coletada (com ou
sem reposi¸ c˜ ao) o importante ´e que os indiv´ıduos que compor˜ ao a amostra dever˜ ao ser
selecionados atrav´es de um processo aleat´ orio qualquer (sorteio), pois, somente nestas
condi¸ c˜ oes, podemos aplicar os modelos probabil´ısticos da estat´ıstica a esta amostra, o que
vai garantir a validade dos testes estat´ısticos que ser˜ ao realizados com base nos resultados
destas amostras. Os principais tipos de amostragem s˜ ao:
• Probabil´ısticas ou aleat´ oria: Quando todos os indiv´ıduos da popula¸ c˜ ao tˆem proba-
bilidade conhecida e n˜ ao nula de pertencer a amostra, dentre estas se destacam:
– Amostragem simples ao acaso (ASA).
– Amostragem sistem´ atica (AS).
– Amostragem por comglomerados.
– Amostragem estratificada (AE).
• N˜ ao probabil´ıstica, n˜ ao aleat´ oria, escolha racional ou escolha justificada: Quando
alguns indiv´ıduos da popula¸ c˜ ao tˆem probabilidade desconhecida ou nula de pertencer
a amostra, as principais s˜ ao:
– Inacessibilidade a toda a popula¸ c˜ ao.
104
– Amostragem sem norma (a esmo).
– Popula¸ c˜ ao formada por material cont´ınuo.
– Intencional
5.2.1 Principais t´ecnicas de amostragem probabil´ısticas.
5.2.1.1 Amostragem Simples ao Acaso
Esta t´ecnica s´ o pode ser aplicada em popula¸ c˜ oes homogˆeneas e de tamanho
conhecido. T´ecnica: Enumera-se todos indiv´ıduos da popula¸ c˜ ao e sorteia-se (por meio de
um dispositivo aleat´ orio qualquer), os indiv´ıduos que compor˜ ao a amostra. Neste tipo de
amostragem podem ser retiradas N
n
amostras diferentes com reposi¸ c˜ ao ou C
n
N
amostras
diferentes sem reposi¸ c˜ ao.
5.2.1.2 Amostragem Sistem´atica
´
E uma simplifica¸ c˜ ao do processo anterior. Neste caso, apenas o primeiro ele-
mento da amostra ser´ a sorteado, e os demais ser˜ ao retirados em uma progress˜ ao aritm´etica,
com raz˜ ao k, em que:
k =
N
n
,
com N = tamanho da popula¸ c˜ ao e n = tamanho da amostra at´e se completar o tamanho
da amostra desejado.
5.2.1.3 Amostragem por Conglomerados
Quando uma popula¸ c˜ ao apresenta uma subdivis˜ ao natural em grupos
menores (denominados conglomerados), sorteia-se um n´ umero suficiente desses grupos
(conglomerados) e todos os elementos destes v˜ ao compor a amostra.
5.2.1.4 Amostragem Estratificada
´
E uma t´ecnica utilizada quando a popula¸ c˜ ao a ser estudada ´e heterogˆenea,
deste modo, subdivide-se a popula¸ c˜ ao em estratos (sub-popula¸ c˜ oes) que sejam homogˆeneos
105
dentro de si, e heterogˆeneos entre si, e aplica-se uma das t´ecnicas de amostragens ante-
riormente descritas, para retirar-se sub-amostras dentro de cada estrato, de modo que a
amostra final seja representativa da popula¸ c˜ ao, como um todo ( contenha indiv´ıduos de
todos os estratos). Quanto ao tamanho das sub-amostras retiradas (ni), ´e classificada em:
i. Uniforme
Quando de K estratos, retiram-se amostras de mesmo tamanho n, independentemente
do tamanho do estrato.
ii. Proporcional
Quando o tamanho da amostra retirado em cada estrato (ni) ´e proporcional ao
tamanho do estrato.
Ex. Para exemplificar os dois tipos de amostragem estratificada descritos,
consideremos um estudo realizados em propriedades rurais de um munic´ıpio, composto
por 1000 propriedades rurais, distribu´ıdas, quanto a sua ´ area, conforme a Tabela 1 e que
neste munic´ıpio sejam amostradas 50 propriedades:
Tabela 5.1: Distribui¸ c˜ ao do n´ umero de propriedades rurais de um munic´ıpio qualquer,
quanto a ´ area e n´ umero de propriedades a serem amostradas por estrato (classes)
´
Area (ha) N´ umero de Propriedades Amostra estratificada (N=50)
Uniforme Proporcional
0¬ 20 500 10 25
20¬ 50 320 10 16
50¬ 100 100 10 5
100¬200 50 10 3
200¬ 400 30 10 1
Total 1000 50 50
106
5.2.2 Principais t´ecnicas de amostragem n˜ao probabil´ısticas.
5.2.2.1 Inacessibilidade a toda popula¸c˜ao
A amostragem ´e realizada na parte da popula¸ c˜ ao que ´e acess´ıvel.
Ex. Controle de qualidade numa linha de produ¸ c˜ ao de cigarros. S´ o tem-se
acesso aos cigarros que j´ a est˜ ao prontos, embora os que ainda ser˜ ao produzidos fazem parte
da popula¸ c˜ ao de cigarros produzidos por aquela linha produ¸ c˜ ao.
5.2.2.2 Amostragem sem norma (a esmo)
N˜ ao se utiliza nenhum sorteio, para identificar a amostra, muito embora o
amostrador procure ser aleat´ orio.
Ex. Amostrar 80 frangos num galp˜ ao com 3000 frangos, amostrar peixes em
um lago, pessoas em uma pra¸ ca, etc.
5.2.2.3 Popula¸c˜ao formada por material cont´ınuo.
Processo utilizado para se amostrar l´ıquidos, gases ou s´ olidos. Homogeniza-
se o material a ser amostrado e em seguida colhe-se a amostra.
5.2.2.4 Intencional
O pesquisador escolhe deliberadamente certos elementos da popula¸ c˜ ao para
formar a amostra, baseado num pr´e-julgamento.
Ex. Pesquisa de mercado para lan¸ car uma nova marca de leite longa vida
tipo A . O pesquisador selecionar´ a indiv´ıduos com poder aquisitivo m´edio/alto, que s˜ ao
os principais consumidores deste produto (publico alvo), embora toda a popula¸ c˜ ao inde-
pendentemente do poder aquisitivo possa ser consumidora deste produto.
5.3 Distribui¸c˜ oes Amostrais
107
Figura 5.2: Representa¸ c˜ ao esquem´ atica da distribui¸ c˜ ao amostral de um estimador.
5.3.1 Distribui¸ c˜ao amostral da m´edia
Considere-se, a t´ıtulo de exemplo, uma popula¸ c˜ ao hipot´etica, formada por
trˆes indiv´ıduos, para os quais a vari´ avel de interesse (X), seja a nota final destes indiv´ıduos
na disciplina estat´ıstica, a qual segue uma distribui¸ c˜ ao uniforme discreta como apresentado
a seguir:
X 8 9 10
P(X = x)
1
3
1
3
1
3
¸
= 1
Neste caso tem-se:
N = 3;
E(X) = µ = 9;
V (X) = σ
2
=
2
3
.
5.3.1.1 Amostragem com reposi¸c˜ao
Retirando-se todas as poss´ıveis amostras com reposi¸ c˜ ao, de tamanho n = 2,
tem-se um total de 3
2
= 9 poss´ıveis amostras, as quais est˜ ao apresentadas a seguir:
108
Figura 5.3: Distribui¸ c˜ ao das notas de trˆes alunos.
Amostra Indiv´ıduos Notas ¯ x
1 1;1 8 e 8 8
2 1;2 8 e 9 8,5
3 1;3 8 e 10 9
4 2;1 9 e 8 8,5
5 2;2 9 e 9 9
6 2;3 9 e 10 9,5
7 3;1 10 e 8 9
8 3;2 10 e 9 9,5
9 3;3 10 e 10 10
A distribui¸ c˜ ao amostral de ¯ x ser´ a:
¯ x 8 8,5 9 9,5 10
P(¯ x = ¯ x
i
)
1
9
2
9
3
9
2
9
1
9
Em que:
E(¯ x) = µ
¯ x
=
¸
n
i=1
¯ x
i
P(¯ x = ¯ x
i
) = 9, 0
V (¯ x) = σ
2
¯ x
=
¸
n
i=1
[¯ x
i
−E(¯ x)]
2
P(¯ x = ¯ x
i
) =
1
3
Assim, verifica-se que:
E(¯ x) = 9, 0 = µ e V (¯ x) =
1
3
=
σ
2
n
109
Figura 5.4: Distribui¸ c˜ ao amostral de ¯ x.
Prova:
¯ x =
1
n
¸
n
i=1
x
i
E(¯ x) = E
¸
1
n
n
¸
i=1
x
i
¸
=
1
n
E [x
1
+x
2
+ +x
n
]
=
1
n
[E(x
1
) +E(x
2
) + +E(x
n
)]
=
1
n
[µ +µ + +µ]
=
1
n

= µ
110
V (¯ x) = V
¸
1
n
n
¸
i=1
x
i
¸
=
1
n
2
V [x
1
+x
2
+ +x
n
]
=
1
n
2
[V (x
1
) +V (x
2
) + +V (x
n
)]
=
1
n
2

σ
2

2
+ +µ

=
1
n
2

2
= σ
2
Ent˜ ao tem-se que: ¯ x ∼ N

µ,
σ
2
n

5.3.1.2 Amostragem sem reposi¸c˜ao
Retirando-se todas as poss´ıveis amostras sem reposi¸ c˜ ao, de tamanho n = 2,
tem-se um total de 6 poss´ıveis amostras, as quais est˜ ao apresentadas a seguir:
Amostra Indiv´ıduos Notas ¯ x
1 1;2 8 e 9 8,5
2 1;3 8 e 10 9
3 2;1 9 e 8 8,5
4 2;3 9 e 10 9,5
5 3;1 10 e 8 9
6 3;2 10 e 9 9,5
A distribui¸ c˜ ao amostral de ¯ x ser´ a:
¯ x 8,5 9 9,5
P(¯ x = ¯ x
i
)
1
3
1
3
1
3
Em que:
E(¯ x) = µ
¯ x
=
¸
n
i=1
¯ x
i
P(¯ x = ¯ x
i
) = 9, 0
V (¯ x) = σ
2
¯ x
=
¸
n
i=1
[¯ x
i
−E(¯ x)]
2
P(¯ x = ¯ x
i
) =
1
6
Assim, verifica-se que:
E(¯ x) = 9, 0 = µ e V (¯ x) =
1
6
=
σ
2
n
N−n
N−1
Deste modo, se amostragem for sem reposi¸ c˜ ao, ¯ x ∼ N

µ,
σ
2
n
N−n
N−1

.
111
O termo
N−n
N−1
´e conhecido como fator de corre¸ c˜ ao para amostragem sem
reposi¸ c˜ ao em popula¸ c˜ oes finitas (ASRPF). Uma popula¸ c˜ ao ´e considerada finita quando
n
N
> 0, 05 ou seja a amostra representar mais de 5% do tamanho da popula¸ c˜ ao. Quando
tal crit´erio n˜ ao for satisfeito, o fator de corre¸ c˜ ao torna-se desprez´ıvel, podendo, portanto
ser eliminado.
Cap´ıtulo 6
Inferˆencia
6.1 Teoria da estima¸c˜ao
6.1.1 Defini¸c˜ oes
Estimador
Consideremos uma amostra (x
1
, x
2
, x
3
, . . . , x
n
) de uma vari´ avel aleat´ oria que
deve descrever uma caracter´ıstica de interesse da popula¸ c˜ ao. Seja θ um parˆ ametro que
desejamos estimar, como por exemplo a m´ediaµ = E(x) ou a variˆ ancia σ
2
= V (x). Um
estimador,
ˆ
θ, do parˆ ametro θ ´e uma vari´ avel aleat´ oria, que ´e fun¸ c˜ ao das observa¸ c˜ oes
x
1
, x
2
, x
3
, . . . , x
n
.
Assim,
¯ x =

n
i=1
x
i
n
´e um estimador da m´edia poupulacional µ,
s
2
=

n
i=1
(x
i
−¯ x)
2
n−1
´e um estimador da variˆ ancia populacional σ
2
Estimativa
Estimativa ´e o valor num´erico assumido pelo estimador quando os valores
observados x
1
, x
2
, x
3
, . . . , x
n
s˜ ao considerados.
Assim,
¯ x = 70kg ´e uma estimativa da m´edia poupulacional µ,
s
2
= 9kg
2
´e uma estimativa da variˆ ancia populacional σ
2
Estima¸c˜ao por ponto e por intervalo.
112
113
Quando a estimativa de um parˆ ametro populacional ´e dada por um ´ unico
valor, tem-se uma estimativa pontual do parˆ ametro populacional, desconhecido, como por
exemplo ao a altura m´edia de uma amostra de 500 universit´ arios ´e ¯ x = 1, 68m, ´e uma
estimativa pontual da verdadeira altura m´edia da popula¸ c˜ ao de universit´ arios. Por´em
sabe-se que ¯ x ∼ N(µ;
σ
2
n
), assim sendo, para cada amostra retirada da popula¸ c˜ ao, poder´ a
se obter uma diferente estimativa para µ. Deste modo, torna-se mais interessante obter-
se, a partir, de uma determinada amostra, um intervalo que apresente uma probabilidade
conhecida de conter o verdadeiro parˆ ametro populacional, ou seja obter uma estimativa por
intervalo para o parˆ ametro em quest˜ ao, como por exemplo P(1, 60 ≤ µ ≤ 1, 76) = 0, 95,
ou seja existe 0,95 de probabilidade de que a verdadeira m´edia populacional esteja entre
1,60 e 1,76 metros, ou ainda existe 95% de confian¸ ca em se afirmar que a verdadeira
m´edia populacional esteja entre 1,60 e 1,76 metros. Apesar disto, o uso de estimativas
pontuais ´e imprescind´ıvel, haja vistas, serem necess´ arias para a obten¸ c˜ ao das estimativas
por intervalo. Deste modo desej´ avel que estas estimativas sejam bastantes confi´ aveis, e
para isso ´e necess´ ario que os estimadores que as fornecer˜ ao apresentem boas propriedades,
aliado ao fato de serem obtidas a partir de amostras representativas.
6.1.2 Propriedades dos Estimadores
6.1.2.1 N˜ao tendenciosidade
Um estimador
ˆ
θ ´e dito um estimador n˜ ao tendencioso do parˆ ametro θ se
E(
ˆ
θ) = θ
obs. Os termos n˜ ao tendencioso, n˜ ao viciado, n˜ ao viesado e imparcial s˜ ao
sinˆ onimos.
Ex1.:¯ x =

n
i=1
x
i
n
´e um estimador n˜ ao tendencioso da m´edia populacional µ
114
prova:
E(¯ x) = E
¸¸
n
i=1
x
i
n

=
1
n
E
¸
n
¸
i=1
x
i
¸
=
1
n
E [x
1
+x
2
+ +x
n
]
=
1
n
[E(x
1
) +E(x
2
) + +E(x
n
)]
=
1
n
[µ +µ + +µ]
=
1
n

= µ
Ex2.:s
2∗
=

n
i=1
(x
i
−¯ x)
2
n
´e um estimador tendencioso da variˆ ancia populacional
σ
2
.
prova:
n
¸
i=1
(x
i
− ¯ x)
2
=
n
¸
i=1
(x
i
−µ +µ − ¯ x)
2
=
n
¸
i=1
[(x
i
−µ) −(¯ x −µ)]
2
=
n
¸
i=1
(x
i
−µ)
2
−2
n
¸
i=1
(x
i
−µ)(¯ x −µ) +
n
¸
i=1
(¯ x −µ)
2
= como (¯ x −µ) ´e uma constante e
n
¸
i=1
(x
i
−µ) = n(¯ x −µ), tem-se:
n
¸
i=1
(x
i
− ¯ x)
2
=
n
¸
i=1
(x
i
−µ)
2
−n(¯ x −µ)
2
115
Portanto,
E

s
2∗

= E
¸¸
n
i=1
(x
i
−µ)
2
−n(¯ x −µ)
2
n

=
1
n

n
¸
i=1
E

(x
i
−µ)
2

−nE

(¯ x −µ)
2

¸
=
1
n
¦nV (X) −nV (¯ x)¦
=
1
n


2
−n
σ
2
n

=
n −1
n
σ
2
Deste modo, verifica-se que s
2∗
´e um estimador tendencioso de σ
2
. UM
estimador n˜ ao tendencioso ´e facilmente obtido por:
s
2
=
n
n −1
s
2∗
=
¸
n
i=1
(x
1
− ¯ x)
2
n −1
(6.1)
6.1.2.2 Consistˆencia.
Um estimador
ˆ
θ ´e um estimador consistente do parˆ ametro θ se:
i. lim
n→∞
E[
ˆ
θ] = θ;
ii. lim
n→∞
V (
ˆ
θ) = 0.
¯ x =

n
i=1
x
i
n
´e um estimador consistente da m´edia populacional µ, pois
i. E(¯ x) = µ
ii. lim
n→∞
V (
ˆ
¯ x) = lim
n→∞
σ
2
n
= 0.
6.1.2.3 Eficiˆencia
Se θ
1
e θ
2
s˜ ao dois estimadores n˜ ao tendenciosos de θ, ent˜ ao, θ
1
´e mais
eficiente que θ
2
se:
116
V (θ
1
) < V (θ
2
)
Eficiˆencia relativa
A eficiˆencia relativa do estimador θ
1
, em rela¸ c˜ ao ao estimador θ
2
´e dada por:
Ef
θ
1

2
=
V (θ
2
)
V (θ
1
)
(6.2)
6.1.3 Intervalos de confian¸ ca
Conhecendo-se a distribui¸ c˜ ao amostral do estimador, de um parˆ ametro θ,
pode-se facilmente determinar um intervalo que apresente uma confian¸ ca 1 − α para θ,
como ser´ a visto a seguir.
6.1.3.1 Intervalo de confian¸ca para a m´edia µ
6.1.3.1.1 Variˆancia conhecida Sabe-se que ¯ x ∼ N(µ;
σ
2
n
), assim a vari´ avel z =
¯ x−µ
σ

n
ter´ a distribui¸ c˜ ao N(0; 1). Fixando-se um n´ıvel de confian¸ ca (1 −α) vir´ a:
P(−z
α
2
≤ z ≤ z
α
2
) = 1 −α
P(−z
α
2

¯ x−µ
σ

n
≤ z
α
2
) = 1 −α
P(−z
α
2
σ

n
≤ ¯ x −µ ≤ z
α
2
σ

n
) = 1 −α
P(−¯ x −z
α
2
σ

n
≤ −µ ≤ −¯ x +z
α
2
σ

n
) = 1 −α
P(¯ x +z
α
2
σ

n
≥ µ ≥ ¯ x −z
α
2
σ

n
) = 1 −α reorganizando vem
P(¯ x −z
α
2
σ

n
≤ µ ≤ ¯ x +z
α
2
σ

n
) = 1 −α
E o intervalo de confian¸ ca para µ, com uma confian¸ ca 1 −α pode ser ent˜ ao
escrito como:
IC(µ)
1−α
= ¯ x ±z
α
2
σ

n
(6.3)
em que
n ´e o tamanho da amostra.
117
Obs. Se ocorrer amostragem sem reposi¸ c˜ ao em popula¸ c˜ ao finita (ASRPF) o
intervalo de confian¸ ca para a m´edia ser´ a:
IC(µ)
1−α
= ¯ x ±z
α
2
σ

n

N −n
N −1
(6.4)
onde:
N ´e o tamanho da popula¸ c˜ ao;
n ´e o tamanho da amostra.
Ex.: Uma m´ aquina produz rolamentos que apresentam desvio padr˜ ao de
0, 042 polegadas em seu diˆ ametro. Desejando-se conhecer o diˆ ametro m´edio dos rolamentos
produzidos por esta m´ aquina, extraiu-se uma amostra de 100 rolamentos, observando-se
uma m´edia igual a 0, 824 polegadas. Obter o intervalo com 0, 90 de confian¸ ca para o
verdadeiro diˆ ametro m´edio dos rolamentos.
Solu¸ c˜ ao:
Tem-se ¯ x = 0, 824 σ = 0, 042 n = 100 1−α = 0, 90 substituindo esses valores
em 6.3 vem:
IC(µ)
0,90
= 0, 824 ±z
0,05
0, 042

100
= 0, 824 ±1, 65
0, 042

100
= 0, 824 ±0, 007
Interpreta¸ c˜ ao: Como µ ´e um parˆ ametro e n˜ ao uma vari´ avel aleat´ oria, a
interpreta¸ c˜ ao correta do intervalo de confian¸ ca ´e: Constru´ıdos todos os intervalos do tipo
¯ x ± 1, 65
σ

n
, 90% deles conter˜ ao o parˆ ametro µ. Na pr´ atica, apenas um ´ unico intervalo
´e constru´ıdo, no presente exemplo tal intervalo foi [0, 817; 0, 831]. Esse intervalo ´e ent˜ ao
comumente chamado intervalo de confian¸ ca de 90% para µ. Isto ´e tem-se 90% de confian¸ ca
de que esse intervalo contenha o valor µ, no sentido de que 90% dos intervalos assim
constru´ıdos conteriam µ.
´
E obviamente incorreto, do ponto de vista da estat´ıstica cl´ assica ou
freq¨ uˆentista, dizer que a probabilidade do intervalo [0, 817; 0, 831] conter o valor µ ´e 0,90.
118
Pois essa probabilidade ´e 0 ou 1, dependendo de µ pertencer ou n˜ ao ao intervalo ao inter-
valo fixo.
6.1.3.1.2 Variˆancia desconhecida Quando n˜ ao se conhece σ
2
e conseq¨ uentemente
σ, mas sim sua estimativa s, o intervalo de confian¸ ca para a m´edia ser´ a dado por:
Amostras Pequenas (n ≤ 30)
IC(µ)
1−α
= ¯ x ±t
α
2
s

n
, (6.5)
t
α
2
com n −1 graus de liberdade,
em que:
n ´e o tamanho da amostra.
Obs. Se ocorrer amostragem sem reposi¸ c˜ ao em popula¸ c˜ ao finita (ASRPF) o
intervalo de confian¸ ca para a m´edia ser´ a:
IC(µ)
1−α
= ¯ x ±t
α
2
s

n

N −n
N −1
, (6.6)
t
α
2
com n −1 graus de liberdade,
onde:
N ´e o tamanho da popula¸ c˜ ao;
n ´e o tamanho da amostra.
Amostras Grandes (n > 30)
Foi visto que ` a medida que aumenta-se o tamanho da amostra, a distribui¸ c˜ ao
t se Student se aproxima da distribui¸ c˜ ao normal, deste modo, quando se estiver trabal-
hando com amostras grandes (n > 30) pode-se utilizar a distribui¸ c˜ ao normal padronizada,
z, em lugar da t na obten¸ c˜ ao dos intervalos de confian¸ ca, mesmo que σ
2
seja desconhecida.
Ex.: Um Cia adquiriu 500 cabos. Uma amostra de 30 deles selecionados ao
acaso apresentou tens˜ ao de ruptura media igual a 2400 kg com desvio padr˜ ao de 150 kg.
Obter o intervalo com 95% de confian¸ ca para a verdadeira tens˜ ao media de ruptura destes
cabos.
solu¸ c˜ ao:
119
Tem-se:N = 500 n = 30 ¯ x = 2400 s = 150 1 −α = 0, 95
n
N
=
30
500
= 0, 06 > 0, 05 → ocorreu ASRPF.
IC(µ)
0,95
= 2400 ±t
0,025
150

30

500 −30
500 −1
= 2400 ±(2, 045)(27, 38)(0, 97)
= 2400 ±54, 31
Interpreta¸ cao: Existe 95% de confian¸ ca em se dizer que a verdadeira tens˜ ao
media de ruptura dos cabos est´ a entre 2345,69 e 2454,31kg.
6.1.3.2 Diferen¸ca entre duas m´edia (µ
a
−µ
b
)
.
6.1.3.2.1 Variancias Conhecidas:
IC(µ
a
−µ
b
)
1−α
= ¯ x
a
− ¯ x
b
±z
α
2

σ
2
a
n
a
+
σ
2
b
n
b
(6.7)
em que:
¯ x
a
e ¯ x
b
s˜ ao as estimativas pontuais das m´edias das popula¸ c˜ oes a e b, respec-
tivamente;
σ
2
a
e σ
2
b
as variˆ ancias das popula¸ c˜ oes a e b, respectivamente e
n
a
e n
b
os tamanhos das amostras das popula¸ c˜ oes a e b, respectivamente.
Obs: Se ocorrer ASRPF deve-se multiplicar a variˆ ancia da popula¸ c˜ ao na
qual ocorreu ASRPF pelo fator de corre¸ c˜ ao
N−n
N−1
.
Ex.: As empresas A e B produzem tubos para esgoto com a variˆ ancias em
seus diˆ ametros iguais a 8mm
2
e 10mm
2
, respectivamente. Uma amostra de 48 tubos da
empresa A apresentou diˆ ametro m´edio igual a 40mm, e uma amostra de 36 tubos da
empresa B apresentou diˆ ametro m´edio de 42mm. Verifique, por meio de um intervalo de
120
confian¸ ca com 0, 95 de probabilidade, se existe diferen¸ ca entre os diˆ ametros m´edios dos
tubos das marcas A e B.
Solu¸ c˜ ao:
Pop. A Pop. B
σ
2
A
= 8 σ
2
B
= 10
¯ x
A
= 40 ¯ x
B
= 42
n
A
= 48 n
B
= 36
IC(µ
a
−µ
b
)
0,95
= ¯ x
a
− ¯ x
b
±z
0,025

σ
2
a
n
a
+
σ
2
b
n
b
= 40 −42 ±1, 96

8
40
+
10
42
= −2 ±1, 2973
Conclus˜ ao: Pode-se afirmar com 95% de confian¸ ca que a verdadeira diferen¸ ca
entre os diˆ ametros m´edios dos tubos produzidos pelas empresas A e B est´ a entre −2 ±
1, 2973mm, isto ´e entre -3,2973 e -0,7027 mm. Como esse intervalo n˜ ao compreende o
valor 0 (zero) Tem-se 95% de confian¸ ca em afirmar que os diˆ ametros m´edios dos tubos
produzidos por estas empresas n˜ ao s˜ ao iguais.
6.1.3.2.2 Variancias Desconhecidas: Quando desconhece-se as variˆ ancias popula-
cionais (σ
2
a
e σ
2
b
) torna-se necess´ ario a substitui¸ c˜ ao de seus valores param´etricos por suas
estimativas amostrais (s
2
a
e s
2
b
). Neste caso, deve-se utilizar a distribui¸ c˜ ao t de Student, em
lugar da normal. Al´em desta altera¸ c˜ ao deve-se considerar ainda se as duas popula¸ c˜ oes s˜ ao
homoced´ asticas ou heteroced´ asticas, isto ´e, se as variˆ ancias populacionais (desconhecidas)
s˜ ao iguais ou diferentes, o que pode ser aferido por meio de um teste de hip´ otese para
homogeneidade das variˆ ancias (Cap 7).
Popula¸c˜ oes homoced´asticas
Sendo as popula¸ c˜ oes homoced´ asticas (σ
2
a
= σ
2
b
= σ
2
), assim, s
2
a
e s
2
b
s˜ ao duas
estimativas para um mesmo parˆ ametro (σ
2
) ent˜ ao o intervalo de confian¸ ca para a diferen¸ ca
entre duas m´edias ´e dado por:
121
IC(µ
a
−µ
b
)
1−α
= ¯ x
a
− ¯ x
b
±t
α
2
s
p

1
n
a
+
1
n
b
, (6.8)
t
α
2
com n
a
+n
b
−2 graus de liberdade.
em que:
s
p
=

(n
a
−1)s
2
a
+ (n
b
−1)s
2
b
n
a
+n
b
−2
Popula¸c˜ oes heteroced´asticas
Sendo as popula¸ c˜ oes heteroced´ asticas (σ
2
a
= σ
2
b
), assim, s
2
a
e s
2
b
s˜ ao estima-
tivas de diferentes parˆ ametros, n˜ ao podendo, pois serem combinadas em um ´ unico valor.
Ent˜ ao o intervalo de confian¸ ca para a diferen¸ ca entre duas m´edias ´e dado por:
IC(µ
a
−µ
b
)
1−α
= ¯ x
a
− ¯ x
b
±t
α
2

s
2
a
n
a
+
s
2
b
n
b
(6.9)
t
α
2
com v graus de liberdade.
em que:
v =

s
2
a
n
a
+
s
2
b
n
b

2

s
2
a
n
a

2
n
a
−1
+

s
2
b
n
b

2
n
n
−1
6.1.3.3 Intervalo de confian¸ca para propor¸c˜ao
6.1.3.3.1 Amostras grandes (n > 30) O intervalo de confian¸ ca para a propor¸ c˜ ao ´e
dado por:
IC(P)
1−α
= ˆ p ±z
α
2

ˆ pˆ q
n
(6.10)
em que:
ˆ p ´e a propor¸ c˜ ao estimada na amostra;
ˆ q = 1 − ˆ p e;
n ´e o tamanho da amostra.
122
Obs: Se ocorrer ASRPF, o intervalo de confian¸ ca para propor¸ c˜ ao ´e dado
por:
IC(P)
1−α
= ˆ p ±z
α
2

ˆ pˆ q
n

N −n
N −1
(6.11)
6.1.3.3.2 Amostras pequenas (n ≤ 30) Quando a amostra for pequena deve-se
utilizar a distribui¸ c˜ ao t de Student, em lugar da normal e o intervalo de confian¸ ca para a
propor¸ c˜ ao ser´ a dado ent˜ ao por:
IC(P)
1−α
= ˆ p ±t
α
2

ˆ pˆ q
n
, (6.12)
t
α
2
com n −1 graus de liberdade
Obs: Se ocorrer ASRPF, o intervalo de confian¸ ca para propor¸ c˜ ao ´e dado
por:
IC(P)
1−α
= ˆ p ±t
α
2

ˆ pˆ q
n

N −n
N −1
(6.13)
t
α
2
com n −1 graus de liberdade
6.1.3.4 Intervalo de confian¸ca para a diferen¸ca entre propor¸c˜ oes
Dadas duas amostras independentes, de popula¸ c˜ oes diferentes, o intervalo
de confian¸ ca para a diferen¸ ca entre as propor¸ c˜ oes nestas popula¸ c˜ oes ´e dado por:
6.1.3.4.1 Amostras grandes (n > 30)
IC(P
a
−P
b
)
1−α
= ( ˆ p
a
− ˆ p
b
) ±z
α
2

ˆ p
a
ˆ q
a
n
a
+
ˆ p
a
ˆ q
b
n
b
(6.14)
em que:
ˆ p
a
´e a propor¸ c˜ ao estimada na amostra;
ˆ q
a
= 1 − ˆ p
a
;
ˆ q
a
= 1 − ˆ p
a
;
n
a
e n
b
s˜ ao os tamanhos das amostras a e b, respectivamente
Obs: Se ocorrer ASRPF, deve-se multiplicar o componente da variˆ ancia,
referente ` a popula¸ c˜ ao na qual ocorreu ASRPF pelo fator de corre¸ c˜ ao
N−n
N−1
.
123
6.1.3.4.2 Amostras pequenas (n ≤ 30)
IC(P
a
−P
b
)
1−α
= ( ˆ p
a
− ˆ p
b
) ±t
α
2

ˆ p
a
ˆ q
a
n
a
+
ˆ p
a
ˆ q
b
n
b
(6.15)
t
α
2
com n
a
+n
b
−2 graus de liberdade
Obs: Se ocorrer ASRPF, deve-se multiplicar o componente da variˆ ancia,
referente ` a popula¸ c˜ ao na qual ocorreu ASRPF pelo fator de corre¸ c˜ ao
N−n
N−1
.
6.1.3.5 Intervalo de confian¸ca para a variˆancia (σ
2
)
O intervalo de confian¸ ca para a variˆ ancia populacional ´e dado por:
Sabe-se que
(n −1)s
2
σ
2
sin χ
2
n−1
Ent˜ ao,
P
¸
(n −1)s
2
χ
2
1−
α
2
≤ σ
2

(n −1)s
2
χ
2
α
2
¸
= 1 −α
E o intervalo de confian¸ ca para a variˆ ancia ser´ a:
IC(σ
2
)
1−α
=
¸
(n −1)s
2
χ
2
1−
α
2
;
(n −1)s
2
χ
2
α
2
¸
(6.16)
6.2 Teoria da decis˜ao (Testes de Hip´ oteses)
Uma hip´ otese cient´ıfica ´e qualquer afirma¸ c˜ ao que possa ser refutada, caso
contr´ ario pertencer´ a a outro ramo do conhecimento humano, como por exemplo a religi˜ ao.
Assim sendo, a hip´ otese: “Os motores da marca x s˜ ao mais econˆ omicos que os da marca
y” ´e uma hip´ otese cient´ıfica, pois qualquer pessoa que duvide, ou queira comprova-la,
pode montar um experimento e averiguar sua veracidade. Por outro lado, a hip´ otese:
“Deus existe”, n˜ ao pode ser avaliada, n˜ ao sendo, portanto, cient´ıfica. Uma determinada
hip´ otese ´e tida como verdadeira, se em sua avalia¸ c˜ ao n˜ ao forem encontrados ind´ıcios que
a desaprovem, permanecendo assim at´e que se prove o contr´ ario. Para que uma hip´ otese
cient´ıfica seja testada, ela deve ser convertida em uma hip´ otese estat´ıstica, que ´e uma
124
afirma¸ c˜ ao sobre um parˆ ametro populacional. Um teste de hip´ otese, fundamenta-se em
um conjunto de regras, que permitem, a partir dos resultados experimentais (amostrais)
rejeitar ou n˜ ao tal hip´ otese, associando a esta decis˜ ao uma determinada confian¸ ca.
6.2.1 Metodologia de um teste de hip´ otese
Para a realiza¸ c˜ ao de um teste de hip´ oteses, deve-se formular duas hip´ oteses
estat´ısticas, a saber:
• Hip´ otese de nulidade (H
0
) ´e a hip´ otese que ser´ a testada, sendo geralmente formulada
com o intuito de ser rejeitada.
• Hip´ otese alternativa (H
a
) ´e qualquer hip´ otese que contrarie H
0
.
Suponha que esteja-se interessado em verificar se a verdadeira performance
(km/litro de combust´ıvel) dos ve´ıculos, de determinada marca, equipados com motores 1.6
c.c. seja de 14km/l, como afirma o fabricante, ou se este ´e inferior a 14km/l. Ent˜ ao
deve-se formular as seguintes hip´ otese estat´ısticas:

H
0
: µ = 14km/l
H
a
: µ < 14km/l
Para verificar a veracidade da hip´ otese H
0
, deve-se conduzir um experimento
(coletar uma amostra), no qual ser´ a medida a performance de v´ arios carros, que fornecer˜ ao
uma estimativa da performance m´edia, e sua variˆ ancia, a partir das quais, verifica-se a
veracidade da hip´ otese H
0
. Suponha que no experimento acima tenham sido avaliados 9
carros, e que estes tenham apresentado uma performance m´edia de 13 km/l, com variˆ ancia
4(Km/l)
2
. Pelo simples fato desta amostra de 9 carros ter apresentado uma performance
m´edia inferior a informada pelo fabricante (14 km/l), n˜ ao se pode concluir que esta afir-
mativa seja falsa, pois como j´ a ´e sabido, esta estimativa est´ a sujeita uma distribui¸ c˜ ao
amostral. Deste modo, para verifica a veracidade de H
0
, assume-se que esta hip´ otese
seja verdadeira, isto ´e µ = 14 km/l. e calcula-se a probabilidade de uma amostra, com
tamanho n = 9, retirada desta popula¸ c˜ ao, fornecer uma estimativa inferior a estimativa
125
obtida (13 km/l). Caso esta probabilidade seja alta, n˜ ao haver´ a nenhuma raz˜ ao para re-
jeitar a hip´ otese H
0
(isto ´e duvidar de sua veracidade), sendo esta tida como verdadeira.
Nesta situa¸ c˜ ao disse que a diferen¸ ca observada entre a m´edia amostral (13 km/l) e a pop-
ulacional (14 km/l) n˜ ao ´e significativa, da´ı a terminologia usual de que “o teste foi n˜ ao
significativo”, usada para dizer que a hip´ otese H
0
n˜ ao foi rejeitada. Por outro lado, se a
probabilidade de se obter esta estimativa for pequena (p < 0, 05) h´ a raz˜ oes para acreditar
que a verdadeira m´edia populacional seja menor do que se imaginva, ou seja a verdadeira
performance deve ser menor que 14 km/l. Nesta situa¸ c˜ ao, diz-se que a diferen¸ ca foi sig-
nificativa, portanto a hip´ otese H
0
deve ser rejeitada (o teste foi significativo). Obs: N˜ ao
existe nenhum argumento cient´ıfico para se fixar o n´ıvel de probabilidade limite de um
teste em 0, 05. Este ´e apenas um valor usual, devido a facilidade de sua obten¸ c˜ ao em
tabelas. No nosso exemplos temos:

H
0
: µ = 14km/l
H
a
: µ < 14km/l
na amostra de n = 9 carros obteve-se ¯ x = 13 km/l e s
2
= 4 (km/l)
2
;
sabendo-se que ¯ x sin N

µ,
σ
2
n

, assumido µ = 14 km/l, e como n˜ ao se conhece σ
2
, mas
sim s
2
, tem-se:
¯ x sin t
(8)

14,
4
9

gr´ afico
t
c
=
¯ x −µ
σ

n
=
13 −14
2

9
= −1, 5
Ent˜ ao,
P[
H
0
(¯ x ≤ 13) = P(t ≤ −1, 5) = 0, 1720
como esta probabilidade ´e alta, n˜ ao h´ a raz˜ oes para acreditar que a verdadeira
performance m´edia seja inferior a 14 km/l
126
6.2.2 Tipos de erros
Ao realizar-se um teste de hip´ otese, pode-se incorrer em dois tipos de er-
ros, que ser˜ ao discutidos a seguir. Suponha que a hip´ otese H
0
formulada, no exemplo
anterior seja verdadeira, isto ´e a performance m´edia dos carros realmente ´e de 14 km/l,
isto ´e (µ = 14 km/l), e por efeito de acaso obtenha-se, na amostra, uma estimativa
de performance, cuja probabilidade de ocorrˆencia seja muito baixa, o que levaria a re-
jei¸ c˜ ao da hip´ otese H
0
: µ = 14 km/l, que ´e verdadeira. Ent˜ ao ter-se-a cometido um erro
denominado erro Tipo I (rejeitar uma hip´ otese H
0
) verdadeira. A probabilidade de se
cometer este erro ´e denominada n´ıvel de significˆ ancia (α) sendo esta, determinada (fixada)
pelo pesquisador. Por outro lado, a hip´ otese formulada pode ser falsa, isto ´e na verdade
µ = 14 km/l, e por efeito de acaso obter uma estimativa, que nos leve a n˜ ao rejei¸ c˜ ao da
hip´ otese H
0
: µ = 14 km/l. Nesta situa¸ c˜ ao ter-se-a cometido o erro Tipo II (aceitar H
0
falsa). A probabilidade de cometer este erro ´e (β), sendo esta uma fun¸ c˜ ao de α, H
0
e do
tamanho amostral. As probabilidades de se cometer os erros Tipo I e Tipo II, (α e β) s˜ ao
inversamente proporcionais, como pode ser observado na fig?, sendo que, a ´ unica maneira
de se diminuir simultaneamente α e β ´e aumentando o tamanho amostral (n).
Figura 6.1: Erros Tipo I e Tipo II.
Figura tipos de erros
127
Os tipos de erros que podem ser cometidos em um teste de hip´ oteses, bem
como suas probabilidades est˜ ao resumidos na tabela 6.1
Tabela 6.1: Tipos de erros pass´ıveis de serem cometidos ao se testar uma hip´ otese
Decis˜ ao
Realidade Rejeita H
0
N˜ ao Rejeita H
0
H
0
verdadeira α 1 −α
(erro Tipo I) Decis˜ ao correta
H
0
falsa 1 −β β
Decis˜ ao correta (erro Tipo II)
6.2.3 Tipos de testes
De acordo com o tipo de hip´ otese formulada pode-se ter os seguintes tipos
de testes de hip´ oteses:
i. Teste Bilateral: Apresenta duas regi˜ oes de rejei¸ c˜ ao de da hip´ otese H
0
, situadas nos
extremos da distribui¸ c˜ ao amostral, ´e utilizado para testar as hip´ oteses do tipo:

H
0
: µ = θ
H
a
: µ = θ
ii. Teste Unilateral a Direita: Apresenta uma ´ unica regi˜ ao de rejei¸ c˜ ao da hip´ otese H
0
,
situada no extremo superior da distribui¸ c˜ ao amostral, ´e utilizado para testar as
hip´ oteses do tipo:

H
0
: µ = θ
H
a
: µ > θ
128
iii. Teste Unilateral a Esquerda Apresenta: uma regi˜ ao de rejei¸ c˜ ao da hip´ otese H
0
, situada
no extremo inferior da distribui¸ c˜ ao amostral, ´e utilizado para testar as hip´ oteses do
tipo:

H
0
: µ = θ
H
a
: µ < θ
6.2.4 Algoritmo para realiza¸c˜ao de um teste de hip´ otese
i. Formular as hip´ otese H
0
e H
a
;
ii. Fixar o valor de α;
iii. Construir a regra de decis˜ ao (regi˜ oes de rejei¸ c˜ ao e n˜ ao rejei¸ c˜ ao de H
0
);
iv. Calcular a estat´ıstica adequada para o teste;
v. Tomar a decis˜ ao;
vi. Conclus˜ ao.
Exemplo. Aplicando-se este algoritmo ao exemplo da performance m´edia
dos carros tem-se:
i.

H
0
: µ = 14km/l
H
a
: µ < 14km/l
ii. α = 0, 05
iii. t
0,05
(8) = 1, 860 Regra: rejeitar H
0
se t
calc
≤ −1, 860
iv.
t
calc
=
¯ x −µ
0
s

n
=
13 −14
2

9
= −1, 5
v. Como t
calc
= −1, 5 > t
tab
= −1, 860, n˜ ao rejeita-se a hip´ otese H
0
, pois o valor da
estat´ıstica teste (t
calc
) encontra-se na regi˜ ao de n˜ ao rejei¸ c˜ ao de H
0
.
129
vi. Conclui-se pelo teste t de Student, ao n´ıvel de 0, 05 de probabilidade que a verdadeira
performance m´edia destes carros n˜ ao ´e inferior a 14 km/l.
130
6.2.5 Estat´ıstica apropriadas para os testes de hip´ oteses
Parˆ ametro Presuposi¸ c˜ oes Estat´ıstica Distribui¸ c˜ ao
µ X ∼ N(µ, σ
2
) t
calc
=
¯ x−µ
0
s

n
n > 30 N(0, 1)
n ≤ 30 t
(n−1)
µ
a
−µ
b
X
a
∼ N(µ
a
, σ
2
a
)
X
b
∼ N(µ
b
, σ
2
b
)
σ
2
a
= σ
2
b
t
calc
=
¯ x
a
− ¯ x
b
−(µ
a
−µ
b
)
s
p

1
n
a
+
1
n
b
s
p
=

(n
a
−1)s
2
a
+(n
b
−1)s
2
b
n
a
+n
b
−2
n > 30 N(0, 1)
n ≤ 30 t
(n
a
+n
b
−2)
X
a
∼ N(µ
a
, σ
2
a
)
X
b
∼ N(µ
b
, σ
2
b
)
σ
2
a
= σ
2
b
t
calc
=
¯ x
a
− ¯ x
b
−(µ
a
−µ
b
)

s
2
a
n
a
+
s
2
b
n
b
n > 30 N(0, 1)
n ≤ 30 t
(v)
v =

s
2
a
n
a
+
s
2
b
n
b

2

s
2
a
n
a

2
n
a
−1
+

s
2
b
n
b

2
n
n
−1
dados pareados
t
calc
=
¯
d−d
0
s
d

n
d
i
= x
i antes
−x
i depois
n > 30 N(0, 1)
n ≤ 30 t
(n−1)
p t
calc
=
ˆ p−p
0

ˆ p(1−ˆ p)
n
n > 30 N(0, 1)
n ≤ 30 t
(n−1)
p
a
−p
b
t
calc
=
ˆ p
a
−ˆ p
b
−(p
0
a
−p
0
b
)

ˆ p
a
(1−ˆ p
a
)
n
+
ˆ p
b
(1−ˆ p
b
)
n
n > 30 N(0, 1)
n ≤ 30 t
(n
a
+n
b
−2)
σ
2
a
σ
2
b
X
a
∼ N(µ
a
, σ
2
a
)
X
b
∼ N(µ
b
, σ
2
b
)
F
calc
=
s
2
a
s
2
b
σ
2
b
σ
2
a
F
(n
a
−1),(n
b
−1)
131
6.2.6 Teste de Qui-Quadrado (χ
2
)
O teste de Qui-Quadrado ´e utilizado para compara¸ c˜ ao entre as freq¨ uˆencias
observadas as esperadas segundo um modelo probabil´ıstico qualquer.
Uma medida da discrepˆ ancia entre as freq¨ uˆencias observadas e esperadas ´e
dada por:
χ
2
calc
=
k
¸
i=1
(F
oi
−F
ei
)
2
F
ei
; (6.17)
em que:
F
oi
´e a freq¨ uˆencia observada;
F
ei
´e a freq¨ uˆencia esperada.
A express˜ ao 6.17 fornece um valor sempre positivo, e pode-se demonstrar
que χ
2
calc
∼ χ
2
v
. Em que χ
2
v
´e uma distribui¸ c˜ ao Qui-Quadrado com v graus de liberdade.
Assim, a estat´ıstica 6.17 pode ser utilizada tanto para verificar a aderˆencia
das freq¨ uˆencias observadas a um modelo, (teste Qui-Quadrado de aderˆencia), como para
verificar a independˆencia entre duas vari´ aveis.
6.2.6.1 Teste de aderˆencia
´
E utilizado para verificar o ajustamento de um modelo de probabilidade
aos dados observados, ou seja, verificar se as diferen¸ cas entre as freq¨ uˆencias observadas e
esperadas s˜ ao estatisticamente significativas.
Neste caso o n´ umero de graus de liberdade (v) ser´ a:
v = k −1 −m,
em que:
k ´e o n´ umero de classes, e
m o n´ umero de parˆ ametros estimados para se obter as freq. esperadas.
Exemplo1. Em seus experimentos com ervilhas, Mendel, ao cruzar plantas
de sementes amarelas lisas com plantas de sementes verdes enrugadas, observou a seguinte
132
descendˆencia na gera¸ c˜ ao F
2
: 315 plantas com sementes amarelas lisas, 108 com sementes
amarelas enrugadas, 101 com sementes verdes lisas e 32 com sementes verdes enrugadas.
De acordo com os postulados de Mendel a segrega¸ c˜ ao esperada nesta gera¸ c˜ ao deveria seguir
a propor¸ c˜ ao de 9:3:3:1 Verificar se a teoria da segrega¸ c˜ ao independente dos genes explica
a segrega¸ c˜ ao observada.
Solu¸ c˜ ao:
Hip´ oteses a serem testadas:

propor¸ c˜ ao = 9 : 3 : 3 : 1
propor¸ c˜ ao = 9 : 3 : 3 : 1

χ
2
= 0
χ
2
> 0
Obter as freq¨ uˆencia esperadas
classes F
o
F
e
Amarelas lisas 315 312,75
Amarelas enrugadas 108 104,25
Verdes lisas 101 104,25
Verdes enrugadas 32 34,75
Total 56 556
Obter a estat´ıstica χ
2
calc
χ
2
calc
=
(315 −312, 75)
2
312, 75
+ +
(32 −34, 75)
2
34, 75
= 0, 470
como nenhum parˆ ametro foi estimado, o n´ umero de graus de liberdade ser´ a:
v = 4 −1 −0 = 3
Verifica-se na tabela de χ
2
que χ
2
(0,01)
(3) = 11, 345
Como χ
2
calc
< χ
2
tab
o teste foi n˜ ao significativo.
Exemplo2 A distribui¸ c˜ ao do n´ umero de gols/partida, realizadas pelo
Cruzeiro, durante o Brasileir˜ ao 2001, foi:
Verificar se o n´ umero de gols por partida pode ser modelado segundo uma
distribui¸ c˜ ao de Poison
Solu¸ c˜ ao:
133
!h N´ umero de gols por partida marcados pelo Cruzeiro Esporte Clube durante o campe-
onato brasileiro de 2002.
N´ umero de gols 0 1 2 3 4
N´ umero de partidas 8 9 4 2 3
!h Probailidades estimadas via modelo de Poisson do n´ umero de gols por partida
marcados pelo Cruzeiro Esporte Clube durante o campeonato brasileiro de 2002.
n´ umero de gols 0 1 2 3 4
Prob. 0,26 0,35 0,23 0,10 0,04
Para obten¸ c˜ ao das freq¨ uˆencias esperadas pela distribui¸ c˜ ao torna-se
necess´ ario estimar o n´ umero m´edio de gols: ¯ x = 1, 35 gols por partida, em em seguida
obter a distribui¸ c˜ ao de probabilidade do n´ umero de gols/partidas:
Assim a freq¨ uˆencia esperada pela distribui¸ c˜ ao de Poison ser´ a dada pelo pro-
duto da probabilidade do cruzeiro realizar um determinado n´ umero de gols em uma partida
pelo n´ umero de partidas realizadas:
O valor da estat´ıstica χ
2
ser´ a:
χ
2
calc
=
(8 −6, 76)
2
6, 76
+
(9 −9, 10)
2
9, 10
+ +
(3 −1, 04)
2
1, 04
= 4, 98
Comparando esse valor com o de χ
2
Tabela
= com 3 graus de liberdade (5-1-1)
tem-se que o pvalor=0.1732, portanto n˜ ao rejeita-se H
0
.
6.2.6.2 Teste de independencia
O teste χ
2
de independˆencia ´e aplicado a tabelas de contingˆencia, as quais
s˜ ao construidas no intuito de estudar a rela¸ c˜ ao entre duas vari´ aveis categoricas. Considere-
se como exemplo a tabela 6.3 na qual est˜ ao apresentados os n´ umero de alunos matriculados
!h Frequˆencias esperadas do n´ umero de gols por partida marcados pelo Cruzeiro Es-
porte Clube durante o campeonato brasileiro de 2002, estimadas pelo modelo Poisson.
N´ umero de gols 0 1 2 3 4
N´ umero de partidas (Fo) 8 9 4 2 3
Fe 6,76 9,10 6,24 2,86 1,04
134
nos col´edios A e B, em rela¸ c˜ ao ` a sua classe econˆ omica (alta, m´edia ou baixa).
Tabela 6.2: N´ umero de alunos matriculados em dois col´edios em rela¸ c˜ ao ` a classe social
dos mesmos
Classe social
col´egio Alta M´edia Baixa Total
A 20 40 40 100
B 50 40 30 120
Total 70 80 70 220
A estat´ıstica utilizada para o teste ´e
χ
2
calc
=
h
¸
i=1
k
¸
j=1
(Fo
ij
−Fe
ij
)
2
Fe
ij
(6.18)
em que:
Fo
ij
´e a freq¨ uˆencia observada na casela ij;
Fe
ij
´e a freq¨ uˆencia esperada na casela ij, a qual ´e dada por:
Fe
ij
=
(Total da lina i)(total da coluna j)
totalgeral
Sob H
0
, a estat´ıstica 6.18 tem distribui¸ c˜ ao de χ
2
com
v = (h −1)(k −1) −p
graus de liberdade, sendo p o n´ umero de parˆ ametros estimados.
No exemplo tem-se:
substituindo esses resultados em 6.18
χ
2
calc
=
(20 −31, 82)
2
31, 82
+
(40 −36, 36)
2
336, 36
+ +
(30 −30, 18)
2
30, 18
= 20, 27
Verifica-se na tabela de χ
2
que o valor de χ
2
0,05
(2) = 5, 99. Como o valor de
χ
2
calc
´e maior que o de χ
2
tab
, este se encontra na regi˜ ao de rejei¸ c˜ ao de H
0
portanto, rejeita-se
135
Tabela 6.3: N´ umero de alunos matriculados em dois col´edios em rela¸ c˜ ao ` a classe social
dos mesmos
Classe social
col´egio Alta M´edia Baixa Total
A 20(31,82) 40(36,36) 40(31,82) 100
B 50(31,18) 40(43,64) 30(38,18) 120
Total 70 80 70 220
( ) Freq¨ uencia esperada
a hip´ otese de independˆencia entre os col´egios e a classe social dos alunos. Ou seja pode-se
afirmar, ao n´ıvel de 0,05 que a classe social e o col´egio no qual os alunos estudam n˜ ao s˜ ao
independentes.
Cap´ıtulo 7
Regress˜ao e Correla¸c˜ao linear
Estima¸ c˜ ao dos parˆ ametros do modelo de regress˜ ao pelo m´etodo dos m´ınimos
quadrados:
Seja o modelo:
y
i
= β
0

1
x
i
+e
i
(7.1)
em que:
y
i
´e o valor observado da vari´ avel resposta (dependente);
β
0
´e o intercepto do modelo;
β
1
´e coeficiente angular;
x
i
´e o valor da vari´ avel preditora e
e
i
´e o erro aleat´ orio associado a observa¸ c˜ ao y
i
.
Ajustar um modelo de regress˜ ao, via m´etodo de m´ınimos quadrados, implica
procurar os valores (
ˆ
β
i
) tais que os valores estimados (preditos) de y
i
, ˆ y
i
=
ˆ
β
0
+
ˆ
β
1
sejam
os mais pr´ oximos poss´ıveis dos valores observados. Isto ´e os erros sejam m´ınimos
Partindo-se do modelo 7.1 tem-se que o erro cometido ao se estimar uma
observa¸ c˜ ao ´e
e
i
= y
i
−β
0
−β
1
x
i
.
Definindo a fun¸ c˜ ao
136
137
S(β
0
, β
1
) =
n
¸
i=1
e
2
i
=
n
¸
i=1
(y
i
−β
0
−β
1
x
i
)
2
(7.2)
Os estimadores de m´ınimos quadrados de β
0
e β
1
,
ˆ
β
0
e
ˆ
β
1
s˜ ao aqueles que
minimizam a fun¸ c˜ ao 7.2. Assim, estes estimadores s˜ ao obtidos solucionando-se o sistema:

∂S
∂β
0
= 0
∂S
∂β
1
= 0

2
¸
n
i=1
(y
i

ˆ
β
0

ˆ
β
1
x
i
)(−1) = 0
2
¸
n
i=1
(y
i

ˆ
β
0

ˆ
β
1
x
1
)(−x
i
) = 0

¸
n
i=1
y
i
−n
ˆ
β
0

ˆ
β
1
¸
n
i=1
x
1
= 0 (a)
¸
n
i=1
y
i
x
i

ˆ
β
0
¸
n
i=1
x
i

ˆ
β
1
¸
n
i=1
x
2
i
= 0 (b)
de (a) tem-se:
ˆ
β
0
=
¸
n
i=1
y
i
n

ˆ
β
1
¸
n
i=1
x
i
n
ˆ
β
0
= ¯ y −
ˆ
β
1
¯ x (7.3)
de (b) tem-se:
138
ˆ
β
0
n
¸
i=1
x
i
+
ˆ
β
1
n
¸
i=1
x
2
i
=
n
¸
i=1
x
i
y
i
¸
n
i=1
y
i
n

ˆ
β
1
¸
i = 1
n
x
i
n

n
¸
i=1
x
i
+
ˆ
β
1
n
¸
i=1
x
2
i
=
n
¸
i=1
x
i
y
i
¸
n
i=1
y
i
¸
n
i=1
x
i
n

ˆ
β
1
¸
n
i=1
x
2
i
n
+
ˆ
β
1
n
¸
i=1
x
2
i
=
n
¸
i=1
x
i
y
i
¸
n
i=1
y
i
¸
n
i=1
x
i
n
+
ˆ
β
1

n
¸
i=1
x
2
i

¸
n
i=1
x
2
i
n

=
n
¸
i=1
x
i
y
i
ˆ
β
1

n
¸
i=1
x
2
i

¸
n
i=1
x
2
i
n

=
n
¸
i=1
x
i
y
i

¸
n
i=1
y
i
¸
n
i=1
x
i
n
ˆ
β
1
=
¸
n
i=1
x
i
y
i

n
i=1
y
i

n
i=1
x
i
n
¸
n
i=1
x
2
i

n
i=1
x
2
i
n
(7.4)
ˆ
β
1
=
SPXY
SQDX
Uma medida da qualidade do ajuste, do modelo obtido, aos dados ´e dada
pelo coeficiente de determina¸ c˜ ao (R
2
),
r
2
=
SPXY
2
SQDX
SQDY
(7.5)
Exemplo: Os dados a seguir refrem-se ao n´ umero de CDs vendidos por uma
determinada gravadora, em milhares de unidades, em 10 semanas consecutivas ap´ os o
lan¸ camento do mesmo. Ajustar um modelo de regress˜ ao linear simples que descreva a
quantidade de CDs vendidos em fun¸ c˜ ao do tempo de lan¸ camento.
Semanas 1 2 3 4 5 6 7 8 9 10
CDs (Milunid) 5,0 6,7 6,0 8,7 6,2 8,6 11,0 11,9 10,6 10,8
Tem-se que: n = 10
¸
10
i=1
X
i
= 55
¸
10
i=1
X
2
i
= 385
¸
10
i=1
Y
i
= 85, 5
¸
10
i=1
X
i
Y
i
= 529, 4
Substituindo esses valores em 7.4 tem-se:
ˆ
β
1
=
529,4−
(55)(85,5)
10
385−
55
2
10
= 0, 72
e em 7.3:
ˆ
β
0
= 8, 55 −(0, 72)(5, 5) = 4, 59
139
Portanto a equa¸ c˜ ao de regress˜ ao que descreve o n´ umero de Cds vendidos em
fun¸ c˜ ao do n´ umero de semanas ap´ os o lan¸ camento ´e:
y = 4, 59 + 0, 72x
Cujo coeficiente de determina¸ c˜ ao ´e:
r
2
=
59,15
2
82,5
54,565
= 0, 77

Sum´rio a
1 Introdu¸˜o ca 2 Estat´ ıstica descritiva 2.1 Organiza¸ao e apresenta¸ao de dados. . . . . . . . . . . . . . . . . . . . . . c˜ c˜ 2.1.1 Apresenta¸ao tabular . . . . . . . . . . . . . . . . . . . . . . . . . . c˜ 2.1.1.1 2.1.1.2 2.1.2 Distribui¸oes de freq¨ˆncias . . . . . . . . . . . . . . . . . c˜ ue Distribui¸oes de freq¨ˆncias acumuladas . . . . . . . . . . c˜ ue 7 9 9 11 11 16 19 19 20 21 22 25 25 28 34 36 38 40 41 42 47

Apresenta¸ao gr´fica . . . . . . . . . . . . . . . . . . . . . . . . . . c˜ a 2.1.2.1 2.1.2.2 2.1.2.3 2.1.2.4 Histogramas . . . . . . . . . . . . . . . . . . . . . . . . . . Pol´ ıgonos de freq¨ˆncia . . . . . . . . . . . . . . . . . . . ue Gr´fico de setores (pizza) . . . . . . . . . . . . . . . . . . a Ogivas . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

2.2

Medidas de Posi¸ao e dispers˜o . . . . . . . . . . . . . . . . . . . . . . . . c˜ a 2.2.1 Medidas de Posi¸ao . . . . . . . . . . . . . . . . . . . . . . . . . . . c˜ 2.2.1.1 2.2.1.2 2.2.1.3 2.2.1.4 2.2.2 M´dia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . e Mediana . . . . . . . . . . . . . . . . . . . . . . . . . . . . Moda . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Separatrizes (Quantis) . . . . . . . . . . . . . . . . . . . .

Medidas de disperss˜o . . . . . . . . . . . . . . . . . . . . . . . . . a 2.2.2.1 2.2.2.2 2.2.2.3 Amplitude Total (A) . . . . . . . . . . . . . . . . . . . . . Variˆncia e desvio padr˜o . . . . . . . . . . . . . . . . . . a a Coeficiente de varia¸ao . . . . . . . . . . . . . . . . . . . . c˜

2

3 2.2.2.4 2.2.2.5 3 Probabilidades 3.1 3.2 3.3 3.4 3.5 3.6 Processo aleat´rio: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . o Espa¸o amostral e Eventos c . . . . . . . . . . . . . . . . . . . . . . . . . . Erro padr˜o da m´dia . . . . . . . . . . . . . . . . . . . . a e Momentos, Assimetria e Curtose . . . . . . . . . . . . . . 48 48 54 54 55 56 58 59 60 63 63 63 64 65 66 67 68 68 69 70 71 72 72 72 73 74 78 80

Probabilidade . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Probabilidade Condicionada . . . . . . . . . . . . . . . . . . . . . . . . . . Independˆncia de eventos. . . . . . . . . . . . . . . . . . . . . . . . . . . . e Teorema de Bayes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

4 Vari´veis aleat´rias a o 4.1 Vari´veis Aleat´rias Unidimensionais. . . . . . . . . . . . . . . . . . . . . . a o 4.1.1 4.1.2 4.2 Distribui¸oes de Probabilidades . . . . . . . . . . . . . . . . . . . . c˜ Fun¸ao Reparti¸ao ou Distribui¸ao Acumulada F(x) . . . . . . . . . c˜ c˜ c˜

Vari´veis Aleat´rias Bidimensionais . . . . . . . . . . . . . . . . . . . . . . a o 4.2.1 4.2.2 4.2.3 4.2.4 Distribui¸ao Conjunta de duas vari´veis aleat´rias . . . . . . . . . . c˜ a o Distribui¸ao Marginal c˜ . . . . . . . . . . . . . . . . . . . . . . . . .

Vari´veis Aleat´rias Independentes . . . . . . . . . . . . . . . . . . a o Esperan¸a Matem´tica . . . . . . . . . . . . . . . . . . . . . . . . . c a 4.2.4.1 Propriedades da Esperan¸a Matem´tica . . . . . . . . . . c a

4.2.5

Variˆncia de uma vari´vel aleat´ria. . . . . . . . . . . . . . . . . . . a a o 4.2.5.1 Propriedades da variˆncia . . . . . . . . . . . . . . . . . . a

4.2.6 4.3

Covariˆncia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . a

Distribui¸oes de vari´veis aleat´rias discretas . . . . . . . . . . . . . . . . . c˜ a o 4.3.1 4.3.2 4.3.3 4.3.4 Distribui¸ao Uniforme Discreta . . . . . . . . . . . . . . . . . . . . c˜ Distribui¸ao de Bernoulli . . . . . . . . . . . . . . . . . . . . . . . c˜ Distribui¸ao Binomial. . . . . . . . . . . . . . . . . . . . . . . . . . c˜ Distribui¸ao de Poison . . . . . . . . . . . . . . . . . . . . . . . . . c˜ 4.3.4.1 Aproxima¸ao da distribui¸ao Binomial a Poisson. . . . . . c˜ c˜

. .8 4. . . . 101 a Vantagens do processo de amostragem em rela¸ao ao censo. . . .4. . .7 4. . . . . . . . . . . .1. . . . .5 4. . . .4. . . . . . . . . . . .2. . . . .2. . . . . . . . .2. . . . 100 c˜ Importˆncia do uso de amostras. . . . . . . . . . . . . . . c˜ e Distribui¸ao Pascal (Binomial Negativa) . . . 104 Amostragem Estratificada . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . c˜ 81 83 85 86 87 87 88 90 93 95 96 97 97 100 Distribui¸oes de vari´veis aleat´rias cont´ c˜ a o ınuas . .4. . .1. .6 4. . . . . .1 5. . . . . . . . . . . . . . .2.3.3 Defini¸oes . . .2. . . . . .7 Distribui¸ao Normal Reduzida ou Padronizada. .3. 104 Amostragem Sistem´tica . . . . . . .4. . . . . . . .1. . 100 c˜ 5.2. . . 4. . . . . . . .3 4. . .2. . . . .3. . . . c˜ Aproxima¸ao da Distribui¸ao Binomial a Normal . . . . . . .2 5. . c˜ Distribui¸ao Normal . . 104 Principais t´cnicas de amostragem n˜o probabil´ e a ısticas. .2. . .2 5. . . .4 5. .4 Distribui¸ao Geom´trica . . . . . . . . . .2. . c˜ Distribui¸ao Hipergeom´trica . . . . . 106 Popula¸ao formada por material cont´ c˜ ınuo. . . . . . . . . . . . . .1. . . . . . . . . .4 4.4 4. .2. . . . . . . .2 Amostragem Simples ao Acaso . .3 5.1 4. . . . . .2 T´cnicas de amostragem. .6 4. . . . . c˜ c˜ ` 5 Amostragem 5. 102 c˜ 5.1. . . . . . . . . . . . . . c˜ Distribui¸ao F de Snedcor . . . . . 104 5. . .1. . . .1 Introdu¸ao. . . . . . . . . . . . . 104 a Amostragem por Conglomerados . .4 Inacessibilidade a toda popula¸ao . . . . . . . . . . . . . . . . 106 5. . . . . . . . . . . . . .5 4. . . . c˜ Distribui¸ao Qui-Quadrado c˜ . . .2. . . . . . .2.4. . . . . . . . . .1. . . . . . . . . .4. . . . . . . . . . . . .2.2 Distribui¸ao Uniforme . . . . . . . c˜ e Distribui¸ao Multinomial . . .1 5. . .1 Principais t´cnicas de amostragem probabil´ e ısticas. . . . . . . . . . . . c˜ 4. . . . . . . . . . . . . . 103 e 5.2 5. . . . . .1 4. . 106 c˜ Amostragem sem norma (a esmo) . . c˜ Distribui¸ao Exponencial . . . . . . . . . . . . . . . . . . . . . . Distribui¸ao t de Student . . . 106 . . . . .2. .4. . . . . .4. . . . . . . . . .3 5. . . . . . . . . . .2. . . . . . . . . . . . . . . . . . . . . . . . . . . . . .1 5. . . . . . . . . . . . . . . . . . . . . 106 Intencional . . . . . . . . . . . . . . . . .3. .

. . . . . . .2. .1.1 5. . . . .3 Intervalo de confian¸a para propor¸ao . . . . .3. . . 122 c c c˜ 6. . . .3. . . .1 Amostragem com reposi¸ao . . . . . . . . . . . . . . . . .1. . . . . . . . . . . . . . .2. . . . . . . . . . .1. . . . . . . . 119 Variancias Desconhecidas: . .1 6. . . .2.2 Defini¸oes . .3. . . 118 a Diferen¸a entre duas m´dia (µa − µb ) . . . . . . . . . . .2. 126 Tipos de testes . . 110 c˜ 112 Teoria da estima¸ao . . . . . . . . . . .3. .1. . . . .3. . . . . .1 6. . . . . . . . . . . . . . . . . . . . . 107 c˜ Amostragem sem reposi¸ao . . . .2 Amostras grandes (n > 30) . .3 Metodologia de um teste de hip´tese . . . . . .3. .2. . . . . . . . . . .1. . . 122 Amostras pequenas (n ≤ 30) . . .3 6. . . . 112 c˜ 6. . . . . . . . 116 c 6. . .3. . . . . . . . . . 124 o Tipos de erros . . . . . . . . . 121 Amostras pequenas (n ≤ 30) . . . . .3. . .4. 113 a Consistˆncia. . . . . . . . . . .2 Intervalo de confian¸a para a variˆncia (σ 2 ) . . . . .3. . .2 6. . . 123 c a Teoria da decis˜o (Testes de Hip´teses) . .1.1. .1. . .1. . . . . . .2 6.1.1 6. . . . 127 .1 Distribui¸ao amostral da m´dia . . .1.3 N˜o tendenciosidade . 112 c˜ Propriedades dos Estimadores . . . . . . .1 6. . . . . .1. . . . . . . . . . . . . 113 6. . . . . . . . . . . . . . .1. .2 6. . . . . 116 c e 6. . .1 6. . . . . . . . . . 115 e Intervalos de confian¸a . . . .3.3. . . . . . .1 6. . . . . . 119 c e 6. . . . . 123 6. . . . . . . . 123 a o 6.3. . .1. . .4 Intervalo de confian¸a para a diferen¸a entre propor¸oes . . . 121 c c˜ 6. . . . . . .2 Variancias Conhecidas: .4. . . .1. . .3. .3.2 Variˆncia conhecida .2 6. . . . . 120 6. . . . . . . . . . . . .1. . . . . .1. . . . . 116 a Variˆncia desconhecida . . . . . . . . . . .2. . . . .5 6. . . . .5 5. .2. . . . . . . . . . . . . . . . . 106 c˜ 5. . . . . . . . .1 Intervalo de confian¸a para a m´dia µ . . .3.3. . . .1. . . .1.3. . . . . . . . . . . . . . . . . . . . . . . 107 c˜ e 5. . . . . . . . . . . .1. . . . . . . . . . . . . . . . . . . . . . .2. . . . . . . .2 6 Inferˆncia e 6. . . . . 122 Amostras grandes (n > 30) . . . . . . . .1. . .3 Distribui¸oes Amostrais . . . . . . . . .3.1. .1. . 115 e Eficiˆncia .1 6. . . . . .

.2. . 130 o Teste de Qui-Quadrado (χ2 ) . . . . . . . . . . . . . . .6 Algoritmo para realiza¸ao de um teste de hip´tese . . . . . . . . . . . . . . .2. . .6 6. . . . . .4 6. . . . . . .2. 131 e Teste de independencia . . . . .5 6. . . .2.6. . . . .2 Teste de aderˆncia . . 131 6. . . . . . . .6. . . . 128 c˜ o Estat´ ıstica apropriadas para os testes de hip´teses . . . . . . . . . 133 136 7 Regress˜o e Correla¸˜o linear a ca . . . . . . .1 6.2.

Pois a partir de 1925. e nas respostas dos “por quˆs” de seus problemas. e acima de tudo que o pesquisador desenvolva um esp´ ırito cr´ ıtico e jamais deixe de pensar.Cap´ ıtulo 1 Introdu¸˜o ca O cidad˜o comum pensa que a estat´ a ıstica se resume apenas a apresentar tabelas de n´meros em colunas esportivas e ou econˆmicas de jornais e revistas. Mas estat´ ıstico de hoje n˜o se limita a compilar tabelas de dados e a os ilustrar graficamente. Deste modo. pilhas de moedas. A estat´ ıstica descritiva se refere a maneira de apresentar um conjunto de dados em tabelas e gr´ficos. organiza¸ao. quando se observou apenas uma parte (amostra) desta popc˜ ula¸ao. E que para ela ser bem usada ´ necess´rio e e a conhecer os seus fundamentos e princ´ ıpios. Pois ”em ciˆncia ´ f´cil mentir usando a e e a 7 . Didaticamente podemos dividir a estat´ c˜ a c˜ ıstica em duas partes a estat´ ıstica descritiva e a inferˆncia estat´ e ıstica. ent˜o. interpretar e analisar os dados experimentais e apresentar os resultados de maneira a facilitar a tomada de decis˜es razo´veis. apree c˜ senta¸ao. E necess´rio ter em mente que a estat´ c˜ ´ a ıstica ´ uma ferramenta para o pesquisador. a estat´ ` ıstica e ıfico. J´ a inferˆncia esc˜ a e tat´ ıstica baseia-se na teoria das probabilidades para estabelecer conclus˜es sobre todo um o grupo (chamado popula¸ao). e ao modo a de resumir as informa¸oes contidas nestes dados a algumas medidas. ou quando muito associam a estat´ a ıstica a previs˜o de ` a resultados eleitorais. ilustradas u o com gr´ficos. podemos ent˜o o a a definir estat´ ıstica como sendo a ciˆncia que se preocupa com a coleta. an´lise e interpreta¸ao de dados. etc. o trabalho do estat´ a ıstico passou a ser o de ajudar iniciou-se como m´todo cient´ a planejar experimentos. com os trabalhos de Fisher.

8 estat´ ıstica, o dif´ ´ falar a verdade sem usar a estat´ ıcil e ıstica”.

Cap´ ıtulo 2 Estat´ ıstica descritiva
2.1 Organiza¸˜o e apresenta¸˜o de dados. ca ca
As observa¸oes s˜o o material b´sico com que o pesquisador trabalha. Esc˜ a a tas observa¸oes podem ser por exemplo a produtividade de uma planta, a velocidade de c˜ processamento de um computador, a resistˆncia a ruptura de determinado cabo, suscetibile ` idade ou n˜o de um indiv´ a ıduo a determinada doen¸a, cor de uma flor, sexo do primeiro c filho de um casal, opini˜o dos alunos quanto a did´tica de um professor, etc. Estas oba a serva¸oes apresentam uma caracter´ c˜ ıstica em comum que ´ a varia¸ao ou variabilidade, ou e c˜ seja assumem diferentes valores de indiv´ ıduo para indiv´ ıduo. Uma caracter´ ıstica que pode assumir diferentes valores de indiv´ ıduo para indiv´ ıduo ´ denominada vari´vel. Caso contr´rio ´ denominada constante. As vari´veis e a a e a s˜o classificadas em: a • QUALITATIVAS: S˜o aquelas para as quais uma medi¸ao num´rica n˜o ´ poss´ a c˜ e a e ıvel. Ex: Cor de flor, sexo, sabor. • QUANTITATIVAS: S˜o aquelas para as quais ´ poss´ se realizar-se uma medi¸ao a e ıvel c˜ num´rica, subdivide-se em: e – DISCRETAS: Pr´prias de dados de contagem, ou seja s´ assumem valores ino o teiros. Ex: n´mero de filhos, n´mero de acidentes de trˆnsito ocorridos num u u a 9

10 certo per´ ıodo, etc. – CONT´ INUAS: S˜o aquelas origin´rias de medi¸oes, deste modo, podem assumir a a c˜ qualquer valor real entre dois extremos. Ex: Peso corporal, altura, resistˆncia e a ruptura, volume, etc. Os dados coletados no campo e trazidos para o laborat´rio (escrit´rio), na o o forma em que se encontram, como os apresentados na Tabela 2.1, s˜o denominados dados a brutos. Normalmente este tipo de dados tr´s pouca ou nenhuma informa¸ao ao leitor, a c˜ sendo necess´rio uma elabora¸ao (organiza¸ao) destes dados, afim de aumentar sua caa c˜ c˜ pacidade de informa¸ao. c˜ Tabela 2.1: Diˆmetro a altura do peito (DAP), em mm de 40 p´s de Eucalyptus citriodora a ` e aos 6 anos de idade em Lavras - MG 104 108 138 101 163 141 90 154 122 142 106 201 169 120 210 98 129 138 122 161 167 189 132 127 144 151 146 82 137 132 172 87 183 138 115 179 142 111 140 136

A mais simples organiza¸ao num´rica ´ ordena¸ao dados em ordem crescente c˜ e e c˜ ou decrescente (ROL). Como pode-se observar na Tabela 2, a simples organiza¸ao dos c˜ dados em um Rol, aumenta muito a capacidade de informa¸ao destes. Pois enquanto a c˜ Tabela 2.1 nos informava apenas que t´ ınhamos 40 p´s de Eucalipto, e alguns D.A.P., na e Tabela 2.2, verificamos que o menor diˆmetro observado foi 82 mm e o maior 210 mm, o a que nos fornece uma amplitude total de varia¸ao da ordem de 128 mm. c˜ Amplitude total

132 mm 138 a mm e 142 mm s˜o mais comuns. que delimitam o intervalo de classe. Diˆmetro a altura do peito (DAP).1. deve-se conhecer os valores dos limites inferior e superior da classe.1. em mm de 40 p´s de Eucalyptus a ` e citriodora aos 6 anos de idade em Lavras . c˜ ue Para identificar uma classe.11 A = maior valor observado − menor valor observado A = 210mm − 82mm = 128mm (2.2: Tabela 2. podemos ainda agrupa-los em o c˜ classes de menor tamanho. c˜ Distribuindo-se os dados observados em classes e contando-se o numero de indiv´ ıduos contidos em cada classe.MG 82 87 90 98 101 104 106 108 111 115 120 122 122 127 129 132 132 136 137 138 138 138 140 141 142 142 144 146 151 154 161 163 167 169 172 179 183 189 201 210 2. afim de aumentar sua a capacidade de informa¸ao.1 Apresenta¸˜o tabular ca Distribui¸oes de freq¨ˆncias c˜ ue Ap´s esta primeira organiza¸ao dos dados. para o caso dos .1 2. A disposi¸ao tabular dos e ue c˜ dados agrupados em classes. Por exemplo.1) Pode-se observar ainda que alguns diˆmetros como 122 mm. obt´m-se a freq¨ˆncia de classe. juntamente com as freq¨ˆncias correspondentes denomina-se ue distribui¸ao de freq¨ˆncia. a Tabela 2.1.

Quando o intervalo de classe ´ aberto. n ≤ 100 k= √ n. como por exemplo: a [128mm . pode-se desejar incluir em uma unica classe todos os indiv´ ´ ıduos que possuam DAP entre 120 e 138 mm assim. os limites da classe n˜o pertencem a ela. em fun¸ao do n´mero de dados (n) ´: c˜ u e 1. Uma indica¸ao do n´mero de a e c˜ u classes a ser utilizado.138mm[ para este tipo de intervalo pode-se utilizar ainda a seguinte nota¸ao: c˜ 128mm 138mm Constru¸ao de uma distribui¸ao de freq¨ˆncia c˜ c˜ ue Para montar uma distribui¸ao de freq¨ˆncia ´ necess´rio que primeiramente c˜ ue e a se determine o n´mero de classes (k) em que os dados ser˜o agrupados. (2. e e a quando o intervalo ´ fechado. se ´ aberto ou fechado. Neste ponto surge uma d´vida fundamental.12 DAP dos eucaliptos. Por quest˜es de u a o ordem pr´tica e est´tica sugere-se utilizar de 5 a 20 classes. Nota¸ao: e a c˜ • Intervalos abertos ]128mm .138mm] (128mm .138mm[ • Intervalos fechados [128mm .138mm) • Intervalos mistos S˜o fechados em um extremo e abertos no outro.2) . o intervalo de classe seria de 120 mm a 138 mm. os limite de classe pertencem a classe em quest˜o. Indiv´ u ıduos que apresentem DAP exatamente iguais a 120 mm ou a 138 mm pertencem ou n˜o a esta classe? Deste a e modo surge a necessidade de definir a natureza do intervalo de classe.

3) (2.5) 1 (2.4) PM = em que: (2. e Lsup ´ o limite superior da classe. a Os limites inferior e superior das classes devem ser escolhidos de modo que o menor valor observado esteja localizado no ponto m´dio da primeira classe. e Assim. o u a deve-se ent˜o determinar o intervalo de classe (c ). que ´ dado por: e e Linf − Lsup 2 A k−1 (2. e a n ´ o n´mero de observa¸oes. e u c˜ Ap´s determinado o n´mero de classes (k) em que os dados ser˜o agrupados. Crit´rio de SCOTT (1979).7) . baseado na normalidade dos dados: e An 3 k= 3. que ´ dado pela seguinte express˜o: a e a c= em que: c ´ amplitude de classe. e s ´ o desvio padr˜o.6) Linf ´ o limite inferior da classe. e A ´ a amplitude total. e u Conhecida a amplitude de classes. n > 100 k = 5log(n). o limite inferior da primeira classe ser´: a c 2 Linf 1 = menorvalor − (2. determina-se ent˜o os intervalos de classe. e k ´ o n´mero de classes.49s em que: A ´ a amplitude total.13 2. 3.

6 2 c 2 = 69. 8 120. u e 3o Determinar a amplitude de classe (c) c= 128 = 25. 4 146.14 E os demais limites s˜o obtidos somando-se c ao limite anterior. 2 5o Determinar os intervalos de classe 69. 4 146.3 que os DAP dos 40 p´s de Eucalyptus citriodora em quest˜o est˜o e a a concentrados entorno dos valores centrais. Pois pode-se verificar c˜ e c˜ claramente na Tabela 2. 8 6 Montar a distribui¸ao de freq¨ˆncia. 6 197. 0 171. al´m de facilitar sua visualiza¸ao. basta apresentar as classes obtidas c˜ ue na forma tabular e contar quantos indiv´ ıduos existem em classe. 2o Determinar o n´mero de classes (k) u n = 40 K= √ 40 = 6. Apresentando os dados na forma de distribui¸ao de freq¨ˆncia. 2 94. 6 o 120.menor valor observado = 210 -82 =128 mm. sintetiza-se a c˜ ue informa¸ao contida nos mesmos. como o n´mero de classes ´ inteiro usaremos 6 classes. 8 94. 2 222. 0 171. 6mm 6−1 4o Determinar o limite inferior da primeira classe (Li) Linf 1 = menorvalor − Linf 1 = 82 − 25. 32 . 2 197. decrescendo em dire¸ao aos valores extremos. c˜ A apresenta¸ao dos dados em forma de distribui¸ao de freq¨ˆncia facilita ainda o c´lculo c˜ c˜ ue a . c˜ ue Para montar a distribui¸ao de freq¨ˆncia. a A t´ ıtulo de ilustra¸ao agruparemos os dados referentes ao DAP de eucaliptos c˜ em classes 1o Amplitude total (A) A = maior valor observado .

2 94. pois indicam o n´mero de observa¸oes pertencentes a cada classe. al´m de permitir a apresenta¸ao gr´fica dos e c˜ a mesmos. Para solucionar este problema utiliza-se a freq¨ˆncia relativa. 4 146. 8 120. 8 120. e ue e Assim a Tabela 2. 2 222. 0 171. Classes (mm) 69. 4 146. e ue e Fi ´ a freq¨ˆncia absoluta da i-´ssima classe. que expressa c˜ ue c˜ c˜ u a quantidade de observa¸oes pertencentes a uma classe.15 Tabela 2.3 pode ser apresentada do seguinte modo: . ue ue As freq¨ˆncias apresentadas na Tabela 2. Fi (2.3: Distribui¸ao de freq¨ˆncias dos DAP de 40 p´s de Eucalyptus citriodora aos 6 c˜ ue e anos de idade em Lavras . 6 197. Freq¨ˆncia Absoluta e Freq¨ˆncia Relativa. 8 Tabula¸ao c˜ ||| |||||||| |||||||||||||||| ||||||| |||| || Freq¨ˆncia ue 3 8 16 7 4 2 40 de v´rias medidas estat´ a ısticas de interesse.MG. 2 Total 94.8) F ri ´ a freq¨ˆncia relativa da i-´ssima classe. em rela¸ao ao n´mero total de observa¸oes. e ´ dada por: c˜ e Fi k i=1 F ri = e que. 0 171. este tipo de u c˜ freq¨ˆncia apresenta a limita¸ao de sua interpreta¸ao ser dependente do n´mero total de ue c˜ c˜ u observa¸oes.3 s˜o denominadas freq¨ˆncias abue a ue solutas. 6 197.

5 e 2. 8 120.400 0. 6 197.0 40. 2 94.5 20.4: Distribui¸ao de freq¨ˆncias dos DAP de 40 p´s de Eucalyptus citriodora aos 6 c˜ ue e anos de idade em Lavras .0 100. 0 171. 6 197. 8 Freq¨ˆncia Absoluta Freq¨ˆncia Relativa ue ue 3 8 16 7 4 2 40 0.16 Tabela 2. assim como a soma das freq¨ˆncias de todos os valores acima do limite ue inferior de uma classe ´ denominada freq¨ˆncia acumulada para cima. 4 146.0 5.2 Distribui¸oes de freq¨ˆncias acumuladas c˜ ue Muitas vezes pode-se estar interessado n˜o em saber a quantidade de oba serva¸oes que existe numa determinada classe. e ue A t´ ıtulo de ilustra¸ao. mas sim a quantidade de observa¸oes acima c˜ c˜ ou abaixo de um determinado ponto na distribui¸ao.1. Mas como proceder para obter as freq¨ˆncias ue acumuladas para valores intermedi´rios aos apresentados na tabela? Como por exemplo a a .0 17. 0 171. 8 120.075 0. 2 Total 94. Classes (mm) 69. pois o valor 146 mm ´ um dos limue e ites de classe apresentados nesta tabela. 2 222. as freq¨ˆncias acumuladas para cima e para baixo dos DAP dos 40 p´s de ue e Eucalyptus citriodra o em quest˜o.1.75%).100 0.6.0 2.200 0. a soma das freq¨ˆncias de todos os valores abaixo do limite ue superior de uma determinada classe ´ definida como freq¨ˆncia acumulada para baixo e ue deste ponto. 4 146.5 e verificar a freq¨ˆncia acumulada abaixo deste valor (6. c˜ Deste modo.000 Freq¨ˆncia Relativa (%) ue 7.MG.050 1.175 0. est˜o apresentadas nas Tabelas 2.5 10. respecc˜ a tivamente. a Aplica¸oes das distribui¸oes de freq¨ˆncias acumuladas c˜ c˜ ue Para verificar qual a porcentagem de p´s de Eucalyptus citriodra que pose suem DAP inferior a 146 mm basta consultar diretamente a Tabela 2.

6) = 0.950 1.0 a 171.6 mm de 146.6 mm =0. c para uma diferen¸a de 4. 850 − 0.6 mm = 0.850 Assim. pressup˜e-se que os diˆmetros estejam uniformea o a mente distribu´ ıdos dentro das classes. e procede-se do seguinte modo: Freq. Freq¨ˆncia Acumulada ue Diˆmetro (mm) a Abaixo de 69.0 mm existir˜o x dos DAP.8 Abaixo de 120.0 Abaixo de 171.850 0. abaixo de 146.2 Abaixo de 222.075 0.MG.0 mm a a ent˜o.4 Abaixo de 146. da classe imediatamente inferior a 150 (abaixo de 146)= 0.6 mm s˜o 25.000 0.0 mm = 0. Freq.000 freq¨ˆncia acumulada abaixo de 150 mm? ue Para este tipo de c´lculo.275 0.2 Abaixo de 94.17 Tabela 2. 675 = 0.0 a 150.0 mm s˜o 4.850. acumulada abaixo.675 Freq.675 0. entre 146.8 Absoluta 0 3 11 27 34 38 40 Relativa 0. Freq. a para uma diferen¸a de 25.675. da classe imediatamente superior a 150 (abaixo de 171. Freq.5: Distribui¸ao de freq¨ˆncia acumulada para baixo dos DAP de 40 p´s de c˜ ue e Eucalyptus citriodra aos 6 anos de idade em Lavras .6 mm existem 0. c a ou seja . 175 de 146.0 e 171.6 Abaixo de 197.175 dos DAP. abaixo de 171. acumulada abaixo.

e obtendo os seguintes resultados: 021532122303001235100204034021 Dispondo estes dados em um Rol tem-se: 000000000111112222222333334455 .325 0.0 → x de onde verifica-se que x = 0.2 Acima de 94. Exemplo 2.0 mm existem 0. Como abaixo de 140.: Realizou-se num grande hospital um estudo referente ao n´mero u de vitimas fatais de acidentes de transito.0 Acima de 171.675 dos DAP. Obs. Freq¨ˆncia Acumulada ue Diˆmetro (mm) Absoluta a Acima de 69.675 + 0.6: Distribui¸ao de freq¨ˆncia acumulada para cima dos DAP de 40 p´s de Eucac˜ ue e lyptus citriodra aos 6 anos de idade em Lavras .0273 = 0. o mesmo ocorrendo com as vari´veis quantitativas discretas a (Exemplo 2).0273.7023 dos DAP. Para vari´veis qualitativas n˜o se faz necess´rio a distribui¸ao dos a a a c˜ dados em classes pois cada “valor” da vari´vel j´ representa uma classe distinta como a a pode ser observado na tabela 7.150 0. 0273.4 Acima de 146. e entre 140.050 0.175 4.6 Acima de 197.MG. atendidas diariamente.2 Acima de 222. durante um certo mˆs.000 0.8 40 37 29 13 6 2 0 Relativa 1.18 Tabela 2.925 0.000 25. conclui-se que abaixo de 150 mm existam 0.8 Acima de 120.725 0.6 mm → 0.0 e 150 mm existem 0.

00 Tabela 2. e cuja altura ´ proporcional a freq¨ˆncia da classe. SEXO MASCULINO FEMININO TOTAL Fa 20 30 50 Fr 0.7: Distribui¸ao de Freq¨ˆncias do N´mero de Funcion´rios da Empresa Tabajara c˜ ue u a Classificado Quanto ao Sexo em 1996.60 1. com as a bases assentadas sobre um eixo horizontal.1. durante um certo mˆs e Vitimas fatais (X/dia) 0 1 2 3 4 5 Total N´mero de dias u 9 5 7 5 2 2 30 2. tais como histogramas.8: N´mero de v´ u ıtimas fatais de acidentes de trˆnsito atendidas diariamente em a um grande hospital. tendo o centro da mesma no ponto m´dio da e classe que representa. e mais facilmente visualizadas atrav´s de gr´ficos.19 Tabela 2. e a ıgonos de freq¨ˆncia.1.2 Apresenta¸˜o gr´fica ca a As mesmas informa¸oes fornecidas pelas distribui¸oes de freq¨ˆncias podem c˜ c˜ ue ser obtidas.1 Histogramas Os histogramas s˜o constitu´ a ıdos por um conjunto de retˆngulos.2. ogivas. ue a pol´ 2.40 0. Se as amplitudes e ` ue . pictogramas e outros. gr´ficos de setores.

afim de que as areas dos mesmos a a ´ sejam proporcionais as freq¨ˆncias das classes.20 de classe forem todas iguais. ` ue Figura 2.1.2. as alturas e a dos retˆngulos dever˜o ser convenientemente ajustadas.1: Diˆmetro a altura do peito de 40 p´s de Eucalyptus citriodora aos 6 anos de a ` e idade em Lavras-MG. Por´m. Completa-se o pol´ ıgono unindo-se as extremidades da linha que une os pontos representativos das freq¨ˆncias de classe aos pontos m´dios das classes imediatamente ue e anterior e posterior as classes extremas. que tˆm freq¨ˆncia nula.2 Pol´ ıgonos de freq¨ˆncia ue Pol´ ıgono de freq¨ˆncia ´ um gr´fico de an´lise no qual as freq¨ˆncias das ue e a a ue classes s˜o localizadas sobre perpendiculares levantadas nos ponto m´dios das classes. a e E pode ser obtido pela simples uni˜o dos pontos m´dios dos topos dos retˆngulos de um a e a histograma. 2. e ue . se os intervalos de classe n˜o tiverem todos a mesma amplitude. as alturas ser˜o numericamente iguais as freq¨ˆncias das a ue classes.

21 Figura 2.2: Diˆmetro a altura do peito de 40 p´s de Eucalyptus citriodora aos 6 anos de a ` e idade em Lavras-MG. e ´ ue basta resolver uma regra de trˆs simples. Figura 2.3 Gr´fico de setores (pizza) a O processo de constru¸ao de um gr´fico de setores ´ simples pois sabe-se que c˜ a e setor de circunferˆncia formado por um angulo de 360o equivale a 100% da area da cire ˆ ´ cunferˆncia.3: Diˆmetro a altura do peito de 40 p´s de Eucalyptus citriodora aos 6 anos de a ` e idade em Lavras-MG.1. assim para obter-se o setor cuja area representa uma determinada freq¨ˆncia. 2.2. como a apresentada a seguir: e .

1. ´ c ue .22 360o xo → → 100% Fr Figura 2.4: Diˆmetro a altura do peito de 40 p´s de Eucalyptus citriodora aos 6 anos de a ` e idade em Lavras-MG. respectivamente. 2. nas quais ue as freq¨ˆncias acumuladas s˜o localizadas sobre perpendiculares levantadas nos limites ue a inferiores ou superiores das classes.4 Ogivas Ogiva ´ o nome dado a um pol´ e ıgono de freq¨ˆncias acumuladas. quando as classes apresentam ` ue diferentes amplitudes . torna-se necess´rio fazer um ajuste na altura dos retˆngulos.2. Deste modo. Histogramas com classes de diferentes tamanhos Como foi comentado. dependendo se a ogiva representar as freq¨ˆncias acuue muladas abaixo ou acima. as areas dos retˆngulos de um histograma s˜o propor´ a a cionais a freq¨ˆncia da classe que representam. afim a a de que suas areas permane¸am fieis ‘a sua freq¨ˆncia.

5: Diˆmetro a altura do peito de 40 p´s de Eucalyptus citriodora aos 6 anos de a ` e idade em Lavras-MG.9) . (2.23 Figura 2.6: Diˆmetro a altura do peito de 40 p´s de Eucalyptus citriodora aos 6 anos de a ` e idade em Lavras-MG. Para realizar esta corre¸ao utilizamos como altura dos retˆngulos a dfr (denc˜ a sidade de freq¨ˆncia relativa). Figura 2. dada por ue Fr c df r = em que.

150. esta distor¸ao ´ corrigida.250 0.5000 0.7. ´ Tabela 2. como pode ser verificado na figura 2. tendo como coordenadas do eixo Y as df r. que deveria representar a % de propriedades com area entre 150 ´ ´ 2. nota-se que area do u e ´ histograma. c˜ e Os histogramas e pol´ ıgonos de freq¨ˆncias podem indicar ainda qual ´ o tipo ue e de distribui¸ao que os dados seguem. como pode ser visto a seguir: c˜ . Quando deveriam ser iguais.9.8. apresentadas na tabela 2.9 nas classes 50 150 e 150 400 existem o mesmo n´mero de propriedades.0000 Caso constru´ ıssemos um histograma utilizando as F r obter´ ıamos a figura 2.250 1.24 Fr = freq¨ˆncia relativa da classe ue c = amplitude de classe Para ilustrar o uso da df r na constru¸ao de histogramas utilizaremos os c˜ dados da tabela 2. Construindo o histograma. Por´m ao observar-se a figura 2. a ´ Area 0 50 150 Total 50 150 400 Fa 500 250 250 1000 Fr 0. Como pode-se observar.5 vezes maior que a area referente a classe 50 e ´ ` 400 ha.7.9: Distribui¸ao de Freq¨ˆncias da Areas em ha de 900 Propriedades Rurais em c˜ ue uma Regi˜o de MG.10.na tabela 2.

2.25 ´ Figura 2. ´ Figura 2.1 Medidas de Posi¸˜o e dispers˜o ca a Medidas de Posi¸˜o ca As medidas de posi¸ao ou de tendˆncia central constituem uma forma mais c˜ e sint´tica de apresentar os resultados contidos nos dados observados.7: Distribui¸ao do N´mero de Propriedades Rurais Segundo suas Areas. Num c˜ u Certo Munic´ ıpio de MG.8: Distribui¸ao de Freq¨ˆncias do Areas. pois representam um e . em ha de 900 Propriedades Rurais em c˜ ue uma Regi˜o de MG. a 2.2 2.

a ´ Area 0 50 150 Total 50 150 400 Fr 0. c˜ e valor central.0010 Figura 2. As medidas de posi¸ao mais c˜ empregadas s˜o a m´dia. c˜ e Figura 2. em torno do qual os dados se concentram.26 ´ Tabela 2.10: Distribui¸ao de Freq¨ˆncias do Areas.0025 0.250 1. a mediana e a moda. a e .250 0.000 c 50 100 250 dfr 0. em ha de 900 Propriedades Rurais em c˜ ue uma Regi˜o de MG.0100 0.9: Distribui¸ao sim´trica.500 0.10: Distribui¸ao assim´trica a esquerda.

27 Figura 2.12: Distribui¸ao em jota.11: Distribui¸ao assim´trica a direita. c˜ c˜ .13: Distribui¸ao em jota invertido. c˜ Figura 2.14: Distribui¸ao distribui¸ao bimodal. c˜ e Figura 2. c˜ Figura 2.

o Se os dados estiverem agrupados na forma de uma distribui¸ao de freq¨ˆncia.M´dia Aritm´tica: e e e e e c˜ A m´dia aritm´tica ou simplesmente m´dia de um conjunto de n observa¸oes. para o c´lculo da m´dia. 900 = 1. isto c˜ e o quer dizer que alguns leit˜es pesaram menos de 1. 1. . 670kg ´ um valor em torno do e o e qual os pesos ao nascer destes cinco leit˜es se concentra.2.: Dados os pesos ao nascer (kg) de cinco leit˜es da ra¸a Large White. 670kg. mas em o m´dia. .800. c˜ 2. e . bem como pela relativa simplicidade do seu c´lculo. 670kg 5 Interpreta¸ao: O peso m´dio ao nascer dos cinco leit˜es foi de 1.10) Ex. 1.500. 800 + 1. o c 1. al´m ıvel a e de prestar-se bem ao tratamento alg´brico.28 Figura 2. .900.1 M´dia e ´ E a mais usada das trˆs medidas de posi¸ao mencionadas. por ser a mais e c˜ comum e compreens´ delas.800. x2 .1. c a o a a e . x1 .15: Distribui¸ao multimodal. 1. xn ´ definida como: e n i=1 ¯ x= xi n (2. Temos que o peso m´dio ao nascer destes leit˜es ´ e o e x= ¯ 1. o peso ao nascer dos leit˜es foi 1. 670kg. 350 + 1. Ou seja 1. 1. outros pesaram mais. c˜ ue lan¸a-se m˜o da Hip´tese tabular b´sica.350. . 670kg. 800 + 1. 500 + 1.

145 0.015 1. e = freq¨ˆncia absoluta da classe i.” e Que ´ realizado atrav´s da seguinte express˜o: e e a x= ¯ em que.000 TOTAL x= ¯ 286200 (350)(14) + (450)(46) + · · · + (1150)(6) = = 715. a Dura¸ao (horas) c˜ 300 400 500 600 700 800 900 1000 1100 400 500 600 700 800 900 1000 1100 1200 Fa 14 46 58 76 68 62 48 22 6 400 Fr 0.190 0.115 0.11: Durabilidade (horas) de 400 v´lvulas ensaiadas na Tabajara Inc.170 0.11) F ri = freq¨ˆncia relativa da classe i. 5horas 14 + 46 + · · · + 6 400 Propriedades da M´dia e .: Calcular a m´dia dos dados apresentados a seguir: e Tabela 2.29 Hip´tese Tabular B´sica o a “Todas as observa¸oes contidas numa classe s˜o consideradas iguais ao ponto c˜ a m´dio da classe.055 0. ue Ex. xi F ai = ponto m´dio da classe i. ue k i=1 xi F ai k i=1 F ai k = i=1 xi F r i (2.120 0.035 0.155 0.

75 2.75 5. A soma dos quadrados dos desvios de um conjunto de dados em rela¸ao a uma conc˜ stante k ´ m´ e ınima quando k for a m´dia. x=2 ¯ (1 − 2) + (2 − 2) + (3 − 2) = 0 Prova: n n i=1 [xi − x] = ¯ = i=1 n xi − n¯ x xi − n n n i=1 xi i=1 n n xi = i=1 xi − i=1 = 0 ii. Ent˜o o valor de θ que minimiza S ´ obtido solucionando-se o sistema: a e .30 i. e Ex.0 1.0 2.3.2.3.: Dados .1.5 2.00 2. A soma dos desvios de um conjunto de dados em rela¸ao a sua m´dia ´ nula c˜ e e Ex.0 Prova: Seja S= i=1 n Soma dos quadrados dos desvios 5.2. x = 2 ¯ k 1.: Dados 1.5 3.00 2.00 [xi − θ]2 .

: Dados: 1. 2. a nova m´dia fica multiplicada e por k. Multiplicando-se todos os dados por uma constante k.: Dados 1. A m´dia de um conjunto de dados acrescidos ou subtra´ e ıdos em cada elemento de uma constante k ´ igual a m´dia original somada ou subtra´ desta constante. 2. 4. 5 x∗ = 4 = 2 + 2 = x + k ¯ Prova: x = ¯ n i=1 xi n fazendo x∗ = (xi ± +k) i tem-se: x∗ = ¯ = n i=1 ∗ xi n i=1 (xi n i=1 n x∗ ¯ n xi ± nk = n n i=1 xi = ±k n = x±k ¯ ± k) iv.31 dS =0 dθ Assim n 2 i=1 n [xi − θ] = 0 xi − nθ = 0 θ = θ = x ¯ n i=1 i=1 x1 n iii. e ´ e ıda Ex. 3 x = 2 ¯ . Ex. 3 x = 2 ¯ ¯ k=2 novos dados: 3.

c˜ ii.32 ¯ k=3 novos dados: 3. Na sua determina¸ao s˜o considerados todos os dados da distribui¸ao. c˜ a c˜ iv. . E unica para um conjunto de dados. vi. a a a u c˜ e ´ ´ v. N˜o pode ser calculada para dados agrupados que apresentam classes extremas abera tas. . . Localiza-se. . wn que dependem da importˆncia atribu´ a cada uma das oba ıda serva¸oes. ue iii. x2 . . .M´dia Ponderada e ` As vezes associa-se as observa¸oes x1 . w2 . xn determinadas pondera¸oes ` c˜ c˜ ou pesos w1 . . em geral. 9 x∗ = 6 = (3)(2) = k¯ x Prova: x = ¯ n i=1 xi n fazendo x∗ = (kxi ) i tem-se: x ¯ ∗ = = = k n i=1 x∗ i n i=1 (kxi ) n i=1 n n xi n x ¯ ∗ = k¯ x Caracter´ ısticas e importˆncia: a ´ i.: Classe 0 a 500 mais de 500 . . A sua precis˜o est´ na raz˜o direta do n´mero de observa¸oes com que ´ calculada. 6. Ex. neste caso a m´dia ´ dada por: c˜ e e Fa 5 6 . na classe de maior freq¨ˆncia. E muito influenciada pelos valores extremos da distribui¸ao.

xn . e e a ou seja uma varia¸ao harmˆnica. varia¸ao de pre¸os de c˜ o a c˜ c produtos agr´ ıcolas no decorrer do ano (safra/entre safra).33 xp = ¯ n i=1 xi wi n i=1 wi (2. etc.: Se o exame final de um curso tem peso 3.14) A m´dia geom´trica ´ utilizada para representar vari´veis assim´tricas a e e e a e direita. por ser muito influenciada pelos valores exe e tremos. . x1 . como por exemplo ondas de r´dio. x2 . nestes casos. . ou seja: c˜ n xG = ¯ ou ainda: n x 1 X2 · · · x n = n xi i=1 (2. · · · . Como exemplos de vari´veis. m´dia aritm´tica.15) Este tipo de m´dia ´ utilizado para vari´veis que apresentem periodicidade. sinais de TV.12) Ex. o .M´dia Harmˆnica e o A m´dia harmˆnica de um conjunto de n observa¸oes. .13) 1 ¯ ln xG = n n ln xi i=1 (2.M´dia Geom´trica e e A m´dia geom´trica de um conjunto de n observa¸oes. pois. n˜o representa bem a vari´vel. para as quais a m´dia a a a e e e e e c˜ geom´trica ´ um melhor localizador do que a m´dia aritm´tica pode sitar-se a distribui¸ao de renda da popula¸ao brasileira. x2 . xn .90 nas provas correntes? e Aplicando-se a equa¸ao2. Qual a nota m´dia de um aluno que obteve 85 no exame final e 70. e as provas correntes peso 1. ´ dada e e c˜ e pela raiz de ordem n do produto dessas observa¸oes.12 tem-se: c˜ xp = ¯ 415 (3)(85) + (1)(70) + (1)(90) = = 85 pontos 3+1+1 5 . x1 . a condutividade hidr´ulica de um solo e o diˆmetro de c˜ a a torr˜es de solo. ´ a e o c˜ e rec´ ıproca da m´dia aritm´tica dos rec´ e e ıprocos das observa¸oes: c˜ 1 1 n n 1 i=1 xi xH = ¯ = n n 1 i=1 xi (2. . .

FM d (2.2.2 Mediana Para um conjunto de dados ordenados (Rol) a mediana ´ o valor que ´ e e precedido e seguido pelo mesmo n´mero de dados (observa¸oes). e Ex. 5 iii. ` a C´lculo da mediana a i. a mediana ser´ dada por: u a x( n ) + x( n+2 ) 2 2 Md = Ex. Quando o n´mero de dados for par.17) Md = ( 4 ) ( 4+2 ) 2 2 2 +x = x(2) +x(3) 2 = 1+2 2 = 1. a mediana ´ dada por: e M d = x( n+1 ) 2 (2. 3. e c ´ amplitude da classe mediana.34 2.18) Fa = ´ a freq¨ˆncia acumulada das classes anteriores a classe mediana. 2.: Para os dados da Tabela2. 4 ⇒ n = 5 (´ impar) M d = x( 5+1 ) = x(3) = 2 2 ii.1. Dados agrupados: n 2 M d = Li + em que. 1.11 (Durabilidade das v´lvulas) temos: a . e ue e ue FM d ´ a freq¨ˆncia da classe mediana. Quando o n´mero de dados (n) for ´ u ımpar. 2. − Fa + c.16) Ex.: 0. Li = e o limite inferior da classe mediana.: 0. Isto ´ 50% dos dados s˜o u c˜ e a superiores a mediana e 50% s˜o inferiores. 3 ⇒ n = 4 (par) x 2 (2. 1.

que pertencem a 5a classe [700 − 800[ Aplicando-se a f´rmula da mediana vem: ` o 2 M d = Li + − Fa + c FM d 400 − 194 + 100 = 700 + 2 68 = 708. E muito empregada em pesquisas nas quais os valores extremos tˆm pouca ime a portˆncia. . Multiplicando-se todas as observa¸oes por uma constante (k). A soma dos m´dulos dos desvios dos dados em rela¸ao a mediana ´ m´ o c˜ ` e ınima. Pode ser obtida em distribui¸oes de freq¨ˆncias que apresentem classes com limites c˜ ue indefinidos. ´ ii. Somando-se ou subtraindo-se uma constante (k) a todas as observa¸oes. Propriedades da Mediana: i. n i=1 |xi − M d| = m´ inimo ii. a mediana c˜ fica somada ou subtra´ desta constante (k).82 horas e 50% duram mais que 708. ıda x∗ = X ± k ⇒ M d ∗ = M d ± k iii.82 horas indica que 50% das v´lvulas duram c˜ a menos que 708. x∗ = kx ⇒ M d∗ = kM d Caracter´ ısticas e Importˆncia: a i. o valor da mediana encontra-se entre a posi¸ao 200 e 201 x n e c˜ c˜ 2 x n+2 . 82 horas n 2 Interpreta¸ao: A mediana igual a 708. a mediana fica multic˜ plicada por esta constante (k).35 n = 400 observa¸oes.82 horas.

7. 9. 7. ue No histograma acima. N˜o ´ influenciada por valores extremos e sim pelo n´mero de observa¸oes. 3. e c˜ c Tra¸a-se as retas AC e BD. 8. o valor mais comum.e ∆2 a diferen¸a entre as freq¨ˆncias da classe modal e da imediatamente c ue posterior. deslocando-a no sentido da classe de maior freq¨ˆncia. 5. 10. bem e a ´ como pode n˜o existir. Para um conjunto de dados a moda pode n˜o ser unica. na classe modal.36 iii.: 2. 4. No ponto de intersec¸ao destas retas (E) tra¸a-se uma perpenc dicular ao eixo das classes. os v´rtices A. que representam as alturas dos triˆngulos ABE e CDE. C e D. Por E tra¸a-se a reta F F . 3.1. 4. 2. 3. Sendo ∆1 a diferen¸a entre a freq¨ˆncia da classe modal e da classe imediatac ue mente anterior. 2. os c segmentos EF e EF . a partir c˜ a e e do histograma de freq¨ˆncias (M´todo de Czuber). 4. a M o = 4 e M o = 10. correspondente a ordenada m´xima da disue e ` a tribui¸ao. 7. 2. 1. a Ex. n˜o possui moda. 4. e ue isto ´.3 Moda A moda de um conjunto de dados ´ o valor que ocorre com maior freq¨ˆncia. a e u c˜ ´ iv. localizando o ponto M o. 8. a . cujos comprimentos s˜o proporcionais a a ∆1 e ∆2 . E mais realista do que a m´dia para representar certas vari´veis. 1. 7. na forma de uma distribui¸ao de a c˜ freq¨ˆncias. 10. valor da moda. a moda ´ o ponto do eixo x. 13. O ponto M o divide o intervalo da classe modal (c) em duas partes. como o n´ salarial e a ıvel de uma empresa. obtendo assim. 10 9 20 13 M o = 7.2. Dados Agrupados Quando os dados est˜o agrupados. paralela ao eixo das classes. Este m´todo ´ baseado na influˆncia ue e e e e que as classes adjacentes exercem sobre a moda. marca-se. B. O processo para c´lculo da moda em dados agrupados ´ o geom´trico.

19 tem-se: ∆1 c. e .37 Figura 2.16: Esquema para obten¸ao da moda pelo m´todo de Czuber c˜ e Sendo Li o limite inferior da classe modal.20) M o = Li + em que: (2. ∆1 + ∆ 2 (2.20 em 2.16 que: M o = Li + x (2. verificasse na figura 2. Ls o limite superior e x a distˆncia a entre Li e a moda (M o).19) Sendo os triˆngulos ABE e CDE semelhantes (pois possuem dois angulos a ˆ iguais) tem-se que: EF AB = EF CD x ∆1 = c−x ∆2 x∆2 = c∆1 − x∆1 ∆1 x = c ∆1 + ∆ 2 Substituindo 2.21) Li ´ o limite inferior da classe modal.

a moda fica multiplicada por esta constante. x∗ = kx ⇒ M o∗ = kM o 2. N˜o ´ afetada por valores extremos. deixa 25% dos elementos abaixo dele. Assim: Q1 ´ o 1o quartil. N˜o apresenta boas propriedades alg´bricas.38 ∆1 ´ a diferen¸a entre a freq¨ˆncia da classe modal e da imediatamente e c ue anterior. e . a e a ´ ii. e c ´ a amplitude da classe modal. ∆2 ´ a diferen¸a ente a freq¨ˆncia da classe modal e da imediatamente e c ue anterior.2. d) Maximiza o n´mero de desvios iguais a e u a zero. ıda x∗ = x ± k ⇒ M o ∗ = M o ± k ii. Caracter´ ısticas e Importˆncia a i.4 Separatrizes (Quantis) Quartis Os quartis separam um conjunto de dados ordenados (Rol) em quatro partes iguais.1. Propriedades da Moda i. o iii. a moda fica somada ou subtra´ da mesma constante. Somando-se ou subtraindo uma constante a todos os dados. E uma medida bastante utilizada em Estat´ ıstica Econˆmica. Multiplicando-se todos os dados por uma constante k. a n˜o ser que estes constituam a classe modal.

2. . 10). FQ1 ´ a freq¨ˆncia da classe que cont´m Q1 e e ue e c ´ a amplitude da classe que cont´m Q1 . de um conjunto de observa¸oes organizadas na forma ´ c˜ de uma distribui¸ao de freq¨ˆncias pode ser obtido por: c˜ ue in 10 Di = LiDi + em que: − F a Di c F Di (2. a e O i − esimo decil. FQ3 ´ a freq¨ˆncia da classe que cont´m Q3 e e ue e e e c ´ a amplitude da classe que cont´m Q3 . deixa 75% dos elementos abaixo dele. e e F aQ3 ´ a freq¨ˆncia acumulada das classes anteriores a classe que cont´m e ue ` e Q3 . Decis S˜o valores que dividem uma s´rie de dados ordenados em dez partes iguais.23) LiQ3 ´ o limite inferior da classe que cont´m Q3 . Determina¸ao de Q1 c˜ n 4 Q1 = LiQ1 + em que: − F a Q1 c F Q1 (2. e e c˜ Determina¸ao de Q3 3n 4 Q3 = LiQ3 + em que: − F a Q3 c F Q3 (2. e e F aQ1 ´ a freq¨ˆncia acumulada das classes anteriores a classe que cont´m e ue ` e Q1 . (i = 1.39 Q2 = 2o quartil. . Q3 = 3o quartil. deixa 50% dos elementos abaixo dele. .24) .22) LiQ1 ´ o limite inferior da classe que cont´m Q1 . coincide com a mediana. .

8. FDi ´ a freq¨ˆncia da classe que cont´m Di e e ue e c ´ a amplitude da classe que cont´m Di .40 LiDi ´ o limite inferior da classe que cont´m Di . 10.25) LiPi ´ o limite inferior da classe que cont´m Pi . 10. 2.2. e e Rela¸oes emp´ c˜ ıricas entre m´dia. 2. 12.2 Medidas de disperss˜o a A utiliza¸ao de uma medida de posi¸ao para substituir um conjunto de dados c˜ c˜ ´ insuficiente para sintetizar a informa¸ao nele contida. . 10. 10. 10. e ue ` e FPi ´ a freq¨ˆncia da classe que cont´m Pi e e ue e c ´ a amplitude da classe que cont´m Pi . moda e as distribui¸oes de dados: e c˜ Distribui¸ao c˜ Sim´trica e Assim´trica a direita (assim´trica positiva) e e Assim´trica a esquerda (assim´trica negativa) e e Rela¸ao c˜ x = Md = Mo ¯ x > Md > Mo ¯ x < Md < Mo ¯ 2. a e Dada uma distribui¸ao de freq¨ˆncias. 13. o valor do i − esimo percentil. 10) ´ c˜ ue ´ e obtido por: in 100 Pi = LiPi + em que: − F a Pi c F Pi (2. mediana. 10. . .10. 24 . e e Percentis S˜o valores que dividem uma s´rie de dados ordenados em 100 partes iguais. . 10. 10. como pode ser observado a seguir: e c˜ A = 10. e e F aDi ´ a freq¨ˆncia acumulada das classes anteriores a classe que cont´m e ue ` e Di . (i = 1. 10. 11. 18 1. 10 B= C= 1. e e F aPi ´ a freq¨ˆncia acumulada das classes anteriores a classe que cont´m Pi .

mediana (eq 2. e e mvo ´ o menor valor observado. a e A amplitude ´ uma medida de dispers˜o f´cil de ser calculada e ´ certamente a maneira e a a e mais natural e comumente utilizada para descrever a variabilidade de um conjunto de . ent˜o. sendo que esta varia¸ao ´ maior no conjunto C. por´m observando-os.2. pois enquanto no conjunto A os dados s˜o todos iguais.41 Calculando a m´dia (eq 2.26) Nota-se.10). mee e dianas e modas iguais a 10unidades. os demais a c˜ c˜ e apresentam uma certa varia¸ao. uma medida de dispers˜o. e Para os conjuntos A. em que: M V O ´ o maior valor observado. (2. que vai informar como ` c˜ a estes dados se comportam em torno da medida de posi¸ao em quest˜o.B e C tem-se: AA = 10 − 10 = 0 unidades AB = 18 − 1 = 17 unidades e AC = 24 − 1 = 23 unidades.16 e moda desses trˆs conjuntos e e tem-se: xA = xB = xc = 10 unidades ¯ ¯ ¯ M dA = M dB = M dc = 10 unidades M oA = M oB = M oc = 10 unidades Assim.1 Amplitude Total (A) A amplitude total ´ a diferen¸a entre o maior e o menor valor observado e c A = M V O − mvo.C) apresentam m´dias. verifica-se que os trˆs conjuntos (A.2. para sintetizarmos eficientemente a informa¸ao de um conjunto de dados temos que c˜ associar a medida de posi¸ao utilizada. c˜ a 2. que a amplitude do conjunto C ´ bem maior que nos demais. Deste modo.B. percebe-se que eles s˜o bem e a diferentes entre si.

e dividindo-se a soma dos quadrados dos c˜ desvios pelo n´mero de observa¸oes obt´m-se a variˆncia populacional que ´ uma medida u c˜ e a e quantitativa da dispers˜o de um conjunto de dados entorno da sua m´dia. ser facila mente calcul´vel e compreens´ a ıvel. mas deve-se lembrar que a soma dos desvios de um e conjunto de dados em rela¸ao a sua m´dia ´ nula. pois s´ utiliza os valores extremos. optou-se por utilizar a soma c˜ e e a dos quadrados dos desvios. a e e de esta soma de quadrados de desvios ser m´ ınima.42 dados. no seu c´lculo e c˜ u c˜ a n˜o s˜o consideradas todas as observa¸oes. al´m do fato. mas. que estava trazendo complica¸oes. pensou-se inicialmente ´ u a em obter-se a m´dia destes desvios. como j´ foi visto em propriedades da a m´dia. Quando estiver trabalhando com amostras. a variˆncia ´ dada pela a e soma dos quadrados dos desvios dividida por n − 1 (n´mero de observa¸oes menos um) u c˜ .2 Variˆncia e desvio padr˜o a a Uma boa medida de dispers˜o deve basear-se em todos os dados. Ent˜o. a a c˜ o 2. Por´m sua interpreta¸ao depende do n´mero de observa¸oes.28) Para os exemplos anteriores tem-se: 2 σA = 2 σB 2 σA (10 − 10)2 + (10 − 10)2 + · · · + (10 − 10)2 = 0 unidades2 7 (1 − 10)2 + (8 − 10)2 + · · · + (18 − 10)2 = 22 unidades2 = 7 (1 − 10)2 + (2 − 10)2 + · · · + (24 − 10)2 = 50 unidades2 = 7 Obs.2. e 1 SQD = V (x) = σ = N N 2 n i=1 (xi − x)2 ¯ (2. al´m de prestar-se bem ao tratamento alg´brico. pois elevando-se cada desvio ao quadrado elimina-se o sinal negativo. Uma e e medida com todas estas caracter´ ısticas ´ obtida considerando-se os desvios de cada obe c˜ c˜ e serva¸ao em rela¸ao a m´dia (chamados erros) : ei = xi − x ¯ (2.27) Para obter um unico n´mero que represente a dispers˜o dos dados.2.

33) xi ´ o ponto m´dio da i-´sima classe.31) n SQD = i=1 n (xi − x)2 ¯ (x2 − 2¯xi + x2 ) x ¯ i n = i=1 n = i=1 n x2 i x2 i i=1 n − 2¯ x −2 ( xi + n¯2 x i=1 n i=1 = = i=1 xi xi ) n n n i=1 xi + n i=1 2 n i=1 xi 2 n x2 − i n Para dados tabulados o c´lculo da variˆncia ´ realizado por meio das a a e seguintes express˜es: o 1 σ = N 2 n i=1 n x2 F i − i x2 F i i ( n i=1 xi F i ) N 2 (2.43 que ´ denominado graus de liberdade.29) Formulas computacionais para o c´lculo da variˆncia a a 1 σ = N 2 i=1 n x − 2 ( n i=1 x) 2 N ( n i=1 (2. e e e e Fi ´ a freq¨ˆncia absoluta da i-´sima classe.30) 2 prova: 1 s = n−1 2 i=1 x − 2 x) n (2. Assim: e 1 SQD = s = n−1 n−1 2 n n i=1 (xi − x)2 ¯ (2.32) 2 em que: 1 s = n−1 2 i=1 − ( n i=1 xi F i ) n (2. e ue e Propriedades da variˆncia a .

A variˆncia de uma soma ou diferen¸a entre vari´veis ´ a soma das variˆncias das a c a e a vari´veis se estas forem independentes.44 i. a V (X ± Y ) = V (X) + V (Y ) se X e Y f orem independentes . k = constante. prova Dado que: x1 = x2 = · · · = xn = k ⇒ x = k. A variˆncia de uma constante k ´ nula a e V (k) = 0. portanto: ¯ n 1 V (x) = N = 1 N i=1 n (xi − x)2 ¯ (k − k)2 i=1 = 0 ii.

Multiplicando-se todos os dados por uma constante k. Y ) iii. a variˆncia fica multiplicada a por k 2 . X ∗ = X ± k ⇒ V (X ∗ ) = V (X) Prova: 1 V (X ) = N ∗ n = = 1 N 1 N i=1 n ¯ (x∗ − X ∗ )2 i ¯ (xi ± k) − X ± k) ¯ (xi − X)2 2 i=1 n i=1 = V (X) iv. Y ) para W = X + Y tem-se:V (W ) = V (X) + V (Y ) + 2cov(X. Somando-se ou subtraindo-se uma constante k a todos os dados a variˆncia n˜o se a a altera.45 Prova: w = x ± y 1 V (W ) = N = = = = = 1 N 1 N 1 N 1 N 1 N n i=1 n ¯ (wi − W )2 ¯ ¯ (xi − yi ) − (X − Y ) 2 i=1 n i=1 n ¯ ¯ ¯ ¯ (xi − yi )2 − 2(xi − yi )(X − Y ) + (X − Y )2 2 i=1 n 2 ¯ ¯ ¯ ¯ ¯ ¯¯ ¯ x2 − 2xi yi + yi − 2(xi X − xi Y − yi X + yi Y ) + (X 2 − 2X Y + Y 2 i 2 i=1 n 2 ¯ ¯ ¯ ¯ ¯¯ (x2 − 2xi x + x2 ) + (yi − 2yi Y + Y 2 ) − 2(xi yi − xi Y − yi X + X Y ) ¯ ¯ i 2 ¯ ¯ ¯ ¯ (xi − X)2 + (yi − Y )2 − 2(xi − X)(yi − Y ) 2 2 i=1 = V (X) + V (Y ) − 2cov(X.

caso esteja-se trabalhando com o peso corporal de indiv´ ıduos. o qual ´ expresso na mesma unidade a e em que os dados foram coletados. 6 unidades = √ 50 = 7. tomados em kg. 07 unidades = .35) Para o exemplo em quest˜o tem-se: a σA = σB σA √ 0 = 0 unidades √ 22 = 4.k ⇒ V (X ∗ ) = k 2 V (X) Prova: V (X ∗ ) = = = = 1 N 1 N 1 N 1 N 2 n i=1 n ¯ (x∗ − X ∗ )2 i (kxi ) − k¯)2 x (k 2 x2 − 2k 2 xi x + k 2 x) ¯ ¯ i k 2 (x2 − 2xi x + x) ¯ ¯ i i=1 n i=1 n i=1 = k V (X) Desvio Padr˜o a Um inconveniente da variˆncia ´ que ela ´ expressa em unidades ao quadrado. No intuito de resolver este problema trabalha-se com o desvio padr˜o que ´ c˜ a e definido como a raiz quadrada positiva da variˆncia.34) s= √ s2 (2.46 X ∗ = X. a e e ou seja. σ= √ σ2 (2. a variˆncia destes pesos ´ expressa em kg2 . o que causa algumas dificuldades de intera e preta¸ao.

36) CVA = CVB CVA Ex.1: 0 100 = 0% 10 4.2. 69 100 = 46. o desvio padr˜o fica multiplicada por k X ∗ = kX ∗ ⇒ s(X ∗ ) = ks(X) 2.2. e σ CV = ¯ 100 X Ex. que expressa a variabilidade dos dados em rela¸ao a c˜ c˜ ` sua m´dia. 9% = 10 7. X ∗ = X ± k ⇒ s(X ∗ ) = s(X) a ii.3 Coeficiente de varia¸˜o ca A variˆncia e o desvio padr˜o s˜o medidas de dispers˜o absolutas. mesmo n´mero de observa¸oes e e u c˜ estiverem expressos nas mesmas unidades.47 Propriedades do desvio padr˜o a i. . Ent˜o para comparar qualquer conjunto de a dados quanto a sua variabilidade deve-se lan¸ar m˜o de uma medida de dispers˜o relativa ` c a a como o coeficiente de varia¸ao (CV ). Somando-se ou subtraindo-se uma constante k a todos os dados o desvio padr˜o n˜o a a se altera. 7% 10 (2.2. 07 = 100 = 70. deste a a a a modo s´ podem ser utilizadas para comparar a variabilidade de dois ou mais conjuntos o de dados quando estes apresentarem a mesma m´dia. Multiplicando-se todos os dados por uma constante k.

. x2 . . Assimetria e Curtose Momentos Se x1 . (2.5 Os dados acima referem-se a temperatura ambiental e precipita¸ao de uma ` c˜ certa regi˜o. (2.2. c˜ e O momento de ordem r em rela¸ao a uma origem k.4 Erro padr˜o da m´dia a e ´ e a e E uma medida que fornece uma id´ia da precis˜o com que a m´dia foi estimada. Nota-se que o primeiro c˜ n − k)r . e para a a a tanto utilizar-se o desvio padr˜o (S).37) xr i n . a a 2. . al´m de cometer o disparate de comparar numericamente duas a e vari´veis que est˜o expressas em unidades diferentes. Caso deseje-se saber qual das duas vari´veis possui maior dispers˜o. xn s˜o os n valores assumidos pela vari´vel X.39) .5 Momentos.2. define-se a a a quantidade xr + x r + · · · + x r n 2 ¯ = Xr = 1 n ¯ e momento em rela¸ao a origem (X 1 ) ´ a m´dia de X. .2.2. concluiria-se erroneamente que a precipita¸ao ´ mais a c˜ e vari´vel que a temperatura. qualquer.7 Precipita¸ao (mm) c˜ 800 100 12. s sX = √ ¯ n 2.38) como o momento de ordem r em rela¸ao a origem.48 Estat´ ıstica M´dia e s CV % Temperatura (o C) 22 5 22. ´ dado por: c˜ e Mr (k) = n i=1 (xi n i=1 (2.

43) ¯ 3(X − M d) s (2. de uma dise tribui¸ao. n i=1 Fi Mr (k) = em que: (2. ue e Coeficiente de Assimetria (Cs).44) . (2.41) xi ´ o ponto m´dio da i-´sima classe. diz-se c˜ e e ` e e e ` que ela ´ assim´trica a esquerda ou negativa.49 ¯ e O momento de ordem r em rela¸ao a m´dia X ´ dado por: c˜ e ¯ Mr (X) = n i=1 (xi n ¯ − X)r . c˜ e e Cs > 0 a distribui¸ao ´ assim´trica a direita. c˜ e e a Para o caso dos dados encotrarem-se agrupados. e e e e Fi = freq¨ˆncia absoluta da i-´sima. O coeficiente de assimetria (Cs) ´ dado por: e Cs = M3 (σ 2 )1.5 (2. na forma de uma distribui¸ao de freq¨ˆncias. Se o inverso ocorre.40) Nota-se que o segundo momento em rela¸ao a m´dia ´ a variˆncia. as express˜es para o c´lculo dos momentos ser˜o: c˜ ue o a a n r i=1 (xi − k) Fi .42) Classifica¸ao das distribui¸oes quanto a assimetria: c˜ c˜ Cs = 0 distribui¸ao ´ sim´trica perfeita. c˜ e e ` Cs < 0 a distribui¸ao ´ assim´trica a esquerda. ou afastamento da simetria. diz-se que ` a ` a distribui¸ao ´ assim´trica a direita ou assim´trica positiva. Se a curva de freq¨ˆncia (pol´ c˜ ue ıgono de freq¨ˆncia suavizado) de uma distribui¸ao ue c˜ tem uma “cauda” mais longa a direita da ordenada m´xima do que a esquerda. Assimetria ´ o grau de desvio. c˜ e e ` Existem ainda o primeiro e segundo coeficientes de assimetria de Pearson dados respectivamente por: Cs = e Cs = ¯ X − Mo s (2.

c˜ e Coeficiente de Curtose. A distribui¸ao que tem um pico relativamente c˜ c˜ c˜ alto ´ chamada leptoc´rtica. Curtose ´ o grau de achatamento de uma distribui¸ao. enquanto a distribui¸ao que possui o topo achatado ´ denome u c˜ e inada platic´rtica e a distribui¸ao que n˜o ´ muito pontiaguda.17: Distribui¸ao sim´trica. c˜ e Figura 2. c˜ e Figura 2. nem muito achatada. considerado usuale c˜ mente em rela¸ao a distribui¸ao normal.18: Distribui¸ao assim´trica a esquerda. como u c˜ a e .50 Tipos de distribui¸oes quanto a assimetria c˜ Figura 2.19: Distribui¸ao assim´trica a direita.

c˜ u Ex.22: Distribui¸ao platic´rtica.20: Distribui¸ao leptoc´rtica.45) Tipos de distribui¸ao quanto a curtose: c˜ ` Figura 2.: Os dados a seguir referem-se ao n´mero de partos/dia ocorrido num u determinado hospital durante o mˆs de mar¸o de 1997 e c . c˜ u Figura 2. O coeficiente de curtose ´ c˜ e u e dado por: M4 (σ 2 )2 Ck = (2.51 acontece com a distribui¸ao normal ´ denominada mesoc´rtica. c˜ u Figura 2.21: Distribui¸ao mesoc´rtica.

terceiro e quarto momentos em rela¸ao a m´dia c˜ e ¯ M2 (X) = = n ¯ 2 i=1 (xi − X) Fi n i=1 Fi 2 (12 − 17. 27 (σ 2 )1. 6)3 2 = −3.5 5. 6) 1 + (14 − 17. 96 M3 = = −0. 6)3 4 + · · · + (22 − 17. 971. 97 30 ¯ M3 (X) = = (12 − 17. 6)2 2 = 5.4 + · · · + 22. 22 30 n ¯ 4 i=1 (xi − X) Fi n i=1 Fi 4 c) Obter os coeficientes de assimetria e curtose −3. 6)2 4 + · · · + (22 − 17.1 + 14. 6) 1 + (14 − 17. 96 30 n ¯ 3 i=1 (xi − X) Fi n i=1 Fi 3 ¯ M4 ( X = = (12 − 17.5 Cs = .2 = 17. 6)4 2 = 89. 6)3 4 + · · · + (22 − 17.52 X (partos/dia) 12 14 16 18 20 22 Total a) Obter o primeiro momento em rela¸ao a origem c˜ M1 = n i=1 (xi )Fi n i=1 Fi F (n´mero de dias) u 1 4 6 10 7 2 30 = 12. 6) 1 + (14 − 17. 6 30 b) segundo.

50 2 )2 (σ 5.53 Ck = 89. 972 . 22 M4 = = 2.

surgir´ uma regularu a idade do resultado. o Ex. u • Peso de uma pessoa. mas pode-se descrever todos os a poss´ ıveis resultados. • Quando o experimento for repetido um grande n´mero de vezes. • Sexo do primeiro filho de um casal.: • Jogar uma moeda e observar a sua face superior. haver´ uma estabilidade da fra¸ao e a c˜ da ocorrˆncia de um particular resultado. Caracter´ ısticas de um processo (experimento) aleat´rio o • Cada experimento pode ser repetido indefinidamente sob as mesmas condi¸oes. c˜ • N˜o se conhece a priori o resultado do experimento. e r n (freq¨ˆncia relativa) ue 54 . isto ´.1 Processo aleat´rio: o Qualquer fenˆmeno que gere resultado incerto ou casual. • N´mero de chips defeituosos encontrados num lote de 100 chips.Cap´ ıtulo 3 Probabilidades 3.

F F M.1: Freq¨ˆncia relativa de sucessos em fun¸ao do n´mero de repeti¸oes (r) para ue c˜ u c˜ um experimento com p = 0.: Processo aleat´rio: Verificar a idade de uma pessoa. Ω = M M M.2 Espa¸o amostral e Eventos c O conjunto formado por todos os poss´ ıveis resultados de um processo aleat´rio ´ denomiado espa¸o amostral (Ω). M F F.: Processo aleat´rio: Verificar a cor das flores de uma planta fe feijoeiro. 5 3. F = sexo feminino e M = sexo masculino. F M F. o e c Ex1. M M F. Qualquer sub-conjunto do espa¸o amostral (Ω ) ´ denominado evento. em que . amarela}. o Ω = x ∈ R : 0 ≤ x ≤ 120 Ex3. F F F .: Processo aleat´rio: Conforma¸ao dos dos filhos de um casal com trˆs o c˜ e filhos quanto ao sexo.55 Figura 3. o Ω = {branca. F M M. c e Como exemplo tem-se: . roxa. M F M. Ex2.

´ dada a e e pela raz˜o: a P (A) = em que: n ´ o n´mero de eventos de interesse. 3. Evento imposs´ ou vazio E5 = φ. e e u N o n´mero total de eventos. M F F }. a a . a probabilidade de ocorrˆncia de um determinado evento A.: A = primeiro filho ser do sexo feminino. e portanto da express˜o a qual deseja-se definir. u Exemplos: P (E1 ) = P (E1 ) = 1 8 3 8 n .3 Probabilidade A chamada defini¸ao cl´ssica de probabilidade ´: Dado um conjunto de N c˜ a e eventos equiprov´veis. Ex. A e B. Dois eventos.56 E1 : Trˆs filhos do sexo feminino E1 = {F F F }. a probabilidade pode ser vista como uma medida da possibilidade de ocorrˆncia de um particular evento. Eventos especiais: Evento certo E4 = Ω. e E2 : Dois filhos do sexo feminino E2 = {F F M. N = 0. B = primeiro filho ser do sexo masculino. s˜o mutuamente exclusivos se eles n˜o puderem ocorrer a a simultaneamente. F M F. 375 Deste modo. 125 = 0. Um problema da defini¸ao cl´ssica de e c˜ a c˜ c a probabilidade reside no fato de em sua defini¸ao lan¸ar-se m˜o do conceito de eventos equiprov´veis. E3 : Uma pessoa ter entre 20 e 25 anos E3 = {20 ≤ x ≤ 25}. ıvel Eventos mutuamente exclusivos.

P (Ac ) = 1 − P (A). • A3 : P (A ∪ B) = P (A) + P (B) se os eventos A e B forem mutuamente exclusivos. pode-se enunciar e demonstrar os seguintes teoremas. dada pelos seguintes axc˜ a iomas. • A1 : P (A) ≥ 0. atribu´ ıdos a Kolmogorov: ` Axiomas de Kolmogorov. A2 e A3. que ser˜o muito uteis no c´lculo de probabilidades a ´ a T1. • A2 : P (Ω) = 1.57 Modernamente adota-se uma defini¸ao axiom´tica. P (φ) = 0 Prova: Ω = Ω∪φ P (Ω) = P (Ω ∪ φ) ← A3 P (Ω) = P (Ω) + P (φ) ← A2 1 = 1 + P (φ) P (φ) = 0 T2. Prova: Ω = A ∪ Ac P (Ω) = P (A ∪ Ac ) ← A3 P (Ω) = P (A) + P (Ac ) ← A2 1 = P (A) + P (Ac ) P (Ac ) = 1 − P (A) . A partir dos axiomas A1. Ac = Acomplementar.

4 Probabilidade Condicionada Ex: Seja o processo aleat´rio de se lan¸ar um dado de seis faces. Qual a probabilidade de que a face superior do dado seja maior ou igual 4. 5. Tem-se que: P (A) = 1 . P (B/A). 6 Sejam ainda os seguintes eventos: Evento A : (f ace superior par) A = 2. 6. 3. 4. P (A ∪ B) = P (A) + P (B) − P (A ∩ B) T4. sabendo-se que ela ´ par? Neste caso quer saber-se qual a probabilidade do evento B. 6. e observar o c o valor num´rico da face superior deste. 2.58 T3. Evento B : (f ace superior maior ou igual a 4) B = 4. e c˜ c˜ c . 5. e a a sabendo-se que o evento A j´ ocorreu. Se j´ sabemos que o evento A ocorreu (que a face superior ´ par). P (B) = 2 1 2 1 e P (A ∩ B) = 3 . P (A ∪ B) = P (A) + P (B) − P (A ∩ B) Prova: Os eventos A e A c ∪ B s˜o mutuamente a exclusivos. e Ω = 1. isto implica numa redu¸ao ou restri¸ao no espa¸o amostral Ω. P (A ∪ B) = P [A ∪ (Ac ∩ B)] = P (A) + P (Ac ∩ B) B = (B ∩ A) ∪ (Ac ∩ B) P (B) = P (B ∩ A) + P (Ac ∩ B) P (Ac ∩ B) = P (B) − P (B ∩ A) Logo. 0 ≤ P (A) ≤ 1 3. 4.

se A e B forem independentes tem-se: P (A ∩ B) P (B) P (A ∩ B) = P (A/B)P (B) ∴ P (A/B) = P (A ∩ B) = P (A)P (B) Ex. a e n˜o altera a probabilidade de ocorrˆncia do outro) se e somente se: a e P (A/B) = P (A) ou P (B/A) = P (B) Deste modo. Ent˜o P (B ∗ ) = 3 . 4. aplicada Estat´ ıstica Computa¸ao c˜ Total Masculino Feminino total 70 15 10 20 115 40 15 20 10 85 110 30 30 30 200 .5 Independˆncia de eventos.1) 3. (f ace superor maior ou igual a 4) a 2 passa a ser: B ∗ = {4. e Dois eventos. a P (B/A) = Defini¸ao: c˜ P (A∩B) P (A) = 1 3 1 2 = 2 3 P (B/A) = P (A ∩ B) P (A ∩ B) e P (A/B) = P (A) P (B) (3. pura Mat. A e B s˜o considerados independentes (a ocorrˆncia de um. 6}. Considere o quadro a seguir. 6} e evento em quest˜o. representativo da distribui¸ao dos alunos c˜ matriculados num determinado Instituto de matem´tica: a sexo Curso Mat.59 que passa a ser: ω ∗ = {2.

5 1 . do sexo feminino ´ e P (F ) = 85 200 = 0. 200 e. do curso de Mat. e retira-se uma ´ bola desta. Considere 5 urnas exatamente iguais. Pura ´ e P (F ∩ P ) = 40 200 = 0. 2 . do curso de Mat. a a 3. 575 b.60 Observando-se os dados acima verifica-se que a probabilidade de um aluno aleatoriamente escolhido ser: a.425 P (F ∩P ) P (F ) = 0. do sexo feminino e fazer Mat. (tipo C2 ) tˆm 2 bolas brancas e e e a ultima. 5 P (B/C1 ) = P (C2 ) = P (B/C2 ) = P (C3 ) = . Qual a probabilidade de que a urna escolhida seja do tipo C3 . duas outras. 5 1 . Duas destas urnas. do sexo masculino ´ e P (M ) = 115 200 = 0. 3 1 . (tipo C1 ) tˆm 3 bolas brancas. 550 d. 4706 Como P (P ) = P (P/F ) conclui-se que os eventos sexo e curso no qual o aluno esta matriculada n˜o s˜o independentes. 2 2 . 425 c. dado que ´ do sexo feminino ´ e e P (P/F ) = P (P/F ) = 40 85 = 0.200 0. 4706 ou = 0. Pura ´ e P (P ) = 110 200 = 0. Pura.6 Teorema de Bayes Ex. sabendo-se que a bola retirada era branca? Esquema: Quer se obter P (C3 /B). (tipo C3 ) tem 6 bolas brancas. sabendo-se que: P (C1 ) = P (B/C3 ) = 1. Escolhe-se uma urna ao acaso. cada uma com 6 bolas.

tem-se: c˜ P (C3 ∩ B P (C3 )P (B/C3 ) = (1) P (B) P (B) P (C3 /B) = Como o numerador ´ conhecido. e reunidos formam o espa¸o amostral completo. necessita-se conhecer P (B). E como C1 . a P (B) = P (C1 ∩ B) + P (C2 ∩ B) + P (C3 ∩ B) = P (C1 )P (B/C1 ) + P (C2 )P (B/C2 ) + P (C3 )P (B/C3 ) 1 2 1 1 2 + + (1) = 5 2 5 2 5 = 8/15(2) Substituindo (2) em (1) 1 (1) 3 P (C3 )P (B/C3 ) 5 P (C3 /B) = = 8 = P (B) 8 5 Generalizando este resultado. a c pode-se decompor o evento B em 3 eventos mutuamente exclusivos: B = (C1 ∩ B) ∪ (C2 ∩ B) ∪ (C3 ∩ B).2: Representa¸ao esquem´tica das urnas contendo 6 bolas cada c˜ a Da defini¸ao de probabilidade condicionada. C2 e e C3 s˜o eventos mutuamente exclusivos. ent˜o.61 Figura 3. tem-se o teorema de Bayes: P (Ci )P (A/Ci ) P (Ci )P (A/Ci ) P (Ci /A) = n i=1 (3.2) .

01) + (0. 16 . e verificando-se que ele n˜o funciona. 04) + (0. da produ¸ao conjunta c˜ a desta companhia. a a e 0. II e III.62 Ex. 03. 01) = (0. a a A probabilidade de que um circuito produzido por estas f´bricas n˜o funcione ´ de 0. 01. 40)(0. respectivamente. 30)(0. 30)(0. 03) = 0. e a A f´brica I produz 40% dos circuitos. qual a probabilidade dele ter sido produzido na f´brica I? a P (I/def eito) = P (I)P (def eito/I) P (I)P (def eito/I) + P (II)P (def eito/II) + P (III)P (def eito/III) (0. 04 e 0. 40)(0. Uma companhia produz circuitos integrados em trˆs f´bricas I. Pegando-se um circuito. ao acaso. enquanto que as f´bricas II e III produzem 30% cada.

a o Uma fun¸ao que associa valores reais aos eventos de um espa¸o amostral ´ c˜ c e definida como uma vari´vel aleat´ria. ca n i=1 = 1 . que pode ser discreta ou cont´ a o ınua. p2 . . 4.1. Se um experimento consiste em verificar o n´mero de componentes u defeituosos. Ex2. sua distribui¸ao ´ caracterizada a a c˜ e por uma fun¸˜o de probabilidade P (X = x). xn com proa o babilidades respectivamente iguais a p1 . .1 Distribui¸oes de Probabilidades c˜ Se uma vari´vel aleat´ria X pode assumir os valores x1 . . 2 ou 3. . a a fun¸ao: c˜ Y = “Altura de um universit´rio”. que pode assumir os valores 0. num sistema formado por trˆs componentes. for discreta. . . pn . a fun¸ao: e c˜ X = “n´mero de componentes defeituosos”.Cap´ ıtulo 4 Vari´veis aleat´rias a o 4. . define uma vari´vel aleat´ria cont´ a a o ınua. que associa probabilidades n˜o nulas aos ca a 63 . x2 . define uma vari´vel aleat´ria u a o discreta. Ex1. 1. . tais que uma distribui¸˜o de probabilidade. tem-se definida Se a vari´vel X em quest˜o. Se um experimento consiste em verificar as alturas de 30 universit´rios.1 Vari´veis Aleat´rias Unidimensionais. que pode assumir quaisquer valores entre 130 e 220cm.

2 Fun¸˜o Reparti¸˜o ou Distribui¸˜o Acumulada F(x) ca ca ca x F (x) = i=1 P (X = x).d.p. somente haver´ interesse na probabilidade de a que a vari´vel assuma valores dentro de determinados intervalos. Ex. (4. 00 Se.64 poss´ ıveis valores da vari´vel aleat´ria.2) para vari´veis aleat´rias cont´ a o ınuas.1) para vari´veis aleat´rias discretas. ∞ −∞ f (x)dx = 1. ii. e a o x F (x) = −∞ f (x)dx. sendo sua distribui¸ao de a c˜ probabilidades caracterizada por uma fun¸˜o densidade probabilidade (f. a vari´vel X for cont´ a ınua. e c˜ 4. Para o caso as alturas dos universit´rios tem-se a 2 1 (x−µ) 1 e− 2 σ 2 .1.). f (x) ≥ 0. f (x). ∀x ∈ . Para o exemplo do n´mero de componentes defeituosos em um sistema u composto por trˆs componentes tem-se: e X P (X = x) 0 1 8 1 3 8 2 3 8 3 1 8 = 1. 2πσ f (x) = √ que ´ a distribui¸ao normal. (4. ca a qual dever´ possuir as seguintes propriedades: a i. a o Ex. Exemplos: .

d. Como f(x) ´ uma fdp tem-se que: e ∞ −∞ 0 −∞ f (x)dx = 1.p):   f (x) = 0 para x < 0    f (x) = kx para 0 ≤ x ≤ 2     f (x) = 0para x > 2 graficamente tem-se: Figura 4. at´ este ponto. a ´ .1: Representa¸ao gr´fica da fun¸ao F(x) anteriormente definida c˜ a c˜ a) Obter o valor de k.65 Seja a seguinte vari´vel aleat´ria cont´ a o ınua. Todavia. definida pela fun¸ao densidade c˜ de probabilidade (f. b) calcular F(1) F (1) = P (X ≤ 1) = = 1 x dx −∞ 2 1 −∞ f (x)dx = 1 4 4. portanto: 0dx + 2 0 2 0 kxdx + ∞ 2 0dx = 1. considerou-se que o a o e resultado do experimento em quest˜o seria registrado como um unico valor x.2 Vari´veis Aleat´rias Bidimensionais a o Para o estudo de vari´veis aleat´rias. 0+k k= 1 2 xdx + 0 = 1.

e S o espa¸o amostral associado a E. observando o resultado da face superior de ambos. Para e tanto. onde : c˜ X= face superior do dado. Exemplo: Seja o experimento de se lan¸ar simultaneamente um dado e uma c moeda. Teremos ent˜o a seguinte a fun¸ao de probabilidade. o c a o a a o Sejam X e Y duas vari´veis aleat´rias. Y = yi ) que associa um valor p(xi . sua fun¸ao de e a o c˜ probabilidade. yi ). representada por P (X = xi . e Y= face superior da moeda X\Y 1 2 3 4 5 6 Cara 1 12 1 12 1 12 1 12 1 12 1 12 Coroa 1 12 1 12 1 12 1 12 1 12 1 12 1 Se (X. o sexo e peso de um rec´m-nascido. que pode ser discreta. yi ) = 1. Y ) deve satisfazer as seguintes condi¸oes: c˜ i. Y ) ´ uma vari´vel aleat´ria bidimensional discreta. Ent˜o (X. faz-se necess´rio a seguinte defini¸ao: a c˜ Sejam E um experimento aleat´rio. diz-se que f (x. P (xi .1 Distribui¸˜o Conjunta de duas vari´veis aleat´rias ca a o Se (X. cont´ ınua ou mista. ii. y) ´ uma fun¸ao densidade de probabilidade conjunta se: e c˜ . Y ) define uma vari´vel aleat´ria bidimensional. yi ) ≥ 0∀(xi . como por exemplo a a observar o peso e altura de uma pessoa. P (xi .66 existem casos em que h´ interesse por dois resultados simultˆneos. etc. Y ) for uma vari´vel aleat´ria bidimensional cont´ a o ınua. yi ) a cada valor do par (X.2. 4.

∀(x. f (x. y) ∈ . e Y= face superior da moeda X= face superior do dado. Distribui¸ao marginal de Y c˜ f (x. y)dxdy = 1. sem considerar Y ou vice-versa.2.4) P (Y = yj ) = i P (xi . e Y= face superior da moeda . y) ≥ 0.3) para vari´veis aleat´rias discretas e a o ∞ −∞ g(x) = para vari´veis aleat´rias cont´ a o ınuas. (4. y)dy.5) para vari´veis aleat´rias discretas e a o ∞ −∞ h(y) = para vari´veis aleat´rias cont´ a o ınuas. yj ). ∞ −∞ ∞ −∞ f (x. e sua distribui¸ao de probabilia o c˜ dade conjunta.67 i.2 Distribui¸˜o Marginal ca Dada uma vari´vel aleat´ria bidimensional.6) Exemplo no exemplo do lan¸amento simultˆneo de um dado e uma moeda c a teremos: X= face superior do dado. ii. f (x. c˜ a que s˜o denominadas distribui¸oes marginais de X e Y respectivamente. (4. (4. y)dx. a c˜ Distribui¸ao marginal de X c˜ P (X = xi ) = j P (xi . (4. 4. yj ). pode-se obter a distribui¸ao da vari´vel X.

ou a o f (x.P (yj )∀ i e j. (4. yj ) = P (xi ).2. para vari´veis aleat´rias cont´ a o ınuas 4. para vari´veis aleat´rias discretas.68 X\Y 1 2 3 4 5 6 P (Y = yj ) Cara 1 12 1 12 1 12 1 12 1 12 1 12 1 2 Coroa 1 12 1 12 1 12 1 12 1 12 1 12 1 2 P (X = xi ) 1 6 1 6 1 6 1 6 1 6 1 6 1 4.3 Vari´veis Aleat´rias Independentes a o Seja (X. (4.h(y)∀ i e j. Y ) uma vari´vel aleat´ria bidimendional. e a o ∞ −∞ E(X) = µ = xf (x)dx.4 Esperan¸a Matem´tica c a A esperan¸a matem´tica de uma vari´vel aleat´ria ou valor esperado. y) = g(x).7) para vari´veis aleat´rias discretas.2. ent˜o as vari´veis X e Y a o a a s˜o independentes se e somente se a P (xi .8) . E(X). c a a o e definida por: E(X) = µ = i xi P (X = xi ).

k = constante. ii. 5 componentes pif ados por sistema.69 para vari´veis aleat´rias cont´ a o ınuas Ex1: Para a vari´vel aleat´ria cont´ a o ınua definida por:   f (x) = 0 para x < 0    f (x) = x para 0 ≤ x ≤ 2 2     f (x) = 0para x > 2 tem-se ∞ −∞ 0 E(X) = = xf (x)dx 2 0dx + 4 unidade 3 −∞ 0 x2 dx + 2 ∞ 2 0dx = Ex2: Para a vari´vel aleat´ria discreta n´mero de componentes pifados tema o u se: X P (X = x) 0 1 8 1 3 8 2 3 8 3 1 8 = 1. iv. 0 E(X) = i xi P (X = xi ) 1 3 3 1 = 0 +1 +2 +3 8 8 8 8 = 1. .E(X). E(X ± k) = E(X) ± k.4. E(kX) = k. E(k) = k.1 Propriedades da Esperan¸a Matem´tica c a i.2. v. iii. 4. E(XY ) = E(X)E(Y ) se X e Y forem independentes. E(X ± Y ) = E(X) ± E(Y ).

V (X) = E[X − E(X)]2 = E{X 2 − 2XE(X) + [E(X)]2 } = E(X 2 ) − 2E(X)E(X) + [E(X)]2 = E(X 2 ) − [E(X)]2 com. e E(X 2 ) = no caso cont´ ınuo. (4. ∞ −∞ (xi − µ)2 f (x)dx. E(X 2 ) = i 2 xi P (X = xi ).8 verifica-se c˜ c a (xi − µ)2 P (X = xi ). Ex1. a a o V (X) = E[X − E(X)]2 = E[X − µ]2 .11) no caso discreto.2.10) a o para vari´veis aleat´rias discretas. (4. Para a vari´vel aleat´ria cont´ a o ınua definida por:   f (x) = 0 para x < 0    f (x) = x para 0 ≤ x ≤ 2 2     f (x) = 0para x > 2 ∞ −∞ x2 f (x)dx. Obs.9) Aplicando-se a defini¸ao de esperan¸a matem´tica (eq 4.70 4. e V (X) = para vari´veis aleat´rias cont´ a o ınuas. que a variˆncia pode ser ent˜o definida como: a a V (X) = i (4.5 Variˆncia de uma vari´vel aleat´ria.7 e 4. .

X) = k 2 V (X). V (X ± Y ) = V (X) ± V (Y ) se X e Y forem independentes. V (k ± X) = V (X). V (k) = 0. iv. . 0 V (X) = E(X 2 ) − [E(X)]2 E(X 2 ) = i x2 P (X = xi ) i 1 3 3 1 = (02 ) + (12 ) + (22 ) + (32 ) 8 8 8 8 = 3 V (X) = 3 − 4.71 tem-se: V (X) = E(X 2 ) − [E(X)]2 E(X 2 ) = = ∞ −∞ 0 x2 f (x)dx 2 0dx + −∞ 0 x3 dx + 2 ∞ 2 0dx = 2 unidade V (X) = 2 − se: X P (X = x) 0 1 8 4 3 2 = 2 unidade2 9 Ex2: Para a vari´vel aleat´ria discreta n´mero de componentes pifados tema o u 1 3 8 2 3 8 3 1 8 = 1.5. ii. iii. k = constante.1 3 2 2 = 3 (componentes pif ados por sistema)2 4 Propriedades da variˆncia a i. V (k.2.

3.2.72 4.3 4. e a o ∞ −∞ ∞ −∞ E(XY ) = para vari´veis aleat´rias continuas. para vari´veis aleat´rias discretas. E(XY ) = i j (4.1 Distribui¸oes de vari´veis aleat´rias discretas c˜ a o Distribui¸˜o Uniforme Discreta ca Enquadram-se aqui as distribui¸oes em que os poss´ c˜ ıveis valores da vari´vel a aleat´ria tenham todos a mesma probabilidade de ocorrˆncia. 4. voltando-se a propriedade iv. a poss´ Ex. com. Y ) = E {[X − E(X)][Y − E(Y )]} = E(XY ) − E(X)E(Y ). Cov(X. Y ). Se X e Y forem independentes.6 Covariˆncia a A covariˆncia mede o grau de dispers˜o conjunta de duas vari´veis aleat´rias. cada um ter´ probabilidade igual a n . Para duas vari´veis aleat´rias quaisquer tem-se: a o V (X + Y ) = V (X) + V (Y ) + 2Cov(X. tem-se que: X P (X = x) 1 1 6 2 1 6 3 1 6 4 1 6 5 1 6 6 1 6 =1 . Por´m o fato de Cox(X. a o xyf (xy)dxdy. Y ) = 0 n˜o implica que X e Y sejam a e a independentes. a a a o Cov(X. das variˆncias. se existem n valores o e 1 ıveis. Y ) = 0.12) xi yj P (X = xi )(Y = yj ). Obs. Seja o lan¸amento de um dado e a vari´vel aleat´ria X = “face superior c a o do dado”. Logo.

a Associando-se uma vari´vel aleat´ria X aos poss´ a o ıveis resultados do experimento. c a • Uma pe¸a produzida por uma Cia. Ent˜o.73 ou P (X = x) = 1/6 4. com a a o c˜ p sendo a probabilidade de ocorrer “sucesso”. a vari´vel aleat´ria X. c • O sexo do primeiro filho de um casal ser masculino ou feminino. E(X) = p (4.13) Parˆmetros caracter´ a ısticos . Ser perfeita ou defeituosa.2 Distribui¸˜o de Bernoulli ca Seja um experimento onde s´ podem ocorrer dois poss´ o ıveis resultados. e q = (1 − p) a probabilidade de ocorrer “fracasso”. a • Um indiv´ ıduo portador de certa doen¸a morrer ou n˜o. • Um consumidor que entra numa loja comprar ou n˜o comprar um produto.3. como por exemplo: • Um jogador de basquete converter ou n˜o converter um arremesso. assim definida tem distribui¸ao Bernoulli. “sucesso” e “fracasso”. de forma que: X=1 X=0 se o resultado for “sucesso” e se o resultado for “fracasso”. Fun¸ao de probabilidade c˜ A fun¸ao de probabilidade da Distribui¸ao de Bernoulli ´ dada por: c˜ c˜ e   q = (1 − p) para x = 0    P (X = x) = p para x = 1     0 para outros valores de x.

Simbolicamente : X ∼ B(n. e Se um experimento atende a todas as condi¸oes acima. deve-se atender as c˜ seguintes condi¸oes: c˜ i. a ii. A probabilidade p de sucesso em cada prova ´ constante. ent˜o a vari´vel aleat´ria X = c˜ a a o n´mero de sucessos obtidos nas n tentativas ter´ uma distribui¸ao Binomial. para um experimento se enquadrar na distribui¸ao Binomial. p) . Cada tentativa ´ uma prova de Bernoulli (s´ podem ocorrer dois poss´ e o ıveis resultados).3 Distribui¸˜o Binomial. ca ´ E a mais importante das distribui¸oes de probabilidades discretas.3. Sendo c˜ que. S˜o realizadas n provas (tentativas) independente. iii.74 Prova: E(X) = xi P (X = xi ) = 1p + 0(1 − P ) = p V (X) = pq Prova: V (X) E(X 2 ) = = = ∴ V (X) = = = pq p − p2 P (1 − p) p E(X 2 ) − [E(X)]2 x2 P (X = xi ) i 4. com n tenu a c˜ tativas e p (probabilidade de sucesso).

Sabendo-se que a probabilidade de um determinado casal gerar um filho com olhos azuis ´ de 1 .75 Fun¸ao de Probabilidade c˜ x P (X = x) = Cn px q n−x . qual a probabilidade de que dentre trˆs filhos deste casal. e e 4 .14) com x Cn = n! . x!(n−x)! p = probabilidade de “sucesso”. q = 1 − p = probabilidade de “fracasso” Parˆmetros caracter´ a ısticos E(X) = np V (X) = npq prova: n E(X) = x=0 n xP (X = x) x xCn px q n−x x=0 n = = x=0 n x n! px q n−x x!(n − x)! = x=1 n−1 n! px q n−x fazendo s = x − 1 (x − 1)!(n − x)! n (n − 1)! p(s+1) q n−(s+1) s!(n − 1 − s)! s C(n−1) p(s+1) q n−(s+1) = = n = np s=0 n−1 s=0 n−1 s C(n−1) ps q (n−1)−s s=0 = np Exemplos: Ex1. (4.

76 a) Nenhum tenha olhos azuis. P (trˆs com olhos azuis) = P (AAA) = e 1 . e Ser˜o considerados dois m´todos para resolu¸ao deste exemplo: a e c˜ 1o M´todo . P (um com olhos azuis) = P (EEA ∪ EAE ∪ AEE) = c. a probabilidade de cada um dos eventos do espa¸o amostral ´: c e P (EEE) = P (EEA) = P (EAE) = P (AEE) = Assim. P (dois com olhos azuis) = P (EAA ∪ AAE ∪ AEA) = d.pela defini¸ao de probabilidades: e c˜ Espa¸o amostral: c   EEE       EEA Ω=  EAE       AEE   EAA      AEA   AAE      AAA  Uma vez que a cor dos olhos de um filho independe da cor dos olhos dos demais (s˜o a eventos independentes). P (N enhum com olhos azuis) = P EEE = 27 . 64 9 .utilizando a fun¸ao de probabilidade binomial: e c˜ 1 X ∼ B(3. 4 ) . 64 + + 9 64 3 64 + + 9 64 3 64 = = 27 . d) Os Trˆs tenham olhos azuis. c) Dois tenham olhos azuis. 64 2o M´todo . b) Um tenha olhos azuis. 64 9 64 3 64 27 64 9 64 9 64 9 64 P (EAA) = P (AEA) = P (AAE) = P (AAA) = 3 64 3 64 3 64 1 64 b. a.

5) = R$4095. P (trˆs com olhos azuis) = P (X = 3) = C3 e 1 1 4 1 2 4 1 3 4 1 0 4 3 2 4 3 3 4 27 . verifica-se que a probabilidade total ´ dada por: C3 p0 q 3 + e 1 2 3 C3 p1 q 2 + C3 p2 q 1 + C3 p3 q 0 que corresponde a expans˜o do binˆmio (p + q)3 da´ o nome a o ı distribui¸ao binomial.77 0 a. 10% das pe¸as produzidas c˜ c s˜o consideradas defeituosas. 0081 b) Qual a probabilidade de haverem duas ou mais pe¸as defeituosas em uma caixa? c P (X ≥ 2) = P (X = 2) + P (X = 3) + P (X = 4) + P (X = 5) = 1 − [P (X = 0) + P (X = 1)] = 0. 64 1 . P (dois com olhos azuis) = P (X = 2) = C3 3 d. 5905 d) Supondo que a empresa pague uma multa de R$10. c O n´mero de caixas com pe¸as defeituosas em um lote de 1000 caixas segue uma u c distribui¸ao binomial com n = 1000 e p = 0. qual o valor esperado desta multa em um lote de 1000 caixas? P (uma caixa ter pe¸a defeituosa) = 1 − P (X = 0) = 0. Num determinado processo de fabrica¸ao. 9)2 = 0. 1) 3 P (X = 3) = C5 (0. P (um com olhos azuis) = P (X = 1) = C3 2 c.00 por caixa que apresente pe¸as c defeituosas. 4095 = 409. c a) Qual a probabilidade de haverem exatamente 3 pe¸as defeituosas numa caixa? X ∼ B(5. 0. 9)5 = 0. 64 = 27 . As pe¸as s˜o acondicionadas em caixas com 5 unidades cada a c a uma. c˜ Ex2. e o valor esperado da multa: E(M ulta) = 10E(Y ) = (10)(409. 64 = = = 3 1 4 3 0 4 0 Deste modo. 64 9 . P (N enhum com olhos azuis) = P (X = 0) = C3 1 b. 00 . 4095. 5 caixas. 0815 c) Qual a probabilidade de uma caixa n˜o apresentar nenhuma pe¸a defeituosa? a c 0 P (X = 0) = C5 (0. c˜ E(Y ) = np = 1000. Assim.0. 1)3 (0. 1)0 (0. 4095.

15) e = 2. a vari´vel e a aleat´ria o X = n´mero de sucessos em um intervalo. como ocorre no caso da u distribui¸ao Binomial. Simbolicamente : X ∼ a c˜ a P (λ) Fun¸ao de Probabilidade c˜ e−λ λx . e • O n´mero de defeitos encontrados em um rolo de arame ovalado.78 4. 7182 (base dos logaritimos neperianos). • O n´mero de acidentes automobil´ u ısticos ocorridos numa rodovia em um mˆs. Parˆmetros Caracter´ a ısticos E(X) = V (X) = λ . e assumindo-se que os sucessos sejam independˆntes. u Note que nos exemplos acima. etc. Em um experimento a com estas caracter´ ısticas. n˜o h´ como determinar-se a probabilidade a a de ocorrˆncia de um sucesso. que pode ser um intervalo de tempo. x! P (X = x) = com (4. u ter´ uma distribui¸ao Poisson. espa¸o. mas sim no n´mero de sucessos ocorridos durante um intervalo c˜ u cont´ ınuo.3. como por e ue e e exemplo dois suic´ ıdios por ano. a qual ser´ que denominada λ.4 Distribui¸˜o de Poison ca A distribui¸ao de Poison ´ empregada em experimentos nos quais n˜o se c˜ e a esta interessado no n´mero de sucessos obtido em n tentativas. mas sim a freq¨ˆncia m´dia de sua ocorrˆncia. com parˆmetro λ. de 500m. Como por exemplo: c • O n´mero de suic´ u ıdios ocorridos em uma cidade durante um ano.

79 Prova: n E(X) = x=0 n xP (X = x) x x=0 n = = x=0 n e−λ λx x! e−λ λx fazendo s=x-1 tem-se: (x − 1)! e−λ λs+1 s! e−λ λs s! = x=0 n = λ x=0 = λ n E(X ) = x=0 n 2 x2 P (X = x) x x=0 n 2e −λ x = = x=0 n λ x! x e−λ λx fazendo s=x-1 tem-se: (x − 1)! e−λ λs+1 s! e−λ λs s! n = = λ = λ (s + 1) x=0 n (s + 1) x=0 n s x=0 e−λ λs e−λ λs + s! s! x=0 = λ [λ + 1] = λ2 + λ .

submetidos a este soro. X = n´mero de chamadas por dia u Y = n´mero de chamadas por semana u E(X) = λ = 3 chamadas por dia → E(Y ) = λ∗ = 7E(X) = 21 chamadas por semana P (Y = 20) = 4.80 V (X) = E(X 2 ) − [E(X)]2 = λ2 + λ − λ 2 = λ Exemplo: O Corpo de Bombeiros de uma determinada cidade recebe. Na e c˜ pr´tica. 1353. 01) → E(X) = n. c) 20 chamadas em uma semana. Determinar a probabilidade de entre c˜ e 200 indiv´ ıduos. c˜ e X ∼ B(200. tende para uma distribui¸ao de Poisson. E(X) = np. ca ca Pode-se demonstrar que uma distribui¸ao Binomial.01.p = 200x0. . ent˜o λ = E(X) = c˜ a np Exemplo: A probabilidade de um indiv´ ıduo sofrer uma rea¸ao al´rgica. a c˜ e Aproxima¸ao: Sabe-se que se X ∼ B(n.4. a aproxima¸ao ´ considerada boa quando n ≥ 50 e p ≤ 0. Aproxima¸˜o da distribui¸˜o Binomial a Poisson.1 e−21 212 0 20! = 0. p). 10. 0498. rec˜ e sultante da inje¸ao de determinado soro ´ de 0. 0. Qual a probabilidade de receber: e a) 4 chamadas num dia X P (3) P (X = 4) = e−3 34 4! = 0. 3 chamadas por dia. b) Nenhuma chamada em um dia P (X = 0) = e−3 30 0! = 0. 01 = 2 = λ P (X = 2) e−2 20 0! = 0. 1680. em m´dia. nenhum sofrer esta rea¸ao al´rgica. cujo evento de interesse c˜ ´ raro (p muito pequeno e n muito grande). 0867.3.

com parˆmetro p (probabilidade a c˜ e a de sucesso) . com p = probabilidade de “sucesso”. Suponha-se c˜ que o experimento seja repetido at´ que ocorra o primeiro sucesso (o sexo do filho seja e feminino). Simbolicamente X ∼ G(p). dever˜o ocorrer k − 1 fracassos antes e c˜ a que o experimento seja encerrado. Fun¸ao de Probabilidade c˜ Como o experimento ser´ repetido at´ que se obtenha o primeiro sucesso.3. a a probabilidade de que a vari´vel aleat´ria a o X = n´mero de repeti¸oes at´ se obter o primeiro sucesso ´ u c˜ e e P (X = x) = pq x−1 . E. que em cada repeti¸ao seja independente das u c˜ demais e que a probabilidade de sucesso p em cada repeti¸ao seja constante.81 4.5 Distribui¸˜o Geom´trica ca e Suponha-se um experimento. e a e considerando que esse ocorra na k-´sima repeti¸ao. no qual esteja-se interessado apenas na ocorrˆncia ou n˜o de um determinado evento. Assim. q = 1 − p = probabilidade de “fracasso” Parˆmetros caracter´ a ısticos E(X) = V (X) = Prova: 1 p q p2 (4. como por exemplo o sexo do filho de uma e a determinada mulher ser feminino.16) . a a o u e Ent˜o a vari´vel aleat´ria: X = n´mero de tentativas at´ que se obtenha o primeiro sucesso. seguir´ uma distribui¸ao geom´trica. assim como na distribui¸ao binomial. que esse experc˜ imento seja repetido um n´mero n de vezes.

) = p dq dq 1 − q 1(1 − q) − (−1)q dq(1 − q) − d(1 − q)q =p p (1 − q)2 (1 − q)2 1 1 p =p 2 2 (1 − q) p 1 p Obs: a permuta da deriva¸ao e do somat´rio ´ v´lida aqui.82 ∞ x=1 ∞ E(X) = = xP (X = x) xpq x−1 =p ∞ x=1 xq x−1 ∞ x=1 = p = = = = x=1 ∞ x=1 d d x q =p dq dq qx d d q p (q 1 + q 2 + . . porque a s´rie c˜ o e a e converge quando |q| < 1. 2 ∞ x=1 ∞ E(X ) = = x2 P (X = x) x pq 2 x−1 =p ∞ x2 q x−1 qx = p = = = = x=1 ∞ x=1 d x d q =p dq dq x=1 ∞ x=1 d q d p (q 1 + q 2 + . . . . ) = p dq dq 1 − q dq(1 − q) − d∂(1 − q)q 1(1 − q) − (−1)q p =p (1 − q)2 (1 − q)2 1 1 p =p 2 2 (1 − q) p 1 p Exemplo: .

a probabilidade de c˜ que o r-´simo sucesso ocorra na k-´sima repeti¸ao do experimento ´ dada por: e e c˜ e .83 Um casal com problemas para engravidar. ent˜o a a e e a vari´vel X = n´mero de tentativas at´ se obter o r-´simo sucesso seguir´ a distribui¸ao a u e e a c˜ de Pascal. 8)2 = 0. A eficiˆncia da referida t´cnica ´ c˜ e e e de 0. 128 b) Qual o custo esperado deste casal para obter o primeiro filho? E(X) = 1 p 1 = 0. Dado que a probabilidade de ocorrˆncia de sucesso. 2 = 5 Custo esperado = 5 ∗ 2000. e sendo estes dois eventos independentes. 00. c˜ a) Qual a probabilidade de que o casal obtenha ˆxito na terceira tentativa? e P (X = k) = pq k−1 = (0. 2)(0. Fun¸ao de Probabilidade: c˜ Para que o r-´simo sucesso ocorra na k-´sima tentativa. c˜ e numa dada repeti¸ao do experimento ´ dada por p e a probabilidade de ocorrerem r − 1 c˜ e sucessos em k − 1 repeti¸oes. recorreu a uma t´cnica de inseme ina¸ao artificial no intuito de conseguir o primeiro filho. ´ necess´rio que e e e a ocorra um sucesso nesta tentativa (repeti¸ao do experimento) e que tenham ocorrido r − 1 c˜ sucessos nas k−1 repeti¸oes anteriores. 20 e o custo de cada insemina¸ao U $2000. e conc˜ c˜ e siderando que o experimento ser´ repetido at´ que se obtenha o r-´simo sucesso.3. 00 4. 00 = U $10000.6 Distribui¸˜o Pascal (Binomial Negativa) ca Nas mesmas condi¸oes em que foi definida a distribui¸ao geom´trica.

84

P (X = k) = pC(k−1) pr−1 q (k−1)−(r−1) ; = C(k−1) pr q k−r , k ≥ r; em que: p = probabilidade de “sucesso”; q = 1 − p = probabilidade de “fracasso” Parˆmetros caracter´ a ısticos E(X) = V (X) = Prova: De acordo com Meyer (1969) a esperan¸a e variˆncia da distribui¸ao Pascal c a c˜ podem ser obtidas do seguinte modo: Sejam as vari´veis: a
r p rq p2 (r−1)

(r−1)

(4.17)

Z1 = n´mero de repeti¸oes necess´rias at´ o primeiro sucesso u c˜ a e Z2 = n´mero de repeti¸oes necess´rias entre o primeiro sucesso u c˜ a . . . e o segundo, inclusive . . .

Zr = n´mero de repeti¸oes necess´rias entre o (r-1) sucesso e o r-´simo sucesso, u c˜ a e inclusive

´ E imediato verificar que todas as vari´veis Zi s˜o independentes e possuem a a distribui¸ao geom´trica. Assim, c˜ e

85

E(Y ) = E(Z1 + Z2 + · · · + Zr ) = E(Z1 ) + E(Z2 ) + · · · + E(Zr ) 1 1 1 + + ··· + = p p p r = p de modo an´logo: a

V (Y ) = V (Z1 + Z2 + · · · + Zr ) = V (Z1 ) + V (Z2 ) + · · · + V (Zr ) q q q = 2 + 2 + ··· + 2 p p p rq = 2 p

4.3.7

Distribui¸˜o Hipergeom´trica ca e
Considere um conjunto de N elementos, r dos quais tˆm uma determinada e

caracter´ ıstica (r ≤ N ), e que destes N elementos ser˜o extra´ a ıdos n elementos sem reposi¸ao c˜ (n ≤ N ). A vari´vel aleat´ria X = n´mero de elementos com a referida caracter´ a o u ıstica, a c˜ e c˜ que estar˜o entre os n retirados, segue uma distribui¸ao hipergeom´trica, cuja fun¸ao de probabilidade ´ derivada diretamente da defini¸ao cl´ssica de probabilidade. e c˜ a Fun¸ao de probabilidade: c˜
x n−x Cr CN −r P (X = x) = n CN

(4.18)

Parˆmetros caracter´ a ısticos: Fazendo
r N

=pe

N −r N

= q tem-se: E(X) = np (4.19)

V (X) = npq

N −n N −1

(4.20)

86 Exemplo: No fich´rio de um hospital, est˜o arquivados os prontu´rios dos de 20 paa a a cientes, que deram entrada no PS apresentando algum problema card´ ıaco. Destes 5 sofreram infarto. Retirando-se uma amostra ao acaso de 3 destes prontu´rios, qual a probaa bilidade de que dois deles sejam de pacientes que sofreram infarto?

P (X = 2) = = = =

2 3−2 C5 C20−5 C 2 03 2 1 C5 C15 C 2 03 (10)(15) 1140 0, 1315

4.3.8

Distribui¸˜o Multinomial ca
Considere um experimento com as seguintes caracter´ ıticas:

a i. S˜o realizadas n provas independentes; ii. Cada prova admite um unico resultado entre r poss´ ´ ıveis; a iii. As probabilidades pi de ocorrer um determinado resultado s˜o constantes para todas as repeti¸oes do experimento. c˜ Associando a este experimento r vari´veis aleat´rias (X1 , X2 , . . . , Xr ) cada a o uma indicando o n´mero de vezes que ocorreu o resultado nas n repeti¸oes. Ent˜o, a u c˜ a distribui¸ao da vari´vel multi dimensional (X1 , X2 , . . . , Xr ) ´ chamada distribui¸ao multic˜ a e c˜ nomial. Fun¸ao de probabilidade c˜

P (X1 = x1 ; X2 = x2 ; . . . ; Xr = xr ) = Exemplo:

n! p x1 p x2 . . . p xn n x1 !x2 ! . . . xn ! 1 2

(4.21)

87 Em um determinado cruzamento entre duas plantas de milho.4 4. qual a probabilidade de o que se obtenham respectivamente 2.4.23) (4. 25)3 2!5!3 = 0. 25. mm = 3) = 10! (0.1 Distribui¸oes de vari´veis aleat´rias cont´ c˜ a o ınuas Distribui¸˜o Uniforme ca A fun¸ao densidade probabilidade da distribui¸ao uniforme cont´ c˜ c˜ ınua ´ dada e por:   1 b−a f (x) = para a ≤ x ≤ b (4.24) (b − a)2 12 . 50 o e o e com gen´tipo mm 0.22) ´ a E f´cil verificar que que a equa¸ao 4. De 10 descendentes deste cruzamento. 0. 0769 4.22 e uma fun¸ao densidade probabilidade c˜ c˜ pois: ∞ −∞ a b  0 para outos valores de x (pov) f (x)dx = −∞ 0dx + a = 0+ = 1 (b − a) = 1 b−a b 1 x +0 b−a a 1 dx + b−a ∞ b 0dx Parˆmetros caracter´ a ısticos E(X) = V (X) = a+b 2 (4. com gen´tipo M m. M m e mm? o P (M M = 2. 50)5 (0. 5 e 3 indiv´ ıduos com gen´tipos M M . a probabilidade de se obter uma planta com gen´tipo M M ´ igual a 0. 25. M m = 5. 25)2 (0.

2 Distribui¸˜o Normal ca ´ E a mais importante das distribui¸oes de probabilidades cont´ c˜ ınuas.88 Prova: E(X) = = −∞ ∞ −∞ a xf (x)dx b x0dx + a x 1 x2 b +0 b−a 2 a b2 − a 2 (b − a)(b + a) = = 2(b − a) 2(b − a) b+a = 2 = 0+ 1 dx + b−a ∞ b x0dx E(X 2 ) = = ∞ −∞ a x2 f (x)dx b x 0dx + −∞ a 2 1 b−a 3 3 b − a3 = 3(b − a) = 0+ x3 b a 1 dx + x b−a 2 ∞ b x2 0dx +0 V (X) = E(X 2 ) − [E(X)]2 = = = = b3 − a 3 b+a − 3(b − a) 2 3 3 (b + a)2 4(b3 − a3 ) − 3(b + a)2 b −a − = 3(b − a) 4 12(b − a) 3 2 2 3 (b − a)3 b − 3ab + 3a b − a = 12(b − a) 12(b − a) 2 (b − a) 12 2 4. tendo grande aplica¸ao em pesquisas cient´ c˜ ıficas e tecnol´gicas. Pois. a maioria das vari´vies o a .4.

2: Distribui¸ao normal. que garante que a distribui¸ao e c˜ c˜ e c˜ c˜ amostral das m´dias segue uma distribui¸ao normal. a a Fun¸ao Densidade Probabilidade c˜ A fun¸ao densidade probabilidade normal ´ dada por: c˜ e 1 x−µ 2 1 e− 2 ( σ ) f (x) = √ 2πσ (4. como ser´ visto mais adiante. como a Binomial. seguem esta distribui¸ao. independentemente da distribui¸ao da vari´vel em estudo. π e e s˜o as constantes 3. para esta. E sim´trica em rela¸ao ao ponto x = µ. e c˜ .25) em que: a a e a µ e σ s˜o os parˆmetros m´dia e desvio padr˜o respectivamente. e o realizados sobre a m´dia de uma popula¸ao qualquer. a e c˜ c˜ e o Teorema do Limite Central (TLC) que ´ a base das estimativas e testes de hip´teses. a O gr´fico da fun¸ao normal ´ dado por: a c˜ e Figura 4. aliado ao fato da facilidade e boa c˜ precis˜o que ´ obtida na aproxima¸ao de outras distribui¸oes.1415 e 2.7182 respectivamente. a Gr´fico. c˜ Propriedades. ´ i.89 cont´ ınuas de interesse pratico.

2. A dificuldade para se processar esse tabelamento se prendeu na infinidade de valores que µ e σ poderiam assumir. dada por ´ f (x)dx = 1 representa a probabilidade da vari´vel X assumir um valor entre a e b. 1). e a v.z definida a por:z = x−µ σ . o c˜ Sendo a fun¸ao 4. σ 2 ) 4. Nestas condi¸oes teria que se dispor de uma tabela c˜ para cada uma das infinitas combina¸oes de µ e σ. iv.25 uma fun¸ao densidade de probabilidade (fdp). Portanto.90 ii. em que a ¡ b. Nota¸ao c˜ X ∼ N (µ. que seriam obtic˜ dos por meio da integra¸ao da fun¸ao densidade probabilidade normal num determinado c˜ c˜ intervalo. procurou-se tabelar os valores de probabilidade. o c´lculo de probabilidades via distribui¸ao normal a c˜ envolve a solu¸ao de integrais que n˜o s˜o nada triviais. ou padronizada. que n˜o sofresse a influencia destes parˆmetros (µ c˜ a a e σ). Tem forma campanular (sino). a Deste modo. m´dia. Assim. ca Como pode-se notar. Procurou-se. area c˜ c˜ ´ compreendida entre a curva e eixo x ´ igual a 1. a area sob a curva entre os pontos a e b. de m´dia zero e desvio padr˜o um. z ∼ N (0. Em virtude da grande aplica¸ao c˜ a a c˜ da distribui¸ao normal. iii.4. mediana e moda se confundem no ponto de m´ximo e c˜ e a da curva (x = µ). E assint´tica em rela¸ao ao eixo das abicissas. por isso. ou seja e b a ∞ −∞ f (x)dx = 1. pois a a f (x)dx = 0. As trˆs medidas de posi¸ao. em uma distribui¸ao norc˜ c˜ mal reduzida. Fica perfeitamente definida conhecendo-se a m´dia e o desvio padr˜o. ´ imediato verificar que probabilidade de um ponto qualquer ´ e e nula. obter uma c˜ nova forma para a distribui¸ao normal. O problema foi solucionado mediante o emprego de uma nova vari´vel. Tem dois pontos de inflex˜o em x = µ ± σ. a ´ vi.1 Distribui¸˜o Normal Reduzida ou Padronizada. e a . que transforma todas as distribui¸oes normais.

c˜ e a a) Qual a probabilidade de um pneu aleatoriamente escolhido durar mais de 75000Km? Sabe-se que X ∼ N (60000. em quilˆmetros rodados. Desta forma. para um valor de x = µ c˜ numa distribui¸ao normal qualquer. e assim por diante. 5 − 0. na distribui¸ao normal c˜ c˜ reduzida. 3413 + 0. para qualquer que seja a a curva correspondente a uma distribui¸ao normal. ´ uma vari´vel normal c˜ o e a com dura¸ao m´dia 60000Km e desvio padr˜o 10000Km. corresponde o valor:z = 0.91 utilizamos apenas uma tabela para o c´lculo de probabilidades. Exemplo: 1. 3413 = 0. 6826 75000−60000 10000 x−µ σ = 15000 10000 = 1.3: Utilizando-se a transforma¸ao: c˜ z= tem-se: que o valor x = 75000 equivale a z = portanto. 5) = 0. 100002 ) e deseja-se obter: P (X ≥ 75000) =? Figura 4. P (X ≥ 75000) = P (z ≥ 1. 5. Para x = µ + σ tem-se z = 1. . 0668 b) Qual a probabilidade de um pneu aleatoriamente escolhido durar entre 50000km e 70000km? P (50000 ≤ X ≤ 70000) =? P (50000 ≤ X ≤ 70000) = P (−1 ≤ z ≤ 1) = 0. A dura¸ao de um certo tipo de pneu. 4332 = 0.

De quantos c˜ ` quilˆmetros deve ser este prazo.92 Figura 4. 30 ≥ z ≥ 1) = 0. 01 z : P (Z ≤ z) = 0. 33 = x−60000 10000 ⇒ x = 36700km . o pneu seja trocado.6: x : P (X ≤ x) = 0. 01 = −2. 2234 d) Qual a probabilidade de um pneu aleatoriamente escolhido durar exatamente 70000km? P (X = 70000) = P (z = 0) = 0 e) O fabricante deseja fixar prazo de garantia. de tal modo que. em quilˆmetros.4: Figura 4. o se a dura¸ao do pneu for inferior a garantia. 3413 + 0. 33 z= x−µ σ ⇒ −2. 1179 = 0. para que somente 1% dos pneus sejam trocados? o Figura 4.5: c) Qual a probabilidade de um pneu aleatoriamente escolhido durar entre 63000km e 70000km? P (63000 ≥ X ≥ 70000) = P (0.

3 Distribui¸˜o Exponencial ca Em um processo de Poison. Cuja fun¸ao densidade probabilidade ´ dada por: c˜ c˜ e f (t) = λe−λt . num certo per´ ıodo de tempo. t ≥ 0 (4. que c˜ a representa o intervalo decorrido entre dois sucessos consecutivos.26) Figura 4. como por exemplo contar o n´mero de carros que passam por um determinado u ponto de uma estrada. Assim. tal que o n´mero de a e u sucessos em um determinado intervalo t segue uma distribui¸ao de Poison com m´dia c˜ e µ = λt). Ent˜o para que T seja maior que um t qualquer ´ preciso que a e o pr´ximo sucesso demore mais do que t para ocorrer. o P (t > t) = P (0 sucessos em t) = e−λt a fun¸ao parti¸ao no ponto t ser´: c˜ c˜ a .93 4. A distribui¸ao da vari´vel T . com parˆmetro λ (isto ´. ´ conhecida como Dise tribui¸ao Exponencial.4.7: Distribui¸ao exponencial. c˜ Prova: Por defini¸ao a vari´vel T representa o tempo decorrido entre dois sucessos c˜ a em um processo de Poison.

8647 = R$ 16.28) tf (t)dt = 0 ∞ tλe−λt dt Certo tipo de fus´ tem dura¸ao de vida que segue uma distribui¸ao expoıvel c˜ c˜ nencial com vida m´dia de 100 horas.00. obt´m-se a fun¸ao densidade c˜ c˜ c˜ e c˜ probabilidade: f (t) = dF (t) = λe−λt para t ≥ 0 dt = 0 para t < 0 Parˆmetros caracter´ a ısticos: M´dia: e 1 λ 1 λ2 E(t) = Variˆncia a V (t) = Prova: E(t) = = Exemplo: 1 λ ∞ −∞ (4.94 F (t) = P (T ≤ t) = 1 − e−λt Derivando-se a fun¸ao parti¸ao em rela¸ao a t.27) (4. existe um custo adicional de R$8.E(custo) = 10. e se durar e ıvel menos de 200 horas. dura mais de 150 horas? l=? M´dia :m(t)= e b) Qual o custo esperado dos fus´ ıveis custo= P(T ¡ 200) = 1 . aleatoriamente escolhido.1353 + 18.0.92 . Cada fus´ tem um custo de R$10.0.00. a) Qual a probabilidade de um fus´ ıvel.

sendo muito empregada em estat´ ıstica n˜o param´trica. Para n inteiro positivo. 5 e 10 graus de liberdade c˜ Esperan¸a: c E(χv ) = v.4 Distribui¸˜o Qui-Quadrado ca A distribui¸ao de χ2 (lˆ-se qui-quadrado) ´ um caso particular da distribui¸ao c˜ e e c˜ gama. utilizada para verifica¸ao od ajuste de modelos probabil´ c˜ ısticos te´ricos a um conjunto o de dados observados segue tal distribui¸ao. c˜ A fun¸ao densidade de probabilidade ´ dada por: c˜ e x v 1 x( 2 −1) e−( 2 ) v Γ( 2 ) f (x) = em que: 2 (v) 2 (4.4.95 4.29) v s˜o os graus de liberdade.8: Distribui¸oes Qui-Quadrado com 1. uma vez que a estat´ a e ıstica χ2 . a Γ(n) ´ a fun¸ao gama. Γ(n) = (n − 1)! e c˜ Figura 4. Variˆncia: a V (χv ) = 2v .

32) Caracter´ ısticas: i.96 4.4. n−1 x−µ ¯ s √ n (4. Variˆncia: a V (t) = v v+2 x2 1+ v − v+1 2 (4.30) demonstrar que: Z= x−µ ¯ σ √ n Suponha-se que o parˆmetro σ em 4.30 seja substitu´ por seu estimador a ıdo n˜o tendencioso a s2 = Assim a eq. como pode ser observado na figura 4. pode-se ∼ N (0.9 lim f (t) = z v→inf .31) Pode-se demonstrar que que a vari´vel t. De modo semelhante. 4.5 Distribui¸˜o t de Student ca Viu-se que a vari´vel z = a x−µ σ ∼ N (0. cuja fun¸ao densidade probabilidade ´: c˜ e Γ v+1 2 f (x) = v √ Γ( 2 ) πv em que: v s˜o os graus de liberdade.30 ficar´: a t= (xi − x) ¯ .31 segue uma distribui¸ao t de a c˜ student com v = n − 1 graus de liberdade. ´ sim´trica em rela¸ao ao ponto x = 0 (m´dia) e e c˜ e ii. e c˜ Esperan¸a: c E(t) = 0. t tende para z.4. a Γ() ´ a fun¸ao Gama. se v tende para infinito. 1) (4. 1).

pois. v2−2 Variˆncia: a V (F ) = 2v22 (v1+v2−2) v1(v2−4)(v22 ) 4.4. quando n for grande. 4. o erro cometido ser´ tanto c˜ c˜ ` a menor quanto maior for n e mais pr´ximo de o 1 2 for p (probabilidade de sucesso). u c˜ a tais c´lculos tornam-se demorados e tedioso e uma boa aproxima¸ao torna-se util.33) Esperan¸a: c E(F ) = v2 .7 Aproxima¸˜o da Distribui¸˜o Binomial ` Normal ca ca a Os problemas relacionados com a distribui¸ao Binomial s˜o f´ceis de serem c˜ a a resolvidos desde que o n´mero de repeti¸oes (n) n˜o seja grande. Alguns autores afirmam que a aproxima¸ao ´ considerada boa quando np 5.4.9: Distribui¸oes t de student com 5 e 30 graus de liberdade e distribui¸ao normal c˜ c˜ padronizada. Como a Distribui¸ao c˜ e c˜ . Quando a c˜ ´ se utiliza a aproxima¸ao da distribui¸ao Binomial a Normal.6 Distribui¸˜o F de Snedcor ca Γ( v1+2 ) f (x) = v1 2 v2 Γ( 2 )Γ( 2 ) v1 v2 ( v1 ) 2 x( v1−2 ) 2 v1 1 + ( v2 )y ( v1+v2 ) 2 (4.97 Figura 4.

07 ≤ z ≤ 0.10: Distribui¸ao F. 07) = 0. chamada corre¸ao para descontinuidade da curva. com 10 graus de liberdade para o numerador e 20 para o c˜ denominador. Assim. e a Normal cont´ e ınua . 95) = 47. 5 ≤ X ≤ 50.p = (1000)(0. ao realizar-se a aproxima¸ao deve-se fazer c˜ uma corre¸ao. 5 e xi − 0. 0. qual a probabilidade de que em um dia sejam a a e produzidos: a) 50 chips defeituosos? X B(1000. 05)(0. 5 ≤ X ≤ xi + 0. P (X = xi ) pela Binomial ´ aproximada para P (x − i − 0. 05) = 50 chips e Variˆncia =V (X) = npq = (1000)(0. 5% c˜ dos chips produzidos s˜o considerados defeituosos. 05) M´dia =E(X) = n.98 Figura 4. Binomial ´ discreta. 0558 b) menos que 50 chips defeituosos . Sabendo-se que a produ¸ao di´ria a c˜ a da f´brica em quest˜o ´ de 1000 chips. 5) = P (−0. que consiste em supor c˜ c˜ ıda distribu´ entre xi + 0. 5 chip2 a P (X = 50) P (49. 5) e na Distribui¸ao Normal c˜ Exemplo. Em um determinado processo de produ¸ao de chips para computador. 5 a probabilidade concentrada em xi .

99 P (X ≤ 50) P (X ≤ 50. 07) = 0. 5279 . 5) = P (z ≤ 0.

Parˆmetro: ´ uma medida associada a uma caracter´ a e ` ıstica populacional Ex: M´dia e (µ). Ex: M´dia (¯).1 Introdu¸˜o. temos que lan¸ar m˜o do processo o c a 100 .Cap´ ıtulo 5 Amostragem 5. ca Defini¸oes c˜ i. Estat´ ıstica: ´ uma medida associada a uma caracter´ e ` ıstica amostral. a iv. Popula¸˜o: conjunto de indiv´ ca ıduos com pelo menos uma caracter´ ıstica observ´vel a em comum. etc.1. retirada segundo algumas t´cnicas esc˜ c˜ c˜ e pec´ ıficas. muitas das vezes. como por exemc˜ a plo saber qual o tempo necess´rio para o organismo humano degradar certo composto a qu´ ımico. qual a produ¸ao total de gr˜os de um pa´ num determinado ano. E e c˜ e e a para respondermos a estas quest˜es. qual a altura c˜ a ıs m´dia da popula¸ao brasileira. variˆncia (σ 2 ). Amostra: por¸ao ou fra¸ao da popula¸ao. e x variˆncia (s2 ).1 5. que matem as mesmas caracter´ ısticas de interesse da popula¸ao. ii. c˜ iii. a Um dos principais problemas apresentados na estat´ ıstica ´ o de se fazer e afirma¸oes sobre os parˆmetros populacionais (geralmente desconhecidos). afirmar se um novo composto ´ carciniogˆnico ou n˜o.

´ necess´rio que a e a a amostra utilizada seja representativa da popula¸ao. Esquematicamente tem-se: e c˜ Figura 5. c˜ ii. representativa e da popula¸ao. ´ necess´rio o conhecimento das rela¸oes existentes entre as estimativas obtidas e a c˜ e os valores dos parˆmetros populacionais. a c˜ iii. a partir desta c˜ e a amostra. para que se possa fazer uma inferˆncia segura sobre um e a parˆmetro qualquer. ´ necess´rio conhecer a distribui¸ao a e a c˜ amostral do estimador utilizado. ela deve ser retirada c˜ segundo determinadas t´cnicas de amostragem.1: Representa¸ao esquem´tica do processo de amostragem e inferˆncia. Indispens´vel no estudo de popula¸oes infinitas.101 de amostragem. a i. para fazermos a inferˆncia sobre os parˆmetros populacionais. 5. Indispens´vel em estudos nos quais a coleta de dados implica na destrui¸ao do material a c˜ utilizado. De posse de uma amostra. ou seja.2 Importˆncia do uso de amostras. e para isso. . Conveniente no estudo de popula¸oes grandes.1. c˜ a e Para que o processo anteriormente descrito seja confi´vel. que consiste em estudar apenas uma fra¸ao da popula¸ao (a amostra) e a c˜ c˜ partir desta fazer inferˆncias sobre a popula¸ao.

no momento da coleta da e c˜ o informa¸ao. ou n˜o conseguic˜ a las de todo. para serem uteis. ii. completamente diferente da que existia no momento da coleta dos dados. em rela¸ao a observa¸ao c˜ c˜ de todos os indiv´ ıduos da popula¸ao (censo) s˜o: c˜ a i. realizados pelo governo. pode-se obter resultados suficientemente precisos. as c˜ c˜ despesas s˜o menores do que as oriundas de um censo.102 5. c˜ c˜ ´ o de conhecer a situa¸ao de um determinado fenˆmeno. Se o resultado dessa pesquisa for conhecida muito tempo depois. os levantamentos que se fundamentam na amostragem tem maior amplitude e flexibilidade. Este ´ um fator primordial. c˜ c˜ Se- gundo COCHRAN (1977). Maior amplitude e flexibilidade: Em certos tipos de investiga¸ao. seja c˜ nesse momento. Custo reduzido: Sendo os dados obtidos apenas de uma fra¸ao da popula¸ao. e quando se necessita urgentemente das informa¸oes. c˜ ´ de amostras que representam apenas uma pequena fra¸ao da popula¸ao. Dessa forma. O objetivo de uma investiga¸ao. O censo completo torna-se impratic´vel e e c˜ a resta a escolha entre obter as informa¸oes por meio de uma amostra. Maior exatid˜o: Em virtude de se poder empregar pessoal de melhor qualidade a . usavam amostras de cerca de 100. cuja disponibilidade ´ limitada para a obten¸ao de dados.3 Vantagens do processo de amostragem em rela¸˜o ao ca censo. ou. para que de acordo com a informa¸ao obtida. c˜ iv. nos Estados Unidos. se possa tomar as medidas c˜ c˜ poss´ ıveis para resolver algum problema. tem-se que c˜ utilizar pessoal bem treinado e equipamento altamente especializado. os mais importantes levantamentos peri´dicos. Tratando-se de grandes a popula¸oes.1. relativamente as informa¸oes que podem ser obtidas.000 pessoas. ´ bem poss´ e ıvel que a situa¸ao que se pretendia resolver. Maior rapidez: Os dados podem ser apurados e sintetizados mais rapidamente em uma amostragem do que em uma contagem completa. o aproximadamente uma pessoa em cada 1800. iii. As principais vantagens do processo de amostragem.

dada a redu¸ao no volume de c˜ trabalho. no caso da amostragem a ser sem reposi¸ao. caso a amostragem seja realizada com reposi¸ao. c˜ . as principais s˜o: a – Inacessibilidade a toda a popula¸ao. – Amostragem sistem´tica (AS). n˜o aleat´ria. Independentemente da maneira como a amostra ´ coletada (com ou c˜ e sem reposi¸ao) o importante ´ que os indiv´ c˜ e ıduos que compor˜o a amostra dever˜o ser a a selecionados atrav´s de um processo aleat´rio qualquer (sorteio). proporcionar resultados mais exato que o censo. Os principais tipos de amostragem s˜o: a • Probabil´ ısticas ou aleat´ria: Quando todos os indiv´ o ıduos da popula¸ao tˆm probac˜ e bilidade conhecida e n˜o nula de pertencer a amostra. escolha racional ou escolha justificada: Quando a o alguns indiv´ ıduos da popula¸ao tˆm probabilidade desconhecida ou nula de pertencer c˜ e a amostra. e por se tornar exequ´ ıvel a supervis˜o mais cuidadosa a do campo de trabalho e do processamento de dados. e Ao coletarmos uma amostra podemos faze-la com reposi¸ao ou sem c˜ reposi¸ao. 5. • N˜o probabil´ a ıstica. – Amostragem estratificada (AE). dentre estas se destacam: a – Amostragem simples ao acaso (ASA). a – Amostragem por comglomerados. na realidade. somente nestas e o condi¸oes. uma amostragem pode. o que vai garantir a validade dos testes estat´ ısticos que ser˜o realizados com base nos resultados a destas amostras.103 e intensivamente treinado. um mesmo indiv´ c˜ c˜ ıduo tem chance de pertencer mais de uma vez a amostra. pois. o que n˜o acontece.2 T´cnicas de amostragem. podemos aplicar os modelos probabil´ c˜ ısticos da estat´ ıstica a esta amostra.

Neste caso.2 Amostragem Sistem´tica a ´ E uma simplifica¸ao do processo anterior. Amostragem Simples ao Acaso Esta t´cnica s´ pode ser aplicada em popula¸oes homogˆneas e de tamanho e o c˜ e conhecido. n com N = tamanho da popula¸ao e n = tamanho da amostra at´ se completar o tamanho c˜ e da amostra desejado.2. – Intencional 5.2.1.1.3 Amostragem por Conglomerados Quando uma popula¸ao apresenta uma subdivis˜o natural em grupos c˜ a menores (denominados conglomerados).1.4 Amostragem Estratificada ´ E uma t´cnica utilizada quando a popula¸ao a ser estudada ´ heterogˆnea. os indiv´ o ıduos que compor˜o a amostra. c˜ 5. Neste tipo de a n amostragem podem ser retiradas N n amostras diferentes com reposi¸ao ou CN amostras c˜ diferentes sem reposi¸ao. 5.1 5. T´cnica: Enumera-se todos indiv´ e ıduos da popula¸ao e sorteia-se (por meio de c˜ um dispositivo aleat´rio qualquer).104 – Amostragem sem norma (a esmo). em que: a k= N . apenas o primeiro elec˜ mento da amostra ser´ sorteado. – Popula¸ao formada por material cont´ c˜ ınuo.2. e c˜ e e deste modo. a 5.2.1.2. subdivide-se a popula¸ao em estratos (sub-popula¸oes) que sejam homogˆneos c˜ c˜ e . a a a e com raz˜o k. sorteia-se um n´mero suficiente desses grupos u (conglomerados) e todos os elementos destes v˜o compor a amostra.1 Principais t´cnicas de amostragem probabil´ e ısticas. e os demais ser˜o retirados em uma progress˜o aritm´tica.

e heterogˆneos entre si. quanto a area e n´mero de propriedades a serem amostradas por estrato (classes) ´ u ´ Area (ha) N´mero de Propriedades Amostra estratificada (N=50) u Uniforme 0 20 20 50 50 100 100 200 200 400 Total 500 320 100 50 30 1000 10 10 10 10 10 50 Proporcional 25 16 5 3 1 50 . retiram-se amostras de mesmo tamanho n. independentemente do tamanho do estrato. como um todo ( contenha indiv´ c˜ ıduos de todos os estratos). ii. de modo que a amostra final seja representativa da popula¸ao. Uniforme Quando de K estratos. Proporcional Quando o tamanho da amostra retirado em cada estrato (ni) ´ proporcional ao e tamanho do estrato. Ex. para retirar-se sub-amostras dentro de cada estrato. ´ classificada em: e i. composto por 1000 propriedades rurais. quanto a sua area. e aplica-se uma das t´cnicas de amostragens antee e riormente descritas. conforme a Tabela 1 e que ´ neste munic´ ıpio sejam amostradas 50 propriedades: Tabela 5. distribu´ ıdas. Quanto ao tamanho das sub-amostras retiradas (ni). consideremos um estudo realizados em propriedades rurais de um munic´ ıpio.1: Distribui¸ao do n´mero de propriedades rurais de um munic´ c˜ u ıpio qualquer. Para exemplificar os dois tipos de amostragem estratificada descritos.105 dentro de si.

c˜ c˜ 5. Processo utilizado para se amostrar l´ ıquidos.4 Intencional O pesquisador escolhe deliberadamente certos elementos da popula¸ao para c˜ formar a amostra. Ex.2. 5. baseado num pr´-julgamento. pessoas em uma pra¸a.2.1 Principais t´cnicas de amostragem n˜o probabil´ e a ısticas.2.2.2. muito embora o a amostrador procure ser aleat´rio.2.3 Popula¸˜o formada por material cont´ ca ınuo. embora os que ainda ser˜o produzidos fazem parte a a a da popula¸ao de cigarros produzidos por aquela linha produ¸ao.106 5. S´ tem-se c˜ o acesso aos cigarros que j´ est˜o prontos. Controle de qualidade numa linha de produ¸ao de cigarros.2.2. amostrar peixes em a um lago.2. O pesquisador selecionar´ indiv´ a ıduos com poder aquisitivo m´dio/alto. e Ex. gases ou s´lidos. embora toda a popula¸ao indec˜ pendentemente do poder aquisitivo possa ser consumidora deste produto.3 Distribui¸oes Amostrais c˜ . que s˜o e a os principais consumidores deste produto (publico alvo).2 Amostragem sem norma (a esmo) N˜o se utiliza nenhum sorteio. Inacessibilidade a toda popula¸˜o ca A amostragem ´ realizada na parte da popula¸ao que ´ acess´ e c˜ e ıvel. 5. Pesquisa de mercado para lan¸ar uma nova marca de leite longa vida c tipo A . o Ex.2 5. para identificar a amostra. c 5. Homogenizao se o material a ser amostrado e em seguida colhe-se a amostra. etc. Amostrar 80 frangos num galp˜o com 3000 frangos.

3. uma popula¸ao hipot´tica. a qual segue uma distribui¸ao uniforme discreta como apresentado c˜ a seguir: X P (X = x) 8 1 3 9 1 3 10 1 3 =1 Neste caso tem-se: N = 3. E(X) = µ = 9. para os quais a vari´vel de interesse (X). V (X) = σ 2 = 2 . c˜ tem-se um total de 32 = 9 poss´ ıveis amostras.107 Figura 5.1 Distribui¸˜o amostral da m´dia ca e Considere-se. formada por c˜ e trˆs indiv´ e ıduos.2: Representa¸ao esquem´tica da distribui¸ao amostral de um estimador. 3 5. as quais est˜o apresentadas a seguir: a .1.3. seja a nota final destes indiv´ a ıduos na disciplina estat´ ıstica.1 Amostragem com reposi¸˜o ca Retirando-se todas as poss´ ıveis amostras com reposi¸ao. a t´ ıtulo de exemplo. c˜ a c˜ 5. de tamanho n = 2.

verifica-se que: E(¯) = 9.1 1.108 Figura 5.3 2. c˜ e Amostra 1 2 3 4 5 6 7 8 Indiv´ ıduos 1.5 9 8. 0 = µ e V (¯) = x x = σ2 n .1 2.2 Notas 8e8 8e9 8 e 10 9e8 9e9 9 e 10 10 e 8 10 e 9 x ¯ 8 8.5 9 9.1 3.5 9 9.3 3.5 2 9 n i=1 9 3 9 9.5 2 9 10 1 9 xi P (¯ = xi ) = 9.5 9 3.3 10 e 10 10 A distribui¸ao amostral de x ser´: c˜ ¯ a x ¯ P (¯ = xi ) x ¯ Em que: E(¯) = µx = x ¯ 2 V (¯) = σx = x ¯ 8 1 9 8.2 2.2 1.3: Distribui¸ao das notas de trˆs alunos. 0 ¯ x ¯ − E(¯)]2 P (¯ = xi ) = x x ¯ 1 3 1 3 n x i=1 [¯i Assim.

c˜ ¯ Prova: x= ¯ 1 n n i=1 xi 1 E(¯) = E x n = = = = = n xi i=1 1 E [x1 + x2 + · · · + xn ] n 1 [E(x1 ) + E(x2 ) + · · · + E(xn )] n 1 [µ + µ + · · · + µ] n 1 nµ n µ .109 Figura 5.4: Distribui¸ao amostral de x.

2 10 e 9 9.2 1. σ a ¯ n 5.2 Amostragem sem reposi¸˜o ca Retirando-se todas as poss´ ıveis amostras sem reposi¸ao.5 9 8.3 2. σ c˜ ¯ n N −n N −1 . 0 = µ e V (¯) = x x = σ 2 N −n n N −1 2 Deste modo. .5 1 3 xi P (¯ = xi ) = 9. de tamanho n = 2. as quais est˜o apresentadas a seguir: a tem-se um total de 6 poss´ Amostra 1 2 3 4 5 Indiv´ ıduos 1. c˜ ıveis amostras.5 1 3 n i=1 9 1 3 9.5 9.5 9 6 3.1 Notas 8e9 8 e 10 9e8 9 e 10 10 e 8 x ¯ 8. x ∼ N µ. se amostragem for sem reposi¸ao.1.3 3.110 1 n n V (¯) = V x = = = = = xi i=1 1 V [x1 + x2 + · · · + xn ] n2 1 [V (x1 ) + V (x2 ) + · · · + V (xn )] n2 1 σ2 + σ2 + · · · + µ n2 1 nσ 2 n2 σ2 2 Ent˜o tem-se que: x ∼ N µ.3.5 A distribui¸ao amostral de x ser´: c˜ ¯ a x ¯ P (¯ = xi ) x ¯ Em que: E(¯) = µx = x ¯ 2 V (¯) = σx = x ¯ 8. verifica-se que: E(¯) = 9. 0 ¯ x ¯ − E(¯)]2 P (¯ = xi ) = x x ¯ 1 6 1 6 n x i=1 [¯i Assim.1 2.

Uma popula¸ao ´ considerada finita quando c˜ c˜ c˜ e n N > 0. Quando c˜ tal crit´rio n˜o for satisfeito. o fator de corre¸ao torna-se desprez´ e a c˜ ıvel. podendo.111 O termo N −n N −1 ´ conhecido como fator de corre¸ao para amostragem sem e c˜ reposi¸ao em popula¸oes finitas (ASRPF). portanto ser eliminado. 05 ou seja a amostra representar mais de 5% do tamanho da popula¸ao. .

x2 . a Assim. x2 . x n . que ´ fun¸ao das observa¸oes x1 . .Cap´ ıtulo 6 Inferˆncia e 6. . x3 . Assim. .1 6.1. xn ) de uma vari´vel aleat´ria que a o deve descrever uma caracter´ ıstica de interesse da popula¸ao. . θ. do parˆmetro θ ´ uma vari´vel aleat´ria. Um e a ˆ a e a o e c˜ c˜ estimador. . como por exemplo a m´diaµ = E(x) ou a variˆncia σ 2 = V (x).1 Teoria da estima¸˜o ca Defini¸oes c˜ Estimador Consideremos uma amostra (x1 . x = 70kg ´ uma estimativa da m´dia poupulacional µ. . . ¯ e e s2 = 9kg 2 ´ uma estimativa da variˆncia populacional σ 2 e a Estima¸˜o por ponto e por intervalo. x3 . x 3 . ca 112 . Seja θ um parˆmetro que c˜ a desejamos estimar. . . . x= ¯ s2 = n i=1 xi n ´ um estimador da m´dia poupulacional µ. xn s˜o considerados. x 2 . e e ´ um estimador da variˆncia populacional σ 2 e a n x 2 i=1 (xi −¯) n−1 Estimativa Estimativa ´ o valor num´rico assumido pelo estimador quando os valores e e observados x1 . . .

Deste modo desej´vel que estas estimativas sejam bastantes confi´veis. serem necess´rias para a obten¸ao das estimativas a c˜ pontuais ´ imprescind´ por intervalo. torna-se mais interessante obterse.60 e 1. assim sendo. ou seja obter uma estimativa por a intervalo para o parˆmetro em quest˜o.60 e 1. como por a exemplo ao a altura m´dia de uma amostra de 500 universit´rios ´ x = 1. haja vistas. Os termos n˜o tendencioso. ou ainda existe 95% de confian¸a em se afirmar que a verdadeira c m´dia populacional esteja entre 1. poder´ c˜ a n se obter uma diferente estimativa para µ. o Ex1.76 metros.2 6. 68m. n˜o viesado e imparcial s˜o a a a a sinˆnimos. e a a aliado ao fato de serem obtidas a partir de amostras representativas. a partir.1. e a a para isso ´ necess´rio que os estimadores que as fornecer˜o apresentem boas propriedades. Apesar disto.1.2. σ ). para cada amostra retirada da popula¸ao. 76) = 0. tem-se uma estimativa pontual do parˆmetro populacional. a a ou seja existe 0. como por exemplo P (1.113 Quando a estimativa de um parˆmetro populacional ´ dada por um unico a e ´ valor.:¯ = x n i=1 xi n ´ um estimador n˜o tendencioso da m´dia populacional µ e a e . 60 ≤ µ ≤ 1. Por´m e c˜ a e ¯ sabe-se que x ∼ N (µ. de uma determinada amostra. Deste modo. ´ uma e a e ¯ e estimativa pontual da verdadeira altura m´dia da popula¸ao de universit´rios.76 metros. o uso de estimativas e e ıvel. um intervalo que apresente uma probabilidade conhecida de conter o verdadeiro parˆmetro populacional. desconhecido.1 Propriedades dos Estimadores N˜o tendenciosidade a ˆe Um estimador θ ´ dito um estimador n˜o tendencioso do parˆmetro θ se a a ˆ E(θ) = θ obs. 2 6.95 de probabilidade de que a verdadeira m´dia populacional esteja entre e 1. n˜o viciado. 95.

tem-se: x i=1 (xi − x)2 = ¯ i=1 (xi − µ)2 − n(¯ − µ)2 x .114 prova: E(¯) = E x = = = = = = Ex2.:s2∗ = σ2. prova: n n n n i=1 xi n n 1 E n xi i=1 1 E [x1 + x2 + · · · + xn ] n 1 [E(x1 ) + E(x2 ) + · · · + E(xn )] n 1 [µ + µ + · · · + µ] n 1 nµ n µ ´ um estimador tendencioso da variˆncia populacional e a n x 2 i=1 (xi −¯) i=1 (xi − x) ¯ 2 = i=1 n (xi − µ + µ − x)2 ¯ [(xi − µ) − (¯ − µ)]2 x n n = i=1 n = i=1 (xi − µ) − 2 2 i=1 (xi − µ)(¯ − µ) + x n i=1 (¯ − µ)2 x = como (¯ − µ) ´ uma constante e x e n n i=1 (xi − µ) = n(¯ − µ).

θ1 ´ mais a a a e eficiente que θ2 se: σ2 n n i=1 xi n ´ um estimador consistente da m´dia populacional µ.2. pois e e = 0.3 Eficiˆncia e Se θ1 e θ2 s˜o dois estimadores n˜o tendenciosos de θ. limn→∞ V (x) = limn→∞ ¯ 6. . ˆ ii. E(¯) = µ x ˆ ii. x= ¯ i. verifica-se que s2∗ ´ um estimador tendencioso de σ 2 .2 Consistˆncia.2. ent˜o.1. e ˆe Um estimador θ ´ um estimador consistente do parˆmetro θ se: a ˆ i. UM e estimador n˜o tendencioso ´ facilmente obtido por: a e n 2∗ s = s = n−1 2 n i=1 (x1 − x) 2 ¯ n−1 (6. E s 2∗ = E 1 = n = n i=1 (xi n − µ)2 − n(¯ − µ)2 x n i=1 x E (xi − µ)2 − nE (¯ − µ)2 1 {nV (X) − nV (¯)} x n σ2 1 nσ 2 − n = n n n−1 2 = σ n Deste modo.115 Portanto.1. limn→∞ V (θ) = 0.1) 6. limn→∞ E[θ] = θ.

Fixando-se um n´ de confian¸a (1 − α) vir´: a c˜ ıvel c a P (−z α ≤ z ≤ z α ) = 1 − α 2 2 P (−z α ≤ 2 x−µ ¯ σ √ n ≤ zα ) = 1 − α 2 σ σ P (−¯ − z α √n ≤ −µ ≤ −¯ + z α √n ) = 1 − α x x 2 2 σ σ P (−z α √n ≤ x − µ ≤ z α √n ) = 1 − α ¯ 2 2 σ σ P (¯ + z α √n ≥ µ ≥ x − z α √n ) = 1 − α reorganizando vem x ¯ 2 2 σ σ ¯ P (¯ − z α √n ≤ µ ≤ x + z α √n ) = 1 − α x 2 2 E o intervalo de confian¸a para µ. de um parˆmetro θ. c como ser´ visto a seguir.1.1. 1).3) .2) 6.1 Intervalo de confian¸a para a m´dia µ c e a Variˆncia conhecida Sabe-se que x ∼ N (µ.1.θ2 = (6. e (6. σ ).3. assim a vari´vel z = a ¯ n 2 x−µ ¯ σ √ n ter´ distribui¸ao N (0.3 Intervalos de confian¸a c Conhecendo-se a distribui¸ao amostral do estimador.1. com uma confian¸a 1 − α pode ser ent˜o c c a escrito como: σ IC(µ)1−α = x ± z α √ ¯ 2 n em que n ´ o tamanho da amostra. a 6.3.116 V (θ1 ) < V (θ2 ) Eficiˆncia relativa e A eficiˆncia relativa do estimador θ1 . em rela¸ao ao estimador θ2 ´ dada por: e c˜ e V (θ2 ) V (θ1 ) Efθ1 .1 6. c˜ a pode-se facilmente determinar um intervalo que apresente uma confian¸a 1 − α para θ.

apenas um unico intervalo ¯ a a a ´ N −n N −1 (6. 824 ± z0. observando-se a uma m´dia igual a 0. 824 polegadas. 817. 831] conter o valor µ ´ 0. 042 polegadas em seu diˆmetro.90. dizer que a probabilidade do intervalo [0. ue e . 0.: Uma m´quina produz rolamentos que apresentam desvio padr˜o de a a 0. e Ex. Na pr´tica. 0. 007 Interpreta¸ao: Como µ ´ um parˆmetro e n˜o uma vari´vel aleat´ria. 824 ± 1. 90 substituindo esses valores em 6. 65 √n .3 vem: 0. no presente exemplo tal intervalo foi [0. 90 de confian¸a para o e c verdadeiro diˆmetro m´dio dos rolamentos. Esse intervalo ´ ent˜o e a comumente chamado intervalo de confian¸a de 90% para µ.4) ´ constru´ e ıdo.117 Obs. a e Solu¸ao: c˜ ¯ Tem-se x = 0. Desejando-se conhecer o diˆmetro m´dio dos rolamentos a a e produzidos por esta m´quina. 042 IC(µ)0. 65 √ 100 = 0. 831]. 824 ± 0. 817. no sentido de que 90% dos intervalos assim constru´ ıdos conteriam µ. ´ E obviamente incorreto. a c˜ e a a a o interpreta¸ao correta do intervalo de confian¸a ´: Constru´ c˜ c e ıdos todos os intervalos do tipo σ x ± 1.90 = 0. do ponto de vista da estat´ ıstica cl´ssica ou a freq¨ˆntista. 042 n = 100 1−α = 0. e c˜ n ´ o tamanho da amostra. 042 = 0. 824 σ = 0.05 √ 100 0. 90% deles conter˜o o parˆmetro µ. Obter o intervalo com 0. Isto ´ tem-se 90% de confian¸a c e c de que esse intervalo contenha o valor µ. extraiu-se uma amostra de 100 rolamentos. Se ocorrer amostragem sem reposi¸ao em popula¸ao finita (ASRPF) o c˜ c˜ intervalo de confian¸a para a m´dia ser´: c e a σ IC(µ)1−α = x ± z α √ ¯ 2 n onde: N ´ o tamanho da popula¸ao.

6) . c˜ z. 2 onde: N ´ o tamanho da popula¸ao. a distribui¸ao ` c˜ t se Student se aproxima da distribui¸ao normal. Se ocorrer amostragem sem reposi¸ao em popula¸ao finita (ASRPF) o c˜ c˜ intervalo de confian¸a para a m´dia ser´: c e a s IC(µ)1−α = x ± t α √ ¯ 2 n t α com n − 1 graus de liberdade. ¯ 2 n t α com n − 1 graus de liberdade.118 Pois essa probabilidade ´ 0 ou 1. solu¸ao: c˜ N −n .: Um Cia adquiriu 500 cabos. 6. c˜ c Ex. mesmo que σ 2 seja desconhecida. deste modo. a a Obter o intervalo com 95% de confian¸a para a verdadeira tens˜o media de ruptura destes c a cabos. quando se estiver trabalc˜ hando com amostras grandes (n > 30) pode-se utilizar a distribui¸ao normal padronizada. o intervalo de confian¸a para a m´dia ser´ dado por: c e a Amostras Pequenas (n ≤ 30) s IC(µ)1−α = x ± t α √ . e Obs. 2 em que: n ´ o tamanho da amostra.1.1. Uma amostra de 30 deles selecionados ao acaso apresentou tens˜o de ruptura media igual a 2400 kg com desvio padr˜o de 150 kg. e Amostras Grandes (n > 30) Foi visto que a medida que aumenta-se o tamanho da amostra. mas sim sua estimativa s.2 Variˆncia desconhecida Quando n˜o se conhece σ 2 e conseq¨entemente a a u σ.3. N −1 (6. e c˜ n ´ o tamanho da amostra. dependendo de µ pertencer ou n˜o ao intervalo ao intere a valo fixo.5) (6. em lugar da t na obten¸ao dos intervalos de confian¸a.

2. respectivamente e a c˜ α 2 2 2 σa σb + na nb (6.95 = 2400 ± t0.3. Uma amostra de 48 tubos da a empresa A apresentou diˆmetro m´dio igual a 40mm.119 Tem-se:N = 500 n = 30 x = 2400 s = 150 1 − α = 0. respec¯ ¯ a e c˜ tivamente.1. por meio de um intervalo de a e . 38)(0. e uma amostra de 36 tubos da a e empresa B apresentou diˆmetro m´dio de 42mm.69 e 2454. c˜ Obs: Se ocorrer ASRPF deve-se multiplicar a variˆncia da popula¸ao na a c˜ qual ocorreu ASRPF pelo fator de corre¸ao c˜ N −n .025 √ 30 500 − 1 = 2400 ± (2.1. respectivamente. 97) = 2400 ± 54. 95 ¯ n N = 30 500 = 0.31kg. 6. N −1 Ex. a 6. 045)(27. Verifique. 150 500 − 30 IC(µ)0. 05 → ocorreu ASRPF. respectivamente. 31 Interpreta¸ao: Existe 95% de confian¸a em se dizer que a verdadeira tens˜o c c a media de ruptura dos cabos est´ entre 2345. 06 > 0.3.7) na e nb os tamanhos das amostras das popula¸oes a e b.1 Variancias Conhecidas: IC(µa − µb )1−α = xa − xb ± z ¯ ¯ em que: xa e xb s˜o as estimativas pontuais das m´dias das popula¸oes a e b. 2 2 σa e σb as variˆncias das popula¸oes a e b.: As empresas A e B produzem tubos para esgoto com a variˆncias em a seus diˆmetros iguais a 8mm2 e 10mm2 .2 Diferen¸a entre duas m´dia (µa − µb ) c e .

120 confian¸a com 0, 95 de probabilidade, se existe diferen¸a entre os diˆmetros m´dios dos c c a e tubos das marcas A e B. Solu¸ao: c˜ Pop. A
2 σA =

Pop. B 8 40 48
2 σB =

10 42 36
2 2 σa σb + na nb

xA = ¯ nA =

xB = ¯ nB =

IC(µa − µb )0,95 = xa − xb ± z0,025 ¯ ¯ = 40 − 42 ± 1, 96 = −2 ± 1, 2973

8 10 + 40 42

Conclus˜o: Pode-se afirmar com 95% de confian¸a que a verdadeira diferen¸a a c c entre os diˆmetros m´dios dos tubos produzidos pelas empresas A e B est´ entre −2 ± a e a e a 1, 2973mm, isto ´ entre -3,2973 e -0,7027 mm. Como esse intervalo n˜o compreende o valor 0 (zero) Tem-se 95% de confian¸a em afirmar que os diˆmetros m´dios dos tubos c a e produzidos por estas empresas n˜o s˜o iguais. a a 6.1.3.2.2 Variancias Desconhecidas: Quando desconhece-se as variˆncias populaa

2 2 a c˜ e cionais (σa e σb ) torna-se necess´rio a substitui¸ao de seus valores param´tricos por suas

estimativas amostrais (s2 e s2 ). Neste caso, deve-se utilizar a distribui¸ao t de Student, em c˜ a b lugar da normal. Al´m desta altera¸ao deve-se considerar ainda se as duas popula¸oes s˜o e c˜ c˜ a homoced´sticas ou heteroced´sticas, isto ´, se as variˆncias populacionais (desconhecidas) a a e a s˜o iguais ou diferentes, o que pode ser aferido por meio de um teste de hip´tese para a o homogeneidade das variˆncias (Cap 7). a Popula¸oes homoced´sticas c˜ a
2 2 Sendo as popula¸oes homoced´sticas (σa = σb = σ 2 ), assim, s2 e s2 s˜o duas c˜ a a b a

estimativas para um mesmo parˆmetro (σ 2 ) ent˜o o intervalo de confian¸a para a diferen¸a a a c c entre duas m´dias ´ dado por: e e

121 IC(µa − µb )1−α = xa − xb ± t α sp ¯ ¯ 2 t α com na + nb − 2 graus de liberdade. 2 em que: (na − 1)s2 + (nb − 1)s2 a b na + n b − 2 1 1 + , na nb (6.8)

sp =

Popula¸oes heteroced´sticas c˜ a

2 2 Sendo as popula¸oes heteroced´sticas (σa = σb ), assim, s2 e s2 s˜o estimac˜ a a b a

tivas de diferentes parˆmetros, n˜o podendo, pois serem combinadas em um unico valor. a a ´ Ent˜o o intervalo de confian¸a para a diferen¸a entre duas m´dias ´ dado por: a c c e e s2 s2 a + b na nb

IC(µa − µb )1−α = xa − xb ± t α ¯ ¯ 2 t α com v graus de liberdade. 2 em que:
2 sa na s2 a na 2

(6.9)

+ +

v=

s2 b nb

2
2

s2 b nb

na −1

nn −1

6.1.3.3 6.1.3.3.1 dado por:

Intervalo de confian¸a para propor¸˜o c ca Amostras grandes (n > 30) O intervalo de confian¸a para a propor¸ao ´ c c˜ e pq ˆˆ n

IC(P )1−α = p ± z α ˆ 2 em que: p ´ a propor¸ao estimada na amostra; ˆe c˜ q = 1 − p e; ˆ ˆ n ´ o tamanho da amostra. e

(6.10)

122 Obs: Se ocorrer ASRPF, o intervalo de confian¸a para propor¸ao ´ dado c c˜ e por: IC(P )1−α = p ± z α ˆ 2 6.1.3.3.2 pq ˆˆ n N −n N −1 (6.11)

Amostras pequenas (n ≤ 30) Quando a amostra for pequena deve-se

utilizar a distribui¸ao t de Student, em lugar da normal e o intervalo de confian¸a para a c˜ c propor¸ao ser´ dado ent˜o por: c˜ a a pq ˆˆ , n

IC(P )1−α = p ± t α ˆ 2 t α com n − 1 graus de liberdade 2

(6.12)

Obs: Se ocorrer ASRPF, o intervalo de confian¸a para propor¸ao ´ dado c c˜ e por: IC(P )1−α = p ± t α ˆ 2 t α com n − 1 graus de liberdade 2 6.1.3.4 pq ˆˆ n N −n N −1 (6.13)

Intervalo de confian¸a para a diferen¸a entre propor¸oes c c c˜ Dadas duas amostras independentes, de popula¸oes diferentes, o intervalo c˜

de confian¸a para a diferen¸a entre as propor¸oes nestas popula¸oes ´ dado por: c c c˜ c˜ e 6.1.3.4.1 Amostras grandes (n > 30) IC(Pa − Pb )1−α = (pa − pb ) ± z α ˆ ˆ 2 em que: pa ´ a propor¸ao estimada na amostra; ˆ e c˜ qa = 1 − p a ; ˆ ˆ qa = 1 − p a ; ˆ ˆ na e nb s˜o os tamanhos das amostras a e b, respectivamente a Obs: Se ocorrer ASRPF, deve-se multiplicar o componente da variˆncia, a referente a popula¸ao na qual ocorreu ASRPF pelo fator de corre¸ao ` c˜ c˜
N −n . N −1

p a qa pa qb ˆˆ ˆˆ + na nb

(6.14)

5 Intervalo de confian¸a para a variˆncia (σ 2 ) c a O intervalo de confian¸a para a variˆncia populacional ´ dado por: c a e Sabe-se que (n − 1)s2 sin χ2 n−1 σ2 Ent˜o. Para que uma hip´tese e a o cient´ ıfica seja testada. a hip´tese: “Os motores da marca x s˜o mais econˆmicos que os da marca o a o y” ´ uma hip´tese cient´ e o ıfica.2 Amostras pequenas (n ≤ 30) IC(Pa − Pb )1−α = (pa − pb ) ± t α ˆ ˆ 2 t α com na + nb − 2 graus de liberdade 2 Obs: Se ocorrer ASRPF. caso e c˜ contr´rio pertencer´ a outro ramo do conhecimento humano.1. n˜o sendo. pode montar um experimento e averiguar sua veracidade.1. portanto. a hip´tese: o a a ıfica.3. χ2 α χ2 α 1− 2 2 (6. a a a Assim sendo. permanecendo assim at´ que se prove o contr´rio.4. que ´ uma e . a referente a popula¸ao na qual ocorreu ASRPF pelo fator de corre¸ao ` c˜ c˜ 6. ela deve ser convertida em uma hip´tese estat´ o ıstica. ou queira comprova-la. Uma determinada “Deus existe”.15) N −n . deve-se multiplicar o componente da variˆncia. Por outro lado.2 Teoria da decis˜o (Testes de Hip´teses) a o Uma hip´tese cient´ o ıfica ´ qualquer afirma¸ao que possa ser refutada. se em sua avalia¸ao n˜o forem encontrados ind´ o e c˜ a ıcios que a desaprovem. como por exemplo a religi˜o. pois qualquer pessoa que duvide.123 6. n˜o pode ser avaliada. N −1 =1−α E o intervalo de confian¸a para a variˆncia ser´: c a a IC(σ 2 )1−α = (n − 1)s2 (n − 1)s2 . a P (n − 1)s2 (n − 1)s2 ≤ σ2 ≤ χ2 α χ2 α 1− 2 2 pa qa p a qb ˆˆ ˆˆ + na nb (6.16) 6.3. cient´ hip´tese ´ tida como verdadeira.

a o a c 6. a partir dos resultados experimentais (amostrais) rejeitar ou n˜o tal hip´tese. com e tamanho n = 9. seja de 14km/l. Pelo simples fato desta amostra de 9 carros ter apresentado uma performance m´dia inferior a informada pelo fabricante (14 km/l). como afirma o fabricante. deve-se conduzir um experimento o (coletar uma amostra). sendo geralmente formulada o e o a com o intuito de ser rejeitada. esta estimativa est´ sujeita uma distribui¸ao a e a c˜ amostral.c. fornecer uma estimativa inferior a estimativa c˜ . Ent˜o e a deve-se formular as seguintes hip´tese estat´ o ısticas:   H : µ = 14km/l 0  H : µ < 14km/l a Para verificar a veracidade da hip´tese H0 . retirada desta popula¸ao. Um teste de hip´tese.2.124 afirma¸ao sobre um parˆmetro populacional. com variˆncia e a 4(Km/l)2 . para verifica a veracidade de H0 . equipados com motores 1. de determinada marca. o e o Suponha que esteja-se interessado em verificar se a verdadeira performance (km/litro de combust´ ıvel) dos ve´ ıculos. a partir das quais. que fornecer˜o a a a uma estimativa da performance m´dia. isto ´ µ = 14 km/l. no qual ser´ medida a performance de v´rios carros. e que estes tenham apresentado uma performance m´dia de 13 km/l. e sua variˆncia.6 c. e calcula-se a probabilidade de uma amostra. assume-se que esta hip´tese o seja verdadeira. deve-se formular duas hip´teses c˜ o o estat´ ısticas. fundamenta-se em c˜ a o um conjunto de regras. Deste modo. ou se este ´ inferior a 14km/l. que permitem.1 Metodologia de um teste de hip´tese o Para a realiza¸ao de um teste de hip´teses. associando a esta decis˜o uma determinada confian¸a. a saber: • Hip´tese de nulidade (H0 ) ´ a hip´tese que ser´ testada. pois como j´ ´ sabido. n˜o se pode concluir que esta afire a mativa seja falsa. Suponha que no experimento acima tenham sido avaliados 9 o carros. verifica-se a e a veracidade da hip´tese H0 . • Hip´tese alternativa (Ha ) ´ qualquer hip´tese que contrarie H0 .

No nosso exemplos temos:   H : µ = 14km/l 0  H : µ < 14km/l a sabendo-se que x sin N µ. 5) = 0. 05) h´ raz˜es para acreditar a o que a verdadeira m´dia populacional seja menor do que se imaginva. Este ´ apenas um valor usual. 5 P |H0 (¯ ≤ 13) = P (t ≤ −1. Nesta situa¸ao. e como n˜o se conhece σ 2 . Obs: N˜o existe nenhum argumento cient´ ıfico para se fixar o n´ de probabilidade limite de um ıvel teste em 0. da´ a terminologia usual de que “o teste foi n˜o a e ı a significativo”. Por outro lado. ou seja a verdadeira e performance deve ser menor que 14 km/l. n˜o haver´ nenhuma raz˜o para rea a a jeitar a hip´tese H0 (isto ´ duvidar de sua veracidade). assumido µ = 14 km/l. n˜o h´ raz˜es para acreditar que a verdadeira e a a o performance m´dia seja inferior a 14 km/l e . 05.125 obtida (13 km/l). 1720 x como esta probabilidade ´ alta. usada para dizer que a hip´tese H0 n˜o foi rejeitada. sendo esta tida como verdadeira. ¯ . Caso esta probabilidade seja alta. σ ¯ n sim s2 . portanto a hip´tese H0 deve ser rejeitada (o teste foi significativo). 4 ¯ 9 gr´fico a x−µ ¯ σ √ n 2 na amostra de n = 9 carros obteve-se x = 13 km/l e s2 = 4 (km/l)2 . tem-se: x sin t(8) 14. mas a tc = Ent˜o. a = 13 − 14 2 √ 9 = −1. devido a facilidade de sua obten¸ao em e c˜ tabelas. o e Nesta situa¸ao disse que a diferen¸a observada entre a m´dia amostral (13 km/l) e a popc˜ c e ulacional (14 km/l) n˜o ´ significativa. se a o a probabilidade de se obter esta estimativa for pequena (p < 0. diz-se que a diferen¸a foi sigc˜ c o a nificativa.

As probabilidades de se cometer os erros Tipo I e Tipo II. no exemplo a o anterior seja verdadeira. como pode ser observado na fig?. e Figura 6. pode-se incorrer em dois tipos de ero ros. cuja probabilidade de ocorrˆncia seja muito baixa. sendo que. o que levaria a ree jei¸ao da hip´tese H0 : µ = 14 km/l. uma estimativa e de performance.1: Erros Tipo I e Tipo II. (α e β) s˜o a inversamente proporcionais. e por efeito de acaso obtenha-se. Ent˜o ter-se-a cometido um erro c˜ o e a denominado erro Tipo I (rejeitar uma hip´tese H0 ) verdadeira. isto ´ a performance m´dia dos carros realmente ´ de 14 km/l. a hip´tese formulada pode ser falsa. Por outro lado. determinada (fixada) pelo pesquisador. Suponha que a hip´tese H0 formulada. e e e isto ´ (µ = 14 km/l). e por efeito de acaso obter uma estimativa.2 Tipos de erros Ao realizar-se um teste de hip´tese. na amostra. H0 e do e c˜ tamanho amostral. A probabilidade de cometer este erro ´ (β). A probabilidade de se o e ıvel a cometer este erro ´ denominada n´ de significˆncia (α) sendo esta. Nesta situa¸ao ter-se-a cometido o erro Tipo II (aceitar H0 o c˜ falsa).2. que ´ verdadeira. que ser˜o discutidos a seguir. isto ´ na verdade o e a c˜ µ = 14 km/l. Figura tipos de erros . que nos leve a n˜o rejei¸ao da hip´tese H0 : µ = 14 km/l.126 6. sendo esta uma fun¸ao de α. a unica maneira ´ de se diminuir simultaneamente α e β ´ aumentando o tamanho amostral (n).

Teste Unilateral a Direita: Apresenta uma unica regi˜o de rejei¸ao da hip´tese H 0 .3 Tipos de testes De acordo com o tipo de hip´tese formulada pode-se ter os seguintes tipos o de testes de hip´teses: o i.1 a Tabela 6. situadas nos o c˜ o extremos da distribui¸ao amostral.2. ´ utilizado para testar as c˜ e hip´teses do tipo: o   H :µ=θ 0  H :µ>θ a .1: Tipos de erros pass´ ıveis de serem cometidos ao se testar uma hip´tese o Decis˜o a Realidade H0 verdadeira Rejeita H0 α (erro Tipo I) H0 falsa 1−β Decis˜o correta a N˜o Rejeita H0 a 1−α Decis˜o correta a β (erro Tipo II) 6. bem o como suas probabilidades est˜o resumidos na tabela 6. ´ a c˜ o situada no extremo superior da distribui¸ao amostral. ´ utilizado para testar as hip´teses do tipo: c˜ e o   H :µ=θ 0  H :µ=θ a ii.127 Os tipos de erros que podem ser cometidos em um teste de hip´teses. Teste Bilateral: Apresenta duas regi˜es de rejei¸ao de da hip´tese H0 .

situada a c˜ o no extremo inferior da distribui¸ao amostral. ii.05 (8) = 1. Tomar a decis˜o.128 iii. a o c˜ a c˜ iv. 5 v. n˜o rejeita-se a hip´tese H0 . a vi. Fixar o valor de α. 860 Regra: rejeitar H0 se tcalc ≤ −1. tcalc = x − µ0 ¯ s √ n = 13 − 14 2 √ 9 = −1. Construir a regra de decis˜o (regi˜es de rejei¸ao e n˜o rejei¸ao de H0 ). iii. Conclus˜o. 860. a Exemplo. α = 0. Aplicando-se este algoritmo ao exemplo da performance m´dia e dos carros tem-se: i. t0. 5 > ttab = −1. Como tcalc = −1. Teste Unilateral a Esquerda Apresenta: uma regi˜o de rejei¸ao da hip´tese H 0 . pois o valor da a o estat´ ıstica teste (tcalc ) encontra-se na regi˜o de n˜o rejei¸ao de H0 .4 Algoritmo para realiza¸˜o de um teste de hip´tese ca o i. 860 iv. v. Calcular a estat´ ıstica adequada para o teste. o ii.2. 05   H : µ = 14km/l 0  H : µ < 14km/l a iii. Formular as hip´tese H0 e Ha . ´ utilizado para testar as hip´teses do c˜ e o tipo:   H :µ=θ 0  H :µ<θ a 6. a a c˜ .

ao n´ de 0. e a e .129 vi. Conclui-se pelo teste t de Student. 05 de probabilidade que a verdadeira ıvel performance m´dia destes carros n˜o ´ inferior a 14 km/l.

2. σb ) Fcalc = 2 s2 σ b a 2 s2 σ a b F(na −1). 1) 2 Xa ∼ N (µa . 1) n ≤ 30 t(n−1) µa − µ b 2 Xa ∼ N (µa . σa ) tcalc = sp = Xb ∼ 2 N (µb . σa ) 2 Xb ∼ N (µb . 1) depois − xi n ≤ 30 t(n−1) n > 30 N (0. 1) n ≤ 30 t(na +nb −2) n > 30 N (0.(nb −1) .5 Estat´ ıstica apropriadas para os testes de hip´teses o Parˆmetro a µ Presuposi¸oes c˜ X ∼ N (µ. σb ) 2 2 σa = σ b 1 1 +n na b (na −1)s2 +(nb −1)s2 a b na +nb −2 xa −xb −(µa −µb ) ¯ ¯ sp n > 30 N (0. σ 2 ) Estat´ ıstica tcalc = x−µ0 ¯ s √ n Distribui¸ao c˜ n > 30 N (0. 1) n ≤ 30 t(na +nb −2) p tcalc = p−p0 ˆ p(1−p) ˆ ˆ n pa − p b tcalc = pa −ˆb −(p0a −p0b ) ˆ p p (1−p ) ˆ ˆ pa (1−pa ) ˆ ˆ + b n b n 2 σa 2 σb 2 Xa ∼ N (µa .130 6. σb ) 2 2 σa = σ b tcalc = xa −xb −(µa −µb ) ¯ ¯ s2 s2 a+ b na nb n ≤ 30 t(v) v= 2 s2 a + sb na nb 2 s2 a na 2 na −1 + 2 s2 b nb nn −1 dados pareados tcalc = di = x i antes ¯ d−d0 s √d n n > 30 N (0. 1) n ≤ 30 t(n−1) n > 30 N (0. σa ) 2 Xb ∼ N (µb .

(teste Qui-Quadrado de aderˆncia).2. observou a seguinte . como para verificar a independˆncia entre duas vari´veis. e ue A express˜o 6.131 6. a estat´ ıstica 6.17 fornece um valor sempre positivo. e e u m o n´mero de parˆmetros estimados para se obter as freq.6 Teste de Qui-Quadrado (χ2 ) O teste de Qui-Quadrado ´ utilizado para compara¸ao entre as freq¨ˆncias e c˜ ue observadas as esperadas segundo um modelo probabil´ ıstico qualquer. e ue Fei ´ a freq¨ˆncia esperada.1 Teste de aderˆncia e ´ E utilizado para verificar o ajustamento de um modelo de probabilidade aos dados observados. em que: k ´ o n´mero de classes. u a Exemplo1. v e v calc Assim.17 pode ser utilizada tanto para verificar a aderˆncia e ue e das freq¨ˆncias observadas a um modelo.6. Fei (6. e a 6. Uma medida da discrepˆncia entre as freq¨ˆncias observadas e esperadas ´ a ue e dada por: k 2 χcalc = i=1 (Foi − Fei )2 . Em seus experimentos com ervilhas. ou seja. esperadas. a Neste caso o n´mero de graus de liberdade (v) ser´: u a v = k − 1 − m. Em que χ2 ´ uma distribui¸ao Qui-Quadrado com v graus de liberdade.17) em que: Foi ´ a freq¨ˆncia observada. Mendel. ao cruzar plantas de sementes amarelas lisas com plantas de sementes verdes enrugadas. verificar se as diferen¸as entre as freq¨ˆncias observadas e c ue esperadas s˜o estatisticamente significativas. e pode-se demonstrar a c˜ que χ2 ∼ χ2 .2.

25 104. De acordo com os postulados de Mendel a segrega¸ao esperada nesta gera¸ao deveria seguir c˜ c˜ a propor¸ao de 9:3:3:1 Verificar se a teoria da segrega¸ao independente dos genes explica c˜ c˜ c˜ a segrega¸ao observada. 75 como nenhum parˆmetro foi estimado. realizadas pelo c˜ u Cruzeiro.132 descendˆncia na gera¸ao F2 : 315 plantas com sementes amarelas lisas. durante o Brasileir˜o 2001. 75 34. a calc tab Exemplo2 A distribui¸ao do n´mero de gols/partida. foi: a Verificar se o n´mero de gols por partida pode ser modelado segundo uma u distribui¸ao de Poison c˜ Solu¸ao: c˜ . 470 312. 75)2 (32 − 34. 75)2 + ··· + = 0.75 104. o n´mero de graus de liberdade ser´: a u a v =4−1−0=3 Verifica-se na tabela de χ2 que χ2 (3) = 11.25 34. 101 com sementes verdes lisas e 32 com sementes verdes enrugadas.75 556 Amarelas enrugadas 108 Verdes lisas Verdes enrugadas 101 32 Total 56 2 Obter a estat´ ıstica χcalc χ2 = calc (315 − 312.01) Como χ2 < χ2 o teste foi n˜o significativo. 108 com sementes e c˜ amarelas enrugadas. Solu¸ao: c˜ Hip´teses a serem testadas: o    propor¸ao = 9 : 3 : 3 : 1  χ2 = 0 c˜ ⇒  propor¸ao = 9 : 3 : 3 : 1  χ2 > 0 c˜ Obter as freq¨ˆncia esperadas ue classes Amarelas lisas Fo 315 Fe 312. 345 (0.

04 Comparando esse valor com o de χ2 abela = com 3 graus de liberdade (5-1-1) T tem-se que o pvalor=0. Considerea c˜ a se como exemplo a tabela 6.04 . N´mero de gols u N´mero de partidas (Fo) u Fe 0 8 6.6. 04)2 (8 − 6.3 na qual est˜o apresentados os n´mero de alunos matriculados a u !h Frequˆncias esperadas do n´mero de gols por partida marcados pelo Cruzeiro Ese u porte Clube durante o campeonato brasileiro de 2002.2. N´mero de gols u 0 1 9 2 3 4 2 4 3 N´mero de partidas 8 u !h Probailidades estimadas via modelo de Poisson do n´mero de gols por partida u marcados pelo Cruzeiro Esporte Clube durante o campeonato brasileiro de 2002.26 1 0. portanto n˜o rejeita-se H0 . n´mero de gols u Prob.10 4 0. a 6.23 3 0.10 2 4 6.1732. 76 9.04 Para obten¸ao das freq¨ˆncias esperadas pela distribui¸ao torna-se c˜ ue c˜ necess´rio estimar o n´mero m´dio de gols: x = 1. em em seguida a u e ¯ obter a distribui¸ao de probabilidade do n´mero de gols/partidas: c˜ u Assim a freq¨ˆncia esperada pela distribui¸ao de Poison ser´ dada pelo proue c˜ a u duto da probabilidade do cruzeiro realizar um determinado n´mero de gols em uma partida pelo n´mero de partidas realizadas: u O valor da estat´ ıstica χ2 ser´: a χ2 = calc (3 − 1.76 1 9 9. as quais e e e s˜o construidas no intuito de estudar a rela¸ao entre duas vari´veis categoricas.133 !h N´mero de gols por partida marcados pelo Cruzeiro Esporte Clube durante o campeu onato brasileiro de 2002. 0 0.2 Teste de independencia O teste χ2 de independˆncia ´ aplicado a tabelas de contingˆncia. 35 gols por partida. 10)2 + + ··· + = 4. estimadas pelo modelo Poisson.24 3 2 2.86 4 3 1. 76)2 (9 − 9. 98 6.35 2 0. 10 1.

sendo p o n´mero de parˆmetros estimados. este se encontra na regi˜o de rejei¸ao de H0 portanto. 82)2 (40 − 36. 18 Verifica-se na tabela de χ2 que o valor de χ2 (2) = 5.2: N´mero de alunos matriculados em dois col´dios em rela¸ao a classe social u e c˜ ` dos mesmos Classe social col´gio e A B Total Alta 20 50 70 M´dia e 40 40 80 Baixa 40 30 70 Total 100 120 220 A estat´ ıstica utilizada para o teste ´ e h 2 χcalc k = i=1 j=1 (F oij − F eij )2 F eij (6.18 χ2 = calc (20 − 31.18) em que: F oij ´ a freq¨ˆncia observada na casela ij.134 nos col´dios A e B. 27 31. m´dia ou baixa). rejeita-se a c˜ calc e tab . em rela¸ao a sua classe econˆmica (alta. 36)2 (30 − 30. a estat´ ıstica 6. 82 336. a qual ´ dada por: e ue e (T otal da lina i)(total da coluna j) totalgeral F eij = Sob H0 . 18)2 + + ··· + = 20. 36 30. 99.05 χ2 ´ maior que o de χ2 .18 tem distribui¸ao de χ2 com c˜ v = (h − 1)(k − 1) − p graus de liberdade. Como o valor de 0. e ue F eij ´ a freq¨ˆncia esperada na casela ij. u a No exemplo tem-se: substituindo esses resultados em 6. e c˜ ` o e Tabela 6.

18) Total 100 120 220 70 80 70 ( ) Freq¨encia esperada u a hip´tese de independˆncia entre os col´gios e a classe social dos alunos. Ou seja pode-se o e e afirmar.82) 30(38. ao n´ de 0.135 Tabela 6.64) Baixa 40(31.18) M´dia e 40(36. .3: N´mero de alunos matriculados em dois col´dios em rela¸ao a classe social u e c˜ ` dos mesmos Classe social col´gio e A B Total Alta 20(31.05 que a classe social e o col´gio no qual os alunos estudam n˜o s˜o ıvel e a a independentes.36) 40(43.82) 50(31.

e ´ coeficiente angular. Isto ´ os erros sejam m´ e ınimos Partindo-se do modelo 7. implica ˆ ˆ ˆ procurar os valores (βi ) tais que os valores estimados (preditos) de yi . yi = β0 + β1 sejam ˆ os mais pr´ximos poss´ o ıveis dos valores observados. Definindo a fun¸ao c˜ 136 .1 tem-se que o erro cometido ao se estimar uma observa¸ao ´ c˜ e e i = y i − β 0 − β 1 xi . via m´todo de m´ a e ınimos quadrados. e o c˜ Ajustar um modelo de regress˜o. e ´ o valor da vari´vel preditora e e a (7.1) ei ´ o erro aleat´rio associado a observa¸ao yi .Cap´ ıtulo 7 Regress˜o e Correla¸˜o linear a ca Estima¸ao dos parˆmetros do modelo de regress˜o pelo m´todo dos m´ c˜ a a e ınimos quadrados: Seja o modelo: yi = β 0 + β 1 xi + e i em que: yi β0 β1 xi ´ o valor observado da vari´vel resposta (dependente). e a ´ o intercepto do modelo.

Assim.3) n de (b) tem-se: .2) ˆ ˆ a Os estimadores de m´ ınimos quadrados de β0 e β1 . β1 ) = i=1 e2 i = i=1 (yi − β0 − β1 xi )2 (7. β0 e β1 s˜o aqueles que minimizam a fun¸ao 7.137 n n S(β0 . estes estimadores s˜o obtidos solucionando-se o sistema: c˜ a     2  2 n i=1 (yi n i=1 (yi ∂S ∂β0 ∂S ∂β1 = 0 = 0 = 0  ˆ ˆ − β0 − β1 x1 )(−xi ) = 0 n i=1 ˆ ˆ − β0 − β1 xi )(−1)    n i=1 n i=1 ˆ yi xi − β 0 ˆ ˆ yi − n β 0 − β 1 x1 n i=1 = 0 (a) x2 = 0 (b) i n i=1 ˆ xi − β 1 de (a) tem-se: ˆ β0 = n i=1 yi n ˆ0 = y − β1 x β ¯ ˆ¯ ˆ − β1 n i=1 xi (7.2.

9 9 10. Ajustar um modelo de regress˜o linear simples que descreva a c a quantidade de CDs vendidos em fun¸ao do tempo de lan¸amento.8 CDs (M ilunid) 5.5) Exemplo: Os dados a seguir refrem-se ao n´mero de CDs vendidos por uma u determinada gravadora. 55 − (0.0 Yi = 85.3: ˆ β0 = 8.5) 10 2 385− 55 10 Xi = 55 Xi2 = 385 10 i=1 Xi Yi = 529. 72)(5. em milhares de unidades.6 7 11. do modelo obtido. 4 Substituindo esses valores em 7. aos dados ´ dada e pelo coeficiente de determina¸ao (R2 ). 72 e em 7.0 8 11.4− (55)(85.7 10 i=1 3 6. 5 529.0 4 8.2 6 8. 5) = 4. em 10 semanas consecutivas ap´s o o lan¸amento do mesmo. c˜ SP XY 2 SQDX r2 = SQDY (7. 59 .4) Uma medida da qualidade do ajuste. c˜ c Semanas Tem-se que: n = 10 10 i=1 1 2 6.4 tem-se: ˆ β1 = = 0.138 n n n ˆ β0 n i=1 ˆ xi + β 1 i=1 n i=1 n x2 i = i=1 n xi yi xi yi i=1 n yi n i=1 n ˆ − β1 yi n i = 1 n xi n n i=1 ˆ xi + β 1 i=1 n 2 i=1 xi i=1 n x2 = i x2 = i i=1 xi ˆ − β1 n n ˆ + β1 n i=1 xi yi i=1 n n i=1 yi n n i=1 xi ˆ + β1 i=1 n x2 − i x2 − i x2 i x2 i n n i=1 = i=1 n xi yi xi yi − xi yi − n i=1 n i=1 ˆ β1 i=1 n = ˆ β1 = ˆ β1 i=1 n i=1 yi n yi n n n i=1 n i=1 xi n i=1 n i=1 xi SP XY = SQDX x2 − i x2 i (7.6 10 10.7 10 i=1 5 6.

139 Portanto a equa¸ao de regress˜o que descreve o n´mero de Cds vendidos em c˜ a u fun¸ao do n´mero de semanas ap´s o lan¸amento ´: c˜ u o c e y = 4. 72x Cujo coeficiente de determina¸ao ´: c˜ e r2 = 59. 59 + 0.5 54.152 82. 77 .565 = 0.

Sign up to vote on this title
UsefulNot useful