Professional Documents
Culture Documents
ESTATÍSTICA BÁSICA
Presidente Prudente
2008
Índice
1.0 Introdução.......................................................................................................... 2
1.1 O que é Estatística.............................................................................................. 3
3.0 Medidas-resumo............................................................................................... 17
4.1 Introdução.......................................................................................................... 20
4.2 Associação entre variáveis Qualitativas............................................................. 21
4.3 Medidas de Associação...................................................................................... 22
4.4 Associação entre Variáveis Quantitativas.......................................................... 22
4.5 Associação entre Variáveis Qualitativas e Quantitativas................................... 24
4.6 Exercícios........................................................................................................... 25
5.0 Probabilidade................................................................................................... 26
5.1 Introdução.......................................................................................................... 26
5.2 Probabilidade condicional e independência....................................................... 27
5.3 Exercícios........................................................................................................... 28
Bibliografia ............................................................................................................ 30
1
1.0 Introdução
2
1.1 O Que é Estatística
3
2.0 Resumo de Dados
Exemplo 1.0
4
Tabela 1.0
Informações sobre estado civil, grau de instrução, número de filhos, salário
(expresso como fração do salário mínimo), idade (medida em anos e meses) e
procedência de 36 empregados da seção de orçamentos da Companhia.
De modo geral, para cada elemento investigado numa pesquisa, tem-se associado
um (ou mais de um) resultado correspondendo à realização de uma característica
(ou características). Por exemplo, considerando a variável estado civil, para cada
empregado pode-se associar um dos resultados, solteiro ou casado (note que poderia
haver outras possibilidades, como separado, divorciado, mas somente as duas
mencionadas foram consideradas no estudo).
Resumindo
Como as variáveis são classificadas e outros exemplos:
5
Uma variável originalmente quantitativa pode ser coletada de forma qualitativa.
Por exemplo, a variável idade, medida em anos completos, é quantitativa (contínua);
mas, se for informada apenas a faixa etária (0 a 5 anos, 6 a 10 anos, etc...), é qualitativa
(ordinal). Outro exemplo é o peso dos lutadores de boxe, uma variável quantitativa
(contínua) se trabalha com o valor obtido na balança, mas á qualitativa (ordinal) se o
classificarmos nas categorias do boxe (peso-pena, peso-leve, peso-pesado, etc.).
Outro ponto importante é que nem sempre uma variável representada por números
é quantitativa.
O número do telefone de uma pessoa, o número da casa, o número de sua
identidade. Às vezes o sexo do indivíduo é registrado na planilha de dados como 1 se
macho e 2 se fêmea, por exemplo. Isto não significa que a variável sexo passou a ser
quantitativa!
Exemplo 1.2
A tabela apresenta a distribuição de freqüência da variável grau de instrução,
usando os dados da tabela 1.0.
Tabela 1.1. Freqüência e porcentagem dos 36 empregados da seção de orçamentos
da Companhia MB segundo o grau de instrução.
6
2.3 Gráficos
Tabela 1.3.
7
Figura 1.0
Gráfico em Barras para a variável Grau de Instrução
18
18
16
14
12
12
Freqüência (ni)
10
6
6
4
0
Fundamental Médio Superior
Grau de Instrução
Figura 1.1
Gráfico em Setores para a variável Grau de Instrução
50%
Fundamental
Médio
33%
Superior
17%
8
(i) Gráfico em Barras
Tabela 1.4
Freqüências e Porcentagens dos empregados da seção de orçamentos da
Companhia MB, segundo o número de filhos.
Figura 1.2
Gráfico de Barra para a variável Números de Filhos
35
35
30
25
25
Porcentagem
20
20
15
15
10
5 0 5
0
0 1 2 3 4 5
Números de Filhos
9
Exemplo1.3: Considere a variável tempo, em segundos, entre carros que passam
por um cruzamento, viajando na mesma direção.
6, 3, 5, 6, 4, 3, 5, 4, 6, 3, 4, 5, 2, 10.
Figura 1.3
2 3 4 5 6 7 8 9 10
(iii) Histograma
Tabela 1.5
Freqüências e Porcentagens dos 36 empregados da seção de orçamentos da
companhia MB, por faixas de salário.
10
Figura 1.4
Histograma da variável Salário
0,09
0,08
0,07 0,0833
D en sid a d e d e F req ü ên cia
0,06 0,0695
0,05
0,0556
0,04
0,03 0,0347
0,02
0,01 0,007
0
04 |-- 08 08 |-- 12 12 |-- 16 16 |-- 20 20 |-- 24
Classes de Salários
11
Tabela 1.6
Dívida Externa do Brasil de 1956 a 2006, em Milhões de Dólares.
Ano Dívida Ano Dívida Ano Dívida
1956 2736 1973 14857 1990 123439
1957 2491 1974 20032 1991 123910
1958 2870 1975 25115 1992 135949
1959 3160 1976 32145 1993 145726
1960 3738 1977 37951 1994 148295
1961 3291 1978 52187 1995 159256
1962 3533 1979 55803 1996 179935
1963 3612 1980 64259 1997 199998
1964 3294 1981 73963 1998 241644
1965 3823 1982 85487 1999 241468
1966 3771 1983 93745 2000 236156
1967 3440 1984 102127 2001 226067
1968 4092 1985 105171 2002 227689
1969 4635 1986 111203 2003 235414
1970 6240 1987 121188 2004 220182
1971 8284 1988 113511 2005 187987
1972 11464 1989 115506 2006 191999
Fonte: IPEADATA
Figura 1.5
Gráfico de Linhas para a variável Dívida Externa do Brasil no período 1956 a 2006
250000
200000
Dívida em Milhões de Dólares
150000
100000
50000
0
56
58
60
62
64
66
68
70
72
74
76
78
80
82
84
86
88
90
92
94
96
98
00
02
04
06
19
19
19
19
19
19
19
19
19
19
19
19
19
19
19
19
19
19
19
19
19
19
20
20
20
20
Ano
12
2.4 Ramo-e-Folhas
Exemplo 1.4
53 70 84 69 77 87 53 82 67 54
70 71 95 51 74 55 63 85 53 64
82 78 55 69 72 59 55 73 52 50
5 01233345559
6 34799
7 00123478
8 22457
9 5
2.5 Exercícios
1) Um questionário foi aplicado aos alunos do primeiro ano de uma escola fornecendo
as seguintes informações:
13
Toler: Tolerância ao cigarro: (I) Indiferente, (P) Incomoda Pouco e (M)
Incomoda Muito;
Exer: Horas de atividade física, por semana;
Cine: Número de vezes que vai ao cinema por semana;
OpCine: Opinião a respeito das salas de cinema na cidade: (B) regular a boa e (M)
muito boa
TV: Horas gastas assistindo TV, por semana
OpTV: Opinião da programação na TV: (R) Ruim, (M) Média, (B) Boa e (N)
não sabe.
Tabela A
ID Turma Sexo Idade Alt Peso Filh Fuma Toler Exer Cine Opcine Tv OpTV
1 A F 17 1,60 60,5 2 Não P 0 1 B 16,5 R
2 A F 18 1,69 55,0 1 Não M 0 1 B 7 R
3 A M 18 1,85 72,8 2 Não P 5 2 M 15 R
... ... ... ... ... ... ... ... ... ... ... ... ... ...
49 B M 17 1,80 71,0 1 Não P 7 0 M 14 R
50 B M 18 1,83 86,0 1 Não P 7 7 M 20 B
Fonte: Magalhães e Pedroso de Lima (2004).
(b) Bacias Hidrográficas (A: Amazônica, P:Platina, SF:São Francisco, N:do Nordeste,
L:do Leste, S:do Sul);
Resolução α Variável Qualitativa Nominal
14
(c) Número de sementes germinadas (0, 1, 2, 3, 4, 5);
Resolução α Variável Quantitativa Discreta
Tabela B: Informações sobre estado civil, grau de instrução, numero de filhos, salário
(expresso como fração do salário mínimo) e procedência de 36 empregados da seção de
orçamento da Companhia MB.
Tabela B
(a)Estado Civil
Resolução
Estado Civil f
Freqüência ni
Porcentagem 100x
i
Solteiro 4 57,14
Casado 3 42,85
Total 7 100,00
Resolução
15
c) Idade
Resolução
Idade f
Freqüência n i
Porcentagem
i
26 α 32 2 28,27
32 α 38 2 28,57
38 α 42 3 42,85
Total 7 100,00
8 11 8 12 14 13 11 14 14 15
6 10 14 19 6 12 7 5 8 8
10 16 10 12 12 8 11 6 7 12
7 10 14 5 12 7 9 12 11 9
14 8 14 8 12 10 12 22 7 15
Resolução
10
9
8
7 7
7
6
Freqüência
5 5
5
4
4
3
3
2 2 2
2
1 1 1 1
0
5 6 7 8 9 10 11 12 13 14 15 16 19 22
Número de Erros
16
3.0 Medidas - Resumo
Média
_
A média é a medida mais popular e representada por x , ela representa o ponto de
equilíbrio da distribuição de seus valores.
Considere uma variável x com observações representadas, por x 1 ,x 2 ,.....x n . A
média desse conjunto é a soma dos valores divididos pelo número total de observações.
Isto é
n
x + x 2 + x3 + Λ + x n ∑x i
x= 1 = i =1
n n
Mediana
A mediana representada por md obs é o valor que ocupa a posição central dos
dados ordenados. É o valor que divide os dados, isto é, metade dos dados será maior que a
mediana e metade será menor.
Considere a seguinte série de valores: 5, 2, 6, 13, 9, 15, 10.
De acordo com a definição de mediana, o primeiro passo a ser dado é ordenar o
conjunto de valores: 2, 5, 6, 9, 10, 13, 15. O valor que divide a série em duas partes iguais é
9. Logo, a mediana é 9.
Moda
A moda é dada pelo valor mais freqüente do conjunto de dados.
Máximo e Mínimo
O máximo é o valor maior da observação do conjunto de dados, enquanto que o
mínimo é a menor observação.
17
Definição 1.0: Amplitude de uma variável em um conjunto de dados
( x − x ) 2 + ( x 2 − x ) 2 + ( x3 − x ) 2 + Λ + ( x n − x ) 2 ∑ (x i − x)2
s2 = 1 = i =1
n −1 n −1
1 n 2 2
s = ∑ xi − n ( x )
2
n − 1 i =1
3.3 Quantis
Tanto a média como o desvio padrão podem não ser medidas adequadas para
representar um conjunto de dados, pois:
São afetadas, de forma exagerada, pois valores extremos:
Apenas com estes dois valores não temos idéia da simetria ou assimetria da
distribuição dos dados.
Para contornar esses fatos, outras medidas têm de ser consideradas.
Vimos que a medida é um valor que deixa metade dos dados abaixo dela e metade
acima. De modo geral, podemos definir uma medida, chamada quantil de ordem p
p-quantil, indicada por q(p), onde é uma proporção qualquer 0<p<1, tal que 100% das
observações sejam menores do que q(p).
18
q(0,25):1° Quartil=25º Percentil
q(0,50):2ºQuartil=Mediana=50ºPercentil
q(0,75):3ºQuartil=75ºPercentil
Exemplo 1.3
3.5 Exercícios
Resolução
−
25 x0 + 20 x1 + 3 x 2 + 1x3 + 1x 4
x = = 0,66
50
b) Calcule a variância?
25(0 − 0,66) 2 + 20(1 − 0,66) 2 + 3(2 − 0,66) 2 + 1(3 − 0,66) 2 + 1(4 − 0,66) 2
Var= =0,704
50
d) Se o livro tem 500 páginas, qual o número total de erros esperado no livro?
19
2) Medidas da pulsação de 15 índios nativos dos Alpes Peruanos estão apresentadas a
seguir:
64 64 68 68 76 60 72 88 60 68 80 60 72 88 60
Mediana=68
(b) Calcule: Mínimo, Q1, Q2, Q3 e Máximo;
Resolução
Maximo=60
Mínimo=60
q(0,25) = Q1 = 60
q(0,50) = Q2 = 68
q(0,75) = Q3 =76
4.1 Introdução
20
4.2 Associação entre Variáveis Qualitativas
Exemplo 1.4
Queremos verificar se existe ou não associação entre o sexo e a carreira escolhida
por 200 alunos de Economia e Administração.
A partir dessa tabela podemos observar que independentemente do sexo, 60% das
pessoas preferem Economia a 40% preferem Administração ( observe na coluna de
total)
Não havendo dependência entre as variáveis esperaríamos essas mesmas
proporções para cada sexo. Observando a tabela, vemos que as proporções do sexo
masculino (61% e 39%) e do sexo feminino (60% e 40%). Esses resultados parecem
indicar não haver dependência entre que, neste caso, as variáveis sexo e escolha do
curso parece ser não associados.
21
4.3 Medidas de Associação
X2
C= ,
X2 +n
X2
T= n
(r − 1)( s − 1)
Exemplo 1.5
Neste tipo de gráfico temos os possíveis pares de valores (x ,y), na ordem que
aparecem.
Para o exemplo, vemos que parece haver uma associação entre as variáveis,
porque no conjunto a medida que aumenta o tempo de serviço, aumenta o numero de
clientes.
22
Tabela1.5: Numero de anos de serviço (x) por numero de clientes (y) de agentes de uma
Companhia de Seguros.
Tabela 1.5
Agente Anos de Serviços(x) Números de clientes (y)
A 2 48
B 3 50
C 4 56
D 5 52
E 4 43
F 6 60
G 7 62
Fonte: Bussab e Morettin (2002)
Figura1.7
Gráficos de dispersão para as variáveis (x) anos de serviços e (y): numero de clientes.
Gráfico de Dispersão
70
7
Numeros de clientes
60 6
4
50 3 5
2
4
40 Gráfico de
30 Dispersão
20
10
0
0 2 4 6 8
Anos de Serviços
23
Se por acaso os pontos dos gráficos estivessem disperso e sem ordem de
crescimento ou de diminuição havendo acumulação entres eles, não haverá associação
entre as variáveis.
Exemplo1.6
_ _
( x − x)( y i − y )
Cov (x,y) = ∑i =1 i
n
,
n
24
Ou seja, a média dos produtos dos valores centrados das variáveis.
Com essa definição, o coeficiente de correlação pode ser escrito como,
Cov( x, y )
Corr (x, y) =
dp ( x).dp ( y )
4.6 Exercícios
Com base na tabela abaixo, você concluiria que o tipo de atividade está
relacionada ao fato de as embarcações serem de propriedades estatal ou particular ?
Encontre uma medida de dependência entre as variáveis.
Atividades
Propriedades Total
Costeira Fluvial Internacional
Resolução
Tabela de desvio
Atividades
Propriedades Total
Costeira Fluvial Internacional
25
5.0 Probabilidade
5.1 Introdução
Considera-se probabilidade como sendo uma função P(.) que atribui valores
numéricos aos eventos do espaço amostral.
Definição: Probabilidade
i)0 P(A) 1, ∀ A ⊂ Ω
ii)P(Ω)=1
n n
iii)P Υ Aj = ∑ p ( Aj ) , com os Aj ' s distintos
j =1 j =1
26
Sejam A e B eventos de Ω. Então
P(A ∪ B) =P(A) +P(B)-P(A ∩ B)
P(A ∩ B ) = P ( A B ) P ( B ),
Com P(B)>0.
P( A C j ) P (C j )
P(C j A ) = k
, j = 1,2,3,......, k .
∑ P( A C ) P(C )
i =1
i i
27
5.3 Exercícios
Resolução
62
835
Resolução
Resolução
P(H ∪ R ) = P ( H ) + P ( R ) − P ( H ∩ R )
476 287 92
P(H ∪ R ) = + − = 0,803
835 835 835
d)O filme ser policial dado que foi alugado por um homem?
Resolução
P( P ∩ H )
P(P H ) =
P( H )
248 476
P(P H ) = = P( P H ) = 0,91
476 835
28
Companhia MB
29
Bibliografia
Wilton de O. Bussab, Pedro A. Morettin- Estatística Básica- São Paulo : Saraiva. 5º edição,
2005.
30