UNIVERSIDADE FEDERAL DO PARAN

´
A
SETOR DE CI
ˆ
ENCIAS SOCIAIS APLICADAS
CURSO DE P
´
OS-GRADUAC¸
˜
AO EM DESENVOLVIMENTO ECON
ˆ
OMICO
Resolu¸ c˜ ao dos Exerc´ıcios da Disciplina de M´etodos Quantitativos
– Profs. Resp. Luiz Alberto Esteves e Mauricio Vaz Lobo Bittencourt –
Rodrigo Hermont Ozon
1
Mar¸ co de 2009
1
Endere¸co eletrˆonico rodrigo.ozon@ibqp.org.br Vide meu Curriculum Lattes . Erros e omiss˜oes s˜ao de
minha completa responsabilidade.
E como toda a vida humana ´e um grande jogo de azar!...
– Voltaire, Les d´elices (24 de novembro de 1755.
Ou ´e um Universo muito bem organizado ou um caos que se encolheu e abra¸ cou a si mesmo, por´em, em qualquer
caso, ´e um Universo, mesmo assim. Mas pode uma certa ordem substituir dentro de ti, enquanto se encontra a
desordem no Todo ?
– As medita¸ c˜oes de Marco Aur´elio, IV:27 (S´eculo II)
Sum´ario
1 Quest˜ao 1 4
1.1 (a) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
1.2 (b) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.3 (c) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.4 (d) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
1.5 (e) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
2 Quest˜ao 2 7
2.1 (a) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
2.2 (b) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
2.3 (c) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
2.4 (d) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
2.5 (e) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
2.6 (f ) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
2.7 (g) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
3 Quest˜ao 3 15
3.1 (a) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
3.2 (b) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
3.3 (c) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
3.4 (d) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
4 Quest˜ao 4 16
5 Quest˜ao 5 16
5.1 (a) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
5.2 (b) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
5.3 (c) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
6 Quest˜ao 6 20
7 Quest˜ao 7 20
8 Quest˜ao 8 20
9 Quest˜ao 9 21
10 Quest˜ao 10 22
4
Observa¸ c˜ ao: A planilha Excel com os c´ alculos desenvolvidos encontram-se aqui.
1 Quest˜ao 1
Dada a amostra:
18
15
20
19
19
18
16
17
20
18
16
15
17
19
18
17
16
18
17
19
1.1 (a)
Construa a distribui¸ c˜ ao de freq¨ uˆencias
Resposta:
“Uma distribui¸c˜ ao de frequˆencia ´e uma tabela resumida na qual os dados s˜ ao organizados em grupos
de classe ou categorias convenientemente estabelecidas e numericamente ordenadas.” Levine, Berenson
e Stephan, 2000 p. 60 [4]
Como explicam os autores, ao desenvolver a tabela de distribui¸ c˜ ao de frequˆencia, ´e desej´avel
que cada grupo de classe tenha largura de intervalo igual. Para determinar a largura do intervalo
de cada classe, a ´area de dados
2
´e dividida pelo n´ umero de classes desejado:
Largura do intervalo ≈
intervalo
n´ umero de grupos de classe desejado
(1)
Uma vez que existem somente 20 observa¸ c˜ oes, decidimos que 6 grupos de classe seriam
suficientes
3
. Atrav´es do c´ alculo da amplitude dada por X
maior
−X
menor
que ´e igual a 5 e de
(1) a largura de cada intervalo de classe ser´ a aproximadamente igual a:
Largura do intervalo ≈
5
5, 29
≈ 0, 94 ou ent˜ ao 1
Deste modo constru´ımos a tabela de distribui¸ c˜ ao de frequˆencias para a amostra:
2
intervalo=amplitude total
3
Quando se considera intervalos de classe de igual amplitude, o n´ umero de classes ´e obtido atrav´es da Regra
de Surges dada por: k = 1 + 3, 3 log
10
n, onde k = n´ umero de classe e n = n´ umero total de observa¸c˜oes Cancho
(2004, p. 13) [1]. Desta forma, para a amostra obtemos k = 1 + 3, 3 log
10
20 = 5, 29 (arrendondamento para 6)
5
X
i
Frequˆencia (f(X
i
))
15 por´em inferiores a 16 2
16 por´em inferiores a 17 3
17 por´em inferiores a 18 4
18 por´em inferiores a 19 5
19 por´em inferiores a 20 4
20 por´em inferiores a 21 2
¸
f(X
i
) ou Total 20
No entanto, como a amostra ´e contida de dados discretos, ou seja, “s´ o poderem assumir um
n´ umero finito de diferentes valores de diferentes valores dentro de um intervalo finito” Hoffman (2006,
p.25) [3],n˜ao h´a necessidade de determinar intervalos de classe.
Deste modo, reestruturamos a tabela da seguinte forma:
Frequˆencia
X
i
(f(X
i
))
15 2
16 3
17 4
18 5
19 4
20 2
¸
f(X
i
) ou Total 20
Tabela 1: Distribui¸c˜ao de frequˆencia de X
1.2 (b)
Determine as freq¨ uˆencias relativas
Resposta:
“A distribui¸ c˜ ao de frequˆencia relativa (...) ´e formada dividindo-se as frequˆencias em cada classe
da distribui¸c˜ ao de frequˆencia pelo n´ umero total de observa¸ c˜ oes. (Levine, Berenson e Stephan, 2000 p.
64 [4])
Deste modo, dividimos o valor de cada f(X
i
) obtido na tabela de distribui¸ c˜ ao de frequˆencia
do exerc´ıcio anterior (vide a tabela 1.1) pelo seu total (
¸
f(X
i
)) para obtermos:
Frequˆencia Frequˆencia Relativa
X
i
(f(X
i
)) (f
relativa
= f
i
/
¸
f
i
)
15 2 0,10
16 3 0,15
17 4 0,20
18 5 0,25
19 4 0,20
20 2 0,10
¸
ou Total 20 1,00
Tabela 2: Distribui¸c˜ao de frequˆencias relativas de X
1.3 (c)
Determine as freq¨ uˆencias acumuladas
Resposta:
6
A tabela de frequˆencias acumuladas ´e obtida atrav´es da tabela de distribui¸ c˜ ao de frequˆencias
de X obtida anteriormente (tabela 1.1) somando-se cada valor de frequˆencia pela anterior, da
seguinte maneira:
Frequˆencia Frequˆencia Acumulada
X
i
f(X
i
) f
Ac.
= f(X
i
) +f(X
i−1
)
15 2 2
16 3 5
17 4 9
18 5 14
19 4 18
20 2 20
¸
ou Total 20 20
Tabela 3: Distribui¸c˜ao de frequˆencias acumuladas de X
1.4 (d)
Determine as freq¨ uˆencias acumuladas relativas
Resposta:
Para a amostra dispon´ıvel e utilizando a tabela de frequˆencia relativa, obtemos:
Percentagem de X
i
com
X
i
Valor ”Inferior a ”Indicado
(f
Ac. Rel.
= f
Relativa
X
i
+ f
Relativa
X
i−1
)
15 0
16 0,10
17 0,25
18 0,45
19 0,70
20 0,90
¸
ou Total 1,00
Tabela 4: Distribui¸c˜ao de frequˆencias acumuladas relativas de X
1.5 (e)
A porcentagem dos valores menores que 19 e a dos maiores que 17
Resposta:
Para efetuar tais c´ alculos nos baseamos na tabela 1.1 de frequˆencias de X para verificar as
condi¸ c˜ oes destes valores estarem dentro de tais intervalos.
Os valores em porcentuais foram calculados da seguinte maneira:
• Se f(X
i
) for menor que 19 e 17 ent˜ ao calculamos a divis˜ ao de f(X
i
) pelo somat´ orio de
f(X
i
), ou seja, se 17 < f(X
i
) < 19 ent˜ ao f(X
i
)/
¸
f(X
i
) ;
• Se f(X
i
) for menor que 19 ent˜ ao calculamos a divis˜ ao de f(X
i
) pelo somat´ orio de f(X
i
),
ou seja, se f(X
i
) < 19 ent˜ ao f(X
i
)/
¸
f(X
i
);
• Se f(X
i
) for maior que 17 ent˜ ao calculamos a divis˜ ao de f(X
i
) pelo somat´ orio de f(X
i
),
ou seja, se f(X
i
) > 17 ent˜ ao f(X
i
)/
¸
f(X
i
)
7
Para 17 <
¸
f(X
i
) < 19 obtemos 25% dos valores dentro deste intervalo, j´a para
¸
f(X
i
) <
19 obtemos um intervalo de valores de 70% e para
¸
f(X
i
) > 17 obtemos 55%.
A tabela a seguir resume os c´ alculos elaborados:
Frequˆencia Percentagem de Percentagem de Percentagem de
X
i
(f) 17 < f(X
i
) < 19 f(X
i
) < 19 f(X
i
) > 17
15 2 0,10
16 3 0,15
17 4 0,20
18 5 0,25 0,25 0,25
19 4 0,20
20 2 0,10
¸
ou Total 20 0,25 0,70 0,55
Tabela 5: Resumo para propor¸c˜oes de 17 < f(X
i
) < 19, f(X
i
) < 19 e f(X
i
) > 17
2 Quest˜ao 2
Considere 2 empresas que pagam os seguintes sal´ arios aos seus funcion´ arios, em
R$:
Empresa A Empresa B
500 100
600 100
600 100
700 200
700 200
800 200
800 300
800 300
900 500
900 6000
1000
1000
1100
2.1 (a)
Calcule e interprete as medidas de tendˆencia central (m´edia aritm´etica, mediana e
moda) referentes ` a rela¸ c˜ ao salarial de cada empresa.
Resposta:
A m´edia aritm´etica que ´e a soma dos valores dividida pelo n´ umero de valores ´e calculada da
seguinte maneira:
X =
n
¸
i=1
X
i
n
Sendo X = m´edia aritm´etica da amostra, n = tamanho da amostra, X
i
=i−´esima observa¸ c˜ ao
da vari´ avel aleat´ oria X e
n
¸
i=1
X
i
= somat´orio de todos os valores de X
i
na amostra.
Para a nossa amostra das 2 empresas e sal´arios de funcion´arios obtemos:
8
X
Empresa A
=
n
¸
i=1
X
i
n
=
500, 00 + 600, 00 + 600, 00 +. . . + 1100, 00
13
= R$ 800,00
X
Empresa B
=
n
¸
i=1
X
i
n
=
100, 00 + 100, 00 + 100, 00 +. . . + 500, 00 + 6000, 00
10
= R$ 800,00
Observamos aqui que a m´edia calculada ´e a mesma (R$ 800,00) para ambas as empresas
mesmo que somente a empresa A apresente trˆes valores salariais iguais a m´edia calculada. Al´em
disso, verificamos que para esse conjunto de dados, na empresa A cinco valores s˜ ao menores que
a m´edia e cinco s˜ ao maiores, enquanto que para a empresa B, apesar de nenhum funcion´ario
receber sal´ario igual a m´edia, nove valores s˜ ao menores que a sua m´edia e somente um ´e maior.
“A m´edia funciona como um ponto de equil´ıbrio de modo que as observa¸ c˜ oes que s˜ ao menores
equilibram aquelas que s˜ ao maiores.
Note que o c´ alculo da m´edia baseia-se em todas as observa¸ c˜ oes (X
1
, X
2
, . . . , X
n
) no conjunto
de dados. Nenhuma outra medida de tendˆencia central comumente utilizada possui essa
caracter´ıstica. Uma vez que seu c´ alculo baseia-se em todas as observa¸ c˜ oes, a m´edia aritm´etica
´e altamente afetada por um ou mais valores exremos. Nestes casos, a m´edia aritm´etica n˜ ao
seria a melhor medida a ser utilizada para descrever ou resumir tal conjunto de dados”.
Levine, Berenson e Stephan, 2000 p. 120 [4].
O c´ alculo da mediana que ´e o valor do meio de uma sequˆencia ordenada de dados, ´e desen-
volvido da seguinte maneira:
“Caso n˜ ao existam valores repetidos, metade das observa¸ c˜ oes ser´ a menor e metade ser´ a
maior. A mediana n˜ ao ´e afetada por qualquer observa¸ c˜ ao extrema em um conjunto de dados.
Assim, sempre que uma observa¸ c˜ ao extrema est´ a presente, ´e apropriado utilizar a mediana
em vez de m´edia aritm´etica para descrever um conjunto de dados.
Para calcular a mediana atrav´es de um conjunto de dados coletados em sua forma crua,
precisamos primeiramente posicionar os dados em uma posi¸ c˜ ao ordenada. Ent˜ ao utilizamos
a f´ ormula do ponto de posicionamento
D =
n+1
2
para encontrar, na disposi¸ c˜ ao ordenada, o lugar que corresponde ao valor da mediana. Uma
das seguintes regras ´e
• Regra 1: Se o tamanho da amostra for um n´ umero ´ımpar, a mediana ´e representada pelo
valor num´erico correspondente ao ponto de posicionamento - (n+1)/2 das observa¸ c˜ oes
ap´ os ordena¸ c˜ ao.
• Regra 2: Se o tamanho da amostra for um n´ umero par, o ponto de posicionamento fica
entre as duas observa¸ c˜ oes no meio na disposi¸ c˜ ao ordenada. A mediana ´e a m´edia dos
valores num´ericos correspondentes ` aquelas observa¸ c˜ oes centrais.” Levine, Berenson e
Stephan (2000, p. 122) [4]
Para a amostra de tamanho par, “a mediana ´e, por conven¸c˜ ao, a m´edia aritm´etica
dos dois valores centrais” Hoffman (2006, p.32) [3] e para ´ımpar “a mediana ´e o
valor central”.
Com a organiza¸ c˜ ao dos dados em ordem crescente obtemos as seguintes classifica¸ c˜ oes para
ambas empresas:
9
Empresa A Empresa B
500,00 100,00
600,00 100,00
600,00 100,00
700,00 200,00
700,00 200,00
800,00 200,00
800,00 300,00
800,00 300,00
900,00 500,00
900,00 6000,00
1000,00
1000,00
1100,00
Para a empresa A como n ´e ´ımpar, calculamos a m´edia de
800,00+800,00
2
= 800, 00 para
obtermos o valor da mediana, e para a empresa B como n ´e par, o valor da mediana, por
conven¸ c˜ ao ´e igual a 200,00.
A moda, ou o valor que ocorre com maior frequˆencia para a amostra de sal´arios da empresa
A = M
1
= 800, 00 e para a empresa B = M
1
= 100, 00, sendo portanto unimodais.
No entanto, como os sal´arios se caracterizam como vari´ avel cont´ınua precisamos tabular e
organizar os dados em distribui¸ c˜ oes de frequˆencias para o c´ alculo das medidas de tendˆencia
central.
Valor Frequˆencia Frequˆencia Relativa Frequˆencia Acumulada Frequˆencia Rel. Ac.
f(X
i
) f(X
i
)/
¸
f(X
i
) f
Ac.
= f(X
i
) + f(X
i−1
) f
Ac.Rel
= f
Rel.
X
i
+ f
Rel.
X
i−1
400 por´em inferiores a 600 1 0,08 1 0,08
600 por´em inferiores a 800 4 0,31 5 0,38
800 por´em inferiores a 1000 5 0,38 10 0,77
1000 por´em inferiores a 1200 3 0,23 13 1,00
Totais 13 1 13 1,00
Tabela 6: Distribui¸c˜ao de Frequˆencias completa para os sal´arios pagos aos funcion´arios da Empresa A
Valor Frequˆencia Frequˆencia Relativa Frequˆencia Acumulada Frequˆencia Rel. Ac.
f(X
i
) f(X
i
)/
¸
f(X
i
) f
Ac.
= f(X
i
) + f(X
i−1
) f
Ac.Rel
= f
Rel.
X
i
+ f
Rel.
X
i−1
0 por´em inferiores a 2000 9 0,9 9 0,9
6000 por´em inferiores a 8000 1 0,1 10 1
Totais 10 1 10 1
Tabela 7: Distribui¸c˜ao de Frequˆencias completa para os sal´arios pagos aos funcion´arios da Empresa B
Deste modo o c´ alculo da m´edia aritm´etica para as distribui¸ c˜ oes de frequˆencias toma a seguinte
especifica¸ c˜ ao:
X =
k
¸
j=1
X
j
f
j
k
¸
j=1
f
i
=
1
n
k
¸
j=1
X
j
f
j
10
J´a a mediana, dada pela rela¸ c˜ ao: Hoffman, 2006 p. 32 [3]
D = L
h
+
1
f
h

¸
n
2

h−1
¸
j=q
f
j
¸

(L
h+1
−L
h
)
“Onde se sup˜ oe que a classe mediana seja a h−´esima, D indica a mediana, L
h
´e o limite
inferior da classe mediana, L
h+1
´e o limite superior da classe mediana, n ´e o n´ umero de dados
observados, f
h
´e a frequˆencia da classe mediana e
¸
h−1
j=1
f
j
´e a soma das frequˆencias das classes
inferiores ` a classe mediana.” Hoffman, 2006 p. 32 [3].
Todavia, n˜ao podemos encontrar a classe mediana quando a distribui¸ c˜ ao de frequˆencias
assume intervalos de classe pares, uma vez que a f´ormula acima ´e interpolativa.
Finalmente, se calcularmos a moda para os sal´arios em ambas as empresas, e para isso,
primeiramente localizamos a classe modal, “que no caso de intervalos de classe terem a mesma
amplitude ´e aquela que apresenta a maior frequˆencia. Se a amplitude das classes varia, a classe
modal ´e aquela que apresenta o maior valor para o quociente da divis˜ ao da frequˆencia pela
amplitude do intervalo de classe.” Hoffman, 2006 p. 33 [3]
Assim, a f´ormula que representa o c´ alculo da moda para as distribui¸ c˜ oes de frequˆencia assume
a seguinte especifica¸ c˜ ao:
M = L
h
+
f
h
−f
h−1
2f
h
−f
h−1
−f
h+1
(L
h+1
−L
h
)
onde: sup˜oe-se que a classe modal seja a h−´esima, M a moda, L
h
, L
h+1
e f
h
s˜ ao respec-
tivamente, o limite inferior, o limite superior e a frequˆencia da classe modal, e f
h−1
, f
h+1
s˜ ao
frequˆencias das classes vizinhas `a classe modal.
Deste modo, calculamos a moda para ambas as empresas da seguinte maneira:
M
Empresa A
= 800 +
5 −4
2 · 5 −4 −3
· 200 = 866, 66
M
Empresa B
= 0 +
9 −1
2 · 9 −1
· 2000 = 941, 17
Finalmente, conclu´ımos resumidamente que as medidas de tendˆencia central para os dados
de sal´arios pagos aos funcion´arios de ambas as empresas pode ser facilmente visualizado pela
tabela abaixo:
Estat´ıstica Empresa A Empresa B
M´edia 800,00 800,00
Mediana 800,00 200,00
Moda 800,00 100,00
Media (dist. freq.) 853,85 1.600,00
Mediana (dist. freq.) - -
Moda (dist. freq.) 866,66 941,18
Tabela 8: Resumo das Medidas de Tendˆencia Central para a amostra de sal´arios entre as empresas A e B
2.2 (b)
Ao analisar as medidas de tendˆencia central (MTC) e esbo¸ car, em um gr´ afico,
a distribui¸ c˜ ao dos sal´ arios pagos pela empresa A, o que se pode concluir sobre
a rela¸ c˜ ao existente entre as suas MTC ? Quanto ` a sua distribui¸ c˜ ao, ela ´e uma
distribui¸ c˜ ao sim´etrica, assim´etrica positiva ou assim´etrica negativa ?
Resposta:
11
Se considerarmos que os dados s˜ ao discretos, a distribui¸ c˜ ao ´e unimodal e sim´etrica pois
X = D = M = 800, 00, e se considerarmos que sal´arios se caracterizam como cont´ınuos,
verificamos que a distribui¸ cao ´e unimodal assim´etrica a esquerda pois X < M ou seja X =
853, 85 < M = 866, 66.
2.3 (c)
Fazer o mesmo solicitado na letra b) para a empresa B.
Resposta:
Como visto na tabela 2.1 vimos que X = 800, 00 > D = 200, 00 > M = 100, 00 que se
caracteriza como uma distribui¸ c˜ ao de frequˆencias unimodal e assim´etrica `a direita (assimetria
positiva) e se considerarmos que os sal´arios s˜ ao cont´ınuos, vemos que a distribui¸ c˜ ao de frequˆencias
tamb´em ´e unimodal e assim´etrica `a direita, uma vez que X = 1.600, 00 > M = 941, 18.
Vale ressaltar um exemplo de lit´ıgio salarial em uma empresa destacado por Hoffman (2006) [3]:
“Do ponto de vista do empres´ ario, preocupado com os custos de produ¸ c˜ ao, o sal´ ario m´edio ´e a
medida de tendˆencia central mais conveniente (...). Para os representantes dos trabalhadores,
12
por outro lado, o sal´ ario modal e o sal´ ario mediano seriam medidas de tendˆencia central
mais apropriadas do que o sal´ ario m´edio, pois refletem melhor a situa¸c˜ ao da maioria dos
empregados.” Hoffman, 2006 p. 39 [3].
2.4 (d)
Encontre o desvio-padr˜ ao dos sal´ arios pagos pela empresa A e dos sal´ arios pagos
pela empresa B, considerado o n´ umero total de sal´ arios que cada empresa paga.
Resposta:
A variˆ ancia da popula¸ c˜ ao ´e igual `a soma das diferen¸ cas ao quadrado em torno da m´edia
aritm´etica da popula¸ c˜ ao, divida pelo tamanho da popula¸ c˜ ao:
σ
2
Empresa A
=
N
¸
i=1
(X
i
−µ)
2
N
= 29.230, 77
onde N = tamanho da popula¸ c˜ ao e µ = m´edia aritm´etica da popula¸ c˜ ao enquanto o desvio
padr˜ ao (σ
2
) para a empresa A ´e σ
2
=

σ
2
=

29.230, 77 = 170, 97 e da mesma maneira para a
empresa B:
σ
2
Empresa B
=
N
¸
i=1
(X
i
−µ)
2
N
= 3.018.000, 00
e

σ
2
Empresa B
= 1737, 24
2.5 (e)
Mas se fosse considerada uma amostra, haveria diferen¸ ca no resultado do desvio-
padr˜ ao dessa amostra para o desvio-padr˜ ao da popula¸ c˜ ao ? Por quˆe ?
Resposta:
Inicialmente, ´e interessante distinguir popula¸ c˜ ao e amostra, sendo que popula¸ c˜ ao ´e o conjunto
total de elementos portadores de, pelo menos, uma caracter´ıstica comum.
E amostra ´e uma parcela representativa da popula¸ c˜ ao que ´e examinada com o prop´ osito de
tirarmos conclus˜oes sobre a essa popula¸ c˜ ao.
Sobre isso, Cancho (2004, p. )
“Uma popula¸c˜ ao ´e o conjunto maior de indiv´ıduos ou objetos cujo estudo nos interessa
ou acerca dos quais deseja ter informa¸ c˜ oes. Os elementos desse conjunto se denominam
dados ou observa¸ c˜ oes. As observa¸ c˜ oes mensur´ aveis denominam-se dados quantitativos. Por
exemplo, altura de estudantes, idade de pessoas, a dura¸ c˜ ao de uma lˆ ampada de luz ( vida
´ util das lˆ ampadas) etc. Por´em, o sexo, o estado civil das pessoas, a marca de cigarros s˜ ao
n˜ ao mensur´ aveis e denominam-se dados qualitativos. Assim, uma popula¸c˜ ao estat´ıstica ´e o
conjunto de observa¸ c˜ oes quantitativas ou qualitativas. A popula¸c˜ ao sendo infinita, portanto,
´e imposs´ıvel ter uma informa¸ c˜ ao completa sobre ela, a popula¸c˜ ao sendo numerosa talvez
n˜ ao seja poss´ıvel estudar cada um dos seus elementos. Nesses casos, recorre-se ` a informa¸ c˜ ao
proporcionada por uma parte nita da popula¸c˜ ao chamada amostra. Em estat´ıstica ´e freq¨ uente
trabalhar com as chamadas amostras aleat´ orias, nas quais todos os elementos da popula¸c˜ ao
tˆem a mesma chance de serem escolhidos para compor a amostra. Uma amostra aleat´ oria
tem a propriedade de refletir as caracter´ısticas da popula¸ c˜ ao da qual foi sorteada.” Cancho,
(2004, p. 2) [1]
13
Para calcularmos o desvio padr˜ ao inicialmente pegamos a raiz quadrada da variˆ ancia da
amostra (S
2
) de sal´arios dada por:
S
2
=
n
¸
i=1
(X
i
−X)
2
n −1
S
2
Empresa A
=
(500, 00 −800, 00)
2
+ (600, 00 −800, 00)
2
+. . . + (1.100, 00 −800, 00)
2
13 −1
= 31.666, 66
e a partir da variˆ ancia calculamos o desvio padr˜ ao (S) que ´e o mesmo que:
S
Empresa A
=

n
¸
i=1
(X
i
−X)
2
n −1
= 177, 95
e da mesma forma para a empresa B obtemos:
S
Empresa B
=

n
¸
i=1
(X
i
−X)
2
n −1
= 1.831, 21
J´a a variˆ ancia (σ
2
) e o desvio padr˜ ao da popula¸ c˜ ao (σ) s˜ ao obtidos da seguinte maneira:
A variˆ ancia da popula¸ c˜ ao ´e igual `a soma das diferen¸ cas ao quadrado em torno da m´edia
aritm´etica da popula¸ c˜ ao, dividida pelo tamanho da popula¸ c˜ ao.
µ =
¸
N
i=1
(X
i
−µ)
2
N
onde N = tamanho da popula¸ c˜ ao, X
i
= i−´esimo valor da vari´ avel aleat´ oria,
¸
N
i=1
X)
i
=
somat´orio de todos os valores de X
i
da popula¸ c˜ ao,
¸
N
i=1
(X
i
− µ)
2
) = somat´orio de todas as
diferen¸ cas ao quadrado entre os valores X
i
e µ. E o desvio-padr˜ ao da popula¸ c˜ ao (σ) ´e a raiz
quadrada da variˆ ancia da popula¸ c˜ ao (σ
2
):
σ =

¸
N
i=1
(X
i
−µ)
2
N
Logo, nota-se a partir das f´ormulas amostrais e populacionais que haveria prov´ aveis diferen¸ cas
nos resultados conforme elucidam Levine, Berenson e Stephan (2000, p. 151) [4]:
“Notamos que as f´ ormulas para a variˆ ancia da popula¸c˜ ao e para o desvio padr˜ ao diferem das
f´ ormulas para a amostra na medida em que (n −1) no denominador de S
2
e S ´e substitu´ıdo
por N no denominador de σ
2
e σ.
A tabela a seguir compara as medidas de dispers˜ ao amostral e populacional:
14
Medida de Dispers˜ ao Empresa A Empresa B
M´edia Amostral (X) 800,00 800,00
M´edia Populacional (µ) 800,00 800,00
Variˆ ancia Amostral 31666,67 3353333,33
Variˆ ancia populacional 29230,77 3018000,00
Desvio padr˜ ao Amostral 177,95 1831,21
Desvio padr˜ ao populacional 170,97 1737,24
Tabela 9: Comparativo entre medidas de dispers˜ao amostral e populacional
2.6 (f )
Comparando a m´edia salarial da empresa A com a m´edia salarial da empresa B,
pode-se afirmar que as 2 m´edias tˆem a mesma representatividade? Justifique com
base no desvio-padr˜ ao.
Resposta:
Como visto na tabela 2.5 do exerc´ıcio anterior, para os mesmos valores de m´edias para ambas
empresas: “Essa medida de posi¸ c˜ ao apresenta a desvantagem de ser fortemente influenciada por
valores discrepantes, isto ´e, valores muito pequenos ou muito elevados. Portanto, nesse caso essa
medida j´ a n˜ ao ser´ a um valor representativo do conjunto de dados.” Cancho (2004, p. 18) [1]
A variˆ ancia e o desvio padr˜ ao s˜ ao utilizados para comparar a variabilidade de conjuntos de
dados expressados nas mesmas unidades, com m´edias que sejam aproximadamente similares.
Deste modo vimos que tanto as variˆ ancias amostrais e populacionais da empresa A s˜ ao muito
menores do que os da empresa B, e da mesma maneira os desvios-padr˜ oes, evidenciando que os
sal´arios da empresa A apresentam menor variabilidade do que a empresa B.
Portanto, n˜ao podemos afirmar que as 2 m´edias tem a mesma representatividade, se consid-
erarmos as medidas de variabilidade em torno das mesmas.
2.7 (g)
Com base na conclus˜ ao da letra d), em qual das duas empresas vocˆe gostaria de
trabalhar ? Por quˆe ?
Resposta:
Se nos basearmos no crit´erio de escolha somente pelos desvios-padr˜ oes notamos como evi-
denciado anteriormente que a empresa A ´e menos vol´ atil que a B, todavia o desvio padr˜ ao como
medida de dispers˜ ao absoluta dimensiona o afastamento m´edio entre os termos de uma s´erie e
seu valor m´edio. Seu resultado ´e expresso na mesma unidade de medida dos dados pesquisados.
Se medirmos o coeficiente de varia¸ c˜ ao que ´e uma medida de variabilidade adimensional
expressa o n´ umero de vezes que o desvio padr˜ ao cont´em a m´edia. Essa medida estat´ıstica ´e
utilizada para comparar conjuntos de dados que tˆem diferentes unidades ou quando as m´edias
s˜ ao muito diferentes. Denota-se o coeciente de variabilidade populacional e amostral por CV e
cv; respectivamente.
Popula¸ c˜ ao: CV =
σ
µ
onde µ = m´edia populacional e σ = desvio padr˜ ao populacional; e
Amostral: cv =
S
X
15
onde X = m´edia amostral e S = desvio padr˜ ao amostral, encontramos:
CV
Empresa A
= 0, 2137 CV
Empresa B
= 2, 1715
cv
Empresa A
= 0, 2224 cv
Empresa B
= 2, 2890
Concluindo, portanto, com base na m´edia salarial igual em ambas empresas e sendo os
desvios-padr˜ oes e coeficientes de varia¸ c˜ ao da empresa B superiores aos da empresa A, claramente
opta-se por trabalhar na empresa A pela sua menor dispers˜ ao salarial.
3 Quest˜ao 3
Considere as informa¸ c˜ oes do seguinte quadro:
PESO Excessivo Normal Deficiente Peso Total
PRESS
˜
AO
Elevada 0,10 0,08 0,02 0,20
Normal 0,15 0,45 0,20 0,80
Total 0,25 0,53 0,22 1
3.1 (a)
Qual a probabilidade de uma pessoa escolhida ao acaso ter press˜ao elevada ?
Resposta:
Sendo P(A) a probabilidade de ocorrˆencia do evento press˜ ao elevada, ent˜ao P(A) = 0, 20 ou
20%.
3.2 (b)
Qual a probabilidade de uma pessoa escolhida ao acaso ter peso deficiente ?
Resposta:
Sendo P(B) a probabilidade de ocorrˆencia do evento simples (ou marginal), peso deficiente,
ent˜ao P(A) = 0, 22 ou 22%.
3.3 (c)
Se a pessoa escolhida ao acaso tem excesso de peso, qual a probabilidade de ter
press˜ ao elevada ?
Resposta:
Sendo P(C) a probabilidade de ocorrˆencia do evento simples (ou marginal), excesso de peso
e P(A) a probabilidade de ocorrˆencia do evento press˜ ao elevada, ent˜ao P(C) = P(A)|P(C) =
0, 10/0, 25 = 0, 22 ou 22%.
3.4 (d)
Se a pessoa escolhida ao acaso tem press˜ ao normal, qual a probabilidade de ter peso
deficiente ?
Resposta:
Sendo P(D) a probabilidade de ocorrˆencia do evento press˜ ao e P(B) a probabilidade de
ocorrˆencia do evento peso deficiente, ent˜ao P(D) = P(B)/P(D) = 0, 20/0, 80 = 0, 20 ou 20%.
16
4 Quest˜ao 4
Dados os valores de X e suas respectivas probabilidades, encontre a esperan¸ ca e a
variˆ ancia de x.
X p(X)
0 1/16
1 4/16
2 6/16
3 4/16
4 1/16
Resposta:
A esperan¸ ca ou valor esperado ´e a m´edia ponderada dos valores que a vari´ avel aleat´ oria ou
fun¸ c˜ ao assume, usando-se, como pesos para pondera¸ c˜ ao, as probabilidades correspondentes a
cada valor.
Deste modo, para uma vari´ avel aleat´ oria discreta temos: E(X) =

¸
i=1
p(X
i
)X
i
e para uma
vari´ avel aleat´ oria cont´ınua X o valor esperado calcula-se mediante o integral de todos os valores
da fun¸ c˜ ao de densidade f(x):
f(E(X)) =


−∞
Xf(x)d(x)
Nessa defini¸ c˜ ao sup˜oe-se que somat´orio e a integral convergem. Em caso contr´ario dizemos
que o valor esperado da vari´ avel aleat´ oria X n˜ao existe.
Como para a amostra selecionada E(X) = µ = 2, “A distribui¸c˜ ao, ou dispers˜ ao, dos valores X
em torno do valor esperado pode ser medida pela variˆ ancia, que ´e definida como
var(X) = σ
2
X
= E(X −µ)
2
A raiz quadrada positiva de σ
2
X
, σ
X
e definida como desvio-padr˜ ao de X. A variˆ ancia ou o desvio-
padr˜ ao d˜ ao uma indica¸ c˜ ao de qu˜ ao pr´ oxima ou dispersamente os valores X individuais se espalham em
torno de seu valor m´edio. A variˆ ancia definida anteriormente ´e calculada como segue: Gujarati, 2000 p.
771 [2]
¸
x
(X −µ)
2
f(x) se X for uma v.a. discreta (2)
=


−∞
(X −µ)
2
f(x)d(x) se X for uma v.a. cont´ınua
Por conveniˆencia de c´ alculo, a f´ ormula da variˆ ancia dada anteriormente pode tamb´em ser expressa
como”
(X) = σ
2
x
= E(X −µ)
2
= E(X
2
) −µ
= E(X
2
) −[E(X)]
2
Assim, utilizando-se da equa¸ c˜ ao (2) obtemos:
var(X) = (0 −2)
2
1/16 + (1 −2)
2
4/16 + (2 −2)
2
6/16 + (3 −2)
2
4/16 + (4 −2)
2
1/16 = 1%
5 Quest˜ao 5
Dada a fun¸ c˜ ao f(x) =

K(1 −X) se 1 ≤ X ≤ 2
0 para outros valores
Pede-se:
5.1 (a)
O valor de K para que f(x) seja uma PDF
Resposta:
Como explicam Morettin, Hazzan e Bussab (2003, p.196) [5]
“Esse conceito ´e bastante utilizado em Estat´ıstica, em que as probabilidades s˜ ao calculadas
como ´ areas sob um gr´ afico de uma fun¸ c˜ ao chamada densidade de probabilidade. Dada uma
vari´ avel cont´ınua, as probabilidades a ela associadas s˜ ao obtidas a partir de uma fun¸ c˜ ao f(x)
chamada fun¸ c˜ ao densidade de probabilidade, cujas caracter´ısticas s˜ ao:
• (i)f(x) ≥0, para todo x;
• (ii)


−∞
f(x)dx = 1
Por exemplo, pode-se verificar que a fun¸ c˜ ao
f(x) =

e
−x
se x ≥ 0
0 se x < 0
´e uma fun¸ c˜ ao densidade de probabilidade. A probabilidade de uma vari´ avel cont´ınua estar
entre dois valores a e b, com a < b ´e dada pela integral

b
a
f(x)dx. Assim, no exemplo dado,
a probabilidade de a vari´ avel estar entre 1 e 3 ´e dada por

3
1
e
−x
dx = [−e
−x
]
3
1
= −e
−3
+e
−1
=
1
e

1
e
3
Deste modo, para encontrarmos o valor de K, calculamos a integral

2
1
K(1 −X)dx
Para que seja uma fun¸ c˜ ao de densidade ´e preciso verificar se a ´area sob eixo x e a fun¸ c˜ ao
f(x) ´e igual a 1. Isto ´e, a integral de −∞ a ∞ deve ser igual a um.

−∞

f(x)d(x) =

1
−∞
f(x)d(x) +

2
1
f(x)d(x) +


2
f(x)d(x) =

2
1
f(x)d(x)
=

2
1
K(1 −X)dx = K ·
¸
X −
X
2
2

2
1
= K ·
¸
2 −
2
2
2
−1 −
1
2
2

= −
1
2
K
Logo, para encontrarmos a fun¸ c˜ ao de distribui¸ c˜ ao de probabilidades, o valor da integral
definida deve ser igual a 1

1
2
K = 1
Ent˜ao ´e f´acil ver que se
K = −2 =

2
1
K(1 −X)dx = 1
Tirando a prova real para K = −2 em f(x), encontramos

2
1
−2(1 −X)dx
= −2 ·
¸
X −
X
2
2

2
1
= −2 ·
¸
2 −
2
2
2
−1 −
1
2
2

17
18
= −2 ×−
1
2
= 1
ent˜ao finalmente provamos que:

2
1
−2(1 −X)dx = 1
1 = 1
no qual o valor de K = −2 faz com que a f(x) seja uma PDF.
5.2 (b)
O gr´ afico da fun¸ c˜ ao
Resposta:
Observa-se que a fun¸ c˜ ao f(x) ≥ 0 (´e n˜ao negativa) ∀x ∈ R, ou seja, no D = {x|1 ≤ x ≤ 2} e
Im = {f(x)|0 ≤ f(x) ≤ 2}.
5.3 (c)
As probabilidades P(x < 3/2) e P(x ≥ 5/3)
Resposta:
Quando um dos extremos (limites) da integra¸ c˜ ao forem por exemplo +∞
Defini¸ c˜ ao:


a
f(x)dx = lim
k→∞

k
a
f(x)dx,
desde que o limite exista e seja finito.
Analogamente, definem-se:

b
−∞
f(x)dx = lim
k→−∞

b
k
f(x)dx desde que o limite seja finito
19


−∞
f(x)dx =

c
−∞
f(x)dx +


c
f(x)dx desde que existam as integrais do segundo
membro para o valor c considerado
Se chamarmos de probabilidade do evento: A = {x ∈ R
x
| x < 3/2}, ou seja,
P(A) = P(X < 3/2) =

3/2
−∞
f(x)dx =

1
−∞
f(x)dx +

3/2
1
f(x)dx =

3/2
1
f(x)dx
4
=

3/2
1
K(1 −X)dx = K ·
¸
X −
X
2
2

3/2
1
= K ·
¸
3/2 −
(3/2)
2
2
−1 −
1
2
2

=
= K ·
¸
3
2

9/4
2

1
1

1
2

= K ·
¸
3
2

9
4
×
1
2

1
1

1
2

=
K ·
¸
3
2

9
8

1
1

1
2

= K ·
¸
12
8

9
8

8
8

4
8

= −
1
8
K
Como do exerc´ıcio anterior encontramos K = −2, substitu´ımos no resultado para
P(A) = P(X < 3/2) = −
1
8
×−2 =
1
4
= 0, 25
J´ a para a probabilidade do evento: B = {x ∈ R| x ≥ 5/3}, fazemos:
P(B) = P(X ≥ 5/3) =


5/3
f(x)dx =


8/3
f(x)dx +

8/3
5/3
f(x)dx =

8/3
5/3
f(x)dx
=

8/3
5/3
K(1 −X)dx = K ·
¸
X −
X
2
2

8/3
5/3
= K ·
¸
8
3

8/3
2
2

5
3

5/3
2
2

= K·
¸
8
3

32
9

5
3

25
18

= K·
¸
24
9

32
9


16
18

5
18

= K·
¸
16
18

5
18

= K·
¸

21
18

= −
7
6
K
Como do exerc´ıcio anterior encontramos K = −2, substitu´ımos no resultado para
P(B) = P(X ≥ 5/3) = −
7
6
×−2 =
14
6
= 2, 3333
Note que este resultado parece um pouco estranho uma vez que se espera que P(B) fique entre 0 e
1. Se calcularmos pela defini¸ c˜ ao apresentada no in´ıcio, verificamos que:
lim
k→∞

k
5/3
K(1 −X)dx
= lim
k→∞
¸
X −
X
2
2


5/3
= lim
k→∞
¸
∞−

2
2

5
3

25
18
)

= n˜ ao ∃ nos R, ou seja, o limite ´e indefinido.
No entanto, se reescrevermos o intervalo para o evento P(A e B)= {X ∈ R|3/2 ≤ X ≤ 5/3}, teremos

5/3
3/2
K(1 −X)dx
= K ·
¸
5
3

25
18

3
2

9
8

= −
7
72
K = −
7
72
×−2 =
14
72
=
1
5
= 0, 1944
4
Para os limites superiores da integral definida, quando queremos obter P(x < qualquer n´ umero real), sub-
tra´ımos o equivalente a uma unidade do mesmo e ao contr´ario, quando desejamos saber se P(x > qualquer n´ umero
real), adicionamos o equivalente a uma unidade. Caso contr´ario de acordo com a defini¸c˜ao exposta acima, o valor
de
lim
k→−∞

3/2
k
K(1 −X) = lim
k→∞
¸
x −
x
2
2

3/2
−∞
= lim
k→−∞
¸
3
8
−k −
k
2
2

= −∞
e n˜ao encontrar´ıamos a percentual de probabilidade. No exerc´ıcio para encontrar P(x < 3/2) subtra´ımos 1/2,
ou seja fizemos 3/2 −1/2 = 1 para encontrar os limites da integral definida para b (superior) e a (inferior).
20
6 Quest˜ao 6
Dado X˜N(3, 16), ou seja, X segue uma distribui¸ c˜ ao normal com m´edia 3 e variˆ ancia 16,
encontre a probabilidade de X ser maior igual a 2 e menor que 5, ou seja, P(2 ≤ X ≤ 5).
Resposta:
Para que n˜ ao precisemos utilizar a fun¸ c˜ ao:
f(X) =
1

2πσ
e
−(1/2)(X−µ)/σ]
2
utilizamos a padroniza¸ c˜ ao dos dados, geralmente dispostos em tabelas da distribui¸ c˜ ao normal padronizada.
Utilizando a f´ ormula da transforma¸ c˜ ao (Z), qualquer vari´ avel aleat´ oria normal X ´e convertida em uma
vari´ avel normal padronizada Z.
O valor de Z ´e igual `a diferen¸ ca entre X e a m´edia aritm´etica µ, dividida pelo desvio padr˜ ao σ.
Z =
X −µ
σ
Enquanto os dados originais para a v.a. X possu´ıam m´edia aritm´etica µ e desvio padr˜ ao σ, a vari´ avel
aleat´ oria padronizada Z ter´ a sempre m´edia aritm´etica µ = 0 e desvio padr˜ ao σ = 1
Sendo X˜N(3, 16) ou seja, distribu´ıda normalmente com µ = 3 e σ
2
= 16 e sabendo-se que σ =

σ
2
= 4 a P(2 ≤ X ≤ 5), ser´ a obtida atrav´es da padroniza¸ c˜ ao para X = 2 e X = 5
Z =
2 −3
4
= −1/4 ou −0, 25 e
5 −3
4
= 1/2 ou 0, 5
Deste modo, a probabilidade pedida para X = 2 que corresponde na tabela de distribui¸ c˜ ao normal
padronizada ao valor de Z de 0,0987 e X = 5 a 0,1915.
Logo P(2 ≤ X ≤ 5) = P(−0, 25 ≤ X ≤ 0, 5) = 0, 0987 + 0, 1915 = 0, 2902 ou ent˜ ao 29%.
7 Quest˜ao 7
Se uma variavel aleat´ oria tem distribui¸ c˜ ao normal com µ = 10 e σ = 5 , qual e a probabilidade
de ela assumir um valor no intervalo de 12 a 15 ?
Resposta:
Para encontrarmos P(12 ≤ X ≤ 15) procedemos primeiramente com a f´ ormula da padroniza¸ c˜ ao:
Z
12
=
12 −10
5
=
2
5
= 0, 4 e Z
15
=
15 −10
5
= 1
Em seguida, subtra´ımos a ´area correspondente de Z
15
da tabela que ´e =0,3413 de Z
12
= 0, 4 = 0, 1554
P(12 < X < 15) = 0, 3413 −0, 1554 = 0, 1859 ou 18,6%.
8 Quest˜ao 8
Calcular os ´ındices de pre¸ cos de Laspeyres, Paasche e Fischer para os dados abaixo: (ano-
base 2002)
2002 2003
Item Pre¸co Quantidade Pre¸co Quantidade
X 35 3 39 5
Y 28 5 20 8
Z 12 9 18 10
Resposta:
O ´ındice de Laspeyres ´e dado pela f´ ormula:
21
I

L
(p
t
|p
0
) =
n
¸
i=1
P
it
Q
i0
n
¸
i=1
P
i0
Q
i0
· 100
Onde P
it
´e o valor do pre¸ co no per´ıodo t, Q
i0
´e a quantidade no ano-base e P
i0
´e o pre¸ co no ano-base.
Para medirmos a varia¸ c˜ ao no n´ıvel de pre¸ cos, comparamos o custo de aquisi¸c˜ ao da cesta de mercadorias
q
t
no per´ıodo t, dado por
¸
P
it
Q
it
, com custo de aquisi¸ c˜ ao da cesta de mercadorias no per´ıodo base,
dado por
¸
P
i0
Q
it
. Dessa maneira obtemos o ´ındice de pre¸ cos de Paasche, dado por
I

p
(p
t
|p
0
) =
n
¸
i=1
P
it
Q
it
n
¸
i=1
P
i0
Q
it
· 100
mostrando que o ´ındice de pre¸ cos de Paasche para o per´ıodo t pode ser interpretado como uma
m´edia ponderada dos pre¸ cos relativos, utilizando-se como fatores de pondera¸ c˜ ao os valores monet´ arios
das quantidades vendidas no per´ıodo t, considerando os pre¸ cos do per´ıodo-base, isto ´e utilizando P
i0
Q
it
como fator de pondera¸ c˜ ao para o pre¸ co relativo da i−´esima mercadoria.
Como o m´etodo de Laspeyres e Paasche dar˜ ao, em geral resultados diferentes quando analisamos
a varia¸ c˜ ao no n´ıvel dos pre¸ cos de um conjunto de produtos, o ´ındice de Fischer conduz a um valor
intermedi´ ario entre os dois.
Este ´ındice ´e por defini¸ c˜ ao a m´edia geom´etrica entre o ´ındice de pre¸ cos de Laspeyres e Paasche, ou
seja
I
F
(p
t
|p
0
) =

I

L
(p
t
|p
0
)I

p
(p
t
|p
0
)
Ou seja o ´ındice de Fischer ´e a raiz da multiplica¸ c˜ ao do valor de ´ındice Laspeyres pelo ´ındice de
Paasche.
Para a tabela acima encontramos para os trˆes produtos (X, Y e Z), os seguintes resultados:
I

L
(p
t
|p
0
) = 107, 3654391
I

p
(p
t
|p
0
) = 103, 0828516
I
F
(p
t
|p
0
) =

107, 36 ×103, 08 = 105, 2023556
9 Quest˜ao 9
Calcular as medidas de desigualdade G, R, V (Z) e W para a distribui¸ c˜ ao de renda para 8
indiv´ıduos dada abaixo:
i X
i
1 1
2 1
3 1
4 2
5 4
6 8
7 13
8 20
Resposta:
Este exerc´ıcio est´ a resolvido em Hoffman (2006, p. 341) [3]. Para calcularmos o Gini, procedemos
construindo a tabela:
22
i X
i
p
i
i
¸
j=1
X
j
φ
i
φ
i−1

i
1 1 0,125 1 0,02 0,02
2 1 0,125 2 0,04 0,06
3 1 0,125 3 0,06 0,10
4 2 0,250 5 0,10 0,16
5 4 0,500 9 0,18 0,28
6 8 1,000 17 0,34 0,52
7 13 1,625 30 0,60 0,94
8 20 2,500 50 1,00 1,60
Em que p
i
´e o resultado da divis˜ao de X
i
pelo ´ ultimo valor de i (nesse caso 8),
¸
i
j=1
X
j
´e a soma de
X
i
at´e i, ou seja, o valor do quarto X
j
´e igual a 2+1+1+1=5, φ
i
´e o resultado de
¸
i
j=1
X
ij
divido pelo
seu ´ ultimo valor, ou seja o valor do quarto φ ´e dado por 5/50=0,10 e φ
i−1

i
´e o valor da adi¸ c˜ ao de φ
i
com o anterior, ou seja o valor do quarto φ ´e igual a 0,10+0,06=0,16.
E assim, calculamos o Gini, atrav´es da f´ ormula:
G = 1 −
1
n
n
¸
i=1

i−1

i
)
E ent˜ ao encontramos
G = 1 −
1
8
· 3, 68 = 0, 54
Os valores do coeficiente de Gini variam, portanto, entre 1 e zero; quanto mais pr´oximo de 1 for o
coeficiente, maior ser´ a a concentra¸ c˜ ao na distribui¸ c˜ ao de qualquer vari´ avel, acontecendo o contr´ ario `a
medida que esse coeficiente se aproxima de zero.
A entropia ´e, ent˜ ao, uma medida do grau de igualdade de uma distribui¸ c˜ ao. Theil (1967) mostrou
que ´e mais interessante utilizar uma medida de desigualdade obtida subtraindo a entropia de seu valor
m´ aximo. Esta medida ´e chamada Redundˆ ancia da distribui¸ c˜ ao, e ´e dada por:
R = log n −H(y) =
n
¸
i=1
y
i
log(ny
i
) =
n
¸
i=1
y
i
log

¸
¸
y
i
1
n
¸

onde 0 ≤ R ≤ log n.
[falta resolver]
.
.
.
10 Quest˜ao 10
Calcular as medidas de concentra¸ c˜ ao CR
2
, HH, B, e E para uma ind´ ustria com quatro em-
presas cujas produ¸ c˜ oes s˜ ao: 12, 132, 12, e 36.
Resposta:
Inicialmente para calcularmos o a raz˜ ao de concetra¸ c˜ ao organizamos as empresas de maneira que
X
1
≥ X
2
· · · ≥ X
n
e em seguida obtemos a raz˜ ao de concentra¸ c˜ ao das k maiores empresas pela f´ ormula
23
CR
k
=
k
¸
i=1
y
i
onde y
i
=
X
i

sendo n o tamanho da amostra e µ a m´edia populacional de X
i
.
Em seguida, resumimos os c´ alculos conforme tabela a seguir:
Empresa i X
i
y
i
A 1 132 0,6875
B 2 36 0,1875
C 3 12 0,0625
D 4 12 0,0625
Para encontrarmos o valor de CR
2
basta somarmos os valores dos dois primeiros y
i
da tabela para
encontrarmos, CR
2
= 0, 6875 + 0, 1875 = 0, 875.
O ´ındice de Hirschman-Herfindahl ´e definido por (Hoffman, 2006 p. 372) [3]
H =
1
n
(C
2
+ 1) onde C = σ/µ
Sendo que C ´e o coeficiente de varia¸ c˜ ao de X
i
.
A express˜ ao alternativa do ´ındice HH nos mostra que para um dado valor de coeficiente de varia¸ c˜ ao,
o ´ındice HH ´e inversamente proporcional ao n´ umero de empresas. Adicionalmente, para um n fixo, o
´ındice HH varia diretamente com o coeficiente de varia¸ c˜ ao.
Para a nossa amostra, obtemos
HH =
1
4
· [(49, 48/48)
2
+ 1] = 0, 516
O ´ındice de Rosenbluth quando as empresas de uma ind´ ustria est˜ ao organizadas de maneira que
y
1
≥ y
2
· · · y
n
, ent˜ ao o ´ındice de Rosenbluth ´e
B =
1
2
¸
iy
i
−1
Onde i corresponde ao n´ umero da observa¸ c˜ ao de y
i
.
Deste modo, obtemos
B =
1
2 · 1, 5 −1
= 0, 5
Para calcularmos a entropia da distribui¸ c˜ ao da produ¸ c˜ ao entre as empresas de uma ind´ ustria, pro-
cedemos
E =
n
¸
i=1
y
i
log

1
y
i

com 0 ≤ E ≤ log n
Sendo que log ´e logaritmo natural ou neperiano.
Para o nosso exerc´ıcio, montamos a tabela
Empresa i X
i
y
i
log(1/y
i
) log(1/y
i
)y
i
A 1 132 0,6875 0,37 0,257601746
B 2 36 0,1875 1,67 0,313870581
C 3 12 0,0625 2,77 0,173286795
D 4 12 0,0625 2,77 0,173286795
Aplicando a f´ ormula obtemos E = 0, 918.
OBS.: As respostas ser˜ ao disponibilizadas at´e a quarta-feira da semana da prova.
5
.
5
As respostas encontram-se no site http://www.sitenarede.com/luiz esteves/ibqp
24
Referˆencias
[1] Cancho, V., G. No¸ c˜oes de Estat´ıstica e Probabilidade. Universidade Federal de Ouro Preto,
Instituto de Ciˆencias Exatas e Biol´ ogicas, Departamento de Matem´ atica, 5 de agosto de 2004.
[2] Gujarati, D., N. Econometria B´asica. ed. Pearson Education do Brasil, S˜ ao Paulo, 2000.
[3] Hoffman, R. Estat´ıstica para economistas. 4 ed. Pioneira Thomson Learning, S˜ ao Paulo, 2006.
[4] Levine, D., M., Berenson, M., L., Stephan, D. Estat´ıstica: Teoria e Aplica¸ c˜oes Usando Mi-
crosoft Excel em Portuguˆes. LTC - Livros T´ecnicos e Cient´ıficos, Rio de Janeiro, 2000.
[5] Morettin, P., Hazzan, S., Bussab, W. C´alculo Fun¸ c˜oes de uma e de v´arias vari´aveis. Ed.
Saraiva, S˜ ao Paulo, 2003.
[6] Santos, R. J. Introdu¸ c˜ao ao L
A
T
E
X. Dispon´ıvel em: <http://www.mat.ufmg.br>