You are on page 1of 102

Estadstica Descriptiva

Facultad Ciencias Econmicas y


Empresariales
Departamento de Economa Aplicada
Profesor: Santiago de la Fuente
Fernndez

1.

Se ha realizado un estudio sobre el consumo de gas (en m ) en las viviendas


de una urbanizacin durante el mes de enero, obtenindose los datos que se
muestran en la tabla.

Consumo de gas
Viviendas
3
(m )
50
10
100
40
200
200
60
400
400
10
500
a) Represente el histograma de esta distribucin.
b) Calcule el consumo medio de gas de las viviendas. El valor hallado es
representativo de la distribucin?
c) Calcule el consumo ms frecuente.
d) Averige el valor del tercer cuartil de la distribucin del consumo de gas y
explique su significado e) Si la factura del gas consiste en una cantidad fija de
3
20 ms 0,5 por cada m consumido, calcule
la factura media de las viviendas y determine si la factura es ms dispersa que
el consumo.
Solucin:
a)
Consumo
gas

amplitu
d
ci

ni
i

densida
d

xi

x n

hi
ni
ci

x n

50 100

50

10

0,2

10

75

750

56250

100 200

100

40

0,4

150

6000

900000

200 400

200

60

0,3

300

18000

5400000

400 500

100

10

0,1

50
90
11
0
120

450

4500

2025000

29250

8381250

b) El consumo medio de gas de las


viviendas:

xi
ni

a1 x

i 1

243,75 m

29250
12
0

xi

ni

i1

69843,75
2
N

sX

8381250

120

10429,6875
102,1258 m

s a 69843,75 (243,75) 10429,6875


a
2
1

s
102,1258
C.V X
0, 42 (42%)
x
243,75

El consumo medio de gas de las viviendas es de 243,75 m , con una dispersin


del 42%. Con lo cual, el consumo medio de gas no es muy representativo.
c) El consumo ms frecuente se encuentra en el intervalo modal [100200),
puesto que es en el que se alcanza la mxima densidad de frecuencia.
Md L i
h

hi hi 1
(h

) i (h h

i 1 )

i 1

0,4 0,2
3
c 100
100 166,67 m
(0,4 0,2) (0,4 0,3)

Advirtase que si la amplitud de los intervalos


fuera constante:

Md L i

ni ni
1

(ni ni 1 ) (ni
ni 1 )

3. N
3.120

d) El tercer
cuartil:

90 , observando en la columna
N , Q P
4
i
3
75

P75 200

90 50

L
c i

ci

Ni 1

, de donde:

N N
i

i1

200

333,33 m
110 50

El 75% de las viviendas que consumen menos, consumen como mximo 333,33
3
m de gas.
e) Segn el enunciado del apartado, la factura del gas viene dada por la
relacin Y 20 0,5. X , por tanto, hay un cambio de origen y de escala:
La factura
media:

Y 20 0,5. X 20 0,5.243,75 141,875

sY Var (20 0, 5. X) s Y 0, 5.s X 0, 5.102,1258 51, 063


2
2
0, 5 . s
C.V

SY

51,

063
y

141,875

0,36 (36%)
La factura del gas est menos dispersa que el consumo.
CAMBIO DE ORIGEN Y DE ESCALA DE LA MEDIA Y VARIANZA:
k

yi

.ni

i1

(a bxi
). ni
i1

a ni b
.ni
i1

i1

xi
a
N

ni
i 1

xi .ni
b

i1

yabx

abx
N

E(y) E(a b x) y a b x

La media se ve afectada por el mismo cambio de origen y de escala efectuada


sobre la variable.
k

i
y)
(y
.n
2

sy

i1

(a bii x (a . n

(x
b x) 2
i1

N
i

k
2

i
(b
n
x b x) .

x) . n i

2 i1

i1

Var (a b x) b x . s

b s

La varianza no se ve afectada por el cambio de origen pero si por el cambio de


escala efectuado sobre la variable.
2.

De una distribucin bidimensional (X,Y) se sabe que al aumentar los valores


de X aumentan los de Y. Se ha obtenido la recta de regresin lineal mnimo
2
cuadrtica de Y sobre X y se ha comprobado que la varianza residual, Sry vale
cero. Se tienen adems los valores de los siguientes momentos respecto al
origen:
a10 2

a20 40

a01 10

a02 125

a) Determine la varianza debida a la regresin en la recta de Y/X y el valor de la


covarianza.
b) Se hace un cambio de variable de la forma X= 2X. Si se obtiene la nueva
recta de regresin de
Y/X, ser bueno el ajuste? Razone su respuesta.
c) Se decide cambiar la funcin de ajuste de Y sobre X por una constante, Y = c.
Utilizando el mtodo de mnimos cuadrados, determine el valor de esta
constante para nuestro caso.
Solucin:
2

a) Las varianzas de las variables X e Y,


respectivamente, son:

s a 2
a
x
20
2

s a 2
a
y
02

40 2 36
10
2

125 10 25
01

2
2
2
2
Siendo
s (1 R ) 1 R 0 R 1 , existe una dependencia funcional,
2
s
el ajuste es
ry 0 y
perfecto.

Para calcular la covarianza s xy tenemos en cuenta que


sxy sxy
2
R b . b'
.

1
2
2
s
s

s2 s2 . s2 36 . 25
900
xy

900 30
xy

b) El coeficiente de determinacin R2 es invariante ante un cambio de origen y


de escala, con lo que la bondad del ajuste ser idntico.
c) E(y) E(c)

y c

X' k X

INVARIABILIDAD DEL COEFICIENTE DE CORRELACIN LINEAL R :


CAMBIO DE ORIGEN:

a'10 x ' E(X ') E(m X) m E(X) m


x
a'11 E(X ' Y) E (m X) Y E(m Y) E(X
Y) m y a11
s x'y a'11 x m y a11 (m x ) y
'y
a11 x y

s xy

2
a'
2
s 20 x
s (m X)
' Var

c2
s2
s

x'
y

x
y

sxy sxy

s x ' y a'11 x ' y k a11 k x y k (a11 x


y) k s xy

s x'
c
2

2
xy
2
2

s
R' c . c

.2 2 ss . R2
'
sx s y
2

X Y) k E(X Y) k a11

a'20 s x ' Var (k X) k Var (X) k sx

s
s x 'y
xy
c'

2
s2
s

a'10 x ' E(X ') E(k X) k


E(X) k x a'11 E(X ' Y) E(k

s
s
xyx' y

CAMBIO DE ESCALA:

y
2

s x'

'y

c'

k
sx

k s xy

sy

ks
R'2 c . c ' 2 2
k sx
sy

sx

k s xy

xy

ks
.2

xy

sy
2
xy

R2

sx . sy

El coeficiente de determinacin R es invariante ante un cambio de origen y de


escala
3.

Abel Grandes Pistado pregunt a sus 31 compaeros de clase qu calificacin


obtuvieron en el ltimo examen de estadstica. Slo recuerda que l aprob
con la nota mediana de 5,6667 y su tocayo Escasi Lopasa tuvo un 4,6 (una de
las notas ms frecuentes habidas). Y, haciendo memoria, ha podido completar
los siguientes datos:
Nota de
estadsti
ca 0
4
55
77
99
10

Nmero
de
alumnos
8
n2
n3
6
6

Calcule:
a) Qu proporcin de alumnos ha obtenido una nota superior a 5? Cmo
es la distribucin respecto a la moda?
b) Estudie la dispersin relativa de las notas a partir del coeficiente de
variacin de Pearson.
Interprete los resultados.
c) Cmo afecta a la homogeneidad de la distribucin que este examen sea
un 60 por ciento de la calificacin final?

d) Comente, con base estadstica, el grado de concentracin de las notas de


este examen.
Solucin:

a)
Li
L i1
04
45
57
79
9 10

amplitud

ci
4
1
2
2
1

ni
ci
i
2 U
8
n2 6 h2 6
n3 6 h3
33
6
6
6
32
ni

hi

Sabemos que, Me
5,6667

Ni
8
14
20
26
32

Ni
xi
%
N
25
2
43,75
4,5
62,50
6
81,25
8
100
9,5
212,5

pi

xi .ni
16
27
36
48
57
184

Ui x i
.ni
16
43
79
127
184

Ui
2
pi qi
x . q
%
%
ni
32
8,70
16,30
121,5 23,37 20,38
216
42,93 19,57
384
69,02 12,23
541,5
100
000
1295
68,48

y Md 4,6

Para hallar n2 y n3 , podemos recurrir a la moda o a la mediana, a saber.


hi

La moda aproximada cuando existen distintas


amplitudes: Md L i

hi 1 hi

ci

h3
4,60 4
h
2 h3

1 1,2 3 h
.c
3n
0, 4

3.2 6
3

siend N 32 8 n2 6 6 6 n2 32 26 6
o,
N
Ni1
La mediana Me Li 2
ci
Ni Ni1

32
(8 n
2 )
8 n2
2
2 n2 6
2 0,6
5,6667
(8 n2 n3 ) (8
n
5

n2 )
3

12n

N 32 20 n2 n3 32 26 6
n3

La proporcin de alumnos que obtienen


una nota superior a 5. La distribucin
3
respecto a la moda.
666

n n4 n5
5
p
.100 3
.100
.100 56,25%
x
i

N
3

La distribucin es bimodal, puesto que h2 h5 6


b) Dispersin relativa de las notas a partir del coeficiente de variacin de
Pearson. Interpretar los resultados.

xi

n
a x
5,75
1

i
i 1

184

xi

a
2

ni

i 1

1295

40,46875

32

32
2

sx a 2 a 40, 46875 7,
2
40625
5,75

sx

7, 40625 2,72

s
2, 72
C.V x
0, 4730 (47,30 %) , la dispersin es del 47,30 %, es decir,
una dispersin media. x
5,75
c) La homogeneidad de la distribucin, cuando el examen es un 60 % de la
calificacin final.

CAMBIO DE ESCALA DEL COEFICIENTE DE VARIACIN DE PEARSON C.V:

yk.x

E(y) E(k . x) k . E(x) k . x


k .s

C.V

Var (y) Var


(k
. x) k .
2
2
Var(x) k . s

s
x

y
x

k .s k
.s
x

k. x

C.V
x

El Coeficiente de Variacin de Pearson es invariante ante un cambio de escala.


C.Vfin
al

s final

xfinal

2. sx

0, 4730 (47,30 %)

2.x

d) Grado de concentracin de las notas de este examen.


51

El ndice de concentracin de
Gini: IG
La concentracin es
mediobaja.
4.

(pi qi )
i 1
51

68,48

0,32 (32 %)

212,5

pi

i1

Se han obtenido las siguientes expresiones para las rectas de regresin


mnimo cuadrticas de una variable bidimensional (X,Y), donde X es el gasto
mensual en ocio e Y el gasto mensual en transporte de un grupo de amigos:
Y4X2

Y 2 X 10

Sabiendo adems que la covarianza entre ambas variables sxy 60 . Se pide:


a) Identifique cul es la recta de regresin de
Y/X y de X/Y. b) Interprete los coeficientes de
las rectas de regresin.
c) Porcentaje de variabilidad explicada y no explicada por la recta.
d) Calcule la varianza residual en la regresin Y/X. Coincidir con la varianza
residual en la regresin
X/Y? Justifique su respuesta.
Solucin:
Recta de regresin Y/X:
2 X 10
a)

Y , pendiente b 2

Recta de regresin Y 4 X 2
X/Y:

4XY2

1
4

, pendiente b'

La otra opcin no puede ocurrir:


Recta de regresin Y/X:
4X2

2XY
Recta de regresin X/Y: Y 2 10
X 10

1
Y5
2

puesto que R b . b' 4 cuando se sabe 0 R2 1


1
que
.
2
2
Como las dos pendientes son positivas (2 y 1/4), la recta de regresin
de Y/X tiene mayor pendiente en valor absoluto que la de X/Y

b)

El coeficiente de determinacin lineal R b . b' 2 .


4
2

c)

0, 5

La recta de regresin de Y sobre X explica el 50% de la variabilidad de la


variable dependiente y el otro 50% es no explicado.

b
xy

s
2

sx
d)
s
b' xy

2
s 30

60 2

2
x

s 240

60

42
s

s s .(1 R ) s
ry
x

Las varianzas
residuales:

s s .(1 R ) s
rx
y

5. Sabiendo x 3 , xs2 6 ,
2
que
s 8

30 . (1 0, 5) 15
ry

240 . (1 0, 5) 120
rx

y que la recta de regresin de Y sobre X es y 4


0,667. x

Obtener la recta de regresin de X sobre Y.


Solucin:

Y/X: y 4 0,667.
x

X/Y:

6.

y 4
0,667. x

4 0,667. 3 2

sxy

b 0,667
s
s2x

b'

s xy

s xy

0,667 . 6 4
xy

4
0, 5
8

sy
x a' b' y

x a' b' 3 a' 0, 5 . 2

x 4 0, 5 . y

a' 4

Hallar la recta de regresin de Y sobre X sabiendo que x

4,1 , y 2,3

punto (5,9 , 3, 5)
Solucin:
Y/X:

y a b 2,3 a 4,1 . b
yab x x
por pasar por (5,9 , 3, 3, 5 a 5,9 . b

5)

y la recta pasa por el

1, 2
0,667
b

a 2,3 4,1 . 0,667

0, 435

a 4,1 . b 2,3


a 5,9 . b 3, 5

7.

y 0, 435 0,667. x

La tabla muestra la comprensin lectora (X) de dos grupos de individuos


educados en niveles socioculturales altos (A) y bajos (B).
Intervalos
0
7 13
14 20
21 27
28 34

nA
4
6
9
12
9

nB
4
7
9
8
2

Si a partir de la puntuacin X 19 se considera una comprensin lectora buena. Se


pide:
a) Porcentaje de personas en cada grupo con una buena comprensin lectora.
b) Entre qu valores de comprensin lectora estar la quinta parte central del
Grupo A?
c) Entre qu valores de comprensin del Grupo B se encuentran los 12 centrales?
d) Cul de los dos grupos presenta mayor variabilidad?
Solucin:
a) Advirtase que los intervalos son cerrados, se deben expresar abiertos a la
derecha con extremos reales:
Intervalos
0, 5
6,5 13,
13,5 20,
20,5 27,
27,5

x
3
10
17
24
31

ci

nA

NA

7
7
7
7
7

4
6
9
12
9

4
10
19
31
40

x.nA
12
60
153
288
279
792

x 2 .nA
36
600
2601
6912
8649
18798

x.nB

4
7
9
8
2

4
11
20
28
30

12
70
153
192
62
489

x .nB
36
700
2601
4608
1922
9867

Se calcula el orden k del percentil que es igual a 19.


Este da el porcentaje de las personas que tienen menos de 19 puntos. La
respuesta ser su diferencia hasta 100.
En el Grupo
A:
P
19
k
9

k .40

10

7 . (0, 4 . k

. 19 13, 5 10)
13, 5 100

7
19 10

49, 5

2,8 . k

70

k 119, 5 / 2,8
42,68

El 57,32%
Grupo A.

100 42,68 57,32 tiene una buena comprensin lectora en el

En el Grupo
B:
P
19
k

k .30

11

13, 5 100

9
El 39,76%

7 . (0, 3 . k
19 13, 5 11)

20 11
.

49, 5

2,1 . k

77

k 126, 5 / 2,1
60,24

100 60,24 39,76 tiene una buena comprensin

lectora en el Grupo B. En consecuencia, el Grupo A tiene una mejor


comprensin lectora.
b) La quinta parte representa el 20%. Con relacin al centro (50%), cubrirn
desde el 40% al 60%, se tendr que calcular el Percentil 40 y el Percentil 60 de
la distribucin de comprensin lectora del Grupo A.

40 . 40
10
16 10
100
. 13, 5
. 18,17
13, 5
7

7
19 10
19 10

60 . 40
19
24 19
. 23, 42
20, 5 100
. 20, 5

7
7
31 19
31 19

40

60

La quinta parte central del Grupo A se encuentra entre los valores [18,17 23,42]
c) Los 12 valores representa el (12 / 30 40%) . Con relacin al centro (50%),
cubrirn desde el 30% al
70%, teniendo que calcular el Percentil 30 y el Percentil 70 de la
distribucin de comprensin lectora del Grupo B.

30 . 30
4
9 4
. 11, 5
6, 5 100
. 6, 5

7
7
11 4
11 4

70 . 30
20
21 20
100
. 21,375
20, 5
. 20, 5

7
7
28 20
28 20

30

70

Los 12 centrales valores centrales de comprensin del Grupo B se encuentran


entre
[11,5 21,375]

d) Mayor variabilidad tendr aquel grupo que posea mayor dispersin entre sus
valores, es decir, si la media aritmtica es representativa de las
observaciones (no existen valores extremos exageradamente distanciados de
la mayora).
El estadstico ms adecuado para medir la variabilidad relativa entre dos series
es el Coeficiente de Variacin de Pearson, entendiendo que un valor mayor
indica menor homogeneidad, un valor menor refleja menor dispersin o
variabilidad.
792
x
19,8
77,91
s
A
40

s
A

18798

40

19,8

77,91 8,83
A

489
x
16,3
63,21
s
B

s
B

9867

16,3

63,21 7,95
B

30

30
8 , 83

CV
CVA

. 100 44, 59 %

7, 95

. 100 48,77%

16,3

19,8
El Grupo B presenta mayor variabilidad relativa, en contra de lo
obtenido comparando la desviacin tpica.
8.

A partir de la tabla adjunta, donde N 11 , Y 0


X \ Y
0
1

2
0
3

0
1
n22
1

1
0
n23
0

a) Son independientes las variables estadsticamente?


b) Rectas de regresin de Y/X e X/Y
c) Qu parte de la varianza calculada Y es explicada por la regresin?
Qu parte es debida a causas ajenas?.
Solucin:
a)
X \ Y

0
1

0
3

2
n j

1
n22
1

0
n23
0
n23

De otra
parte,

2 n22

3
Y

2 .3 0 n23

1
3 n22 n23
1
5 n22 n23
11

n23 6

0
11

5 n22 6 n22 0
11X \ Y
2
0
0
1
2
n j

ni

ni

0
3
0

1
0
1

0
6
0

1
9
1

11

Las variables X e Y son


independientes
ni j
n i
i, j
N N

n j

n12 n1 n2

N N N

No
porque no se verifica la relacin:
1 son
1 independientes
2
x

11 11
11

b)
3

a11

a
i1

10

x i yj
1
ni j
2 . 1. 3 1 . 1. 6 0
i1 j1

N
11
3

x i ni

1 .9 0 2 .
1

a
i1

20

11
2
a

x
10

20

13

s
x

11
11

0, 43

11

yj nj
j1

a01 y
0

y
01

13

11

s2
a

s2
a

x i2
1
ni
12 . 22 . 1

9
N
11

2
a

02

a02

N
11
18

0
18
11
11

y 2j
nj
j1

18

1
(2) . 3 1 . 6

N
11
2

18
2

1,28

11

covarianz sxy a11 a10 . a01 1 . 0 0


a:
0
s
El coeficiente de regresin de Y sobre X (pendiente
xy
de la recta):
b

s2x 0
Y a b
X
Y/ X :

0 a 0.1

2 / 11

a
0

Y0

s
El coeficiente de regresin de X sobre Y (pendiente
xy
de la recta):
b'

s2Y 0
X a' b' 1 a' 0 .
Y
0
X/ Y :

X1

a' 1

18 / 11

COEFICIENTE
DETERMINACIN:

r b . b'
0

Las rectas son perpendiculares, y


en
consecuencia, las variables (X, Y) son INCORRELADAS
VARIANZA RESIDUAL s2 s2 (1 r2 ) s2
DE Y:
ry
y
ry

s2
sy
rY

2
s
Y explicada

18
11
11

18

Y explicada

18

(1 0)

11

Y explicada

18
11

9.

La variable X tiene y sx2 1 . Determinar el coeficiente de variacin de


x 4 variables:
Pearson de las
W
3)

(X

(X 2)

Solucin:

E(W)
2

.
X E(X)
2
2

Var (W) Var 3 1 X . Var(X) 1 s

1
2
.
s

x
2

2
4

C.V
w

sw
1

.x

. s

1
x

1/2

w1 / 2

2
2

E(Z) E

3

.
X E(X)
3
3

.x

Var (Z) Var 2 1 X . Var(X) 1

1
2
.
s

3
9

. s
z

1
x

C.V sz 1 /3
1 z2 / 3
z
2
COEFICIENTE DE VARIACIN DE PEARSON : CAMBIO DE ORIGEN Y DE ESCALA
E(Y) E (a b . X) b . E(X) a b . X
a
Var (Y) Var a b . X b2 .
Var(X) b2 . s2
C.
V y
.X

b .s x
a b

s b. s
x

sx
a
X
b

El Coeficiente de Variacin de Pearson se encuentra afectado ante un cambio


de origen.

10. Si s y y r 0 La recta de regresin Y/X tiene mayor pendiente que la de


sx
X/Y?
Solucin:
RELACIN ENTRE LOS COEFICIENTES DE REGRESIN Y CORRELACIN
s xy
b 2
sx
s
b'

xy
2
y

sxy b .
2
s

b.s
r . sx
x

br.

.s
s
2
s

s xy

r
sx . sy

b.

xy

b' . ys r . s
b' r .
x

r.
sx
sy

sx
sy

sxy r . sx . s y

s
r. y
sx

.s

Si y sx , r 0
s

sy

b b'

11. Sean dos variables X e Y, tipificadas e incorreladas. Escribir la recta de


regresin de Y sobre X
Solucin:
Por ser (X, Y) variables
tipificadas:
Por ser (X, Y) variables
incorreladas:

x 0
y 0

sxy 0

sx 1
sy 1

b
0

b'

r 0

0
y a b. ay 0
Y/X y a b .
x
:

x
b0
Y/X: y 0
12. En una regresin lineal las varianza explicada por la regresin y residual
son iguales. Cunto vale el coeficiente de determinacin?.
Solucin:
2

sy s ry s Ry 2 s

s
s
ry
2
r 1 ry r 1
1
2s
2
2
sy
ry
2

1
2

Sea y i el valor terico que correspondera a la recta de regresin de Y sobre X

y i a

b . xi ,

elevando al cuadrado la
descomposicin (y i y)

(yi y i (y i y) :
)

2 (y y ) (

(y y)
y y)2 (y

i
i
i
i
i

2 y
(y
)

2 (y y y)
) (y
i i i

2
y)

se observa que,
( y i y i ).( y i y ) ( yi a bxi ).(a bx i
y)
b x i ( yi a y ( yi a

a ( yi a b x i )

b xi )
b xi )

0
0

sumacuadrados total
cuadradosexplicada

(y y )
i

(y y )

i
(y y )

Dividiendo por
N:

suma cuadradosresidual
2
i

2 (y y y )
(y i
)
i
i
i

N2 N 2 N
sy
sry
2
Ry
s por
ry

Dividiendo
la expresin
s2 s2
y

r2
s
2

s s
2
2
y
Ry

2
ry

y)
(y

suma

2
i

2s2 s2
s y
ry

Ry

2
sRy

s2 :
y

2 2
ry

s sy 2(1

r )

s2
Ry
2
2
s
2

s
s
ry
2
y
y
r 1 s
y

s Ry

sy. r

ry

13. Determinar si son coherentes los datos:


2

a) N 100 , x 5 , y x 8 , s 12, 5 ,
2
2
s 70 , r

0,9

b) La suma de residuos al cuadrado correspondientes a una de las posibles


rectas de regresin vale 100

Solucin:
Solo son
tiles:

N2 100 , s2 12, 5 , s2 70 ,
r 0,9 , x
y

2 (y y 10
)
0
2
i
sry
i

1
N
100

2
(y y ) 100
i

100
(x 2
x i ) i
s

1
N
100
2
rx

De otra parte,
2
2
2
2
Y/X: sry s y (1 r ) sry 70 (1 0,9)

71

No son coherentes.

2
2
2
2
X/Y: srx s x (1 r ) srx 12, 5 (1 0,9)

1,25 1

No son coherentes.

14. Dada la siguiente distribucin:


xi

10

15

20

25

ni

a) Calcular la media armnica, geomtrica y aritmtica


b) Calcular la varianza, desviacin tpica y coeficiente de
variacin de Pearson c) Hallar la media aritmtica y la
desviacin tpica de la variable X tipificada
d) Mediante la transformacin y
desviacin tpica
5

x 15

, hallar la media, varianza y

Solucin:
a)
xi

10

15

20

25

ni

23

x i ni

15

70

75

60

125

345

xi i

125

759375

8000

ni
xi

0,6

1000000
0
0,7

0,3333

0,15

976562
5
0,2

75

700

1125

1200

3125

7,415771484 .
25
10
1,983
3
622
5

2
x
i
ni

N
xA 5
n
n
n
i
1

i1 x
x1
i
x2

N
2

n
4

x3

x4

23

11, 597
n 1,9833
5

x5

n
23
x i 23 n
x5 1 .n x 2 .n x 3 .n x n23 7,415771484
4
xG
.x 1
. 10
i
2
3
4

13,329

5 i1

x i ni
345
a1 x i1
15
N
23
La relacin entre las diferentes
medias es:

x A xG x

x2i ni
a

b)
270,652
2

6225

a
s a 15
270,652 45,652

25

sx

i1

N
23
45,652
6,76

2
x

2
1

CV s x 6 , 76 0, [45% de dispersin de los datos]


45 x
15
x

c) La variable X
tipifica: zi

xi
x
sx

xi

10

15

20

25

ni

1,479

0,740

0,740

1,479

4,438

5,178

2,219

7,396

zi2 ni

6,565

3,830

1,641

10,941

23

yi

y i ni

10

y i2 ni

12

20

42

xi
x
s
z i ni x

z
i

z i ni
0
z i1

0
N
23

zi2
23
Toda var iable tipificada tiene
ni
(2 z
0
2
i1
)
s
1
z
N
media 0 y var ianza 1
23

d) Con la transformacin y
5
5

yi ni
0
y i1

0
N
23

x 15

y i2
42
42
ni
0

2
2
(y)
s i1
1,826
y
N
23
23

No son necesarios los clculos, se conoce:


x 15
y E
5

1
1
E x 3 3 x 3
5
5

15
0
5

23

x 15
1 2 45,652
sy2 Var Var x
s
1,826
1

x
25
25
5
2
5

s
y

42
23

1,35

15. Ana acude con su hijo a la consulta de un odontlogo para cuatro


restauraciones dentarais, observando que el doctor aplicaba cantidades de
cemento de ionmeros de vidrio con flor y composite (Y, en gramos)
conforme a los dimetros de perforacin de cada pieza dental (X, en
milmetros) como se refleja a continuacin:
X \ Y
0
3
55
10

01

13
1

36

6 10

1
1

Se pide:
a) Son independientes estadsticamente ambas variables?.
Razone la respuesta. b) Calcule las rectas de regresin de Y/X e
X/Y. Interpretar los resultados.
c) Qu parte de la varianza de las perforaciones habidas (X) es explicada
por la cantidad de ionmeros de vidrio consumida (Y)? Qu parte no es
explicada?.
Solucin:

ni j n
i
a) Las variables X e Y son independientes cuando se verifica

i,
j

N N
X \ Y

0,5

1,5
4
7,5
n j

4,5

1
1

ni

x i ni

xi2 ni

1
2
1

1,5
8
7,5
17

2,25
32
56,25
90,5

1
1

y j n j

0,50

4,50

15

y 2j n

0,25

20,25

64

88,5

n12 1
Las
variables
no
son
independientes:

n
n
1
2


N 4
N
N

b)
a

11

10

x i yj
ni j

i1 j1

1,5 . 2 . 41 . 0, 5 .

1
N
4

1 1

x i ni
17
x i1

4,25
N

4 . 4,5 .
1

7, 5 . 8 . 1 20,75

20

x i2
ni
i1

90 , 5

22,625
4

nj

sx a 20 a
2
4,25

22,625 4, 5625

yj nj
j1

a01 y
3,75

4, 5625 2,136

sx

a02

y 2j
nj
j1
N

88 , 5

22,125
4

s2y a02 222,125


3,75
a01

2
8, 0625

covarianz s xy a11 a10 . a01


a:
20,75

8,
2,84
0625

sy

4,25 . 3,75 4,8125

s xy
4 , 8125
El coeficiente de regresin de Y sobre X (pendiente b

1, 055
s2x
de la recta):
4, 5625
Y a b 3,75 a 1, 055 . 4,25 a
X
0,734

Y/X:
0,734

1, 055 X

s xy 4 , 8125
El coeficiente de regresin de X sobre Y (pendiente b'

0, 597
s2Y
de la recta):
8, 0625
X a' b' 4,25 a' 0, 597 . 3,75 a' 2,
Y
011

X/Y:
011

X 2,

0, 597 Y

c) COEFICIENTE
DETERMINACIN:

r b . b' 1, 055 . 0, 597 0,6298

VARIANZA RESIDUAL s2 s2 (1 r2 ) s2 4, 5625 (1 0,6298)


DE X:
1,689rx
rx
x
2

2
sx

rx

Rx

varianza residual varianza


regresin no explicada
explicada

sRx s x
srx

NO EXPLICADA

sRx 8, 0625 1,689


6,3735

EXPLICAD
A

16. El salario medio mensual en cientos de euros de 160 obreros se distribuye de


la siguiente forma:
Intervalo
s ni

48
3

8 12
12

12 16
40

16 20 20 24 24 28 28 32 32 36
47
32
13
9
4

a) Media aritmtica, mediana, moda y


percentil 75. b) Coeficiente de asimetra
de Fisher.
c) Realizar una redistribucin en la que los intervalos tengan una amplitud de 8,
y con estos nuevos intervalos calcular la media aritmtica y el coeficiente de
variacin de Pearson. Comparar los resultados obtenidos en el apartado (a)
Solucin:
a)
Intervalos
xi

48

8 12

10

ni

12

40

Ni

15

hi ni /
c i x i . ni

0,75

(x i x )
(x i x )
ni x2 )
(x
i
ni
(x i x3 )
ni

12 16 16
20
14
18

20 24 24 28

32 36

22

26

30

34

47

32

13

55

102

134

147

156

160

10

11,75

3,25

2,25

40

18

120

560

846

704

338

270

136

2992

12,7

8,7

4,7

0,7

3,3

7,3

11,3

15,3

38,1

104,4

188

32,9

105,6

94,9

101,7

61,2

483,87

908,28

883,6

23,03

348,48

692,77

1149,21

936,36

160

5425,6
0

1149,98 5057,22 12986,07 14326,30 15303,3


6145,149 7902,03 4152,92 16,121 4
1
3
8
6

x i .ni
2992
a x i1

18,7
1
N
160
Md L i

28 32

Me
L

hi hi

ci
Md 16

(hi hi 1 ) (hi hi 1 )
1

Se verifica la
relacin x

Me Md

80
M
16
. 4 18,13

N i 1
55
c
2
102 55
Ni Ni1
i

11,75
. 4 17,27
10
(11,75 10) (11,75 8)

Distribucin asimtrica a la derecha o positiva

Advirtase que para calcular la moda, cuando la amplitud de los intervalos es


igual, para trabajar con una escala ms pequea, se puede emplear la
expresin:
Md L i

ni ni

ci

Md 16

47 40

P75

. 4 17,27
(ni ni 1 ) (ni ni 1 )

75 N
Ni1
100
ci Q
Li
Ni
20
Ni1

P75

120
102
134
102

(47 40) (47 32)

. 4 22,25

b) Coeficiente de asimetra de g
m3
Fisher:

1
s
8

g1 0 Asimetra a la derecha o positiva


g1 0 Simetra
g1 0 Asimetra a la izquierda o negativa

.n(x x)

m2 2 i 1 i
var ianza)
s
N

5425,60

33,91 (

33,91 5,82 (desviacin tpica)

160

3
. ni
(x i x)

m3 i1

15303,36

95,65
160

m
95, 65
g 3
0,
485
0
1
3
5,82
3
s

Distribucin asimtrica a la derecha o positiva.

c)
Intervalo
s xi

4 12
8

ni

15

87

45

13

160

x i . ni

120

1392

1080

416

3008

x2 i .
ni

960

22272

25920

13312

62464

x i .ni
3008
a x i1

18,8
1
N
160

CV

36 , 96
sx

0,32 x
18,8

12 20 20 28 28 36
16
24
32

x i2 .
62464
ni

i1
a
390, 4
2
N
160

s a 390, 4 18,8
a
36,96
x

(32% de dispersin de los datos)

La media aritmtica cambia, se ha transformado la distribucin de datos.

17. La distribucin de salarios de una empresa es la siguiente:


Salario (euros)
3000 5000
1000 2000
5000 9000
2000 3000

Empleados
25
100
5
50

a) Estudiar la concentracin de salarios


b) Qu porcentaje de empleados percibe el 50% de los salarios?
c) La empresa como poltica comercial analiza subir los salarios a todos los
empleados, con un incremento del 10%, o bien con un aumento de 200
euros por empleado. Cul de las dos opciones sera ms equitativa?
d) Cul es la concentracin de salarios si el nmero de empleados hubiera sido el
doble?
Solucin:
a) La concentracin de salarios se analiza mediante el ndice de Gini, que no
vara mediante cambios de escala (subida porcentual del 10% a los
empleados) mientras que queda modificado con cambios de origen (subida
lineal de 200 euros a cada empleado).
Ordenando los salarios en forma creciente:
xi

Salarios
1000
2000
3000
5000
9000

ni

Ni

1500 100
2500 50
4000 25
7000 5

100
150
175
180

x i ni

ui x i
ni

N
%p i .
i 100
N
55,5
x
83,3
97,22
100
236,11

150000 acumula
150000
125000 275000
100000 375000
35000 410000
41000

u
%qi i .
100
u
36,5k
50
67,0
91,46
100
195,12

qi

I 1 i1
G
3

pi

195,12
1

0,174
236,11

(concentracin de salarios del 17,4%)

i1

b) En la tabla se observa que el 55,56% de los empleados percibe el 36,59% de


los salarios, y el
83,33% de los empleados percibe el 67,07% de los salarios. En consecuencia,
el 50% de los salarios estar distribuido entre un conjunto de empleados
situado entre el 55,56 y el 83,33%.
Bajo la hiptesis de linealidad, se establece la relacin de porcentajes:
67, 07 36 , 59

50

36 , 59

30, 48

13, 41

x 55, 56

27, 77 . 13, 41
83,33 55, 56
30, 48

x 55, 56

x 67,78 %
27,77 x 55, 56

c)
SUBIDA DE SALARIOS DEL 10% Cambio de escala
en los salarios
u'i 'xi
Ni
'
'
ni
Ni
xi
xi
ni
ni
1,1.xi
%pi .100
acumula
N
1650
100 100 165000 165000
55,56
2750
50
150 137500 302500
83,33
4400
25
175 110000 412500
97,22
7700
5
180
38500
451000
100
451000
236,11

'
u
%qi i.100
'

k
'

u
36,59
67,07
91,46
100
195,12

qi
195,12
I 1 i1 1

0,174
G
236,11
3
pi

(concentracin de salarios del 17,4%)

i1

u .1,1
u
'
Advirtase que:
q i
i i q
i
u
u
k .1,1
Con una subida del 10% a cada empleado, la equidistribucin no vara.
El cambio de escala en los salarios no afecta al ndice de Gini, propiedad
conocida como Principio de la Renta relativa.
SUBIDA LINEAL DE SALARIOS DE 200 EUROS Cambio de origen en los
salarios
x'i 200
xi
1700
2700
4200
7200

ni

Ni

100
50
25
5

100
150
175
180

u'i 'xi
N
%pi i.100
x' i
ni
N
ni
acumula
170000 170000
55,56
135000 305000
83,33
105000 410000
97,22
36000
446000
100
446000
236,11

'
u
'
%qi i.100
k

u'
38,12
68,39
91,93
100
198,43

qi
198, 43
I 1 i1 1

0,16
G
236,11
3
pi

(concentracin de salarios del 16%)

i1

Con una subida lineal de 200 euros a cada empleado, la equidistribucin


de salarios es ms equitativa.
Si por el contrario la empresa hubiera rebajado 50 euros a cada empleado, la
equidistribucin de salarios sera menos equitativa.
El cambio de origen en los salarios afecta al ndice de Gini, propiedad conocida

como Principio de
Dalton.

d) Concentracin salarios si el nmero de empleados hubiera sido el doble:


SUBIDA LINEAL DE EMPLEADOS Cambio de escala en la Poblacin
'
'
u' x
u
i
'
'
'
i %p i N
i .
xi
ni' 2 n
%q
x
n

i
'
' .100
i
N i
' 100
i
n
u
k
i i

i
N
1500
200
200 300000 acumula
300000
55,56
36,5
2500
100
300 250000
550000
83,33
67,0
7
4000
50
350 200000
750000
97,22
91,4
6
7000
10
360
70000
820000
100,00
100,00
820000
236,11
195,12
360
3

qi

I 1 i1
G
3

pi

195,12
1

0,174
236,11

(concentracin de salarios del 17,4%)

i1

El cambio de escala en la poblacin no afecta al ndice de Gini, propiedad


conocida como Principio de la Poblacin. Es decir, el tamao de la poblacin
no importa, lo que interesa son las proporciones de individuos de la
poblacin que perciben diferentes niveles de salario.
18. Dada la tabla de correlacin:
X \ Y
1
0
1

1
2
2
1

0
1
4
0

1
2
2
1

Estudiar la independencia estadstica, calcular las rectas de regresin y la


correlacin entre ambas variables.
Solucin:
a)
X \ Y

ni

x i .ni

xi2 . ni

1
0
1
n j

2
2
1

1
4
0

2
2
1

5
8
2

5
0
2

5
0
2

N 15

10

y j . n j
2

y j . n j

ni j
Las variables X e Y son independientes cuando se
N

in nj

verifica

i, j

Si alguna de las frecuencias absolutas es igual a 0 no son independientes

estadsticamente:

n32
n2
N
3
3

x i .y j
. ni j

a1 i

10

s
a
xy
01

15

15

3
1

x i2
ni
i1

15

a
20

7
2

s
ax

15

yj nj
j1
y

2
a

20

10

15

21


25
5

N
N

y 2j nj
1
j1

a02

s2Y a02 a012

10

b
0

.0

10
0

15

15

aa . 0
0
11

1. 1. 1. (1). 1. 1. 1 0
2
1

a01
0

x i ni

15

1.(1).

N
15

a
i1

n3

j1

0 r

15

Re ctas regresin
perpendiculares

b'
0

10

var iable s INCORRELADAS

Rectas de regresin:
y a b. ay 0
Y/X y a b .
y0
x
:

x
b0

X/Y: x a' b'


.y

x a' b' . a' x

0,2

x 0,2

b' 0

19. La variable estadstica X tiene x 2 , s x 1 . Determinar la media aritmtica,


la varianza y el
X1
coeficiente de variacin de
Y
2
Pearson de
Solucin:

1
E(
Y)
E

E(X)
1


1 1

Var (Y)
X
Var

2 2

C.V
Y

sY 1 / 2

1 y1 / 2

.x
2

1
2

1
1
1

2
.s Var(X) .x s Y. s
2
4
2

20. La varianza explicada por una regresin lineal simple es el doble de la


varianza residual, Cunto vale el coeficiente de determinacin?
Solucin:
2

2
ry

sRy 2

sy s ry s Ry 3 s

s ry
s
1
ry
s s (1 r 1
1
1
r )
2
2
s
3s
3
2
2
ry
y

ry

2
3

21. Dada la distribucin:


xi

10

ni

a) Calcula los coeficientes de asimetra de Pearson y de Fisher, coeficiente de


curtosis.
Y1

b) Siendo la variable X

, halla los coeficientes de asimetra de Pearson y

Fisher de la variable Y
2
c) Tienen el mismo coeficiente de Variacin de Pearson las dos variables?
c) Calcula el coeficiente de curtosis de las variables X e Y
Solucin:
a)
xi

ni

Ni

x i .ni

xi x

2
4
8
10

3
4
1
2

3
7
8
10

6
16
8
20

3
1
3
5

10
1578

(x x )2 (x x ) . 2(x4 x ) .
i
n i i
n 27 i i
9
81
1
4
4
9
9
27
25
50
25

50

4
81
125
0

90

x i .ni 50
x i1

5
N
10

(x 3x ) .
i n
i
243

192

M
4

ex

Coeficiente asimetra de
Pearson:

M
4

dx
x

APx

x Mdx

0,33

(x i x ) 90
. ni

2
s i1
9
N
10

5 4

s 9 3
x

0 asimetra a la derecha o
positiva

sx
3
4

Coeficiente de asimetra de
Fisher:

m
3x

g1x

m3x 19, 2

0,71 0
27
sx 3

x )i 192
(x
i .n
i1

19,2
N
10

s 3 27

asimetra a la derecha o positiva

Coeficiente de
curtosis:

x ) i 1578
(x
i .n
i1

157,8
N
10

m
4x

m
157, 8
g 4x 3
3 1, 05 0
(PLATICRTICA)
2x
81
sx 4

s 3 81
x

menor apuntamiento que la normal

Y12X

b)

Los coeficientes de asimetra de Pearson y de Fisher son invariantes ante un


cambio de origen y de escala y, en consecuencia, la distribucin Y presenta:
APy 0,33 0 asimetra a la derecha o positiva

g1y 0,71 0

asimetra a la derecha o positiva

Haciendo las operaciones:


yi

ni

Ni

y i .ni

yi y

(y i y)2

5
9
17
21

3
4
1
2

3
7
8
10

15
36
17
42

6
2
6
10

36
4
36
10
0

10
25248

110

(y i y) .
ni 10
8
16
36
20

y i .ni 110
y i1

11
N
10

M
9

ey
dy

Coeficiente asimetra de
Pearson:

APy

y Mdy

m
3y

1y

m
3
sy

3y

153, 6

0,71 0
216

sy
6
4

Coeficiente de asimetra de
Fisher:

(y i
ni
2
sy i1

M
9

(yi y) . (yi 3 y) .
ni
ni 388
648
8

64
32
129
21
6
360
1536

y) .
N

360

36

s 36 6
y

10

11 9
0,33 0 asimetra a la derecha o
positiva

(yi ny) i. 1536


i1

153,6
N
10

asimetra a la derecha o positiva

s3 63 216
y

c) El coeficiente de variacin de Pearson es invariante ante un cambio de escala


(Y 2 X) pero no
2 sx
ante un cambio de origen (Y 1 2 X) . En
. No tienen, por tanto, el

este caso: CVy


mismo
12x
coeficiente de variacin.
Coeficiente de variacin de
Pearson de X:

CV
x

sx

0,6

datos)
x
5

(60% de dispersin de los

2. sx
6
Coeficiente de variacin de Pearson

0, 54
de Y: CVy
los datos)
1 x 11

(54% de dispersin de

d) El coeficiente de curtosis o apuntamiento es invariante ante un cambio de


origen y de escala
(Y 1 2 X) y, en consecuencia:
g2y 1, 05 0

menor apuntamiento que la normal (PLATICRTICA)


4

Haciendo
operaciones: m

(yi y) .i n 25248
i1

2524,8
4y
N
10

m 4y
2524 , 8
g
3

3 1, 05 0
2y(PLATICRTICA)
4
1296
sy

s 6 1296
y

menor apuntamiento que la normal

PARCIALILLO 22 DE FEBRERO 2013


1. Se ha realizado un estudio entre 100 mujeres mayores de 25 aos,
observndose el nmero de hijos de las mismas. El resultado ha sido:
Nmero de
hijos
0
1
2
3
4
5
6

(x
)

Nmero de
mujeres 13
20
25
20
11
7
4

(ni
)

a) Calcular el nmero medio de hijos, la mediana, la moda y el tercer cuartil


b) Cul es el nmero mximo de hijos que tiene el 70% de las mujeres que menos
hijos tienen?
c) Calcular el coeficiente de variacin de Pearson
d) Calcular el coeficiente de asimetra de Fisher y el coeficiente de curtosis
Solucin:
a)
xi
ni

13
20
25
20
11
7
4
100

13
33
58
78
89
96
10
0

75
50

0
1
2
3
4
5
6

N
i

f
ni
=
N

0,13
0,20
0,25
0,20
0,11
0,07
0,04
1,0

xi
ni

(x i
x)

(x i 2
i(x
2
x) x) n

(xi x)
3
n

(xi x) n

0
20
50
60
44
35
24
233

2,33
1,33
0,33
0,67
1,67
2,67
3,67

5,43
1,77
0,11
0,45
2,79
7,13
13,47

164,44
47,05
0,90
6,02
51,23
133,24
197,72
175,82

383,15
62,58
0,30
4,03
85,56
355,75
725,65
1617,01

F
Ni
=
N

0,13
0,33
0,58
0,78
0,89
0,96
1

70,58
35,38
2,72
8,98
30,68
49,90
53,88
252,11

x i ni
i1

Median Me
a:
2

(pasa de la mitad
50%)

233

Media
aritmtica:

2,33

100
Md (n3 25, el ms grande)
2

100.
3
3 Cuartil

: Q

75

3
hijos

(F pasa del 75%)

b) El nmero mximo de hijos que tiene el 70% de las mujeres que menos hijos
tienen es el Decil 7 (Percentil 70)
Decil 7 Percentil 70:
3 hijos

(F pasa de 0,7)
4

c)
Varianza:

2
x x ni

m s2
2

252,11
2,5211 hijos
10
N
0

i1

2,5211 1,59 hijos

Desviacin
tpica: s

Coeficiente de Variacin de Pearson: C.V


del 68,24%

1,59

0,6824 una dispersin

x
2,33

d) Coeficiente de asimetra de
Fisher:
1 7
3
(x i x) in

m
N i1
1,76
g 3

0,4378 Asimetra a la derecha o positiva


01
s3
1,59 3
s3

Coeficiente de curtosis:
1
m4

N(xi1i x)

g
3
20,47 0
s

in

16,17
1,59

PLATICRTICA

2. Los salarios de los empleados de la cadena de produccin de una empresa se


Salario
ui = x i
Ni
u
distribuyen
x i segnnila tabla
Niadjunta:
x i ni
%p =
.
% q .100
= i
[L i
n
acumulada
i
uk
100
Salarios
10

20
20

40
40 50 50
L10
)
60 100 100 36,3
15
12000 12000 180000
180000
i+1 20
200
N
12000
6000
1000
80
20050
x
empleados
0
20 40 30
6000 18000 180000
360000
90
72,7
Qu
porcentaje
de
empleados
que
percibe
el
50%
de
los
salarios?
Es
3
40 50 45
1000 19000 45000
405000
95
81,8
equilibrada la distribucin de salarios?
2
50
75
800
19800 60000
465000
99
93,9
100
4
100
150
200
20000 30000
495000
100
100
Solucin:
5
200
4
5
4

x
n

p
344

i
i
i
i
qi 284,85
i1
i1
495000
20000
i
i

En la tabla se observa que el 60% de los empleados percibe el 36,36% de los


salarios y que el 90% de los empleados percibe el 72,73% de los salarios. Para
estimar el porcentaje (x) de empleados que percibe el 50% de los salarios se
necesita realizar una interpolacin lineal:
x 60
50

90 60

36,3
6

72,73 36,3

x 60

90 60

13,6
4

x 71,25%

36,37

qi

I 1

i1

pi

284,85
1

0,17
344

i1

La concentracin es pequea, pudiendo concluir que la distribucin de salarios es


equilibrada.
3. Sea la distribucin bidimensional, donde las variables X e Y son
estadsticamente independientes.
X\Y
1
2
Se pide:

3
3
2

4
c
6

a) Calcular las medias y varianzas marginales.


b) Hallar la covarianza y las rectas de regresin.

Solucin:
X \
Y1
2
n
j

3
3
2

4
c
6

6c

ni
nij ni n j
3
i, j
Por
ser
independientes:
.
c
N
N
N
118 c

c
x

11 c 3 c

c
6c

(3 c).(6 c) c.
(11 c)

18
2

X \ Y
1
MEDIAS Y VARIANZAS MARGINALES:
2
n

ni

3
3
2

4
9
6

12
8

15

20

MARGINAL DE LA VARIABLE X:

xi ni

a x
10

1 . 12 2 . 8
1, 4
N

i1

a
20

i1

ni i
1
N

21 . 12
2 . 8
20

2,2

20
2

sx a 20 a
2
1, 4

2,2 0,24

MARGINAL DE LA VARIABLE Y:

a0 y
3,75
1

y jn

j1

sy a 02 a
2
3,75

3 . 5

20

4 . 15

a0

j1

N
20

n
j

2
2
153 . 5 4 . 14,25

14,25 0,1875

b)
sxy a11 a10 a01
covarianza:

X \ Y
1
2
n

X \ Y
1
2
n j

ni

3
3
2

4
9
6

12
8

15

20

x y

a1
1

i1 j1

nij
1. 3. 3 1. 4 . 9 2 . 3. 2 2 . 4 . 6

105
5,25
N
20
30
j

s xy a11 a10 a01 5,25 1, 4 . 3,75 0


Sin calcular la covarianza, se conoca que la covarianza sxy 0 por ser (X, Y)
variables independientes.
Si (X, Y) independientes
s
SiXYsxy0 0
independientes

(X, Y) No son

Y/X: Y a b X
Por otra parte, se conoce que en las rectas de
X/Y: X a' b' Y
regresin:
Los coeficientes de regresin respectivos (b, b') dependen de la covarianza s xy ,
dado que vienen
s
s
xy
expresad b xy
2 , b'
.
2
s
os:
s
x

Si sxy b 0 , b' 0
0
Y/ X : Y a
X / Y : X a'

Con lo cual, las rectas de regresin


solicitadas son:

Los coeficientes respectivos (a, a') se calculan teniendo en cuenta:


Y/X: Yab
X

Y a b 3,75 a 0 x
X
1, 4

a
3,75

gre

/X

X a' b' 1, 4 a' 0 x


Y
3,75

re
Y

X / Y : X a' b'
Y

ect

Y 3,75

si

a' 1, r ect a
4
re gre si n

/Y

X 1,
4

Advirtase que cuando las variables (X, Y) son independientes, la covarianza sxy 0
En consecuencia:

Las coeficientes de regresin b 0 , b' 0

La recta de regresin de Y/X: Y Y 3,75


La recta de regresin de X/Y: X X 1, 4
2

El coeficiente de determinacin r b . b' 0 , es decir, las dos rectas son


perpendiculares y las
variables son INCORRELADADAS.

Si (X, Y)
independientes

s XY 0

b0

b' 0

4. En una distribucin bidimensional se conoce:


r 0,7
Obtener:

Solucin:

sx 1,2

y 4

X / Y : X 0,6 0, 44 Y

a) Recta de regresin de Y/X


b) Varianza
de Y

r 0

a) Recta de regresin de X sobre Y:


a' 0,6

X 0,6 0, 44 Y

b' 0, 44

X 0,6 0,
44 Y

X 0,6 0, 44 . 4 2,36

De otra parte, el coeficiente de determinacin r :


2

r b.
b'

0, 7

0,7 b . 0,
44

0,
44

1,114

La recta de regresin de Y sobre X: Y


abX

Y a b 4 a 1,114 .
X
2,36

Y/X: Y 1,37 1,114 X


b) Varianza de la Y: Sabemos que, s x 1,2
s xy
b 2
sx

1,114

xy

1,2
2

b' 0, 44

sxy 1,114 . 1,22 1,604

b 1,114

a 1,37

EXAMEN DE ESTADSTICA
DESCRIPTIVA

GRADO EN ECONOMA
14 de Mayo 2013
1.

Una institucin pblica decidi estudiar el gasto mensual en alimentacin en


una ciudad, para lo cual se seleccion un distrito y se tom muestras cuyo
resultado fue el que sigue:
Distrito
Gasto ($)1 N
100 200 Familias
24
200 300
36
300 400
20
400 500
20
500
50
1000
a) Halle el gasto medio y el mediano en alimentacin del distrito
b) Si existe un segundo distrito de 120 familias con un gasto medio de 419,4
$ y una desviacin tpica de 242,701 $, cul de los dos tiene un gasto
medio ms representativo?
c) Halle el gasto medio y la desviacin tpica del conjunto de los dos distritos.
d) Cul es el nivel de gasto realizado por un mayor nmero de familias en el
distrito 1?
e) Cul es el mximo gasto realizado entre las 50 familias con menor gasto
del distrito 1?
f) Un ndice de Gini de 0,10 en esta distribucin qu nos indicara?

Solucin:
a)
[L i L i1 )
100
200
300
400
500
500
1000

xi

ni

150
250
350
450
750

x i .ni

24 3600 540000
36 9000 225000
0
20 7000 245000
0
20 9000 405000
0
50 3750 2812500
150 0
6610 0
374150
0
00

x n
i

Gasto
medio:

i1

Nii

x .ni

66100
440,67 $

24 N
60
80
100
150

ni

Fii N

ci

n
di i
ci

0,16
0,24
0,13
0,13
0,33

0,16
0,40
0,53
0,66
1

100
100
100
100
500

0,24
0,36
0,2
0,2
0,1

N
150
El Gasto mediano se encuentra en el intervalo 300 400
Mediana
: M

150

2
e

75

150
60
75 60
100 300
100 375 $
300 2

N i1
L 2
c
N i

Ni1
ni

80 60

80 60

b) El coeficiente de variacin de Pearson mide el grado de homogeneidad de


una distribucin
2
5

x i ni
2
37415000

2
2
2
s x i1
x
440,67 55243,28
ax
2
N
150

Distrito 1
sx 55243, 235, 04
28

sx 235, 04
CVx

0, 5334 (55,34%)
x
440,67

s y 242,701
y 419, 4

Distrito
sy
242, 701
CV
0, 5787 (57,87 %)
2
x

y
419, 4

Al tener el Distrito 1 un Coeficiente de Variacin de Pearson ms pequeo


(menor dispersin del gasto medio) indica que tiene una media ms
representativa que el Distrito 2.
c)

El gasto medio y desviacin tpica conjunta de los dos distritos:

Distrito 1:
(X ; n1 150 , x 440,67 , s x
235, 04 )

Distrito 2:
( Y ; n2 120 , y 419, 4 , s y
242,701)

N n1 n2 150 120 270


n x n2 y 150 . 440,67 120 . 419, 4
xy 1
media ponderada

431,22
n1
150 120
n2
media ponderada
varianza
ponderada de las
de las
varianzasp
medias parciales
arciales
2

var ian za

total
2
s
x1 x2

si ni

i1

2
i

(x xi ) n

i1

intragrupos

entregrupos

media
ponderada
de las
varianzasp
arciales
2

s
i1

2
i

ni

ns2 n s2 150 . 235, 042 120 . 242, 7012

56870, 45

150 120

N
n1 n2
varianza
ponderada
de las
medias
parciales
2

(x x )
2

ni

i1

(440 , 67 431, 22) . 150 (419, 4 431, 22) . 120

111,71
270

varia nza

total

56870, 45 111,71 56982,16


s

sx y

d) El intervalo modal es 200 300

56982,16 238,71
x y

por tener mayor densidad de frecuencia

d2

0,36
Md L

(d i d
i1 )

c
(d i d i1 ) (d i
d i1 )

Intervalo 200

d
i

d
i1

i1
i1

(0,36
100 242,86 $
0,24)
(0,36 0,24) (0,36
0,2)

d i1

i1

Md 200

300 :

Moda
aproximada: M

Moda aproximada: Md
Li
d

0, 2
c 200
100 245, 45 $
0,24 0,2

i1

e) Mximo gasto realizado entre las 50 familias con menor gasto del distrito 1
33, 33 . N
50
15

0,33 P33,33 Li

(33,33%)

N
100
N
i
N i1

i 1

ci

ni

33, 33 . 150
P33,33 L i

N
100
N
i
N i1

50
c 200
24

60
24

i
i 1

100 272,22 $

ni

f) Un ndice de Gini de 0,10, al ser prximo a cero, indica que el gasto se


encuentra bastante bien repartido entre las familias.

2.

Se ha realizado un estudio para determinar la recta de regresin que


explique el gasto diario de los clientes del hotel (Y, medida en ) en funcin
de la edad de los mismos (X, medida en aos). Tras analizar los datos se ha
obtenido la siguiente recta de regresin Y/X:
Y 25 2,9 X

a) Interprete los resultados de la recta de regresin.


b) Si se sabe que sx y que s y 30 , determine la bondad del ajuste de esta
10
recta de
regresin a partir del coeficiente de correlacin lineal e interprtela.
Calcule los parmetros de la regresin de X sobre Y sabiendo que la
media de edad de los clientes es de 30 aos.
d) Cul sera la edad esperada para un husped que ha gastado
diariamente 100 euros? La prediccin ser fiable?. Razone la respuesta.
c)

Solucin:
a) 29 es el coeficiente de regresin lineal. Al ser positivo cuando X crece, Y crece
e indica el aumento de gasto de un cliente cuando su edad aumenta en una
unidad.

25 euros es el valor de Y para X=0 aos. En este caso no tiene sentido.


b) La bondad del ajuste viene dado por el coeficiente de determinacin:
a
Y/X : Y 25 2,9 X 25

b 2,9

s2x

s
r b . b'

s b. s
s
xy

Coeficiente
determinacin:

sxy

xy

s x. s

290

10 . 30

2,9 . 10 290
x

xy

0,934

La relacin lineal es bastante buena ya que el 93,4% de la variabilidad de Y se


explica a partir de su dependencia con la variable X.
c)

x 30

y 25 2,9
. x

y 25 2,9 . 30 112 Y 25 2,9 X

r
0,934
0,322
b' b'
X a' b'
b
2,
Y
9
x a' b' 30 a' 0,322 . 112

y
Recta de regresin de X/Y:
a' b' Y

a' 6, 064

X 6, 064 0,322 . Y

d) Edad esperada para un husped con un gasto diario de 100 euros


X / Y : para Y
100

X 6, 064 0,322 . 100 26,136 euros

La prediccin es con una fiabilidad


del 93,4%

3.

(r 0,934 )

Un sector de la economa nacional dispone del valor de produccin a


precios corrientes de cada ao (miles de euros) y los ndices de precios de
Laspeyres y Fisher.

Ao
2007
2008
2009
2010
2011
2012

Produccin
(precios
corrientes)
78.14
7
91.35
7
88.85
4
92.89
2
101.33
6
102.57
8

Lp (%)

Fp (%)

100
104,22
107,25
109,05
114,87
126,35

100
105,34
108,94
111,36
117,67
130,18

Utilizando el deflactor ms idneo, calcular la produccin anual en precios


constantes de 2007.
Soluci
n:
Para calcular el valor real (precios constantes) de una magnitud se requiere
deflactar el valor nominal (precios corrientes), eliminando la influencia que han
experimentado los precios. Para ello, se deflacta la serie dividiendo el valor
nominal entre un ndice de precios.

(p rec ios cor rie

Vt

nt es )

V
=


Valor
Valor
No minRe
al al

ndice Pr
(precios
ecios
constantes)

. 100

Ip, 0t

El deflactor ms adecuado es el de Paasche, ya que con ste ndice de precios se


obtiene una relacin entre valores monetarios corrientes y valores monetarios
constantes.
n

ndice de
Paasche:

pit .qit

P
p

i1

pi0 .qit

Vt

pit .qit
i 1

Pp

i0

it

i1

pit .
qit

i1

p .q

i1
n

pi0 .qit
i1

El ndice de precios de Fp
Fisher

Ao

Producci
n
(precios
VNt
p

2007
2008
2009
2010
2011
2012

78.14
91.35
7
88.85
4
92.89
2
101.336
102.578

Lp .
Pp

%
Lp
100
104,22
107,25
109,05
114,87
126,35

Pp

(Fp
2
)
Lp

% Fp
100
105,34
108,94
111,36
117,67
130,18

(F p)
%Pp
L

100
106,47
110,66
113,72
120,54
134,13

Producci
n
R

N
t

7814
P
85803,7
5
80297,0
4
81685,6
1
84069,5
8
76478,7
8

4.

En la tabla adjunta se reflejan las ventas trimestrales de una empresa en


millones de euros. Halle la serie desestacionalizada por el mtodo de las
medias mviles.
Trimestres \
AosPrimero
Segundo
Tercero
Cuart
o

2008
2
2
3
3

2009
3
4
5
4

2010
2
4
5
4

2011
4
5
7
3

2012
5
6
8
5

Solucin:
Se obtienen las medias mviles de tamao 4 (perodo de las variaciones
estacionales), que al ser un nmero par, sern descentradas y correspondern a
los perodos intermedios entre cada dos trimestres consecutivos:
Y2,
5

Y4,
5

Y1 Y2 Y3 Y4

2 2 3 3

Y3,
5

2, 5
4
4
Y3 Y4 Y5 Y6 3 3 3 4

Y5,

Y2 Y3 Y4 Y5
4
Y4 Y5 Y6 Y7
4

2 3 3 3
4
3 3 4 5
4

2,75
3,75

3,25

4
4

Y Y17 Y18 Y19


3 5 6
Y Y18 Y19 Y20
5 6 8
Y17 16
Y18 17

,5
8
5
,5
5, 5
6
4
4
4
4

SERIE DESCENTRADA
Trimestres \
2008
Aos
Primero

Segundo
Segundo
2,5
Tercero
2,7
Cuarto
5
3,2
Primero
5

2009
3,7
5
4
3,7
5
3,7
5

2010
3,7
5
3,7
5
4,2
5
4,5

2011
5
4,7
5
5,2
5

2012
5,5
6

Para corregir la nueva serie de mviles descentrada, a partir de ella se calcula la


media aritmtica de cada dos valores sucesivos, asignando este nuevo valor al
instante central de los dos periodos considerados, es decir:
Y 2 ,5 Y3,5
Y

2,625
3

2,5 2, 75

Y
Y
4

3 ,5

Y
2, 75
3,
4
,5 25

3
2
2

Y17 ,5
Y
Y17 ,,5 Y18 ,5
5, 25 5, 5
5, 5 6
Y1 16 ,5
Y1

5,75
2
2
7
8
5,375
2
2

SERIE CENTRADA: COMPONENTES TENDENCIA Y CCLICA


Trimestres \
2008
2009
2010
2011
AosPrimero

3,5
3,750
4,750
Segundo

3,875
3,750
4,875
Tercero
2,625
3,875
4
4,875
Cuart
3
3,750
4,375
5,125
o

2012
5,375
5,750

Y3 , Y4 se toma como lnea de tendencia.


La lnea que une los puntos

, , Y18

El inconveniente que presenta el mtodo de las medias mviles es que no


permite efectuar predicciones, puesto que con l no se obtiene la expresin de
una frmula matemtica que facilite obtener el valor de la tendencia para un
instante futuro.
Este motivo hace que el mtodo se utilice poco para determinar la tendencia,
aunque s se utiliza en
el clculo de los ndices de variacin estacional (IVE).
Al aplicar el mtodo de las medias mviles, en el esquema multiplicativo Yi t =
Ti t .Eit . Cit . A i t , lo que
realmente se obtiene es una
aproximacin de Tit .Cit

(componentes tendencia y cclica),


quedando sin

analizar las componentes estacional ( Eit ) y accidental (Ait ).


La
Tit y la componente cclica Cit se eliminarn dividiendo cada dato de la
tendencia serie original Y
it
por la correspondiente media mvil:
Yi t
Ti t . Cit

Ti t .Eit . Cit
. A it
=
= Eit . A it
Tit .
Ci t

quedando la componente estacional y accidental

Trimestres \
2008
2009
2010
Aos
Primero

3/3,5
2/3,75
Segundo

4/3,875
4/3,75
Tercero
3/2,625 5/3,875
5/4
Cuart
3/3
4/3,75
4/4,375
o
COMPONENTES ESTACIONAL Y ACCIDENTAL
Trimestres \
2008
2009
2010
Aos
Primero

0,857
0,533
Segundo

1,032
1,067
Tercero
1,143
1,290
1,250
Cuart
1
1,067
0,914
o

2011
4/4,75
5/4,875
7/4,875
3/5,125

2012
5/5,375
6/5,75

2011
0,842
1,026
1,436
0,585

2012
0,930
1,043

El ndice Bruto de Variacin Estacional (IBVE) se calcula eliminando la


componente accidental A i t . Para ello, se hace el clculo de las medias
aritmticas trimestrales, es decir, la media aritmtica de cada fila de la tabla
anterior (donde solo apareca el producto de Ei t . A i t ):
0, 857 0, 533 0, 842 0, 930
0,791

4
1,143 + 1, 290 + 1,250 + 1,
436

= 1,280
4

1, 032 + 1, 067 + 1, 026 + 1, 043


= 1, 042
4
1 + 1, 067 + 0, 914 + 0, 585
= 0,892
4

COMP. ESTACIONAL Y ACCIDENTAL

Trim \
2008 2009 2010 2011
Aos
Primero 0,857 0,533 0,842
Segund 1,032 1,067 1,026
oTercero 1,143 1,290 1,250 1,436
Cuarto
1
1,067 0,914 0,585

2012
0,930
1,043

COMPONENTE ESTACIONAL
IBVE
%
(0, 791 / 1, 001) . 100
0,791
78,990
042 / 1, 001) . 100
1,042 (1,
(1, 280 / 1, 001) . 100
1,280 104,095
(0, 892 / 1, 001) . 100
0,892 127,847
89,067 400
1,001

IBVE

4 , 004

1, 001
4
Advirtase que los ndices de variacin estacional (IVE) tienen que sumar 4
(400%)
Sobre un nivel medio de ventas, la influencia de la variacin estacional (% IVE
100) produce:
1 Trimestre:
21, 01%

(78,990 100)

2 Trimestre:
4, 095 %
3 Trimestre:
27,847 %
4 Trimestre:
10,933 %

(104, 095 100)


(127,847 100)
(89, 067 100)

descenso
21,01%
ventas
aumento
27,847%
descenso
10,933%

de ventas del
aumento
de
del
4,095%
de ventas del
de ventas del

La DESESTACIONALIZACIN (aplicando el mtodo a la razn a la media mvil)


consiste en dividir cada valor de la serie original por cada ndice de Variacin
Estacional correspondiente, en porcentaje
Yit
.100
%
IVEt
Trimestres \
2008
Aos
Primero
(2/78,99).10
0
(2/104,095).1
Segundo
00
(3/127,847).1
Tercero
00
(3/89,067).1
Cuart
00
o
SERIE DESESTACIONALIZADA
Trimestres \
2008
Aos
Primero
2,532
Segundo
1,921
Tercero
2,347
Cuart
3,368
o

2009

2010

201
1
(4/78,99).10

2012

(3/78,99).10 (2/78,99).10
(5/78,99).10
0
0
0
0
(4/104,095).1 (4/104,095).1 (5/104,095).1 (6/104,095).1
00
(5/127,847).1 00
(5/127,847).1 00
(7/127,847).1 00
(8/127,847).1
00
00
00
(4/89,067).1 (4/89,067).1 (3/89,067).1 00
(5/89,067).10
00

00

2009
3,798
3,843
3,911
4,491

00

2010
2,532
3,843
3,911
4,491

2011
5,064
4,803
5,475
3,368

2012
6,330
5,764
6,257
5,614

EXAMEN DE ESTADSTICA
DESCRIPTIVA

GRADO EN ECONOMA
21 de Junio 2013

1. En una fbrica trabajan 20.000 personas en la cadena de produccin, cuyos


salarios, en miles de euros, se distribuyen segn la tabla adjunta:
Salarios

10 20
12.000

40 50
1.000

20 40
6.000

50 100
N
80
trabajadores
0
a) Determine el grado de concentracin de los salarios

100
200
200

b) Qu parte de la nmina percibe el 5% del personal mejor pagado?


c) Qu porcentaje de los trabajadores percibe el 50% de los salarios?
d) Si la empresa hace una reestructuracin del 60% de plantilla en cada uno
de los tramos de los salarios, cul sera el ndice de Gini?
Solucin:
a) Ordenando los datos de forma creciente:

Salarios

xi

ni

10 20

15

20 40
40 50
50
100
100
200

30
45
75
150

x i ni

Ni

12000 1200
0
6000 1800
1000 0
1900
800 0
1980
200 0
2000
0

18000
0
18000
045000
60000
30000

N
%pi i .
100
N
60
x
90
95
99

U xi i
n
acumulada
i

180000
360000
405000
465000
495000

344

% iq

Ui

100
36,3
6
50
72,7
3
81,8
2
93,9
4

284,85

ndice de
Gini:

Ii1 1
G
5

p
i1

284 , 85

0,1719 (17,19 %)

344

b) Comenzando por los salarios ms bajos, se observa que el 81,82% de los


salarios, es percibido por el 95% de la plantilla. En consecuencia, el 5% del
personal mejor pagado percibe el 18,18%

c)

Se observa que el 60% de los trabajadores percibe el 36,36% de los salarios,


mientras que el 90% de los trabajadores percibe el 72,73% de los salarios.
Para estimar el porcentaje x de trabajadores que percibe el 50% de los
salarios, se realiza una interpolacin lineal:

90 60
60

72,73 36,36
36,36

x 71,25 %

50

d) El ndice de Gini tiene que ser coherente con el Principio de la Poblacin, es


decir, el ndice de Gini no varia cuando el conjunto de individuos con la misma
renta se multiplican por un escalar.
En consecuencia, si la empresa hace una modificacin de la plantilla del 60%
en todos los tramos
de salarios el ndice de Gini tiene que ser IG 0,1719
el mismo:

2.

Dada la tabla de correlacin:


X\Y
1
2

0
1
4

3
5
4

6
2
1

a) Hallar las rectas de regresin mnimo cuadrticas asociadas.


b) Hallar la varianza explicada por la regresin y la varianza residual de la
recta Y/X, explicando los resultados.
Solucin:
a) Se efectan los clculos necesarios para obtener los momentos respecto al
origen:
X \ Y
0
ni
x i ni
1
1
5
2
4
4

2
1

8
9

8
18

xi xi y
nij
8
36

26

44

ni 2

n j

17

y j n j

27

18

45

y 2j n

81

108

189

0
0

12
12

15
24

63

26
x

xi ni

1,
53
N

i1

10

x
a
2,
20 59

2
i

ni

i1

44

sx a 20 a
2
1,53

2,59 0,25

17

17
3

n
a0

189

j1

s
a2 02 a 11,12 4,1
y 45
2,65

2,65

a02
2

a1
1

x y

i1 j1

nij

3,71
N
17

63

j1

11,12
17

sxy a11 a10 . a01 3,71 1, 53 . 2,65 0,34

0
,
34
xy
bs

1,36
2
0,25

Recta regresin
Y/X:

Y/X:
Y

Ya bX

x
y a b x ay b

2,65 1,36 . 1, 53 4,73

4,73 1,36 X

0
,
34
b' s2y xy 083 0,
Recta regresin X a' b' Y
4,1

X/Y:

X/Y:
X

x a' b' a' x b' 1, 53 0, 083 . 2,65


y
1,75
y

1,75 0,
083 Y

b) Coeficiente de
determinacin:
Varianza residual
de Y:

r b . b' (1,36). ( 0, 083) 0,1129

s2 s2 (1 r2 ) 4,1 (1 0,1129 ) 3,637


ry

Varianza explicada por la


regresin:

s2 y s2 Ry s2 r y s2 s2 R ys2 4,1
3,637
0, 463
y
ry

2
2
s s2 . 4,1 . 0,1129 0, 463
Ry r
y

La mayor parte de la variable dependiente Y resulta ser residual, un


100 88,7 % .

3, 637

4,1

En consecuencia, una pequea parte queda explicada por la regresin:


r2 . 100 0,1129 . 100 11,29 %

(0, 463 / 4,1) . 100 11,29 %


Al ser la varianza explicada muy pequea, el ajuste no es bueno y las rectas de
regresin no pueden utilizarse de manera fiable para hacer predicciones.

3. Un trabajador ha recibido los siguientes salarios en los


aos 2005 y 2006: Salario 2005 = 18.565 euros
Salario 2006 = 19.005 euros
Esta persona quiere saber si su poder adquisitivo ha aumentado en el ao 2006
respecto al 2005. Para ello dispone de la siguiente informacin relativa al ndice de
Precios de Consumo con base el ao 2002
2005

IPC200
e

109,93 %

2006

IPC200

113,63 %

a) Interprete el valor de los nmeros ndice proporcionados


b) Determine e interprete la tasa de variacin que ha sufrido el poder
adquisitivo de este asalariado entre los aos 2005 y 2006, en trminos
nominales y en trminos reales (constantes del 2002)
c)

Si el salario del trabajador en el ao 2002 fue de 16.000 euros, cul fue


la tasa media anual acumulativa en trminos nominales y reales
(constantes del 2002) en el periodo 20022006?

Solucin:
a)
2005

En el ao 2005 los precios se han incrementado un 9,93% respecto


al ao 2002

2006

En el ao 2006 los precios se han incrementado un 13,63%


respecto al ao 2002

IPC200 =
109,93%
IPC200 =
113,63%

b) Para calcular el salario real (precios constantes) se requiere deflactar el


salario nominal (precios corrientes), eliminando la influencia que han
experimentado los precios. Para ello, se deflacta la serie dividiendo el valor
nominal entre el IPC

precios
corrientes
Salario
nominal

t
IP 2002

precios
constantes

Salario
real =

Tasas de
variacin

Nominal :

Re al :
2005

SR

corriente
cons tan te

200
5

SN2005

IP

200
5
200
2

18565

16888, 02 euros

1,
0993

16725,34 euros
SRcons tan te corrient
S e
2006

IP2006

200 19005
6
1,136
200
2
3

2006
200
5

TV

19005

18665

16725, 34

1 . 100 0,963%

16888, 02

2006

TV

1 . 100 2,37%

En trminos nominales el salario ha crecido un 2,37%, aunque en trminos reales


(eliminado el efecto de la inflacin), el salario ha disminuido un 0,963%.
c)

La tasa media anual acumulativa en trminos nominales y reales


(constantes del 2002) en el periodo 20022006

SNcorriente

Isalario
nominal

SN200

real

19005

1,1878

2006

2
salario

cons tan
te
2006

S
SR2002

16000
16725, 34
1, 0453
16000

Tasa de variacin media anual en trminos nominales:


TM nominal I salario
4

nominal

1,1878

1 1, 04396 1 0, 4396 (4,396 %)

Tasa de variacin media anual en trminos reales:


TM real I salario
4

4.

real

1 4 1, 0453 1 1, 0111 0,111 (1,11%)


1

Tras analizar los datos referentes a un ao y medio (desde 2004.1


hasta 2005.2) de una determinada serie temporal (Y), de periodicidad
trimestral, se han obtenido los siguientes resultados con t = 0, 1, , 5:
15 t =

2
55 t2 =

t yt =
71.950

yt =
19.073

= 97.199.705

Los ndices de variacin estacionales han sido:


IVE1 = 1, 033

IVE2 = 0,87

IVE3 = 0,97

IVE4 = 1,127

a) Realice un ajuste lineal de la tendencia de la serie. Determine a partir del


coeficiente de determinacin lineal si el ajuste es bueno o malo, y prediga
el valor de la serie para el tercer y cuarto trimestre del ao 2005.
b) Interprete estadsticamente los IVEs
Solucin:
s ty
b
Y a b. t
st

a) Recta de regresin de Y
sobre t:

i1

N
N

15

t1

2, 5
6
6

ayb

t
6

1907
3

y
a

3178,83

11

t
t1

71950

11991,67
6

s ty a11 t . y 11991,67 2, 5 . 3178,83


4044, 59

ty

st
t

4044 , 59
b

1385,13

i 1

55
2
2, 2,92
6

2,92

con lo que, Y = 283, 99 +

1385,13 . t

a 3178,83 1385,13 . 2, 5 283,99

El Coeficiente de
determinacin lineal:
6

s
t
b'
ty

R b . b'

s t 1 y
0, 00066
y
2
N
sy
6094990,66

97199705
59
2

3178,83 6094990,66
6

b'

4044,

R b . b' 1385,13 . 0, 00066 0,914


2

El modelo es bueno porque explica el 91,4% ( R = 0, 914 ) de la variabilidad


de Yt en funcin de t. Para predecir el tercer (t 6) y cuarto trimestre (t 7)
de 2005: Y = 283,99 + 1385,13. t
2005.3: Y = 283,99 + 1385,13 . 6 = 8026,79
2005.4: Y = 283,99 + 1385,13 . 7 = 9411,92
En el esquema multiplicativo Yit = Tit
. Ei t . Ci t . A it

Yit = Tit .
IVEh

(h t)

= T2005.3 . IVE3 = 8026,79 . 0,97 = 7785,99


Y
Yit = Tit . 2005.3
IVEh
Y2005.4 = T2005.4 . = 9411,92 . 1,127 = 10607,23
IVE4
b) Los ndices de variacin estacional muestran el componente estacional en el
esquema
multiplicativo. El componente
Eit son las oscilaciones que sufre una serie
estacional
temporal en
periodos inferiores o iguales a
un ao.
IVE1 = 1, 033

IVE2 = 0,87

IVE3 = 0,97

IVE4 = 1,127

IVE1 = 1, 033 significa que por el hecho de estar en el primer trimestre, la


variable Yit es un 3,3%
mayor que el comportamiento habitual o tendencia de la serie.
IVE2 = 0,87 significa que por el hecho de estar en el segundo trimestre, la
variable Yit es un 13%
menor que el comportamiento habitual o tendencia de la serie.

EXAMEN DE ESTADSTICA
DESCRIPTIVA

EXAMEN DE ESTADSTICA DESCRIPTIVA


28 DE JUNIO 2013
1. Se quieren analizar los accidentes de trfico en las provincias espaolas.
Se disponen de los siguientes datos:
Accidentes de Trfico
N de Provincias
(miles)
espaolas25
0
15
15
35
35
10
50
a) Obtenga el nmero medio de accidentes por provincia y su valor mediano.
b)

La media obtenida en el apartado anterior, es representativa?

c) Se producen en Espaa los accidentes de forma concentrada segn provincias?


Justifique el indicador empleado para medir la concentracin de los accidentes e
interprete los resultados.

d) En Alemania se ha realizado un estudio similar al espaol. Se ha obtenido un


ndice de Gini del
0,70. Dibuje las curvas de Lorenz tericas que representaran los indicadores
de concentracin de ambos pases y explique la posicin de cada una de ellas.
Solucin:
a)
[L i L i1
) 0 15
15 35
35 50

xi

ni

7,5
25
42,5

25
15
10

15
20
15

Ni

xi n

15
40
50

187,5
375
425
987,5

xi ni
1406,25
9375
18062,5
28843,75

xn
i

Nmero medio
accidentes:

i1

987, 5
19,75

N
50

N
Ni1
50
2
Valor mediano: Me

Li
15
c

15

i
2

25
20 15
15

20 23

.4

N i N i1

40 15

40 15

ni

b) Para saber si la media obtenida es representativa se calcula el Coeficiente de


Variacin de
Pearson:

n
a2 i1

28843, 75

576, 875
50

s a
a 576,875 186,8125
2
2

19,75
s 13, 67
CV
0,6911
x 19, 75

s 186, 8125 13, 67

(69,11%)

El Coeficiente de Variacin de Pearson cuantifica el grado de dispersin


(69,11%), que resuelta ser alto, por lo que la media aritmtica no es
representativa.
c)
Rentas
ni
xi
[L i L i1
) 0 15 7,5 25
25
15
15
42,5 10
35
50

Ni

xi n

15
40
50

187,5
375
425

Ui

Ui x i
ni

Ni

%p
i
100N

187,5
562,5
987,5

50
80
100

100
18,99
56,96
100

130

75,95

987,5

%q

%(p q
)

31,01
23,04
0
54,05

El grado de concentracin de accidentes viene reflejado por el ndice de Gini:


2

(p

75,
95
Ii1 1
1
58%)
G
13
2
0
pi
i1

0, 4158 (41,

o
bien

qi )

54 , 05

0, 4158
130

Ii1
G
2

p
i1

Cuanto ms prximo a cero se encuentre el ndice de Gini ser ms


equitativo el grado de concentracin de accidentes, siendo de 41,58%, se
puede concluir que existe concentracin de accidentes.
d)

IG (Alemania) 0,70 IG (Espaa)


0, 4158 concluyendo que en
Alemania estn ms concentrados
los accidentes, esto es, al dibujar

las curvas tericas, la curva de


Lorenz de Espaa se encontrara
ms prxima a la diagonal
principal.

2. A partir de la tabla adjunta, siendo N 11 , Y 0


X \ Y
0
1

2
0
3

0
1
n22
1

1
0
n23
0

a) Son independientes las variables estadsticamente?


b) Rectas de regresin de Y/X e X/Y
c) Qu parte de la varianza calculada Y es explicada por la regresin? Qu

parte es debida a causas ajenas?


Solucin:
a)
X \ Y

0
1

0
3

2
n j

1
n22
1

0
n23
0
n23

De otra
parte,

2 n22

2 .3 0 n23

ni
1
3 n22 n23
1
5 n22 n23
11

n23 6

0
11

5 n22 6 n22 0
11
X \ Y
2
0
0
1
2
n j

ni

0
3
0

1
0
1

0
6
0

1
9
1

11

Las variables X e Y son


independientes
ni j
n i nj
i, j

N N

n12 n1 n2

N N

No son
porque no se verifica la relacin:
1
1 independientes
2
x

11 11
11

b)
3

x i yj
ni j
i1 j1

2 . 1. 3

1 . 1. 6 0

11

a
i1

10

11

11

x i ni

1 .9 0 2 .
1

a
i1

20

11

x i2
1
ni
12 . 22 . 1

9
N
11

13

s2
a

2
a

x
10

20

13

0, 43

11

yj nj

a01 y
0

y
01

11
11

j1

s2
a

2
a

02

a02

N
11
18

0
18
11
11

y 2j
nj
j1

18

1
(2) . 3 1 . 6

N
11
2

18
2

1,28

11

covarianz sxy a11 a10 . a01 1 . 0 0


a:
0
s
El coeficiente de regresin de Y sobre X (pendiente
xy
de la recta):
b

s2x 0
Y a b
X
Y/ X :

0 a 0.1

2 / 11

a
0

Y0

s
El coeficiente de regresin de X sobre Y (pendiente
xy
de la recta):
b'

s2Y 0
X a' b' 1 a' 0 .
Y
0
X/ Y :

18 / 11

a' 1

X1

COEFICIENTE
DETERMINACIN:

r b . b'
0

Las rectas son perpendiculares, y


en
consecuencia, las variables (X, Y) son INCORRELADAS
VARIANZA RESIDUAL s2 s2 (1 r2 ) s2
DE Y:
ry
y
ry

s2
sy
rY

2
s
Y explicada

18
11
11

18

Y explicada

18

(1 0)

11

Y explicada

18
11

3. En la tabla se presenta el valor de importaciones de un pas durante los aos


2009 y 2010.
Importaciones
Alimentos
Otros bienes de
consumo
Bienes de capital
Bienes intermedios
TOTAL

2009
1010
7450
2400
4755
15615

2010
1200
7955
2210
6256
17621

Se sabe que las importaciones tanto de alimentos como de otros bienes de


consumo se pagaron un
3% ms caras en 2010 que en 2009.
Las importaciones de bienes de capital subieron sus precios un 1,2% y las de
bienes intermedios bajaron un 0,5%.
Se pide:
a) Calcular el ndice de precios total de las importaciones en 2010 con base 2009,
utilizando Laspeyres y Paasche.
b) Cunto crecieron las importaciones en cantidad en 2009 con respecto a 2010?
Solucin:
a)
Utilizando el ndice de precios de Laspeyres:

Importaciones
Alimentos
Otros bienes de
consumo
Bienes
de capital
Bienes intermedios
TOTAL

pi,09 .
qi,09
1010
7450
2400
4755
15615

Laspeyre
s
pi,10 .
pi,10 .
qi,10
i,09
1200
1,03 xq1010
=
7955
2210
6256
17621

1,03 x 7450 =

7673,5
1,012
x 2400 =
2428,8
0,995
x 4755 =
4731,23
15873,83

i1pi,10 .qi,09

Lp

pi,0 .

i1 9

15873,83
. 100
. 100 101,66%
15615

qi,09

Utilizando el ndice de precios de Paasche:

Importaciones
Alimentos
Otros bienes de
consumo
Bienes de capital
Bienes intermedios

pi,09 .
qi,09
1010
7450
2400
4755

Paasch
e
pi,10 .
qi,10
1200

7955
2210
6256

pi,09 .
qi,10 =
1200/1,03
7955/1,03 =

7723,30 =
2210/1,012
2183,79 =
6256/0,995
6287,44

TOTAL

15615

17621

17359,58

Pp

i1pit .qit
4

pi0.

17621
. 100
17359,58

. 100 101,51%

qit

i1

b) Para calcular los ndices cunticos de Laspeyres y Paasche se requiere hallar


previamente el ndice de valor de las importaciones entre 2009 con base 2010.
4

pi,10 . qi,10
V10 i1
17621
IV

1,1285 09
15615
V
4 p
09
i,0 .
9 q
i1
i,09
10

t
Siend
IV
o,
P L
0
Q0

t
P0

.t P

P0
Q0

.L

(112,85%)

10
10 IV 09
PQ 09 10
LP 0

112,85
. 100
. 100 111,01%
101,66

10

L IV
100

Q 09

10
09

PP10
0
9

112,8
. 100 111,17%
5
101,51

4. En la tabla adjunta se reflejan las ventas trimestrales de una empresa en


millones de euros.
Trimestres \
2006 2007 2008 2009 2010
Aos
Primero
1
2
2
3
5
Segundo
2
3
4
4
7
Tercer
4
5
5
7
8
o
Cuart
3
4
3
6
7
o
Suponiendo un esquema de agregacin multiplicativo en la serie temporal:
a) Desestacionalice la serie de ventas por el mtodo de las medias mviles.
Calcule los ndices de Variacin Estacional (IVEs) por el mtodo de la
tendencia.
b)

Solucin:
a) Para calcular la tendencia secular de la serie por el mtodo de las medias
mviles, se obtienen primero medias mviles de tamao 4 (perodo de las
variaciones estacionales), que al ser un nmero par, se pierden 4 datos, resulta
una serie descentrada y correspondern a los perodos intermedios entre cada
dos trimestres consecutivos.
Clculo de las medias mviles:
1 2 4 3
2,5 entre segundo y tercer trimestre de 2006
4
2 4 3 2
2,75 entre tercer y cuarto trimestre de 2006
4
4 3 2 3
3 entre cuarto trimestre de 2006 y primer trimestre de 2007
4
3 2 3 5
3,25 entre primer y segundo trimestre de 2007
4
2 3 5 4
3,5 entre segundo y tercer trimestre de 2007
4

SERIE DESCENTRADA de medias mviles


Trimestres \
2006
2007
2008
Aos
PrimeroSegundo

3,25
3,75
SegundoTercero
2,5
3,5
3,5
TerceroCuarto
2,75
3,5
3,75
CuartoPrimero
3
3,75
3,75

2009
4,25
5
5,5
6,25

2010
6,5
6,75

Para centrar la serie hay que calcular la media aritmtica de cada dos
observaciones sucesivas, de este modo, las medias que irn apareciendo,
respectivamente, sern:
2,5 2,75
2,625
2

2
3,5 3,75
3,625

2,75 3
2,875
2

3,75 3,75
3,75
2

3 3,25
2

3,125

3,75 3,5
3,625
2

3,25 3,5

3,375
2

3,5 3,75
3,625
2

3,5 3,5
2

3,5

3,75 3,75

3,75
2

3,75 4 ,25
4

4 ,25 5

5 5,5

4,625
2

6,5 6,75

5,25
2

5,5 6,25

6,25 6,5

5,875
2

6,375

6,625
2

SERIE CENTRADA de las medias mviles:


Trimestres \
2006
2007
2008
Aos Primer

3,125
3,75
Segund

3,375
3,625
o
Tercer
2,625
3,5
3,625
o
Cuart
2,875
3,625
3,75
o

2009
4
4,625
5,25
5,875

2010
6,375
6,625

La lnea que se obtiene al


representar grficamente la serie de
la tabla (t , yit ) ser la lnea de
tendencia, que comienza en el tercer
trimestre de 2006 y finaliza en el
segundo trimestre de 2010.

Al aplicar el mtodo de las medias mviles, en el esquema multiplicativo Yi t Ti t


.Ei t .Ci t . Ai t , lo que
realmente se obtiene en la serie cronolgica es una
aproximacin de Ti t .Ci t

, quedando sin
analizar las

componentes estacional ( Eit ) y accidental (Ait ).


La tendencia y la componente cclica se eliminarn dividiendo cada dato de la
serie original por la correspondiente media mvil:
Yi t
Ai t

E
Ti t . Ci t

Ti t . Ei t . Ci t .
i

. Ai

quedando la componente estacional y accidental

Ti t . Ci t

Trimestres \
2006
2007
2008
2009
AosPrimero

2/3,125
2/3,75
3/4
Segundo

3/3,375 4/3,625 4/4,625


Tercero
4/2,625
5/3,5
5/3,625
7/5,25
Cuart
3/2,875 4/3,625
3/3,75
6/5,875
o
Trimestres \
2006
2007
2008
2009
AosPrimero

0,640
0,533
0,750
SERIE
con las componentes
estacional
y accidental
Segundo

0,889
1,103
0,865
Tercero
1,524
1,429
1,379
1,333
Cuart
1,043
1,103
0,8
1,021

2010
5/6,375
7/6,625

2010
0,784
1,057

Se elimina la componente accidental Ai t con el clculo de las medias aritmticas


trimestrales, es
decir, la media aritmtica de cada fila de la tabla anterior (donde solo apareca el
producto de Ei t . Ai t ):
0,640 0,533 0,750 0,784

0,889 1,103 0,865 1,057


4

0,677

1,043 1,103 0,8 1,021


0,992
4

1,524 1,429 1,379 1,333


1,416

0,978

Trimestres \
AosPrimero
Segundo
Tercer
o
Cuart
o

2006

1,524
1,043

2007
0,640
0,889
1,429
1,103

Se calcula la media aritmtica


de los cuatro valores obtenidos
anteriormente

2008
0,533
1,103
1,379
0,8

2009
0,750
0,865
1,333
1,021

2010
0,784
1,057

IVBE
0,677
0,978
1,416
0,992
1,016

0,677 0,978 1,416 0,992


1,016
4

Se calculan los ndices de Variacin Estacional, expresando para ello cada


uno de los valores anteriores en forma de porcentaje sobre la media
anual, obteniendo:
Trimestres \
AosPrimero
Segundo
Tercer
o
Cuart
o

IVE
(%) . 100 =
(0,677/1,016)
66,63
(0,978/1,016)
. 100 =
96,31
(1,416/1,016)
. 100 =
139,41
(0,992/1,016) . 100=
97,65
400
%

DESESTACIONALIZACIN (aplicando el mtodo a la razn a la media


mvil). El proceso consiste en dividir cada valor de la serie original por cada
ndice de Variacin Estacional correspondiente:
Trimestres \
2006
2007
AosPrimero
1/0,6663 2/0,6663
Segundo
2/0,9631 3/0,9631
Tercero
4/1,3941 5/1,3941
Cuart
3/0,9765 4/0,9765
o
Serie desestacionalizada, mtodo
Trimestres \
2006
2007
AosPrimero
1,501
3,002
Segundo
2,077
3,115
Tercero
2,869
3,587
Cuart
3,072
4,096

2008
2/0,6663
4/0,9631
5/1,3941
3/0,9765
a la razn
2008
3,002
4,153
3,587
3,072

2009
3/0,6663
4/0,9631
7/1,3941
6/0,9765

2010
5/0,6663
7/0,9631
8/1,3941
7/0,9765

a la media mvil
2009
2010
4,502
7,504
4,153
7,268
5,021
5,738
6,144
7,168

b) Los ndices de Variacin Estacional (IVEs) por el mtodo de la tendencia.


Se calculan las medias anuales y t (medias para cada ao de k = 4 subperiodos)
Trimestres \
Aos Primero
Segundo
Tercero
Cuart
o

200
6
1
2
4
3

200
7
2
3
5
4

y2006 2,5

200
8
2
4
5
3

y2007 3,5

200
9
3
4
7
6

y2008 3,5

y2009 5

2010
5
7
8
7
y2010
6,75

yi t

y t

i 1

t (2006 , 2007 , , medias anuales


2010)

La tendencia media anual T t se obtiene ajustando una recta de regresin a los


aos (t1 , t2 , , tn ) y a
las medias
anuales

y t , donde t (t1 , t2 , T t y t a b. t
, tn ) :

(t2006 , t2007 , ,
ty2010
)
t medias

2006

2007

2008

2009

2010

2,50

3,50

3,50

5,00

6,75

anuales
Por el mtodo de los mnimos cuadrados, resulta: a
2003,75 y
con lo que, T t y t

b1

t (t2006 , t2007 , , t2010 ) , resulta pues:

2003,75 t

Tendencia media anual


(t2006 , t2007 , ,
2006
t2010 )

T t

2,25

2007

2008

2009

2010

3,25

4,25

5,25

6,25

A partir de la tendencia media anual T t se obtiene el valor de la


tendencia para los distintos subperodos, segn la expresin general:
T T
it

k1

b
t . i

tendencia media anual para los subperodos ksimos


k

donde,
t Ao (2006, 2007, ..., 2010)
Subperodo donde se calcula la tendencia (trimestral i = 1, 2,
i 3, 4)
k Nmero total de subperodos ( datos trimestrales k = 4)
b Pendiente de la recta de regresin = 1

Trimestre Primero
2006 : T
Trimestre Segundo
2006 : T

i2006

4 1 1
.
2,25 1

2 4

4 1 1
.
2,25 2
i2006

2 4

1,875
2,125

Trimestre Tercero
2006 : T

4 1 1
.
2,25 3
i2006

2 4

2,375

Trimestre Primero
2007 : T

4 1 1
.
3,25 1
i2007

2 4

2,875

Trimestre Primero
2008 : T

4 1 1
.
4,25 1
i2008

2 4

3,875

Trimestre Primero
2009 : T

4 1 1
.
4,25 1
i2009

2 4

4,875

Trimestre Primero
2010 : T

4 1 1
.
5,25 1
i2010

2 4

5,875

SERIE DE LA TENDENCIA
(k=4
i
t
trimestres)
Primero
1
Segundo
2
Tercero
3
Cuart
4
o

2006
1,875
2,125
2,375
2,625

2007
2,875
3,125
3,375
3,625

2008
3,875
4,125
4,375
4,625

2009
4,875
5,125
5,375
5,625

2010
5,875
6,125
6,375
6,625

Representacin grfica de la
serie con los datos originales y la
serie suavizada de tendencia

Para eliminar la tendencia y la componente cclica se divide cada trmino de la


serie original entre el correspondiente trmino de la serie terica de tendencia.
SE ELIMINA LA TENDENCIA Y LA COMPONENTE CCLICA DE LA SERIE
Trimestres \
2006
2007
2008
AosPrimero
2010
2009
1/1,875
2/2,875
2/3,875
5/5,875
3/4,875
Segundo
2/2,125
3/3,125
4/4,125
7/6,125
4/5,125
Tercero
4/2,375
5/3,375
5/4,375
8/6,375
7/5,375
Cuart
3/2,625
4/3,625
3/4,625
6/5,625
o
7/6,625
Sealar que, en el esquema multiplicativo, al aplicar el mtodo de los mnimos
cuadrados, lo que se obtiene es una aproximacin, ya que en el perodo que se
considera (un ao) es suficientemente pequeo, pudiendo suponer que la
componente cclica est incluida en la tendencia secular, puesto que en un

perodo tan corto no da lugar a que se manifiestes plenamente las variaciones


cclicas.

Serie con las COMPONENTES ESTACIONAL y ACCIDENTAL


Trimestres \
2006
2007
2008
2009
2010
AosPrimero
0,533
0,696
0,516
0,615
0,851
Segundo
0,941
0,960
0,970
0,780
1,143
Tercero
1,684
1,481
1,143
1,302
1,255
Cuart
1,143
1,103
0,649
1,067
1,057
o
Para eliminar la componente accidental, calculamos para cada trimestre la
media aritmtica de los valores obtenidos por trimestres (filas) en la serie
anterior con las componentes estacional y accidental.
0,533 0,696 0,516 0,615
0,851

0,941 0,96 0,97 0,78 1,143


5

0,642
5

1,143 1,103 0,649 1,067 1,057


1,004
5

1,684 1,481 1,143 1,302


1,255

0,959

1,373
5

Trimestres \
AosPrimero
Segundo
Tercero
Cuart
o

2006
0,533
0,941
1,684
1,143

2007
0,696
0,960
1,481
1,103

2008
0,516
0,970
1,143
0,649

2009
0,615
0,780
1,302
1,067

El promedio anual de las cuatro medias aritmticas:


004
0,994

2010
0,851
1,143
1,255
1,057

IBV
E
0,642
0,959
1,373
1,004
0,994

0, 642 0 , 959 1, 373 1,


4

Se calculan los ndices de Variacin Estacional, expresando para ello cada uno de
las valores obtenidos
(medias aritmticas por trimestres) en forma de porcentaje sobre la media anual,
obteniendo:
Trimestres \
AosPrimero
Segundo
Tercero
Cuart
o
En definitiva, sobre un
estacional produce:
1
2
3
4

Trimestre:
Trimestre:
Trimestre:
Trimestre:

IBV
E
0,642
0,959
1,373
1,004

IVE
(%)
(0,642/0,944).100
=
64,59
(0,959/0,944).100
=
96,48
(1,373/0,944).100
=
138,13
(1,004/0,944).100
=
101,01
nivel medio de ventas, la influencia de la variacin

( 64,59 100 = 35,41) un descenso de ventas del 35,41%


(96,48 100 = 3,52) un descenso de ventas del 3,42%
(138,13 100 = 38,13) un aumento de ventas del 38,13%
(101,01 100 = 1,01) un aumento de ventas del 1,01%