You are on page 1of 6

INTRODUCCIÓN AL ANÁLISIS DE DATOS

Curso 2009-2010
Cuadernillo 2 PLANTILLA

El alumno deberá entregar este segundo cuadernillo al profesor-tutor de su
centro asociado o al profesor-tutor del campus (según el caso) que le haya
sido asignado antes del 19 de enero del 2010

Disponemos de los datos de todos los profesores de las universidades públicas (48)
durante el curso 2007-08: universidad a la que pertenecen, sexo y edad (
http://www.ine.es ). Se resumen los datos en la siguiente Tabla:

Sexo
Edad Varon Mujer Total
65-69 2721 609 3330
60-64 5759 1819 7578
55-59 8330 3457 11787
50-54 9096 4567 13663
45-49 10373 5985 16358
40-44 10331 6471 16802
35-39 8275 6000 14275
30-34 5255 4399 9654
25-29 2210 2282 4492
20-24 171 194 365
62521 35783 98304

1. a) Si elegimos un profesor al azar ¿Cuál es la probabilidad de que sea mujer?.

Solución:
35783
P(M)   0,36
98304

2. a) Si elegimos al azar 6 profesores ¿cuál es la probabilidad de que la mitad sean
hombres y la otra mitad mujeres?

Solución:

 n 
f x   PX  x     p x qn x
 x 
 6  6!
f x     0,64 3 0,36 63  0,64 5 0,36 63  20  0,262  0,0467  0,245
 3 3! 6  3!

1
INTRODUCCIÓN AL ANÁLISIS DE DATOS
Curso 2009-2010
Cuadernillo 2 PLANTILLA

b) Si vamos eligiendo aleatoriamente uno a uno ¿cuál es la probabilidad de que
necesitemos 6 elecciones para obtener 3 mujeres?

Solución:
Será la probabilidad de que en los 5 primeros ensayos haya 2 mujeres por la
probabilidad de que en el sexto ensayo sea mujer. Es decir:

 5  
  0,36 0,64 ·0,36  10·0,13·0,26·0,36  0,122
2 5 2

 2  

Sabiendo que la variable Edad se distribuye normalmente, con media 46 y desviación
típica 10, responda a las preguntas 3, 4 y 5.

3. ¿Cuál es el percentil 75 de la distribución?

Solución:

P75  z  0,67 (Tabla IV)
P75  46
0,67 
10
P75  0,67·10   46  52,70

4. ¿Qué número de profesores, aproximadamente, se encuentra entre los valores 29,5
y 44,5?

Solución:

X = 44,5 → z = (44,5-46)/10 = -0,15 → p = 0,4404 (Tabla III)

X = 29.5 → z = (29,5-46)/10 = -1,65 → p = 0,0495 (Tabla III)

0,4404 -0,0495 = 0,3909 → El 39,09% de los profesores se encuentra entre los valores
29,5 y 44,5, es decir, 98304 x 0,3909  38427 profesores.

2
INTRODUCCIÓN AL ANÁLISIS DE DATOS
Curso 2009-2010
Cuadernillo 2 PLANTILLA

5. ¿Entre qué valores se encontrará el 50% de los valores centrales de la variable
Edad?

Solución:

P25  z  0,67 (Tabla III)
P25  46
 0,67 
10
P25   0,67·10   46  39,30

P75  z  0,67 (Tabla IV)
P75  46
0,67 
10
P75  0,67·10   46  52,70

El 50% de los valores centrales de la variable Edad se encuentra entre 39,30 y 52,70.

6. Si no dispusiéramos de los datos poblacionales, y quisiéramos estimar la media de
edad del profesorado a partir de una muestra ¿qué tipos de muestreo aleatorio
podemos utilizar?

Solución:

Podríamos utilizar los muestreos por estratificado, conglomerado y polietápico

Muestreo estratificado

Podríamos realizar la selección en función del número de profesores de cada sexo.

Muestreo por conglomerado

Se selecciona al azar algunas universidades, luego algunas facultades dentro de cada
universidad, después algunas asignaturas dentro de cada facultad. La muestra estará
formada por todos los profesores de las asignaturas seleccionadas.

Muestreo polietápico

Sería una combinación de los dos anteriores.

7. Si no dispusiéramos de los datos poblacionales (pero sabemos que la desviación
típica de la población es igual a 10) y quisiéramos estimar la media de la edad del
profesorado, con un nivel de confianza del 95 % y un error máximo de 4 puntos
¿cuál debería ser el tamaño n de la muestra? Extraemos una muestra aleatoria de n

3
INTRODUCCIÓN AL ANÁLISIS DE DATOS
Curso 2009-2010
Cuadernillo 2 PLANTILLA

profesores y obtenemos una media muestral de 47,5 años, ¿entre qué valores
estimaremos que se encuentra la media poblacional?

Solución:

Tamaño de la muestra

n.c. = 0,95 → z1-α/2 = z0,975 = 1,96 (Tabla IV)

1,96 2  10 2
n  24
42

n = 24 es el tamaño muestral mínimo para no superar un Emáx = 4, con un nivel de
confianza de 0,95.

Límites del intervalo de confianza


Li = X - z 1-/2 = 47,5-4 = 43,5
n

Ls = X + z1-α/2 = 47,5+4= 51,5
n

Para un nivel de confianza del 95%, se estima que la edad media de los
profesores de las universidades públicas está entre 43,5 y 51,5 años.

8. Queremos estimar el número medio de horas semanales que los profesores
dedican a la docencia para un nivel de confianza del 95%. Seleccionamos
aleatoriamente una muestra de 400 profesores y les pedimos que nos indiquen el
número de horas semanales que dedican impartiendo clase. Analizados estos datos
obtenemos una media de 12,5 horas y una cuasidesviación típica de 4,5. ¿Cuál es
el error de estimación máximo de la media? ¿Entre qué valores estimaremos que
se encuentra el parámetro?

Solución:

Error de estimación máximo de la media

n.c. = 0,95 → z1-α/2 = z0,975 = 1,96 (Tabla IV) → Aproximación de la t de Student a la

normal

4
INTRODUCCIÓN AL ANÁLISIS DE DATOS
Curso 2009-2010
Cuadernillo 2 PLANTILLA

S n1 4,5
E máx  z 0,995  1,96  0,44
n 400

Límites del intervalo de confianza

S n1
Li = X - z 1-/2 = 12,5 - 0,44 = 12,06
n
S n1
Ls = X + z 1-/2 = 12,5 + 0,44 = 12,94
n

Para un nivel de confianza del 95%, se estima que el tiempo medio que los profesores
de las universidades públicas dedican a impartir clases está entre 12,06 y 12,94 horas
semanales.

9. Queremos estimar la proporción de profesores que se dedican a la investigación
para un nivel de confianza del 95%. Seleccionamos una muestra aleatoria de 144
profesores y obtenemos una proporción de 0,6 ¿Cuál es el error de estimación
máximo? ¿Entre qué valores se encuentra el parámetro?

Solución:

Error de estimación máximo de la proporción

n.c. = 0,95 → z1-α/2 = z0,975 = 1,96 (Tabla IV)

P = 0,60

Se cumple la condición para la aproximación a la normal: nP(1-P) ≥ 5 →

144(0,60)(0,40) = 34,56

(0,60)(0,40)
Emáx = 1,96  0,08
144

Límites del intervalo de confianza

L i  0,60  0,08  052
L S  0,60  0,08  0,68

Para un nivel de confianza del 95%, se estima que la proporción de profesores de las
universidades públicas que se dedican a la investigación está entre 0,52 y 0,68.

5
INTRODUCCIÓN AL ANÁLISIS DE DATOS
Curso 2009-2010
Cuadernillo 2 PLANTILLA

10. Queremos conocer la satisfacción laboral de los profesores. Seleccionamos
aleatoriamente una muestra de 400 profesores y medimos esa variable en una
escala de intervalo (de 0 a 10) obteniendo una satisfacción media igual a 8 y una
cuasidesviación típica de 9. Para un nivel de confianza del 95%, ¿cuál es el error
de estimación máximo de la media? ¿Entre qué valores estimaremos que se
encuentra la satisfacción media de toda la población de profesores de las
universidades públicas durante el curso 2007-08?

Solución:

Error de estimación máximo de la media

n.c. = 0,95 → z1-α/2 = z0,975 = 1,96 (Tabla IV) → Aproximación de la t de Student a la

normal

S n1 9
E máx  z 0,995  1,96  0,88
n 400

Límites del intervalo de confianza

S n1
Li = X - z 1-/2 = 8 - 0,88 = 7,12
n
S n1
Ls = X + z1-α/2 = 8 + 0,88 = 8,88
n

Para un nivel de confianza del 95%, se estima que la satisfacción media de los
profesores de las universidades públicas es un valor entre 7,12 y 8,88 en una escala de
0 a 10.

6