Professional Documents
Culture Documents
desde cero
Definicin
La ciencia que se ocupa de la recopilacin, tabulacin, anlisis, interpretacin y
presentacin de datos.
Poblacin y muestra
Poblacin es el conjunto de individuos, con alguna caracterstica comn, sobre el
que se hace un estudio estadstico.
En la prctica es frecuente tener que recurrir a una muestra para inferir datos de la
poblacin. La muestra es un subconjunto de la poblacin, seleccionada de modo
que ponga de manifiesto las caractersticas de la misma, de ah que la propiedad
ms importante de las muestras es su representatividad.
El proceso seguido en la extraccin de la muestra se llama muestreo.
Ejemplo
Identificar la poblacin y la muestra en la siguiente situacin:
En una institucin educativa se quiere saber la ocupacin de los egresados de la
ltima dcada. Para esto se convoca a una reunin de egresados y de los
asistentes, se encuesta a diez egresados de cada ao. Determina la poblacin y la
muestra.
Solucin
Poblacin. Todos los egresados de la ltima dcada.
Muestra. Los 100 estudiantes seleccionados, 10 de cada promocin.
Albert Maguia R.
Tipos de
variables
Cuantitativas
Discretas
Cualitativas
Continuas
Nominales
Ordinales
Ejemplo
Tipo de variable
Definicin
Ejemplo
Nominal
Ordinal
Discreta
Continua
Albert Maguia R.
Ejercitndose
Determine qu tipo son las siguientes variables. Si son variables cualitativas
(nominal u ordinal) o cuantitativas (discretas o continuas).
a) Marca de automvil.
b) Duracin de una cancin.
c) Nmero de temas de un CD o DVD.
d) Estado civil (soltero, casado, divorciado).
e) Cantidad de lluvia en un ao en Tacna (mm3).
f) Nivel educacional (bsica, media, universitaria).
g) Temperatura al medioda en Tumbes (grados Celsius).
TRABAJO PRACTICO 1
I.
II.
Existen muchas formas de organizar los datos. Podemos slo colectarlos y mantenerlos en
orden; o si las observaciones estn hechas con nmeros, entonces podemos hacer una
lista de los puntos de los datos, de menor a mayor segn su valor numrico. Pero si los
datos son trabajadores especializados (como carpinteros, albailes o soldadores) de una
construccin; o los distintos tipos de automviles que ensamblan todos los fabricantes; o
los diferentes colores de suteres fabricados por una empresa dada, debemos de
organizarlos de manera distinta. Necesitaremos presentar los puntos de datos en orden
alfabtico o mediante algn principio de organizacin. Una forma comn de organizar los
datos consiste en dividirlos en categoras o clases parecidas y luego contar el nmero de
observaciones que quedan dentro de cada categora. Este mtodo produce una
Distribucin de frecuencias.
Distribucin de frecuencias
X i Variable
fi
Fi
hi
Hi
hi %
h1
h1 100
h1 h2
h2 100
h1 h2 h3
h3 100
f1
n
x1
f1
f1
x2
f2
f1 f 2
x3
f3
f1 f 2 f 3
xn
n = Total
f1 f 2 f 3
fn
f2
n
f3
n
fn
h1 h2 h3
fn
n
hn
hn 100
h % 100
i
Hi %
Hi
Albert Maguia R.
Ejemplo
Los siguientes datos representan el nmero de hijos por familia encuestada.
0 0 1 1 1 1 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2
2 2 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 4 4 4 4 4 4 5 6
A partir de estos datos, construya una tabla de frecuencias.
Solucin:
Para construir la tabla de frecuencias hay que tener en cuenta que la variable en
estudio es el nmero de hijos (discreta), que toma los valores existentes entre 0 y 6
hijos y las frecuencias son el conjunto de familias, de esta forma tenemos:
Xi
fi
Fi
hi
Hi
hi %
Hi %
0
1
2
3
4
5
6
2
4
21
15
6
1
1
2
6
27
42
48
49
50
0,04
0,08
0,42
0,30
0,12
0,02
0,02
0,04
0,12
0,54
0,84
0,96
0,98
1
4
8
42
30
12
2
2
4
12
54
84
96
98
100
h % 100
n = 50
50
Ejercitndose
Se realiz un sondeo entre 25 miembros de una clase de psicologa acerca del
nmero de hermanos que tenan en sus familias. A partir de estos datos, elabore
una tabla de distribuciones de frecuencias.
2
5
1
5
1
3
2
4
4
6
1
3
2
3
2
3
3
4
6
2
3
1
2
5
2
Albert Maguia R.
A menudo, los conjuntos de datos que contienen una gran cantidad de elementos
se organizan en grupos o clases. Todos los datos son asignados a la clase que les
corresponde; luego, se elabora una Distribucin de frecuencias para datos
agrupados. Estos intervalos (grupos o clases) tienen un punto medio que recibe el
nombre de marca de clase. La marca de clase se obtiene calculando el promedio
entre los lmites inferior y superior de cada intervalo.
Ejemplo
X i Variable
Yi marca de clase
[ xi x2
[ x2 x3
y1
xi x2
2
y2
x2 x3
2
x x4
y3 3
2
[ x3 x4
[ xn 1 xn
yn
fi
Fi
hi
Hi
hi %
Hi %
h % 100
xn 1 xn
2
n = Total
Ejercitndose
En una prueba tomada a 50 alumnos, se registraron los siguientes puntajes:
83
82
87
64
63
75
83
62
67
83
68
85
66
61
83
76
83
67
78
76
83
72
70
84
71
77
82
79
83
72
77
74
67
80
84
75
73
75
83
84
77
72
89
80
87
77
63
72
84
78
Albert Maguia R.
xmx xmn
m
m 1 3,3log 50 m 6,6 m 7
89 61
C4
7
Xi
Yi
fi
Fi
hi
Hi
hi %
Hi %
[ 61 65 >
[ 65 69 >
[ 69 73 >
[ 73 77 >
[ 77 81 >
[ 81 85 >
[ 85 89 ]
63
67
71
75
79
83
87
5
5
6
7
9
14
4
5
10
16
23
32
46
50
0,10
0,10
0,12
0,14
0,18
0,28
0,08
0,10
0,20
0,32
0,46
0,64
0,92
1
10
10
12
14
18
28
8
10
20
32
46
64
92
100
Total
h % 100
50
Albert Maguia R.
TRABAJO PRACTICO 2
I.
En una empresa, se hizo el estudio sobre las edades de los empleados y se obtuvo
la siguiente tabla:
Edades
N de empleados
[ 20 25 >
12
[ 25 30 >
15
[ 30 35 >
23
[ 35 40 >
11
[ 40 45 >
9
Donde A es el porcentaje de empleados con 30 aos o ms; B es el porcentaje
de empleados con menos de 40 aos. Calcular el valor de A + B
II.
III.
a)
f 4 F3
H4
b)
H 2 % h4 %
h2
c)
H 3 % h2 %
Y3
d)
f 2 F1
H5
Albert Maguia R.
Las tablas de frecuencias de los datos estadsticos muestran una informacin ordenada del
hecho que se analiza y estudia. Adems de esta forma de presentacin es til conocer la
forma de presentarlos grficamente para obtener una apreciacin global, rpida y visual
de la informacin sealada.
Grfico de Bastones
Se utiliza para describir datos cuando la variable es discreta. Su construccin se
hace levantando segmentos perpendiculares al eje de la variable y con una altura
Nmero de I.E.
Nmero de Docentes
Histograma de Frecuencias
Se utiliza para describir datos cuando la variable es continua. Su construccin se
hace levantando sobre el eje de la variable rectngulos que tengan por base la
amplitud del intervalo de clase y una altura proporcional a su frecuencia absoluta o
N de Turistas
relativa porcentual.
Gastos en Dlares
Albert Maguia R.
Polgono de Frecuencias
Se utiliza tambin para describir datos cuando la variable es continua.
Su construccin se hace uniendo los puntos medios superiores de los rectngulos
N de Turistas
en el histograma.
Gastos en Dlares
Grfico de Barras
Se utiliza para describir datos cuando la variable es cualitativa. Su construccin se
hace levantando barras proporcionales a su frecuencia absoluta o relativa
N de Personas
porcentual.
Estado Civil
Grfico de Sectores Circulares
Se utiliza tambin para describir datos cuando la variable es cualitativa. Se usa
frecuentemente cuando se desea comparar cada categora de la variable con
respecto al total. Para su elaboracin se utiliza una circunferencia, siendo
Albert Maguia R.
10
necesario que los valores absolutos y/o porcentuales sean traducidos en grados
sexagesimales.
TRABAJO PRACTICO 3
I.
2
4
3
3
2
5
4
4
4
3
4
4
5
3
3
1
3
4
5
3
3
5
4
3
2
500
750
650
800
890
550
780
700
850
850
600
630
740
750
950
Albert Maguia R.
11
III.
IV.
54
60
68
64 65 67 68
73
79
74 77 79
84 89
Si una mujer en Suiza gana 1300
francos, cunto gana un hombre
en el mismo puesto y con la
43
Suecia
Grecia
Dinamarca
Francia
Holanda
Blgica
Alemania
Suiza
Reino Unido
Espaa
Estados Unidos
Australia
Luxemburgo
Japn
V.
1102
euros
netos.
Cunto
Albert Maguia R.
12
xi
Ejemplo
Calificaciones
1
2
3
4
5
fi xxxxx Calificaciones fi
3
6
17
3
7
22
6
8
10
8
9
6
9
10
5
Albert Maguia R.
13
Calificaciones
1
2
3
4
5
6
7
8
9
10
Total
fi
3
3
6
8
9
17
22
10
6
5
89
fi . xi
3
6
18
32
45
102
154
80
54
50
544
Tenemos:
n fi 89
xi 544
xi
544
x 6,11
89
yi
Ejemplo
Tenemos:
Intervalos
[02]
[35]
[68]
[ 9 11 ]
[ 12 14 ]
Total
fi
12
13
23
16
18
82
Intervalos
[02]
[35]
[68]
[ 9 11 ]
[ 12 14 ]
Total
fi
12
13
23
16
18
82
yi
1
4
7
10
13
-
fi . yi
12
52
161
160
234
619
n fi 82
yi 619
yi
619
x 7,55
82
Albert Maguia R.
14
La Mediana
La mediana es la medida de tendencia central que se define como aquel valor
nominal que tiene, dentro de un conjunto de datos ordenados, arriba y abajo de l,
el mismo nmero de datos nominales. En otras palabras, es el dato que est a la
mitad, es el dato que divide en dos partes iguales a un conjunto de datos.
La Mediana para frecuencias simples
Cuando los datos recolectados han sido organizados en una tabla de distribucin
de frecuencias simples, la mediana, para poblaciones como para muestras, se
puede calcular por medio de la frmula
Fi
n
xi Fi
2
xi Me
Ejemplo
Xi
fi
Fi
0
1
2
3
4
5
6
7
8
9
10
Total
1
1
3
5
6
7
11
15
25
20
23
117
1
2
5
10
16
23
34
49
74
94
117
-
Fi
117
2
xi F74
Fi 58,5
xi 8
Fi 74
Me 8
Albert Maguia R.
15
2 Fi 1
Me Linf
C
fi
Fi
n
[ Linf Lsup ] Fi
2
Me [ Linf Lsup ]
Ejemplo
Linf Lsup
fi
Fi
[ 1 30 ]
1 1
[ 31 60 ]
1 2
[ 61 90 ]
3 5
[ 91 120 ] 5 10
[ 121 150 ] 6 16
[ 151 180 ] 7 23
[ 181 210 ] 11 34
[ 211 240 ] 15 49
Total
49 -
Fi
49
Fi 24,5 Fi 34
2
24,5 23
Me 181
29
11
[181 210] Fi 34
Me [181 210]
Me 184,95
La Moda
La moda es la medida de tendencia central que se define como aquel valor nominal
que tiene la frecuencia mayor. Por lo tanto, una distribucin de frecuencias puede
tener ms de una moda o, inclusive, no tener moda cuando todos los datos tienen
frecuencia 1.
La Moda para frecuencias simples
Cuando los datos recolectados han sido organizados en una tabla de distribucin
de frecuencias simples, la moda, para poblaciones como para muestras, se puede
calcular por medio de la frmula
fi f x
xi fi
Md xi
Albert Maguia R.
16
Ejemplo
Xi
fi
1
2
3
4
5
6
Total
8
5
13
17
10
7
60
xi f i
fi f x
17 f x
xi 17 xi 4
fi 17
Me xi
Me 4
d1
Md Linf
C
d1 d 2
fi f x
[ Linf Lsup ] f i
Donde : d1 fi fi 1
Md [ Linf Lsup ]
d2 fi fi 1
Ejemplo
Linf Lsup
fi
[ 10 20 >
[ 20 30 >
[ 30 40 >
[ 40 50 >
[ 50 60 >
[ 60 70 >
Total
8
5
13
17
10
7
60
17 f x
[40 50 17
4
Md 40
10
47
Md [40 50
d1 17 13 d1 4
d 17 10 d 7
2
2
40
Md 40
11
Md 40 3,6
Albert Maguia R.
17
TRABAJO PRACTICO 4
I.
II.
III.
fi
0
1
2
3
4
Total
1
4
7
6
2
20
fi
[ 26 34 >
[ 34 42 >
[ 42 50 >
[ 50 58 >
[ 58 66 >
[ 66 74 >
[ 74 82 >
[ 82 90 >
Total
1
2
4
10
16
8
3
7
51
IV.
Al calcular la media de 125 datos, result 42. Un chequeo posterior mostr que en
lugar del valor 12,4 se introdujo 124. Corregir la media.
V.
Albert Maguia R.
18
Media
Mediana
B
1
2
7
12
13
7
7
x x
n 1
Ejemplo
Encuentre la desviacin estndar muestral para la siguiente distribucin de
frecuencias.
Albert Maguia R.
19
Xi
fi
10
Total
25
Xi
fi
2
3
4
5
5
8
10
2
2 5 3 8 4 10 5 2
xi x
x x
2 3,36 1,36
1,8496
3 3,36 0,36
0,1296
4 3,36 0,64
0,4096
5 3,36 1,64
2,6896
25
x 3,36
Pero como los datos no son nicos, es decir, hay repeticiones por cada dato (frecuencias),
se tendr que multiplicar cada valor obtenido por su frecuencia respectiva. Esto es:
x x . f
2
x x
i
fi
x x
i
x x
i
fi
n 1
19, 76
25 1
fi 19,76
s 0,91
En el caso de que los datos sean agrupados (con intervalos) se utilizar la marca de clase
como el valor que representar a cada dato.
Albert Maguia R.
20
TRABAJO PRACTICO 5
I.
II.
Xi
fi
Xi
fi
0
1
2
3
4
5
6
2
4
21
15
6
1
1
[ 61 65 >
[ 65 69 >
[ 69 73 >
[ 73 77 >
[ 77 81 >
[ 81 85 >
[ 85 89 ]
5
5
6
7
9
14
4
III.
Albert Maguia R.
21
SEMANA 6 PROBABILIDADES
1
2
0,5
Albert Maguia R.
22
P xi
Casos Favorables
Casos Posibles
Ejemplo
Imaginemos que deseamos obtener un nmero impar al lanzar un dado. Cules
seran los casos favorables y cules los casos posibles? Naturalmente, tendramos:
Casos favorables: 1,3,5
3
6
P xi : impar
1
2
Formalizando:
Albert Maguia R.
23
TRABAJO PRACTICO 6
I.
Resuelva cada uno de los problemas que se le propone. No olvide que debe
justificar cada uno de sus razonamientos.
Una mquina produce 100 tornillos de los que 3 son defectuosos. Si se cogen
dos tornillos, halla la probabilidad de que al coger el segundo sea defectuoso,
con la condicin de que el primero tambin haya sido defectuoso.
Una familia tiene tres hijos. Hallar la probabilidad de que los tres sean varones.
Se extrae una bola de una urna que contiene 6 bolas rojas y 4 verdes, se
observa si ha sido roja y se vuelve a introducir; luego se extrae otra bola. Cul
es la probabilidad de que las dos sean rojas?
Se extraen de una vez dos bolas de una urna que contiene 6 bolas rojas y 4
verdes. Cul es la probabilidad de que las dos sean rojas?
II.
Albert Maguia R.
24
Ejemplo
La ltima novela de un autor ha tenido un gran xito, hasta el punto de que el 80%
de los lectores ya la han ledo. Un grupo de 4 amigos son aficionados a la lectura.
a) Cul es la probabilidad de que el grupo hayan ledo la novela 2 personas?
Tenemos los siguientes datos: n 4
4
2
2
P X 2 0,8 0, 2
2
k 2
p 0,8
q 0, 2
P X 2 0,1536
Albert Maguia R.
25
4
4
4
2
2
3
1
4
0
0,8 0, 2 0,8 0, 2 0,8 0, 2 0,9728
3
4
2
Ejercitndose
a) Se afirma que el 30% de la produccin de ciertos instrumentos se realiza con
material nacional y los dems con material importado. Si se toma una
muestra aleatoria con reemplazo de 25 de estos instrumentos, calcular:
- Cul es la probabilidad de que 3 de ellos sean de material nacional?
- Cul es la probabilidad de que no ms de 3 de ellos sean de material
nacional?
- Cul es la probabilidad de que al menos 3 sean de material nacional?
- Cuntos instrumentos fabricados con material nacional se espera
encontrar en la muestra?
b) Un examen consta de 6 preguntas con 4 posibles respuestas cada una, de las
que slo una de ellas es correcta. Un estudiante que no se haba preparado la
materia responde completamente al azar marcando una respuesta aleatoria.
Calcular la probabilidad de que acierte 4 o ms preguntas.
c) La probabilidad de que un cazador novato cobre una pieza es 0,4. Si lo intenta
5 veces, calcula la probabilidad de que cobre una pieza al menos 3 veces.
d) El 53% de los trabajadores de una determinada empresa son mujeres.
Si elegimos 8 personas de esa empresa al azar, calcula la probabilidad de que:
- Haya ms de 6 mujeres
- Hallar la media y la desviacin estndar.
e) Un examen tipo test consta de 100 preguntas, cada una de las cuales se
acompaa de cuatro respuestas, una de ellas correcta y errneas las otras
tres. Si un estudiante contesta al azar, cul es la probabilidad de que acierte
ms de 30 preguntas? y menos de 15?
Albert Maguia R.
26
TRABAJO PRACTICO 7
I.
Una urna contiene 6 bolas con nmeros pares y 9 bolas con nmeros impares.
Si hacemos diez extracciones con reemplazamiento, calcula la probabilidad de
obtener nmero impar:
- Alguna vez
- Ms de 8 veces
II.
III.
IV.
Albert Maguia R.
27
fo fe
Donde: o
f e Una frecuencia esperada
fe
Proceso estadstico
Para aplicar la Prueba Chi Cuadrado se debe tomar en cuenta los siguientes pasos:
1. Formulacin de la hiptesis
Ho = Hiptesis nula (no existe dependencia)
H1 = Hiptesis alternativa (existe dependencia)
2. Nivel de significancia
N.C = x %
x
100
3. Grados de libertad
v r 1 c 1
r nmero de filas
donde:
c nmero de columnas
4. Estadstico de prueba
2
Tabla
con v
Albert Maguia R.
28
6. Clculos
f o = frecuencia absoluta de cada celda de la tabla
fe =
ri . c j
n
7. Decisin
2
2 Tabla
Si : 2
2
Tabla
Se acepta H o
Se rechaza H o
8. Coeficiente de contingencia
C
2
2 n
Donde k min i , j
adems
C 0,
k 1
Albert Maguia R.
29
Tabla 01
Datos de hospitalizaciones clasificados segn el tipo
de cobertura del seguro y el tiempo de estancia
% de costos
cubiertos por
el seguro
< 25 %
25 50 %
> 50 %
Total
Das en el hospital
<5
5 10
> 10
40
30
40
110
75
45
100
220
65
75
190
330
Total
180
150
330
660
Solucin
Paso 1 formulacin de la hiptesis
H0 = tiempo de estancia y tipo de seguro son independientes.
H1 = el tiempo de estancia depende del tipo de seguro.
Paso 2 nivel de significancia
N.C = 99%, lo cual implica = 0,01
Paso 3 grados de libertad
v 3 1 3 1 v 4
con 0,01 v 4
2
Tabla
13, 28
Albert Maguia R.
30
Paso 6 Clculos
Calculando las frecuencias esperadas de cada celda de la tabla:
fe
c1 40
fe
c4 30
fe
c7 40
180 110
660
150 110
660
330 110
660
30
fe
c2 75
25
fe
c5 45
55
fe
c8 100
180 220
660
150 220
660
60
fe
c3 65
50
fe
c6 75
fe
c9 190
330 220
660
110
180 330
660
150 330
660
90
75
330 330
660
165
Das en el hospital
<5
5 10
Total
> 10
< 25 %
40
30
75
60
65
90
180
25 50 %
30
25
45
50
75
75
150
> 50 %
40
55
100
110
190
165
330
Total
110
220
330
40 30 2 75 60 2 65 90 2 30 25 2 45 50 2
30
60
90
25
50
2
2
2
2
75
55
110
165
660
2 24,32
Paso 7 Decisin
Como 2 24,32 13, 28 rechazamos H0. En este sentido, Mendoza debe rechazar la
hiptesis nula e informar al seor Althomaro que la evidencia refuerza su creencia
de que la duracin de las hospitalizaciones y la cobertura de los seguros son
dependientes entre s.
Albert Maguia R.
31
24,32
24,32 660
Cmx
C 0,19
3 1
Cmx 0,82
3
C = 0, 19
0, 41
0, 82
Dado que el valor obtenido est muy lejos del valor deseado (0,6) se concluye que
la dependencia entre la variables es baja (dbil)
Ejercitndose
a) Estamos interesados en estudiar la fiabilidad de cierto componente
informtico con relacin al distribuidor que nos lo suministra. Para realizar
esto, tomamos una muestra de 100 componentes de cada uno de los 3
distribuidores que nos sirven el producto comprobando el nmero de
defectuosos en cada lote. La siguiente tabla muestra el nmero de
defectuosos en para cada uno de los distribuidores.
Componentes defectuosos Componentes correctos Total
Distribuidor 1
16
94
100
Distribuidor 2
24
76
100
Distribuidor 3
9
81
100
Total
49
251
300
Fumadores
No Fumadores
Total
Albert Maguia R.
32
TRABAJO PRACTICO 8
I.
Lan Per desea determinar si existe alguna relacin entre el nmero de vuelos que
las personas toman y su ingreso. A qu conclusin llega al nivel del 1% con base
en los datos para 100 viajeros en la tabla de contingencia?
Ingreso
Menos de $ 30 000
30 000 50 000
50 000 70 000
Ms de $ 70 000
II.
Nunca
20
8
7
2
Frecuencia de vuelos
Rara vez
15
5
8
5
Con frecuencia
2
1
12
15
III.
NIVEL EDUCATIVO
Pasante de
Preparatoria
licenciatura
17
11
23
8
38
16
19
6
97
41
Profesional o
posgrado
10
12
35
28
85
No termin la
preparatoria
21
5
7
13
46
Total
59
48
96
66
269
Un educador tiene la opinin de que las calificaciones que obtienen los alumnos de
preparatoria dependen de la cantidad de tiempo que ellos pasan escuchando
msica. Ser cierta su opinin.
Horas consumidas
escuchando msica
<5
5 10
11 20
> 20
Total
A
13
20
9
8
50
PROMEDIO DE CALIFICACIONES
B
C
D
10
11
16
27
27
19
27
71
16
11
41
24
75
150
75
Total
E
5
2
32
11
50
55
95
155
95
400
Albert Maguia R.
33
2.
a) El ingreso mensual (sueldo) es por excelencia una variable cuantitativa
(continua)
b) Lo que aqu importa es el grado que cursan. Por ejemplo, en primer grado hay
25 alumnos, en segundo grado hay 37 alumnos, etc. Por lo tanto, la variable es
cualitativa (nominal)
c) El cdigo de identificacin es como el DNI (34003247, 76293045, etc.). En
consecuencia, la variable es cuantitativa (discreta), dado que, el nmero de DNI
no puede tomar decimales.
d) Los nmeros de las camisetas pueden ser 1, 2, 3, etc. Por lo tanto, la variable es
cuantitativa (discreta),
e) Dado que se refiere a la posicin, por ejemplo, el 1 significa primer puesto, el 2
significa segundo puesto y 3 el tercer puesto, es decir, posee un orden
invariable. por lo tanto, la variable es cualitativa (ordinal)
Albert Maguia R.
34
fi
Fi
12
12
[ 25 30 >
15
[ 30 35 >
hi
Hi
hi %
Hi %
Yi
0,17 0,17
17
17
22,5
27
0,21 0,38
21
38
27,5
23
50
0,33 0,71
33
71
32,5
[ 35 40 >
11
61
0,16 0,87
16
87
37,5
[ 40 45 >
70
0,13
13
100
42,5
Total
70
100
2.
Puntaje
[ 10 15 >
fi
Fi
10
10
[ 15 20 >
15
[ 20 25 >
hi
Hi
hi %
Hi %
Yi
0,11 0,11
11
11
12,5
25
0,17 0,28
17
28
17,5
28
53
0,31 0,59
31
59
22,5
[ 25 30 >
20
73
0,22 0,81
22
81
27,5
[ 30 35 >
17
90
0,19
19
100
32,5
Total
90
100
3.
Tabla 1
Tabla 2
a) 70,11
a) 90, 12
b) 257, 14
b) 294, 12
c) 2, 83
c) 3, 38
d) 27
d) 25
Albert Maguia R.
35
xi
fi
1
2
3
4
5
2
4
12
8
4
fi
Albert Maguia R.
36
Estado civil
Soltero
Casado
Divorciado
Viudo
Total
frecuencia
7
18
3
2
30
Soltero
Casado
Divorciado
Viudo
4. Dado que el problema trata, por un lado, de fechas las cuales tienen un orden
invariable y, por otro lado, del gnero o sexo; podemos afirmar lo siguiente: la
fecha corresponde a una variable cualitativa ordinal y el sexo a una variable
cualitativa nominal. En consecuencia, el grfico que le corresponde es el grfico de
barras compuestas, dado que estn presentes dos variables.
5. Este problema trata sobre el sueldo que ganan las mujeres respecto a lo que ganan
los hombres. Por ejemplo, en Japn, una mujer gana el 43% de lo que gana un
hombre (ver grfico). En este sentido si una mujer, en Suiza, tiene un sueldo de
1300, este valor equivale al 68% del sueldo de un hombre, es decir, un suizo
ganara 1911,76 (tem 1). De manera anloga, en Espaa una mujer ganara el 67%
de 1102, esto es 738,34 (tem 2)
Albert Maguia R.
37
fi
Fi
0
1
2
3
4
Total
1
4
7
6
2
20
1
5
12
18
20
-
Media
0 1
Mediana
4 5
Fi
20
Moda
20
Fi 10
2
La mayor f i en
este caso es f3 7 ,
Fi 12 xi 2
x 2, 2
en consecuencia,
Md = 2
Me xi Me 2
2.
Li Ls
fi
Fi
Yi
[ 26 34 >
[ 34 42 >
[ 42 50 >
[ 50 58 >
[ 58 66 >
[ 66 74 >
[ 74 82 >
[ 82 90 >
Total
1
2
4
10
16
8
3
7
51
1
3
7
17
33
41
44
51
-
30
38
46
54
62
70
78
86
-
Media
30 1
Mediana
Fi
86 7
51
x 63,10
51
Fi 26,5
2
Fi 33 [58 66
26,5 17
Me 58 8
16
Me 62,75
Moda
La mayor f i en este caso es f5 16 , en consecuencia Md [58 66
6
Md 58 8
Md 61, 41
68
bc
23 b c 46 a d 50 ,
2
abcd
24 a b c d 96
4
Albert Maguia R.
38
a1 a2 a3
125
a125
42
lugar de 12, 4 es decir, hay un exceso de: E = 124 12,4 = 111,6 pero, este exceso
se ha promediado, de acuerdo al dato del problema. En consecuencia:
111, 6
0,8928 exceso promedial x 42 0,8928 x 41,11 corregido
125
4,7525
70 40 10
fi
x x
x x
0
1
2
3
4
5
6
2
4
21
15
6
1
1
0 2,52
1 2,52
2 2,52
3 2,52
4 2,52
5 2,52
6 2,52
6,35
2,31
0,27
0,23
2,19
6,15
12,11
x x
fi
x x
12,70
9,24
5,67
3,45
13,14
6,15
12,11
Li - Ls
fi
Yi
x x
x x
[ 61 65 >
[ 65 69 >
[ 69 73 >
[ 73 77 >
[ 77 81 >
[ 81 85 >
[ 85 89 ]
5
5
6
7
9
14
4
63
67
71
75
79
83
87
63 76,44
67 76,44
71 76,44
75 76,44
79 76,44
83 76,44
87 76,44
180,63
89,11
29,59
2,07
6,55
43,03
111,51
fi 62, 46 n 50
62, 46
50 1
x x
903,15
445,55
177,54
14,49
58,95
602,42
446,04
s 1,13
fi
x x
i
2648,14
50 1
fi 2648,14
s 7,35
Albert Maguia R.
39
Li - Ls
59
9 13
13 17
17 21
21 25
fi
10
8
5
4
3
x x
Yi
7
11
15
19
23
x x
7 12,6
11 12,6
15 12,6
19 12,6
23 12,6
x x
31,36
2,56
5,76
40,96
108,16
fi
313,6
20,48
28,80
163,84
324,48
x x
i
fi 851, 2 n 30
851, 2
30 1
s 5, 42
3.
1er producto
2do producto
3er producto
x 2,5 s 0,004
x 2,8 s 0,006
x 3,7 s 0,09
Si los promedios fueran iguales en los tres productos, se compararan de manera directa
sus desviaciones estndar. Pero en este caso, las medias son distintas. En tal sentido, es
necesario hallar el coeficiente de variacin, el cual relaciona las medias con sus
desviaciones estndar. El coeficiente de variacin se define como:
CV
er
1 producto
0,0016 <> 0,16%
do
s
x
2 producto
0,002 <> 0,2%
3er producto
0,024 <> 2,4%
Albert Maguia R.
40
b) Los casos posibles del evento son: { HHH, HHM, HMH, HMM, MHH, MHM,
MMH, MMM }. Entonces, la probabilidad de que sus tres hijos sean varones
es { HHH } = 1/8
c) En total hay 10 bolas (entre rojas y verdes). En este sentido, la probabilidad
de que resulte roja es 6/10, tanto para 1ra como para la 2da extraccin. Esto
ocurre porque la bola se vuelve a introducir. Entonces, la probabilidad de que
las dos bolas sean rojas es ( 6/10 )( 6/10 ) = 36/100
d) En este caso es sin reposicin (no se vuelve a introducir). Entonces, la
probabilidad de que en la 1ra sea roja es 6/10 pero la probabilidad de que la
2da sea roja es 5/9 (en total quedan 9 bolas, de las cuales 5 son rojas, dado
que ya elegimos una roja previamente). Es decir, la probabilidad de que
ambas sean rojas es ( 6/10 )( 5/9 ) = 30/90
Albert Maguia R.
41
10
0
10
P X 0 0, 6 0, 4 0, 00010 P x 1 P X 0 0,99999
0
Ms de 8 veces (n = 10, p = 0,6, q = 0,4, k = 9 y 10)
10
10
9
1
10
0
P X 9 P X 10 = 0, 6 0, 4 0, 6 0, 4 = 0,04031 + 0,00605 = 0,04636
9
10
2.
Alguno defectuoso (n = 60, p = 0,03; q = 0,97; k = 0
60
0
60
P X 0 0, 03 0,97 0,16080 P x 1 P X 0 0,83920
0
Menos de dos defectuosos (n = 60, p = 0,03, q = 0,97, k = 1 y 0)
60
60
1
59
0
60
P X 1 P X 0 = 0, 03 0,97 0, 03 0,97 = 0,2984 + 0,1608 = 0,4592
1
0
3.
Alguna vez (n = 15, p = 0,4; q = 0,6; k = 0
15
0
15
P X 0 0, 4 0, 6 0, 00047 P x 1 P X 0 0,99953
0
Menos de dos veces (n = 15, p = 0,4, q = 0,6, k = 1 y 0)
15
15
1
14
0
15
P X 1 P X 0 = 0, 4 0, 6 0, 4 0, 6 = 0,00047 + 0,00047 = 0,0094
1
0
10
Albert Maguia R.
42
Nunca
Menos de $ 30 000
20
30 000 50 000
50 000 70 000
Ms de $ 70 000
Frecuencia de vuelos
Rara vez
13,69
12,21
15
5,18
Con frecuencia
11,10
2
4,62
5
9,99
4,20
1
8,91
8
8,14
8,10
12
7,26
5
6,60
15
13, 69
12, 21
11,10
5,18
5 4, 62 2 1 4, 20 2 7 9,99 2 8 8,912
2
2 33,90
4,
62
4,
20
9,99
8,91
12 8,10 2 2 8,14 2 5 7, 26 2 15 6, 60 2
8,10
8,14
7, 26
6, 60
0,01
Se sabe que: X 2 v 6
16,81
2.
Frecuencia con la
que leen
Nunca
Profesional o
posgrado
18,64
10
NIVEL EDUCATIVO
Pasante de
Preparatoria
licenciatura
21,28
8,99
17
11
15,17
Algunas veces
12
17,31
23
30,33
7,32
8
34,62
38
No termin la
preparatoria
10,09
21
59
8,21
5
14,63
48
16,42
Maana o tarde
35
Ambas ediciones
28
19
13
66
Total
85
97
41
46
269
20,86
16
Total
23,80
7
10,06
96
11,29
Albert Maguia R.
43
18, 64
21, 28
8,99
10, 09
15,17
17,31
7,32
8, 21
2 32,86
2
30,33
34, 62
14, 63
16, 42
20,86
23,80
10, 06
11, 29
0,05
Se sabe que: X 2 v 9
16,92
3.
Horas
consumidas
escuchando
msica
PROMEDIO DE CALIFICACIONES
A
Total
13
10,31
10
20,63
11
10,31
16
55
5 10
11,88
20
17,81
27
35,63
27
17,81
19
11,88
2
95
19,38
11 20
29,06
27
58,13
71
29,06
16
19,38
32
155
> 20
10,31
11
20,63
41
10,31
24
11
95
Total
50
75
150
75
50
400
6,88
<5
6,88
6,88
6,88
6,88
11 6,88
6,88
2 97,91
0,01
Fin
Albert Maguia R.
44
1.
3.
4.
5.
6.
7.
8.
9.
Albert Maguia R.
45
b) Arreglo de datos
c) Histograma
d) Ojiva
46
b) La media
c) La mediana
d) T.A.
18. Cuando nos referimos a que una curva est cargada hacia el extremo izquierdo,
podemos decir que es:
a) Simtrica
c) Positivamente sesgada
d) N. A.
19. Si un evento no se ve afectado por el resultado de otro evento, se dice que ambos
eventos son:
a) Dependientes
b) Independientes
c) Mutuamente excluyentes
d) Tanto b como c
20. Suponga que se lanza un dado dos veces consecutivas y que usted tiene que trazar
el rbol de probabilidades que muestra todos los resultados posibles de los dos
lanzamientos Cuntas ramas tendr el rbol?
a) 6
b) 12
c) 36
d) 42
e) 48
Albert Maguia R.
47
1. La tabla adjunta muestra las edades de 220 alumnos de un colegio. Cul(es) de las
siguientes afirmaciones es (son) verdadera(s)?
i.
ii.
iii.
La moda es 17 aos
La mediana es mayor que la media
La mitad de los alumnos tiene 17 o 18 aos
2. Las fichas del peso de 10 nios, marcan en promedio 20 kg. En la oficina de control
se pierde una ficha y se sabe que el promedio del resto es 19 kg. Cul es el peso
del nio al que le perdieron la ficha?
3. Si se tabularan las frecuencias de las estaturas y color de ojos de los alumnos de un
curso, Cul de las opciones siguientes es siempre verdadera?
i.
ii.
iii.
iv.
v.
Con la moda del color de ojos se determina el color de ojos que predomina
ii.
iii.
Albert Maguia R.
48
ii.
iii.
CRDITOS
El presente documento denominado ESTADSTICA DESDE CERO, es un material
hibrido en cuanto a su contenido. Algunos conceptos y problemas se extrajeron
de los materiales elaborados por DANNY PERICH CAMPANA PSU Matemtica y
RICHARD LEVIN & DAVID RUBIN Estadstica para Administradores.
Albert Maguia R.
49