Professional Documents
Culture Documents
i1
18
46.6%
variable)
2. Mediana.
- Ordenamos los datos de menor a mayor
40 40 40 45 45 45 45 45 48 48 48 48 48 50 50 50 50 55
- Cmo el nmero de datos es par, entonces el valor de la mediana estar dado
por la semisuma de los datos centrales.
Luego. Me = 48%
3. Moda.
Existen varias modas, porque varios de los datos diferentes se repiten, por lo
tanto no tiene sentido considerar este indicador.
Indicadores de dispersin.
1. Longitud de recorrido.
LoR = 55 - 40 = 15%
2. Desviacin Media.
18
DeM
x
i 1
18
xi
xi
40
40
40
45
45
45
45
45
48
48
48
48
48
50
50
50
50
55
6.6
6.6
6.6
1.6
1.6
1.6
1.6
1.6
1.4
1.4
1.4
1.4
1.4
3.4
3.4
3.4
3.4
8.4
56.8
3.15 %
Pgina 30
10 datos
Interpretacin.
Observando la columna de las desviaciones, xi , tenemos que 10 datos se alejan de la
media en menos de 3.15 o lo que es equivalente a que el 55% de los datos se aleja de
la media en menos de 3.15 lo que podramos interpretar como que los datos no estn
muy dispersos.
3. Varianza.
X
2
i1
(a)
X2
i1
2 X xi
i 1
X2
N X
N
(b)
Por lo tanto, el valor de la varianza puede ser obtenido a partir de las frmulas (a) o
(b).
Para el ejemplo utilizaremos las dos frmulas.
Clculos segn (a)
Clculos segn (b)
xi
( xi )
( xi ) 2
xi
xi2
40
40
40
45
45
45
45
45
48
48
48
48
48
50
50
50
-6.6
-6.6
-6.6
-1.6
-1.6
-1.6
-1.6
-1.6
1.4
1.4
1.4
1.4
1.4
3.4
3.4
3.4
43.56
43.56
43.56
2.56
2.56
2.56
2.56
2.56
1.96
1.96
1.96
1.96
1.96
11.56
11.56
11.56
40
40
40
45
45
45
45
45
48
48
48
48
48
50
50
50
1600
1600
1600
2025
2025
2025
2025
2025
2304
2304
2304
2304
2304
2500
2500
2500
Pgina 31
50
55
840
3.4
8.4
11.56
70.56
270.08
50
55
840
X2
2500
3025
39470
270.08
15.004 % 2
18
X2
39470
(46.6) 2 21.217 % 2
18
X 3.874 %
X 4.6 %
15%<CoV<25%
25%<CoV
Tendencia Central
Me
Mo
LoR
DeM
Dispersin
2
CoV
Pgina 32
46.6%
48%
15%
3.15 %
21.21%
4.61%.
0.099
Interpretacin.
El CoV = 0.099 nos dice que la dispersin de los datos es baja, ahora observamos los
indicadores de tendencia central, como no existe mucha diferencia entre el valor de la
media y el valor de la mediana, se elige la media aritmtica como indicador de
tendencia central, luego concluimos que la mayora de los datos estn en torno a la
meda, es decir, en la mayora de los cursos el avance del Silabo est en torno al 46.6 %
a mitad del periodo acadmico, es decir hay un ligero atraso.
Calculo de los diferentes indicadores de Tendencia Central y Dispersin, cuando se
tiene ms de 30 datos.
Ejemplo
La profesora del curso de estadstica I, grupo 4 Sem. 2003 I, de la EAP de
Estadstica, FCM, generalmente, al finalizar el semestre obtiene el porcentaje de
asistencia de cada uno de sus alumnos, para posteriormente ver si hubo o no relacin
con la nota que obtuvieron. Los datos se dan a continuacin:
0.4
8
0.1
0.6
1
0.3
5
0.7
1
0.1
0.4
2
0.7
4
0.3
2
0
0.7
4
0.6
1
0.2
6
0.4
5
0.7
1
0.1
3
0.3
9
0.5
5
0.0
6
0.8
1
0.6
5
0.1
6
0.6
8
0.6
5
0.8
4
0.0
6
0.7
7
0.5
5
0.1
9
0.7
4
0.7
4
0.2
3
0.6
1
0.2
6
0.7
1
0.5
5
Cmo estos datos, son datos poblacionales y N > 30, entonces las frmulas a utilizar
para hallar los indicadores son los siguientes:
1. Clculo de la media aritmtica, la varianza y la desviacin estndar y el
coeficiente de variacin.
UE: El alumno del curso de Estadstica I del grupo 4 del Perodo Acadmico 2003-I, de
la EAPE de la FCM.
Conjunto de individuos: todos los alumnos del grupo 4, constituyen la poblacin de
individuos.
Variable: Porcentaje de asistencia a clases (X).
Tipo de variable cuantitativa continua.
Conjunto de datos, constituyen los datos poblacionales.
Previo al clculo de los indicadores de tendencia central y dispersin, se construye la
tabla de frecuencias y el polgono de frecuencias, dado qu, el observar el
comportamiento de la variable ayuda a visualizar la tendencia central
Xi
fi
6
4
'
X i 1 X 'i
Pgina 33
0.32
0.45
0.58
0.71
- 0.45 0.385
- 0.58 0.515
- 0.71 0.645
- 0.84 0.775
4
5
6
10
X i fi
i 1
Xi
fi
0
Xi
Xi
fi
Xif i
0.19
0.32
0.45
0.58
0.71
- 0.84
0.125
0.255
0.385
0.515
0.645
0.775
6
4
4
5
6
10
35
0.75
1.02
1.54
2.575
3.87
7.75
17.505
'
i 1
0.7
0.20
0.33
0.46
0.59
0.71
Luego:
0.48037
'
= 0.5%
= 0.0577222 %2
2
X
X
i 1
2
i i
N
X i f 2i
0.09375
0.2601
0.5929
1.326125
2.49615
6.00625
10.775275
= 0.2403 %
CoV =
2. Clculo de la mediana.
Procedimiento.
a. Se construye la tabla de frecuencias acumuladas ( absolutas o relativas)
'
X i 1
0.6
0.19
0.32
0.45
0.58
0.71
b.
'
Xi
- 0.19
- 0.32
- 0.45
- 0.58
- 0.71
- 0.84
Fi
6
10
14
19
25
35
Pgina 34
d.
`
Utilizando la frmula, Me X 3 A4
0.5N F3
, obtenemos el valor de
F4 F3
Me
0.5 %
0.541%
Mo1
0.125%
Mo2
0.775%
Dispersin
LoR
2
2
0.78%
0.0577% 0.24%
CoV
0.48
Interpretacin.
El coeficiente de Variacin, CoV, como es superior a 0.25 nos dice que los datos estn
muy dispersos, y al ver los valores de tendencia central la media y la mediana estos son
diferentes, aparentemente estn cerca el uno del otro, pero al observar la tabla de
frecuencias y el polgono de frecuencias vemos que hay dos valores frecuentes, 0125 y
0.775 en torno a los cuales se acumulan los datos es decir existen 2 modas, por lo que la
media aritmtica ni la mediana no son los adecuados para representar a los datos.
Del anlisis hecho al problema anterior concluimos, que no basta contar con los
indicadores, siempre es conveniente complementar el anlisis con la representacin
grfica de la distribucin de los datos o comportamiento de la variable.
DESVIACIN TIPICA O ESTANDAR.
La varianza se expresa en unidades que son el cuadrado de la unidad de la variable, que
no tiene significado real, por ello es preferible utilizar otra medida de dispersin y esta
es la desviacin tpica o estndar que se define como la raz cuadrada positiva de la
varianza.
2
Cuando el polgono de frecuencias es simtrico o casi simtrico, la desviacin estndar
permite clasificar a las unidades estadsticas en cinco categoras e indicar el porcentaje
de individuos de cada categora.
Las categoras y el porcentaje son las siguientes:
Valores de la
variable
3
2
2
2
2
3
Lic. Mara A. Zacaras Daz
Nombre de la
categora
Muy malo
Malo
Regular
Bueno
Muy bueno
Porcentaje de
Unid. Estad.
2.5
13.5
68
13.5
2.5
Pgina 35
Ejemplo.
El siguiente cuadro estadstico y grfica muestran
Porcentaje
de avance
40 - 43
43 - 46
46 - 49
49 - 52
52 - 55
Total
Cursos
3
5
5
4
1
18
Que, la distribucin de los datos es casi simtrica, por lo tanto, podemos aplicar las
propiedades de la desviacin estndar.
En este caso la variable es: Porcentaje de avance de los cursos, donde = 46.6 % y =
4.61 %
Porcentaje de avance
32.77
37.38
41.99
51.21
55.82
37.38
41.99
51.21
55.82
60.43
Nombre de la
Categora
Avance muy bajo
Avance bajo
Avance regular
Avance Alto
Avance muy alto
Porcentaje de
cursos
Ningn curso
16.6
77.7
5.5
Ningn curso
Podemos observar que no hay ningn curso cuyo avance sea calificado como muy bajo
o muy alto, y en cuanto al porcentaje de cursos dentro de cada categora, difiere en
cuanto a lo establecido, debido a que el polgono es casi simtrico no es simtrico y
porque son pocos los datos.
VARIABLES ESTANDARIZADAS O TIPIFICADAS
Los datos de una variable pueden tomar varias apariencias numricas, dependiendo de
la unidad en la cual es medida. Por ejemplo si se registra el ingreso de los trabajadores
en soles o dlares, lo que da lugar a que, la media aritmtica y la varianza con cada una
de las unidades sea diferente, pero si se da en su forma estandarizada, las medias y las
varianzas sern iguales en una u otra unidad.
Una variable estandarizada se denota con Z y su definicin es:
Lic. Mara A. Zacaras Daz
Pgina 36
X X
X
Donde: X es la media y X es la desviacin estndar de X
xi X
Esta definicin indica que un dato, zi
, mide, en cunto, un dato xi se aleja de
X
su media en trminos de su desviacin estndar.
Z
Z2
X2
1
X2
Ejemplo
La nota media y la varianza del primer examen parcial del curso de clculo I de un
grupo de estudiantes es:
X = 10 puntos
X2 = 4 puntos2
Donde X: Nota de clculo I.
Un alumno obtuvo 11 de nota En unidades estndar a cuanto equivale su nota?
Rpta.
Nota
x = 11 puntos
En unidades estndar:
z
x X 11 10
0.5
X
2
Ejemplo.
La siguiente tabla muestra informacin estadstica, respecto a las notas del primer
examen parcial del curso de Estadstica, de todos los alumnos del curso, los cuales
estn divididos en dos grupos
Grupo
Nota media
1
2
13
13
Varianza
9
4
Pgina 37
Comparando estas notas estandarizadas, que la nota de Rosa es menor que la nota de
Juan, entonces Juan esta en mejor posicin.
El propietario de una fabrica de corbatas, desde hace 2 aos cuenta con 50 trabajadores.
Posee informacin respecto de la produccin diaria de ellos, esta algo satisfecho, sin
embargo cree que s introduce algunas modificaciones, la produccin podra mejorar. Es as
que divide el grupo de trabajadores en dos, en el saln A ubica a 25 trabajadores, quienes
trabajan en las mismas condiciones de siempre, en el saln B ubica a los otros 25
trabajadores, en este ambiente establece nuevas condiciones de trabajo: Msica de
ambiente, alfombra y mejor iluminacin. Al da siguiente, despus de un mes de esta
modificacin, registro la produccin de cada trabajador y los resultados son los siguientes:
Saln A
12
24
21
32
13
16
Saln B
16
18
18
20
36
45
41
45
40
44
44
42
47
48
Pgina 38
28
26
32
a.
b.
c.
d.
e.
25
29
31
33
35
30
26
45
40
30
59
30
46
51
56
48
51
52
49
53
55
50
54
52
49
54
59
12
24
a.
b.
c.
d.
e.
f.
21
32
Saln A
13 16
16 18
18
20
36
45
41
45
Saln B
40 44
44 42
47
48
Solucin.
Considerando los datos poblacionales
1.a. En el saln A la produccin ms baja es de 12 corbatas y la produccin ms alta es de 59
corbatas, pero este ltimo dato es el nico, en realidad la produccin esta oscilando entre
12 y 45 corbatas.
En el saln B, la produccin de corbatas oscila entre 36 y 59 corbatas.
De la informacin anterior podramos concluir, que los trabajadores del saln B tienen una
produccin ms homognea y es mayor que la de los trabajadores del saln A.
1.b. Obtenemos las medidas resumen.
Tendencia Central
Saln
A
B
X
27.56 Corb.
48.44 Corb.
Dispersin
Med
LoR
28 Corb. 47 Corb. 105.29 Corb2.
49 Corb. 23 Corb. 29.21 Corb2.
2
X
X
10.26 Corb.
5.404 Corb.
CoV
0.370
0.112
Pgina 39
2.c.
2.d.
2.e.
2.f.
Media
19
43.2
Mediana
Moda
18
44
Long.
Recorrido
20
12
Varianza
33.77
12.62
Desv.
Estandar
5.81
3.56
Coef.
Variacin
0.31
0.082
Ejemplo.
En los siguientes enunciados identifique si en su contenido se encuentra, un estadgrafo,
un parmetro o un dato e indique el nombre, justifique su respuesta. Asimismo diga si se
Lic. Mara A. Zacaras Daz
Pgina 40
3122
3986
Pgina 41
Porcentaje de
Mujeres
Si
No
30
70
Pgina 42