You are on page 1of 20

MEDIDAS DE TENDENCIA NO CENTRAL - UNIDAD 3

Temas para investigar


I. ¿Qué es una medida de tendencia no central?
Permiten conocer puntos característicos de una serie de valores, que no necesariamente tienen
que ser centrales.
La intención de estas medidas es dividir el conjunto de observaciones en grupos con el mismo
número de valores.
II. ¿Cómo se hallan los cuartiles de un conjunto de datos?
Los cuartiles son los tres elementos de un conjunto de datos ordenados que dividen el conjunto
en cuatro partes iguales. Distinguimos los casos en que los datos están agrupados en frecuencias
y los que no lo están. Los datos también pueden estar agrupados en intervalos de valores.
Vayamos a datos no agrupados. Para el cuartil 1 (Q1) y cuartil 3 (Q3) hallaremos su posición
mediante los siguientes pasos:

(N+1) /4 y 3(N+1) /4 pueden resultar números decimales. Por ejemplo, si el conjunto de datos es
de 20 elementos, N=20, tendremos que el sujeto del primer cuartil es el (N+1) /4= (20+1)
/4=21/4=5,25. En el caso de que nos dé un número decimal Diferenciaremos dos casos:

Sin parte decimal: elegimos ese mismo sujeto. Por ejemplo, si el conjunto tiene 19 elementos,
(N+1) /4= (19+1) /4=20/4=5, por lo que el primer cuartil será Q1=X5.

Con parte decimal: supongamos que el elemento es un número con parte decimal entre el
sujeto i y el i+1. Sea un número de la forma i,d donde i es la parte entera y d la decimal. El
cuartil será:

Ejemplo

El cálculo del segundo cuartil (Q2) depende de si el número de sujetos N es par o impar. Al ser
la mediana, se utiliza el procedimiento de cálculo de la mediana.
Los cuartiles tienen las siguientes características

El cuartil 1 (Q1) es el percentil 25 (P25).


El cuartil 2 (Q2) es la mediana y el percentil 50 (P50).
El cuartil 3 (Q3) es el percentil75 (P75).
Un percentil

Es una de las llamadas medidas de tendencia no central (cuartiles, deciles, quintiles, percentiles,
etc.) que se puede describir como una forma de comparación de resultados, por ello es un
concepto ampliamente utilizado en campos como la estadística o el análisis de datos. El percentil
es un número de 0 a 100 que está muy relacionado con el porcentaje pero que no es el porcentaje
en sí.

III. ¿Cómo determinar los percentiles de un conjunto de datos?


Para calcular los percentiles de un conjunto de datos, primero se han de ordenar los datos en
orden ascendente. Una vez ordenados, un determinado percentil puede encontrarse restando 0,5 a
la posición del dato en la secuencia, dividiendo por el número total de datos y multiplicando
luego por 100.

Fórmula general para calcular percentiles

Siendo P el percentil, Xn la posición en la secuencia de la muestra X y N el número total de


datos.

Diagrama de Caja y Bigotes

Los diagramas de Caja y Bigotes son una presentación visual que describe varias características
importantes, al mismo tiempo, tales como la dispersión y simetría. Para su realización se
representan los tres cuartiles y los valores mínimo y máximo de los datos, sobre un rectángulo,
alineado horizontal o verticalmente.

Construcción
Comparar distribuciones
Diagrama de Caja a través de Excel

Construcción

Una gráfica de este tipo consiste en una caja rectangular, donde los lados más largos muestran
el recorrido intercuartílico. Este rectángulo está dividido por un segmento vertical que indica
donde se posiciona la mediana y por lo tanto su relación con los cuartiles primero y tercero
(recordemos que el segundo cuartil coincide con la mediana). Esta caja se ubica a escala sobre un
segmento que tiene como extremos los valores mínimo y máximo de la variable. Las líneas que
sobresalen de la caja se llaman bigotes. Estos bigotes tienen un límite de prolongación, de modo
que cualquier dato o caso que no se encuentre dentro de este rango es marcado e identificado
individualmente.

EJEMPLO DISTRIBUCIÓN DE EDADES

Utilizamos la ya usada distribución de frecuencias (en tallos y hojas), que representan la edad de
un colectivo de

20 personas.

36 25 37 24 39 20 36 45 31 31

39 24 29 23 41 40 33 24 34 40

ORDENAR LOS DATOS

Para calcular los parámetros estadísticos, lo primero es ordenar la distribución.

20 23 24 24 24 25 29 31 31 33 34 36 36 37 39 39 40 40 41 45

CALCULO DE CUARTILES

Q1, el cuartil Primero es el valor mayor que el 25% de los valores de la distribución. Como N =
20 resulta que

N/4 = 5; el primer cuartil es la media aritmética de dicho valor y el siguiente:


Q1= (24 + 25) / 2 = 24,5

Q2, el Segundo Cuartil es, evidentemente, la mediana de la distribución, es el valor de la variable


que ocupa el lugar central en un conjunto de datos ordenados. Como N/2 =10; la mediana es la
media aritmética de dicho valor y el siguiente:

me= Q2 = (33 + 34) / 2 =33,5

Q3, el Tercer Cuartil, es el valor que sobrepasa al 75% de los valores de la distribución. En
nuestro caso, como

3N / 4 = 15, resulta

Q2= (39 + 39) / 2 = 39

DIBUJAR LA CAJA Y LOS BIGOTES

El bigote de la izquierda representa al colectivo de edades ( Xmín, Q1)

La primera parte de la caja a (Q1, Q2),

La segunda parte de la caja a (Q2, Q3)

El bigote de la derecha viene dado por (Q3, Xmáx).

INFORMACIÓN DEL DIAGRAMA

Podemos obtener abundante información de una distribución a partir de estas representaciones.

La parte izquierda de la caja es mayor que la de la derecha; ello quiere decir que la edad
comprendida entre
el 25% y el 50% de la población está más dispersa que entre el 50% y el 75%.
El bigote de la izquierda (Xmím, Q1) es más corto que el de la derecha; por ello el 25%
de los más jóvenes
están más concentrados que el 25% de los mayores.
El rango intercuartílico = Q3 - Q1 = 14,5; es decir, el 50% de la población está
comprendido en 14,5 años.

COMPARAR DISTRIBUCIONES

La mayor utilidad de los diagramas caja y bigotes es para comparar dos o más conjuntos de
datos.

Comparación distribución de edades

Comparación entrenamientos de un corredor

Comparación clasificación liga.

COMPARACIÓN DISTRIBUCIÓN DE EDADES

Análogamente a lo realizado con los diagramas de tallo y hojas, comparamos, mediante estos
diagramas, esta distribución con la del otro ejemplo de distribución de edades.

35 38 32 28 30 29 27 19 48 40

39 24 24 34 26 41 29 48 28 22
Qué aplicación se les puede dar a las medidas de tendencia central en su carrera

Para que una calificación tenga significado hay que contar con elementos de referencia
generalmente relacionados con ciertos criterios estadísticos. Las medidas de tendencia
central (media, mediana y moda) sirven como puntos de referencia para interpretar las
calificaciones que se obtienen en una prueba y nosotros como administradores en seguridad y
salud en el trabajo estamos realizando constantes mediciones y estas medidas nos servirán
mucho como puntos de referencias.

A partir de los temas abordados en los videos, la revisión del material y del libro de la
unidad “Medidas de tendencia no central”, realice los siguientes ejercicios:

1. Los siguientes datos representan el número de hijos de un grupo de 40 familias.

2 3 0 1 3 5 2 3 1 5
2 1 4 3 2 0 5 0 1 1
2 5 0 2 0 3 1 3 1 0
3 3 2 4 5 2 1 0 2 4

a. Halle las medidas de tendencia central para datos no agrupados (realizar procesos
completos).
b. Determine Q1, Q2 y Q3.
a. Construya el diagrama de caja y bigotes.

Tabla de frecuencia # 1

Numero
Fi Ni FI(%) F% “Xi (fi)”
familia
0 7 7 17,5 17,5 0
1 8 15 20 37,5 8
2 9 24 22,5 60 18
3 8 32 20 80 24
4 3 35 7,5 87,5 12
5 5 40 12,5 100 25
TOTAL 40 100 87
Medidas de tendencia central:

Calculo de la MODA “Mo”


Se busca el dato de mayor frecuencia, teniendo en cuenta nuestra tabla # 1 podemos decir que la
MODA “Mo”, es el 2 ya que es el número que más repite.

Mo: 2

Calculo de la MEDIA

Para calcular la MEDIA o PROMEDIO debemos realizar la siguiente formula:


= ∑ Xi (fi)
∑fi

= 87
40

= 2,175

Calculo de la MEDIANA “Me”


Para calcular la MEDIANA “Me” se toma el total de los datos y lo dividimos entre 2

Me = n / 2
Me = 40/2

Me = 20

Nos dirigimos a la tabla 1 y buscamos el número 20 en la frecuencia acumulada, como no


se encuentra, miramos el valor más cercano que le sigue, en este caso sería el 24,
seguimos el intervalo hasta los números de familias y de ahí sacamos la MEDIANA que
en este caso es 2.
Me = 2

Cuartiles Q1, Q2, y Q3

Con la fórmula de posición  K (n+1) / 4


K =1
N=40
a. Posición de cuartil 1  Q1 = 1 (40+1) = 1*41 = 41 = 10.25
4 4 4
 Q1 = 1
K =2
N=40
b. Posición del cuartil 2  Q2 = 2(40+1) = 2*41 = 82 = 20.5
4 4 4
Q2 = 2
K =3
N=40
c. Posición del cuartil 3  Q3 = 3(40+1) = 3*41= 123 = 30.75
4 4 4
 Q3 =3

Hallamos el Rango Intercuartilico; RI = Q3 – Q1  RI = 3 – 1 = 2

 RI = 2

Hallamos los valores atípicos; des la siguiente forma:


 Xmin = Q1 – 1.5 * RI  1 – 1.5 * 2 = -2
 Xmax = Q3 + 1.5 * RI  3 + 1.5 * 2 = 6

Diagrama de caja y bigote

Q1 Q2 Q3
min max

-2 -1 0 1 2 3 4 5 6

2. Los siguientes datos corresponden a los días de vacaciones que tomaron los empleados
durante el último año:
a. Complete la tabla de frecuencias.
b. Halle las medidas de tendencia central (realizar procesos completos).
c. Desarrolle el diagrama de caja y bigotes.
d. Halle el percentil 25, 60 y 90 del conjunto de datos.
Tabla de frecuencia # 2

# de días (xi) Cantidad de Ni Fi (%) Fi (%) Xi . Fi


empleados (fi)
0 10 10 22,222 22,222 0
1 6 16 13,333 35,555 6
2 12 28 26,666 62,222 24
3 9 37 20 82,222 27
4 4 41 8,888 91,111 16
5 3 44 6,666 97,777 15
6 1 45 2,222 100 6
Total 45 94

Medidas de tendencia central:


Calculo de la MODA “Mo”
En nuestro ejercicio la moda corresponde a Xi: 2 por repetirse 12 veces en el conjunto de datos.

Calculo de la MEDIA
= ∑ Xi (fi)
∑fi
= 94/45
= 2,088

Calculo de la MEDIANA “Me”


Se toma el total de datos y lo dividimos entre 2
Me= n/2
Me= 45/2
Me= 22,5
El cálculo de la mediana no da un resultado decimal 22,5, para que nos resulte un numero entero
lo aproximamos a 23, como el número no se encuentra en la tabla de frecuencia buscamos el
valor más cercano, en este caso seria 28 que corresponde a Xi= 2
Hallar el percentil 25, 60 y 90
Percentil 25:
P25= 25(45 + 1)/100
P25= 11,5
P25= 1(1-1) . 0,5
P25= 0,5

Percentil 60:
P60= 60(45+1)/100
P60= 27,6
P60= 2(2-2) . 0,6
P60= 1,2

Percentil 90:
P90= 90(45+1)/100
P90= 41,1
P90= 4(4-4) . 0,4
P90= 1,6

Para poder realizar el diagrama de la caja de bigotes tenemos que hallar los cuartiles: Q1,
Q2 Y Q3.
Cuartiles Q1, Q2, y Q3

Con la fórmula de posición  K (n+1) / 4


K =1
N=45
Posición de cuartil 1  Q1 = 1 (45+1) = 1*46 = 46 = 11.5
4 4 4
 Q1 = 1

K =2
N=45
Posición del cuartil 2  Q2 = 2(45+1) = 2*46 = 92 = 23
4 4 4
Q2 = 2
K =3
N=45

Posición del cuartil 3  Q3 = 3(45+1) = 3*46= 138 = 34.5


4 4 4
 Q3 =3

Hallamos el Rango Intercuartilico; RI = Q3 – Q1  RI = 3 – 1 = 2

 RI = 2

Hallamos los valores atípicos; des la siguiente forma:


 Xmin = Q1 – 1.5 * RI  1 – 1.5 * 2 = -2
 Xmax = Q3 + 1.5 * RI  3 + 1.5 * 2 = 6

Diagrama de caja y bigote

Q1 Q2 Q3
min max

-2 -1 0 1 2 3 4 5 6

3. Los siguientes datos corresponden a los días de vacaciones que tomaron los empleados
durante el último año:
a. Desarrolle el diagrama de caja y bigotes.
b. Halle el percentil 15, 30,60,75 y 90 del conjunto de datos.

Tabla de frecuencia # 3
I Clase L.R.C MC Fi Ni fi (%) Fi (%) MC (fi)
1 (0 – 2) -0,5 – 2,5 1 10 10 22,222 22,222 10
2 (2 – 4) 1,5 – 4,5 3 6 16 13,333 35,555 18
3 (4 – 6) 3,5 – 6,5 5 12 28 26,666 62,222 60
4 (6 – 8) 5,5 – 8,5 7 9 37 20 82,222 63
5 (8 – 10) 7,5 – 10,5 9 4 41 8,888 91,111 36
6 (10- 12) 9,5 – 12,5 11 3 44 6,666 97,777 33
7 (12 – 11,5 – 13 1 45 2,222 100 13
14) 14,5
total 233

Medidas de tendencia central:


Clase modal: En nuestro ejercicio la clase modal será el intervalo de clase 3, que corresponde
a 4 – 6, por tener una frecuencia de 12.
Calculo de la media: utilizamos la siguiente formula
∑ 𝑚𝑐 . 𝑓𝑖
𝑥=
n
233
𝑥=
45

𝑥 = 5,177

Calculo de la mediana: Calculamos la mediana teórica: n/2 = 45/2 = 22,5 como el número es
decimal lo aproximamos a 13 para convertirlo a entero.
n
( − 𝑓𝑖−1 )
𝑀𝑒 = LRi + 2 .𝑎
fi
𝑀
(23 − 16)
𝑒 = 3,5 + .2
12
𝑀𝑒 = 3,5 + 1,16
𝑀𝑒 = 4,66
Hallar el percentil 15, 30, 60, 75 y 90
Percentil 15:
P15= (15 . 45)/100
P15= 6 + 2 (-21,75 / 9)
P15= 6 + (-4,72)
P15= 1,28
Percentil 30:
P30= 30/100 . 45 = 13,5
P30= 2 + (13,5 – 10) . 2 / 6
P30= 2 + 1,16
P30= 3,16
Percentil 60:
P60= 60/100 . 45 = 27
P60= 4 + (27 – 16) . 2 / 12
P60= 4 + 1,83
P60= 5,83
Percentil 75:
P75= 75/100 . 45 = 33,75
P75= 6 + (33,75 – 28) .2 / 9
P75= 6 + 1,27
P75= 7,27
Percentil 90:
P90= 90/100 . 45 = 40,5
P90= 8 + (40,5 – 37) . 2 / 4
P90= 8 + 1,75
P90= 9,75

Para realizar el diagrama de caja y bigotes, debemos hallar los cuartiles, Q1, Q2, y Q3, con
la siguiente formula.

Pe = Li + (n/100-fi-1) .a
Fi
Q1 = P25 = 25 .45 = 11.25
100
P25 = 2 + (11.25-10).2
6
P25 = 2 + 0,41
P25 = 2,41
Q1 = 2,41

Q2 = P50 = 50 .45 = 22,5


100
P50 = 4 + (22.5-16). 2
12
P50 = 4 + 1,08
P50 = 5,08
Q2 = 5,08

Q3 = P75 = 75 .45 = 33,75


100
P75 = 6+ (33,75-28). 2
9
P75 = 6 + 1,27
P75 = 7,27
Q3 = 7,27

Hallamos el rango intercuartilico


 RI = Q3 – Q1  7.27 – 2.41 = 4.86
 RI = 4.86

Hallamos Los valores atípicos de Q1 y Q3, con la siguiente formula.


 Q1 – 1.5 * RI  2.46 – 7.29 = - 4.87
 Q3 + 1.5 * RI  7.27 + 7.29 = 14.56

Hallamos los valores de Xmin y Xmax.


 Xmin sacamos el mayor valor entre – 4.87 y el mínimo de la Mc que es 1
 Xmin = 1
 Xmax Sacamos el menor valor entre 14.56 y el máximo de la Mc que es 13
 Xmax = 13
Diagrama de caja y bigote.

Valor
Valor atipico Q1 Q2 Q3 atipico

-1 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
4. n una competición de tiro al blanco con rifle de aire, se tienen los dos últimos
participantes, los cuales tiraron a un tablero, ellos obtienen el siguiente registro después
de 15 disparos cada uno.

a. Halle del conjunto de datos el promedio, la mediana y la moda.


b. Determine Q1, Q2 y Q3 .
c. Realice el diagrama de caja y bigotes y analice los resultados de los dos conjuntos de
datos.
(Nota: hacer la tabla de frecuencias para el puntaje de cada jugador).
Tabla de frecuencia # 4 primer jugador

PUNTOS
POR fi Ni FI(%) F% “Xi (fi)”
DISPAROS
1 6 6 40 40 6
2 3 9 20 60 6
3 0 9 0 60 0
4 3 12 20 80 12
5 3 15 20 100 15
TOTAL 15 100 39

Medidas de tendencia central:

Calculo de la MODA “Mo”


Se busca el dato de mayor frecuencia, teniendo en cuenta nuestra tabla # 4 podemos decir que la
MODA “Mo”, es el 1 ya que es el número que más repite
Mo: 1 punto

Calculo de la MEDIA “ ”

Para calcular la MEDIA o PROMEDIO debemos realizar la siguiente formula:


= ∑ Xi (fi)
∑fi

= 39
15

= 2,6 puntos por disparos

Calculo de la MEDIANA “Me”


Para calcular la MEDIANA “Me” se toma el total de los datos y lo dividimos entre 2

Me = n / 2
Me = 15/2

Me = 7,5
Me= 8 puntos

Nos dirigimos a la tabla # 4 y buscamos el número 8 en la frecuencia acumulada, como


no se encuentra, miramos el valor más cercano que le sigue, en este caso sería el 9,
seguimos el intervalo hasta los números de disparos y de ahí sacamos la MEDIANA que
en este caso es 2.

Me = 2 puntos

Cuartiles Q1, Q2, y Q3; Jugador 1

Con la fórmula de posición  K (n+1) / 4

Donde, K = Cuartil estudiado; n = Número total de datos; 4 = Por ser un cuartil, ósea entre 4

d. Posición de cuartil 1  Q1 = 1(15+1) =1*16 = 16 = 4


4 4 4

 Q1 = 1 punto
e. Posición del cuartil 2  Q2 = 2 (15+1) = 2*16 = 32 = 8
4 4 4

 Q2 = 2 puntos

f. Posición del cuartil 3  Q3 = 3(15+1) = 3*16 = 48 = 12


4 4 4
 Q3 = 4 puntos

Hallamos el Rango Intercuartilico; RI = Q3 – Q1  RI = 4 – 1 = 3

 RI = 3

Hallamos los valores atípicos; des la siguiente forma:

 Xmin = Q1 – 1.5 * RI  1 – 1.5 * 3 = - 3.5


 Xmax = Q3 + 1.5 * RI  4 + 1.5 * 3 = 8.5

Diagrama de caja y bigote del jugador 1

Q1 Q2 Q4
min max

-4 -3 -2 -1 0 1 2 3 4 5 6 7 8 9
Tabla # 5 jugador numero 2

PUNTOS
POR fi Ni FI(%) F% “Xi (fi)”
DISPAROS
1 0 0 0 0 0
2 7 7 46,666667 46,666667 14
3 7 14 46,666667 93,333333 21
4 1 15 6,6666667 100 4
5 0 15 0 100 0
TOTAL 15 100 39

Medidas de tendencia central:

Calculo de la MODA “Mo”


Se busca el dato de mayor frecuencia, teniendo en cuenta nuestra tabla # 5 podemos decir que la
MODA “Mo”, es el 2 y 3 ya que es el número que más repite, por lo tanto, es BIMODAL

Mo: 2 Y 3 puntos

Calculo de la MEDIA “ ”

Para calcular la MEDIA o PROMEDIO debemos realizar la siguiente formula:


= ∑ Xi (fi)
∑fi

= 39
15

= 2,6 puntos por disparos.

Calculo de la MEDIANA “Me”


Para calcular la MEDIANA “Me” se toma el total de los datos y lo dividimos entre 2

Me = n / 2
Me = 15/2

Me = 7,5
Me= 8
Nos dirigimos a la tabla # 5 y buscamos el número 8 en la frecuencia acumulada, como
no está nos ubicamos en el 14 seguimos el intervalo hasta los números de disparos y de
ahí sacamos la MEDIANA que en este caso es 3.

Me = 3 puntos

Cuartiles Q1, Q2, y Q3; Jugador 2

Con la fórmula de posición  K (n +1)/ 4

Donde, K = Cuartil estudiado; n = Número total de datos; 4 = Por ser un cuartil, ósea entre 4

a. Posición de cuartil 1  Q1 = 1(15+1) = 1*16 = 16 = 4


4 4 4

 Q1 = 2 puntos

b. Posición del cuartil 2  Q2 = 2 (15+1) = 2*16 = 32 = 8


4 4 4

 Q2 = 3 puntos

c. Posición del cuartil 3  Q3 = 3(15+1) = 3*16 = 48 = 12


4 4 4

 Q3 = 3 puntos

Hallamos el Rango Intercuartilico; RI = Q3 – Q1  RI = 3 – 1 = 2

 RI = 2

Hallamos los valores atípicos; des la siguiente forma:

 Xmin = Q1 – 1.5 * RI  2 – 1.5 * 2 = - 1


 Xmax = Q3 + 1.5 * RI  3 + 1.5 * 2 = 6
Diagrama de caja y bigote del jugador 2

Q1 Q2 Q3
min max

-1 0 1 2 3 4 5 6

Conclusión ejercicio 4.

Revisando los datos obtenidos, debemos decir que los dos jugadores tuvieron la misma
puntuación en el mismo número de tiros al blanco, pero se diferencian en que los obtuvieron
disparando en aros de puntaje distinto.

Por tanto, decimos que el jugador 1, tuvo la mayor cantidad de puntos, disparando 3 veces en el
aro que da 5 puntos, mientras en el aro que más veces repitió el tiro fue en el aro que solo da 1
punto, mientras el jugador 2 obtuvo la mayor cantidad de puntos disparando 7 veces en el aro
que da 3 puntos.

Para terminar, deducimos que el jugador 2 fue más “efectivo” que el jugador 1 ya que tuvo un
mejor promedio de disparo, sin menospreciar al jugador 1, que en definitiva obtuvo el mismo

You might also like