You are on page 1of 13

UNIVERSIDAD DISTRITAL FRANCISCO JOS

E DE CALDAS
Facultad Tecnol ogica
Profesora: Helena Dulcey Hern andez
Electiva No T ecnica Abril, 2012
Notas de Clase
Medidas de Localizaci

on
Los res umenes visuales de datos son herramientas excelentes para obtener impresiones y puntos de vista
preliminares. El analisis formal de los datos requiere calcular e interpretar medidas de resumen numericas; es
decir, a partir de los datos, se intenta extraer varias cantidades de resumen: n umeros que puedan servir para
caracterizar el conjunto de datos y mostrar algunas de sus propiedades sobresalientes. El interes fundamental
tiene que ver con los datos numericos.
1. Medidas de Tendencia Central
Son estadgrafos de posicion que son interpretados como valores que permiten resumir a un conjunto de datos
dispersos, estas medidas ayudan a saber donde estan los datos pero no indican como se distribuyen.
Dentro de estas medidas se encuentran

Media o Promedio
Mediana
Moda
1.1. La Media
Es el valor medio ponderado de la serie de datos. Se pueden calcular diversos tipos de media, siendo las mas
utilizadas:
1.1.1. Media aritmetica
Es la suma de todos los valores dividida por la cantidad de valores de la muestra
x =
x
1
+x
2
+x
3
+. . . +x
n1
+x
n
n
=
n

i=1
x
i
n
La media aritmetica se denomina frecuentemente valor promedio.
Ejemplo 1 Media aritmetica para datos no agrupados El profesor de estadstica desea conocer el
promedio de las notas nales de los 10 alumnos de la clase. Las notas de los alumnos son:
3, 2 3, 1 2, 4 4, 0 3, 5
3, 0 3, 5 3, 8 4, 2 4, 0
Cual es el promedio de notas de los alumnos de la clase?
Pag. 1
UNIVERSIDAD DISTRITAL FRANCISCO JOS

E DE CALDAS
Facultad Tecnol ogica
Profesora: Helena Dulcey Hern andez
Electiva No T ecnica Abril, 2012
Solucion. Aplicando la formula para datos no agrupados se tiene que sumando todos los datos y diviendolos
por 10 resulta
x =
10

i=1
x
i
10
=
3, 2 + 3, 1 + 2, 4 + 4, 0 + 3, 5 + 3, 0 + 3, 5 + 3, 8 + 4, 2 + 4, 0
10
= 3, 47
Si se calcula nuevamente la media aritmetica, con la modicacion de que la primera nota sea 0, 0 se tiene
que la media cambia de 3,47 a 3,15. Esta variacion notoria se debe a que la media aritmetica es sensible a
los valores extremos cuando se trata con pocos datos. El 0, 0 es una nota atpica comparada con las demas,
que estan ubicadas entre 3, 0 y 4, 2.
Tambien se calcula multiplicando cada valor por el n umero de veces que se repite. La suma de todos estos
productos se divide por el total de datos de la muestra:
x =
(x
1
n
1
+x
2
n
2
+x
3
n
3
+. . . +x
n1
n
n1
+x
n
n
n
n
Ejemplo 2 Media aritmetica para datos agrupados
Preguntas buenas Personas
1 15
2 13
3 8
4 19
5 21
6 5
Solucion. Aplicando la formula se tiene
x =
1 15 + 2 13 + 3 8 + 4 19 + 5 21 + 6 5
81
= 3,41
En promedio los encuestados contestaron aproximadamente 3 preguntas buenas.
Ejemplo 3 Calcular la media para los datos distribuidos en la siguiente tabla de frecuencia
Intervalo Marca de clase Frecuencia
40,1 48,1 44,1 3
48,1 56,1 52,1 8
56,1 64,1 60,1 11
64,1 72,1 68,1 32
72,1 80,1 76,1 21
80,1 88,1 84,1 18
88,1 96,1 92,1 14
96,1 104,1 100,1 1
Pag. 2
UNIVERSIDAD DISTRITAL FRANCISCO JOS

E DE CALDAS
Facultad Tecnol ogica
Profesora: Helena Dulcey Hern andez
Electiva No T ecnica Abril, 2012
Solucion.
x =
44,1 3 + 52,1 8 + 60,1 11 + 68,1 32 + 76,1 21 + 84,1 18 + 92,1 14 + 100,1 1
108
= 73,06
Las desventajas de la media aritmetica son las siguientes
1. Si alguno de los valores es extremadamente grande o extremadamente peque no, la media no es el
promedio apropiado para representar la serie de datos.
2. Solo se puede calcular cuando la variable es cuantitativa
3. No se puede determinar si en una distribucion de frecuencias hay intervalos de clase abiertos.
Ejemplo 4 Comparacion entre el calculo de la media aritmetica para datos no agrupados y
datos agrupados en tablas tipo B
Calcular la media aritmetica a los siguientes datos sin agrupar y agrupandolos en una tabla de frecuencia
47, 8 23, 1 12, 4 35, 4 44, 0 26, 2
18, 6 11, 0 32, 0 12, 4 49, 4 41, 4
18, 6 21, 0 26, 3 11, 1 21, 4 30, 6
12, 8 43, 1 18, 1 38, 1 16, 8 12, 4
33, 6 40, 9 15, 2 33, 2 48, 2 37, 0
Datos no agrupados
x =
10

i=1
x
i
30
= 27,74
Datos agrupados
Intervalo Marca de clase Frecuencia
11, 00 17, 41 14, 21 8
17, 41 23, 81 20, 61 6
23, 81 30, 21 27, 01 2
30, 21 36, 61 33, 41 5
36, 61 43, 01 39, 81 4
43, 01 49, 40 46, 21 5
x =
14,21 8 + 20,61 6 + 27,01 2 + 33,41 5 + 39,81 4 + 46,21 5
30
= 28,29
Pag. 3
UNIVERSIDAD DISTRITAL FRANCISCO JOS

E DE CALDAS
Facultad Tecnol ogica
Profesora: Helena Dulcey Hern andez
Electiva No T ecnica Abril, 2012
Se tiene una diferencia entre ambas medias: 27, 74 para los datos no agrupados y 28, 29 para los datos
agrupados. Esta diferencia radica que en la tabla existe una perdida de informacion, al agrupar los datos en
los intervalos de clase. El valor de la media exacta es el calculado para los datos no agrupados, pero dada la
proximidad de la media para los datos agrupados, se toma esta ultima como cierta.
1.1.2. Media geometrica
Se eleva cada valor al n umero de veces que se ha repetido. Se multiplican todo estos resultados y al producto
nal se le calcula la raz n (siendo n el total de datos de la muestra).
M
g
=
n

x
n
1
1
x
n
2
2
x
n
3
3
. . . x
nn
n
= (x
n
1
1
x
n
2
2
x
n
3
3
. . . x
nn
n
)
1
n
Seg un el tipo de datos que se analice sera mas apropiado utilizar la media aritmetica o la media geometrica.
La media geometrica se suele utilizar en series de datos como tipos de interes anuales, inacion, etc., donde
el valor de cada a no tiene un efecto multiplicativo sobre el de los a nos anteriores. En todo caso, la media
aritmetica es la medida de posicion central mas utilizada.
Ejemplo 5 Encuentre la media geometrica de las tasas de interes de tres bonos son 5 %, 7 % y 4 %.
M
g
=
3

7 5 4 = 5,192
Otra aplicacion de la media geometrica es determinar el porcentaje promedio del incremento en ventas,
produccion u otros negocios o series economicas de un periodo a otro.
La formula para este tipo de problema es:
M
g
=
n

valor al nal del periodo


valor inicio del periodo
1
Ejemplo 6 El n umero total de mujeres inscritas en colegios americanos aumento de 755000 en 1986 a
835000 en 1995.
M
g
=
10

835000
755000
1
Es decir, la media geometrica de la tasa de crecimiento es 1,01 %.
Pag. 4
UNIVERSIDAD DISTRITAL FRANCISCO JOS

E DE CALDAS
Facultad Tecnol ogica
Profesora: Helena Dulcey Hern andez
Electiva No T ecnica Abril, 2012
EJERCICIO
Una clase de ingles para estudiantes de otra lengua esta conformada por 20 estudiantes franceses, 25 es-
tudiantes italianos y 15 estudiantes espa noles. En un examen, los estudiantes franceses obtuvieron 78 en
promedio, los estudiantes italianos 75 y los estudiantes espa noles 76. Encuentre la nota promedio para la
clase.
1.2. Mediana
La mediana es el valor que divide una serie de datos en dos partes iguales. La cantidad de datos que queda
por debajo y por arriba de la mediana son iguales.
Supongamos que una lista x
1
, x
2
, . . . , x
n
, de n valores o datos, es ordenada en forma creciente. La mediana de
los datos, representada por x (lease x mo no), se dene como el valor del medio (si n es impar) o el promedio
de los valores medios (si n es par). Es decir,
x =

x
k+1
cuando n es impar y n = 2k + 1
x
k
+x
k+1
2
cuando n es par y n = 2k
Ejemplo 7 Encuentre la mediana para los siguientes datos:
4 1 2 3 4 2 2 1 5 5 3
Solucion.
1. Se ordenan los datos ascendente o descendentemente
1 1 2 2 2 3 3 4 4 5 5
2. Se ubica el valor que divide en dos parte iguales el n umero de datos, en este caso como el n umero de
datos es impar entonces es el n umero que esta ubicado en la sexta posicion corresponde a la mediana
1 1 2 2 2

5 datos
mediana

3 3 4 4 5 5

5 datos
La distribucion de frecuencia acumulada puede utilizarse para encontrar la mediana de un conjunto arbitrario
de datos. Una propiedad de la mediana x es que hay justo el mismo n umero de n umeros menor que x y el
mismo n umero de n umero mayor que x
La mediana de una muestra de datos organizados en una distribucion de frecuencias se calcula mediante la
siguiente formula:
Pag. 5
UNIVERSIDAD DISTRITAL FRANCISCO JOS

E DE CALDAS
Facultad Tecnol ogica
Profesora: Helena Dulcey Hern andez
Electiva No T ecnica Abril, 2012
x = L +
(
n
2
F
A
f
)
A
donde L es el lmite inferior de la clase que contiene a la mediana, F
A
es la frecuencia acumulada que pre-
cede a la clase de la mediana, f es la frecuencia de clase de la mediana e A es la amplitud del intervalo de clase.
Para determinar la clase de la mediana de datos agrupados:
1. Se elabora una distribucion de frecuencias acumulada.
2. Se divide el n umero total de datos entre 2.
3. Se determina que clase contiene este valor.
Ejemplo 8 Encuentre la mediana a la siguiente distribucion de frecuencia, la cual representa las atenciones
medicas brindadas por el hospital
1
Edad en a nos Marca de clase Frecuencia F
A
[10, 20) 15 8 8
[20, 30) 25 20 28
[30, 40) 35 14 42
[40, 50) 45 8 50
[50, 60) 55 2 52
[60, 70) 65 2 54
[70, 80) 75 2 55
Solucion. Como son 55 datos entonces la mitad es 27.5, luego el valor de la mediana se encuentra en la
segunda clase, es decir en el intervalo [20, 30), luego se tiene que L = 20, n = 55, f = 20, A = 10, F
A
= 8
Por lo tanto
x = 20 +
55
2
8
20
10 = 29.75
Por lo que se puede concluir que el 50 % de las personas atendidas en un n de semana por el hospital tienen
una edad inferior a los 29.75 a nos.
1.3. Moda
La moda indica el valor que mas se repite, o la clase que posee mayor frecuencia, no necesariamente es unica,
es decir puede haber mas de una moda en una distribucion, as por ejemplo
1
Informacion tomada de http://dieumsnh.qfb.umich.mx/estadistica/mediana.htm. Consultada el 6 de Abril de 2012
Pag. 6
UNIVERSIDAD DISTRITAL FRANCISCO JOS

E DE CALDAS
Facultad Tecnol ogica
Profesora: Helena Dulcey Hern andez
Electiva No T ecnica Abril, 2012
Ejemplo 9 Los siguientes datos provienen del resultado de entrevistar a 30 personas sobre la marca de
gaseosa que mas consume a la semana:
Marca 1 Marca 1 Marca 2 Marca 1 Marca 3
Marca 2 Marca 3 Marca 1 Marca 1 Marca 1
Marca 1 Marca 1 Marca 3 Marca 1 Marca 3
Marca 1 Marca 2 Marca 3 Marca 3 Marca 3
Marca 1 Marca 1 Marca 2 Marca 1 Marca 2
Marca 3 Marca 1 Marca 1 Marca 2 Marca 3
Solucion.
1. Se determina las frecuencias de cada valor de la variable.
La marca 1 se repite 15 veces
La marca 2 se repite 6 veces
La marca 3 se repite 9 veces
2. La moda representa el valor que mas se repite. En este caso es la marca 1.
Ejemplo 10 Calcule la moda en los datos agrupados a partir de la siguiente tabla de frecuencia:
Intervalo M
c
Frecuencia
[4, 6) 5 2
[6, 8) 7 4
[8, 10) 9 4
[10, 12) 11 5
[12, 14) 13 5
Solucion. Las marcas de clase que mas frecuencias tienen son 11 y 13, por tanto decimos que es un caso
donde aparecen dos modas
2. Medidas de posicion no centrales
Las medidas de posicion no centrales permiten conocer otros puntos caractersticos de la distribucion que
no son los valores centrales. Entre otros indicadores, se suelen utilizar una serie de valores que dividen la
muestra en tramos iguales
Pag. 7
UNIVERSIDAD DISTRITAL FRANCISCO JOS

E DE CALDAS
Facultad Tecnol ogica
Profesora: Helena Dulcey Hern andez
Electiva No T ecnica Abril, 2012
2.1. Cuartiles
Son 3 valores que distribuyen la serie de datos, ordenada de forma creciente o decreciente, en cuatro tramos
iguales, en los que cada uno de ellos concentra el 25 % de los resultados.
Q
1
= mediana de la primera mitad de los valores
Q
2
= M = mediana de todos los valores
Q
3
= mediana de la segunda mitad de los valores
2.1.1. Primer cuartil
El primer cuartil es el valor correspondiente al punto debajo del cual se encuentra el 25 % de las observaciones
en un conjunto ordenado de datos.
Para calcular el primer cuartil en datos no agrupados cuando se tiene una serie de valores x
1
, x
2
, x
3
. . . x
n
,
se utiliza la siguiente formula
Cuando n es par
n
4
Cuando n es impar
n + 1
4
La forma para calcular el primer cuartil en datos agrupados es
Q
1
= L +
n
4
F
A
f
A
donde L = lmite de las clases que contienen Q
1
, F
A
= frecuencia acumulada que precede a la clase que
contiene a Q
1
, f = frecuencia de la clase que contiene Q
1
, A= amplitud de la clase que contiene Q
1
2.1.2. Tercer Cuartil
El tercer cuartil es el valor correspondiente al punto debajo del cual se encuentra 75 % de las observaciones
en un conjunto ordenado de datos:
Para datos no agrupados tenemos
Cuando n es par
3
4
n
Cuando n es impar
3(n + 1)
4
Pag. 8
UNIVERSIDAD DISTRITAL FRANCISCO JOS

E DE CALDAS
Facultad Tecnol ogica
Profesora: Helena Dulcey Hern andez
Electiva No T ecnica Abril, 2012
Para datos agrupados, se encuentra el tercer cuartil con la siguiente formula
Q
3
= L +
3
4
n F
A
f
A
donde L = lmite de las clases que contienen Q
3
, F
A
= frecuencia acumulada que precede a la clase que
contiene a Q
3
, f = frecuencia de la clase que contiene Q
3
, A= amplitud de la clase que contiene Q
3
Ejemplo 11 Encuentre el primer y tercer cuartil de la siguiente tabla e interprete los resultados obtenidos
2
Salarios No. de Empleados F
A
200 299 85 85
300 399 90 175
400 499 120 295
500 599 70 365
600 699 62 427
700 800 36 463
Solucion. Como los datos estan agrupados, entonces se utiliza la formula para encontrar cada uno de los
cuartiles, as
Se encuentra la posicion para el primer cuartil,
n
4
=
463
4
= 115,75, esta posicion se encuentra en la
segunda clase, luego
Q
1
= 300 +
115,75 85
90
100 = 300 +
30,75
9
10 = 300 + 34,16 = 334,16
Lo que signica es que el 25 % de los empleados reciben sueldos inferiores a 334,16
La posicion para el tercer cuartil
3n
4
=
3(463)
4
= 347,25, la cual se encuentra en la cuarta clase, as
Q
3
= 500 +
347,25 295
70
100 = 500 +
52,25
7
10 = 500 + 74,64 = 574,64
Esto indica que el 25 % de los empleados reciben sueldos superiores a 574,64
2.2. Deciles
Son 9 valores que distribuyen la serie de datos, ordenada de forma creciente o decreciente, en diez tramos
iguales, en los que cada uno de ellos concentra el 10 % de los resultados.
2
Informacion tomada de http://www.monograas.com/trabajos27/datos-agrupados/datos-agrupados.shtml. Consultada el 6
de abril de 2012
Pag. 9
UNIVERSIDAD DISTRITAL FRANCISCO JOS

E DE CALDAS
Facultad Tecnol ogica
Profesora: Helena Dulcey Hern andez
Electiva No T ecnica Abril, 2012
Para datos no agrupados, siendo N
d
el n umero del decil, se tiene
Cuando n es par
N
d
10
n
Cuando n es impar
N
d
(n + 1)
10
Para datos agrupados los deciles se calculan
D
k
= L
k
+
k
10
n F
A
f
A, k = 1, 2, . . . , 9
donde, L
k
: Lmite infeerior del intervalo que contiene el decil, k : decil a buscar, F
A
: Frecuencia acumulada
anterior al intervalo de clase que contiene el decil, f : Frecuencia del intervalo donde esta el decil, A :
Amplitud del intervalo que contiene el decil
2.3. Percentiles
Son 99 valores que distribuyen la serie de datos, ordenada de forma creciente o decreciente, en cien tramos
iguales, en los que cada uno de ellos concentra el 1 % de los resultados. Por lo general se denotan con la letra
P y el respectivo percentil, por ejemplo P
15
deja por debajo al 15 % de las observaciones y por encima queda
el 85 %
Para datos agrupados en intervalos de clase los percentiles se calculan con la siguiente formula
P
k
= L
k
+
k
n
100
F
A
f
A, k = 1, 2, . . . , 99
Ejemplo 12 De un estudio realizado, se registraron las edades de 15 personas, las cuales se muestran a
continuacion
18 19 19 19 20
20 20 21 21 21
22 22 23 24 24
Calcule el percentil 25, 60 y 90 - P
25
, P
60
, P
90
- e interprete cada resultado obtenido.
Solucion.
1. El P
25
es equivalente a Q
1
, luego
n
4
=
15
4
= 3,75 corresponde al dato que se encuentra en la cuarta
posicion, as Q
1
= 19, esto signica que el 25 % de las personas tienen menos de 19 a nos.
Pag. 10
UNIVERSIDAD DISTRITAL FRANCISCO JOS

E DE CALDAS
Facultad Tecnol ogica
Profesora: Helena Dulcey Hern andez
Electiva No T ecnica Abril, 2012
2. P
60
=
15
100
60 = 9, as hay dos valores que cumplen con la condicion de dejar al menos 9 valores
iguales o inferiores a ellos, los de la posicion 9 y posicion 10, luego P
60
=
x
9
+x
1
0
2
=
21 + 21
2
= 21,
as se concluye que el 40 % de las personas son mayores a 21 a nos.
3. P
90
=
15
100
90 = 13.5, corresponde al dato que se encuentra en la posicion 14, as P
90
= 24, lo que
indica que al menos el 90 % de las personas tienen edades inferiores o iguales a 24 a nos.
3. Diagrama de caja
Los diagramas de cajas y bigotes - tambien llamados boxplots - son representaciones gracas de una dis-
tribucion estadstica unidimensional en las que se reejan cinco parametros: lmite inferior, primer cuartil,
mediana, tercer cuartil y lmite superior. A partir de estos cinco parametros se pueden obtener facilmente
otros dos: rango y el rango intercuartlico. Ademas, tambien dan una medida de la simetra o asimetra de
la distribucion, del sesgo y de la dispersion.
Simetra: Indica la forma del conjunto de datos, lo cual implica observar donde se concentra la informacion.
Para el estudio de la forma de una distribucion, tambien se usan los terminos de sesgo o asimetra. Una
distribucion puede ser
Simetrica: en este tipo de distribuciones la media, la moda y la mediana coinciden y los datos se
distribuyen de igual forma a ambos lados de estas medidas. En el contexto, hay igual n umero de
opciones por encima que por debajo de la mediana.
Asimetrica positiva o sesgada a la derecha: los datos tienden a concentrarse hacia la parte inferior
de la distribucion y se extienden mas hacia la derecha. La media suele ser mayor que la mediana en
estos casos. En el contexto, las opiniones se concentran en un puntaje menor y las de mayor puntaje
estan mas dispersas.
Asimetrica negativa o sesgada a la izquierda: los datos tienden a concentrarse hacia la parte
superior de la distribucion y se extienden mas hacia la izquierda. La media suele ser menor que la
mediana en estos casos. En el contexto, las opiniones se concentran en un puntaje mayor y las de
menor puntaje estan mas dispersas.
Se requieren cinco tipos de datos para construir un diagrama de caja:
1. Valor mnimo o lmite inferior: Es el extremo inferior del bigote. Las opiniones por debajo de este valor
se consideran atpicas.
2. Primer cuartil Q
1
: Por debajo de este valor se encuentra como maximo el 25 % de las opiniones de los
estudiantes.
3. Mediana Q
2
: Coincide con el segundo cuartil. Divide a la distribucion en dos partes iguales. De este
modo, 50 % de las observaciones estan por debajo de la mediana y 50 % esta por encima.
Pag. 11
UNIVERSIDAD DISTRITAL FRANCISCO JOS

E DE CALDAS
Facultad Tecnol ogica
Profesora: Helena Dulcey Hern andez
Electiva No T ecnica Abril, 2012
4. Tercer cuartil Q
3
: Por debajo de este valor se encuentran como maximo el 75 % de las opiniones de los
estudiantes.
5. Valor maximo o lmite superior: Es el extremo superior del bigote. Las opiniones por encima de este
lmite se consideran atpicas.
Los valores atpicos: son aquellas opiniones que estan apartadas del cuerpo principal de datos. Pueden
representar efectos de causas extra nas, opiniones extremas o en el caso de la tabulacion manual, errores de
medicion o registro. Se colocan en la graca con asteriscos (*) o puntos (.) seg un se alejan menos o mas del
conjunto de datos. Se utiliza un superndice numerico para indicar el n umero de veces que aparece ese dato
como atpico
Ejemplo 13 Haga la interpretacion al siguiente boxplot que representa las calicaciones de un grupo de
estudiantes
3
4.5 5 6.5
9
Lmite
Inferior
Q1 Q2 Q3
Lmite
Superior
Solucion. Se observa que
1. El bigote de la izquierda es algo mas corto que el de la derecha, lo que indica que las calicaciones de la
cuarta parte mas baja de la clase estan algo mas concentradas que las calicaciones de la cuarta parte
que las tienen mas altas.
2. La parte izquierda de la caja, que corresponde a los estudiantes que han obtenido calicaciones entre
el 25 % y 50 % es menor que la de la derecha, lo que indica que las calicaciones de estos ultimos
estudiantes estan mas dispersas.
3. El rango esta dado por 9 3 = 6 y el rango intercuartlico es Q
3
Q
1
= 6,5 4,5 = 2
4. La distribucion es asimetrica y ligeramente sesgada hacia la derecha.
Ejemplo 14 Con base en una muestra de 20 entregas, Marcos Pizza se determino la siguiente informacion:
valor mnimo =13 minutos, Q
1
= 15 minutos, mediana = 18 minutos, Q
3
= 22 minutos, valor maximo =
30 minutos. Desarrolle un diagrama de caja para los tiempos de entrega.
3
3
Ejemplo tomado de http://www.cyta.com.ar/biblioteca/bddoc/bdlibros/guia estadistica/modulo 4.htm. Consultado 7 de
Abril de 2012
Pag. 12
UNIVERSIDAD DISTRITAL FRANCISCO JOS

E DE CALDAS
Facultad Tecnol ogica
Profesora: Helena Dulcey Hern andez
Electiva No T ecnica Abril, 2012
Tenga en cuenta las siguientes consideraciones a la hora de interpretar un diagrama de caja
4
1. Mientras mas larga la caja y los bigotes, mas dispersa es la distribucion de datos.
2. La distancia entre las cinco medidas descritas en el boxplot (sin incluir la media aritmetica) puede
variar, sin embargo, recuerde que la cantidad de elementos entre una y otra es aproximadamente la
misma. Entre el lmite inferior y Q
1
hay igual cantidad de opiniones que de Q
1
a la mediana, de esta a
Q
3
y de Q
3
al lmite superior. Se considera aproximado porque pudiera haber valores atpicos, en cuyo
caso la cantidad de elementos se ve levemente modicada.
3. La lnea que representa la mediana indica la simetra. Si esta relativamente en el centro de la caja
la distribucion es simetrica. Si por el contrario se acerca al primer o tercer cuartil, la distribucion
pudiera ser sesgada a la derecha (asimetrica positiva) o sesgada a la izquierda (asimetrica negativa
respectivamente. Esto suele suceder cuando las opiniones de los estudiantes tienden a concentrase mas
hacia un punto de la escala.
4. La mediana puede inclusive coincidir con los cuartiles o con los lmites de los bigotes. Esto sucede
cuando se concentran muchos datos en un mismo punto, en este caso, cuando muchos estudiantes
opinan igual en determinada pregunta. Pudiera ser este un caso particular de una distribucion sesgada
o el caso de una distribucion muy homogenea.
5. Las opiniones emitidas como No aplica (N/A) cuando en realidad s aplica o las opiniones nulas (cuando
el estudiante no opina en una pregunta), no son tomadas en cuenta para elaborar el boxplot de esa
pregunta. Por esta razon encontrara que en ocasiones no hay igual n umero de opiniones para todas las
preguntas.
6. Debe estar atento al n umero de estudiantes que opina en cada pregunta. Lo que pareciera ser dispersion
en los resultados, en ocasiones podra deberse a un tama no de muestra muy peque no: pocos estudiantes
opinaron. Debe ser cauteloso a la hora de interpretar. En estos casos se sugiere remitirse al reporte
numerico.
7. En terminos comparativos, procure identicar aquellas preguntas cuyos boxplot parecen diferir del
resto. Pudiera con esto encontrar fortalezas o debilidades en su actuacion seg un la opinion de los
estudiantes.
BIBLIOGRAF

IA Y CIBERGRAF

IA
1. Devore, Jay Probabilidad y estadstica para ingeniera y ciencias
2. http://www.eumed.net/libros/2007a/239
3. http://www.cyta.com.ar/biblioteca/bddoc/bdlibros/guia estadistica/modulo 3.htm
4. http://www.monograas.com/trabajos27/datos-agrupados/datos-agrupados.shtml#cuartiles
4
Informacion tomada de http://www.cesma.usb.ve/ npena/estadistica 1/BOXPLOT-ayudaenlinea4.htm
Pag. 13

You might also like