You are on page 1of 7

Resolución práctico 3 - 2020

Estadística
Estadística Aplicada
Estadística Aplicada al
Turismo

Integrantes de la cátedra
Silvina Etcheverría
Mario Seffino
Lucas Corrales
Estadística – Cursada 2020

Práctico 3: INDICADORES DE POSICIÓN Y DE DISPERSIÓN


1) Para el Ejercicio 1 del Práctico 2:
a) Calcular todos los indicadores de posición y dispersión posibles.
b) Interpretar el significado de todas las medidas calculadas.
c) Justificar cuáles son las medidas que no se pueden hallar.
Como la variables es cualitativa de escala nominal solamente se puede calcular la moda, que en este
caso es: mo = Económicas (ya que es la categoría con mayor frecuencia).
La mediana no puede calcularse ya que para ello es necesario ordenar los datos y una variable
cualitativa nominal no permite ordenar las observaciones.
El resto de las medidas requieren que las observaciones sean números ya que utiliza operaciones
matemáticas.
2) Calcular todos los indicadores de posición y dispersión del Ejercicio 7 del Práctico 2. Interpretar el
significado de cada una de ellas.

Indicadores de posición
En este caso podemos visualizar los datos como fueron informados (pero los ordenamos):
0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 1 1 1 1
1 1 1 1 1 1 1 2 2 2 2 2 2 2 2 2 2 2 3 3
3 3 3 3 3 4 4 4 4 4 4 4 4 5 5 5 5 5 6 6
O visualizarlos desde la tabla de distribución de frecuencias
X: Número de hijos fi fi↑
0 15 15
1 12 27
2 11 38
3 7 45
4 8 53
5 5 58
6 2 60
Total 60 60
MODA:
Mo = 0 hijos. Interpretación: El grupo más numerosos es el de las personas sin hijos.

MEDIANA:
Calculamos primero la posición de la mediana: (60+1)/2 = 30,5. Esto significa que la mediana se encuentra
entre la 30° y 31° posición. Como en este caso en ambos lugares hay un 2, la mediana es me = 2
Interpretación: La mitad de los empleados de la empresa tienen 2 hijos o menos y la otra mitad 2 hijos o
más.

Cuartil 1: identificamos la posición del Q1. (60 + 1) /4 = 15,25.


Opción 1: Esto significa que el cuartil 1 se encuentra entre la observación 15 y la 16. Por lo tanto, en este
caso será el promedio entre 0 y 1. Q1 = 0,5 hijos.
Interpretación: El 25 % de los empleados de la empresa tienen 0,5 hijos o menos y el 75 % tiene 0,5 hijos o
más.
Opción 2: Se puede redondear el valor de la posición a 154. Por lo tanto, el cuartil 1 es la cuarta observación.
Q1 = 0 hijos.
Interpretación: El 25 % de los empleados de la empresa tienen 0 hijos o menos y el 75 % tiene 0 hijos o más.

2
Estadística – Cursada 2020
AMBAS OPCIONES SON CORRECTAS.

Cuartil 3: identificamos la posición del Q3. (60 + 1). 3 /4 = 45,75.


Opción 1: Esto significa que el cuartil 3 se encuentra entre la 45° y 46° observación. Por lo tanto en este
caso será el promedio entre 3 y 4. Q3 = 3,5 hijos.
Interpretación: El 75 % de los empleados de la empresa tienen 3,5 hijos o menos y el 25 % tiene 3,5 hijos o
más.
Opción 2: Se puede redondear el valor de la posición a 46. Por lo tanto el cuartil 3 es la observación número
46. Q3 = 4 hijos.
Interpretación: El 75 % de los empleados de la empresa tienen 4 hijos o menos y el 25 % tiene 4 hijos o más.
AMBAS OPCIONES SON CORRECTAS.

MEDIA ARITMÉTICA

0 .15+1 .12+2 .11+3 .7+4 .8+5 .5+6 .2


μ= = 2,06 hijos.
60
Interpretación: Los empleados de la empresa tienen en promedio 2,06 hijos cada uno.

Indicadores de dispersión
Recorrido: 6 – 0 = 6 hijos
Recorrido Intercuartílico: 3,5 = 0,5 hijos (usando las opciones 1 para los cuartiles)
(0−2,06)2 .15+ (1−2,06)2 .12+ (2−2,06)2 .11+(3−2,06)2 .7+(4−2,06)2 .8 + (5−2,06)2 .5+ (6−2,06)2 .2
Varianza: = 3,128 hijos
60
al cuadrado
Desvío estándar: √𝑣𝑎𝑟𝑖𝑎𝑛𝑧𝑎 = √3,128 ≅ 1,77 hijos. Interpretación: En promedio los valores de la variable
se alejan 1,77 hijos de la media aritmética.
1.77
Coeficiente de variación: x 100 = 85,9 %. Debido a que es un valor alto se dice que la media aritmética
2.06
NO ES REPRESENTATIVA del conjunto de datos.

3) Dados los siguientes datos: 1 2 1 3 4 5 2 1 1000 3 2. ¿Con qué indicadores de posición representaría
estos datos y con cuáles no? ¿Por qué?
Se puede observar un valor extremo (1000). Por esta razón no es recomendable usar la media aritmética.
Si la calculamos y la acompañamos por sus correspondientes indicadores de dispersión encontraríamos
que la media aritmética no es representativa del conjunto de datos.
La moda es posible usarla (es bimodal) pero siendo cuantitativa se puede calcular la mediana. Para ello
se deben ordenar los datos:
1 1 1 2 2 2 3 3 4 5 6 1000
Luego identificar la posición de la mediana:
Pos me = (12 +1) /2 = 6,5
La mediana es el promedio entre la sexta y la séptima observación:
me = (2+3) /2 = 2,5
4) Sin calcular indique qué ocurriría con los valores de la media, la mediana y el desvío estándar de los datos
del ejercicio 3 si se reemplaza el valor 1000 por un 6.
La media aritmética disminuiría.
Las modas (son dos) serían iguales.

3
Estadística – Cursada 2020
La mediana sería la misma.
5) Un vendedor viajante hizo cinco viajes durante los meses de junio y julio. El número de días y el valor de
las ventas de cada viaje son los siguientes:
Viaje Número de días Valor de las ventas Ventas por día
1 3 $300 $100
2 7 $1540 $220
3 10 $2000 $200
4 5 $400 $80
5 10 $2250 $225
Totales 35 $6490 $825

El gerente de ventas criticó la actuación del vendedor porque sus ventas medias por día sólo ascendieron
a $165. Pero el vendedor arguyó que el gerente de ventas estaba equivocado porque sus ventas medias
por día fueron $185,43. ¿Cómo obtuvo las ventas medias por día? ¿De quién es el promedio correcto?

Cálculo del vendedor :


μ = (100. 3 + 220. 7 + 200. 10 + 80 . 5 + 225. 10 ) /35 = Cálculo del gerente :
$185,43 μ = (100 + 220 + 200 + 80 + 225 ) /5 = $165

Es importante entender que, aunque en la tabla las columnas estén desordenadas, la variable es Ventas
por día (última columna) y el Número de días es la frecuencia absoluta. Teniendo en cuenta esto el
cálculo correcto es el del vendedor ya que el gerente promedió los valores de variable sin tener en
cuenta la frecuencia de cada observación.

6) Los datos del Ejercicio 12 del Práctico 2 corresponden a 80 mediciones de la emisión diaria de óxido de
azufre en una planta industrial. Los indicadores de posición y dispersión para los datos, sin agrupar, son
los siguientes:
Desvío
Media Mediana Cuartil 1 Cuartil 3 Varianza Xmin Xmáx
Estándar
18,896 19,050 14,825 22,975 31.99 5,656 6,2 31,8
En base a los indicadores presentados, contestar las siguientes preguntas:
a) ¿Cuál es la emisión diaria promedio de óxido de azufre? ¿Qué indicador utiliza?
18,896 toneladas diarias
b) ¿Entre qué valores se encuentra el primer 50% de la emisión diaria de óxido de azufre? ¿Qué
indicador utiliza?
El primer 50% de emisiones se encuentra entre 6,2 (Xmin) y 19,050 (Mediana)
c) ¿Entre qué valores se encuentra el 50% central de la emisión diaria de óxido de azufre? ¿Qué
indicador utiliza?
El 50 % central se encuentra entre 14,825 (Q1) y 22,975 (Q3)
d) ¿Entre qué valores se encuentra el último 25% de la emisión diaria de óxido de azufre? ¿Qué
indicador utiliza?
El último 25% de emisiones se encuentra entre 22,975 (Q3) y 31,8 (Xmáx)
e) ¿Qué procedimiento seguiría si tuviera que responder a lo siguiente: ¿entre qué valores se encuentra
el primer 40% de la emisión diaria de óxido de azufre?
SE debería calcular el Decil 4 (o percentil 40). El procedimiento es similar al utilizado para calcular la
mediana y los cuartiles:
 Ordenar los datos de menor a mayor.

4
Estadística – Cursada 2020
 Hallar la posición del indicador: en este caso pos D4 = 4 . (N+1)/10 = 4 . 81/10 = 32,4
 Hallar el valor de variable que se encuentra en esa posición. En este caso deberíamos
identificar la observación 32° y 33° y promediarlas. No se pide que lo hagan pero si quisieran
hacerlo el valor es : D4 = (17,9 + 18)/2 = 17,95
f) ¿Qué indica en este caso el recorrido intercuartílico?
Indica la amplitud del intervalo que contiene al 50% central de las observaciones. En este caso
RI = 22,975 - 14,825 = 8,15
g) ¿Qué indica la desviación estándar?
Indica que en promedio los datos se alejan de la media aritmética 5,656 toneladas.
h) ¿La media es representativa del conjunto de datos? Justificar.
Para responder a esta pregunta se debe calcular el
CV = desvío/media x 100% = 5,656/18,896 x 100% = 29,93%.
Es un valor relativamente bajo. Razón por la cual se puede decir que la media es representativa del
conjunto de datos.
i) Si estas medidas se hubieran calculado teniendo en cuenta los datos agrupados, ¿los resultados
hubieran sido los mismos? En caso de que no sea así, ¿cuáles son los resultados más exactos y por
qué?
Al usar intervalos de clase se pierde exactitud. Por lo tanto los indicadores son una aproximación de
los reales. Hay más precisión si se usan los datos sin agrupar.
7) Para el Ejercicios 9 del Práctico 2:
a) Calcular todos los indicadores de posición y dispersión posibles e interpretarlos.
b) Si los datos se hubieran organizado en 2 intervalos de clase, las medidas calculadas darían otros
resultados. Lo mismo hubiera sucedido si se hubieran organizado en 30 intervalos. ¿Qué conclusiones
puede sacar de esto?, ¿qué cantidad de intervalos estima que es más adecuada y por qué?
La resolución de este ejercicio está hecha con sumo detalle en el otro archivo subido.
8) En cinco pruebas, un estudiante promedió 63.2 con una desviación estándar de 3.3, mientras que otro
promedió 78.8 con una desviación estándar de 5.3. ¿Cuál alumno es relativamente más consistente?
Justificar la respuesta.
Para responder calculamos los coeficientes de variación de ambos estudiantes:
CV 1 = 3.3/63.2 x 100% = 5.22%
CV 2 = 5.3/78.8 x 100% = 6.73%
Se considera más consistente quien presente menor variabilidad, es decir el de menos coeficiente de
variación.
9) Dada la siguiente distribución: 15 20 28 28 29 30 35 42 45. Sin realizar los cálculos, ¿es posible que la
mediana de la distribución sea 5? Imposible. Los indicadores de posición deben estar comprendidos
dentro del rango de valores de la variable.
¿Puede ser que el desvío tenga un valor mayor a 200? Justifique ambas respuestas. Observemos que el
rango de la distribución es 45 – 12 = 33. Esto quiere decir que la mayor distancia entre dos datos es 33
unidades. Por lo tanto el desvío (que indica cuánto se alejan en promedio los datos de la media
aritmética) no puede tomar un valor mayor a ese.
10) Si la varianza de una distribución es 0, ¿qué puede decir de la distribución?
Significa que todos los datos son iguales.
11) En un país A la renta per cápita es de 1000 dólares/año, con una desviación de 125. En un país B, es de
1000 dólares/año pero la desviación es de 560. Sólo con estos datos y tomando como criterio que el
aumento de la clase media es una característica de los países en vías de desarrollo, se puede afirmar
que...(indicar V o F en cada caso)
Notemos que en ambos países el ingreso promedio per cápita es el mismo pero tienen diferentes desvíos.
Un país con alto desvío indica valores alejados de la media y, por lo tanto, advierte la presencia de valores

5
Estadística – Cursada 2020
extremos (distribución heterogénea de ingresos). Por el contrario si el desvío es bajo indica que los
valores se concentra en torno de a media y, por tanto, hay menos diferencia de clases.
Noten que por tener el mismo valor de media solamente analizamos el desvío estándar. Si no fuese así
se debería hacer el análisis en base a los coeficientes de variación (CV).
a) A es un país más desarrollado que B. V
b) B es un país más desarrollado que A. F
c) Son dos países de un nivel similar. F
d) Los datos del enunciado no nos informan acerca del desarrollo. F
12) La edad de los estudiantes regulares que acuden a un cierto curso en los turnos matutino y vespertino
del nivel licenciatura de la Universidad Central se describe a continuación:

Turno matutino 23 29 27 22 24 21 25 26 27 24
Turno vespertino 27 34 30 29 28 30 34 35 28 29

Si la homogeneidad de la clase es un factor positivo en el aprendizaje, utilice una medida de variabilidad


relativa para sugerir en cuál de los dos grupos el proceso de aprendizaje sería más fluido.
Se deben calcular ambos CV. Para ello primeramente s debe hallar media y desvío de cada turno.
μ σ CV
Turno Matutino 24,8 2,35796522 9,508%
Turno Vespertino 30,4 2,72763634 8,972%
El turno vespertino presenta menor variabilidad y, teniendo en cuenta el criterio adoptado, es el
turno en el que se observa mayor fluidez de aprendizaje.
13) En una ciudad existen 3 grandes plantas de fabricación de automóviles (A, B y C) con 50 empleados cada
una. En cada una de estas plantas se registró el salario de cada uno de los empleados. En la tabla
siguiente, se muestran los valores de los indicadores de posición y dispersión calculados para cada
conjunto de datos:
Valor Valor Desviación
Media Mediana Cuartil 1 Cuartil 3 N
mínimo máximo estándar
A $ 550 $ 510 $ 505 $ 515 $ 500 $ 2500 $ 280 50
B $ 1200 $ 1000 $ 800 $ 1500 $ 500 $ 2500 $ 500 50
C $ 1300 $ 600 $ 550 $ 2400 $ 500 $ 2500 $ 900 50
a) Realizar un box-plot para los ingresos de cada una de las plantas de automóviles. Compararlos y sacar
conclusiones.
b) ¿Qué aspecto tendrían los histogramas y polígonos de frecuencias correspondientes?
Para resolver este inciso tengan presente que con los datos no van a poder reconstruir en forma
perfecta la distribución de frecuencias. Y, por lo tanto, no se van a poder realizar polígonos de
frecuencias perfectos. La idea es pensar en qué “forma” tendría el polígono para que sea coherente
con su correspondiente box-plot. Consideren que si la caja del box-plot está hacia la izquierda, el
punto máximo del polígono también debería ubicarse en esa zona.

c) Si recibieras una propuesta para trabajar en alguna de estas 3 plantas y te aseguraran que vas a estar
entre el 50% de los que menos cobran, ¿en qué planta elegirías trabajar y por qué?
d) Si recibieras una propuesta para trabajar en alguna de estas 3 plantas y te aseguraran que vas a estar
entre el 25% de los que más cobran, ¿en qué planta elegirías trabajar y por qué?
e) ¿En cuál de las 3 plantas se observa una menor variabilidad de salarios (con respecto a la media)?
Justificar.
f) ¿En cuál o cuáles de las 3 plantas de fabricación de automóviles el salario promedio no es
representativo de los salarios de los 50 empleados? En ese caso, ¿con qué indicadores resumirías la
información? Justificar.

6
Estadística – Cursada 2020
14) El gerente de una empresa tiene asignado un sueldo de $18700 mensuales. Los salarios de los empleados
son los que figuran en la siguiente tabla:
1800 1950 3090 3710 3690 1890 1920 4920 4290
5250 3660 1830 2160 4010 3990 7950 8850 2270
a) Indicar la variable y el tipo de la misma.
Variable: Salario. Cuantitativa
b) ¿Cuál es el salario promedio de todos los que trabajan en la empresa?
$ 4522,63 (incluido el sueldo del gerente)
c) Calcular los cuartiles e interpretar el resultado.
Me= 3690 Q1 = 1950 Q3= 4920
El 25% de quienes trabajan en la empresa tienen un salario menor o igual a $1950.
El 75% de quienes trabajan en la empresa tienen un salario menor o igual a $4920.
d) Realizar el box-plot y extraer conclusiones.
e) Calcular la desviación estándar e interpretar el resultado.
σ = 3856,3
f) ¿Es el promedio representativo del conjunto de datos? Justificar.
CV = 3856,3/4522,6 = 85,27%. Esto implica que la media no es representativa del conjunto de datos.
La razón de que el desvío sea tan alto tiene que ver con incluir el sueldo del gerente.
g) En las situaciones que se presentan en los incisos siguientes indicar cómo varían la media, la mediana
y el desvío.
i) Si se decide aumentar el salario de cada uno en 700 pesos.
ii) Si se disminuye el sueldo del gerente en $1000.
iii) Si no se tuviera en cuenta el salario del gerente.
iv) Si los sueldos aumentan un 10%.

Inciso Media Mediana Desvío


i) Aumenta $700 Aumenta $700 Queda igual
ii) Disminuye Queda igual Disminuye
iii) Disminuye Se corre a la novena Disminuye
observación
iv) Aumenta Aumenta Aumenta

You might also like