Professional Documents
Culture Documents
Estadística Estadística Aplicada Estadística Aplicada Al Turismo
Estadística Estadística Aplicada Estadística Aplicada Al Turismo
Estadística
Estadística Aplicada
Estadística Aplicada al
Turismo
Integrantes de la cátedra
Silvina Etcheverría
Mario Seffino
Lucas Corrales
Estadística – Cursada 2020
Indicadores de posición
En este caso podemos visualizar los datos como fueron informados (pero los ordenamos):
0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 1 1 1 1
1 1 1 1 1 1 1 2 2 2 2 2 2 2 2 2 2 2 3 3
3 3 3 3 3 4 4 4 4 4 4 4 4 5 5 5 5 5 6 6
O visualizarlos desde la tabla de distribución de frecuencias
X: Número de hijos fi fi↑
0 15 15
1 12 27
2 11 38
3 7 45
4 8 53
5 5 58
6 2 60
Total 60 60
MODA:
Mo = 0 hijos. Interpretación: El grupo más numerosos es el de las personas sin hijos.
MEDIANA:
Calculamos primero la posición de la mediana: (60+1)/2 = 30,5. Esto significa que la mediana se encuentra
entre la 30° y 31° posición. Como en este caso en ambos lugares hay un 2, la mediana es me = 2
Interpretación: La mitad de los empleados de la empresa tienen 2 hijos o menos y la otra mitad 2 hijos o
más.
2
Estadística – Cursada 2020
AMBAS OPCIONES SON CORRECTAS.
MEDIA ARITMÉTICA
Indicadores de dispersión
Recorrido: 6 – 0 = 6 hijos
Recorrido Intercuartílico: 3,5 = 0,5 hijos (usando las opciones 1 para los cuartiles)
(0−2,06)2 .15+ (1−2,06)2 .12+ (2−2,06)2 .11+(3−2,06)2 .7+(4−2,06)2 .8 + (5−2,06)2 .5+ (6−2,06)2 .2
Varianza: = 3,128 hijos
60
al cuadrado
Desvío estándar: √𝑣𝑎𝑟𝑖𝑎𝑛𝑧𝑎 = √3,128 ≅ 1,77 hijos. Interpretación: En promedio los valores de la variable
se alejan 1,77 hijos de la media aritmética.
1.77
Coeficiente de variación: x 100 = 85,9 %. Debido a que es un valor alto se dice que la media aritmética
2.06
NO ES REPRESENTATIVA del conjunto de datos.
3) Dados los siguientes datos: 1 2 1 3 4 5 2 1 1000 3 2. ¿Con qué indicadores de posición representaría
estos datos y con cuáles no? ¿Por qué?
Se puede observar un valor extremo (1000). Por esta razón no es recomendable usar la media aritmética.
Si la calculamos y la acompañamos por sus correspondientes indicadores de dispersión encontraríamos
que la media aritmética no es representativa del conjunto de datos.
La moda es posible usarla (es bimodal) pero siendo cuantitativa se puede calcular la mediana. Para ello
se deben ordenar los datos:
1 1 1 2 2 2 3 3 4 5 6 1000
Luego identificar la posición de la mediana:
Pos me = (12 +1) /2 = 6,5
La mediana es el promedio entre la sexta y la séptima observación:
me = (2+3) /2 = 2,5
4) Sin calcular indique qué ocurriría con los valores de la media, la mediana y el desvío estándar de los datos
del ejercicio 3 si se reemplaza el valor 1000 por un 6.
La media aritmética disminuiría.
Las modas (son dos) serían iguales.
3
Estadística – Cursada 2020
La mediana sería la misma.
5) Un vendedor viajante hizo cinco viajes durante los meses de junio y julio. El número de días y el valor de
las ventas de cada viaje son los siguientes:
Viaje Número de días Valor de las ventas Ventas por día
1 3 $300 $100
2 7 $1540 $220
3 10 $2000 $200
4 5 $400 $80
5 10 $2250 $225
Totales 35 $6490 $825
El gerente de ventas criticó la actuación del vendedor porque sus ventas medias por día sólo ascendieron
a $165. Pero el vendedor arguyó que el gerente de ventas estaba equivocado porque sus ventas medias
por día fueron $185,43. ¿Cómo obtuvo las ventas medias por día? ¿De quién es el promedio correcto?
Es importante entender que, aunque en la tabla las columnas estén desordenadas, la variable es Ventas
por día (última columna) y el Número de días es la frecuencia absoluta. Teniendo en cuenta esto el
cálculo correcto es el del vendedor ya que el gerente promedió los valores de variable sin tener en
cuenta la frecuencia de cada observación.
6) Los datos del Ejercicio 12 del Práctico 2 corresponden a 80 mediciones de la emisión diaria de óxido de
azufre en una planta industrial. Los indicadores de posición y dispersión para los datos, sin agrupar, son
los siguientes:
Desvío
Media Mediana Cuartil 1 Cuartil 3 Varianza Xmin Xmáx
Estándar
18,896 19,050 14,825 22,975 31.99 5,656 6,2 31,8
En base a los indicadores presentados, contestar las siguientes preguntas:
a) ¿Cuál es la emisión diaria promedio de óxido de azufre? ¿Qué indicador utiliza?
18,896 toneladas diarias
b) ¿Entre qué valores se encuentra el primer 50% de la emisión diaria de óxido de azufre? ¿Qué
indicador utiliza?
El primer 50% de emisiones se encuentra entre 6,2 (Xmin) y 19,050 (Mediana)
c) ¿Entre qué valores se encuentra el 50% central de la emisión diaria de óxido de azufre? ¿Qué
indicador utiliza?
El 50 % central se encuentra entre 14,825 (Q1) y 22,975 (Q3)
d) ¿Entre qué valores se encuentra el último 25% de la emisión diaria de óxido de azufre? ¿Qué
indicador utiliza?
El último 25% de emisiones se encuentra entre 22,975 (Q3) y 31,8 (Xmáx)
e) ¿Qué procedimiento seguiría si tuviera que responder a lo siguiente: ¿entre qué valores se encuentra
el primer 40% de la emisión diaria de óxido de azufre?
SE debería calcular el Decil 4 (o percentil 40). El procedimiento es similar al utilizado para calcular la
mediana y los cuartiles:
Ordenar los datos de menor a mayor.
4
Estadística – Cursada 2020
Hallar la posición del indicador: en este caso pos D4 = 4 . (N+1)/10 = 4 . 81/10 = 32,4
Hallar el valor de variable que se encuentra en esa posición. En este caso deberíamos
identificar la observación 32° y 33° y promediarlas. No se pide que lo hagan pero si quisieran
hacerlo el valor es : D4 = (17,9 + 18)/2 = 17,95
f) ¿Qué indica en este caso el recorrido intercuartílico?
Indica la amplitud del intervalo que contiene al 50% central de las observaciones. En este caso
RI = 22,975 - 14,825 = 8,15
g) ¿Qué indica la desviación estándar?
Indica que en promedio los datos se alejan de la media aritmética 5,656 toneladas.
h) ¿La media es representativa del conjunto de datos? Justificar.
Para responder a esta pregunta se debe calcular el
CV = desvío/media x 100% = 5,656/18,896 x 100% = 29,93%.
Es un valor relativamente bajo. Razón por la cual se puede decir que la media es representativa del
conjunto de datos.
i) Si estas medidas se hubieran calculado teniendo en cuenta los datos agrupados, ¿los resultados
hubieran sido los mismos? En caso de que no sea así, ¿cuáles son los resultados más exactos y por
qué?
Al usar intervalos de clase se pierde exactitud. Por lo tanto los indicadores son una aproximación de
los reales. Hay más precisión si se usan los datos sin agrupar.
7) Para el Ejercicios 9 del Práctico 2:
a) Calcular todos los indicadores de posición y dispersión posibles e interpretarlos.
b) Si los datos se hubieran organizado en 2 intervalos de clase, las medidas calculadas darían otros
resultados. Lo mismo hubiera sucedido si se hubieran organizado en 30 intervalos. ¿Qué conclusiones
puede sacar de esto?, ¿qué cantidad de intervalos estima que es más adecuada y por qué?
La resolución de este ejercicio está hecha con sumo detalle en el otro archivo subido.
8) En cinco pruebas, un estudiante promedió 63.2 con una desviación estándar de 3.3, mientras que otro
promedió 78.8 con una desviación estándar de 5.3. ¿Cuál alumno es relativamente más consistente?
Justificar la respuesta.
Para responder calculamos los coeficientes de variación de ambos estudiantes:
CV 1 = 3.3/63.2 x 100% = 5.22%
CV 2 = 5.3/78.8 x 100% = 6.73%
Se considera más consistente quien presente menor variabilidad, es decir el de menos coeficiente de
variación.
9) Dada la siguiente distribución: 15 20 28 28 29 30 35 42 45. Sin realizar los cálculos, ¿es posible que la
mediana de la distribución sea 5? Imposible. Los indicadores de posición deben estar comprendidos
dentro del rango de valores de la variable.
¿Puede ser que el desvío tenga un valor mayor a 200? Justifique ambas respuestas. Observemos que el
rango de la distribución es 45 – 12 = 33. Esto quiere decir que la mayor distancia entre dos datos es 33
unidades. Por lo tanto el desvío (que indica cuánto se alejan en promedio los datos de la media
aritmética) no puede tomar un valor mayor a ese.
10) Si la varianza de una distribución es 0, ¿qué puede decir de la distribución?
Significa que todos los datos son iguales.
11) En un país A la renta per cápita es de 1000 dólares/año, con una desviación de 125. En un país B, es de
1000 dólares/año pero la desviación es de 560. Sólo con estos datos y tomando como criterio que el
aumento de la clase media es una característica de los países en vías de desarrollo, se puede afirmar
que...(indicar V o F en cada caso)
Notemos que en ambos países el ingreso promedio per cápita es el mismo pero tienen diferentes desvíos.
Un país con alto desvío indica valores alejados de la media y, por lo tanto, advierte la presencia de valores
5
Estadística – Cursada 2020
extremos (distribución heterogénea de ingresos). Por el contrario si el desvío es bajo indica que los
valores se concentra en torno de a media y, por tanto, hay menos diferencia de clases.
Noten que por tener el mismo valor de media solamente analizamos el desvío estándar. Si no fuese así
se debería hacer el análisis en base a los coeficientes de variación (CV).
a) A es un país más desarrollado que B. V
b) B es un país más desarrollado que A. F
c) Son dos países de un nivel similar. F
d) Los datos del enunciado no nos informan acerca del desarrollo. F
12) La edad de los estudiantes regulares que acuden a un cierto curso en los turnos matutino y vespertino
del nivel licenciatura de la Universidad Central se describe a continuación:
Turno matutino 23 29 27 22 24 21 25 26 27 24
Turno vespertino 27 34 30 29 28 30 34 35 28 29
c) Si recibieras una propuesta para trabajar en alguna de estas 3 plantas y te aseguraran que vas a estar
entre el 50% de los que menos cobran, ¿en qué planta elegirías trabajar y por qué?
d) Si recibieras una propuesta para trabajar en alguna de estas 3 plantas y te aseguraran que vas a estar
entre el 25% de los que más cobran, ¿en qué planta elegirías trabajar y por qué?
e) ¿En cuál de las 3 plantas se observa una menor variabilidad de salarios (con respecto a la media)?
Justificar.
f) ¿En cuál o cuáles de las 3 plantas de fabricación de automóviles el salario promedio no es
representativo de los salarios de los 50 empleados? En ese caso, ¿con qué indicadores resumirías la
información? Justificar.
6
Estadística – Cursada 2020
14) El gerente de una empresa tiene asignado un sueldo de $18700 mensuales. Los salarios de los empleados
son los que figuran en la siguiente tabla:
1800 1950 3090 3710 3690 1890 1920 4920 4290
5250 3660 1830 2160 4010 3990 7950 8850 2270
a) Indicar la variable y el tipo de la misma.
Variable: Salario. Cuantitativa
b) ¿Cuál es el salario promedio de todos los que trabajan en la empresa?
$ 4522,63 (incluido el sueldo del gerente)
c) Calcular los cuartiles e interpretar el resultado.
Me= 3690 Q1 = 1950 Q3= 4920
El 25% de quienes trabajan en la empresa tienen un salario menor o igual a $1950.
El 75% de quienes trabajan en la empresa tienen un salario menor o igual a $4920.
d) Realizar el box-plot y extraer conclusiones.
e) Calcular la desviación estándar e interpretar el resultado.
σ = 3856,3
f) ¿Es el promedio representativo del conjunto de datos? Justificar.
CV = 3856,3/4522,6 = 85,27%. Esto implica que la media no es representativa del conjunto de datos.
La razón de que el desvío sea tan alto tiene que ver con incluir el sueldo del gerente.
g) En las situaciones que se presentan en los incisos siguientes indicar cómo varían la media, la mediana
y el desvío.
i) Si se decide aumentar el salario de cada uno en 700 pesos.
ii) Si se disminuye el sueldo del gerente en $1000.
iii) Si no se tuviera en cuenta el salario del gerente.
iv) Si los sueldos aumentan un 10%.