You are on page 1of 8

TALLER

Los siguientes datos corresponden a una muestra aleatoria simple de tamaño n = 100
seleccionadas de los N = 365 días de las ventas (en millones) de un supermercado de la
ciudad, los datos se muestra en la tabla siguiente:

78 113 94 101 87 88 75 87 110 92 100 116 102 105 89 104 111 93 114 95
107 117 109 117 100 104 127 112 120 117 108 121 126 127 124 106 127 120 121 118
108 124 128 135 131 114 128 122 129 119 126 131 129 138 139 121 129 128 129 126
129 136 130 140 140 124 130 141 130 135 137 143 132 141 143 133 137 143 138 140
139 144 146 153 146 135 142 151 142 147 142 146 149 175 155 135 167 151 147 152

1. Encuentre las clases para el conjunto de datos anteriores, si se sabe que la primera
clase tiene como límite inferior 75 y la longitud de cada clase es c=10

2. Hallar las frecuencias absolutas y acumuladas en cada clase

3. Que interpretación se le da a las frecuencias absolutas y acumuladas en cada clase

4. Hallar los limites reales de cada clase y sus marcas de clase e interprete

5. Que porcentajes de días al año tienen ventas superiores a $ 140.000.000 (ciento


cuarenta millones de pesos)

6. Que porcentajes de días tiene ventas superiores o iguales a $173.000.000 y


superiores o iguales a $108.000.000

7. Construir el histograma de frecuencias, polígono de frecuencias y ojiva e indicar cuál


debe ser el perfil de la población

8. Calcular la media, mediana y moda e intérprete sus significados en términos


poblacionales

9. Calcular el rango, varianza, desviación estándar, desviación media y desviación


mediana e intérprete sus significados

10. Calcular todos los deciles y cuartiles de la distribución de frecuencias

11. Calcular el recorrido interdecil y el recorrido intercuantil e interprete


SOLUCION

1. Las clases son:

75 - 85, 86 – 96, 97 – 107, 108 – 118, 119 – 129, 130 – 140, 141 – 151, 152 – 162,
163 – 173, 164 – 184.

2. Las frecuencias están en la siguiente tabla:

Clase Frecuencia Frecuencia f/100 F/100


acumulada
75 – 85 2 2 0.02 0.02
86 – 96 8 10 0.08 0.1
97 – 107 9 19 0.09 0.19
108 – 118 14 33 0.14 0.33
119 – 129 24 57 0.24 0.57
130 – 140 21 78 0.21 0.78
141 – 151 7 85 0.07 0.85
152 – 162 13 98 0.13 0.98
163 – 173 1 99 0.01 0.99
174 - 184 1 100 0.01 1

3. Las frecuencias absolutas y acumuladas de cada clase proporcionan mucha más


información a simple vista que los datos originales, estos indican en un conjunto
de datos cuales se repiten más que otros, podríamos preguntarnos porcentajes de
días al año que se gana cierto valor o más o menos, cuanto es el promedio que se
gana en el año el supermercado, etc.

4. Límite inferior real de clase = (límite superior de la clase anterior + límite inferior de
la clase) / 2

Límite superior de clase = (límite superior de la clase + límite inferior de la clase


anterior) / 2

Marca de clase = (límite superior real de la clase) + (límite inferior real de la clase)/2
Límite inferior Límite superior Límite inferior Límite superior Marcas de clase
real real
75 85 74.5 85.5 80
86 96 85.5 96.5 91
97 107 96.5 107.5 102
108 118 107.5 118.5 113
119 129 118.5 129.5 124
130 140 129.5 140.5 135
141 151 140.5 151.5 146
152 162 151.5 162.5 157
163 173 162.5 173.5 168
174 184 173.5 184.5 179

5. Para saber el porcentaje de días que tienen ventas superiores a $140.000.000, se


suman las frecuencias mayores a 140, esto es sumar 7% + 13% + 1% + 1% que
suma 22%

6. Para saber el porcentaje de las ventas superiores o iguales a $173.000.000, se


debe sumar las frecuencias mayores o iguales a 173, esto es sumar 1% + 1 %
que suma 2%.

Para saber el porcentaje de las ventas superiores o iguales a $108.000.000, se


debe sumar las frecuencias mayores o iguales a 108, esto es sumar 14% + 24% +
21% + 7% + 13% + 1% + 1% lo que suma 81%

8. La media se calcula con la siguiente fórmula:

=1/100 [ 80(2) + 91(8) + 102 (9) + 113(14) + 124(24)


+ 135(21) + 146(7) + 157(13) + 168(1) + 179(1)] =
126.09

La mediana se calcula según la siguiente fórmula:

= 118.5 + [(100/2 – 33) /24]*11 = 126.29


La moda se calcula con la siguiente fórmula:

= 118.5+ (3 / 13) x 11 = 121.03

La media es una medida apropiada de tendencia central para muchos conjuntos de datos,
sin embargo dado que todas las mediciones que se emplean para su cálculo, el valor de
la media puede afectarse por la existencia de algunos valores externos.

La mediana es un valor que se basa en la secuencia ordenada de las n mediciones, es


necesario saber que la existencia de valores extremos y agregados muy altos de
observaciones, no afecta su valor, en este sentido la mediana es mejor que la media.
Generalmente los conjuntos de datos que describen información de ingresos caen en esta
categoría.

En muchas ocasiones en una serie de datos puede ocurrir más de una observación con la
misma frecuencia. Este caso se dice que la distribución de frecuencias es multimodal.
Como en todos los aspectos de la vida, el azar puede desempeñar un papel importante en
la organización de un conjunto de mediciones. En ocasiones el azar hace que un solo
elemento no representativo se repita lo suficiente para ser el valor más frecuente del
conjunto de mediciones. Es por esta razón que rara vez se utilice la moda de un conjunto
de datos no agrupados como medida de tendencia central

9. El rango es igual al límite real superior de la última clase menos el limite real
inferior de la primera clase, es decir

R=184.5 – 74.5 = 110

La varianza se da por la siguiente fórmula:

La desviación estándar por la siguiente fórmula:

La desviación media por la siguiente fórmula:


La desviación mediana por la siguiente fórmula:

Sabiendo que la media es 126.09 y la mediana es 126.29

Xi Fi Xi^2Fi |Xi - X̅ |Fi |Xi – X̃|Fi


80 2 12 800 92.18 92.58
91 8 66 248 280.72 282.32
102 9 93 636 216.81 218.61
113 14 178 766 183.26 186.06
124 24 369 024 50.16 54.96
135 21 382 725 187.11 182.91
146 7 149 212 139.37 137.97
157 3 73 947 92.73 92.13
168 1 28 224 41.91 41.71
179 1 32 041 52.91 52.71
Total 100 1 386 623 1 337.16 1 341.96

La varianza es: 1/(100-1)[ 1 386 623 – 1 589 868.81] = 2052.99

La desviación estándar es: 45.31

La desviación media es: 1/100(1 337.16) = 13.37

La desviación mediana es: 1/100(1 341.95) = 13.41

10. Los cuantiles, cualquiera que sea se calculan con la siguiente fórmula:

Los deciles son los puntos que dividen una distribución de frecuencia en 10 partes
iguales con una frecuencia relativa del 0.1 es decir 10%
Los cuartiles son los puntos que dividen una distribución de frecuencia en 4 partes
iguales con una frecuencia relativa del 0.25 es decir 25%

1° decil = 85.5 + [(10 – 2) /8] x 11 = 96.5


2° decil =107.5 + [(20 – 19) /14] x 11 =108.2
3° decil = 107.5 + [(30 – 14) /14] x 11 = 116.14
4° decil = 118.5 + [(40 – 33) /24] x 11 = 121.7
5° decil = 118.5 + [(50 – 33) /24] x 11 =126.29
6° decil = 129.5 + [(60 – 57) /21] x 11 = 131.07
7° decil = 129.5 + [(70 – 57) /21] x 11 = 136.3
8° decil = 140.5 + [(80 – 78) /7] x 11 = 146.64
9° decil = 151.5 + [(90 – 85) /13] x 11 = 155.73
10° decil = 173.5 + [(100 – 99) /1] x 11 = 184.5
1° cuartil = 107.5 + [(25 – 19) /14] x 11 = 112.21
2° cuartil = 118.5 + [(50 – 33) /24] x 11 = 126.29
3° cuartil = 129.5 + [(75 – 57) /21] x 11 = 138.92
4° cuartil = 173.5 + [(100 – 99) /1] x 11 = 184.5

11. El recorrido interdecil es la diferencia entre los percentiles 90avo y 10avo es decir:
Recorrido interdecil = 155.73 – 96.5 = 59.23

El recorrido cuartil es la diferencia entre los percentiles 75avo y 25avo es decir:


Recorrido cuartil = 138.92 – 112.21 = 26.71

En este contexto el recorrido interdecil es una medida de la dispersión del 80% de


la distribución de frecuencia, en tanto que el recorrido intercuartil refleja la
variación del 50% de la distribución de frecuencia. En ambos casos, al excluir los
efectos de los valores extremos de la distribución de frecuencia, se tiene la
capacidad de medir la variabilidad del conjunto de mediciones de la mitad de una
distribución de frecuencia.

Los recorridos interdecil e intercuartil, son dos medidas de dispersión que se


emplean en disciplinas como educación, economía, finanzas e ingeniería. El
recorrido interdecil se emplea muchas veces en pruebas educacionales para medir
la variabilidad en el desempeño sin importar los valores por arriba o por debajo de
un 10% de un valor predeterminado. El recorrido intercuartil se emplea en muchas
ocasiones, en economía y finanzas, para medir la variabilidad de un conjunto de
mediciones de una proporción de su distribución de frecuencia.

7. Histograma de frecuencias
Polígono de frecuencias

Ojiva
TRABAJO DE ESTADISTICAS

INTEGRANTES:
CARLOS HERRERA MONTERO
JORGE SANCHEZ SANTIAGO
TATIANA ECHAVARRIA GIL

GRUPO 01

PROFESOR:
LIC. HUMBERTO BARRIOS ESCOBAR

UNIVERSIDAD POPULAR DEL CESAR


VALLEDUPAR – CESAR
2010

You might also like