You are on page 1of 22

TALLER Nº2

ESTADISTICA DESCRIPTIVA

Daniela Alejandra Vargas Peralta


Johana Carolina Orjuela Bernal
Lady Dayana Varón Conrado
Karen Julieth Tovar Sicacha
Andrés Felipe Melo Alturo

UNIVERSIDAD COOPERATIVA DE COLOMBIA


ECONOMIA, ADMINISTRACION Y CONTADURIA
ADMINISTRACION DE EMPRESAS
IBAGUE-TOLIMA
2019
TALLER Nº2
ESTADISTICA DESCRIPTIVA

Daniela Alejandra Vargas Peralta


Johana Carolina Orjuela Bernal
Lady Dayana Varón Conrado
Karen Julieth Tovar Sicacha
Andrés Felipe Melo Alturo

Dagoberto Salgado Horta

UNIVERSIDAD COOPERATIVA DE COLOMBIA


ECONOMIA, ADMINISTRACION Y CONTADURIA
ADMINISTRACION DE EMPRESAS
IBAGUE-TOLIMA
2019
TALLER Nº2 – ESTADISTICA DESCRIPTIVA

1) En un estudio de mercado se ordena encuestas a 20 personas de


determinada población. Se medirá un conjunto de variables entre las
cuales figura el ingreso mensual (I) en miles de pesos y el nivel
socioeconómico (NSE) que se supone fuertemente relacionado con la
variable anterior. Los datos obtenidos se muestran en la siguiente
tabla:

Encuesta Sexo Edad Ingreso NSE


1 M 24 123.5 C4
2 M 46 678.8 C2
3 F 24 539.0 C2
4 F 35 234.5 C3
5 F 45 149.9 C4
6 F 89 56.8 E
7 M 58 889.3 C1
8 F 25 361.5 C3
9 M 64 548.7 C2
10 M 34 154.5 C4
11 M 72 2630.4 AB
12 F 37 129.5 C4
13 M 59 162.9 C4
14 F 45 516.5 C2
15 F 46 250.6 C3
16 F 45 850.8 C1
17 F 63 57.3 E
18 F 59 409.2 C2
19 F 60 135.0 C4
20 M 34 159.9 E

a) Clasifique las variables del estudio.


b) En que subpoblación, mujeres u hombres, los datos de ingreso
mensual son más homogéneos.
DESARROLLO

Tabla N° 1 Distribución de frecuencias de Ingresos


de 8 datos masculinos

ENCUESTA SEXO EDAD INGRESO NSE


1 M 24 123.5 C4
2 M 46 678.8 C2
7 M 58 889.9 C1
9 M 64 548.7 C2
10 M 34 154.5 C4
11 M 72 2630.4 AB
13 M 59 162.9 C4
20 M 34 159.9 E

Tabla N° 2 Distribución de frecuencias de Ingresos


de 12 datos femeninos

ENCUESTA SEXO EDAD INGRESO NSE


3 F 24 539.0 C2
4 F 35 234.5 C3
5 F 45 149.9 C4
6 F 89 56.8 E
8 F 25 361.5 C3
12 F 37 129.5 C4
14 F 45 516.5 C2
15 F 46 250.6 C3
16 F 45 850.8 C1
17 F 63 57.3 E
18 F 59 409.2 C2
19 F 60 135.0 C4

a) Clasifique las variables del estudio.

Sexo: Dicotómica
Edad: Cuantitativa discreta
Ingresos: Cuantitativa continúa
NSE (Nivel socioeconómico): Cualitativa ordinal
b) En que subpoblación, mujeres u hombres, los datos de ingreso
mensual son más homogéneos.

Media aritmética

Tabla N° 3 de Ingresos de 8 datos masculinos

Media Xi (Xi - Ẋ) (Xi - Ẋ)2


Ẋ = ∑ Xi
n 123.5 -545 297,025
Ẋ = ∑ 5,348.6 678.8 10.3 106.09
8
Ẋ = 668.5 889.3 220.8 48,752.64
548.7 -119.8 14,352.04
151.5 -514 264,196
2630.4 1,961.60 3,849,051.61
162.9 -505.6 255,631.36
159.9 -508.6 258,673.96
TOTAL 4,987,788.67

Tabla N° 4 de Ingresos de 12 datos femeninos

Xi (Xi - Ẋ) (Xi - Ẋ)2


529 231.45 53,569.10
Media 234.5 -73.05 5,336.30
Ẋ = ∑ Xi
149.9 -157.65 24,853.52
n
56.8 -250.75 62,875.56
Ẋ = ∑ 3,690.6
12 361.5 53.95 2,910.60
Ẋ = 307.55 129.5 -178.05 31,701.80
516.5 208.95 43,660.10
250.6 -56.95 3,243.30
850.8 543.25 295,120.56
57.3 -250.25 62,625.06
409.2 101.65 10,332.72
135 -172.55 29,773.50
TOTAL 626,002.12
Varianza Masculina Variación Femenina

S2 = ∑ (Xi - Ẋ)2 S2 = ∑ (Xi - Ẋ) 2


n n

S2 = 4,987,788.7 S2 = 626,002.1
8 12

S2 =623,473.5875 S2 =52,166.843

Desviación típica o estándar

Masculino Femenino

𝐒 = √𝐒 𝟐 𝐒 = √𝐒 𝟐

𝐒 = √𝟔𝟐𝟑, 𝟒𝟕𝟑. 𝟓𝟖𝟕𝟓 𝐒 = √𝟓𝟐, 𝟏𝟔𝟔. 𝟖𝟒𝟑

𝐒 = 𝟕𝟖𝟗. 𝟔𝟎𝟑𝟒𝟑𝟔𝟗 𝐒 = 𝟐𝟐𝟖. 𝟒𝟎𝟎𝟔𝟏𝟗𝟓

Coeficiente De Variación

Masculino Femenino
Cv = (s)
x 100% Cv = (s)
x 100%
789.6034369 228.4006195
Cv = ( 668.5
) 100% Cv = ( 307.55
) 100%

Cv= 118.1156974 Cv = 74.26454869

b) En que subpoblación, mujeres u hombres, los datos de ingreso mensual


son más homogéneos

Respuesta: los datos de ingreso mensuales son más homogéneos en la


subpoblación de las mujeres.
2) Se conocen los puntajes que un grupo de postulantes, no así las
identificaciones de los mismos. Uno de ellos, Andrés quiere conocer
su puntaje y le han dicho que es mayor que el promedio y menor que
el percentil 75 Los puntajes son los siguientes

Tabla N° 5 Distribución de frecuencia de 14 datos de puntajes


de un grupo de postulantes

Media Xi (Xi - Ẋ) (Xi - Ẋ)2 Xi2


344 - 272.93 74,490.7849 118,336
491 - 125.93 15,858.3649 241,081
Ẋ = ∑ Xi
n 513 - 103.93 10,801.4449 263,169
Ẋ = ∑ 8,637 522 - 94.93 9,011.7049 272,484
14 526 - 90.93 8,268.2649 276,676
Ẋ = 616.928
527 - 89.93 8,087.4049 277,729
590 - 26.93 725.2249 348,100
591 - 25.93 672.3649 349,281
684 67.07 4,498.3849 467,856
739 122.07 14,901.0849 546,121
744 127.07 16,146.7849 553,536
750 133.07 17,707.6249 562,500
765 148.07 21,924.7249 585,225
851 234.07 54,788.7649 724,201
8,637 -608.29 257,882.928544 5,586,295

Varianza Desviación

S2 = ∑ (Xi - Ẋ)2 𝐒 = √𝐒𝐒


n

S2 = 257,882.928544 𝐒 = √𝐒𝐒, 𝐒𝐒𝐒. 𝐒𝐒𝐒𝐒𝐒𝐒𝐒𝐒𝐒𝐒𝐒


14

S2 =18,420.20918171429 𝐒 = 𝐒𝐒𝐒.𝐒𝐒𝐒𝐒𝐒𝐒𝐒𝐒𝐒𝐒𝐒𝐒𝐒
Tabla N° 6 Distribución de frecuencia de 14 datos de puntajes
de un grupo de postulantes

Xi (Xi - Ẋ) (Xi - Ẋ)2 Xi2


344 - 268.214 71,938.7498 118,336
491 - 121.214 14,692.8338 241,081
Media 513 - 99.214 9,843.417796 263,169
522 -90.214 8,138.565796 272,484
Ẋ = ∑ Xi 526 -86.214 7,432.853796 276,676
n 527 - 85.214 7,261.425796 277,729
Ẋ = ∑ 8,571 590 - 22.214 493.461796 348,100
14 591 - 21.214 450.033796 349,281
Ẋ = 612,214 618 5.786 33.477796 381,924
739 126.786 16,074.6898 546,121
744 131.786 17,367.5498 553,536
750 137.786 18,984.9818 562,500
765 152.786 23,343.5618 585,225
851 238.786 57,018.7518 724,201
8,571 -603.643 253,074.355172 5,500.357

Varianza Desviación

S2 = ∑ (Xi - Ẋ)2 S = √S2


n

S2 = 253,0740355172 S = √18, 076.73966


14

S2 =18,076.73966 𝐒 = 𝐒𝐒𝐒.𝐒𝐒𝐒𝐒𝐒𝐒𝐒𝐒𝐒𝐒𝐒𝐒𝐒

Mediana

Ẋ = ∑ Xi
n
Ẋ = ∑ 8,516
14
Ẋ = 608.285
Tabla N° 7 Distribución de frecuencia de 14 datos de puntajes
de un grupo de postulantes

Xi (Xi - Ẋ) (Xi - Ẋ)2 Xi2


344 - 264.285 69,846.56123 118,336
491 - 117.285 13,755.77123 241,081
513 - 95.285 9,079.231225 263,169
522 - 86.285 7,445.101225 272,484
526 - 82.285 6,770.821225 276,676
527 - 81,285 6,607.251225 277,729
590 - 18.285 334.311225 348,100
591 - 17.285 298.771225 349,281
618 9.715 94.381225 381,924
684 75.715 5,732.7612 467,856
744 135.715 18,418.56123 553,536
750 141.715 20,083.1412 562,500
765 156.715 24,559.5912 585,225
851 242.715 58,910.5712 724,201
8,516 -599.769 241,936.8572 5,422,098

Varianza Desviación
S2 = ∑ (Xi - Ẋ)2 S = √S2
n

S2 = 241,936.8572 S = √17, 281.20409


14

S2 =17,281.20409 𝐒 = 𝐒𝐒𝐒.𝐒𝐒𝐒𝐒𝐒𝐒𝐒

a) Obtenga los posibles puntajes de Andrés.


Respuesta: Los posibles puntajes de Andrés son:
1. 618,
2. 684
3. 739.
b) entre los valores calculados en a), el puntaje de Andrés es aquel
que, al calcular la desviación estándar de los 14 restantes, produce
la mayor variabilidad ¿Cuál es el puntaje de Andrés?

Respuesta: Entre los valores calculados de Andrés, el puntaje que produce


la mayor variabilidad es 618, el cual tiene una variabilidad 131.4579936

3) Si se conoce que el salario medio mensual de 5 hermanos, es de


$120.000, y la mediana es de $100.000

a) ¿Cuánto dinero llevan mensualmente a la casa los cinco hermanos?

X = 120.000
5 1

X = 120.000 x 5
1

X = 600.000
1

X = 600.000
Respuesta: La cantidad de dinero llevada por los 5 hermanos es de $600.000

b) Si Juan, el mejor pagado de los cinco recibe un aumento de


$10.000; cuál es la nueva media y cuál es la nueva mediana.

Ẋ = ∑ 610.000
5
Ẋ = 122.000

Respuesta: La nueva media es $122.000

 La mediana queda igual, ya que Juan recibe más dinero y al ser el último no
altera la mediana.
4. Un grupo de 80 estudiantes se compone de 35 hombres. En un test,
el puntaje medio de las mujeres fue de 70 puntos y del grupo completo
fue 66.5 puntos.

a) Determine el puntaje medio de los hombres.

Tabla N° 8 De datos de variables


de 35 hombres y 45 mujeres

DATOS ESTUDIANTES

HOMBRES MUJERES

35 45

63 PUNTOS 70 PUNTOS

80 = 66,5%

Hombres 35: 43,75%


Mujeres 45: 56,25%

Formula de la media
Ẋ= 63 puntos
Ẋ= 70 puntos
X + 70 = 63 + 70
2 2
b) Si se cambia la escala de puntajes mediante la transformación Y i (Xi:
puntaje antiguo, Y i puntaje nuevo), determine el nuevo X i puntaje medio de
hombres, mujeres y el grupo completo

 Yi = 2x – 5
Yi = 2(66,5) - 5
Yi = 133-5
Yi = 128
 Hombres 35: 43,75% = 94,73 Ẋ=121
X – 105,27
Ẋ = 133
2
Ẋ = 66.5%
 Mujeres 45: 56,25% = 105,27 Ẋ=135
Ẋ= 128
Ẋ = 128
100
Ẋ = 94,73 %
Respuesta:
 El nuevo puntaje del grupo completo es de 128 puntos.
El nuevo puntaje de las mujeres es 135 puntos
El nuevo puntaje de los hombres es 121 puntos

5) En una distribución simétrica de 7 intervalos de igual amplitud se


conocen los siguientes datos:
A. 10; n=8 Y3; n3= 1260; n2+n5=62; h3=0,21; H6=0.96

a) Complete la información.

Tabla N° 9 Distribución de frecuencia de 7 intervalos de


igual amplitud

Li Ls Yi A ni Ni Yi.ni Yi^2-ni (Yi-Ý)^2.ni hi Hi


35 45 40 10 8 8 320 12800 3836,88 0,08 0,08
45 55 50 10 38 46 1900 95000 5381,18 0,39 0,47
55 65 60 10 21 67 1260 75600 75,81 0,22 0,69
65 75 70 10 3 91 210 14700 196,83 0,03 0,72
75 85 80 10 21 94 1680 134400 6879,81 0,22 0,94
85 95 90 10 2 96 180 16200 1579,22 0,02 0,96
95 105 100 10 4 100 400 40000 5806,44 0,04 1,00
TOTAL 23756,17 1

b) Calcule el promedio bajo la transformación lineal


Ӯ = ∑ yi.ni
n
Ӯ = 6,190
100
Ӯ = 61,9
Varianza Desviación
S2 = ∑ (Yi – Ý) 2 .ni S = √𝑠2
n
S2 =24,739 S = √247,39
100

S2 =247,3 S =15.7286363

6) En un banco comercial se desea estudiar el tiempo de atención necesario


para que un cliente realice una transacción entre las 12:00 horas y las 14:00
horas. Durante una semana se tomaron los tiempos de atención de 10
clientes diariamente, obteniéndose los siguientes datos tabulados

Tiempo de atención
(min.) Cantidad de Clientes
0.25 - 1.65 17
1.65 - 3.05 11
3.05 - 4.45 7
4.45 - 5.85 7
5.85 - 7.25 4
7.25 - 8.65 2
8.65 - 10.05 2
TOTAL 50

a) Determine qué porcentaje de clientes demoraron a lo más 3 minutos


en su atención.
b) Determine cuántas horas a lo más demorará en su transacción el 84%
de los clientes.
c) Construya un gráfico adecuado que permita mostrar
(aproximadamente) la ubicación de la Mediana y el Percentil 75.
Tabla N° 10 Distribución de frecuencia de 50 datos de atención al cliente

Li Ls Yi ni Ni Yini
0.25 1.65 0.95 19 17 16.15
1.65 3.05 2.35 11 28 25.85
3.05 4.45 3.75 7 35 26.25
4.45 5.85 5.15 7 42 36.05
5.85 7.25 6.55 4 46 26.2
7.25 8.65 7.95 2 48 15.9
8.65 10.05 9.35 2 50 18.7
TOTAL 50 ∑ 165.1

a) Determine qué porcentaje de clientes demoraron a lo más 3 minutos


en su atención.

X= 28 * 100%
50 .

X=56%

Respuesta: 28 clientes que equivalen al 56% se demoran a lo máximo 3 minutos en


su atención.

b) Determine cuántas horas a lo más demorará en su transacción el 84%


de los clientes.

Percentil 84

C=84 K=84
k = (84).(50) = 42
n 100

Respuesta: El 84% de los clientes se demoran a lo máximo en su transacción 5:85


minutos.
c) Construya un gráfico adecuado que permita mostrar
(aproximadamente) la ubicación de la Mediana y el Percentil 75.

Mediana

N
Me = Li + 2 - Ni -1 *t1 Li= 1.65 n1= 11 Ni – 1
ni N = 25 A= 1.40
2
Me = 1.65 + 25 – 17 *1.40
11

Me = 1.65+1.01818

Me = 2.66818

Percentil 75

C75=K75

kn= (75)(50)
100 100

Kn= 42

Grafico N° 1 De 50 datos de atención al cliente

6
0

50
4
50 4 8
6
42
40
37,5
35

3
0 2
8

2
0 1
7
1
0

2.66818
0
MEDIANA 0.25-1.65 1.65-3.05 3.05-4.45 PERCENTIL 4.45-5.85 5.85-7.25 7.25-8.65
8.65-10.05
7. La distribución de frecuencias observadas, de los sueldos para los
trabajadores del departamento de producción de dos empresas, A y
B, para dos muestras se da a conocer la siguiente tabla:

Sueldo (UF) nA nB
10.5 – 15.5 4 5
15.5 – 20.5 9 8
20.5 – 25.5 12 7
25.5 – 30.5 15 12
30.5 – 35.5 20 18
35.5 – 40.5 17 23
40.5 – 45.5 10 18
45.5 – 50.5 8 17
50.5 – 55.5 5 12
Total 100 120

a) Calcular en cada muestra las medidas de tendencia central.

b) Compare la homogeneidad de los datos a partir de los sueldos de la


empresa.

Tabla N° 11 De medidas de tendencia central de nA


Li Ls Yi ni Ni Yi.ni (𝐒𝐒 − Ӯ)𝐒 (𝐒𝐒 − Ӯ) −𝐒ni
10.5 15.5 13 4 4 52 398.0025 1592.01
15.5 20.5 18 9 13 162 223.5025 2011.5225
20.5 25.5 23 12 25 276 99.0025 1188.03
25.5 30.5 28 15 40 420 24.5025 367.5375
30.5 35.5 33 20 60 660 0.0025 0.05
35.5 40.5 38 17 77 646 25.5025 433.5425
40.5 45.5 43 10 87 430 10.10025 1010.025
45.5 50.5 48 8 95 384 226.5025 1812.02
50.5 55.5 53 5 100 265 402.0025 2010.0125
TOTAL 100 ∑ 3,295 ∑ 10424.75
Media Moda

Ӯ = ∑ Ӯi.ni Mo = Li+A [ d1 ] Li= 30.5


n [ d1 + d 2] A= 5
d1 = 20-15=5
Ӯ = 3295 Mo = 30.5 + 5 [ 5 ] d2 = 20-17 = 3
100 [5+ 3]
Ӯ = 32.95 sueldos Mo = 30.5 + 3.125

Mo = 33.625

Mediana

N
Me = Lit 2 - Ni -1 *t1 Li = 15.5
ni N = 50
2
Me = 15.5 + 50-4 *5 Ni - 1=4
9 A=5
Me = 15.5 + 25.55 n=9
Me = 41.05

Tabla N° 12 De medidas de tendencia central de Nb

Li Ls Yi n Ni Yi.ni (𝐒𝐒 − Ӯ)𝐒 (𝐒𝐒 − Ӯ)𝐒ni


10.5 15.5 13 5 5 65 559.7956 2798.978
15.5 20.5 18 8 13 144 348.1956 2785.978
20.5 25.5 23 7 20 161 186.5956 1306.1692
25.5 30.5 28 12 32 336 74.9956 899.9472
30.5 35.5 33 18 50 594 13.3956 241.1208
35.5 40.5 38 23 73 879 1.7956 41.2988
40.5 45.5 43 18 91 774 40.1956 723.5205
45.5 50.5 48 17 108 816 128.5956 2186.1252
50.5 55.5 53 12 120 636 266.9956 3203.9472
TOTAL 120 ∑ 4,400 ∑ 14186.672
Media Moda

Ӯ = ∑ Ӯi.ni Mo = Li+A [ d1 ] Li= 35.5


n [ d1 + d 2] A= 5
d1 = 23-18=5
Ӯ = 4,400 Mo = 35.5 + 5 [ 5 ] d2 = 28-18 = 3
120 [5+ 5]

Ӯ = 36.66 Mo = 35.5 + 2.5

Mo = 38

Mediana

N
Me = Lit 2 - Ni -1 *t1 Li = 15.5
ni N = 60
2
Me = 15.5 + 60-5 *5 Ni - 1=5
8 A=5
Me = 15.5 + 34.375 n=8

Me = 49.875
Homogeneidad para datos a partir de los sueldos de la empresa

Varianza Desviación Coeficiente de Variación


S2 = ∑ (𝐒𝐒 − Ӯ) ni
2
S = √S2 Cv = (s) * 100%
n y
S2 = 10,424.75 S =√104.2475 Cv = 10.2101605 *100*
100 32.45
S2 = 104.2475 S = √10.2101605 Cv = 30.98684826%

Sueldo

Varianza Desviación Coeficiente de Variación


S2 = ∑ (𝐒𝐒 − Ӯ) ni 2
S = √S2 Cv = (s) * 100%
n y
S2 = 14,186.672 S = √118.2222667 Cv = 10.87300633 *100*
120 32.45
S2 = 118.2222667 S = √10.87300633 Cv = 29.65904619%

Respuesta: los datos a partir de los sueldos son más homogéneos para nB

10. Los siguientes datos corresponden a los tiempos (en minutos) que
duran 40 llamadas telefónicas recibidas por una central:

a) Construya una tabla de frecuencias con seis intervalos de igual


amplitud.
b) Construya un histograma de frecuencias relativas porcentuales.
c) ¿Qué p o r c e n t a j e de llamadas se e n c u e n t r a n en el intervalo
x s;x s .

PROCEDIMIENTO MECANICO PARA DETERMINAR LOS INTERVALOS

Xmin = 0.5 Rango corregido


Xmáx=2.8 Xmin= 0.5 – 0.05 =0.045
Rango= 2.8-0.5 R’ =A*m Xmax= 2.8 +0.05 =2.85
R = 2.3 R’=0.4*6
Numero de intervalos R’=2.4
m= 1 +3.3* Log (40)
m= 6.28 Diferencia de rangos
m= 6
Amplitud D = R’ – R
A= R D = 2.4 – 2.3
m D = 0.1
A= 0.4 D = 0.05

Media
Ӯ = ∑ Ӯi.ni
n
Ӯ = 67,55
40
Ӯ =1.68875
Tabla N°13Distribución de frecuencia de tiempos en minutos que
duran 40 llamadas telefónicas recibidas por una central

Li Ls Yi A ni hi Ni Hi Yi.ni (Yi-Ӯ)2 (yi-Ӯ)2-ni


0.45 0.85 0.65 0.4 3 7.5 3 7.5 1.45 1.079 3.237
0.85 1.25 1.05 0.4 8 20 11 27.5 11.55 0.408 3.264
1.25 1.65 1.45 0.4 11 27.5 22 55 15.95 0.057 0.627
1.65 2.05 1.85 0.4 8 20 30 75 14.8 0.026 0.208
2.05 2.45 2.25 0.4 8 20 30 95 18 0.026 2.52
2.45 2.85 2.65 0.4 2 5 40 100 5.3 0.315 1.848
∑ 40 ∑ 67.5 0.924 11.704

Diagrama de barras de tiempo en minutos que duran 40 llamadas


telefónicas recibidas por una central

30 27,5

25

20,0 20,0 20,0


20

15

10
7,5
5,0
5

Varianza Desviación Media –Desviación


S2 = ∑ − Ӯ)2 ni S = √S2 1.68875-0.5409=1.14
(𝐒𝐒
n Media + desviación
S2 = 11,704 S = √0.2926 1.688757 + 0.5409 =1.68
40
S2 = 0.2926 𝐒 = 𝐒.
𝐒𝐒𝐒𝐒
c). En el intervalo se encuentran 27 llamadas [1.14 − 2.22]

40l → 100%
27l → x
27l ∗ 100%
=
40l
2700 l %
=
40 l
= 𝐒𝐒.𝐒
%

Respuesta: El 67.5 es el porcentaje de llamadas que se encuentra en el intervalo.

You might also like