Professional Documents
Culture Documents
I PARCIAL :
1. Estadística Descriptiva ( capítulo 1 )
Estadística: Es el proceso de recolección, organización, clasificación, presentación, análisis e interpretación de datos para la toma de
decisiones.
La estadística puede clasificarse en: descriptiva e inferencial
Estadística descriptiva: Consiste en la recolección, organización, clasificación y presentación de datos en una forma fácil.
Estadística Inferencial: Consiste en el análisis e interpretación de datos de una forma más compleja para la toma de decisiones.
Ejemplos:
Identifique si se aplica estadística descriptiva e inferencial:
1. Se toma una muestra de 12 datos para organizarlos en un gráfico: est. descriptiva
2. Se analiza información obtenida sobre casos de COVID19 en Tegucigalpa, el contagio, los medios que lo propagan y las medidas de
bioseguridad a aplicar: est. inferencial
Términos claves:
Total, de elementos con características comunes de interés para una investigación estadística. Si no hay referencia se toma como
Po población de 30 o más elementos.
bla _ Estudiantes matriculados en UNICAH II periodo 2022
ció _ Trabajadores de una maquila
n _Libros de una biblioteca
4. De Razón: Se establece como comparación entre dos elementos de la misma naturaleza (opción numérica), el valor de cero es
importante, se representa por
f1
R= (Generalmente muestras):
f2
temperatura, inventarios, tasas, edad, asistencias a un evento, etc
f 1=19 estudiantes varones de estad í stica I 0801
f 1 19
R= = =0.5 0.5 x 100 = 50%
f 2 38
f 1 21
R= = = 0.53 0.53x100=53% Por cada 100 estudiantes mujeres hay 53 estudiantes varones en estadística I 1103
f 2 40
0.53 x1000= 530 por cada 1000 estudiantes mujeres hay 530 varones en estadística I 1103
Ejercicios: 1.
Clasifique las variables según escala de medición:
1. Marca de automóviles: nominal
2. Pesos de personas de una ciudad: intervalo
3. Rangos en la milicia: ordinal
4. Tasas de mortalidad por COVID19 en una colonia: razón
5. Idiomas que se hablan a nivel mundial: nominal
6. Nacionalidad de personas: nominal
7. Intensidad de un dolor o afección ( nombres): ordinal
b) Número de clases (m): Son las categorías para formar, mínimo son 5 y máximo se puede hasta 20, se puede encontrar de dos formas:
b ¿ con la fórmula de Sturges se calcula con :m=1+3.322 log N , N es el total, de datos. (m se redondea a entero)
2 ≥N
m
, 25 ≥180 32≥ 180 es falso, 26 ≥180 64≥ 180 es falso, 27 ≥180 128≥ 180 es falso, 28 ≥180 256≥ 180 verdadero m=8 clases
* Si se solicita el número de clase con m=1+3.322 log N = 1 + 3.322xlog 140= 8 clases ( redondear a enteros)
* use 2m ≥ N 5
2 ≥120 falso, 26 ≥120 falso, 27 ≥120 verdadero m= 7 clases
R
C= Espacio de cada clase (ancho de clase), cociente entre el rango y número de clases, se redondea a entero: C= , cuando cada categoría ya está formada se
m
verifica el ancho: restando dos límites inferiores consecutivos o dos límites superiores consecutivos.
*Se puede modificar el ancho de clase: cuando uno o más datos quede(n) fuera de la última clase o categoría, se va aumentando 1 unidad al ancho de clases, se
forman de nuevo las clases o categorías, se fijará que lo máximo que debe sobrar de espacio es 1 unidad con relación al último valor, en caso contrario hacer un
ajuste (dividir el espacio que sobra entre dos partes) y colocar ya las clases con el ajuste (para lograr una distribución equitativa con los datos).
d) formar las clases o intervalos (Li-Ls), Li= límite inferior, Ls= límite superior
2. Frecuencia (f): Número de datos que hay en cada clase o categoría numérica.
3. Frecuencia acumulada (fa): suma consecutiva de las frecuencias f.
( Li+ Ls )
4. Marca de clase o punto medio (Xm): Es el promedio de cada clase o categoría numérica, Xm = , no se redondea.
2
5. Frecuencia relativa porcentual ( fr% ): Es la razón o cociente de cada frecuencia f entre el total de datos N se multiplica por 100
f
fr% = x 100
N
6. Frecuencia relativa acumulada porcentual ( fra% ): Es el cociente entre cada fa y el total de datos N se multiplica por 100
fa
fra% = x 100 o suma consecutiva de las frecuencias relativas porcentuales fr%.
N
7. Límites reales de clase ( Lri – Lrs): Sirven para la representación de las clases convirtiéndolas en valores continuos ( compartiendo iguales fronteras ) , se puede
hacer el promedio del límite superior de una clase y el límite inferior de la siguiente, si las clases están formadas por valores enteros ( fronteras diferentes) para
formar los límites reales inferiores (Lri) reste 0.5 a los límites inferiores(Li ) y para formar los límites reales superiores(Lrs) sume 0.5 a los límites superiores(Ls)
C f Xm f f L
l ( a r r í
( Li+2 Ls )
a f % a m
s ) % it
e e
s s
r
( e
L a
i l
– e
L s
s
) ( 1.Ejercicio
L Estatura en pulgadas de 35
ri personas ( población ):
- usando 2m ≥ N para el
L
número de
r
s clases, elabore tabla de
) clases y frecuencias.
44,53,55,57,58,59,60,60,62,63,48,56,58,62,63,65,70,70,71,71,67,68,69,70,73,53,
55,43,62,68,54,66,55,59,67.
Ordenar datos:
43, 44, 48, 53,53, 54, 55,55,55, 56, 57, 58,58, 59,59, 60,60,62,62,62, 63,63, 65, 66,67, 67, 68,68, 69, 70,70,70,71,71,73
1. Clases (Li-Ls)
a) Rango : R=V. máx-v.mín=73-43=30
m
,
b) número de clases : 2 ≥ N 2 ≥35
5
falso, 26 ≥35 verdadero m=6 clases
R 30
c) Ancho de clases: C= = =5
m 6
d) clases (Li-Ls) no se toma esta distribución porque queda fuera el 73, el ancho de clase queda con C=6 y se forman las clases
1) 43-47
2) 48- 52
3) 53-57
4) 58-62
5) 63-67
6) 68- 72
Clases (Li-Ls)
1) 43-48 con C=6 , el último dato es 73 sobran 5 espacios , se hace ajuste 5 espacios ÷ 2 partes=¿2.5 {23espacios antes del primer dato
espacios después del último
2) 49-54
3) 55-60
4) 61-66
5) 67- 72
6) 73- 78
Ajuste clases (Li-Ls) aquí queda
1) 41- 46 43, 44 su frecuencia es 2
2) 47-52 48, su frecuencia es 1
3) 53-58 53,53, 54, 55,55,55, 56, 57, 58,58 su frecuencia es 10
4) 59-64 59,59, 60,60,62,62,62, 63,63 su frecuencia es 9
5) 65-70 65, 66,67, 67, 68,68, 69, 70,70,70 su frecuencia es 10
6) 71-76 71,71,73 su frecuencia es 3
( ) f fa
Clases (f) fa Li+ Ls Límites reales
Xm = fr%= *100 fra%= *100
2 N N
( Li – Ls) (Lri-Lrs)
40
41-46
2 2 f 2 2 40.5-46.5
(Li+Ls)/2 = *100= *100= *100=5.71%
N 35 35
( 41+ 46) 5.71%
=43 . 5
2
47-52
1 3 ( 47+52) 1 3 46.5-52.5
=¿ 49.5 *100= 2.86% *100=8.57%
2 35 35
53-58
10 13 (53+58) 10 13 52.5-58.5
=¿55.5 *100= 28.57% *100=37.14
2 35 35
%
59-64
9 22 (59+64 ) 9 22 58.5-64.5
=¿61.5 *100= 25.71% *100=62.86
2 35 35
% 77 N= 35
T = 100 %
65-70
-0.5 +0.5
10 32 (65+70) 10 32 64.5-70.5
=¿67.5 *100= 28.57% *100=91.43
Lìmites 2 35 35 reales : Lr =
% (40+41)/2= 40.5, Lr
= (46+47)/2= 46.5 , Lr
= 71-76 (52+53)/2= 52.5
3 35 (71+76) 3 35 70.5-76.5
=73.5 *100= 8.57% *100=100%
2 35 35
Ejercicio 2.
1) Clases (Li-Ls)
R 59
a) Rango=87-28=59 b) Nùmero de clases: m= 1+ 3.322 log N= 1+ 3.322* log 30=6 c) ancho de clases C= = = 10
m 6
d) clases (Li-Ls), se toma esta distribución porque caben todos los datos, no se hace ajuste
1) 28-37 28, 29,29,29,33 su frecuencia es 5
2) 38-47 38,38,38,42, 43,43,43,45,45 su frecuencia es 9
3) 48-57 51,54,55,55,56 su frecuencia es 5
4) 58-67 65,65,65,66,67 su frecuencia es 5
5) 68-77 75,76,77 su frecuencia es 3
27
28-37
5 5 f 5 5 27.5-37.5
C=10 (Li+Ls)/2 = *100= *100= *100=16.67%
N 30 30
(28+37) 16.67%
=32 . 5
2
38-47
9 14 (38+ 47) 9 14 37.5-47.5
=42 .5 *100= 30% *100=46.67%
2 30 30
48-57
5 19 5 19 47.5-57.5
( 48+57) *100= 16.67% *100=63.33%
=52.5 30 30
2
58-67
5 24 (58+67) 5 24 57.5-67.5
=62 . 5 *100= 16.67% *100=80%
2 30 30
68-77
3 27 (68+77) 3 27 67.5-77.5
=72 .5 *100= 10% *100=90% 88 N= 30
T = 100 % 2 30 30
78-87
3 30 (78+87) 3 30 77.5-87.5
=82 . 5 *100= 10% *100=100%
2 30 30
-0.5 +0.5 Lr =(27+28)/2=27.5 , Lr=(37+38)/2=37.5
Ejercicio 3.
Dada la distribución de datos, hay 120 datos, el valor mínimo es 34, el valor máximo es 110 determine: elabore tabla de clases y frecuencias use
m
2 ≥ N para el número de clases: cuando no hay datos específicos la tabla se construye sólo con clases, Xm y límites reales de clase
1) Clases (Li-Ls)
a) Rango: R=máx.-v. mín=110-34= 76 b) número de clases 2m ≥ N , 25 ≥120 falso, 26 ≥120 falso , 27 ≥120 verdadero
R 76
m= 7 clases c) ancho de clases C= = = 11
m 7
d) Clases (Li-Ls) No se hace ajuste , los datos caben en las categorías
C=11 1) 34-44
2) 45-55
3) 56-66
4) 67-77
5) 78-88
6) 89-99
7) 100-110
Clases (Li-Ls) Xm = (Li+Ls)/2 Límites reales (Lri-Lrs)
34-44 (34+44)/2=39 33.5-44.5
45-55 (45+55)/2=50 44.5-55.5
56-66 61 55.5-66.5
67-77 72 66.5.77.5
78-88 83 77.5-88.5
89-99 94 88.5-99.5
100-110 105 99.5-110.5
12
a) Rango= 6.9-2.2= 4.7 b)C=4.7/6=0.8 c) fa= 25 tercera clase d) fr%= 4% quinta clase e) Lrs= 5.35 cuarta clase f) Li = 5.4 quinta clase
Elabore los gráficos: polígono e histograma de frecuencias, ojivas (menor que y mayor que) y circular de:
104.91
1. Excedentes: 4.91 es 100%+4.91%= 104.91% se transforma a la forma decimal en = 1.0491
100
105.75
5.75 es 100%+5.75%= 105.75% se transforma a la forma decimal en = 1.0575
100
108.12
8.12 es 100%+8.12%= 108.12% se transforma a la forma decimal en = 1.0812
100
121.60
21.60 es 100%+21.60%= 121.60% se transforma a la forma decimal en = 1.216
100
a) Media geométrica incremento porcentual: n= 4 datos
M .G=√ x 1∗x 2… .. xn =√ ( 1.0491∗1.0575∗1.0812∗1.216 ) =1.098965905
n 4
120520
20 shift √x ❑ ( 23000 )= 1.086341985 T.C.P =(1.086341985-1)*100=8.63%
109.4
29. Excedentes: 9.4 es 100%+9.4%= 109.4% se transforma a la forma decimal en
100 = 1.094
113.8
13.8 es 100%+13.8%= 113.8% se transforma a la forma decimal en = 1.138
100
111.7
11.7es 100%+11.7%= 111.7% se transforma a la forma decimal en = 1.117
100
111.9
11.9 es 100%+11.9%= 111.9% se transforma a la forma decimal en = 1.119
100
14.7 es 100%+14.7%=114.7% se transforma a la forma decimal en 114.7/100=1.147
30. n= 2015-2001=14
5 shift √x ❑ (1.094∗1.138∗1.117∗1.119∗1.147 ¿=¿
x1
= )
x n 14 128653000
40244000
= 1.086554066
33.4 )
= 1.039823724, n=2023-2017=6 P2023 =43.9∗¿= 55.49 en miles
Media x=
∑ x = (12+14+ 22+ 30) = 78 =19.5 n= 4 datos n-1=4-1=3 ,
n 4 4
Mediana es (14+22)/2=18
12,14,22,30
Moda no hay
Varianza s2= ∑
( x−x )2 203
=¿ ¿= =67.67
n−1 3
Media x=
∑ x = (101+97+ 103+ 110+78+87+101+80+ 106+88) = 951 =95.1
n 10 10
2
Varianza s = ∑ ( x−x )2
=¿ ¿ =
1112.9
=123.66 desviación estándar s=√ 123.66 =11.12
n−1 9
1)Usando: Desmos.com/ calculator:
2)
3) Clic en funciones y luego clic en estadística
4) Va seleccionando cada una: median, mean, stdev, var, lo de moda lo escribe en la función, y el c.v la escribe allí
5) Escribe su nombre y captura de pantalla
Usando Calculadora científica CASIO para calcular: media x , varianza s2y desviación estándar s:
2)MODE 2 ( estadístico)SD
12 M+ aparece 1
14 M+ aparece 2
22 M+ aparece 3
1 M+ aparece 4
( )
N
−∑ f 1
Medidas de tendencia central 2
Mediana Me=LI + C
f me
Moda : Mo=LI + ( ∆1
)
∆1 +∆ 2
C , donde está lamayor f
Medidas de dispersión: ¿
Calcule Media, mediana, moda, varianza, desviación estándar y coeficiente de variación de:
C f Xm f(Xm) f( Xm)2
l f
a
s
e
s
(
L
i
-
L
s
)
1 2 2 ( 100+119 ) 24*109.5=2628 24¿ 109.52=¿ 287766
0 4 =¿109.5
2
0
-
1
1
9
2
1 4 6 129.5 45*129.5=5827.5 45∗129.5 =¿754661.25
2 5
0
-
1
3
9
2
1 6 1 149.5 67*149.5=10016.5 67∗149.5 =¿ 1497466.75
4 7
0
-
1
5
9
1 4 1 169.5 44*169.5=7458 44¿ 169.52=¿ 1264131
6 4
0
-
1
7
9
2
1 3 2 189.5 31*189.5=5874.5 31∗189.5 =¿1113217.75
8 1
0
-
1
9
9
N ∑ fXm=31804.5 ∑ f ( Xm)2=4917242.75
=
2
1
1
Media aritmética μ=
∑ fXm = 31804.5 =150.73 se encuentra entre 140-159
N 211
2 ( 4917242.75−211∗150.732 ) 123421.3081
Varianza Poblacional σ =¿ ¿ = = =584.94
211 211
Desviación estándar poblacional σ =√ σ =√ 584.94 =24.19
2
σ 24.19
Coeficiente de variación :C . V = x 100 = *100=16.05%
μ 150.73
( )
N
2 ∑ 1 ( )
− f (105.5−69)
= 140+ ∗20=150.90 está entre 140-159
Mediana Me=LI + C 67
f me
5) C = ancho de clase( reste dos límites inferiores consecutivos o reste dos límites superiores consecutivos) C=140-120=20
211
1) N/2= =105.5 ubicar en fa =136 (allí cabe 105.5) se escoge la clase mediana a 140-169 donde LI=140,
2
luego ∑ f 1=69 ( frecuencia acumulada antes de 136 ), f me =67 ( frecuencia donde está la clase mediana), C= 20 ( ancho de clase
Moda : Mo=LI +
( ∆1
)
∆ 1+ ∆ 2
C , donde está la mayor f
Mo=LI +
( ∆1
∆1 + ∆2 )
C = 140+ (
22
(22+23) )
∗20 = 149.78 está en la clase 140-159
Calcule Media, mediana, moda, varianza, desviación estándar y coeficiente de variación de: ejercicio1: estatura en pulgadas de 35
personas
( ) f(Xm)2
C f Li+ Ls f f L
l ( a Xm r r í fX
a f 2 % a m m
s ) % i
e t
s 0 e
% s
( r
L 1 e
i 0 a
– 0 l
% e
L s
s (
) L
r
i
4 -
0 L
r
s
)
4
1 2 ( 41+ 46) 5 4 2* 2*43.5 2=¿3784.5
2 = 43.5 5 . 0 4
- 2 . 7 . 3.
4 7 1 5 5
6 1 % - =
% 4 8
9 6 7
4 .
. 5
2
9
%
4
7 3 ( 47+52) 2 8 4 1* 1*49.5 2=¿2450.25
1 = 49.5 . . 6 4
- 2 8 5 . 9.
5 6 7 5 5
2 % % - =
5 4
9 2 9.
1 . 5
. 5
4
3
%
N=35 T=100% ∑ fXm=¿ 2140.5 ¿ ∑ f ( Xm)2=¿ ¿134196.75
Media aritmética μ=
∑ fXm = 2140.5 =61.16 está en la clase 59-64
N 35
2 ( 134196.75−35∗61.162 ) 3277654
Varianza Poblacional σ =¿ ¿ = = =93.65
35 35
Desviación estándar poblacional σ =√ σ =√ 93.65 =9.68
2
σ 9.68
Coeficiente de variación :C . V = x 100 = *100=15.83%
μ 61.16
( )
N
−∑ f 1
Mediana Me=LI +
2
f me
C = 59+
(17.5−13)
9 ( )
∗6=62 , está entre 59-64
35
1) N/2= =17.5 ubicar en fa =22 ( allí cabe 17.5) se escoge la clase mediana a 59-64 donde LI=59,
2
luego ∑ f 1=13 ( frecuencia acumulada antes de 22 ), f me =9 ( frecuencia donde está la clase mediana), C= 6 ( ancho de clase)
Aquí hay dos modas: ya que la mayor frecuencia f es 10 hay dos casos
1) Moda : Mo=LI + ( ∆1
∆ 1+ ∆ 2 )
C , donde está la mayor f (Moda 1 )
Mo=LI +
( ∆1
∆1 + ∆2)C = 53+
9
(9+1) ( )
∗6= 58.4 excede un poco de 53-58 limites reales 52.5-58.5
Mo=LI +
( ∆1
)
∆1 + ∆2
C = 65+
1
(
(1+7) )
∗6= 65.75 está entre 65-70