Professional Documents
Culture Documents
=
. .
Estadstica I Ing. Nancy Ochoa Sotomayor
2
MEDIA CUADRTICA: Mc
Raz cuadrada de la media aritmtica de los cuadrados de las observaciones
Mc =
N
N
1 i
2
i x
=
=
(
=
N
1 i
2 1
x
2
i
N
1
/
Mc =
N
i
n
1 i
2
i
x
f
=
Ejemplo:
CLASES f X f. Log X
1 15 16 5 15.5 5.9517
2 17 18 9 17.5 11.1873
3 19 20 7 19.5 9.0302
4 21 22 5 21.5 6.6622
5 23 24 2 23.5 2.7421
6 25 26 1 25.5 1.4065
7 27 - 28 1 27.5 1.4393
C = 2 30 38.4193
a) Cul fue el promedio de incremento porcentual de la poblacin por
ao?
n
CI 1 + r CF
CI: Cantidad Inicial
CF: Cantidad Final
n: N. de perodos
1+r: tasa de variacin por periodo
Log G =
30
4193 38.
G = 19.1
En un pas determinado la poblacin en 12-Julio-1981, fue de 17.01 millones
de habitantes y en 11 Julio-1993, 22.05 millones de habitantes.
CF = CI (1 + r)
n
Estadstica I Ing. Nancy Ochoa Sotomayor
3
1+r =
12
01 17
05 22
.
.
1 + r = 1.01219
r = 2.19%
12-Julio-1981 n = 12 aos 11-Julio-1993
CI = 17.01 1 + r =? CF = 22.05
a) Estimar la poblacin para Mayo 2001 suponiendo que (1+r)
permanece constante
Puede calcularse de dos maneras:
Julio-1981 n = 19 10/12 aos Mayo-2001
CI = 17.01 1 + r = 1.0219 CF =?
CF = 17.01 (1.0219)
19 10/12
= 26.14 = 26140,000
Julio-93 n = 7 10/12 aos Mayo-201
CI = 22.05 1 + r =1.0219 CF =?
CF = 22.05 (1.0219)
7 10/12
= 26.13 = 26130,000
b) En qu ao aproximadamente, la poblacin de este pas ser
el doble de Julio-1981?
Julio-81 n =? ?
CI = 17.01 1 + r =1.0219 CF =34.02
n = 32 =
|
.
|
\
|
) Log(1.0219
17.01
34.02
Log
aos Julio-81
32
Julio-2013
1 + r =
n
CI
CF
n =
r) Log(1
CI
CF
Log
+
|
|
.
|
\
|
Estadstica I Ing. Nancy Ochoa Sotomayor
4
c) En qu ao alcanzar los 40 millones de habitantes?
Julio-93 n =? ?
CI = 22.05 1 + r =1.0219 CF =40.00
n = 49 27. =
|
.
|
\
|
) Log(1.0219
22.05
40.00
Log
aos
La media geomtrica, cuyo trabajo es determinar el cambio porcentual
promedio em el tiempo, requiere que primero se determine qu porcentaje de
cada nmero es del mes anterior
Mes
Quejas
% con
respecto al
mes anterior
1
2
3
4
23
41
37
49
-
1.78
0.90
1.32
PER
POBLACION INTERCENSAL (1940, 1961, 1972, 1981 y 1993)
Fecha
Total
Sexo Pobla-
cin
Urbana
%
Tasa de crecimiento
intercensal
Hombres Mujeres Urbana Rural
09-06-40
02-07-61
04-06-72
12-07-81
11-07-93
6207,967
9906,746
13538,208
17005,210
22048,356
3067,868
4925,518
6784,530
8489,867
10956,375
3140,099
4981,228
6753,678
8515,343
11091,981
35.4
47.4
65.2
70.1
70.1
-
2.2
2.9
2.6
2.2
-
3.7
5.0
3.6
2.8
Fuente: Instituto Nacional de Estadstica e Informtica-Direccin Nacional de
Censos y Encuestas
Diario Extra del 08-07-97 INEI al 30-06-97 24371,000 habitantes 1.77%
Julio 2005: 25.7 millones 1.7 crecimiento
27 aos 6 meses
1993 7 meses
------------------------------
2020 13 meses
2021 Enero 2021
2022
El descontento de los empleados de Bates Electronics se refleja en el nmero
de quejas oficiales durante los ltimos cuatro meses: 23, 41, 37 y 49. Con base
en estos datos. Cul es el incremento promedio mensual en las quejas?
G =
3
90).(1.32) (1.78).(0. = 1.28
(1.28 1) x 100 = 28 % de
incremento mensual medio
en quejas
Estadstica I Ing. Nancy Ochoa Sotomayor
5
MEDIA ARMNICA: H
Es la inversa del promedio de las inversas de las variables
H =
N
X
1
1
N
1 i
i
=
Para su aplicacin prctica, es preferible usar la siguiente frmula, derivada de
la anterior que se denomina FRMULA OPERACIONAL de la Media Armnica:
Es decir; el recproco de la Media Armnica es igual al recproco del nmero de
datos por la suma de los recprocos de las variables.
En este caso la magnitud TIEMPO permanece constante, puesto que cubri
las 3 etapas en tiempos iguales. La magnitud DISTANCIA es la que vara
el promedio a usarse es la media aritmtica
72
3
62 83 71
x =
+ +
= Km. / hora
En este caso la magnitud DISTANCIA se mantiene constante; puesto que el
viaje de ida y regreso lo efectu por la misma va. Es la magnitud TIEMPO la
que vara debido a las diferentes velocidades en los 2 viajes el promedio a
usarse es la media armnica:
75
1
100
1
60
1
2
1
H
1
= |
.
|
\
|
+ =
La media armnica es 75 Km. /hora
H =
=
N
1 i
i X
1
N
=
X
1
N
1
H
1
Un automovilista viaja de A a B a C y regresa a A. La distancia de A a B es
71 Km.; la de B a C es 83 Km. y la de C a A es de 62 Km. Si el automovilista
cubri cada una de las 3 etapas en TIEMPOS IGUALES.
Cul fue la velocidad promedio?
Un automovilista viaja de A a B y regresa por la misma ruta. El viaje de ida
lo efectu a 60 Km. por hora y de regreso a 100 Km. por hora.Cul fue su
velocidad promedio en el viaje total?
Estadstica I Ing. Nancy Ochoa Sotomayor
6
COMPROBACIN
60 km / hora 100 km
A B
100 km / hora 100 km
T
AB
= 100/60= 5/3 T
BA
= 100/100= 1 T
TOTAL
= 5/3 + 1 = 8/3 horas
V = 75
3 8
200
=
/
km / hora
Si utilizramos la media aritmtica sera 80
2
100 60
=
+
El CONSUMO es constante, la inversin vara utilizar la x
x = 22
3
36 18 12
=
+ +
centavos / kg.
INVERSIN es constante, vara la cantidad de CONSUMO anual en kilos;
entonces, el promedio a usarse es la media armnica H
18
1
36
1
18
1
12
1
3
1
H
1
= |
.
|
\
|
+ + =
La media armnica es 18 centavos / kg.
COMPROBACIN
Supngase que el fabricante dispone $ 1,000 anuales para la compra de la
materia prima sus compras anuales en Kg. son las siguientes:
333 8
12 0
1000
,
.
= Kg. 555 5
18 0
1000
,
.
= Kg. 778 2
36 0
1000
,
.
= Kg.
El precio promedio de sus compras, puesto que en los 3 aos invirti $3,000
H = 18 0
778 2 555 5 333 8
000 3
.
, , ,
,
=
+ +
$ / Kg.
Un fabricante compra todos los aos la misma cantidad de materia prima, cuyo
precio por kilo ha subido en 3 aos sucesivos de 12 centavos a 18 centavos y a
36 centavos. Cul fue el precio promedio por Kg. que ha pagado el fabricante
en los 3 aos?
El fabricante tiene un presupuesto fijo para la compra de materias primas y,
por lo tanto invierte la misma suma todos los aos. Si los precios fluctuaron
en la forma indicada en el caso anterior. Cul es el precio promedio que ha
pagado el fabricante en dichos 3 aos?
Estadstica I Ing. Nancy Ochoa Sotomayor
7
Obtengamos primero el precio pagado por Kg. de manzanas.
$ 2.50 por 1.0 Kg. 2.5 / 1.0
$ 2.50 por 1.2 Kg. 2.5 / 1.2 INVERSIN CONSTANTE
$ 2.50 por 1.8 Kg. 2.5 / 1.8
--------- ---------
$ 7.50 4.0 Kg.
H = 875 1
5 2
0 4
3
8 1
5 2
1
2 1
5 2
1
0 1
5 2
1
3
. $
.
.
.
.
.
.
.
.
= =
+ +
Si usramos la MEDIA ARITMTICA:
x = 99 1
3
8 1
5 2
2 1
5 2
0 1
5 2
.
.
.
.
.
.
.
=
+ +
COMPROBACIN
Se pag $ 7.50 por 4 kg
H 4 x $ 1.875 = $7.50
x 4 x $ 1.990 = $7.96 Diferencia: 7.96 7.50 = $ 0.46
Cuando se presenta una relacin inversa entre variables implcitas, como por
ejemplo, entre PRODUCTIVIDAD y TIEMPO
e = Pv x t Pv = e x
t
1
Relacin Inversa
e = V x t V = e x
t
1
La Media Armnica es un promedio que tiene poco uso. Para encontrar la
oportunidad de su aplicacin conviene recordar la siguiente regla general:
SI ENTRE 2 MAGNITUDES EXISTE UNA RELACIN DE DEPENDENCIA,
como por ejemplo, entre:
distancia recorrida y tiempo Km / Hora, cm. / seg.
inversin y cantidad $ / Kg., $ / litro
Y: Variable dependiente X: Variable independiente
LMS.- Suponga que se ha comprado en diferentes puestos de un mercado
con $ 2.50: 1 Kg., 1.2 Kg. y 1.8 Kg. de manzanas. Calcular el precio
promedio por kg. de manzanas.
APLICACIONES DE LA H
Estadstica I Ing. Nancy Ochoa Sotomayor
8
Si X permanece constante e Y vara Media Aritmtica
Si X vara e Y permanece constante Media Armnica
DATOS AGRUPADOS
H =
=
n
1 i X
f
N
i
i
Clases f X f / X
1
2
3
4
5
6
7
15 16
17 18
19 20
21 22
23 24
25 26
27 - 28
5
9
7
5
2
1
1
15.5
17.5
19.5
21.5
23.5
25.5
27.5
30 1.5892
*La suma algebraica de las desviaciones de los recprocos de las
observaciones del recproco de la media armnica es nula
0 )
H
1
X
1
(
n
1 i
i
=
=
*La media armnica se basa en todas las observaciones, por lo que
est afectada por los valores extremos
Pero da a los valores grandes un peso menor que el que da la G;
mientras que a los valores menores pequeos, les da un peso
mayor que el que da la x y la G
*La H no est definida, si alguno de los valores es cero.
Y
DEPENDIENTE
X
INDEPENDIENTE
DISTANCIA TIEMPO
INVERSIN CANTIDAD
Y VARA X CONSTANTE
Y CONSTANTE X VARA
x
H
H =
5892 1
30
.
H = 18.9
Estadstica I Ing. Nancy Ochoa Sotomayor
9
B
60 Km/h 70 Km /h
A C
80 Km/h
0 69
5 36
3 x 840
V
T
d
ABC
ABC
.
.
= = = Km. / hora
0 69
80
1
70
1
60
1
3
80
840
70
840
60
840
3 x 840
V . =
+ +
=
+ +
= Km. / hora
e= 150 Km. e = 250 Km.
Lima Huacho Chimbote
t = 2 horas t = 2.5 horas
v = 75 km/h v= 100 km /h
8 88
h Km 100
Km 250
h Km 75
Km 150
Km 400
V .
/ /
=
+
= km /h
2 velocidad
2 ..parcial Distancia.
1 velocidad
1 ..parcial Distancia.
..TOTAL DISTANCIA.
V
=
Las ciudades A, B y C son equidistantes entre s. Un automovilista viaja de A a B a
60 Km. / h; de B a C 70 Km. / h y de C a A 80 Km. / h. Determinar el promedio de
la velocidad para el viaje completo
Suponiendo que el recorrido ABC sea de
840 Km. x 3 =
d
ABC
14
60
840
t
AB
= = h
12
70
840
t
BC
= = h
5 10
80
840
t
AC
. = = h
------------------------
TABC
= 36.5 horas
Un automovilista de Lima a Huacho (150 KM) lo recorre en 2 horas y de
Huacho a Chimbote (250 Km.) lo recorre en 2.5 horas. Calcular la
velocidad promedio del automovilista de Lima a Chimbote
Estadstica I Ing. Nancy Ochoa Sotomayor
10
RELACIN ENTRE x , G, H y Mc
( )
0 2xy
y
2
x
2
0
y x
2
> + >
+
>
De ( o ) :
+
>
+
>
+
>
+
>
y
1
x
1
2
xy
xy
y
xy
x
2
xy
xy
y x
2
xy
2
y x
xy
xy
( )
0 2xy
y
2
x
2
0
y x
2
> + >
+ > + + xy 2 xy 2 xy 2
y
x
2
2
( )
y x
2xy
2
y x
4xy y) y)(x (x 4xy
y x
2
+
>
+
> + + >
+
xy
y
xy
x
2
2
y x
+
>
+
+
>
+
y
1
x
1
2
2
y x
( )
+ + > +
+
+ > + >
b
2
a
2
2ab
b
2
a
2
b
2
a
2
2ab
b
2
a
2
0
b a
2
( ) ( )
4
b a
2
2
b
2
a
2
4
b a
2
4
)
b
2
a
2
2( +
>
|
.
|
\
|
+
+
>
+
+
>
+
2
b a
2
b
2
a
2
Si:
y x
xy 2
xy
+
=
x > G
G > H
x > H
Mc > x
Mc =
2
x
2
Mc x > G > H
Estadstica I Ing. Nancy Ochoa Sotomayor
11
MEDIDAS DE DISPERSIN
Las medidas de tendencia central no son suficientes para expresar o
caracterizar una distribucin. Se necesitan de otras medidas que nos indiquen
la dispersin o variabilidad de las observaciones
La dispersin se relaciona con la mayor o menor concentracin de datos en
torno a una medida central o promedio
Su importancia radica en:
a) Se utilizan para mostrar el grado de variacin entre los valores de los
datos estadsticos
Ejemplo: Una baja dispersin de los salarios de un grupo de
trabajadores en una fbrica, indicar que a estos trabajadores le son
pagados aproximadamente salarios iguales. Por otro lado, una alta
dispersin dar la impresin de que los trabajadores son pagados con
amplia variacin de salarios.
b) Pueden ser utilizados para suplementar un promedio y para describir un
grupo de datos o compararlo con otros
Ejemplo: 1 2 12 x = 5
No es importante ALTA DISPERSIN Heterogneos
1 2 3 4 5 6 7 8 9 10 11 12
4 5 6 x = 5
Si es importante BAJA DISPERSIN Homogneos
4 5 6
Una medida de dispersin puede ser expresada
a) VALOR ABSOLUTO ( DISPERSIN ABSOLUTA)
R: Rango o recorrido
DM: Desviacin Media
RP: Rango Percentlico
RQ: Rango Cuartlico
S: Desviacin Estndar
V(x): varianza
Q: Desviacin semintercuartlica
b) VALOR RELATIVO (DISPERSIN Relativa)
CV: Coeficiente de variacin
Estadstica I Ing. Nancy Ochoa Sotomayor
12
RANGO o RECORRIDO. R
El recorrido de una variable est definido como la diferencia entre el valor
mayor y el valor menor:
R = VMay Vmen +1 Datos discretos
R = VMay Vmen Datos Continuos
Es la medida ms simple y se utiliza cuando solo se quiere una comparacin
rpida entre distribuciones o conjunto de datos (para ver su heterogeneidad,
como una primera idea)
El inconveniente que tiene al utilizarse, es que solo toma los valores extremos
dejando de lado el conjunto de valores intermedios
RANGO PERCENTLICO: RP
Se utiliza para calcular la altura o elevacin de la curva de una distribucin de
frecuencias respecto a la curva normal y representa el 80% de datos
(centrales)
F
90 %
N
10
8
10 %
80%
RP = P
90
P
10
N
10
9
N
10
1
P10
P90
Estadstica I Ing. Nancy Ochoa Sotomayor
13
RANGO CUARTLICO: RQ
Se utiliza para calcular el rango semi-intercuartlico y representa el 50% de
datos (centrales)
1/4 de las 1/4 de las
Observacin Observaciones Observaciones Observacin
Ms baja Q
1
Q
3
ms lata
Primer Cuartil Mediana Tercer Cuartil
F
75 %
N
4
2
25 %
50%
RQ = Q
3
Q
1
N
4
3
N
4
1
Q
1
Q
3
Estadstica I Ing. Nancy Ochoa Sotomayor
14
DESVIACIN SEMI-INTERCUARTLICO
Si la distribucin es simtrica, se considera que en el intervalo:
( x Q) = ( x - Q, x + Q)
Estn concentrados el 50% de los datos
centrales
F
N / 2
50%
Md
f
50%
-Q +Q
Q x
Q =
2
Q
Q
3 1
Estadstica I Ing. Nancy Ochoa Sotomayor
15
DESVIACIN MEDIA
Se define como la media aritmtica de las desviaciones respecto a la media,
sin tener en cuenta los signos; es decir, tomando el valor absoluto
Pueden tomarse otros promedios, como por ejemplo la mediana
DATOS AGRUPADOS
Si la distribucin de frecuencias es bastante grande y simtrica, se considera
que en el intervalo
( x DM) = ( x- DM, x+ DM)
Estn concentrados el 58 % de los datos
58%
-DM x +DM
x DM)
DM =
N
x
N
1 i
i x
=
DM =
N
x
n
1 i
i x
=
f
i
Estadstica I Ing. Nancy Ochoa Sotomayor
16
CLCULO DE Q PARA DATOS NO AGRUPADOS
A) CUANDO N ES MLTIPLO DE 4
Calcular Q de: 5 , 7 , 12 , 8 , 10 , 6 , 11, 12
Ordenando:
5 6 7 8 10 11 12 12
Q
1
Q
3
Q
1
= 5 6
2
7 6
. =
+
Q = 5 2
2
5 6 5 11
.
. .
=
Q
3
=
B) CUANDO N NO ES MLTIPLO DE 4
Q
i
= i
4
N
= E
4
i
i = 1, 2, 3.
Fraccin
Entero
Sea X el nmero de orden
1) FRACCIN =
4
1
Q
i
=
4
1
X
E
+
4
3
X
E+1
2) FRACCIN =
4
2
Q
i
= X
E+1
3) FRACCIN =
4
3
Q
i
=
4
3
X
E+1
+
4
1
X
E+2
Q
1
= i
4
N
=
4
11
= 2
4
3
FRACCIN = 3/4
Q
1
=
4
3
X
2+1
+
4
1
X
2+2
=
4
3
X
3
+
4
1
X
4
= 14.5 (16)
4
1
(14)
4
3
= +
5 11
2
12 11
. =
+
Calcular Q de: 8 10 14 16 24 34 40 48 54 64 70
X
1
X
2
X
3
X
4
X
5
X
6
X
7
X
8
X
9
X
10
X
11
Estadstica I Ing. Nancy Ochoa Sotomayor
17
Q
3
= i
4
N
= 3
4
11
=
4
33
= 8
4
1
FRACCIN = 1/4
Q
3
=
4
3
X
8+1
+
4
1
X
8
=
4
3
X
9
+
4
1
X
8
= 52.5 (48)
4
1
(54)
4
3
= +
Q = 0 19
2
5 14 5 52
.
. .
=
VARIANZA: V(x), S
2
,
2
Es el promedio del cuadrado de las desviaciones respecto a la media aritmtica
MTODO GENERAL, BSICO, ORIGINAL
Desarrollando:
Hallar la S
2
de 2, 6,7 y 9
4
6
24
x = =
5 6
4
26
S
2
. = =
5 6
2
4
170
6 S
2
. = =
X
X - x (X - x )
2
X
2
2
6
7
9
-4
0
1
3
16
0
1
9
4
36
49
81
24 0 26 170
( )
N
x
X
i
S
2
N
1 i
2
=
=
X
N
X
i
S
2
2
2
N
1 i
=
=
Estadstica I Ing. Nancy Ochoa Sotomayor
18
DATOS AGRUPADOS
Desarrollando:
MTODOS ABREVIADOS
A) MTODO DE LAS DESVIACIONES
|
|
|
.
|
\
|
=
=
=
N
d
i
f
i
2
N
di f
s
2
n
1 i
n
1 i
2
i
B) MTODO CLAVE
(
(
(
(
(
(
(
=
|
|
|
|
.
|
\
|
=
=
N
u f
2
N
u f
c s
i
n
1 i
i
i i
n
1 i
2 2
PROPIEDADES
1) x , V(x) 0
2) V (K) = 0; K es constante
3) V(X K) = V (X)
4) V (K X) = K
2
V(X)
5) V (KX + b) = K
2
V(X), K y b son constantes
( )
N
x
X
f
S
2
i
2
n
1 i
i
=
=
x
f
2
N
n
1 i
X
2
S
2
i i
=
=
Estadstica I Ing. Nancy Ochoa Sotomayor
19
USOS FRECUENTES DE LA DESVIACIN ESTNDAR
Como se ha enfatizado, la desviacin estndar es til para describir un
conjunto de datos midiendo el grado de dispersin de las observaciones
individuales alrededor de su media. Existen dos aplicaciones adicionales para
la desviacin estndar
(1) Teorema de Chebyshev
(2) Regla emprica
(1) TEOREMA DE CHEBYSHEV (Tchebysheff)
Formulado por el matemtico ruso P. L. Chebyshev (1821-1899)
Establece que para todo conjunto de datos, por lo menos (1 -
k
2
1
) %de las
observaciones estn dentro de K desviaciones estndar de la media, en donde
k es cualquier nmero mayor que 1. El teorema de Chebyshev se expresa
como:
Ejemplo:
La Empresa TRANSP, revel que tiene una media de pasajeros por vuelta igual
a 78.7 pasajeros con una desviacin estndar de 12.14. Para programar los
tiempos para una nueva ruta que abri TRANSP, la Gerencia desea saber con
que frecuencia los pasajeros estn dentro de K =2S y cul es dicho intervalo.
SOLUCIN
Si se transportan 2S (2x12.14)=24.28 pasajeros por encima y por debajo de la
media =78.7 pasajeros, se tendr un intervalo de (78.7 24.28)=54.42 a (78.7
+24.28)= 102.98 pasajeros
Se puede estar seguro de que por lo menos: 1 -
(
(
2
2
1
=75 % del tiempo, el
nmero de pasajeros diarios estuvo entre 54 y 103
Interpretacin:
En por lo menos el 75% de los das (es decir, 75% de 50 es igual a 37 das), el
nmero de pasajeros estuvo entre 54 y 103. Esto proporciona a la gerencia de
TRNSP una valiosa informacin sobre para cuntos pasajeros deben
prepararse en trmino de operaciones en transportes.
TEOREMA DE CHEBYSHEV 1 -
(
(
k
2
1
Estadstica I Ing. Nancy Ochoa Sotomayor
20
(2) REGLA EMPRICA, para distribuciones simtricas
a) El 68.27 % de los casos estn comprendidos en intervalo:
X 1 S
(
X - 1 S,
X +1 S) 68.27 %
68.27%
X - 1 S
X 1 S
b) El 95.45 % de los casos estn comprendidos en intervalo:
X 2S
(
X - 2S,
X +2 S) 95.45 %
95.45%
X - 2S
X 2S
c) El 99.73 % de los casos estn comprendidos en intervalo:
X 3S
(
X -3S,
X + 3S) 99.73 %
99.73%
X - 3S
X 3 S
Q ~
3
2
S
DM ~
5
4
S
Estadstica I Ing. Nancy Ochoa Sotomayor
21
COMPONENTES DE LA VARIANZA
Si un conjunto de datos ha sido divididos en categora o estratos, es posible
obtener 2 componentes de la varianza
Si se ha dividido en K estratos, cada uno de los cuales tiene una
X , una
varianza y un nmero de observaciones que indica la importancia de cada uno
de ellos.
En este caso la variabilidad total puede deberse tanto a la variabilidad dentro
de cada estrato, como a la variabilidad entre los diferentes estratos
INTERVARIANZA:
Se
2
Es el estadstico que representa la variabilidad entre los estratos y se define
como la varianza de las medias de los estratos
INTRAVARIANZA:
Sa
2
Es el estadstico que representa la variabilidad dentro de los estratos y se
define como el promedio de las varianzas de los estratos.
S
2
T
=
S
2
a
+
S
2
e
N
1
N
2
N
k
x1
x2
xK
s
2
1
s
2
2
s
2
K
N =
=
K
1 i
i
N
Se
2
= V (
xi
) =
N
X
i
2
Ni
K
1 i
|
.
|
\
|
=
=
X
Xi
:
X del estrato i
=
X:
X General
N
i
: N de observaciones de cada
estrato
Sa
2
= M (
Si
2
) =
N
Ni S
i
k
1 i
2
=
S
2
i
: Varianza del estrato i
Estadstica I Ing. Nancy Ochoa Sotomayor
22
Ejemplo:
En una pequea empresa que se dedica a la fabricacin de productos
metalmecnicos, tiene la siguiente conformacin de su personal:
OPERARIOS 200 300 300 300 400 SUELDOS
MENSUALES
$
TCNICOS 300 400 500 500 500 600 600 600
EMPLEADOS 300 500
Se calcula la media y la varianza de todos los empleados, tcnicos y operarios
(todo el personal)
Sueldos
X
Personal
f
f X
f X
2
u
f u
f u
2
200 1 -2 -2 4
300 5 -1 -5 5
A=400 2 0 0 0
500 4 1 4 4
600 3 2 6 12
15 6300 2890,000 3 25
MEDIA GENERAL:
=
XT
= 420
15
6300
N
fx
= =
=
XT
= A + c
N
fu
=
|
|
.
|
\
|
6 16,266.
420
15
2'890,000
N
fx
S
2
T
2
X
2
T
( )
= =
=
(
(
(
(
(
(
|
.
|
\
|
|
.
|
\
|
6 16,266.
15
3
2
15
25
100
2
N
fu
2
N
u
2
f
c
2
S
2
T
S
2
T
=
N
X
X N S Ni i
2
i
2
i
K
1 i
K
1 i
|
|
.
|
\
|
=
= =
Estadstica I Ing. Nancy Ochoa Sotomayor
23
Organizando por estratos (personal: operarios, empleados y tcnicos) y
obtenemos la media y varianza de cada estrato
ESTRATOS
TAMAO
N
i
MEDIA
xi
VARIANZA
s
2
i
OPERARIOS 5 300 4,000
TCNICOS 8 500 10,000
EMPLEADOS 2 400 10,000
15
( ) ( ) ( ) ( ) ( )
000 4
5
300 500
2
300 400
2
300 300
2
300 300
2
300 300
2
S
2
1
, =
=
( ) ( ) ( )
000 10
8
500 400
2
500 600
2
3
500 500
2
3
S
2
2
, =
=
( ) ( )
000 10
2
400 500
2
400 300
2
S
2
3
, =
=
FRMULA UTILIZADA
N
X
i
X
i
2
Ni
S
2
i
=
|
.
|
\
|
La media ponderada ser:
=
X = 420
2 8 5
2(400) 8(500) 5(300)
N
Xi Ni
K
1 i
=
+ +
+ +
=
=
Se
2
=
( ) ( ) ( )
=
6 266 8
15
420 400
2
2
420 500
2
8
420 300
2
5
. ,
Sa
2
= 8,000
15
2(10000) 8(10000) 5(4000)
=
+ +
S
2
T
=8,266. 6 + 8,000 = 16,266. 6
Estadstica I Ing. Nancy Ochoa Sotomayor
24
Estos resultados nos permiten, concluir que la variabilidad se debe en
proporcin casi iguales a la heterogeneidad en los sueldos dentro de los
estratos y a la heterogeneidad de los diferentes estratos.
----------------------------------------------------------------------------------------------------------
Supongamos que: 000 100
Sa
2
, = y
Se
2
= 2,000
La variabilidad se debe principalmente a la heterogeneidad de los sueldos
dentro de los estratos y no as a diferencias entre estratos. En otras palabras:
Los sueldos promedios de cada estrato, son bastante homogneas ya que la
intervarianza es pequea, mientras que las remuneraciones dentro de cada
estrato son muy heterogneas, puesto que la intravarianza es bastante grande
Ver pgina 41 3ra. Impresin
Manrique & Ochoa Estadstica
S
2
T
= 6 16,266.
(420)
2
15
)
400
2
2(10000 )
500
2
8(10000 )
300
2
5(4000
=
+ + + +
S
2
T
=
15
420) (400
2
2
420) (500
2
8
420) (300
2
5 2(10000) 8(10000) 5(4000)
+
+ + +
S
2
T
= 16,266. 6
S
2
T
=
=
|
|
.
|
\
|
=
X
N
X
S
2
i
Ni
2
T
2
T
K
1 i
S
2
T
=
N
X
X N S Ni i
2
i
2
i
K
1 i
K
1 i
|
|
.
|
\
|
=
= =
Estadstica I Ing. Nancy Ochoa Sotomayor
25
COEFICIENTE DE VARIACIN: CV
Es una dispersin relativa que mide el grado de homogeneidad de un conjunto
de datos
Se considera homogneo a un conjunto de datos, cuando tiene una mayor
concentracin alrededor de la media aritmtica
En estudio de Tiempos, se considera homogneos a los tiempos observados
cuando el CV es menor o igual al 6%
CV 6%
MITAC En la prctica, se acostumbra a considerar que CV superior al 50%
indica un alto grado de dispersin, y consecuentemente, pequea
representatividad de la media aritmtica. En cuanto a valores inferiores a 50%,
la media ser tanto ms representativa, cuanto menor sea el CV
Cuando las variables de dos distribuciones se expresan en unidades diferentes
(ao, centmetros) no tiene sentido comparar los estadsticos de dispersin de
diferentes unidades, pues ellos quedan influenciados por dichas unidades. Esto
puede superarse mediante el CV, ya que ste, no tiene unidad
CV1
CV2
CV1 > CV2 los datos de la distribucin 1 estn ms dispersos
Ms heterogneos
Ms homogneos
CV =
X
S
x 100
Estadstica I Ing. Nancy Ochoa Sotomayor
26
Dos marcas de zapatos para correr fueron evaluadas en cuanto a uso y
desgaste. Cada una report los siguientes nmeros de horas de uso antes que
se detectara un desgaste significativo
Marca A Marca B
97
83
75
82
98
65
75
78
56
87
54
89
65
SB
= 14.0 CV A = 13.5% CVB = 19.6 %
MOMENTOS
Sean X
1
, X
2
, X
3
,, X
N
, los valores de la variable X
El momento de orden r con respecto a un valor cualquiera, est definido
por:
a) Cul zapato parece presentar mayor
desgaste?
b) Cul zapato parece tener un programa de
control de calidad que produzca la mejor
consistencia en su desgaste?
XA
=82.1
XB
= 71.5
SA
= 11.1
M
r
(K) =
( )
N
K
x
i
N
1 i
r
=
a) Momento respecto al origen
Cuando K = 0
r = 1, 2, 3,
b) Momento respecto a la MEDIA
x
r
=
' Mr
=
N
r
x
M
r
=
m
r
N
x)
x
i
(
r
=
Estadstica I Ing. Nancy Ochoa Sotomayor
27
Para DATOS AGRUPADOS
m
r
=
' m0
= 1
N
x
0
=
m
0
= 1
' m1
= x
N
x
1
=
m
1
= 0
' m 2
=
x
x
2
2
N
=
m
2
= S
2
RELACIN ENTRE MOMENTOS
m
1
= 0
m
2
= m
2
2
m
3
= m
3
3 m
2
+ 2
3
m
4
= m
3
4 m
3
+ 6 m
2
2
- 3
4
Hallar los 4 primeros momentos con respecto al origen y a la media
de los siguientes nmeros: 3, 4, 8, 9, 11
r=1 m
1
= x = 7
5
11 9 8 4 3
=
+ + + +
r=2 m
2
=
x
2
=
5
11
2
9
2
8
2
4
2
3
2
+ + + +
= 58.2
r=3 m
3
=
x
3
=
5
11
3
9
3
8
3
4 3
3 3
+ + + +
= 532.6
r=4 m
4
=
x
4
=
5
11
4
9
4
8
4
4
4
3
4
+ + + +
= 5127
r=1 m
1
= 0
' m r
=
x
r
=
' Mr
=
N
r
f.x
m
r
= M
r
=
N
x)
x
i
( f
i
r
Estadstica I Ing. Nancy Ochoa Sotomayor
28
r=2 m
2
=
( ) ( ) ( ) ( ) ( )
2 9
5
7 11
2
7 9
2
7 8
2
7 4
2
7 3
2
. =
r=3 m
3
=
( ) ( ) ( ) ( ) ( )
6 3
5
7 11
3
7 9
3
7 8
3
7 4
3
7 3
3
. =
r=4 m
4
=
( ) ( ) ( ) ( ) ( )
122
5
7 11
4
7 9
4
7 8
4
7 4
4
7 3
4
=
Comprobando:
m
1
= 0
m
2
= m
2
2
= 58.7 (7)
2
= 9.2
m
3
= m
3
3 m
2
+ 2
3
= 532.6 -3(58.2) 7 +2 (7)
3
= -3.6
m
4
= m
3
4 m
3
+ 6 m
2
2
- 3
4
=5127- 487x532.6)+6 (7)
2
(58.2)-
3(7)
4
=122
DEFORMACIN DE LA CURVA ESTADSTICA
A) COEFICIENTE DE ASIMETRA O SESGO
Mide la inclinacin de la curva estadstica con respecto a la curva normal
Mo Mo
x x
Md Md
x > Md > Mo x = Md = Mo x < Md < Mo
SESGO POSITIVO SESGO NULO SESGO NEGATIVO
As > 0 As = 0 As < 0
Sesgada hacia la derecha Sesgada hacia la izquierda
+
0
-
Estadstica I Ing. Nancy Ochoa Sotomayor
29
COEFICIENTE DE PEARSON
COEFICIENTE DE ARTHUR BOWLEY
Variar de -1 a +1 Boowley advirti que un valor de 0.1 puede ser considerado
como un grado moderado de asimetra y un valor de 0.3 como una marcada
asimetra
COEFICIENTE DE FISCHER
( )
N
x X
3
m3
=
S
2
m
2
=
( ) ( )
S
3
2
S
2
3
m
3
2
= =
S
3
m
3
2
=
As
1
=
S
Mo x
As
2
=
( )
S
Md x 3
As =
( ) ( )
Q Q
Q Q Q Q
1 3
1 2 2 3
As =
a
m
3
3
3
S
=
Estadstica I Ing. Nancy Ochoa Sotomayor
30
B) COEFICIENTE DE KURTOSIS
Mide el grado de elevacin de la curva estadstica con respecto a la curva
normal
MS
ALTA
NORMAL MS BAJA
LEPTOKURTICA MESOKURTICA PLATIKURTICA
K > 0.263 K = 0.263 K < 0.263
a4
> 3
a4
= 3
a4
< 3
K =
P P 10 90
Q
K =
a4
=
S
4
4 m
Estadstica I Ing. Nancy Ochoa Sotomayor
31
Clases f X F fx f x
2
f x
3
f x
4
d fd f d
2
u fu f u
2
f i
x
i x
( ) x
x
i
fi
2
( ) x
x
i
fi
3
( ) x
x
i
fi
4
13-15 6 14 6 -6 -36 216 -2 -12 24
16-18 8 17 14 -3 -24 72 -1 -8 8
19-21 16 20 30 0 0 0 0 0 0
22-24 12 23 42 3 36 108 1 12 12
25-27 8 26 50 6 48 288 2 16 32
c=3 50 1024 21644 470380 10472564 24 684 8 76 148.80 672.48 -433.90 19664.799
x = 20.4800 Respecto al origen
Mo=20.5000 4800 20
m
1
1
. =
Md=20.5625 8800 432
m
1
2
. =
Q
1
= 17.9375 6000 9407
m
1
3
. =
Q
3
=23.3750 28 209451
m
1
4
. =
P10
=15.0000
P90
=25.6250
4496 13
S
2
. =
DM=2.976
Q=2.7188
CV=17.9071
Respecto a la media
m
1
=0 m
2
=13.4496
m
3
=-8.678 m
4
=393.2960 K = 0.2559
As
1
= -0.0055
As
2
=-0.0675
As=0.0345 (Bowley)
As=-0.1759 (Fischer)
Estadstica I Ing. Nancy Ochoa Sotomayor
32
a
4
= 2.174
Estadstica I Ing. Nancy Ochoa Sotomayor
33
Cuadro de datos
Da Pana-
dero
Mquina N 1 Mquina N 2
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
A
A
A
B
B
A
A
B
B
B
A
B
B
A
A
A
B
B
B
A
209.20 209.50 210.20 212.00
208.50 208.70 206.20 207.80
204.20 210.20 210.50 205.90
204.00 203.30 198.20 199.90
209.60 203.70 198.20 209.60
208.10 207.90 211.00 206.20
205.20 204.80 198.70 205.80
199.00 197.70 202.00 213.10
197.20 210.60 199.50 215.30
199.10 207.20 200.80 201.20
204.60 207.00 200.80 204.60
214.70 207.50 205.80 200.90
204.10 196.60 204.60 199.40
200.20 205.50 208.00 202.70
201.10 209.20 205.50 200.00
201.30 203.10 196.30 205.50
202.20 204.40 202.10 206.60
194.10 211.00 208.40 202.60
204.80 201.30 208.40 212.30
200.60 202.30 204.30 201.40
214.30 221.80 214.60 214.40
215.30 216.70 212.30 212.00
215.70 213.80 215.20 202.70
212.50 210.20 211.30 210.40
208.40 214.90 212.80 214.80
212.30 216.20 208.40 210.80
208.10 211.90 212.90 209.00
207.50 209.90 210.60 212.30
206.90 207.10 213.60 212.20
209.60 209.50 206.80 214.20
212.20 209.80 207.60 212.60
211.40 211.20 214.40 212.60
209.60 209.20 206.10 207.10
203.50 206.90 210.60 212.30
209.10 206.30 209.80 211.40
208.00 207.90 205.30 203.60
210.00 209.40 209.10 207.00
215.60 211.80 205.40 209.00
214.50 207.50 212.90 204.30
209.10 205.80 212.00 204.20