You are on page 1of 33

Estadstica I Ing.

Nancy Ochoa Sotomayor


1
MEDIA GEOMTRICA: G


Es la raz N-sima del producto de N nmeros
Se utiliza para promediar tasas de variacin (capital y poblacin) y sirve de
base para la frmula del inters compuesto

G =
N
...X
X
.
X
.
X
3 2 1 N







Hallar la media geomtrica de: 2, 4, y 8

G = 4 64 8 x 4 x 2
3 3
= =

Si uno de los nmeros es cero G = 0

DATOS AGRUPADOS


G =
N
n n n 2 2 2 1 1 1 X
...
X X
...
X
...
X X
.
X
...
X X



f
1
veces f
2
veces f
n
veces


G =
| |
X
f
X
f
X
f
n
n
2
2
1
1
N
1
... .
=
N
n
1 i
i
i
X
f
[
=


Log. G =
N
1
(f
1
Log. X
1
+ f
2
Log. X
2
++ f
n
Log. X
n
)














G =
N
X
N
1 i
i
[
=


Log G =
N
n
Xi
Log
f i
1 i

=
. .

Estadstica I Ing. Nancy Ochoa Sotomayor
2
MEDIA CUADRTICA: Mc

Raz cuadrada de la media aritmtica de los cuadrados de las observaciones

Mc =
N
N
1 i
2
i x

=
=
(


=
N
1 i
2 1
x
2
i
N
1
/


Mc =
N
i
n
1 i
2
i
x
f

=


Ejemplo:
CLASES f X f. Log X
1 15 16 5 15.5 5.9517
2 17 18 9 17.5 11.1873
3 19 20 7 19.5 9.0302
4 21 22 5 21.5 6.6622
5 23 24 2 23.5 2.7421
6 25 26 1 25.5 1.4065
7 27 - 28 1 27.5 1.4393
C = 2 30 38.4193






a) Cul fue el promedio de incremento porcentual de la poblacin por
ao?







n

CI 1 + r CF

CI: Cantidad Inicial
CF: Cantidad Final
n: N. de perodos
1+r: tasa de variacin por periodo




Log G =
30
4193 38.


G = 19.1
En un pas determinado la poblacin en 12-Julio-1981, fue de 17.01 millones
de habitantes y en 11 Julio-1993, 22.05 millones de habitantes.

CF = CI (1 + r)
n


Estadstica I Ing. Nancy Ochoa Sotomayor
3
1+r =
12
01 17
05 22
.
.
1 + r = 1.01219
r = 2.19%



12-Julio-1981 n = 12 aos 11-Julio-1993


CI = 17.01 1 + r =? CF = 22.05


a) Estimar la poblacin para Mayo 2001 suponiendo que (1+r)
permanece constante

Puede calcularse de dos maneras:

Julio-1981 n = 19 10/12 aos Mayo-2001

CI = 17.01 1 + r = 1.0219 CF =?

CF = 17.01 (1.0219)
19 10/12
= 26.14 = 26140,000


Julio-93 n = 7 10/12 aos Mayo-201

CI = 22.05 1 + r =1.0219 CF =?

CF = 22.05 (1.0219)
7 10/12
= 26.13 = 26130,000

b) En qu ao aproximadamente, la poblacin de este pas ser
el doble de Julio-1981?

Julio-81 n =? ?

CI = 17.01 1 + r =1.0219 CF =34.02








n = 32 =
|
.
|

\
|
) Log(1.0219
17.01
34.02
Log
aos Julio-81
32

Julio-2013

1 + r =
n
CI
CF

n =
r) Log(1
CI
CF
Log
+
|
|
.
|

\
|

Estadstica I Ing. Nancy Ochoa Sotomayor
4

c) En qu ao alcanzar los 40 millones de habitantes?

Julio-93 n =? ?

CI = 22.05 1 + r =1.0219 CF =40.00

n = 49 27. =
|
.
|

\
|
) Log(1.0219
22.05
40.00
Log
aos









La media geomtrica, cuyo trabajo es determinar el cambio porcentual
promedio em el tiempo, requiere que primero se determine qu porcentaje de
cada nmero es del mes anterior


Mes

Quejas
% con
respecto al
mes anterior
1
2
3
4
23
41
37
49
-
1.78
0.90
1.32


PER
POBLACION INTERCENSAL (1940, 1961, 1972, 1981 y 1993)



Fecha


Total
Sexo Pobla-
cin
Urbana
%
Tasa de crecimiento
intercensal
Hombres Mujeres Urbana Rural
09-06-40
02-07-61
04-06-72
12-07-81
11-07-93
6207,967
9906,746
13538,208
17005,210
22048,356
3067,868
4925,518
6784,530
8489,867
10956,375
3140,099
4981,228
6753,678
8515,343
11091,981
35.4
47.4
65.2
70.1
70.1
-
2.2
2.9
2.6
2.2
-
3.7
5.0
3.6
2.8
Fuente: Instituto Nacional de Estadstica e Informtica-Direccin Nacional de
Censos y Encuestas
Diario Extra del 08-07-97 INEI al 30-06-97 24371,000 habitantes 1.77%
Julio 2005: 25.7 millones 1.7 crecimiento
27 aos 6 meses

1993 7 meses
------------------------------
2020 13 meses
2021 Enero 2021
2022
El descontento de los empleados de Bates Electronics se refleja en el nmero
de quejas oficiales durante los ltimos cuatro meses: 23, 41, 37 y 49. Con base
en estos datos. Cul es el incremento promedio mensual en las quejas?
G =
3
90).(1.32) (1.78).(0. = 1.28

(1.28 1) x 100 = 28 % de
incremento mensual medio
en quejas
Estadstica I Ing. Nancy Ochoa Sotomayor
5

MEDIA ARMNICA: H

Es la inversa del promedio de las inversas de las variables
H =
N
X
1
1
N
1 i
i

=


Para su aplicacin prctica, es preferible usar la siguiente frmula, derivada de
la anterior que se denomina FRMULA OPERACIONAL de la Media Armnica:





Es decir; el recproco de la Media Armnica es igual al recproco del nmero de
datos por la suma de los recprocos de las variables.








En este caso la magnitud TIEMPO permanece constante, puesto que cubri
las 3 etapas en tiempos iguales. La magnitud DISTANCIA es la que vara
el promedio a usarse es la media aritmtica

72
3
62 83 71
x =
+ +
= Km. / hora






En este caso la magnitud DISTANCIA se mantiene constante; puesto que el
viaje de ida y regreso lo efectu por la misma va. Es la magnitud TIEMPO la
que vara debido a las diferentes velocidades en los 2 viajes el promedio a
usarse es la media armnica:


75
1
100
1
60
1
2
1
H
1
= |
.
|

\
|
+ =

La media armnica es 75 Km. /hora
H =

=
N
1 i
i X
1
N

=
X
1
N
1
H
1

Un automovilista viaja de A a B a C y regresa a A. La distancia de A a B es
71 Km.; la de B a C es 83 Km. y la de C a A es de 62 Km. Si el automovilista
cubri cada una de las 3 etapas en TIEMPOS IGUALES.
Cul fue la velocidad promedio?
Un automovilista viaja de A a B y regresa por la misma ruta. El viaje de ida
lo efectu a 60 Km. por hora y de regreso a 100 Km. por hora.Cul fue su
velocidad promedio en el viaje total?
Estadstica I Ing. Nancy Ochoa Sotomayor
6
COMPROBACIN

60 km / hora 100 km
A B

100 km / hora 100 km

T
AB
= 100/60= 5/3 T
BA
= 100/100= 1 T
TOTAL
= 5/3 + 1 = 8/3 horas

V = 75
3 8
200
=
/
km / hora
Si utilizramos la media aritmtica sera 80
2
100 60
=
+







El CONSUMO es constante, la inversin vara utilizar la x

x = 22
3
36 18 12
=
+ +
centavos / kg.







INVERSIN es constante, vara la cantidad de CONSUMO anual en kilos;
entonces, el promedio a usarse es la media armnica H


18
1
36
1
18
1
12
1
3
1
H
1
= |
.
|

\
|
+ + =
La media armnica es 18 centavos / kg.

COMPROBACIN

Supngase que el fabricante dispone $ 1,000 anuales para la compra de la
materia prima sus compras anuales en Kg. son las siguientes:

333 8
12 0
1000
,
.
= Kg. 555 5
18 0
1000
,
.
= Kg. 778 2
36 0
1000
,
.
= Kg.

El precio promedio de sus compras, puesto que en los 3 aos invirti $3,000
H = 18 0
778 2 555 5 333 8
000 3
.
, , ,
,
=
+ +
$ / Kg.

Un fabricante compra todos los aos la misma cantidad de materia prima, cuyo
precio por kilo ha subido en 3 aos sucesivos de 12 centavos a 18 centavos y a
36 centavos. Cul fue el precio promedio por Kg. que ha pagado el fabricante
en los 3 aos?
El fabricante tiene un presupuesto fijo para la compra de materias primas y,
por lo tanto invierte la misma suma todos los aos. Si los precios fluctuaron
en la forma indicada en el caso anterior. Cul es el precio promedio que ha
pagado el fabricante en dichos 3 aos?
Estadstica I Ing. Nancy Ochoa Sotomayor
7




Obtengamos primero el precio pagado por Kg. de manzanas.

$ 2.50 por 1.0 Kg. 2.5 / 1.0
$ 2.50 por 1.2 Kg. 2.5 / 1.2 INVERSIN CONSTANTE
$ 2.50 por 1.8 Kg. 2.5 / 1.8
--------- ---------
$ 7.50 4.0 Kg.
H = 875 1
5 2
0 4
3
8 1
5 2
1
2 1
5 2
1
0 1
5 2
1
3
. $
.
.
.
.
.
.
.
.
= =
+ +


Si usramos la MEDIA ARITMTICA:
x = 99 1
3
8 1
5 2
2 1
5 2
0 1
5 2
.
.
.
.
.
.
.
=
+ +


COMPROBACIN

Se pag $ 7.50 por 4 kg
H 4 x $ 1.875 = $7.50
x 4 x $ 1.990 = $7.96 Diferencia: 7.96 7.50 = $ 0.46




Cuando se presenta una relacin inversa entre variables implcitas, como por
ejemplo, entre PRODUCTIVIDAD y TIEMPO

e = Pv x t Pv = e x
t
1
Relacin Inversa
e = V x t V = e x
t
1

La Media Armnica es un promedio que tiene poco uso. Para encontrar la
oportunidad de su aplicacin conviene recordar la siguiente regla general:

SI ENTRE 2 MAGNITUDES EXISTE UNA RELACIN DE DEPENDENCIA,
como por ejemplo, entre:

distancia recorrida y tiempo Km / Hora, cm. / seg.
inversin y cantidad $ / Kg., $ / litro



Y: Variable dependiente X: Variable independiente

LMS.- Suponga que se ha comprado en diferentes puestos de un mercado
con $ 2.50: 1 Kg., 1.2 Kg. y 1.8 Kg. de manzanas. Calcular el precio
promedio por kg. de manzanas.
APLICACIONES DE LA H
Estadstica I Ing. Nancy Ochoa Sotomayor
8

Si X permanece constante e Y vara Media Aritmtica
Si X vara e Y permanece constante Media Armnica














DATOS AGRUPADOS

H =

=
n
1 i X
f
N
i
i


Clases f X f / X
1
2
3
4
5
6
7
15 16
17 18
19 20
21 22
23 24
25 26
27 - 28
5
9
7
5
2
1
1
15.5
17.5
19.5
21.5
23.5
25.5
27.5

30 1.5892


*La suma algebraica de las desviaciones de los recprocos de las
observaciones del recproco de la media armnica es nula
0 )
H
1
X
1
(
n
1 i
i
=

=

*La media armnica se basa en todas las observaciones, por lo que
est afectada por los valores extremos
Pero da a los valores grandes un peso menor que el que da la G;
mientras que a los valores menores pequeos, les da un peso
mayor que el que da la x y la G

*La H no est definida, si alguno de los valores es cero.

Y
DEPENDIENTE
X
INDEPENDIENTE
DISTANCIA TIEMPO
INVERSIN CANTIDAD
Y VARA X CONSTANTE
Y CONSTANTE X VARA
x
H
H =
5892 1
30
.


H = 18.9
Estadstica I Ing. Nancy Ochoa Sotomayor
9







B


60 Km/h 70 Km /h



A C
80 Km/h



0 69
5 36
3 x 840
V
T
d
ABC
ABC
.
.
= = = Km. / hora

0 69
80
1
70
1
60
1
3
80
840
70
840
60
840
3 x 840
V . =
+ +
=
+ +
= Km. / hora






e= 150 Km. e = 250 Km.
Lima Huacho Chimbote
t = 2 horas t = 2.5 horas
v = 75 km/h v= 100 km /h

8 88
h Km 100
Km 250
h Km 75
Km 150
Km 400
V .
/ /
=
+
= km /h



2 velocidad
2 ..parcial Distancia.
1 velocidad
1 ..parcial Distancia.
..TOTAL DISTANCIA.
V


=




Las ciudades A, B y C son equidistantes entre s. Un automovilista viaja de A a B a
60 Km. / h; de B a C 70 Km. / h y de C a A 80 Km. / h. Determinar el promedio de
la velocidad para el viaje completo
Suponiendo que el recorrido ABC sea de
840 Km. x 3 =
d
ABC

14
60
840
t
AB
= = h
12
70
840
t
BC
= = h
5 10
80
840
t
AC
. = = h
------------------------
TABC
= 36.5 horas
Un automovilista de Lima a Huacho (150 KM) lo recorre en 2 horas y de
Huacho a Chimbote (250 Km.) lo recorre en 2.5 horas. Calcular la
velocidad promedio del automovilista de Lima a Chimbote
Estadstica I Ing. Nancy Ochoa Sotomayor
10

RELACIN ENTRE x , G, H y Mc

( )
0 2xy
y
2
x
2
0
y x
2
> + >

a ambos miembros sumar 4xy



( )
xy
y
2
x
2
4
y x
2
xy
xy
4xy.
y
2
2xy
X
2
>
+
> + +
( ) y x
2
y
2
x
2
4
xy
+
>

------------------------------------------------- ( o )


xy
2
y x
xy
xy
2
y x
2
y x
xy
xy >
+
>
+

+
>

De ( o ) :

+
>
+
>
+
>
+
>
y
1
x
1
2
xy
xy
y
xy
x
2
xy
xy
y x
2
xy
2
y x
xy
xy


( )
0 2xy
y
2
x
2
0
y x
2
> + >

+ > + + xy 2 xy 2 xy 2
y
x
2
2


( )
y x
2xy
2
y x
4xy y) y)(x (x 4xy
y x
2
+
>
+
> + + >
+

xy
y
xy
x
2
2
y x
+
>
+

+
>
+

y
1
x
1
2
2
y x

( )
+ + > +
+
+ > + >

b
2
a
2
2ab
b
2
a
2
b
2
a
2
2ab
b
2
a
2
0
b a
2

( ) ( )
4
b a
2
2
b
2
a
2
4
b a
2
4
)
b
2
a
2
2( +
>
|
.
|

\
|
+

+
>
+

+
>
+
2
b a
2
b
2
a
2
Si:







y x
xy 2
xy
+
=
x > G
G > H
x > H
Mc > x
Mc =
2
x
2


Mc x > G > H
Estadstica I Ing. Nancy Ochoa Sotomayor
11

MEDIDAS DE DISPERSIN

Las medidas de tendencia central no son suficientes para expresar o
caracterizar una distribucin. Se necesitan de otras medidas que nos indiquen
la dispersin o variabilidad de las observaciones
La dispersin se relaciona con la mayor o menor concentracin de datos en
torno a una medida central o promedio
Su importancia radica en:
a) Se utilizan para mostrar el grado de variacin entre los valores de los
datos estadsticos
Ejemplo: Una baja dispersin de los salarios de un grupo de
trabajadores en una fbrica, indicar que a estos trabajadores le son
pagados aproximadamente salarios iguales. Por otro lado, una alta
dispersin dar la impresin de que los trabajadores son pagados con
amplia variacin de salarios.
b) Pueden ser utilizados para suplementar un promedio y para describir un
grupo de datos o compararlo con otros
Ejemplo: 1 2 12 x = 5
No es importante ALTA DISPERSIN Heterogneos
1 2 3 4 5 6 7 8 9 10 11 12


4 5 6 x = 5
Si es importante BAJA DISPERSIN Homogneos
4 5 6


Una medida de dispersin puede ser expresada
a) VALOR ABSOLUTO ( DISPERSIN ABSOLUTA)

R: Rango o recorrido
DM: Desviacin Media
RP: Rango Percentlico
RQ: Rango Cuartlico
S: Desviacin Estndar
V(x): varianza
Q: Desviacin semintercuartlica

b) VALOR RELATIVO (DISPERSIN Relativa)
CV: Coeficiente de variacin









Estadstica I Ing. Nancy Ochoa Sotomayor
12


RANGO o RECORRIDO. R

El recorrido de una variable est definido como la diferencia entre el valor
mayor y el valor menor:

R = VMay Vmen +1 Datos discretos

R = VMay Vmen Datos Continuos

Es la medida ms simple y se utiliza cuando solo se quiere una comparacin
rpida entre distribuciones o conjunto de datos (para ver su heterogeneidad,
como una primera idea)
El inconveniente que tiene al utilizarse, es que solo toma los valores extremos
dejando de lado el conjunto de valores intermedios

RANGO PERCENTLICO: RP




Se utiliza para calcular la altura o elevacin de la curva de una distribucin de
frecuencias respecto a la curva normal y representa el 80% de datos
(centrales)

F


90 %



N
10
8


10 %








80%




RP = P
90
P
10



N
10
9



N
10
1


P10

P90

Estadstica I Ing. Nancy Ochoa Sotomayor
13
RANGO CUARTLICO: RQ




Se utiliza para calcular el rango semi-intercuartlico y representa el 50% de
datos (centrales)




1/4 de las 1/4 de las
Observacin Observaciones Observaciones Observacin
Ms baja Q
1
Q
3
ms lata









Primer Cuartil Mediana Tercer Cuartil

F


75 %



N
4
2


25 %








50%





RQ = Q
3
Q
1



N
4
3



N
4
1


Q
1

Q
3

Estadstica I Ing. Nancy Ochoa Sotomayor
14
DESVIACIN SEMI-INTERCUARTLICO






Si la distribucin es simtrica, se considera que en el intervalo:

( x Q) = ( x - Q, x + Q)
Estn concentrados el 50% de los datos
centrales


F







N / 2




50%


Md

f





50%




-Q +Q
Q x
Q =
2
Q
Q
3 1


Estadstica I Ing. Nancy Ochoa Sotomayor
15

DESVIACIN MEDIA

Se define como la media aritmtica de las desviaciones respecto a la media,
sin tener en cuenta los signos; es decir, tomando el valor absoluto
Pueden tomarse otros promedios, como por ejemplo la mediana







DATOS AGRUPADOS








Si la distribucin de frecuencias es bastante grande y simtrica, se considera
que en el intervalo

( x DM) = ( x- DM, x+ DM)

Estn concentrados el 58 % de los datos







58%


-DM x +DM

x DM)









DM =
N
x
N
1 i
i x


=


DM =
N
x
n
1 i
i x


=
f
i


Estadstica I Ing. Nancy Ochoa Sotomayor
16
CLCULO DE Q PARA DATOS NO AGRUPADOS

A) CUANDO N ES MLTIPLO DE 4

Calcular Q de: 5 , 7 , 12 , 8 , 10 , 6 , 11, 12
Ordenando:
5 6 7 8 10 11 12 12


Q
1
Q
3


Q
1
= 5 6
2
7 6
. =
+

Q = 5 2
2
5 6 5 11
.
. .
=


Q
3
=

B) CUANDO N NO ES MLTIPLO DE 4

Q
i
= i
4
N
= E
4
i
i = 1, 2, 3.

Fraccin
Entero

Sea X el nmero de orden
1) FRACCIN =
4
1
Q
i
=
4
1
X
E
+
4
3
X
E+1
2) FRACCIN =
4
2

Q
i
= X
E+1
3) FRACCIN =
4
3
Q
i
=
4
3
X
E+1
+
4
1
X
E+2






Q
1
= i
4
N
=
4
11
= 2
4
3
FRACCIN = 3/4


Q
1
=
4
3
X
2+1
+
4
1
X
2+2
=
4
3
X
3
+
4
1
X
4
= 14.5 (16)
4
1
(14)
4
3
= +

5 11
2
12 11
. =
+
Calcular Q de: 8 10 14 16 24 34 40 48 54 64 70
X
1
X
2
X
3
X
4
X
5
X
6
X
7
X
8
X
9
X
10
X
11


Estadstica I Ing. Nancy Ochoa Sotomayor
17

Q
3
= i
4
N
= 3
4
11
=
4
33
= 8
4
1
FRACCIN = 1/4

Q
3
=
4
3
X
8+1
+
4
1
X
8
=
4
3
X
9
+
4
1
X
8
= 52.5 (48)
4
1
(54)
4
3
= +

Q = 0 19
2
5 14 5 52
.
. .
=





VARIANZA: V(x), S
2
,

2


Es el promedio del cuadrado de las desviaciones respecto a la media aritmtica

MTODO GENERAL, BSICO, ORIGINAL








Desarrollando:








Hallar la S
2
de 2, 6,7 y 9

4
6
24
x = =

5 6
4
26
S
2
. = =

5 6
2
4
170
6 S
2
. = =




X
X - x (X - x )
2
X
2
2
6
7
9
-4
0
1
3
16
0
1
9
4
36
49
81
24 0 26 170
( )
N
x
X
i
S
2
N
1 i
2

=
=

X
N
X
i
S
2
2
2
N
1 i

=
=

Estadstica I Ing. Nancy Ochoa Sotomayor
18

DATOS AGRUPADOS








Desarrollando:







MTODOS ABREVIADOS

A) MTODO DE LAS DESVIACIONES


|
|
|
.
|

\
|

=
=
=
N
d
i
f
i
2
N
di f
s
2
n
1 i
n
1 i
2
i

B) MTODO CLAVE


(
(
(
(
(
(
(

=
|
|
|
|
.
|

\
|

=
=
N
u f
2
N
u f
c s
i
n
1 i
i
i i
n
1 i
2 2


PROPIEDADES

1) x , V(x) 0
2) V (K) = 0; K es constante
3) V(X K) = V (X)
4) V (K X) = K
2
V(X)
5) V (KX + b) = K
2
V(X), K y b son constantes


( )
N
x
X
f
S
2
i
2
n
1 i
i

=
=

x
f
2
N
n
1 i
X
2
S
2
i i

=
=
Estadstica I Ing. Nancy Ochoa Sotomayor
19

USOS FRECUENTES DE LA DESVIACIN ESTNDAR

Como se ha enfatizado, la desviacin estndar es til para describir un
conjunto de datos midiendo el grado de dispersin de las observaciones
individuales alrededor de su media. Existen dos aplicaciones adicionales para
la desviacin estndar
(1) Teorema de Chebyshev
(2) Regla emprica

(1) TEOREMA DE CHEBYSHEV (Tchebysheff)
Formulado por el matemtico ruso P. L. Chebyshev (1821-1899)
Establece que para todo conjunto de datos, por lo menos (1 -
k
2
1
) %de las
observaciones estn dentro de K desviaciones estndar de la media, en donde
k es cualquier nmero mayor que 1. El teorema de Chebyshev se expresa
como:







Ejemplo:
La Empresa TRANSP, revel que tiene una media de pasajeros por vuelta igual
a 78.7 pasajeros con una desviacin estndar de 12.14. Para programar los
tiempos para una nueva ruta que abri TRANSP, la Gerencia desea saber con
que frecuencia los pasajeros estn dentro de K =2S y cul es dicho intervalo.

SOLUCIN

Si se transportan 2S (2x12.14)=24.28 pasajeros por encima y por debajo de la
media =78.7 pasajeros, se tendr un intervalo de (78.7 24.28)=54.42 a (78.7
+24.28)= 102.98 pasajeros
Se puede estar seguro de que por lo menos: 1 -
(
(

2
2
1
=75 % del tiempo, el
nmero de pasajeros diarios estuvo entre 54 y 103

Interpretacin:
En por lo menos el 75% de los das (es decir, 75% de 50 es igual a 37 das), el
nmero de pasajeros estuvo entre 54 y 103. Esto proporciona a la gerencia de
TRNSP una valiosa informacin sobre para cuntos pasajeros deben
prepararse en trmino de operaciones en transportes.





TEOREMA DE CHEBYSHEV 1 -
(
(

k
2
1

Estadstica I Ing. Nancy Ochoa Sotomayor
20
(2) REGLA EMPRICA, para distribuciones simtricas

a) El 68.27 % de los casos estn comprendidos en intervalo:

X 1 S

(

X - 1 S,

X +1 S) 68.27 %




68.27%



X - 1 S

X 1 S

b) El 95.45 % de los casos estn comprendidos en intervalo:

X 2S

(

X - 2S,

X +2 S) 95.45 %




95.45%



X - 2S

X 2S
c) El 99.73 % de los casos estn comprendidos en intervalo:

X 3S

(

X -3S,

X + 3S) 99.73 %




99.73%



X - 3S

X 3 S











Q ~
3
2
S

DM ~
5
4
S

Estadstica I Ing. Nancy Ochoa Sotomayor
21

COMPONENTES DE LA VARIANZA

Si un conjunto de datos ha sido divididos en categora o estratos, es posible
obtener 2 componentes de la varianza
Si se ha dividido en K estratos, cada uno de los cuales tiene una

X , una
varianza y un nmero de observaciones que indica la importancia de cada uno
de ellos.
En este caso la variabilidad total puede deberse tanto a la variabilidad dentro
de cada estrato, como a la variabilidad entre los diferentes estratos










INTERVARIANZA:
Se
2


Es el estadstico que representa la variabilidad entre los estratos y se define
como la varianza de las medias de los estratos









INTRAVARIANZA:
Sa
2


Es el estadstico que representa la variabilidad dentro de los estratos y se
define como el promedio de las varianzas de los estratos.









S
2
T
=
S
2
a
+
S
2
e



N
1
N
2
N
k
x1

x2

xK

s
2
1

s
2
2

s
2
K


N =

=
K
1 i
i
N


Se
2
= V (
xi
) =
N
X
i
2
Ni
K
1 i
|
.
|

\
|
=

=
X

Xi
:

X del estrato i
=
X:

X General
N
i
: N de observaciones de cada
estrato


Sa
2
= M (
Si
2
) =
N
Ni S
i
k
1 i
2

=



S
2
i
: Varianza del estrato i
Estadstica I Ing. Nancy Ochoa Sotomayor
22





Ejemplo:
En una pequea empresa que se dedica a la fabricacin de productos
metalmecnicos, tiene la siguiente conformacin de su personal:

OPERARIOS 200 300 300 300 400 SUELDOS
MENSUALES
$
TCNICOS 300 400 500 500 500 600 600 600
EMPLEADOS 300 500

Se calcula la media y la varianza de todos los empleados, tcnicos y operarios
(todo el personal)

Sueldos
X
Personal
f

f X

f X
2

u

f u

f u
2
200 1 -2 -2 4
300 5 -1 -5 5
A=400 2 0 0 0
500 4 1 4 4
600 3 2 6 12
15 6300 2890,000 3 25
MEDIA GENERAL:
=
XT
= 420
15
6300
N
fx
= =



=
XT
= A + c
N
fu

= 400 + 100 (3/15) = 420



VARIANZA TOTAL:
s
2
T


( )

= =
=

=
|
|
.
|

\
|
6 16,266.
420
15
2'890,000
N
fx
S
2
T
2
X
2
T


( )

= =

=
(
(
(

(
(
(

|
.
|

\
|
|
.
|

\
|
6 16,266.
15
3
2
15
25
100
2
N
fu
2
N
u
2
f
c
2
S
2
T



S
2
T
=
N
X
X N S Ni i
2
i
2
i
K
1 i
K
1 i
|
|
.
|

\
|
=

= =


Estadstica I Ing. Nancy Ochoa Sotomayor
23


Organizando por estratos (personal: operarios, empleados y tcnicos) y
obtenemos la media y varianza de cada estrato


ESTRATOS
TAMAO
N
i

MEDIA
xi

VARIANZA
s
2
i

OPERARIOS 5 300 4,000
TCNICOS 8 500 10,000
EMPLEADOS 2 400 10,000
15


( ) ( ) ( ) ( ) ( )
000 4
5
300 500
2
300 400
2
300 300
2
300 300
2
300 300
2
S
2
1
, =

=

( ) ( ) ( )
000 10
8
500 400
2
500 600
2
3
500 500
2
3
S
2
2
, =

=


( ) ( )
000 10
2
400 500
2
400 300
2
S
2
3
, =

=

FRMULA UTILIZADA
N
X
i
X
i
2
Ni
S
2
i

=
|
.
|

\
|


La media ponderada ser:


=
X = 420
2 8 5
2(400) 8(500) 5(300)
N
Xi Ni
K
1 i
=
+ +
+ +
=

=




Se
2
=
( ) ( ) ( )

=

6 266 8
15
420 400
2
2
420 500
2
8
420 300
2
5
. ,


Sa
2
= 8,000
15
2(10000) 8(10000) 5(4000)
=
+ +



S
2
T
=8,266. 6 + 8,000 = 16,266. 6
Estadstica I Ing. Nancy Ochoa Sotomayor
24

Estos resultados nos permiten, concluir que la variabilidad se debe en
proporcin casi iguales a la heterogeneidad en los sueldos dentro de los
estratos y a la heterogeneidad de los diferentes estratos.

----------------------------------------------------------------------------------------------------------
Supongamos que: 000 100
Sa
2
, = y
Se
2
= 2,000
La variabilidad se debe principalmente a la heterogeneidad de los sueldos
dentro de los estratos y no as a diferencias entre estratos. En otras palabras:
Los sueldos promedios de cada estrato, son bastante homogneas ya que la
intervarianza es pequea, mientras que las remuneraciones dentro de cada
estrato son muy heterogneas, puesto que la intravarianza es bastante grande


Ver pgina 41 3ra. Impresin
Manrique & Ochoa Estadstica








S
2
T
= 6 16,266.
(420)
2
15
)
400
2
2(10000 )
500
2
8(10000 )
300
2
5(4000
=
+ + + +









S
2
T
=
15
420) (400
2
2
420) (500
2
8
420) (300
2
5 2(10000) 8(10000) 5(4000)

+

+ + +



S
2
T
= 16,266. 6






S
2
T
=
=

|
|
.
|

\
|
=
X
N
X
S
2
i
Ni
2
T
2
T
K
1 i

S
2
T
=
N
X
X N S Ni i
2
i
2
i
K
1 i
K
1 i
|
|
.
|

\
|
=

= =


Estadstica I Ing. Nancy Ochoa Sotomayor
25


COEFICIENTE DE VARIACIN: CV


Es una dispersin relativa que mide el grado de homogeneidad de un conjunto
de datos
Se considera homogneo a un conjunto de datos, cuando tiene una mayor
concentracin alrededor de la media aritmtica








En estudio de Tiempos, se considera homogneos a los tiempos observados
cuando el CV es menor o igual al 6%
CV 6%

MITAC En la prctica, se acostumbra a considerar que CV superior al 50%
indica un alto grado de dispersin, y consecuentemente, pequea
representatividad de la media aritmtica. En cuanto a valores inferiores a 50%,
la media ser tanto ms representativa, cuanto menor sea el CV

Cuando las variables de dos distribuciones se expresan en unidades diferentes
(ao, centmetros) no tiene sentido comparar los estadsticos de dispersin de
diferentes unidades, pues ellos quedan influenciados por dichas unidades. Esto
puede superarse mediante el CV, ya que ste, no tiene unidad





CV1
CV2


CV1 > CV2 los datos de la distribucin 1 estn ms dispersos


Ms heterogneos

Ms homogneos





CV =

X
S
x 100
Estadstica I Ing. Nancy Ochoa Sotomayor
26
Dos marcas de zapatos para correr fueron evaluadas en cuanto a uso y
desgaste. Cada una report los siguientes nmeros de horas de uso antes que
se detectara un desgaste significativo

Marca A Marca B
97
83
75
82
98
65
75
78
56
87
54
89
65

SB
= 14.0 CV A = 13.5% CVB = 19.6 %











MOMENTOS

Sean X
1
, X
2
, X
3
,, X
N
, los valores de la variable X

El momento de orden r con respecto a un valor cualquiera, est definido
por:



















a) Cul zapato parece presentar mayor
desgaste?
b) Cul zapato parece tener un programa de
control de calidad que produzca la mejor
consistencia en su desgaste?

XA
=82.1

XB
= 71.5
SA
= 11.1

M
r
(K) =
( )
N
K
x
i
N
1 i
r

=


a) Momento respecto al origen
Cuando K = 0






r = 1, 2, 3,
b) Momento respecto a la MEDIA








x
r
=
' Mr
=
N
r
x



M
r
=
m
r
N
x)
x
i
(
r
=



Estadstica I Ing. Nancy Ochoa Sotomayor
27

Para DATOS AGRUPADOS






m
r
=
' m0
= 1
N
x
0
=

m
0
= 1


' m1
= x
N
x
1
=

m
1
= 0


' m 2
=
x
x
2
2
N
=

m
2
= S
2


RELACIN ENTRE MOMENTOS

m
1
= 0

m
2
= m
2

2


m
3
= m
3
3 m
2
+ 2
3


m
4
= m
3
4 m
3
+ 6 m
2

2
- 3
4




Hallar los 4 primeros momentos con respecto al origen y a la media
de los siguientes nmeros: 3, 4, 8, 9, 11

r=1 m
1
= x = 7
5
11 9 8 4 3
=
+ + + +

r=2 m
2
=
x
2
=
5
11
2
9
2
8
2
4
2
3
2
+ + + +
= 58.2

r=3 m
3
=
x
3
=
5
11
3
9
3
8
3
4 3
3 3
+ + + +
= 532.6
r=4 m
4
=
x
4
=
5
11
4
9
4
8
4
4
4
3
4
+ + + +
= 5127


r=1 m
1
= 0

' m r
=

x
r
=
' Mr
=
N
r

f.x
m
r
= M
r
=
N
x)
x
i
( f
i
r


Estadstica I Ing. Nancy Ochoa Sotomayor
28
r=2 m
2
=
( ) ( ) ( ) ( ) ( )
2 9
5
7 11
2
7 9
2
7 8
2
7 4
2
7 3
2
. =


r=3 m
3
=
( ) ( ) ( ) ( ) ( )
6 3
5
7 11
3
7 9
3
7 8
3
7 4
3
7 3
3
. =


r=4 m
4
=
( ) ( ) ( ) ( ) ( )
122
5
7 11
4
7 9
4
7 8
4
7 4
4
7 3
4
=



Comprobando:
m
1
= 0

m
2
= m
2

2
= 58.7 (7)
2
= 9.2

m
3
= m
3
3 m
2
+ 2
3
= 532.6 -3(58.2) 7 +2 (7)
3
= -3.6

m
4
= m
3
4 m
3
+ 6 m
2

2
- 3
4
=5127- 487x532.6)+6 (7)
2
(58.2)-
3(7)
4
=122



DEFORMACIN DE LA CURVA ESTADSTICA

A) COEFICIENTE DE ASIMETRA O SESGO

Mide la inclinacin de la curva estadstica con respecto a la curva normal











Mo Mo
x x

Md Md
x > Md > Mo x = Md = Mo x < Md < Mo

SESGO POSITIVO SESGO NULO SESGO NEGATIVO

As > 0 As = 0 As < 0

Sesgada hacia la derecha Sesgada hacia la izquierda
+
0
-
Estadstica I Ing. Nancy Ochoa Sotomayor
29

COEFICIENTE DE PEARSON















COEFICIENTE DE ARTHUR BOWLEY








Variar de -1 a +1 Boowley advirti que un valor de 0.1 puede ser considerado
como un grado moderado de asimetra y un valor de 0.3 como una marcada
asimetra

COEFICIENTE DE FISCHER









( )
N
x X
3
m3

=




S
2
m
2
=
( ) ( )
S
3
2
S
2
3
m
3
2
= =
S
3
m
3
2
=





As
1
=
S
Mo x


As
2
=
( )
S
Md x 3



As =
( ) ( )
Q Q
Q Q Q Q
1 3
1 2 2 3




As =
a
m
3
3
3
S
=
Estadstica I Ing. Nancy Ochoa Sotomayor
30


B) COEFICIENTE DE KURTOSIS

Mide el grado de elevacin de la curva estadstica con respecto a la curva
normal





MS
ALTA

NORMAL MS BAJA


LEPTOKURTICA MESOKURTICA PLATIKURTICA

K > 0.263 K = 0.263 K < 0.263


a4
> 3
a4
= 3
a4
< 3

























K =
P P 10 90
Q



K =
a4
=
S
4
4 m

Estadstica I Ing. Nancy Ochoa Sotomayor
31
Clases f X F fx f x
2
f x
3
f x
4
d fd f d
2
u fu f u
2

f i
x
i x

( ) x
x
i
fi
2


( ) x
x
i
fi
3


( ) x
x
i
fi
4


13-15 6 14 6 -6 -36 216 -2 -12 24
16-18 8 17 14 -3 -24 72 -1 -8 8
19-21 16 20 30 0 0 0 0 0 0
22-24 12 23 42 3 36 108 1 12 12
25-27 8 26 50 6 48 288 2 16 32
c=3 50 1024 21644 470380 10472564 24 684 8 76 148.80 672.48 -433.90 19664.799

x = 20.4800 Respecto al origen
Mo=20.5000 4800 20
m
1
1
. =
Md=20.5625 8800 432
m
1
2
. =
Q
1
= 17.9375 6000 9407
m
1
3
. =
Q
3
=23.3750 28 209451
m
1
4
. =
P10
=15.0000
P90
=25.6250
4496 13
S
2
. =
DM=2.976
Q=2.7188
CV=17.9071

Respecto a la media
m
1
=0 m
2
=13.4496
m
3
=-8.678 m
4
=393.2960 K = 0.2559
As
1
= -0.0055
As
2
=-0.0675

As=0.0345 (Bowley)

As=-0.1759 (Fischer)



Estadstica I Ing. Nancy Ochoa Sotomayor
32
a
4
= 2.174

Estadstica I Ing. Nancy Ochoa Sotomayor
33


Cuadro de datos
Da Pana-
dero
Mquina N 1 Mquina N 2
1
2
3
4
5

6
7
8
9
10

11
12
13
14
15

16
17
18
19
20
A
A
A
B
B

A
A
B
B
B

A
B
B
A
A

A
B
B
B
A


209.20 209.50 210.20 212.00
208.50 208.70 206.20 207.80
204.20 210.20 210.50 205.90
204.00 203.30 198.20 199.90
209.60 203.70 198.20 209.60

208.10 207.90 211.00 206.20
205.20 204.80 198.70 205.80
199.00 197.70 202.00 213.10
197.20 210.60 199.50 215.30
199.10 207.20 200.80 201.20

204.60 207.00 200.80 204.60
214.70 207.50 205.80 200.90
204.10 196.60 204.60 199.40
200.20 205.50 208.00 202.70
201.10 209.20 205.50 200.00

201.30 203.10 196.30 205.50
202.20 204.40 202.10 206.60
194.10 211.00 208.40 202.60
204.80 201.30 208.40 212.30
200.60 202.30 204.30 201.40
214.30 221.80 214.60 214.40
215.30 216.70 212.30 212.00
215.70 213.80 215.20 202.70
212.50 210.20 211.30 210.40
208.40 214.90 212.80 214.80

212.30 216.20 208.40 210.80
208.10 211.90 212.90 209.00
207.50 209.90 210.60 212.30
206.90 207.10 213.60 212.20
209.60 209.50 206.80 214.20

212.20 209.80 207.60 212.60
211.40 211.20 214.40 212.60
209.60 209.20 206.10 207.10
203.50 206.90 210.60 212.30
209.10 206.30 209.80 211.40

208.00 207.90 205.30 203.60
210.00 209.40 209.10 207.00
215.60 211.80 205.40 209.00
214.50 207.50 212.90 204.30
209.10 205.80 212.00 204.20