You are on page 1of 29

1

2
DISTRIBUCIONES UNIDIMENSIONALES DE
FRECUENCIA: CASO DISCRETO
TABLAS DE FRECUENCIA E INDICADORES

Ejemplo:
Se ha tomado una muestra de 20 cajas de fusibles de
seguridad para determinado artefacto electrnico (1caja = 10
fusibles). Se ha examinado cada caja, determinando el
nmero de fusibles defectuosos por caja, obtenido la
siguiente informacin:
3-2-0-2-3-3-1-0-1-3-3-4-4-3-2-4-2-4-2-1
Variable X: Nmero de fusibles defectuosos por caja.
3
DISTRIBUCIONES UNIDIMENSIONALES DE
FRECUENCIA: CASO DISCRETO
Construir la tabla de frecuencias










X
i
n
i
h
i
N
i
H
i

0
1
2
3
4
Total
4
DISTRIBUCIONES UNIDIMENSIONALES DE
FRECUENCIA: CASO DISCRETO
Notacin:

: Valor i-simo de la variable X
: Frecuencia absoluta del valor i-simo de la variable X
: Frecuencia relativa del valor i-simo:


: Frecuencia absoluta acumulada hasta el valor i-simo valor de la variable
X

: Frecuencia relativa acumulada hasta el i-simo valor de la variable X



i
n
i
X
i
X
i
n
i
h
n
n
h
i
i
=
i
N
i
H

=
+ + + = =
j
i
j i j
n n n n N
1
2 1
....
n
N
n n n n H
j
j
i
j i j
= + + + = =

=1
2 1
....
5
DISTRIBUCIONES UNIDIMENSIONALES DE
FRECUENCIA: CASO DISCRETO
Distribucin de frecuencias de la variable
X: Nmero de fusibles defectuosos por caja









Interpretar algunos valores de la tabla
X
i
n
i
h
i
N
i
H
i

0 2 0.1 2 0.1
1 3 0.15 5 0.25
2 5 0.25 10 0.50
3 6 0.3 16 0.80
4 4 0.2 20 1.0
Total 20 1.0 * *
6
GRFICAS DE LA S DISTRIBUCIONES DE FRECUENCIAS
Grficas de frecuencias Simples





Grficas de Frecuencias acumuladas

n
n
h
i
i
=
i
h
i
x
i
n
i
x
i
N
i
x

>
< s
<
=
+
m
j j j
x x si n
x x x si N
x x si
x N
....... ........
........ ....
....... ........ 0
) (
1
1
R x m j e = ; ,.... 3 , 2 , 1
i
H
i
x

>
< s
<
=
+
m
j j j
x x si
x x x si H
x x si
x H
....... ........ 1
........ ....
....... ........ 0
) (
1
1
R x m j e = ; ,.... 3 , 2 , 1
7
DISTRIBUCIONES UNIDIMENSIONALES DE
FRECUENCIA: CASO DISCRETO
Indicadores de centramiento

Media aritmtica
n: Tamao de muestra
Media aritmtica (datos agrupados)
m: Nmero de valores diferentes de X
Mediana para datos no agrupados




Los datos deben estar ordenados por magnitud











=
=
n
i
i
x
n
X
1
1

= =
= =
m
i
i i
m
i
i i
h x n x
n
X
1 1
. .
1

+
=
+
+
par es n si
X X
impar es n si X
M
n n
n
e
2
1
2 2
2
1
8
DISTRIBUCIONES UNIDIMENSIONALES DE
FRECUENCIA: CASO DISCRETO
Indicadores de centramiento
Mediana para datos agrupados




Moda para datos no agrupados


Moda para datos agrupados












repite se ms que Dato M =
0

=
+
<
=

2 2
2
1
1
1
n
N si
X X
n
N si X
M
j
j j
j j
e
i i
h n frecuencia mayor de Dato M =
0
9
DISTRIBUCIONES UNIDIMENSIONALES DE
FRECUENCIA: CASO DISCRETO
Indicadores de variabilidad
Rango

Varianza para datos no agrupados


Varianza para datos agrupados


Nota: La raiz cuadrda de S
2
tomada positiva se denomina Desviacin
estndar










2
1
2
1
2 2
1
) (
1
X x
n
X x
n
S
n
i
i
n
i
i
= =

= =
MIN MAX
X X R =

= = =
= = =
m
i
m
i
i i i i
m
i
i i
X h x h X x n X x
n
S
1 1
2 2 2
1
2 2
. . ) ( . ) (
1
2
S S + =
10
DISTRIBUCIONES UNIDIMENSIONALES DE
FRECUENCIA: CASO DISCRETO
Indicadores de variabilidad
Coeficiente de variacin:






La anterior clasificacin no se puede generalizar en todos los casos ya
que no funciona con datos cercanos a cero o negativos














100 . ) (
X
S
x CV =
Variable
homognea
Variable con
homogeneidad moderada
Variable con
heterogeneidad
% 15 ) ( < x CV % 30 ) ( % 15 < < x CV % 30 ) ( > x CV
11
DISTRIBUCIONES UNIDIMENSIONALES DE
FRECUENCIA: CASO DISCRETO
Indicadores de posicionamiento
Percentiles
El p-simo percentil., es un valor (que se asume para X) tal que
cmo mximo un p por ciento de los elementos (unidades
observadas o medidas) tienen dicho valor o un valor menor y como
mximo, un (100-p) por ciento de las unidades tienen este valor
un valor mayor
Ejemplo
Hallar el percentil P = 40
Pasos:
1) Ordene el conjunto de datos en forma creciente y represnteles
por:
x
1
, x
2
, ..x
n
















100 . ) (
X
S
x CV =
12
DISTRIBUCIONES UNIDIMENSIONALES DE
FRECUENCIA: CASO DISCRETO
Indicadores de posicionamiento
Percentiles




2) Calculamos el ndice i de la siguiente manera:


3) Si i no es entero, se redondea. El valor entero inmediatamente
mayor a i indica la posicin del p-simo percentil. Si i s es entero,
el p-simo percentil es el el promedio de los valores de las unidades
ubicadas en los lugares i e i+1









100 . ) (
X
S
x CV =
X
1
X
2
X
3
X
4
X
5
X
6
X
7
X
8
X
9
X
10

0 0 1 1 1 2 2 2 2 2
X
11
X
12
X
13
X
14
X
15
X
16
X
17
X
18
X
19
X
20

3 3 3 3 3 3 4 4 4 4
8 20 .
100
40
. =
|
.
|

\
|
=
|
.
|

\
|
= n
n
p
i
2
9 8
40
X X
P
+
=
13
DISTRIBUCIONES UNIDIMENSIONALES DE
FRECUENCIA: CASO DISCRETO
Indicadores de posicionamiento
Cuartiles
Con frecuencia se dividen los datos en cuatro partes, cada una con
aproximadamente la cuarta parte de n ( tamao de muestra), o el
25% de los elementos. A los puntos de divisin se les llama
cuartiles y se definen como sigue:
Q
1
: Primer cuartil 25% percentil
Q
2
: Segundo cuartil 50% percentil (MEDIANA)
Q
3
: Tercer cuartil 75% percentil







100 . ) (
X
S
x CV =
8 20 .
100
40
. =
|
.
|

\
|
=
|
.
|

\
|
= n
n
p
i
25%
25%
1
Q
2
Q
3
Q
25%
25%
14
DISTRIBUCIONES UNIDIMENSIONALES DE
FRECUENCIA: CASO CONTINUO
Ejemplo
La siguiente informacin corresponde a mediciones de PH en 20 muestras de
una solucin reguladora, redondeada a dcimas:

3.1-4.0-4.1-3.4-3.6-3.5-3.6-4.2-3.7-2.6-3.5-4.7-1.6-3.8-2.4-3.0-4.0-4.5-3.3-3.9

X: variable medicin de PH.

Obtener la tabla de frecuencias

Determine el rango de la variable


Determine el nmero de clases Este est determinado por los objetivos que se
tengan para el anlisis e interpretacin de la informacin. Por norma:


Supongamos que en ste caso m = 7.







100 . ) (
X
S
x CV =
8 20 .
100
40
. =
|
.
|

\
|
=
|
.
|

\
|
= n
n
p
i
MIN MAX
X X R =
clases de Nmero m m = s s ; 20 5
15
DISTRIBUCIONES UNIDIMENSIONALES DE
FRECUENCIA: CASO CONTINUO
Obtener la tabla de frecuencias

Calcule el ancho del intervalo: Por norma el ancho de clase se
aproxima por encima y debe tener el mismo nmero de decimales que los
datos


Calcule los lmites de clase y las marcas de clase. Por norma el lmite
inferior de la primera clase, debe tomarse un poco menor a X
MIN.
En este
caso, tomaremos el valor 1.55. Note que en realidad, representa cualquier
dato comprendido en el siguiente intervalo:


La marca de clase (semisuma de los lmites de clase). Se obtiene
mediante








100 . ) (
X
S
x CV =
8 20 .
100
40
. =
|
.
|

\
|
=
|
.
|

\
|
= n
n
p
i
45 . 0 44 . 0
7
1 . 3
~ = = =
m
R
C
05 . 0 6 . 1
i
L L
M
i i
i

+
=
+
,
2
1
16
DISTRIBUCIONES UNIDIMENSIONALES DE
FRECUENCIA: CASO CONTINUO
Distribucin de 20 mediciones de PH
Observaciones:

Al agrupar los datos se pierde informacin
Pocas clases globalizan mucho la informacin (datos muy
diferentes sern representados por la misma marca de clase)
Muchas clases hacen compleja la manipulacin de la informacin
(Muchas de ellas tendrn la misma frecuencia o frecuencia cero)
No deben existir clases en donde la frecuencia sea cero, para evitar
este hecho, debe reagruparse la informacin (recuerde que se quiere
explorar cmo es la distribucin de frecuencias en la poblacin y
ste hecho, distorsiona tal objetivo).





100 . ) (
X
S
x CV =
8 20 .
100
40
. =
|
.
|

\
|
=
|
.
|

\
|
= n
n
p
i
17
DISTRIBUCIONES UNIDIMENSIONALES DE
FRECUENCIA: CASO CONTINUO
Nota:

Si el ancho de clase es constante, se facilitan los clculos e interpretaciones ya
que la comparacin entre clases es muy fcil). Cuando el ancho de clase C, no
es el mismo para cada clase, estas no son comparables mirando . Para
hacerlas comparables se debe calcular la densidad de frecuencia



i
C
h
h
i
i
i
= ,
*
8 20 .
100
40
. =
|
.
|

\
|
=
|
.
|

\
|
= n
n
p
i
i
n
i
h
Clase L
i-1
-L
i
M
i
n
i
h
i
N
i
H
i

Total
18
DISTRIBUCIONES UNIDIMENSIONALES DE
FRECUENCIA: CASO CONTINUO
Distribucin de 20 mediciones de PH











Interprete algunos valores de la tabla
8 20 .
100
40
. =
|
.
|

\
|
=
|
.
|

\
|
= n
n
p
i
Clase L
i-1
-L
i
M
i
n
i
h
i
N
i
H
i

1 1.55-2.0 1.775 1 0.05 1 0.05
2 2.0-2.45 2.225 1 0.05 2 0.1
3 2.45-2.9 2.675 1 0.05 3 0.15
4 2.9-3.35 3.125 3 0.15 6 0.30
5 3.35-3.8 3.575 7 0.35 13 0.65
6 3.8-4.25 4.025 5 0.25 18 0.90
7 4.25-4.7 4.475 2 0.1 20 1.0
Total * * 20 1.0 * *
19
DISTRIBUCIONES UNIDIMENSIONALES DE
FRECUENCIA: CASO CONTINUO
Grficas para la Distribucin de 20 mediciones de PH
Histogramas de frecuencias simples






Histogramas de frecuencias acumuladas (Polgono de Frecuencias, Ojiva)












8 20 .
100
40
. =
|
.
|

\
|
=
|
.
|

\
|
= n
n
p
i
i
h
i
n
i
M
i
M
i
H
i
N
i
M
i
M
20
DISTRIBUCIONES UNIDIMENSIONALES DE
FRECUENCIA: CASO CONTINUO
Estime el porcentaje de mediciones (muestras) que tienen un PH comprendido
entre 3.2 y 3.7 U

Calcule los siguientes indicadores
Media aritmtica



Mediana para datos agrupados












8 20 .
100
40
. =
|
.
|

\
|
=
|
.
|

\
|
= n
n
p
i

= =
= =
m
i
m
i
i i i i
h M n M
n
X
1 1
. .
1
{ }
i
i i
i e
h
C L H
L M
. ( 5 . 0
) 1
1


+ =
DISTRIBUCIONES UNIDIMENSIONALES DE
FRECUENCIA: CASO CONTINUO


Cmo deducir la frmula de la mediana?









8 20 .
100
40
. =
|
.
|

\
|
=
|
.
|

\
|
= n
n
p
i
{ }
i
i i
i e
h
C L H
L M
. ( 5 . 0
) 1
1


+ =
1 i
L i
L
5 . 0 ) (
1
<
i
L H
5 . 0 ) ( >
i
L H
5 . 0 ) ( = x H
Cul es el valor de x?
x
22
DISTRIBUCIONES UNIDIMENSIONALES DE
FRECUENCIA: CASO CONTINUO
Percentiles, Deciles y Cuartiles
Con el mismo criterio utilizado para encontrar M
e
, encuentre el percentil 60
(P
60
), el cuartil 3 (Q
3
) y el decil 8 (D
8
). Interprete cada valor.

La Moda M
o
para datos agrupados. En este caso la M
o
, estar en el intervalo
mayor frecuencia de datos ( n
i
o h
i
) o mayor densidad de frecuencia













8 20 .
100
40
. =
|
.
|

\
|
=
|
.
|

\
|
= n
n
p
i
i
i
i
C
h
h =
*
1 i
L
i
L
1
A
2
A
i
h
X
DISTRIBUCIONES UNIDIMENSIONALES DE
FRECUENCIA: CASO CONTINUO
Apoyndose en el grfico anterior, deduzca la siguiente frmula:




Encuentre la varianza de X



Calcule el Coeficiente de Variacin











8 20 .
100
40
. =
|
.
|

\
|
=
|
.
|

\
|
= n
n
p
i
clase de Ancho C h h h h
C
L M
i i i i
i
= = A = A
A + A
A
+ =
+

, ,
;
.
1 2 1 1
2 1
1
1 0
i
m
i
i i
m
i
i X
h X M n X M
n
S . ) ( . ) (
1
1
2
1
2 2

= =
= =
Profesor: Rafael Klinger
LA IMPORTANCIA DE LAS POSICIONES
RELATIVAS DE LA MEDIA, MEDIANA Y MODA
8 20 .
100
40
. =
|
.
|

\
|
=
|
.
|

\
|
= n
n
p
i
Media =20
Mediana =20
Moda =20
TOTALMENTE
SIMTRICA = SESGO =0
SESGADA A LA DERECHA
SESGO = +
Moda
300
Mediana
500
Media
700
SESGADA A LA IZQUIERDA
SESGO = -
Moda
700
Mediana
500
Media
300
Profesor: Rafael Klinger
x
F
r
e
q
u
e
n
c
y
16 12 8 4 0 -4
20
15
10
5
0
Mean 6,619
StDev 4,063
N 100
Histogram of x
Normal
Y LA VARIABILIDAD QUE?
8 20 .
100
40
. =
|
.
|

\
|
=
|
.
|

\
|
= n
n
p
i
x
F
r
e
q
u
e
n
c
y
5,84 5,82 5,80 5,78 5,76 5,74
25
20
15
10
5
0
Mean 5,801
StDev 0,01875
N 100
Histogram of x
Normal
Descriptive Statistics: x

Total
Variable Count Mean StDev Variance Minimum Median Maximum Range
x 100 5,8011 0,0188 0,000352 5,7403 5,8002 5,8514 0,1111

Descriptive Statistics: x

Total
Variable Count Mean StDev Variance Minimum Median Maximum Range
x 100 6,619 4,063 16,512 -4,453 6,795 15,382 19,835

QU DISTRIBUCIN
ES MS VARIABLE?
CMO SE SABE?
Profesor: Rafael Klinger
UN VIASTAZO RPIDO A LA RELACIN
ENTRE DOS VARIABLES
8 20 .
100
40
. =
|
.
|

\
|
=
|
.
|

\
|
= n
n
p
i
Ejemplo:
La siguiente informacin corresponde al registro de las variables X: Estatura (pulgadas) y
Y: peso (libras) en un grupo de 12 personas que desarrollan determinada actividad laboral
X Y X Y X Y
77 185 72 190 71 180
71 175 75 195 69 175
75 200 67 160 68 170
72 210 69 170 72 187
Encuentre la recta de regresin de la forma:
x B B y .
1 0
+ =
S//
Algunos elementos tericos

Profesor: Rafael Klinger 27
UN VIASTAZO RPIDO A LA RELACIN
ENTRE DOS VARIABLES
8 20 .
100
40
. =
|
.
|

\
|
=
|
.
|

\
|
= n
n
p
i
x B B y .
1 0
+ =
Modelo solicitado
Hallar B
0
y B
1

+ =
+ =


= = =
= =
n
i
n
i
n
i
i i i i
n
i
n
i
i i
x B x B x y
x B B n y
1 1 1
2
1 0
1 1
1 0
. .
. .
Ecuaciones normales
x B y B
x x
x x y y
B
n
i
i
n
i
i i
. ,
) (
) ).( (
1 0
1
2
1
1
=

=
=
Profesor: Rafael Klinger
UN VIASTAZO RPIDO A LA RELACIN
ENTRE DOS VARIABLES
8 20 .
100
40
. =
|
.
|

\
|
=
|
.
|

\
|
= n
n
p
i
Estatura (pulgadas)
P
e
s
o

(
l
i
b
r
a
s
)
78 76 74 72 70 68 66
200
190
180
170
160
S 5,73459
R-Sq 79,2%
R-Sq(adj) 77,2%
Ecuacin de regresin
Pe = - 70,19 + 3,525 Es
1 0
1 0
. 61448 . 858 156369
. 858 . 12 2182
B B
B B
+ =
+ =
1865 , 70
5247 , 3
0
1
=
=
B
B
Recta de regresin
ajustada
Y que tan bueno es
el ajuste de dicha recta?
% 23 . 79 7923 . 0
67 , 1583
85 , 328
1
) (
) (
1
1
2
1
2 *
2
~ ~
=

=
=
n
i
i
n
i
i i
y y
y y
R
Profesor: Rafael Klinger
UN VIASTAZO RPIDO A LA RELACIN
ENTRE DOS VARIABLES
8 20 .
100
40
. =
|
.
|

\
|
=
|
.
|

\
|
= n
n
p
i
Nota:

1 0
2
s s R
0
2
= R
La variable X no aporta informacin
para predecir el valor de Y
1
2
= R
Ajuste perfecto: El valor de Y est
plenamente determinado por el valor
de X

You might also like