You are on page 1of 50

1 Aldo Bresani

ESTADSTICA

Subdivisin de la Estadstica:
Estadstica
Descriptiva Inferencial
2 Aldo Bresani
ESTADSTICA DESCRIPTIVA

Conjunto de mtodos estadsticos para resumir y describir
datos completos de una poblacin:

Finalidad:

Entendimiento
Ciclos de Comportamiento
Tendencia

Ejemplo: Resultado de la calificacin de un examen.
3 Aldo Bresani
ESTADSTICA INFERENCIAL

Conjunto de mtodos con los que se hace una
generalizacin de una poblacin a partir de los datos
obtenidos de una muestra de esa poblacin.

Estas conclusiones no tienen porque ser validas al 100%,
por lo que que normalmente se deben dar con una medida
de confiabilidad (Intervalos de Confianza).

Ejemplo: Estimacin del resultado de un examen en base
al muestreo de algunos algunos.
4 Aldo Bresani
POBLACIN Y MUESTRA

Poblacin: (Todo)
Conjunto de elementos que conforman el universo a ser
estudiado. Puede consistir de elementos y/o personas de
los cuales queremos obtener algn tipo de conclusin y/o
dato.
Estas observaciones pueden ser cualitativas o
cuantitativas.
Muestra: (Parte)
Es el subconjunto del universo, el cual se selecciona con
la finalidad de estudiarla y obtener a partir de estos
resultados conclusiones acerca de la poblacin.
5 Aldo Bresani
POBLACIN Y MUESTRA

Poblacin: Parmetro
Medida descriptiva que resume una caracterstica de la
poblacin a partir de la observacin de los datos de todal a
poblacin.

Muestra: Estadstico
Medida descriptiva que resume una caracterstica de la
muestra con el fin de estimar un parmetro.
Las medidas descriptivas para ambos son las mismas.
Ejemplo: La media, varianza, desviacin estndar, etc.
6 Aldo Bresani
VARIABLES

Variable es una caracterstica que se define en la
poblacin, que puede tomar dos o ms valores o
modalidades.
Ejemplos:
Tiempo de respuesta de una Pentium 300 Mhz
Sexo de un beb: Hombre o Mujer
Nro. de hijos de un hogar: Entero positivo
Nro. de aviones que aterrizan en Jorge Chvez en un
perodo de tiempo
7 Aldo Bresani
CLASIFICACIN DE VARIABLES

Cualitativas:
Es una caracterstica cuyos valores solo se pueden
clasificar en categoras o modalidades.
No se puede operar con ellos.
Ejemplo: sexo, grado de instruccin, novel socio
econmico, etc.

Cuantitativas:
Es una caracterstica cuyos valores son numricos y se
puede operar con ellos. Hay dos divisiones:
Discretas y Continuas
8 Aldo Bresani
CLASIFICACIN DE LAS VARIABLES
CUANTITATIVAS

Discretas:
Puede asumir solo valores enteros 0, 1, 2, ...... . No admite
valores intermedios entre dos valores consecutivos.
Ejemplo: Nmero de artculo defectuosos en un lote.

Continuas:
Este tipo de variable puede asumir cualquier valor, entero
y/o decimal.
Ejemplo:Rendimiento de kilometraje por galn.
9 Aldo Bresani
EJERCICIOS DE APLICACIN.

1.- Un fabricante asegura que el 98% de los artculo
producidos resisten cierta temperatura. Para probar la
resistencia al calor de dicho artculo un ingeniero tom
una muestra de 100 de stos y verific que 35 sufrieron
serias modificaciones en su estructura.
2.- En un estudio de mercado que realiz la encuestadora
XYZ sobre la preferencia de gaseosas se obtuvo que 80
afirmaron que prefieren Chaposita, 50 prefieren Cola
y 30 dijeron que prefieren La Nacional.
3.- Se mide la longitud de barras de aluminio y se registra
que stas varan de 10.2 a 10.8 cm.
10 Aldo Bresani
ORGANIZACIN DE DATOS

Luego de recolectar datos, es necesario resumirlos y
presentarlos de tal forma que se puedan COMPRENDER,
ANALIZAR y UTILIZAR. Por eso se ordenan en cuadros
numricos y luego se representan en grficos.

DISTRIBUCIN DE FRECUENCIAS

Se llama as a los cuadros numricos de una sola variable
estadstica, y pueden ser de datos cualitativos o de datos
cuantitativos tanto discretos como continuos.
11 Aldo Bresani
La frecuencia absoluta (fi), de una valor Xi, es el nmero de
veces que aparece repetido dicho valor en el conjunto de las
observaciones realizada.
La suma de todas las frecuencias absolutas es igual al total n de
datos observados:
fi = n
i = i
La frecuencia relativa (fri), es el cociente entre la frecuencia
absoluta y el nmero de observaciones realizadas:
fri = fi / n
La suma de todas las frecuencias relativas siempre es igual a 1,
esto es:
fri = 1
i = 1

12 Aldo Bresani
La frecuencia porcentaje (fpi), es la frecuencia relativa
expresada en porcentaje, entonces el total de las
frecuencias es igual a cien (100).

Ejemplo 1. (para variable cualitativa):
En una entrevista a 30 amas de casa sobre su preferencia
de compra en los auto servicio: De Todo (T), Santa
Beatriz (B) y Don Jorge (KJ), se han obtenido los
siguientes resultados:
T, T, B, B, B, B, J, J, J, J, J, J, T, T, T, B, B, J, J,
J, J, J, B, T, T, T, T, T, B, J.
La tabulacin de estos datos, de la variable en estudio se
muestra en el cuadro siguiente:
13 Aldo Bresani
Distribucin de las amas de casa en cuanto a su
preferencia por autoservicios

Autoservicio Frecuencias Frecuencias En
absoluta relativas %

De Todo 10 0.33 33
Santa Beatriz 8 0.27 27
Don Jorge 12 0.40 40
Total 30 1.00 100
14 Aldo Bresani
GRFICO DE BARRAS

Distribucin de frecuencias
0
10
20
30
40
50
60
70
80
90
1er trim. 2do
trim.
3er trim. 4to trim.
15 Aldo Bresani
Para representar grficamente la distribucin de
frecuencias de una variable cualitativa se utilizan las
barras y los sectores circulares.
1er trim.
2do trim.
3er trim.
4to trim.
16 Aldo Bresani
Ejemplo 2: (Variable Cuantitativa discreta):

Construir la distribucin de frecuencias del nmero de
hijos por familia en una muestra de 20 hogares, si se han
observado los siguientes datos:
2, 1, 2, 4, 1, 3, 2, 3, 2, 0,
3, 2, 1, 3, 2, 3, 3, 1, 2, 4

Definicin de la variable:
X = Nmero de hijos por hogar

Rx = {0, 1, 2, 3, 4}
Conjunto de valores posibles, es un conjunto finito.
17 Aldo Bresani
X Conteo fi fri=ni / n fpi x 100
0 I 1 1/20=0.5 5
1 IIII 4 4/20=0.20 20
2 IIIIIII 7 7/20=0.35 35
3 IIIIII 6 6/20=0.30 30
4 II 2 2/20=0.10 10
20 fi = 1 100

Qu porcentaje de los hogares tienen 3 hijos?
(30%)
Qu porcentaje de los hogares tienen 2 hijos?
(35%)
Cuntos hogares tienen un hijo?
(4)
18 Aldo Bresani
DISTRIBUCIN DE FRECUENCIAS POR
INTERVALOS

Se usa cuando la variable estadstica es continua o cuando el
rango de la variable discreta es infinito o tiene a infinito.
La distribucin se obtiene dividiendo el rango en intervalos o
clases y determinando el nmero de datos que contiene cada
intervalo.
El nmero de intervalos debe estar de preferencia entre 5 y 20.
Los intervalos o clases se deben tomar cerrado a la izquierda y
abiertos a la derecha, con excepcin del ltimo que va cerrado
en ambos lados. Esto se hace con el fin de que estn incluidos
todos los nmeros y evitar ambigedad en la colocacin de los
nmeros en los intervalos.
19 Aldo Bresani
Otro concepto importante es la marca de clase a la cual
denotaremos Xi, y es el punto medio o semisuma de los lmites
inferior (m) y superior (M) de cada intervalo.
Por ejemplo la marca de clase de un intervalo con lmites 0 y 4
seria 2, y el intervalo siguiente de 4 a 8 tendra como marca de
clase el 6.
20 Aldo Bresani
PASOS PARA CONSTRUIR LA DISTRIBUCIN DE
FRECUENCIAS

Determinar el rango (R) de variacin de los datos.
Determinar el nmero de intervalos (K), pudindose usar la
Regla de Sturges o la raz cuadrada de n para tener una idea
inicial:
Regla de Sturges: K = 1 + 3.3*log (n)
K = Raz cuadrada (n)
Determinar la amplitud (A) del intervalo, dividiendo R entre K y
aproximndose por exceso en caso de que la divisin no sea
exacta.
Por ltimo se determinan los extremos de cada intervalo y se
escriben.
21 Aldo Bresani
Ejemplo 3: (Variable cuantitativa continua)

Tomamos una muestra de focos para ver su duracin, teniendo los
siguientes datos:

Cantidad de la muestra (n) = 500 focos
Tiempo mnimo de duracin (m) = 20 horas
Tiempo mximo de duracin (M) = 120 horas

Entonces:
El rango es R = 100
El nmero de intervalos puede ser K = 5
La amplitud del intervalo sera A = 20 (R/K)
22 Aldo Bresani
La descripcin de los intervalos es como sigue:
Ii Xi fi Fi fri Fri
[20,40> 30 50 50 0.10 0.10
[40,60> 50 150 200 0.30 0.40
[60,80> 70 200 400 0.40 0.80
[80,100> 90 80 480 0.16 0.96
[100,120] 110 20 500 0.04 1.00
500

Xi es la marca de clase
23 Aldo Bresani
Como conclusin del cuadro anterior, se puede inferir por
ejemplo que:

200 focos duran entre 60 y 80 horas
o que el 40% de los focos duran entre 60 y 80 horas
Que 400 focos duran hasta 80 horas
o que el 80% de los focos duran hasta 80 horas

Y adems podramos hacer algunos grficos como:
HISTOGRAMAS, POLIGONOS DE FRECUENCIA Y OTROS.
24 Aldo Bresani

HISTOGRAMA, es la representacin por medio de barras
rectangulares, siendo la base de cada barra proporcional a la
amplitud, su centro la marca de clase y la altura su frecuencia
absoluta o relativa.
En el eje horizontal va la escala de la variable y en el vertical la
escala de la frecuencia.

13
24
9
8
5
1
0
5
10
15
20
25
30
0 a 2,0 2,0 a
4,0
4,0 a
6,0
6,0 a
8,0
8,0 a
10,0
10,0 a
12,0
12,0 a
14,0
14,0 a
16,0
Pensiones anuales en miles de soles
N

m
e
r
o

d
e

c
o
l
e
g
i
o
s
25 Aldo Bresani
POLIGONOS DE FRECUENCIA, es la representacin por
medio de una figura polgona cerrada, que se obtiene uniendo con
segmentos de recta los puntos de interseccin de las marcas de
clase con las frecuencias.


9
8
5
1
13
24
0
5
10
15
20
25
30
0 a 2,0 2,0 a
4,0
4,0 a
6,0
6,0 a
8,0
8,0 a
10,0
10,0 a
12,0
12,0 a
14,0
14,0 a
16,0
Pensiones anuales en miles de soles
N

m
e
r
o

d
e

c
o
l
e
g
i
o
s
26 Aldo Bresani

CURVAS DE FRECUENCIA, se puede obtener del polgono de
frecuencia suavizando los puntos angulosos del polgono. Esta
grfica nos describe algunas caractersticas de la distribucin de
la poblacin como: Simetra, Asimetra, Normalidad,
Uniformidad, Bimodalidad, etc.

1
5
8
9
24
13
0
5
10
15
20
25
30
0 a 2,0 2,0 a
4,0
4,0 a
6,0
6,0 a
8,0
8,0 a
10,0
10,0 a
12,0
12,0 a
14,0
14,0 a
16,0
Pensiones anuales en miles de soles
N

m
e
r
o

d
e

c
o
l
e
g
i
o
s
27 Aldo Bresani

LA OJIVA, o polgono de frecuencias acumuladas, se obtiene
uniendo segmentos de recta de intersecciones entre el lmite
superior de cada intervalo y la frecuencia acumulada respectiva.
Con la ojiva se puede calcular fcilmente el nmero o porcentajes
de observaciones que corresponden a un intervalo determinado.


0
13
37
46
54
59 60
0
10
20
30
40
50
60
70
0 a 2,0 2,0 a
4,0
4,0 a
6,0
6,0 a
8,0
8,0 a
10,0
10,0 a
12,0
12,0 a
14,0
14,0 a
16,0
Pensiones anuales en miles de soles
N

m
e
r
o

d
e

c
o
l
e
g
i
o
s
28 Aldo Bresani

BARRAS AGRUPADAS, se usan para comparar las frecuencias
en cada modalidad cuando una variable tiene varias partes.
Ejemplo: La modalidad ao puede tener los componentes
Hombre graduados y Mujeres graduados.
46
35
27
21
28
31
0
10
20
30
40
50
60
70
80
1 2 3
Ao
29 Aldo Bresani
MEDIDAS DESCRIPTIVAS

1. Medidas de Posicin:

Tendencia Central o Promedios: media aritmtica, media
geomtrica, mediana
Localizacin: cuartiles

2. Medidas de dispersin: desviacin estndar, rango, varianza,
coeficiente de variacin.
30 Aldo Bresani
MEDIDAS DE POSICIN


Las medidas de posicin reflejan la tendencia central y la
localizacin de los datos.

Las medidas de tendencia central, denominadas tambin
promedios, ubican el centro de los datos, como la media
aritmtica, la media geomtrica, y la mediana.

31 Aldo Bresani
MEDIDAS DE TENDENCIA CENTRAL

1.- MEDIA ARITMTICA
Es la suma de los valores observados de la variable, dividido
entre el nmero de observaciones.
Media aritmtica de datos no tabulados o media aritmtica
simple.
Se calcula utilizando la frmula:

X = xi
i =1
N
32 Aldo Bresani

Ejemplo: Los siguientes datos corresponden a los ingresos (en
soles) de 10 trabajadores del sector salud.
900, 800. 900, 12100, 800, 700, 1300, 800, 1200
a) calcular el ingreso promedio.




Es decir el ingreso promedio de los 9 trabajadores del sector
salud es 2166 soles.
900 + 800 + 900 + 12100 + 800 + 700 + 1300 + 800 + 1200
9
= 2166
33 Aldo Bresani

- Media para variable discreta (media ponderada)

Ejemplo: Calcular el promedio de notas de 20 alumnos, si 3
alumnos tienen 16, 4 alumnos tiene 14, 8 alumnos tienen 13 y 5
tienen 11
34 Aldo Bresani

- Media para variable discreta (media ponderada)


Calcular el promedio del curso de Soluciones estratgicas con
tecnologa de informacin para Carlos Delgado si las notas que obtuvo
y sus respectivos pesos son los siguientes:
Criterios de evaluacin Notas Peso
Controles de lectura 16 20% 3,20
Participacin en clase 13 15% 1,95
Examen parcial 10 25% 2,50
Casos y trabajos 16 10% 1,60
Examen final 14 30% 4,20
100% 13,45
35 Aldo Bresani

Media aritmtica de datos por intervalos.
(Media para variable continua)

Ejemplo: Calcular el peso promedio de las personas de una
universidad en base a una muestra de 100.
36 Aldo Bresani
Datos
Pesos Nro Marca fi*Xi
Personas
[54-60> 20 57 1140
[60-66> 29 63 1827
[66-72> 28 69 1932
[72-78 > 23 75 1725

100 Total 6624
El peso promedio de la poblacin se calcula en 66.24 kilos.
Observar que si sacamos la media simple de los 100 datos, lo
ms probable es que los resultados difieran.


37 Aldo Bresani

Desventajas de la media aritmtica
1.- La media aritmtica depende de todos los valores observados,
y es afectada por valores extremo. Ejemplo:

a.- 5, 10, 8 . 9 X
1
= 8.00
b.- 5, 10, 8 .50 X
2
= 18.50
a.- 5, 10, 8 .0 X
3
= 5.75


38 Aldo Bresani

2.- MEDIA GEOMTRICA.

La media geomtrica de n valores positivos se define como la raz
n..sima del producto de los datos:



La media geomtrica se usa para promediar tiempos que siguen
una tendencia exponencial, como: razones (a/b), ndices (a/b en
%), proporciones (a/(a+b), tasas de cambio (a-b)/b, entre otros
n
n
x x x x G M ... . .
3 2 1
39 Aldo Bresani

Ejemplo: Si la produccin de cierto cereal ha experimentado un
crecimiento del 30% del primer al segundo ao y un incremento
del 35% del segundo al tercer ao, calcular el porcentaje
promedio de crecimiento de los tres aos y la produccin del
cuarto ao si la del primero fue 100.
40 Aldo Bresani

LA MEDIANA
La mediana es el punto medio de los valores despus de
ordenarlos de menor a mayor o de mayor a menor. Hay tanto
valores por encima de la mediana como por debajo de ella en la
ordenacin de los datos.
Su caracterstica particular es que depende del nmero de datos
observados y no de los valores de esos datos.
41 Aldo Bresani

MEDIANA DE DATOS NO TABULADOS
Si n valores de alguna variable X son ordenados en forma
creciente:
X1 < X2 < X3 < ............ < Xn
Entonces si n es impar la mediana es X(n+1)/2
Y si n es par, la mediana es Xn/2 + X(n+2)/2
2
Ejemplo 1: Hallar la mediana para: 40, 43, 39, 19, 44.
Ejemplo 2: Hallar la mediana para: 3, 12, 16, 46, 39, 1.

42 Aldo Bresani
MODA
La moda simple es el valor de la observacin que aparece con
ms frecuencia.
Es una medida menos importante que la mediana debido a su
ambigedad.
La moda tiene la desventaja que no siempre existe, y si existe no
siempre es nica.
Tambin se puede hallar moda para datos no tabulados y moda
para datos tabulados.
Ejemplo: Moda de datos no tabulados.
Se tiene las siguientes edades en un grupo de 12 personas (35, 41,
31, 33, 34, 28, 31, 32, 34, 29, 33, 34) Cual es la moda simple?
43 Aldo Bresani

MEDIDAS DE DISPERSIN O
VARIACIN

Con las medidas de Tendencia Central es posible determinar el
centro de una distribucin, pero no indican que tan cercanos o
lejanos estn los datos de ese promedio.

La dispersin se calcula entonces para evaluar la confiabilidad de
ese promedio que se est utilizando. Cuando la dispersin es
pequea, los datos estn concentrados alrededor de su promedio y
viceversa.
44 Aldo Bresani
Si ponemos una empresa que comercializa arroz y vamos a
vender bolsas de un kilo, la mquina llenadora y selladora de
bolsas debe estar lo ms ajustada posible a fin de que la varianza
sea la menor posible a pesar de que las bolsas tengan como media
un kilo. Es fcil imaginar lo rpido que quebrara el negocio si
muchas bolsas tuvieran 700 Gms. 800 Grm. y otras 1.2 Kg., o 1.3
Kg.

RANGO
Es la diferencia entre el valor ms alto y el menor valor de una
serie de datos.
R = Xmax - Xmin
45 Aldo Bresani

VARIANZA
Es una medida que cuantifica el grado de dispersin o variacin
de los valores de una variable cuantitativa con respecto a su
media aritmtica. Se define como la media aritmtica de los
cuadrados de las diferencias de los datos con respecto a su media
aritmtica. La varianza de una muestra se denota S
2
mientras que
la de una poblacin se denota Sigma
2
.

DESVIACIN ESTNDAR
Es la raz cuadrada positiva de la Varianza, y se denota como S
cuando se saca de una muestra y como Sigma cuando se obtiene
de una poblacin.
46 Aldo Bresani

VARIANZA Y DESVIACIN ESTNDAR PARA
POBLACIN
Datos no tabulados

Sigma
2
= (Xi - u)
2
N
Datos tabulados

Sigma
2
= fi(Xi - u)
2

N

47 Aldo Bresani

Ejemplo: (datos no tabulados)
Determinar la varianza y desviacin estndar de los siguientes
datos que corresponden a los pesos en kilos de cinco pequeos
chanchos que posee un granjero:
5, 10, 8, 9, y 20 La media u = 10.4
Entonces la varianza es:

Sigma
2
= (5-10.4)
2
+ (10-10.4)
2
+...+(20-10.4)
2

5
Sigma
2
= 129.2 / 5 = 25.84
Y la desviacin estndar es:
= 5.08
48 Aldo Bresani

VARIANZA Y DESVIACIN ESTNDAR PARA
MUESTRA
Datos no tabulados

S
2
= (Xi - X)
2

n - 1
Datos tabulados

S
2
= fi(Xi - X)
2

n - 1

49 Aldo Bresani

COEFICIENTE DE VARIACIN
Es una medida de dispersin relativa que proporciona una
estimacin de la magnitud de las desviaciones con respecto a la
magnitud de la media
CV = s/X o CV = (s/X)x100%


Es til para comparar la variabilidad de dos o ms series de datos
que tengan distintas unidades de media y/o distintas aritmticas
50 Aldo Bresani

Ejemplo:
Las medidas tomadas con un micrmetro al dimetro de una
produccin de cojinetes, tienen una media de 3.98 mm. y una
desviacin estndar de 0.014 mm., mientras que las medidas
tomadas a otra muestra de resortes sin extender, tienen una media
de 1.59 pulgadas y una desviacin estndar de 0.009 pulgadas.
Qu grupo de objetos tiene una mayor variabilidad?.
C.V.1 = (0.014 / 3.98) x 100% = 0.35%
C.V.2 = (0.009 / 1.59) x 100% = 0.57%