You are on page 1of 161

Inferencia Estadstica

Mdulo I
2

Inferencia Estadstica

Estimacin :

Estimacin puntual

Propiedades de los estimadores

Estimacin por intervalos para la media, proporcin, diferencia de


medias y diferencia de proporciones, usando la distribucin normal.
3

Inferencia Estadstica

Contraste de Hiptesis

Fundamentos de la contrastacin de hiptesis


Formulacin de hiptesis. Hiptesis simple y compuesta
Tipos de errores en la contrastacin.
Etapas para la contrastacin de hiptesis.
Contraste de hiptesis para la media, proporcin, diferencia de
medias, y diferencia de proporciones.
Relacin entre los intervalos de confianza y la contrastacin de
hiptesis.
4

Inferencia Estadstica

Estadstica
Descriptiva Inferencial
Organizacin de
Datos Estimacin Contraste de
Hiptesis
Medidas de
Tendencia,
Puntual Por
Posicin, variacin.
Intervalos
Representacin
grfica.
5

Inferencia Estadstica

Mtodos mediante los cuales se selecciona


una muestra aleatoria de una poblacin
intentando:
Hallar el verdadero valor del
parmetro desconocido

Decidir si alguna funcin de la


muestra es igual a algn valor
preconcebido
6

Inferencia Estadstica: Conceptos.

Poblacin: Coleccin de todas las posibles


mediciones que pueden hacerse de una
caracterstica en estudio. (datos o valores).

Muestra: Subconjunto de la poblacin.

Parmetro: Caracterizacin numrica de la


distribucin de la poblacin de manera que
describe, parcial o completamente, la funcin
de densidad de la caracterstica de inters.
7

Inferencia Estadstica: Conceptos.

Estadstico: Cualquier funcin de variables


aleatorias que forman una muestra aleatoria.

Estimador: funcin de variables aleatorias


observables (muestra) y quizs otras
constantes conocidas usados para estimar un
valor poblacional (Parmetro).
8

Inferencia Estadstica.
Poblacin. Valores
Muestra. Muestrales

Inferencia. Estimacin.

Edades. Hab.
Edad Promedio
Municipio
Libertador.
Valores Poblacionales
(Parmetros).

9

Inferencia Estadstica: Conceptos.

Estimacin: Proceso mediante el cual se


utiliza los resultados de una muestra
representativa para estimar el verdadero valor
del parmetro poblacional

Se quiere estimar la edad promedio de los


habitantes del Municipio Libertador del
Estado Mrida.
10

Inferencia Estadstica.

Ejemplo:
Edad
Variable en Estudio:_____________________
Habitantes del Municipio Libertador
Universo:____________________________
Las edades de los Habitantes del Mun. Lib
Poblacin:___________________________
Edad del los habitantes de Ejido
Muestra:_____________________________
Media Poblacional
Parmetro:___________________________
Media Muestral
Estimador:____________________________
11

Inferencia Estadstica.

Propiedades de un Estimador:

Suficiente: Incluye toda la informacin de la muestra.


Insesgado: E( )=

Consistencia: A medida que se incrementa la muestra


el estimador se acerca al verdadero valor del
parmetro.

Varianza Mnima.
Inferencia Estadstica.

Teorema: Sea un estimador de con



base en una muestra
lim V( )= 0
lim E()=
de tamao n si +00
y +00
entonces es un estimador
consistente de
Inferencia Estadstica.

Algunos Estimadores Importantes:


Muestral Poblacional

P
2 2


14

Inferencia Estadstica.

Estimacin Puntual:

Una estimacin puntual de algn


parmetro de la poblacin
consta de un solo valor

Parmetros Poblacionales

Estimadores
15

Inferencia Estadstica.

Ejemplo:
Se quiere estimar el tiempo promedio de reaccin ante
un estimulante de pacientes con cncer en el estado
Mrida para ello se levanto una muestra y se registraron
los tiempos de reaccin

2,5 3,6 3,1 4,3 2,9


2,3 2,6 4,1 3,4 3,4
16

Inferencia Estadstica.

Estimacin por Intervalos:


Es difcil que el estimador insesgado ms
eficiente estime con exactitud el verdadero valor
del parmetro poblacional

Determinar un intervalo en el que, en forma probable


Se encuentra el valor del parmetro.
Intervalos de Confianza:


l< <u
17

Inferencia Estadstica.

Estimacin por Intervalos:


Supngase que una tienda mantiene muy buenos
registros respecto al nmero de unidades de cierto
producto que vende mensualmente. Para la
compaa es muy importante conocer la demanda
promedio ya que con base en esta, se lleva a cabo
el mantenimiento del inventario.
18

Inferencia Estadstica.

Estimacin por Intervalos:

Suponga que la demanda no se ve afectada por


fluctuaciones En la temporada. La compaa decide
que los ltimos 36 meses han sido tpicos Con
respecto a la demanda de ese producto, y con base
a estos Datos muestrales el valor calculado de la
media muestral es de 200 unidades
19

Inferencia Estadstica.

Estimacin por Intervalos:


Implica que la demanda media desconocida no sea
mayor de 250 ni menor a 150?

Suponga que la desviacin estndar de la media


muestral es de 60 Unidades
20

Inferencia Estadstica.

Estimacin por Intervalos:


Teorema Central del Lmite:
Si es la media de una muestra aleatoria de tamao n que se
toma de una de una poblacin que se toma con media y varianza
2 entonces:


= (0,1) +00


21

Inferencia Estadstica.

Intervalos de Confianza para con varianza


conocida:

+
1
2
22

Inferencia Estadstica.

Estimacin por Intervalos:


El consumo de gasolina de los vehculos de una
empresa en litros/da , durante un periodo de 36
das elegidos al azar durante el ao 2012, es el
siguiente:
23

Inferencia Estadstica.

4105 3954 3980 3970 4035 3978


3997 3985 4036 3970 4020 4026
4018 3982 4050 3978 3998 3984
3984 3985 4042 3990 4017 3980
3960 3990 3900 3980 4065 3909
4040 3975 4035 4048 3990 4044
24

Inferencia Estadstica.

Se sabe que el consumo de la empresa sigue


una ley normal cuya varianza es de 1600.
a) Determinar un intervalo para estimar el
consumo medio diario durante el 2012 con un
nivel de confianza del 95% y 99%.
25

Inferencia Estadstica.
Promedio 4000
Desviacion 40,4756443
n 36 3982,66 < < 4017,33 = 0.99
Alfa 0,01
Alfa/2 0,005
1-alfa/2 0,995
Z 2,57 Con un 99% de confianza se espera
Error Mximo 17,3370676 que el verdadero tiempo promedio se
LS 4017,33707 encuentre en el intervalo calculado
LI 3982,66293
26

Inferencia Estadstica.
Calculo del tamao de muestra:

Teorema: Si se usa como estimacin de ,


se puede tener 1 100% de confianza de
que el error no exceder una cantidad
especfica cuando el tamao de la muestra
sea:
2
1
2
=

27

Inferencia Estadstica.

Cul ha de ser el tamao mnimo de la


muestra para que el error no supere los 10
litros/da con la misma confianza del 99%?

2
= 10 2.57 40
n= = 108
1=2.57 10
2
= 40
28

Inferencia Estadstica.

Intervalos de Confianza para con varianza


desconocida:

= 1/2,1


+
1/2,1

29

Inferencia Estadstica.

La puntuacin de una muestra de 20 jueces de


gimnasia rtmica, elegidos al azar, para una
misma prueba present los siguientes puntajes:
9,6 9,8 9,7 9,7
9,8 9,9 9,8 9,8
9,9 9,7 9,9 9,9
9,8 9,8 9,9 9,8
9,9 9,9 9,9 9,7
30

Inferencia Estadstica.
Calcular un intervalo de confianza con un 95% y
99% para la puntuacin promedio
+
1/2,1

Promedio 9,81
n 20
Desv 0,09119095
alfa 0,01 9.75 < < 9.87 = 0.99
alfa/2 0,005
1- alfa/2 0,995
t 2,861 Con un 99% de confianza se espera
Error Mximo 0,05833841 que el verdadero tiempo promedio se
LS 9,86833841 encuentre en el intervalo calculado
LI 9,75166159
31

Inferencia Estadstica.
Intervalos de confianza para la diferencia de
medias de dos poblaciones normales
independientes:

2 2
+
1/2 +

32

Inferencia Estadstica.
Se emplean dos mquinas para llenar botellas de plstico con un
volumen neto de 16 onzas. El proceso de llenado puede suponerse
normal, con desviaciones estndar de 1=0,015 y 2=0,015. Ingeniera
de calidad sospecha que ambas mquinas llenan hasta el mismo
volumen neto, sin importar que este volumen sea o no de 16 onzas. Se
toma una muestra aleatoria de la salida de cada mquina.

mquina 1 16,03 16,04 16,05 16,05 16,02 16,01 15,96 15,98 16,02 15,99

mquina 2 16,02 15,97 15,96 16,01 15,99 16,03 16,04 16,02 16,01 16
33

Inferencia Estadstica.
Promedio 16,015 Promedio 16,005
n 10 n 10
Desv 0,015 Desv 0,015
Var 0,000225 Var 0,000225
alfa 0,05 alfa 0,05
alfa/2 0,025 alfa/2 0,025
1- alfa/2 0,975 1- alfa/2 0,975

Error
Mximo 0,01314808
LS 0,02314808
LI -0,01314808
34

Inferencia Estadstica.
Intervalos de confianza para la diferencia de
medias de dos poblaciones normales
independientes: (Varianzas Desconocida pero
se suponen iguales)
+ 1 1
;1+22; +
2

1 2 + 1 2
=
+ 2
35

Inferencia Estadstica.
Las presiones criticas de dos grupos
independientes de recipientes de distintos vidrios
dan los siguientes valores:
Grupo 1 100 102 96 106 110 110 120 112 112 90
Grupo 2 104 88 100 98 102 92 96 100 96 96

Suponiendo que las dos poblaciones son


normales y de varianzas iguales y
desconocidas, calcular un intervalo de
confianza del 95% para la diferencia de
presiones medias.
36

Inferencia Estadstica.
+ 1 1
/2;+22; +

1 2 + 1 2
=
+ 2
37

Inferencia Estadstica.
Promedio 105,8 Promedio 97,2
n 10 n 10
78,622222
Var 2 Var 22,4
alfa 0,05 alfa 0,05
alfa/2 0,025 alfa/2 0,025
1- alfa/2 0,975 1- alfa/2 0,975
t 2,1 t 2,1

Sp 7,10711693
Error 6,6746385
Mximo 7

15,274638
LS 6
1,9253614
LI 3
38

Inferencia Estadstica.
Intervalos de Confianza para la
Proporcin:

;

+
1/2

39

Inferencia Estadstica.
Tomada, al azar, una muestra de 120 estudiantes
de una Universidad, se encontr que 54 de ellos
hablaban ingls.
Halle, con un nivel de confianza del 90%, un
intervalo de confianza para estimar la
proporcin de estudiantes que hablan el idioma
ingls entre los estudiantes de esa Universidad.
40

Inferencia Estadstica.
41

Inferencia Estadstica.
Intervalos de Confianza para la Diferencia de
Proporciones:

+ 1 1 2 2
1 2 1/2 +
1 2
42

Inferencia Estadstica.

La fraccin de productos defectuosos


producidos por dos lneas de produccin se
est analizando. Una muestra aleatoria de 1000
unidades de la lnea 1 tiene 10 defectuosas, en
tanto que una muestra aleatoria de 1200
unidades de la lnea 2 tiene 25 defectuosas.
43

Inferencia Estadstica.
Contraste de Hiptesis:

Tcnica Estadstica la cual se usa para tomar


decisiones sobre la poblacin, se Establecen
Hiptesis sobres los parmetros y luego se
contrastan para aceptar o rechazar dichas
Hiptesis
44

Inferencia Estadstica.

Hiptesis Estadstica:
Es una suposicin concerniente a una o ms
distribuciones poblacionales, es decir a uno o
ms parmetros de la poblacin.

Esta suposicin es considerada una hiptesis


ya que est referida a una situacin que puede
ser o no ser verdadera.
45

Inferencia Estadstica.
Hiptesis Nula: 0 :
Nulifica el efecto de la variable en estudio, ausencia de los
efectos de la variable que se investiga.

Hiptesis Alternativa: 0 :
Variacin de los valores que prevaleceran si la variable
que se estudia ejerce algn efecto.
(Pregunta que debe responderse, teora que debe
probarse.)
46

Inferencia Estadstica.

Un proceso manufacturero usado en una fbrica durante los ltimos aos


da una produccin media de 100 unidades por hora, con una desviacin
estndar de 8 unidades, se acaba de introducir en el mercado una nueva
mquina para realizar este tipo de producto. Aunque es muy cara
comparada con la que esta en uso, si la media de produccin de la nueva
maquina es de ms d e150 unidades por hora, su adopcin dara bastantes
beneficios. Para decidir si se debiera comprar la nueva mquina, la
gerencia de la fbrica compra 35 de esas mquinas como un experimento.
Establezca la hiptesis nula y la alternativa.
47

Inferencia Estadstica.

Espacio paramtrico:

Conjunto de todos los posibles valores que puede asumir


Es una un cierto parmetro poblacional, no conocido,
respecto al cual se hace una cierta hiptesis. Cuando se
plantea una hiptesis lo que se hace es particionar el
espacio paramtrico en dos sub espacios.
48

Inferencia Estadstica.

Tipos de Hiptesis:
Hiptesis Simple:

El Sub espacio paramtrico contiene un solo punto = 120

Hiptesis Compuesta:

El Sub espacio paramtrico contiene ms de un punto > 120


49

Inferencia Estadstica.

Tipos de Errores que se cometen en una formulacin


de Hiptesis:
Error Tipo I:Rechazar H0 cuando esta es cierta
Error Tipo I:Aceptar H0 cuando esta es falsa.

Ho Cierta Ho Falsa
No Rechace Ho Correcta Error Tipo II
Rechace Ho Error Tipo I Correcta
50

Inferencia Estadstica.

Pasos a Seguir en el contraste de Hiptesis:


1. Formulacin de Hiptesis:

0 : = 0 0 : < 0 0 : < 0
1 : < 0 1 : 0 1 : 0
51

Inferencia Estadstica.
2. Nivel de Significancia:
3. Estadstico de Prueba:


=

3. Estadstico de Prueba:
52

Inferencia Estadstica.
4. Regla de Decisin:
Rechazar Ho Ssi:

0 : = 0
1 : < 0

<
53

Inferencia Estadstica.

0 : < 0
1 : 0

>
54

Inferencia Estadstica.

0 : < 0
1 : 0

> 1

<
55

Inferencia Estadstica.
6. Clculos.

7. Conclusiones.
56

Inferencia Estadstica.
Contraste de Hiptesis para la media :
Una muestra aleatoria de 100 muertes registradas en el estado, el ao
pasado mostro una vida promedio de 71.8 aos. Suponiendo una
desviacin estndar poblacional de 8.9 aos, Esto parece indicar que la
vida media actual es mayor a 70 aos?, Utilice un nivel de significancia de
5%.
57

Inferencia Estadstica.
Contraste de Hiptesis para la diferencia de medias: 1 2 :
Un fabricante de equipo deportivo desarrollo un nuevo sedal para pesca
sinttico, que afirma que tiene una resistencia a la rotura de 8Kg con una
desviacin de 0,5 Kg. Pruebe la hiptesis de que la resistencia media a la
rotura difiere a la que dice el fabricante, sabiendo que en una muestra
aleatoria de tamao 50, arrojo una resistencia promedio a la rotura de 7,8
Kg. Use un nivel de significancia de 0.05.
58

Inferencia Estadstica.
59

Inferencia Estadstica.
Contraste de Hiptesis para la Diferencia de Proporciones:
60

Inferencia Estadstica.
61

Inferencia Estadstica.
Estimacin por Intervalos:
Nivel de Confianza

l< <u = (1 ); 0<<1

l u : Puntos Extremos del Intervalo

Se tiene una Coonfianza de (1-) de Seleccionar una

variable aleatoria Que produzca un intervalo que contenga


62

Inferencia Estadstica.
63

Muestra aleatoria: se considera aleatoria


siempre y cuando cada observacin,
medicin o individuo de la poblacin tenga la
misma probabilidad de ser seleccionado.
64

Censo o Muestreo?
- Costo
- Control Recoleccin de Informacin - Calidad
- Rapidez de resultados
- Poblacin muy grande o infinita
- Poblacin muy homognea
- Proceso de medicin destructivo
65

Individuos o Elementos:
Cualquier ente, racional o irracional, objeto o concepto.

Caractersticas o Propiedades
Existencia, Modalidad Categora (cuantitativa, cualitativa)
Relaciones.

Proceso de Medicin
Determinar si un Individuo posee o no cierta caracterstica o si
presenta cierta modalidad en tal caracterstica.
66

Variables:
son las caractersticas o lo que se estudia de
cada individuo de la muestra. Ej: sexo, edad,
peso, estatura, color de ojos, estado civil,
temperatura, cantidad de nacimientos, presin,
dimetro, ...
Datos:
son los valores que toma la variable en cada
caso.
67

Cualitativos: son datos que solo toman valores


asociados a las cualidades o atributos,
clasificndolos en una de varias categoras, es
decir, no son valores numricos.
Sexo: f/m.
Hbito de fumar: Fumador/No fumador
Color de ojos: negro, azul, marrn,
Religin: Catlica, Evanglica,
Estado civil: soltero, casado, divorciado,
68

Cuantitativos: provienen de variables que


pueden medirse, cuantificarse o expresarse
numricamente. Ejemplos:
Peso
Edad
Estatura
Presin
Humedad
Intensidad de un sismo
Cantidad de hermanos
69

Tipos de variables cuantitativas:


Discretas: es aquella que solo puede tomar un
nmero finito o infinito numerable de valores.
Ejemplo: cantidad de hermanos.
Continuas: es la variable que puede tomar
cualquier valor en una escala continua. Ejemplo:
cantidad de lquido contenido en un recipiente.
70

Escalas de medida

Concepto:
Conjunto de valores que puede tomar una
variable, o conjunto de modalidades que
puede presentar una caracterstica.
71

Escalas de medida

Nominal. Variables Cualitativas


Ordinal.
De Intervalos.
Variables
De Razn o Proporcin. Cuantitativas
Absoluta.
72

Escalas de medida

Escala Nominal: los datos se pueden


agrupar en categoras que no mantienen
una relacin de orden entre s, por lo tanto
no estn definidas las operaciones lgicas
(>, <, , ) sino solo las de igualdad o
diferencia.
Ejemplos: color de ojos, sexo, profesin,
estado civil, religin.
73

Escalas de medida

Escala Ordinal: existe un cierto orden o


jerarqua entre las categoras (>, <, , ).
Ejemplos: grados militares, organigrama de
una empresa, escalafn de los
profesores universitarios, grados
de disnea, estadiaje de un tumor,
resultados de estudios de opinin.
(Excelente, Bueno, Regular, Malo)
74

Escalas de medida

Escala de Intervalos: valores numricos de


las variables y adems de las relaciones de
orden (>, <, , ), se pueden establecer
distancias, es decir, tienen sentido las
operaciones de suma y resta.
Propiedades:
Existe una unidad de medida que se mantiene constante
para todos los valores que toma la variable.
Existe un valor patrn u origen relativo que no significa la
ausencia de valor en la variable.
75

Escalas de medida

Ejemplo: temperatura, nivel de ruido,


movimientos ssmicos.
76

Escalas de medida

Escala de Razn o Proporcin: es la ms


completa y general de todas las escalas. Se
caracteriza porque los valores de la variable
son nmeros, entre los cuales, adems de las
relaciones de orden (>, <, , ) y distancia (+,-),
se pueden establecer mltiplos y proporciones.
Ejemplos: peso, altura, volumen, ingreso, precio
Propiedades:
- Tienen
Poseenunidad
0 absoluto que significa ausencia de la propiedad.
de medida
77

Escalas de medida

Escala Absoluta: se caracteriza porque los


valores que toma la variable son el resultado
de un conteo y por lo tanto, est constituida
por los enteros positivos y el cero.
Ejemplos: nmero de hermanos, cantidad de
autos vendidos, cantidad de
accidentes en una interseccin,
cantidad de hijos,
78

Escalas de medida

Escalas Nominal Ordinal Intervalos Razn Absoluta


Propiedades
Categoriza X X X X X

Jerarquiza X X X X

Diferencias tienen sentido X X X

Mltiplos tienen sentido X X

Cero absoluto X X

Operaciones Aritmticas X X X
(Algunas)
Se pueden transformar en
X X X X
otras del mismo tipo
79

Datos Univariantes y Multivariantes

Univariantes o unidimensionales: slo


recogen informacin sobre una caracterstica
(Ej: edad de los alumnos de una clase).
Bivariantes o bidimensionales: recogen
informacin sobre dos caractersticas de la
poblacin. (Ej: edad y estatura de los
alumnos de una clase).
80

Datos Univariantes y Multivariantes

Multivariantes o pluridimensionales: recogen


informacin sobre tres ms caractersticas.
(Ej: edad, estatura y peso de los alumnos de
una clase).
81

Estadstica - Abusos

Conclusiones errneas debido a que los datos


son numricamente insuficientes.
Representaciones grficas engaosas
(escalas).
Datos muestrales no representativos:
Muestra que no incluye a elementos de toda la poblacin.
Ciertas categoras de personas no responden correctamente.
Respuestas voluntarias (sesgadas).
82

Organizacin de los datos

Datos cualitativos
Se realiza de acuerdo a las modalidades que
presente la variable en estudio. Mediante un
conteo se determina el nmero de datos
(Frecuencia) correspondiente a las diferentes
categoras de la variable. Se usa para
cualquier cantidad de datos.
83

Organizacin de datos cualitativos

Ejemplo: En un estudio sobre las personas que


ejercen cargos directivos en una empresa, se
realizaron 32 entrevistas y se obtuvo la siguiente
informacin. Variable: Sexo.
F, F, M, M, F, M, F, F, M, F, M,
M, M, M, F, F, M, F, F, F, M, F,
F, M, M, F, F, F, F, F, M, M. .
84

Organizacin de datos cualitativos

Clasificacin del Personal Directivo


de acuerdo al sexo.
Sexo Personas
Masculino 14
Femenino 18
Total 32
85

Organizacin de datos cualitativos

Tablas de Doble Entrada o de Contingencia.


Se utilizan para agrupar los datos de acuerdo a
dos caractersticas simultneamente.
Caracterstica B
b1 b2 ... bk Totales
Caracteristica A
... ak

xxx xxx xxx


xxx xxx
a2
a1

Totales
86

Organizacin de datos cualitativos

Datos correspondientes Profesin Sexo M F Totales


a Sexo y Profesin de 32
Ejecutivos de Empresa Abogados 3 4 7
Economistas 3 2 5
Educadores 3 1 4
Gegrafos 2 1 3
Ingenieros 2 5 7
Mdicos - 2 2
Socilogos 1 3 4
Totales 14 18 32
87

Organizacin de los datos

Datos cuantitativos
Para organizar y agrupar datos de tipo
cuantitativo, discretos o continuos, se utiliza un
procedimiento similar al utilizado con los datos
cualitativos, pero ms laborioso.
88

Organizacin de datos cuantitativos

Una vez que se ha


realizado la
recoleccin de los
datos, se obtienen
datos en bruto, los
cuales rara vez son
significativos sin una
organizacin y
tabulacin.
89

Organizacin de datos cuantitativos

Formas de organizar los datos:


Distribucin de Frecuencias: es un arreglo de los datos
que permite expresar la frecuencia de ocurrencias de las
observaciones en cada una de las clases, mostrando el
patrn de la distribucin de manera ms significativa.

Clase Pto. Medio fi Fi fri FRi


90

Organizacin de datos cuantitativos

La Distribucin de Frecuencias:
Se recomienda su uso cuando se tienen grandes
cantidades de datos (n).
Su construccin requiere, en primer lugar, la
seleccin de los lmites de los intervalos de clase.
Para definir la cantidad de intervalos de clase (k),
se puede usar:
La regla de Sturges: k = 1 + 3.3log(n)
k = n
91

Organizacin de datos cuantitativos

La Distribucin de Frecuencias:
La cantidad de clases no puede ser tan pequeo
(menos de 5) o tan grande (ms de 20), que la
verdadera naturaleza de la distribucin sea
imposible de visualizar.
La amplitud de todas las clases deber ser la
misma. Se recomienda que sea impar y que los
puntos medios tengan la misma cantidad de cifras
significativas que los datos en bruto.
Los lmites de las clases deben tener una cifras
significativas ms que los datos en bruto.
92

Organizacin de datos cuantitativos

Determinar:
Punto medio = (Li+Ls)/2.
Frecuencia absoluta de la clase (fi).
Frecuencia acumulada de la clase (Fi).
Frecuencia relativa de la clase (fri):
fri = fi/n
Frecuencia relativa acumulada de la clase (FRi).
93

Organizacin de datos cuantitativos

Ejemplos de Distribuciones de
Frecuencias
94

Organizacin de datos cuantitativos

Formas de organizar los datos:


Arreglo: es la forma ms sencilla de organizar los datos en
bruto. Consiste en colocar las observaciones en orden
segn su magnitud: ascendente o descendente.
Poco prctica cuando se tiene una gran cantidad de datos.
95

Distribucin de Frecuencias

Ejemplo 1:
Se desea determinar cmo varan las estaturas de las mujeres,
al tomar una muestra de 50 trabajadoras de una fbrica de
pantalones.
Los datos obtenidos fueron los siguientes:

1.65 1.63 1.65 1.63 1.69 1.67 1.53 1.58 1.60 1.61
1.65 1.64 1.71 1.68 1.66 1.56 1.59 1.61 1.62 1.63
1.63 1.69 1.67 1.66 1.58 1.60 1.61 1.62 1.64 1.64
1.55 1.59 1.66 1.57 1.61 1.68 1.66 1.57 1.72 1.67
1.64 1.65 1.64 1.65 1.63 1.70 1.62 1.64 1.60 1.62
96

Distribucin de Frecuencias

Organice los datos en una distribucin de


Frecuencias en intervalos de clases, con
amplitud constante.

Para el calculo de la amplitud, aproxime a


tres decimales, y para el calculo de las
clases aproxime a dos decimales.
97

Distribucin de Frecuencias

1.- Se determina el nmero de intervalos (Sturges)


K = 1 + 3.3 log(50) = 6.6 => tomamos K = 7

2.- Se determina la amplitud del intervalo


A 1.72 1.53 0.027
= =
7
3.- Se determinan los intervalos
Primer intervalo: 1,53 + 0,027 = 1,557
[1,53 1,5571)
[1,5571 1,5843)
98

Distribucin de Frecuencias

No.
Intervalo fi Pto.Medio Fi fri FRi
Clase
1 1.53 1.55 2 1.54 2 2/50 = 0,04 = 4% 2/50 = 0,04 = 4%

2 1.56 1.58 5 1.57 7 5/50 = 0,1 = 10% 7/50 = 0,14 = 14%

3 1.59 1.61 9 1.60 16 9/50 = 0,18 = 18% 16/50 = 0,32 = 32%

4 1.62 1.64 15 1.63 31 15/50 = 0,3 = 30% 31/50 = 0,62 = 62%

5 1.65 1.67 12 1.66 43 12/50=0,24 = 24% 43/50 = 0,86 = 86%

6 1.68 1.70 5 1.69 48 5/50 = 0,1 = 10% 48/50 = 0,96 = 96%

7 1.71 1.73 2 1.72 50 2/50 = 0,04 = 4% 50/50 = 1 = 100%

Totales 50 100%
99

Distribucin de Frecuencias

Clasificacin de un grupo de trabajadoras


de la empresa El Pantaln
de acuerdo a sus estaturas (en Mts.)
Estaturas N. Empleadas Porcentaje
1.53 1.55 2 4
1.56 1.58 5 10
1.59 1.61 9 18
1.62 1.64 15 30
1.65 1.67 12 24
1.68 1.70 5 10
1.71 1.73 2 4
Totales 50 100%
Fuente: Registros Empresa El Pantaln
100

Distribucin de Frecuencias

Ejemplo 2:
A 40 pacientes de un hospital se les investig
la variable nmero de hijos, obtenindose la
siguiente informacin:

4 0 5 6 4 2 6 0 6 4
3 7 7 7 7 4 3 4 7 0
2 6 5 7 5 4 6 6 2 5
3 6 6 5 0 6 7 5 6 2
101

Distribucin de Frecuencias

Clases fi fri Fi FRi


0 4 0.100 = 10% 4 0,100 = 10%
1 0 0,000 = 0% 4 0,100 = 10%
2 4 0,100 = 10% 8 0,200 =20%
3 3 0,075 = 7,5% 11 0,275 =27,5%
4 6 0,150 = 15% 17 0,425 = 42,5%
5 6 0,150 = 15% 23 0,575 = 57,5%
6 10 0,250 = 25% 33 0,825 = 82,5%
7 5 0,125 = 12,5% 38 0,950 = 95%
8 2 0,050 = 5% 40 1,000 = 100%
Totales 40 1,000 = 100%
102

Distribucin de Frecuencias

Ejercicio:
Los datos que se muestran a continuacin
representan las calificaciones de 60 estudiantes
que presentaron la PINA en el ao 2010.
a) Construya una distribucin de frecuencias.
b) Qu puede concluir de estos datos?
103

Distribucin de Frecuencias

Ejercicio:
23 60 79 32 57 74 52 70 82 36
80 77 81 95 41 65 92 85 55 76
52 10 64 75 78 25 80 98 81 67
41 71 83 54 64 72 88 62 74 43
60 78 89 76 84 48 84 90 15 79
34 67 17 82 69 74 63 80 85 61
104

Representacin grfica de los datos

Los grficos permiten visualizar en forma global


y rpida el comportamiento de los datos.
Para datos cuantitativos agrupados en clases,
comnmente se utilizan tres tipos de grficos:
Histogramas.
Polgono de frecuencias.
Ojiva o Polgono de frecuencias acumuladas.
105

Representacin grfica de los datos

Para datos cuantitativos


- Diagrama de puntos - Histogramas.
- Diagramas de dispersin - Polgono de frecuencias.
- Curvas - Ojiva o Polgono de
- Pictogramas frecuencias acumuladas.

Para datos cualitativos


Curvas
Barras
Circulares o de Sectores
106

Representacin grfica de los datos

Histograma:
107

Representacin grfica de los datos

Histograma y Polgono de Frecuencias


108

Representacin grfica de los datos

Ojiva
109

Representacin grfica de los datos

Barras
110

Representacin grfica de los datos

Curvas
111

Representacin grfica de los datos

Pictogramas
112

Representacin grfica de los datos

Sectores, torta o circular


113

Ejemplos de construccin de
grficos
114

Medidas de Tendencia Central

Se les conoce tambin como Medidas de


Posicin.
Corresponden a valores que generalmente se
ubican en la parte central de un conjunto de
datos.
Forma cmo los datos se pueden condensar en
un solo valor central, alrededor del cual se
distribuyen todos los datos de la muestra.
115

Medidas de Tendencia Central

Las medidas de tendencia central ms


importantes son:
Media: Aritmtica y Aritmtica ponderada.
Mediana.
Moda.
116

Media Aritmtica

Es la suma de todas las observaciones


dividida entre el nmero total de
observaciones.

Expresada de forma ms intuitiva, se puede


decir que la media aritmtica es la cantidad
total de la variable, distribuida a partes
iguales entre cada observacin. (Wikipedia)
117

Media Aritmtica

Por ejemplo, si en una habitacin hay tres


personas, la media de dinero que tienen en
sus bolsillos sera el resultado de tomar todo
el dinero de los tres y dividirlo a partes
iguales entre cada uno de ellos.
Es decir, la media es una forma de resumir
la informacin de una distribucin (dinero en
el bolsillo) suponiendo que cada observacin
(persona) tendra la misma cantidad de la
variable. (Wikipedia)
118

Clculo de la Media Aritmtica

Para datos no agrupados:


n

x i
X i 1
n
Para datos agrupados:
k

m i fi
X i 1
n
Donde: mi: punto medio de la clase i
fi: frecuencia absoluta de la clase i
119

Mediana

Es el valor que ocupa la posicin central de


un conjunto de observaciones, una vez que
han sido ordenados en forma ascendente o
descendente.
Divide al conjunto de datos en dos partes
iguales.
120

Clculo de la Mediana

Para datos no agrupados:


Si n es impar:
posicin donde se ubica la mediana es igual a
(n+1)/2.

Si n es par:
(n+1)/2 no es entero, por lo tanto la mediana ser
igual al promedio de las dos posiciones centrales.
121

Clculo de la Mediana

Para datos agrupados:


Clase mediana (o medianal) es la que contiene a la
observacin que ocupa la posicin n/2.
n 1
F ( xm 1 )
Md Lm 2 Cm
f ( xm )

Donde: Lm: lmite inferior de la clase mediana.


F(xm-1): frecuencia acumulada de la clase
anterior a la clase mediana.
f(xm): frecuencia absoluta de la clase mediana.
Cm: amplitud de la clase mediana.
122

Moda

Observacin o clase que tiene la mayor


frecuencia en un conjunto de observaciones.
Un conjunto de datos puede ser unimodal,
bimodal o multimodal.
Es la nica medida de tendencia central que
se puede determinar para datos de tipo
cualitativo.
123

Clculo de la Moda

Para datos no agrupados:


es simplemente la observacin que ms se repite.

Para datos agrupados:


1
Mo Lim Cm
1 2
Donde:
Lim: lmite inferior de la clase modal.
1: diferencia entre fi de la clase modal y la anterior.
2: diferencia entre fi de la clase modal y la posterior.
Cm: amplitud de la clase modal (clase de mayor frecuencia).
124

Relacin Media - Mediana - Moda.

Cuando los datos son sesgados es mejor emplear la Md


125

Propiedades de la Media

La suma de las diferencias entre la media


muestral y el valor de cada observacin es
cero.
La media de una constante es la constante.
Si todas las observaciones xi se multiplican
por una constante a, la X tambin se debe
multiplicar por ese mismo valor constante.
126

Propiedades de la Media

Si se somete a una variable estadstica X a


un cambio de origen y escala, Y = a + bX, la
media aritmtica de dicha variable X vara en
la misma proporcin.
La media de la suma de dos variables es
igual a la suma de sus medias.
127

Media. Ventajas y desventajas

Ventajas:
Emplea en su clculo toda la informacin
disponible.
Se expresa en las mismas unidades que la
variable en estudio.
Es el centro de gravedad de toda la
distribucin, representando a todos los valores
observados.
Es un valor nico.
128

Media. Ventajas y desventajas

Ventajas:
Se trata de un concepto familiar para la
mayora de las personas.
Es til para llevar a cabo procedimientos
estadsticos como la comparacin de medias
de varios conjuntos de datos.
129

Media. Ventajas y desventajas

Desventajas:
Se ve adversamente afectada por valores
extremos, perdiendo representatividad.
Si el conjunto de datos es muy grande puede
ser tedioso su clculo manual.
No se puede calcular para datos cualitativos.
No se puede calcular para datos que tengan
clases de extremo abierto, tanto superior
como inferior.
130

Mediana. Ventajas y desventajas

Ventajas:
Fcil de calcular si el nmero de observaciones
no es muy grande.
No se ve influenciada por valores extremos, ya
que solo influyen los valores centrales.
Fcil de entender.
131

Mediana. Ventajas y desventajas

Ventajas:
Se puede calcular para cualquier tipos de datos
cuantitativos, incluso los datos con clase de
extremo abierto.
Es la medida de tendencia central ms
representativa en el caso de variables que slo
admiten la escala ordinal.
132

Mediana. Ventajas y desventajas

Desventajas:
No utiliza en su clculo toda la informacin
disponible.
No pondera cada valor por el nmero de
veces que se ha repetido.
Hay que ordenar los datos antes de
determinarla.
133

Moda. Ventajas y desventajas

Ventajas:
No requiere clculos.
Puede usarse para datos tanto cuantitativos
como cualitativos.
Fcil de interpretar.
No se ve influenciada por valores extremos.
Se puede calcular en clases de extremo
abierto.
134

Moda. Ventajas y desventajas

Desventajas:
Para conjuntos pequeos de datos su valor
no tiene casi utilidad, si es que de hecho
existe. Solo tiene significado en el caso de
una gran cantidad de datos.
No utiliza toda la informacin disponible.
No siempre existe, si los datos no se repiten.
135

Moda. Ventajas y desventajas

Desventajas:
En ocasiones, el azar hace que una sola
observacin no representativa sea el valor
ms frecuente del conjunto de datos.
Difcil de interpretar si los datos tiene 3 o
ms modas.
136

Medidas de dispersin

Tambin conocidas como Medidas de


variacin o variabilidad.
Son valores numricos que indican o
describen la forma en que las observaciones
estn dispersas o diseminadas, con respecto
al valor central.
137

Medidas de dispersin

Son importantes debido a que dos muestras


de observaciones con el mismo valor central
pueden tener una variabilidad muy distinta.
138

Medidas de dispersin

Rango.
Varianza.
Desviacin Tpica.
Coeficiente de Variacin.
139

Medidas de dispersin: Rango

Rango (amplitud o recorrido):


Est determinado por los dos valores
extremos de los datos muestrales, es
simplemente la diferencia entre la mayor y la
menor observacin.
Es una medida de dispersin absoluta, ya que
depende solamente de los datos y permite
conocer la mxima dispersin.
140

Medidas de dispersin: Rango

Casi no se emplea debido a que depende


nicamente de dos valores.
No proporciona una medida de variabilidad
de las observaciones con respecto al centro
de la distribucin.
Notacin: R
141

Medidas de dispersin: Varianza

Es un valor numrico que mide el grado de


dispersin relativa, porque depende de la
posicin de los datos x1,x2,,xn con respecto
a la media.
Es el promedio al cuadrado de las
desviaciones de cada observacin con
respecto a la media.
Notacin: s2, 2, var(X)
142

Medidas de dispersin: Varianza

Si la varianza de un conjunto de observaciones


es grande, se dice que los datos tienen una
mayor variabilidad que un conjunto de datos
que tenga un varianza menor.
x x
n
2
i
s2 i 1
n
n

i
x 2
2
s
2 i 1
x
n
143

Dispersin: Desviacin Tpica

Es la raz cuadrada de la varianza.


Notacin: s, .

s s 2
144

Dispersin: Coeficiente de Variacin

Es una medida de dispersin relativa que


permite comparar el nivel de dispersin de
dos muestras de variables estadsticas
diferentes.
No tiene dimensiones.
Notacin: CV
s
CV 100%
x
145

Ventajas y Desventajas del Rango

Ventajas:
til cuando se quiere conocer la extensin
de las variaciones extremas (valor mximo
de la dispersin).
Fcil de calcular.
146

Ventajas y Desventajas del Rango

Desventajas:
No es una Medida de Dispersin con
respecto al centro de la distribucin.
Solo emplea dos valores en su clculo.
No se puede calcular en distribuciones de
lmite de clase abierto.
147

Propiedades de la Varianza

Propiedades:
1. Siempre es mayor o igual a cero y menor
que infinito.
2. La varianza de una constante es cero.
3. Si a una variable X la sometemos a
Y=a+bX, la varianza de Y ser Var(Y) =
b2Var(X)
148

Ventajas y Desventajas - Varianza

Ventajas:
Es til cuando se compara la variabilidad de
dos o ms conjuntos de datos.
Utiliza toda la informacin disponible.
Desventajas:
No proporciona ayuda inmediata cuando se
estudia la dispersin de un solo conjunto de
datos.
Difcil de interpretar por tener sus unidades
elevadas al cuadrado.
149

Ventajas/Desventajas Desviacin Tpica

Ventajas:
Esta expresada en las mismas unidades que
la variable en estudio.
Utiliza todas las observaciones en su
clculo.
Fcil de interpretar.
Desventajas:
No tiene.
150

Ventajas/Desventajas Coeficiente de Variacin

Ventajas:
Es la nica Medida de Dispersin que
permite comparar el nivel de dispersin de
dos muestras de variables diferentes.
Emplea toda la informacin disponible en su
clculo.
Fcil de calcular.
151

Ventajas/Desventajas Coeficiente de Variacin

Desventaja:
No es una Medida de Dispersin con
respecto al centro de la distribucin de los
datos.
152

Medidas de Forma

Son medidas numricas que permiten


determinar la forma que tiene la curva de los
datos. Por lo tanto, sirven para corroborar lo
que muestran los grficos.
Coeficiente de Pearson
- Asimetra
Medidas Coeficiente de Fisher
de forma
- Kurtosis o apuntamiento
153

Medidas de Forma: Asimetra

Permiten estudiar la forma de la curva,


dependiendo de cmo se agrupan los datos.
154

Medidas de Forma: Asimetra

Coeficiente de Asimetra de Pearson:


Fcil de calcular e interpretar.
Clculo:
ASP

3 X Md
s
o Interpretacin:
= 0, X=Md Simtrica

ASP > 0, X>Md Asimtrica Positiva

< 0, X<Md Asimtrica Negativa


155

Medidas de Forma: Asimetra

Coeficiente de Asimetra de Fisher:


No es de fcil clculo, pero si su interpretacin.

x X
n
3
i
ASF i 1
3
Datos NO agrupados
ns

M
k
3
i x fi
ASF i 1
3
Datos Agrupados
ns
156

Medidas de Forma: Asimetra

o Interpretacin:
= 0, Simtrica

ASF > 0, Asimtrica Positiva

< 0, Asimtrica Negativa


157

Medidas de Forma: Kurtosis

Miden si los valores de la distribucin estn


ms o menos concentrados alrededor de los
valores medios de la muestra (zona central
de la distribucin).
Se definen tres tipos de distribucin segn
su grado de apuntamiento o Kurtosis.
158

Medidas de Forma: Kurtosis

Mesocrtica: grado de concentracin


medio alrededor de los valores centrales
de la variable.
Leptocrtica: grado de concentracin
elevado.
Platicrtica: grado de concentracin
reducido.
159

Medidas de Forma: Kurtosis

x
n
4
i X
CK i 1
4
3 Datos No Agrupados
ns

M f
k
4
i X i
CK i 1
4
3 Datos Agrupados
ns
160

Medidas de Forma: Kurtosis

CK

Interpretacin:

= 0 Mesocrtica

CK > 0 Leptocrtica

< 0 Platicrtica
161

Referencias:

Wikipedia(http://es.wikipedia.org/wiki/Wikipedia:Portad
a)
Walpole y Myers. Probabilidad y Estadstica. Mc Graw-
Hill.
Triola, Mario F. Estadstica. Pearson.
Armas, G, Jose, M.(2002). Estadstica Sencilla:
Descriptiva. Universidad de Los Andes, Facultad de
Economa, Departamento de Estadstica.
Chao, Lincoln L . 1985. Introduccin a la Estadstica.
Mxico: Continental.

You might also like