Professional Documents
Culture Documents
Mdulo I
2
Inferencia Estadstica
Estimacin :
Estimacin puntual
Inferencia Estadstica
Contraste de Hiptesis
Inferencia Estadstica
Estadstica
Descriptiva Inferencial
Organizacin de
Datos Estimacin Contraste de
Hiptesis
Medidas de
Tendencia,
Puntual Por
Posicin, variacin.
Intervalos
Representacin
grfica.
5
Inferencia Estadstica
Inferencia Estadstica.
Poblacin. Valores
Muestra. Muestrales
Inferencia. Estimacin.
Edades. Hab.
Edad Promedio
Municipio
Libertador.
Valores Poblacionales
(Parmetros).
9
Inferencia Estadstica.
Ejemplo:
Edad
Variable en Estudio:_____________________
Habitantes del Municipio Libertador
Universo:____________________________
Las edades de los Habitantes del Mun. Lib
Poblacin:___________________________
Edad del los habitantes de Ejido
Muestra:_____________________________
Media Poblacional
Parmetro:___________________________
Media Muestral
Estimador:____________________________
11
Inferencia Estadstica.
Propiedades de un Estimador:
Insesgado: E( )=
Varianza Mnima.
Inferencia Estadstica.
Inferencia Estadstica.
Estimacin Puntual:
Estimadores
15
Inferencia Estadstica.
Ejemplo:
Se quiere estimar el tiempo promedio de reaccin ante
un estimulante de pacientes con cncer en el estado
Mrida para ello se levanto una muestra y se registraron
los tiempos de reaccin
Inferencia Estadstica.
l< <u
17
Inferencia Estadstica.
Inferencia Estadstica.
Inferencia Estadstica.
Inferencia Estadstica.
= (0,1) +00
21
Inferencia Estadstica.
+
1
2
22
Inferencia Estadstica.
Inferencia Estadstica.
Inferencia Estadstica.
Inferencia Estadstica.
Promedio 4000
Desviacion 40,4756443
n 36 3982,66 < < 4017,33 = 0.99
Alfa 0,01
Alfa/2 0,005
1-alfa/2 0,995
Z 2,57 Con un 99% de confianza se espera
Error Mximo 17,3370676 que el verdadero tiempo promedio se
LS 4017,33707 encuentre en el intervalo calculado
LI 3982,66293
26
Inferencia Estadstica.
Calculo del tamao de muestra:
Inferencia Estadstica.
2
= 10 2.57 40
n= = 108
1=2.57 10
2
= 40
28
Inferencia Estadstica.
Inferencia Estadstica.
Inferencia Estadstica.
Calcular un intervalo de confianza con un 95% y
99% para la puntuacin promedio
+
1/2,1
Promedio 9,81
n 20
Desv 0,09119095
alfa 0,01 9.75 < < 9.87 = 0.99
alfa/2 0,005
1- alfa/2 0,995
t 2,861 Con un 99% de confianza se espera
Error Mximo 0,05833841 que el verdadero tiempo promedio se
LS 9,86833841 encuentre en el intervalo calculado
LI 9,75166159
31
Inferencia Estadstica.
Intervalos de confianza para la diferencia de
medias de dos poblaciones normales
independientes:
2 2
+
1/2 +
32
Inferencia Estadstica.
Se emplean dos mquinas para llenar botellas de plstico con un
volumen neto de 16 onzas. El proceso de llenado puede suponerse
normal, con desviaciones estndar de 1=0,015 y 2=0,015. Ingeniera
de calidad sospecha que ambas mquinas llenan hasta el mismo
volumen neto, sin importar que este volumen sea o no de 16 onzas. Se
toma una muestra aleatoria de la salida de cada mquina.
mquina 1 16,03 16,04 16,05 16,05 16,02 16,01 15,96 15,98 16,02 15,99
mquina 2 16,02 15,97 15,96 16,01 15,99 16,03 16,04 16,02 16,01 16
33
Inferencia Estadstica.
Promedio 16,015 Promedio 16,005
n 10 n 10
Desv 0,015 Desv 0,015
Var 0,000225 Var 0,000225
alfa 0,05 alfa 0,05
alfa/2 0,025 alfa/2 0,025
1- alfa/2 0,975 1- alfa/2 0,975
Error
Mximo 0,01314808
LS 0,02314808
LI -0,01314808
34
Inferencia Estadstica.
Intervalos de confianza para la diferencia de
medias de dos poblaciones normales
independientes: (Varianzas Desconocida pero
se suponen iguales)
+ 1 1
;1+22; +
2
1 2 + 1 2
=
+ 2
35
Inferencia Estadstica.
Las presiones criticas de dos grupos
independientes de recipientes de distintos vidrios
dan los siguientes valores:
Grupo 1 100 102 96 106 110 110 120 112 112 90
Grupo 2 104 88 100 98 102 92 96 100 96 96
Inferencia Estadstica.
+ 1 1
/2;+22; +
1 2 + 1 2
=
+ 2
37
Inferencia Estadstica.
Promedio 105,8 Promedio 97,2
n 10 n 10
78,622222
Var 2 Var 22,4
alfa 0,05 alfa 0,05
alfa/2 0,025 alfa/2 0,025
1- alfa/2 0,975 1- alfa/2 0,975
t 2,1 t 2,1
Sp 7,10711693
Error 6,6746385
Mximo 7
15,274638
LS 6
1,9253614
LI 3
38
Inferencia Estadstica.
Intervalos de Confianza para la
Proporcin:
;
+
1/2
39
Inferencia Estadstica.
Tomada, al azar, una muestra de 120 estudiantes
de una Universidad, se encontr que 54 de ellos
hablaban ingls.
Halle, con un nivel de confianza del 90%, un
intervalo de confianza para estimar la
proporcin de estudiantes que hablan el idioma
ingls entre los estudiantes de esa Universidad.
40
Inferencia Estadstica.
41
Inferencia Estadstica.
Intervalos de Confianza para la Diferencia de
Proporciones:
+ 1 1 2 2
1 2 1/2 +
1 2
42
Inferencia Estadstica.
Inferencia Estadstica.
Contraste de Hiptesis:
Inferencia Estadstica.
Hiptesis Estadstica:
Es una suposicin concerniente a una o ms
distribuciones poblacionales, es decir a uno o
ms parmetros de la poblacin.
Inferencia Estadstica.
Hiptesis Nula: 0 :
Nulifica el efecto de la variable en estudio, ausencia de los
efectos de la variable que se investiga.
Hiptesis Alternativa: 0 :
Variacin de los valores que prevaleceran si la variable
que se estudia ejerce algn efecto.
(Pregunta que debe responderse, teora que debe
probarse.)
46
Inferencia Estadstica.
Inferencia Estadstica.
Espacio paramtrico:
Inferencia Estadstica.
Tipos de Hiptesis:
Hiptesis Simple:
Hiptesis Compuesta:
Inferencia Estadstica.
Ho Cierta Ho Falsa
No Rechace Ho Correcta Error Tipo II
Rechace Ho Error Tipo I Correcta
50
Inferencia Estadstica.
0 : = 0 0 : < 0 0 : < 0
1 : < 0 1 : 0 1 : 0
51
Inferencia Estadstica.
2. Nivel de Significancia:
3. Estadstico de Prueba:
=
3. Estadstico de Prueba:
52
Inferencia Estadstica.
4. Regla de Decisin:
Rechazar Ho Ssi:
0 : = 0
1 : < 0
<
53
Inferencia Estadstica.
0 : < 0
1 : 0
>
54
Inferencia Estadstica.
0 : < 0
1 : 0
> 1
<
55
Inferencia Estadstica.
6. Clculos.
7. Conclusiones.
56
Inferencia Estadstica.
Contraste de Hiptesis para la media :
Una muestra aleatoria de 100 muertes registradas en el estado, el ao
pasado mostro una vida promedio de 71.8 aos. Suponiendo una
desviacin estndar poblacional de 8.9 aos, Esto parece indicar que la
vida media actual es mayor a 70 aos?, Utilice un nivel de significancia de
5%.
57
Inferencia Estadstica.
Contraste de Hiptesis para la diferencia de medias: 1 2 :
Un fabricante de equipo deportivo desarrollo un nuevo sedal para pesca
sinttico, que afirma que tiene una resistencia a la rotura de 8Kg con una
desviacin de 0,5 Kg. Pruebe la hiptesis de que la resistencia media a la
rotura difiere a la que dice el fabricante, sabiendo que en una muestra
aleatoria de tamao 50, arrojo una resistencia promedio a la rotura de 7,8
Kg. Use un nivel de significancia de 0.05.
58
Inferencia Estadstica.
59
Inferencia Estadstica.
Contraste de Hiptesis para la Diferencia de Proporciones:
60
Inferencia Estadstica.
61
Inferencia Estadstica.
Estimacin por Intervalos:
Nivel de Confianza
l< <u = (1 ); 0<<1
l u : Puntos Extremos del Intervalo
Inferencia Estadstica.
63
Censo o Muestreo?
- Costo
- Control Recoleccin de Informacin - Calidad
- Rapidez de resultados
- Poblacin muy grande o infinita
- Poblacin muy homognea
- Proceso de medicin destructivo
65
Individuos o Elementos:
Cualquier ente, racional o irracional, objeto o concepto.
Caractersticas o Propiedades
Existencia, Modalidad Categora (cuantitativa, cualitativa)
Relaciones.
Proceso de Medicin
Determinar si un Individuo posee o no cierta caracterstica o si
presenta cierta modalidad en tal caracterstica.
66
Variables:
son las caractersticas o lo que se estudia de
cada individuo de la muestra. Ej: sexo, edad,
peso, estatura, color de ojos, estado civil,
temperatura, cantidad de nacimientos, presin,
dimetro, ...
Datos:
son los valores que toma la variable en cada
caso.
67
Escalas de medida
Concepto:
Conjunto de valores que puede tomar una
variable, o conjunto de modalidades que
puede presentar una caracterstica.
71
Escalas de medida
Escalas de medida
Escalas de medida
Escalas de medida
Escalas de medida
Escalas de medida
Escalas de medida
Escalas de medida
Jerarquiza X X X X
Cero absoluto X X
Operaciones Aritmticas X X X
(Algunas)
Se pueden transformar en
X X X X
otras del mismo tipo
79
Estadstica - Abusos
Datos cualitativos
Se realiza de acuerdo a las modalidades que
presente la variable en estudio. Mediante un
conteo se determina el nmero de datos
(Frecuencia) correspondiente a las diferentes
categoras de la variable. Se usa para
cualquier cantidad de datos.
83
Totales
86
Datos cuantitativos
Para organizar y agrupar datos de tipo
cuantitativo, discretos o continuos, se utiliza un
procedimiento similar al utilizado con los datos
cualitativos, pero ms laborioso.
88
La Distribucin de Frecuencias:
Se recomienda su uso cuando se tienen grandes
cantidades de datos (n).
Su construccin requiere, en primer lugar, la
seleccin de los lmites de los intervalos de clase.
Para definir la cantidad de intervalos de clase (k),
se puede usar:
La regla de Sturges: k = 1 + 3.3log(n)
k = n
91
La Distribucin de Frecuencias:
La cantidad de clases no puede ser tan pequeo
(menos de 5) o tan grande (ms de 20), que la
verdadera naturaleza de la distribucin sea
imposible de visualizar.
La amplitud de todas las clases deber ser la
misma. Se recomienda que sea impar y que los
puntos medios tengan la misma cantidad de cifras
significativas que los datos en bruto.
Los lmites de las clases deben tener una cifras
significativas ms que los datos en bruto.
92
Determinar:
Punto medio = (Li+Ls)/2.
Frecuencia absoluta de la clase (fi).
Frecuencia acumulada de la clase (Fi).
Frecuencia relativa de la clase (fri):
fri = fi/n
Frecuencia relativa acumulada de la clase (FRi).
93
Ejemplos de Distribuciones de
Frecuencias
94
Distribucin de Frecuencias
Ejemplo 1:
Se desea determinar cmo varan las estaturas de las mujeres,
al tomar una muestra de 50 trabajadoras de una fbrica de
pantalones.
Los datos obtenidos fueron los siguientes:
1.65 1.63 1.65 1.63 1.69 1.67 1.53 1.58 1.60 1.61
1.65 1.64 1.71 1.68 1.66 1.56 1.59 1.61 1.62 1.63
1.63 1.69 1.67 1.66 1.58 1.60 1.61 1.62 1.64 1.64
1.55 1.59 1.66 1.57 1.61 1.68 1.66 1.57 1.72 1.67
1.64 1.65 1.64 1.65 1.63 1.70 1.62 1.64 1.60 1.62
96
Distribucin de Frecuencias
Distribucin de Frecuencias
Distribucin de Frecuencias
No.
Intervalo fi Pto.Medio Fi fri FRi
Clase
1 1.53 1.55 2 1.54 2 2/50 = 0,04 = 4% 2/50 = 0,04 = 4%
Totales 50 100%
99
Distribucin de Frecuencias
Distribucin de Frecuencias
Ejemplo 2:
A 40 pacientes de un hospital se les investig
la variable nmero de hijos, obtenindose la
siguiente informacin:
4 0 5 6 4 2 6 0 6 4
3 7 7 7 7 4 3 4 7 0
2 6 5 7 5 4 6 6 2 5
3 6 6 5 0 6 7 5 6 2
101
Distribucin de Frecuencias
Distribucin de Frecuencias
Ejercicio:
Los datos que se muestran a continuacin
representan las calificaciones de 60 estudiantes
que presentaron la PINA en el ao 2010.
a) Construya una distribucin de frecuencias.
b) Qu puede concluir de estos datos?
103
Distribucin de Frecuencias
Ejercicio:
23 60 79 32 57 74 52 70 82 36
80 77 81 95 41 65 92 85 55 76
52 10 64 75 78 25 80 98 81 67
41 71 83 54 64 72 88 62 74 43
60 78 89 76 84 48 84 90 15 79
34 67 17 82 69 74 63 80 85 61
104
Histograma:
107
Ojiva
109
Barras
110
Curvas
111
Pictogramas
112
Ejemplos de construccin de
grficos
114
Media Aritmtica
Media Aritmtica
x i
X i 1
n
Para datos agrupados:
k
m i fi
X i 1
n
Donde: mi: punto medio de la clase i
fi: frecuencia absoluta de la clase i
119
Mediana
Clculo de la Mediana
Si n es par:
(n+1)/2 no es entero, por lo tanto la mediana ser
igual al promedio de las dos posiciones centrales.
121
Clculo de la Mediana
Moda
Clculo de la Moda
Propiedades de la Media
Propiedades de la Media
Ventajas:
Emplea en su clculo toda la informacin
disponible.
Se expresa en las mismas unidades que la
variable en estudio.
Es el centro de gravedad de toda la
distribucin, representando a todos los valores
observados.
Es un valor nico.
128
Ventajas:
Se trata de un concepto familiar para la
mayora de las personas.
Es til para llevar a cabo procedimientos
estadsticos como la comparacin de medias
de varios conjuntos de datos.
129
Desventajas:
Se ve adversamente afectada por valores
extremos, perdiendo representatividad.
Si el conjunto de datos es muy grande puede
ser tedioso su clculo manual.
No se puede calcular para datos cualitativos.
No se puede calcular para datos que tengan
clases de extremo abierto, tanto superior
como inferior.
130
Ventajas:
Fcil de calcular si el nmero de observaciones
no es muy grande.
No se ve influenciada por valores extremos, ya
que solo influyen los valores centrales.
Fcil de entender.
131
Ventajas:
Se puede calcular para cualquier tipos de datos
cuantitativos, incluso los datos con clase de
extremo abierto.
Es la medida de tendencia central ms
representativa en el caso de variables que slo
admiten la escala ordinal.
132
Desventajas:
No utiliza en su clculo toda la informacin
disponible.
No pondera cada valor por el nmero de
veces que se ha repetido.
Hay que ordenar los datos antes de
determinarla.
133
Ventajas:
No requiere clculos.
Puede usarse para datos tanto cuantitativos
como cualitativos.
Fcil de interpretar.
No se ve influenciada por valores extremos.
Se puede calcular en clases de extremo
abierto.
134
Desventajas:
Para conjuntos pequeos de datos su valor
no tiene casi utilidad, si es que de hecho
existe. Solo tiene significado en el caso de
una gran cantidad de datos.
No utiliza toda la informacin disponible.
No siempre existe, si los datos no se repiten.
135
Desventajas:
En ocasiones, el azar hace que una sola
observacin no representativa sea el valor
ms frecuente del conjunto de datos.
Difcil de interpretar si los datos tiene 3 o
ms modas.
136
Medidas de dispersin
Medidas de dispersin
Medidas de dispersin
Rango.
Varianza.
Desviacin Tpica.
Coeficiente de Variacin.
139
i
x 2
2
s
2 i 1
x
n
143
s s 2
144
Ventajas:
til cuando se quiere conocer la extensin
de las variaciones extremas (valor mximo
de la dispersin).
Fcil de calcular.
146
Desventajas:
No es una Medida de Dispersin con
respecto al centro de la distribucin.
Solo emplea dos valores en su clculo.
No se puede calcular en distribuciones de
lmite de clase abierto.
147
Propiedades de la Varianza
Propiedades:
1. Siempre es mayor o igual a cero y menor
que infinito.
2. La varianza de una constante es cero.
3. Si a una variable X la sometemos a
Y=a+bX, la varianza de Y ser Var(Y) =
b2Var(X)
148
Ventajas:
Es til cuando se compara la variabilidad de
dos o ms conjuntos de datos.
Utiliza toda la informacin disponible.
Desventajas:
No proporciona ayuda inmediata cuando se
estudia la dispersin de un solo conjunto de
datos.
Difcil de interpretar por tener sus unidades
elevadas al cuadrado.
149
Ventajas:
Esta expresada en las mismas unidades que
la variable en estudio.
Utiliza todas las observaciones en su
clculo.
Fcil de interpretar.
Desventajas:
No tiene.
150
Ventajas:
Es la nica Medida de Dispersin que
permite comparar el nivel de dispersin de
dos muestras de variables diferentes.
Emplea toda la informacin disponible en su
clculo.
Fcil de calcular.
151
Desventaja:
No es una Medida de Dispersin con
respecto al centro de la distribucin de los
datos.
152
Medidas de Forma
x X
n
3
i
ASF i 1
3
Datos NO agrupados
ns
M
k
3
i x fi
ASF i 1
3
Datos Agrupados
ns
156
o Interpretacin:
= 0, Simtrica
x
n
4
i X
CK i 1
4
3 Datos No Agrupados
ns
M f
k
4
i X i
CK i 1
4
3 Datos Agrupados
ns
160
CK
Interpretacin:
= 0 Mesocrtica
CK > 0 Leptocrtica
< 0 Platicrtica
161
Referencias:
Wikipedia(http://es.wikipedia.org/wiki/Wikipedia:Portad
a)
Walpole y Myers. Probabilidad y Estadstica. Mc Graw-
Hill.
Triola, Mario F. Estadstica. Pearson.
Armas, G, Jose, M.(2002). Estadstica Sencilla:
Descriptiva. Universidad de Los Andes, Facultad de
Economa, Departamento de Estadstica.
Chao, Lincoln L . 1985. Introduccin a la Estadstica.
Mxico: Continental.