Professional Documents
Culture Documents
Inferencia Estadstica
I. Introduccin
II. Metodologa
A. La hiptesis nula y la hiptesis alterna
B. La regin crtica
Regin de rechazo y regin de no rechazo
Nivel de confianza y nivel de significacin
C. El error en las pruebas de hiptesis
Error tipo I
Error tipo II
D. Pasos en la prueba de hiptesis
III. El p-value en la computadora
Significado de p
IV. El intervalo de confianza
A. La estimacin de parmetros
B. La prueba de hiptesis y el intervalo de confianza
C. Interpretacin del intervalo de confianza
D. El intervalo de confianza y la precisin estadstica
E. El tamao de la muestra y la precisin estadstica
V. Pruebas de hiptesis de una cola. (one-tailed test)
Caso del consumidor
Caso del ejecutivo
I. Introduccin
El propsito principal de esta unidad es desarrollar una metodologa para
inferir si la estadstica obtenida en una muestra corresponde al parmetro
que se propone en la hiptesis.
II. Metodologa
En toda la unidad se utilizar el ejemplo que se haba presentado en la
unidad anterior sobre la fbrica:
H0: x = 368
H1: x 368
Se rechaza H0 a favor de H1
UNIVERSIDAD NACIONAL AUTONOMA DE NICARAGUA
ESTADISTICA APLICADA A LAS CCSS
LICENCIATURA EN TRABAJO SOCIAL
LIC. JULISSA GUTIERREZ
B. La regin crtica
Simplemente observando la media de la muestra de 25 cajas es posible
tener una idea si la media de la poblacin es la planteada por H 0. Si la
media de la muestra fuese 367.8 gr los investigadores estaran dispuestos
a decir que la media de la poblacin es 368 gr como propone H 0, ya que
la diferencia entre la media de la muestra y la propuesta para la poblacin
no es muy grande. Sin embargo, si la media de la muestra es 320 gr.,
entonces sera muy difcil no rechazar H0.
z = valor crtico
2. H0 es cierta y no se rechaza
Error tipo I
H0 es cierta y se rechaza
Ejemplo:
Error tipo II
H0 es falsa y no se rechaza
Error tipo I:
H0 es cierta y se rechaza.
H0 es falsa y no se rechaza.
H0: x = 368
H1: x 368
= 0.05
n = 25
UNIVERSIDAD NACIONAL AUTONOMA DE NICARAGUA
ESTADISTICA APLICADA A LAS CCSS
LICENCIATURA EN TRABAJO SOCIAL
LIC. JULISSA GUTIERREZ
zc = 1.96 y zc = -1.96
Paso 8: COMPUTAR zo
UNIVERSIDAD NACIONAL AUTONOMA DE NICARAGUA
ESTADISTICA APLICADA A LAS CCSS
LICENCIATURA EN TRABAJO SOCIAL
LIC. JULISSA GUTIERREZ
Significado de p
Si se toma como cierta la hiptesis nula, el valor de p representa la
probabilidad de obtener una estadstica igual o ms alejada de la media
(propuesta por H0) que el valor obtenido en la muestra.
Ejemplo:
A. La estimacin de parmetros
Se utiliza la siguiente frmula para determinar los valores crticos del
intervalo de confianza:
X
X z c
n
B. La prueba de hiptesis y el intervalo de confianza
Ejemplo:
UNIVERSIDAD NACIONAL AUTONOMA DE NICARAGUA
ESTADISTICA APLICADA A LAS CCSS
LICENCIATURA EN TRABAJO SOCIAL
LIC. JULISSA GUTIERREZ
372.5 (1.96)(15/5)
372.5 5.88
366.62 x 378.38
372.5 5.88
366.62 x 378.38
370.5 5.88
364.12 mx 375.88
Ejemplo 1:
372.5 (1.96)(15/5)
372.5 5.88
366.62 x 378.38
UNIVERSIDAD NACIONAL AUTONOMA DE NICARAGUA
ESTADISTICA APLICADA A LAS CCSS
LICENCIATURA EN TRABAJO SOCIAL
LIC. JULISSA GUTIERREZ
372.5 (1.64)(15/5)
372.5 4.92
367.58 x 377.42
372.5 (1.96)(15/5)
372.5 5.88
366.62 x 378.38
Ejemplo 3:
372.5 (1.96)(15/7)
372.5 4.2
Por lo tanto la media de la poblacin debe estar en el intervalo
368.3 x 376.7
H0: x 368
UNIVERSIDAD NACIONAL AUTONOMA DE NICARAGUA
ESTADISTICA APLICADA A LAS CCSS
LICENCIATURA EN TRABAJO SOCIAL
LIC. JULISSA GUTIERREZ
Paso 3: = 0.05
Paso 4: n = 25
zc = -1.645
Paso 8:
UNIVERSIDAD NACIONAL AUTONOMA DE NICARAGUA
ESTADISTICA APLICADA A LAS CCSS
LICENCIATURA EN TRABAJO SOCIAL
LIC. JULISSA GUTIERREZ
Paso 1 and 2:
Paso 3: = 0.05
Paso 4: n = 25
zc = 1.645
Paso 8:
I. Introduccin
II. La prueba de t para la media
A. La familia de distribuciones t
B. Prueba t de una cola
III. Tipos de pruebas estadsticas de hiptesis
A. Pruebas paramtricas
La robustez en las pruebas paramtricas
B. Pruebas libres de distribucin
C. Pruebas no paramtricas
UNIVERSIDAD NACIONAL AUTONOMA DE NICARAGUA
ESTADISTICA APLICADA A LAS CCSS
LICENCIATURA EN TRABAJO SOCIAL
LIC. JULISSA GUTIERREZ
I. Introduccin
En la unidad anterior se hizo la prueba de hiptesis cuando se conoca la
desviacin estndar de la poblacin. Pero esto ocurre muy raramente. Por
lo general, en los experimentos que se llevan a cabo se conoce la
desviacin estndar de la muestra solamente. En esos casos es
necesario utilizar otra prueba estadstica.
A. La familia de distribuciones t
Cuando no se conoce la desviacin estndar de la poblacin siempre se
puede usar la desviacin estndar de la muestra, pero dividida entre la
raz cuadrada de n.
1 1 1 1 1
3 4 3 3 4
7 0 8 9 4
. . . . .
UNIVERSIDAD NACIONAL AUTONOMA DE NICARAGUA
ESTADISTICA APLICADA A LAS CCSS
LICENCIATURA EN TRABAJO SOCIAL
LIC. JULISSA GUTIERREZ
4 0 8 1 4
1 1 1 1 1
3 4 3 3 3
9 1 7 3 8
. . . . .
2 8 3 5 2
1 1 1 1 1
4 3 3 3 3
1 9 6 6 5
. . . . .
1 7 7 3 6
1 1 1 1 1
3 4 4 3 3
8 0 0 6 4
. . . . .
0 9 6 7 1
La prueba de hiptesis en esta situacin debe ser una prueba de una cola
donde la media y la desviacin estndar (obtenidas por medio de la
calculadora) son s = 2.66; media = 138.47
Prueba de hiptesis
Paso 1 y 2:
Paso 3: = 0.05
Paso 6: Para tener 5% del rea en la zona de rechazo para una prueba
de una cola y 19 df. Esta rea corresponde al valor crtico t c = -1.7291
Paso 8:
Paso 10: Hay evidencia para concluir que la capacidad promedio de las
bateras es menos de lo que la compaa reclama.
estadstica el experimento tiene que cumplir con los supuestos que exige
la prueba.
A. Pruebas paramtricas
Requieren
C. Pruebas no paramtricas
No tienen que ver con los parmetros de la poblacin
Ejemplo:
1 1 1 1 1
3 4 3 3 4
7 0 8 9 4
. . . . .
4 0 8 1 4
1 1 1 1 1
UNIVERSIDAD NACIONAL AUTONOMA DE NICARAGUA
ESTADISTICA APLICADA A LAS CCSS
LICENCIATURA EN TRABAJO SOCIAL
LIC. JULISSA GUTIERREZ
3 4 3 3 3
9 1 7 3 8
. . . . .
2 8 3 5 2
1 1 1 1 1
4 3 3 3 3
1 9 6 6 5
. . . . .
1 7 7 3 6
1 1 1 1 1
3 4 4 3 3
8 0 0 6 4
. . . . .
0 9 6 7 1
el intervalo es:
138.47 1.24
I. Introduccin
II. Prueba de t para la diferencia entre dos medias cuando las varianzas de las
poblaciones son iguales (Pooled Variance T-test)
A. Si se conocen las desviaciones estndar de las poblaciones
B. Si no se conocen las desviaciones estndar de las poblaciones
1. Supuestos
2. Prueba de t de varianzas combinadas (pooled variance t-test)
3. Ejemplo
4. Intervalo de confianza
III. Prueba de t para la diferencia entre dos medias cuando las varianzas de las
poblaciones no son iguales (Separate Variance t-test)
IV. Prueba F para la diferencia entre dos varianzas
A. La estadstica
B. Ejemplo:
C. Supuestos
V. Prueba de t para dos muestras dependientes o apareadas
A. La prueba de z
B. La prueba t para la diferencia entre las medias de muestras dependientes
(t-test for the Mean Difference)
1. Supuestos
2. Ejemplo
I. Introduccin
Hasta ahora se ha hecho la prueba de hiptesis para inferir el parmetro
de la poblacin partiendo de las estadsticas obtenidas en una muestra.
En esta unidad por medio de la prueba de hiptesis se compararn
estadsticas de dos muestras para hacer inferencias sobre los parmetros
de sus respectivas poblaciones. Primero se trabajar con muestras que
provienen de poblaciones independientes, luego con muestras que
provienen de poblaciones dependientes.
II. Prueba de t para la diferencia entre dos medias cuando las varianzas de las
poblaciones son iguales (Pooled Variance T-test)
Poblacin 1:
Media l
Desv. Est. s1
Tamao de la muestra n1
Poblacin 2:
Media 2
Desv.Est. s2
Tamao de la muestra n2
donde:
1. Supuestos
1. Las muestras se seleccionan aleatoriamente.
i. Hiptesis
Es importante sealar que las hiptesis se pueden presentar de dos
formas diferentes, como una comparacin o como una diferencia
comparable a cero.
H1: m l m 2 m l - m 2 0
o viceversa
UNIVERSIDAD NACIONAL AUTONOMA DE NICARAGUA
ESTADISTICA APLICADA A LAS CCSS
LICENCIATURA EN TRABAJO SOCIAL
LIC. JULISSA GUTIERREZ
iv. Estadstica
3. Ejemplo
Compara los promedios de dividendos en la bolsa de valores de NY y la
de Londres.
Asume que s NY = s L
Paso 1 y 2:
H0: m l = m 2 m l - m 2 = 0
H1: m l m 2 m l - m 2 0
Paso 3: a = 0.05
UNIVERSIDAD NACIONAL AUTONOMA DE NICARAGUA
ESTADISTICA APLICADA A LAS CCSS
LICENCIATURA EN TRABAJO SOCIAL
LIC. JULISSA GUTIERREZ
Paso 4: n1 = 21; n2 = 25
nl+ n2 - 2 = 21 + 25 - 2 = 44 df
Para tener 5% del rea en la zona de rechazo hay que buscar los valores
crticos para la prueba de dos colas bajo 0.025. Los valores crticos
corresponden a -2.0154 y 2.0154
4. Intervalo de confianza
De igual forma que se hizo con una sola muestra se puede construir un
intervalo de confianza alrededor de la estadstica y determinar si la
diferencia entre los parmetros se halla dentro del intervalo de confianza.
La frmula para el intervalo de confianza es:
(0.007, 1.473)
III. Prueba de t para la diferencia entre dos medias cuando las varianzas de las
poblaciones no son iguales (Separate Variance t-test)
Cuando no se puede asumir que las dos poblaciones de las que se
tomaron las muestras tienen varianzas iguales o homogneas entonces
se tiene que utilizar otro mtodo que fue desarrollado por Satterthwaite
para bregar con diferentes varianzas. El mtodo es idntico al anterior
con la diferencia de que la frmula incorpora las dos varianzas y es
necesario utilizar una frmula adicional para determinar los grados de
libertad.
1. Ejemplo
Compara los promedios de dividendos en la bolsa de valores de NY y la
de Londres.
Asume que s NY s L
Pasos 1 y 2:
H0: m l = m 2 m l - m 2 = 0
UNIVERSIDAD NACIONAL AUTONOMA DE NICARAGUA
ESTADISTICA APLICADA A LAS CCSS
LICENCIATURA EN TRABAJO SOCIAL
LIC. JULISSA GUTIERREZ
H1: m l m 2 m l- m 2 0
Paso 3: a = 0.05
Paso 4: n1 = 21; n2 = 25
D = 40.58
Para tener 5% del rea en la zona de rechazo hay que buscar los valores
crticos para la prueba de dos colas bajo 0.025 con 40 df. Los valores
crticos corresponden a -2.0211 y 2.0211
Paso 8: Computar t0
t0 = 2.01
Paso 9:
t0 no cay en la zona de rechazo por lo tanto NO se rechaza H0
Paso 10:
2. Intervalo de confianza
De igual forma que se hizo cuando las varianzas eran iguales se puede
construir un intervalo de confianza alrededor de la estadstica y
determinar si la diferencia entre los parmetros se halla dentro del
intervalo de confianza. La frmula para el intervalo de confianza es:
Por lo tanto
= 0.74 0.7426
(-0.0026, 1.4826)
A. La estadstica
Esta prueba se basa en la razn
B. Ejemplo:
Compara las varianzas de los dividendos de las bolsas de NY y Londres.
Pasos 1 y 2:
H0:
H1:
Paso 3: a = 0.05
Paso 4: n1 = 21; n2 = 25
Paso 8: Computar Fc
F = 1.698/1.353 = 1.25
C. Supuestos
Esta prueba de homogeneidad de varianzas asume que las dos
poblaciones tienen distribuciones normales. La prueba de F no es
robusta bajo este supuesto, especialmente si las muestras tienen
tamaos diferentes.
Ejemplos:
Puede ser el mismo individuo que ha tomado dos pruebas diferentes (pre
y post), hermanos, hombre y mujer del mismo pas, maridos y mujeres, el
mismo objeto vendido bajo dos condiciones diferentes, etc. Es necesario
notar que obligatoriamente se tiene que tener el mismo nmero de
observaciones en cada muestra. Cuando es el mismo individuo que se
mide en dos ocasiones diferentes se llama una prueba de medidas
repetidas. En estos casos lo importante, ms que las medidas en s, es la
diferencia entre las medidas. La diferencia entre parear y repetir medidas
puede verse en el siguiente ejemplo
A. La prueba de z
En todos los problemas de muestras dependientes lo primero que hay
que hacer es determinar la diferencia entre todos los pares y hallar el
promedio de las diferencias que se expresan con la letra mayscula "D" y
dos suscritos, el primero indica la muestra y el segundo la pareja dentro
de las muestras. Asi D 5 = X15 - X25 se refiere a la diferencia entre la
primera y la segunda medida en el quinto sujeto o pareja de sujetos.
Di = X1i - X2i
1. Supuestos
1. La distribucin de la poblacin de diferencias es normal
La estadstica utilizada es
UNIVERSIDAD NACIONAL AUTONOMA DE NICARAGUA
ESTADISTICA APLICADA A LAS CCSS
LICENCIATURA EN TRABAJO SOCIAL
LIC. JULISSA GUTIERREZ
2. Ejemplo
En una empacadora de cereal el jefe de produccin tiene dos mquinas
para llenar cajas y quiere compararlas para determinar cul desperdicia
ms cereal y eventualmente tomar una decisin sobre la mquina que va
a dejar funcionando en la empacadora. En este ejemplo el jefe de
produccin tiene que probar las 10 cajas diferentes correspondientes a
los diferentes tipos de cereal que se empacan en la fbrica. Toma dos
cajas de cada tipo y obtiene los siguientes datos:
Tipo de mquina
Hay que recordar en el momento de la decisin final cmo fue que se hizo
la resta. (A lo que derramaba la nueva se le rest lo que derramaba la
vieja). Por lo tanto si la diferencia es estadsticamente significativa,
esto querra decir que la vieja es mejor.
Pasos 1 y 2:
Paso 3: a = 0.05
Paso 4: n = 10
Para tener un 5% del rea en la zona de rechazo tenemos que hallar los
valores crticos para la prueba de una cola con 9 df. El valor crtico
corresponde a -1.833
Si t0 -1.8331 no se rechaza H0
Paso 8: Cmputo de t0