You are on page 1of 35

Prueba de Hiptesis:

Una muestra
Julio E. Rodrguez Torres
EDUC 6390
Prueba de hiptesis
Hacer inferencias sobre la naturaleza de una
poblacin tomando como base observaciones
obtenidas de una muestra representativa de
esa poblacin.
Hiptesis: Conjetura sobre un parmetro o
varios parmetros de una poblacin.
La hiptesis que se somete a prueba es la
Hiptesis Nula (H
o
).
Hiptesis Nula
Es la hiptesis de no relacin o no diferencia.

No relacin entre variables (correlacin).
H
O
: =0

No diferencia entre grupos (Ej. Control vs
experimental).
H
O
:
1
=
2


Ejemplo:
Una poblacin de estudiantes de primer ao
de Ciencias del Ejercicio tiene una media ()
de 455 puntos en la parte cuantitativa del
SAT.
Una muestra de esa poblacin obtuvo una
media (X) de 535 puntos en la parte
cuantitativa del SAT.
Lgica de la prueba de hiptesis
Cul es la magnitud
de la diferencia?
Poblacin:
Valor hipottico
del parmetro
Muestra:
Valor observado de
la estadstica
Fallar en rechazar
la hiptesis
Rechazar la
hiptesis
=455
=535
Seleccin aleatoria
La diferencia es pequea
La diferencia es grande
Hiptesis alterna: H
a
Se somete a prueba la hiptesis nula (H
O
)
contra una hiptesis alterna que incluye todos
los posibles resultados no expuestos en la
hiptesis nula.
Para el ejemplo anterior establecemos la
hiptesis alterna de que la media en SAT no
es igual a 455 para esta muestra.
H
a
: = 455
Podramos tambien establecer las siguientes:
H
a
: > 455
H
a
: < 455

Hiptesis alterna: H
a
En investigacin la hiptesis alterna es
considerada la hiptesis de investigacin.
Esto es, el investigador est interesado en
determinar relacin o diferencias.
El propsito es encontrar evidencia estadstica
que nos permita rechazar la hiptesis nula en
favor de la alterna (hiptesis de investigacin).
Establecer criterios para rechazar la H
O
Luego de establecer las hiptesis el prximo
paso es determinar seleccionar una mustra
representativa y someter a prueba la H
O
.
Ejemplo:
Seleccionamos al azar una muestra de 144
sujetos y encontramos que la media es 535.
Nos preguntamos: es esta media muestral lo
suficientemente diferente de la media hipottica
de la poblacin
Pregunta
Cul es la magnitud de la diferencia entre
el valor de la estadstica observada y el valor
del parmetro en la poblacin?
Es esa diferencia lo suficientemente grande
para justificar el rechazo de la hiptesis nula?
Consideraciones al someter a prueba la H
0


Errores que se pueden cometer
Nivel de significatividad o significacin
Zona de rechazo
Decisiones en pruebas de hiptesis
Rechazar la H
O
cuando esta es cierta.
Fallar en rechazar la H
O
la cuando esta es
cierta
Fallar en rechazar la H
O
cuando es falsa.
Rechazar la H
O
cuando es falsa.
Cuatro posibles resultados en pruebas de hiptesis
H
O

Es cierta
H
O

Es falsa
Rechazar
H
O

Error Tipo I

Decisin correcta
Fallar en
rechazar
H
O

Decisin correcta

Error Tipo II
Cul de estos dos errores es ms serio?
Supongamos que tenemos unos pacientes con una enfermedad muy
seria. Asignamos de manera aleatoria a los pacientes a dos grupos. A
un grupo se le administra una nueva droga muy costosa. El otro grupo
recibe una terapia convencional. Se postula una H
O
de que no hay
diferencia entre las dos terapias.
Consideremos las consecuencias de cada tipo de error.
Si la nueva droga no es efectiva y se rechaza la Ho (Error Tipo I) se
utilizara una droga que es costosa y no tiene un efecto satisfactorio.
Si la hiptesis nula es falsa y no se rechaza (Error Tipo II) no se utilizara
una droga que es efectiva.
Se necesita un juicio valorativo para indicar qu tipo de error es ms
importante no cometer.
El acercamiento general es considerar que la Ha es cierta y que se
rechaza la H
O
.
Este acercamiento se enfoca en el Error Tipo I.
SE DEBE TRATAR DE MINIMIZAR LOS DOS TIPOS DE ERRORES.
Nivel de significatividad (
Se conoce como la probabilidad de cometer
el Error Tipo I cuando se somete a prueba la
H
O
.
Este nivel alfa se selecciona antes de
someter a prueba la H
O
.
Los ms utilizados son = .05 y =.01.

La prueba de hiptesis siempre comienza planteando que un
parmetro dado de la poblacin es cierto. Este planteamiento se
llama la hiptesis nula y se usa el smbolo H
0
para referirse a
ella. En el caso del ejemplo la hiptesis nula se escribe:
H
0
:
x
= 455
Esta hiptesis se considera cierta hasta que se haya encontrado
evidencia indicando que se rechaza. Es importante notar que la
lgica de la estadstica es que: Nunca se prueba nada.
Solamente se acumula evidencia contra la hiptesis nula para
rechazarla o no rechazarla. El vocabulario estadstico ser:
Hay suficiente evidencia para rechazar H
0
No hay suficiente evidencia para rechazar H
0
La hiptesis alterna se simboliza con H
1
y representa el opuesto de la
hiptesis nula. Es el opuesto absoluto de H
0
. As que cuando se
rechaza una hiptesis se sustenta la otra. H
1
generalmente representa
lo que el investigador quiere demostrar. En el caso del ejemplo la
hiptesis alterna se escribe:
H
1
: x = 455
En el ejemplo anterior si la media de la muestra est muy por arriba o
muy por debajo de la media propuesta en H
0
entonces se rechaza H
0
y
se sustenta H1. Pero tiene que quedar claro que el hecho de que se
rechace H
0
no es prueba de que H1 sea cierta o de que H0 sea falsa.
Solamente se ha acumulado evidencia a favor de una en contra de la
otra. Siempre va a haber un margen de error con respecto a la decisin
que se tome. El lenguaje es bien importante. Siempre se dir:
Se rechaza H
0
a favor de H
1

No se rechaza H
0
pues no hay suficiente evidencia para justificar
su rechazo
Nunca se dice que se ha probado nada. Para probar algo en
matemticas es imprescindible asegurarse que siempre va a ser cierto.
En estadsticas, sin embargo, siempre va a haber un margen de error.
Nunca se dice que se acepta la hiptesis nula o la alterna, puesto
que aceptar es mucho ms que no rechazar.
Regin de rechazo y regin de no rechazo
Para determinar operacionalmente cuando se rechaza y
cuando no se rechaza la hiptesis nula es necesario estudiar la
metodologa de la prueba de hiptesis basndose en la
distribucin muestral de la media. La distribucin muestral de la
media generalmente sigue la distribucin normal y es importante
determinar cul debe ser la regin de rechazo (rejection region)
o regin crtica y cul la regin de no rechazo (nonrejection
region). Generalmente la regin de no rechazo cubre el 95% del
rea alrededor de la media y la regin crtica el 5% de los
extremos. El trabajo estadstico previo consiste en determinar
con qu valor de X comienza la regin crtica.
Regin de rechazo y regin de no rechazo
z = valor crtico
zona blanca = regin de no rechazo
zona gris = regin de rechazo
Nivel de confianza y nivel de significacin
Si H
0
es cierta, en otras palabras, si la media de la
poblacin es 45 y se tomaran todas las posibles
muestras de 144 sujetos, entonces el 95% de esas
muestras tendra su media entre los valores crticos.
Esta regin de no rechazo generalmente es de 95%
99%. El porcentaje correspondiente a la regin de
no rechazo se denomina el nivel de confianza y se
escribe (1- ) donde a representa el porcentaje
correspondiente a las colas (tails) y el porcentaje
correspondiente a la regin de rechazo (a) se llama
el nivel de significatividad (level of significance)
Ejemplo
Una poblacin de estudiantes de primer ao
de Fisiologa del Ejercicio tiene una media ()
de 455 puntos en la parte cuantitativa del
SAT.
Una muestra de 144 estudiantes de esa
poblacin obtuvo una media (X) de 535
puntos en la parte cuantitativa del SAT.

Pasos en la prueba de hiptesis
[Cuando (desviacin estndar de la poblacin) es conocida]
Pasos 1 y 2: PLANTEAR LAS DOS HIPTESIS
H0: = 455
H1: = 455
Paso 3: DETERMINAR EL NIVEL DE
SIGNIFICACIN o
o = 0.05
Paso 4: SELECCIONAR EL TAMAO DE LA
MUESTRA
n = 144
Paso 5: SELECCIONAR LA PRUEBA ADECUADA
En este caso se
conoce o
X
por lo tanto
se usa la prueba z
donde z
0
(z observada)
es


Paso 6: DETERMINAR LOS VALORES CRTICOS
Para tener 5% como rea de rechazo y 95% como rea de no
rechazo es necesario encontrar 0.4750 del rea en la tabla.
Esta rea corresponde a los valores crticos
z
c
= 1.96 y z
c
= -1.96
Paso 7: ESCRIBIR LA REGLA DECISIONAL
Si z
0
< -1.96 si z
0
> 1.96 entonces se rechaza H
0
Si -1.96 < z0 < 1.96 entonces no se rechaza H
0
z
0
se denomina la z observada o el valor observado de la estadstica.
Paso 8: COMPUTAR z
o
n
o
X
144
100
455 535
Z
o
=
Z
o
= 9.6
=
Paso 9: DETERMINAR SI LA ESTADSTICA
EST EN LA ZONA DE RECHAZO O NO
z
0
se encuentra en la zona de rechazo, por
lo tanto se rechaza la hiptesis nula.
Paso 10: EXPRESAR LA DECISIN EN
TRMINOS DEL PROBLEMA
Con un nivel de significacin de 5% se puede
decir que HAY EVIDENCIA PARA
CONCLUIR QUE LA MEDIA OBSERVADA
EN LA MUESTRA ES DIFERENTE DE 455.
El p-value en la computadora
Con el advenimiento de las computadoras la prueba
de hiptesis se ha facilitado. Ya no es necesario:
a. calcular la media de la muestra
b. determinar los valores crticos (paso 6)
c. indicar la regla decisional (paso 7)
d. computar la estadstica (paso 8)
Todos estos pasos quedan sustituidos por la
determinacin del valor de p (p-value) que hace la
computadora. Sin embargo es necesario interpretar
correctamente este valor de p.
Significado de p
Si se toma como cierta la hiptesis nula, el valor de p representa
la probabilidad de obtener una estadstica igual o ms alejada de
la media (propuesta por H
0
) que el valor obtenido en la muestra.
Ejemplo:
Cuando a = 0.05 y p = 0.02 entonces se rechaza H
0

p = 0.02 significa que si la media de la poblacin es 455
entonces la probabilidad de obtener una muestra con una media
de 535 (como la de la muestra) es muy pequea, slo 0.02. En
otras palabras, la estadstica se encuentra en la zona de
rechazo.
Si p = 0.06 entonces no se rechaza H
0
puesto que la estadstica
se encuentra en la zona de no rechazo. En otras palabras,
siempre que p < o se rechaza H
0
y siempre que p > a no se
rechaza H
0
.
Visualmente se puede describir p como el rea
bajo los extremos de la curva.
Prueba de hiptesis cuando o es desconocida
En la unidad anterior se hizo la prueba de
hiptesis cuando se conoca la desviacin
estndar de la poblacin. Pero esto ocurre
muy raramente. Por lo general, en los
experimentos que se llevan a cabo se
conoce la desviacin estndar de la muestra
solamente. En esos casos es necesario
utilizar otra prueba estadstica.
Cuando no se conoce la desviacin estndar de la poblacin
siempre se puede usar la desviacin estndar de la muestra,
pero dividida entre la raz cuadrada de n.



pero no se pueden usar las tablas de la distribucin normal.
Cuando se hace la sustitucin, sobre todo para muestras
pequeas, la distribucin muestral es diferente de la normal.
Realmente se usa toda una familia de distribuciones semejante
a la familia de las distribuciones normales, pero que tienen
ms rea bajo los extremos y menos en el centro. (Hinkle, p.
207)
. La familia de distribuciones t
Sin embargo, a medida que el tamao de la
muestra aumenta las distribuciones de t se
parecen ms a la normal.
Por esta razn cuando el tamao de la muestra
es de ms de 120 se deja de utilizar la tabla de t
y se regresa a la tabla de z.
Sin embargo la tabla de t no es tan detallada como
la de z. Slo aparecen los valores crticos de ciertas
reas de rechazo. (Hinkle p.637, Tabla C3)
Cada una de las distribuciones de t est asociada
con el tamao de la muestra por medio de los
llamados grados de libertad (degrees of freedom).
El intervalo de confianza
Otra forma de trabajar el mismo problema es utilizando el
intervalo de confianza [CI] en vez de la prueba de hiptesis.
El propsito este mtodo el razonamiento es determinar a qu
poblaciones puede corresponder una muestra semejante a la
que se ha obtenido. En vez de suponer que H
0
es cierta,
simplemente se toma un intervalo alrededor de la media de la
muestra.
En otras palabras, se construye un intervalo de confianza [CI]
alrededor de la estadstica observada. Es posible tener un cierto
grado de confianza que este intervalo de confianza incluye el
parmetro de la poblacin. Partiendo de dnde se encuentra la
media de la muestra se hacen inferencias sobre la media de la
poblacin
La estimacin de parmetros
Se utiliza la siguiente frmula para determinar los
valores crticos del intervalo de confianza:

|
|
.
|

\
|

n
z X
X
c
o
La prueba de hiptesis y el intervalo de
confianza
El intervalo determinado por 535 es
535 (1.96)(100/12)
535 16.33
Por lo tanto la media de la poblacin debe estar en
el intervalo
518.67 s x s 551.13
Puesto que la media hipottica de la poblacin es
455 es posible concluir que:
Con un nivel de confianza de 95% se puede decir
que hay evidencia partiendo de la muestra
escogida para concluir que la media es
diferente de 455.

You might also like