You are on page 1of 49

Estadstica I

Unidad 3. Prueba de hiptesis



Licenciatura en Matemticas


6 cuatrimestre


Estadstica I


Unidad 3. Prueba de hiptesis


Clave:
050920623/060920623


Universidad Abierta y a Distancia de Mxico





Estadstica I
Unidad 3. Prueba de hiptesis

Contenido
Presentacin de la unidad ................................................................................................. 3
Propsitos de la unidad ..................................................................................................... 3
Competencia especfica ..................................................................................................... 3
3. Prueba de hiptesis ....................................................................................................... 3
3.1. Elementos de la prueba .............................................................................................. 4
3.1.1. El problema de las pruebas de hiptesis ....................................................................... 7
3.1.2. Hiptesis simple y compuesta ......................................................................................... 8
3.1.3 Regin Crtica ................................................................................................................... 13
3.1.4. Errores tipo I y tipo II ....................................................................................................... 14
Actividad 1. Relacin, estimacin y prueba de hiptesis ........................................... 16
3.2. Pruebas de las Medias (muestras grandes) .............................................................. 16
3.2.1. Para la Media de una poblacin. .................................................................................. 17
3.2.2. Para la comparacin de Medias .................................................................................... 27
Actividad 2. Hiptesis simple y compuesta ................................................................. 33
3.3. Pruebas para las Varianzas (muestras grandes) ....................................................... 33
3.3.1 Para la Varianza de una poblacin ............................................................................ 34
3.3.2. Para la comparacin de Varianzas ........................................................................... 38
Actividad 3. Prueba de hiptesis para la Media y para las Desviaciones .................. 42
3.4 Potencia de la Prueba .............................................................................................. 42
3.4.1 Lema de Neyman Pearson ........................................................................................... 43
3.4.2 Funcin Potencia............................................................................................................ 44
3.4.3 Prueba uniformemente ms potente ......................................................................... 46
Autoevaluacin .............................................................................................................. 46
Evidencia de Aprendizaje. Prueba de hiptesis .......................................................... 48
Autorreflexin ....................................................................... Error! Marcador no definido.
Cierre de la unidad......................................................................................................... 48
Para saber ms .............................................................................................................. 49
Fuentes de consulta ...................................................................................................... 49



Estadstica I
Unidad 3. Prueba de hiptesis

Presentacin de la unidad

En la unidad anterior se estudi la distribucin normal, la binomial y el teorema central del
lmite, que sentaron las bases sobre la forma en que se distribuyen los datos.

En la tercera unidad se estudiarn temas relacionados con la prueba de hiptesis, y
tomando en cuenta que uno de los principales objetivos en la Estadstica inferencial es la
posibilidad de hacer generalizaciones es posible sacar conclusiones basadas en la
probabilidad acerca de una poblacin determinada.

Para ello es fundamental abordar el tema de la Prueba de hiptesis, ya que permitir la
toma de decisiones con base en la informacin que puede proporcionar una muestra
dada de esa poblacin.

Para los fines de esta unidad se estudiarn las Pruebas de hiptesis sus principales
elementos y tipos, y se elaborarn ejemplos y ejercicios con la finalidad de clarificar los
conceptos desarrollados.


Propsitos de la unidad

- Utilizar resultados mustrales a travs del anlisis de pruebas estadsticas como
varianza y potencia de prueba para aceptar o rechazar hiptesis


Competencia especfica

- Utilizar evidencias mustrales para aceptar o rechazar una hiptesis mediante las
pruebas de las medias, varianzas y potencia de la prueba.


3. Prueba de Hiptesis

La Prueba de hiptesis forma parte de la teora de hiptesis tambin conocida como
Teora estadstica de las decisiones, que se caracteriza por hacer posible la toma de
decisin respecto a un par de hiptesis, las cuales son planteadas en torno a un
parmetro o caracterstica de la poblacin.

La Prueba de hiptesis es un procedimiento estndar que consiste en aceptar o
rechazar una aseveracin en torno a un parmetro poblacional, es decir, aceptar o
rechazar una hiptesis originalmente planteada, denominada hiptesis nula, contra una
hiptesis alterna.
En esta unidad nicamente se abordaran Pruebas paramtricas.
Estadstica I
Unidad 3. Prueba de hiptesis

3.1. Elementos de la prueba

Cuando se realiza una prueba de hiptesis, por ejemplo, sobre la media poblacional se
realiza un procedimiento como el siguiente donde estn involucrados varios elementos:

Dado un problema determinado:
- Primer paso plantear las hiptesis (H0 y H
a
).
- Segundo paso: se procede a establecer un nivel de significacin obteniendo una
estadstica de prueba.
- Tercer paso: con base a los resultados obtenidos se debe tomar una decisin en
torno a la hiptesis planteada.

- Cuarto paso: por ltimo se han de sacar conclusiones.

Como se puede apreciar la prueba est conformada por varios elementos, entre los
cuales se pueden mencionar la hiptesis nula y alternativa, el nivel de significacin, la
regin crtica, y la estadstica de prueba.

Las hiptesis nula y alternativa se detallaran ms adelante, al igual que la regin crtica
o de rechazo, en cuanto al estadstico de prueba, ste se basa en el hecho de que la
hiptesis nula es cierta. Es un valor que se calcula con base en la informacin de la
muestra. Ese elemento, que sirve para hacer el contraste, permite la decisin de rechazar
o no rechazar la hiptesis nula.

La eleccin del estadstico adecuado depender de las caractersticas propias del
problema o del estudio que se desea realizar (si la poblacin se distribuye normalmente,
si el tamao de la muestra es lo suficientemente grande para considerarla normal, etc.).

La eleccin del estadstico tambin est relacionada con el parmetro poblacional de
inters. Es decir si el parmetro de inters es la media el estadstico ser uno pero si se
trata de la varianza ser otro.

Cabe sealar que la regin crtica (que se ver ms adelante) a su vez est ligada al
concepto de valor crtico y nivel de significacin. Antes de tratar de definirlos o
explicarlos es conveniente revisar el siguiente esquema en donde se observa con
claridad cada uno de los elementos sealados.

Estadstica I
Unidad 3. Prueba de hiptesis



El valor crtico es un estadstico que se ha de tomar en funcin de la puntuacin Z, de t
de x
2
, de F, y se utiliza para dividir las regiones de la distribucin en dos. Por un lado est
la regin de aceptacin y por el otro la regin de rechazo. Es decir establece una
regin de rechazo de la hiptesis nula y una regin de aceptacin (o de no rechazo) de la
hiptesis nula

Esto se puede ver en la siguiente grfica:



Ahora bien a las zonas de rechazo se les llama colas y se presentan en los siguientes
casos:
Estadstica I
Unidad 3. Prueba de hiptesis





El nivel de significacin es representado por la letra griega (riesgo o probabilidad)o
bien en qu porcentaje se est dispuesto a cometer el error. De tal manera que se desea
tener valores muy bajos de , para que el riesgo o la probabilidad de error sea la ms
pequea posible.

Generalmente los valores asignados a son: 0.01, 0.05, 0.1.dependiendo si se desea el
99%, el 95% o el 90% de confianza respectivamente.

Depender si se trata de una prueba direccional o no direccional.

Por ejemplo

Si la = 0.01 (el 10%) se tienen tres casos:
Estadstica I
Unidad 3. Prueba de hiptesis




Cuando se realiza una prueba de hiptesis se sigue un procedimiento en donde estn
involucrados estos elementos.


3.1.1. El problema de las pruebas de hiptesis

En esta primera parte se abordarn una serie de hechos conceptuales para enmarcar lo
que es una prueba de hiptesis. Tomemos como ejemplo a dos alumnos (alumno x,
alumno z) que estn peleando a mitad del patio de una escuela, llega un profesor a la
escena y puede hacer la conjetura sobre quin empez la agresin; es decir, el profesor
har una afirmacin, a travs de un enunciado que deber probarse si es cierto o es falso.
Esta sera una manera muy sencilla de lo que puede ser una prueba de hiptesis, claro
est que en estadstica lo que importa es poner a prueba hiptesis referidas a los
parmetros o caractersticas de la poblacin.

Si se realiza un estudio estadstico sobre una poblacin se puede evaluar un parmetro
de la misma, por ejemplo, la media o la varianza.
Estadstica I
Unidad 3. Prueba de hiptesis

Como se ha mencionado a lo largo del curso es difcil , incluso, imposible evaluar a toda la
poblacin, por lo que se recurre a la toma de muestras representativas.

Trabajar con una muestra es relativamente sencillo y se puede evaluar cualquier
caracterstica o estadstico de inters obtenindose valores que sean prximos al valor del
parmetro de la poblacin. El problema radica en formular hiptesis en torno a esos
valores de los estadsticos de estas muestras; es decir, en probar esas hiptesis, para
tomar una decisin sobre si debern ser aceptadas o rechazadas.

El aceptar o rechazar una hiptesis implica la posibilidad de haber tomado una decisin
correcta o incorrecta (haber cometido un error). Este aspecto se ver a detalle en el punto
3.1.4) Obviamente que se desea tomar decisiones correctas, pero esto no es posible dado
que se parte de una informacin muestral.

La teora de hiptesis tendr como propsito fundamental hacer elecciones adecuadas
entre dos hiptesis, ambas referidas a un mismo valor de un parmetro de la poblacin.

Se puede resumir el problema de contraste de hiptesis, como una toma de decisin
en la cual se ha de elegir entre dos distribuciones posibles.


Cul de estas dos ser ms factible de ser propuesta como generadora de una
muestra?. En el siguiente punto se har la explicacin de las principales caractersticas de
estas hiptesis y ejemplos para su mejor comprensin,


3.1.2. Hiptesis simple y compuesta

La palabra hiptesis es de hecho de uso cotidiano. A todo mundo se le ha enseado en
la escuela que uno de los pasos del mtodo cientfico es la formulacin de hiptesis.

As mismo, este vocablo es muy recurrente en los medios de comunicacin,, sobre todo
en los noticieros, donde se emplean expresiones como: una posible hiptesis, existe la
hiptesis etc.
En general se podra entender el trmino hiptesis como una conjetura, como una
suposicin, o como una proposicin no demostrada pero que se tienen elementos que
apuntan en esa direccin.

Una posible definicin de lo que es una hiptesis desde el punto de vista estadstico
podra ser que es una conjetura, una proposicin que se realiza sobre un parmetro (o
caracterstica) de la poblacin que es objeto de estudio.

Estadstica I
Unidad 3. Prueba de hiptesis

En esta unidad se va a trabajar con dos tipos de hiptesis: la hiptesis nula (H
0
)y la
hiptesis alternativa (H
a)
, aunque tambin es muy comn en algunos textos encontrar la
notacin H
1
.

Entonces se tiene:

Hiptesis - hiptesis nula H
0

Estadsticas - hiptesis alternativa H
a
o (H
1
).


Veamos en seguida en qu consiste cada una de ellas:

Hiptesis nula H
0
.-

La hiptesis nula, tambin es conocida como hiptesis de trabajo donde la afirmacin
hecha en la hiptesis nula ser contrastada y de ah tendr que ser rechazada o no
rechazada.

Hiptesis nula aseveracin sobre un valor especifico respecto a un parmetro
poblacional. Siempre ser la negacin a la hiptesis alterna.

Un claro ejemplo de lo que en la prctica es una hiptesis nula, se encuentra en los
juzgados de la mayora de los pases:

El principio establece que todo acusado es inocente hasta que se le demuestre lo
contrario.

Para que sea una hiptesis nula la formulacin es la siguiente:
El acusado es inocente.
En trminos matemticos quedara como:
H
0
: acusado = inocente

Una vez formulada se tiene por hecho que es cierta. El contraste es reunir las pruebas
suficientes para demostrar que en efecto el acusado no es inocente, o bien que no existen
suficientes pruebas para declararlo culpable.

Una caracterstica importante de la hiptesis nula es que no supone ninguna diferencia
entre el valor del estadstico y el valor del parmetro poblacional.Por lo que a la hora de
formularla siempre se utilizar el signo igual =. Vemoslo con un ejemplo estadstico.

Ejemplo 1
Se desea realizar un estudio sobre la edad promedio en aos cumplidos que tienen los
estudiantes al egresar como graduados de la universidad.
Estadstica I
Unidad 3. Prueba de hiptesis


Un investigador puede formular las hiptesis siguientes: <24, =24, >24.

Cul sera una hiptesis nula?

Para que sea una hiptesis nula la formulacin es la siguiente:

La edad promedio de egreso (en aos cumplidos) de los estudiantes es de 24 aos.
En trminos estadsticos quedara como:
H
0
: =24
Cabe mencionar que la hiptesis nula haca referencia a un valor que el cientfico, el
investigador (o quin realice el estudio estadstico) presuma no corresponda al
verdadero valor del parmetro poblacional. Por ello se le llamaba hiptesis nula (no
vlida).

Algo muy importante de tener presente es que la hiptesis nula siempre es la que se va a
confirmar en una prueba de hiptesis.
Hiptesis alternativa H
a
(H
1
).

La hiptesis alternativa es una aseveracin sobre el mismo parmetro poblacional al
que hizo referencia la hiptesis nula

Una hiptesis alternativa es aquella que es contraria a la hiptesis nula.

Otra manera de definirla puede ser por complementos. Se formula una hiptesis nula y la
hiptesis alternativa sera una especie de complemento de la hiptesis nula.

A la hora de formular la hiptesis alternativa sta no deber contener el smbolo igual
=aunque pueden usarse los siguientes smbolos:

<,>, . Menor que, mayor que, diferente, as se tienen las siguientes posibilidades para la
hiptesis alternativa (se usara la media para ejemplificar, puede ser cualquier estadstico):
H
a
: 24 en este caso se tiene una hiptesis alternativa de dos colas
H
a
: <24 en este caso se tiene una hiptesis alternativa de cola inferior
H
a
: >24 en este caso se tiene una hiptesis alternativa de cola superior

Contrario a la hiptesis nula la alternativa no se va aprobar con la prueba de hiptesis.

La hiptesis alternativa va a especificar valores vlidos desde el punto de vista del
cientfico (del investigador), por ello suele llamarse hiptesis de investigacin.

Estadstica I
Unidad 3. Prueba de hiptesis

La afirmacin realizada en la hiptesis alternativa es lo que al investigador le interesa que
sea probado. Esta hiptesis se tomar como verdadera una vez que se haya rechazado la
hiptesis nula.

Ejemplo 2

Se desea realizar un estudio sobre la edad promedio de los estudiantes al egresar como
graduados de la universidad.
Un investigador puede formular las hiptesis siguientes: <24, =24, >24.

Cul sera una hiptesis alternativa?
Dado que la hiptesis nula fue:
H
0
: =24
Se presentan varas posibilidades:
H
a
: 24
H
a
: <24
H
a
: >24

Como la hiptesis nula est referida a que el valor es igual, la hiptesis alternativa se va
a formular como no igual o diferente. Pero tambin puede ser la opcin mayor que o
menor que. Una manera de formular la hiptesis alternativa seria:

- La edad promedio de egreso (en aos cumplidos) de los estudiantes no es de 24
aos. O con otras palabras

- La edad promedio de egreso (en aos cumplidos) de los estudiantes es diferente
de 24 aos.

En trminos estadsticos quedara como:
H
a
: 24

Siempre se va a trabajar solamente con una hiptesis alternativa.

Ahora bien se va a definir una hiptesis simple como aquella que especifica un nico valor
para el parmetro en cuestin.
Por ejemplo: H
0
: =24.

Y la hiptesis compuesta es aquella en la que se especifica un intervalo de valores.

Por ejemplo: H
a
: <24.

En conclusin:

Estadstica I
Unidad 3. Prueba de hiptesis

La prueba o contraste de hiptesis se realiza siempre sobre la hiptesis nula. Sera
mucho ms complicado tratar de probar la hiptesis alternativa.

La hiptesis nula siempre asevera la igualdad entre el parmetro poblacional y el
estadstico. La hiptesis alternativa asevera lo opuesto.

La hiptesis nula se formula en trminos del parmetro poblacional, as sea que
nicamente se tenga informacin sobre la muestra.

La hiptesis nula no podr ser cierta aunque no sea rechazada y esto se debe a que se
basa en informacin aportada por la muestra y no de toda la poblacin.

De ser rechazada la hiptesis nula se acepta la hiptesis alternativa.

Ya se seal que la hiptesis nula siempre se va a formular en trminos de una igualdad.
En tanto que la hiptesis alternativa puede presentarse de tres maneras:















Hiptesis
alternativa










H
a
: cierto valor. Prueba de dos colas


H
a
: < cierto valor. Prueba de cola inferior

H
a
: > cierto valor. Prueba de cola superior
Estadstica I
Unidad 3. Prueba de hiptesis








Ejemplo 3
Se realiza una aseveracin sobre la edad promedio en aos cumplidos que tienen los
estudiantes al egresar como graduados de la universidad, asegurndose que es superior
a 24 aos cumplidos. Un investigador no est de acuerdo y desea contrastarla.
Establezca la hiptesis nula y alternativa.

Solucin:
Primero se expresa la afirmacin que se va a probar, para este caso es >24.
Para hacer el contraste se parte del hecho de que >24 es falso por lo tanto se plantea
como verdadero que <=24.

Para finalizar de las dos afirmaciones anteriores se elige como hiptesis nula aquella que
contenga el signo igual que. As se tiene:

H
0
: =24 (<=)
H
a
: >24
Y como se puede observar en este ejemplo se tiene un caso de cola superior.


3.1.3. Regin Crtica

La regin crtica se puede definir como el conjunto de valores de la prueba de hiptesis
que causan el rechazo de la hiptesis nula. Tambin se le puede llamar regin de
rechazo.

Grficamente la regin crtica es el rea comprendida a la izquierda del primer valor crtico
y el rea comprendida a la derecha del segundo valor crtico. Es el rea total que se
denomina regin de rechazo de la hiptesis nula. Es decir en las colas de la curva normal.
Las colas son los extremos de la curva a partir del valor crtico.

Contrario a la regin de rechazo (regin crtica) se tiene la regin de no rechazo o regin
de aceptacin.

Estadstica I
Unidad 3. Prueba de hiptesis

Las dos regiones son complementarias y mutuamente excluyentes.

La regin de aceptacin o de no rechazo es el conjunto de valores de la prueba de
hiptesis que hacen posible no rechazar la hiptesis nula. La regin de no rechazo (o de
aceptacin) est comprendida hacia el centro de la distribucin.

Cuando se est trabajando con una poblacin que se distribuye normalmente se pueden
presentar tres posibilidades para la regin crtica o de rechazo:

La regin crtica es de hecho la parte referente de la prueba de hiptesis, la que da pauta
a la toma de la decisin de rechazar o no rechazar la hiptesis planteada.
Cuando se realiza la prueba y se llega a un resultado que cae dentro de la regin crtica,
la hiptesis nula deber ser rechazada. Si cae fuera no podr ser rechazada o al menos
se dir que no existe la suficiente evidencia para que se rechace.


3.1.4. Errores tipo I y tipo II

En este tema vamos ver los dos tipos de errores que se pueden cometer al realizar
La Prueba de hiptesis. Ya se mencion que toda prueba se realiza sobre la hiptesis
nula. Con base en los resultados arrojados por la prueba se debe decidir si se rechaza o
no la hiptesis nula.
Estadstica I
Unidad 3. Prueba de hiptesis


Supn que se desaprueba la hiptesis nula cuando no se debe rechazar, naturalmente se
estara cometiendo un error que en Estadstica se le llama error tipo I.

Ahora considera el caso de que no se rechaza esa hiptesis pero deba de rechazarse,
nuevamente se estara cometiendo un error, que llamaramos error tipo II.

Por el contrario cuando se rechaza la hiptesis y sta deba ser rechazada se dice que se
ha decidido correctamente, lo mismo ocurre cuando no se rechaza la hiptesis y
efectivamente no deba ser rechazada.

Esto se puede resumir de la siguiente manera en un arreglo llamado tabla de
contingencia:



Esto se puede comprender mejor con un ejemplo:

Ejemplo 4
Se realiza un estudio sobre la edad promedio en aos cumplidos que tienen los
estudiantes al egresar como graduados de la universidad, asegurndose que es de 24
aos cumplidos.

Si la hiptesis nula es H
0
: =24.
Establezca un enunciado para los errores tipo I y II.

Solucin.
El error tipo I consiste en rechazar la hiptesis nula cuando sta no debe de ser
rechazada. Por lo tanto se cometera un error tipo I si se rechaza la hiptesis nula cuando
en realidad la edad promedio de los graduados fuera de 24 aos cumplidos.

El error tipo II consiste en no rechazar la hiptesis nula cuando sta si debe de ser
rechazada.

Estadstica I
Unidad 3. Prueba de hiptesis

Por lo tanto se cometera un error tipo II si no se rechaza la hiptesis nula cuando en
realidad la edad promedio de los graduados es diferente a 24 aos cumplidos.

Ahora bien tanto el error tipo I como el error tipo II se pueden analizar en trminos de sus
probabilidades. As a la probabilidad de que ocurra el error de tipo I se le llama y a la
probabilidad de que ocurra el error de tipo II se le denomina .

P (error tipo I) =
P (error tipo II) =

El valor de es fijado por el investigador al inicio de la prueba, en tanto que el valor de
se puede calcular.

El valor de es el rea obtenida a partir del valor del estadstico de prueba.


Actividad 1. Relacin, estimacin y prueba de hiptesis

A travs de esta actividad, analizars y discutirs en el Foro el resultado sobre un
planteamiento de hiptesis nula e hiptesis alternativa.

Instrucciones:

1. Resuelve el siguiente problema:

Se realiza un estudio estadstico sobre el peso promedio de los jugadores de futbol
americano de la universidad. La muestra tomada reporta una Media de 90 Kg

2. Ingresa al Foro para exponer tus resultados sobre las hiptesis planteadas.

3. Revisa y comenta la aportacin de dos de tus compaeros aceptando o
rechazando su respuesta.

4. Consulta la rbrica general de la participacin en foros, que se encuentra en la
seccin Material de Apoyo.



3.2. Pruebas para las medias (muestras grandes)

Cuando se realiza un estudio estadstico se puede tomar cualquier parmetro poblacional
para realizar una prueba. El parmetro que se elija depender de cada situacin y de las
caractersticas del estudio as como de las necesidades del investigador.
Estadstica I
Unidad 3. Prueba de hiptesis


Quiz el parmetro ms usado sea la Media pues en todo estudio resulta de mucha
utilidad saber el promedio de los datos, es decir sobre qu valor se concentra la mayora
de los datos.

En una prueba de hiptesis sobre las Medias puede interesarnos saber qu tanto se
aproxima la Media de la muestra a la Media poblacional o bien qu tanto difiere la Media
de una Muestra con respecto a la Media de otra.

Se analizarn ejemplos para situaciones en donde se tenga una Media, es decir, se
trabaje solamente con una muestra y tambin para situaciones en donde se cuente con
dos Medias, en cuyo caso se estar trabajando con dos muestras de una misma
poblacin o de dos diferentes poblaciones.

Por otra parte, en la unidad anterior se mencionaron las muestras grandes. Algunos
autores consideran que 30 o 25 datos de la muestra es suficiente. Tambin hay que
recordar el Teorema del Lmite Central en donde se observ que conforme aumente el
tamao de la muestra la distribucin tiende a la normal.

De igual forma es importante recordar que cuando el tamao de la muestra es menor a
estos valores pero la poblacin original sigue una distribucin normal entonces la muestra
tambin sigue la tendencia normal. Pero si el tamao de la muestra es menor a estos
valores y la distribucin de la poblacin no sigue a la normal entonces no se puede
considerar la muestra como normal y ser necesario por lo tanto utilizar otros mtodos.


3.2.1. Para la media de una poblacin.

La prueba de hiptesis sobre las Medias ya se ha venido ejemplificando. Ya se mencion
que en la prueba se tiene una hiptesis nula y una hiptesis alterna a sta y que en
general la hiptesis nula siempre ser aquella en la que se iguale el estadstico al
parmetro de inters. Por lo tanto en una prueba de hiptesis para las Medias la hiptesis
nula siempre ser planteada como:

H0: = cierto valor

Por ejemplo:
H0: = 24

Y la hiptesis alterna como lo diferente. Puede ser no direccional, es decir no se indica si
es mayor o menor, simplemente se establece que es diferente

H
a
: cierto valor prueba de dos colas
Estadstica I
Unidad 3. Prueba de hiptesis


Por ejemplo:
H
a
: 24

O puede ser direccional, es decir se establece si es mayor o menor:

H
a
: <cierto valor prueba de cola inferior o a la izquierda
H
a
: >cierto valor prueba de cola superior o a la derecha

Por ejemplo:
H
a
: <24
H
a
: >24


Ejemplos:

Para facilitar el entendimiento de la prueba de hiptesis es conveniente formular un
procedimiento, es decir una serie de pasos, pero a medida que se avance y se tenga
mayor dominio del tema se puede omitir y realizar la prueba de una manera menos rgida.

1) Dado un problema el primer paso sera plantear las hiptesis (H0 y H
a
) de
acuerdo al texto.


2) En seguida se procede a establecer un nivel de significacin,
(generalmente va de 0.01, 0.05 a 0.10, pero habr estudios y disciplinas
que se salgan de este rango). Como ya se estudi esto permite establecer
el valor crtico que separa la zona de rechazo y la de no rechazo.

3) Se debe obtener una estadstica de prueba.
Estadstica I
Unidad 3. Prueba de hiptesis


ste es un valor que se calcula con base en la informacin de la muestra, se trata del
elemento que sirve para hacer el contraste y, permite la decisin de rechazar o no la
hiptesis nula.

La eleccin del estadstico adecuado depender de las caractersticas propias del
problema o del estudio que se desea realizar y est relacionado con el parmetro
poblacional de inters, si ste es la Media el estadstico ser uno pero si se trata de la
Varianza el resultado ser otro.

Para el caso concreto de la media poblacional se deben tomar en cuenta varias
consideraciones:

- La desviacin estndar es o no conocida
- El tamao de la muestra es mayor o no a 30 (25 para algunos autores)
- La poblacin se distribuye normalmente o no

SI se conoce la desviacin estndar de la poblacin y adems se tiene una muestra
superior a 30, entonces se utiliza el estadstico z.. Si no se conoce la desviacin estndar
de la poblacin pero se tiene una muestra de tamao mayor a 30 tambin se va a utilizar
la tabla z. Cuando el tamao de la muestra es menor a 30 pero se tiene que la poblacin
se distribuye normalmente y adems se conoce la desviacin estndar de la poblacin se
utilizara la tabla z y por ultimo si el tamao de la muestra es menor a 30 pero se tiene que
la poblacin se distribuye normalmente y adems no se conoce la desviacin estndar de
la poblacin se utilizara la tabla t.

Esto se resume en la siguiente tabla.
Muestra Desviacin estndar poblacional
conocida desconocida
n>30 Distribucin normal, usar
tabla z
Distribucin normal, usar
tabla z
n<=30. Pero la poblacin se
distribuye normalmente
Distribucin normal, usar
tabla z
Distribucin t, usar tabla t


Para la prueba de hiptesis de una Media se utiliza el siguiente estadstico de prueba:

CuIcuIudo
=


s
n


Siendo H0:=
0

Estadstica I
Unidad 3. Prueba de hiptesis


Se tienen los siguientes casos:
Posibilidades de H
a
Se va a rechazar H0 si
H
a
: <
0
Zcalc< Z (tablas )
H
a
: >
0


Zcalc> Z (tablas )
H
a
: =
0
|calc |> Z/2(tablas )

La prueba de hiptesis para una Media tambin se trabaja con el mtodo del valor P,
que se ver al final de este apartado.

4) Con base en los resultados obtenidos se debe tomar una decisin en
cuanto a la hiptesis planteada.

El valor del estadstico obtenido en las tablas es el que se va a comparar con el valor del
estadstico de prueba (obtenido por medio de la frmula).

Al graficar se ve claramente si el valor calculado cae o no dentro de la zona de rechazo.

Como ejemplo se presenta la siguiente figura en donde el estadstico de prueba cae
dentro de la zona de rechazo.

Si la prueba es de cola superior y el valor del estadstico de prueba es mayor al valor del
estadstico de tablas, entonces se est en la zona de rechazo y por lo tanto se rechaza la
hiptesis nula y se acepta la hiptesis alterna.

En la siguiente figura se ilustra cuando el estadstico de prueba cae fuera de la zona de
rechazo:
Estadstica I
Unidad 3. Prueba de hiptesis



Esto se resume en la siguiente tabla:

Tipo de prueba Valor calculado
v.s. valor de tablas
Cae en la zona de
rechazo
Se rechaza Ho
Cola inferior Mayor No No
menor si si
Cola superior Mayor Si Si
menor No no
Dos colas Mayor en valor
absoluto
Si

Si

Menor en valor
absoluto

no no

5) Por ltimo se obtienen las conclusiones.

Ejemplo:

Ejemplo 5
Una clnica de tratamiento de la obesidad promete a sus clientes, una reduccin de peso
de 5 kilogramos por mes. Se realiza un estudio estadstico para saber si efectivamente los
pacientes bajan en promedio 5 kilogramos por mes. Para lo cual se tom una muestra de
49 pacientes y se obtuvieron los siguientes resultados:
Una reduccin de peso promedio de 4 kg con una desviacin tpica de 1.8 kilogramos.
La pregunta es se debe aceptar como vlida la promesa de la clnica?

Solucin:
Los datos que se pueden extraer del ejemplos son los siguientes:

Estadstica I
Unidad 3. Prueba de hiptesis

=5kg, n=49, s=1.8kg, =4 kg

Con estos datos se procede a formular la Prueba de hiptesis.
El primer paso es plantear la hiptesis nula y la alterna:
H0: en efecto la media prometida por la clnica es igual a la media poblacional

H
a
: la media prometida por la clnica es diferente. En este caso, por tratarse de reduccin
de peso, a los clientes obviamente les interesa saber si es verdad o por el contrario es
menor (si fuese mayor a la prometida no habra inconveniente).De tal forma que
expresadas en forma matemtica se tiene:
H0:=5

H
a
: <5 prueba de cola inferior o a la izquierda. Si fuese mayor se tendra una prueba de
cola superior y si fuera diferente se tendra una prueba de dos colas.

Ahora se debe de definir el nivel de significancia .
Para este ejemplo se tomara un nivel de significacin del 0.01. =0.01.
Por lo que se tiene un nivel de confianza del 0.99 sea el 99%.

En este problema se tiene el caso donde no se conoce la desviacin estndar (y la
varianza) de la poblacin, sin embargo el tamao de la muestra permite asumir la
distribucin como normal y por tanto utilizar el estadstico z. los datos se pueden
acomodar en un grfico de la distribucin normal para que se visualice mejor el problema.
Se tiene entonces:


Con este valor de =0.01 (=1%), se observa un rea del 49% sea 0.49 y con este valor
se busca en las tablas el valor de z (valor terico)

Se encuentra que: z= 2.33. Lo que corresponde para z=-2.33.

En el tercer paso se va a calcular el estadstico z para verificar si ste cae a la derecha
del valor crtico z obtenido en tablas o bien cae a la izquierda. Se representa en un
diagrama:
Estadstica I
Unidad 3. Prueba de hiptesis



El estadstico de prueba utilizado para la Media considerando la distribucin normal es:

CuIcuIudo
=


s
n


La ecuacin para z relaciona la diferencia de las Medias (de la muestra y la poblacin)
entre el error estndar.

Sustituyendo los valores en la ecuacin se tiene:

=5 kg, n=49, s=1.8 kg, =4 kg

CuIcuIudo
=


s
n

CuIcuIudo
=
4 S
1.8
49

CuIcuIudo
=
1
1.8
7
= S.88


El siguiente paso es tomar la decisin estadstica.
Estadstica I
Unidad 3. Prueba de hiptesis


Si Z
calculado
>Z
tabulado
Entonces el estadstico cae en la zona de no rechazo por tanto no se
rechaza la hiptesis nula.

Si por el contrario el Si Z
calculado
<Z
tabulado
se rechaza la H0 y se acepta la H
a
.

Se tiene:
-3.88 < -2.33

Por lo tanto el estadstico cae en la regin de rechazo. As que se rechaza la H0 y se
acepta la H
a
.

Por ltimo se realiza la conclusin:

Los resultados de la prueba muestran que no se debe tomar como vlida la promesa de la
clnica sobre la reduccin de peso de los pacientes.

Ahora se explicar otro mtodo para resolver el mismo tipo de prueba.

Mtodo del valor P.

El mtodo que se acaba de utilizar en la resolucin del ejemplo se conoce como:
Mtodo del estadstico z (o mtodo del valor crtico); sin embargo existe otro mtodo
que actualmente es muy usado por los investigadores, se conoce como el Mtodo del
valor P.
Que es uno de los conceptos ms importantes actualmente en las pruebas de hiptesis.

El valor P va de 0 a 1.

Es una probabilidad que nos va a permitir observar qu tanta evidencia existe en la
muestra que apoye el rechazar la hiptesis nula. Es decir, con el valor P se determina si
es adecuado rechazar la hiptesis nula en una prueba de hiptesis.

Una posible definicin sera que es el valor mnimo que puede tomar para que la H0 sea
rechazada. En trminos probabilsticos se dira que el valor P es la probabilidad de
encontrar, en una muestra, evidencia suficiente a favor de la hiptesis alternativa.

En una prueba de hiptesis la conclusin resulta de comparar el valor P con .
Se pueden tener los siguientes casos:

- Valor P > no rechazar H0 para ese valor de especfico
- Valor P s se rechaza H0 para ese valor de especfico.
Estadstica I
Unidad 3. Prueba de hiptesis


Ahora bien, entre ms pequeo sea el valor P, mayor ser la evidencia que apoye la
hiptesis alternativa H
a,
de hecho se pueden tomar como regla las siguientes
aseveraciones:

- Valor P < 0.01 es evidencia convincente para rechazar H0
- Valor P entre 0.01 y 0.05 es evidencia fuerte para rechazar H0
- Valor P entre 0.05 y 0.10 es evidencia moderada para rechazar H0
- Valor P >0.10 no hay evidencia para rechazar H0

Cabe mencionar que el uso del valor P, es cada vez mayor comparado con el uso del
nivel de significancia o el mtodo de la regin de rechazo.

Hoy en da, los investigadores se auxilian del software adecuado para el clculo del valor
P, incluso se realiza la prueba de hiptesis completamente en el programa (hay varios en
el mercado, el estudiante decidir cual se adecua a sus necesidades).

nicamente es necesario introducir los datos del problema para que en segundos el
programa arroje los resultados solicitados, incluyendo las grficas.
En seguida se ejemplificara el clculo del valor P, mediante el uso de software estadstico:

Ejemplo 6
El secretario de transporte de la Ciudad de Mxico desea saber el tiempo promedio en el
cual circulan los trenes del Sistema de Transporte colectivo Metro. Sus asesores le
aseguran que pasan 4 trenes (en promedio) cada 10 minutos. Se realiza un muestreo
estadstico anotando la cantidad de trenes que pasan efectivamente cada 10 minutos.
Los datos se muestran en la siguiente tabla.

Nm. de corrida (cada 10min) N de trenes que pasaron
1 9
2 4
3 3
4 5
5 3
6 2
7 1
8 7
9 3
10 9
11 5
12 0
13 2
Estadstica I
Unidad 3. Prueba de hiptesis

14 4
15 3
16 4
17 2
18 0
19 7
20 4
21 2
22 5
23 0
24 9
25 11
26 5
27 15
28 5
29 3
30 2

Se desea saber si se acepta o rechaza la opinin de sus asesores.

Solucin:
Los datos que se pueden extraer del texto son los siguientes:

=4 trenes, n=30, s=?, =?

Lo primero que se puede hacer es calcular los dos datos que nos faltan utilizando para
ello la muestra reportada, se har mediante el uso de software estadstico (el alumno
podr usar el de su preferencia).

Se obtienen los valores:
s=3.48131, =4.46667

El primer paso es plantear la hiptesis nula y la alterna:

H0: en efecto lo que aseguran los asesores es cierto, pasan 4 trenes cada diez minutos,
en promedio.

H
a
: la media que aseguran los asesores es diferente.
De tal forma que expresadas en forma matemtica se tiene:
H0:=4

Estadstica I
Unidad 3. Prueba de hiptesis

H
a
: = 4 prueba de dos colas.
Ahora se debe de definir el nivel de significancia .

Para este ejemplo se tomara un nivel de significacin del 0.05. =0.05.

Con ellos ya se tienen los datos para ser ingresados en el programa y realizar la prueba
de hiptesis.

El programa arroja los siguientes resultados:

Error
estndar
de la
Variable N Media Desv.Est. media IC de 95% Z P
carros 30 4.467 3.481 0.636 (3.221; 5.712) 0.73 0.463

El siguiente paso es tomar la decisin estadstica.

Dado que el P valor es mayor al valor de .
0.463 > 0.05

La prueba seala que no hay suficiente evidencia para rechazar la hiptesis H0,
Finalmente se concluye que como el P valor es mayor al valor de y no se rechaza la H0
el secretario de transporte debe tomar como cierto lo que le aseguran sus asesores.

Resumiendo, se puede decir que la prueba de hiptesis para la Media, usando el mtodo
del valor P, se realiza igual slo que ahora en lugar de comparar el valor del estadstico
obtenido en tablas (usando ) con el valor del estadstico calculado, simplemente se va a
comparar con el valor P.

En el siguiente apartado se aborda la prueba para dos Medias.


3.2.2. Para la comparacin de Medias

Ahora se ampliar la prueba para dos Medias. As que se tomarn dos muestras
aleatorias. Generalmente el tamao de las muestras es distinto. Sigue aplicndose el
criterio del Teorema Central de Lmite, es decir, muestras mayores a 30 tienden a la
distribucin normal. Se tiene entonces que las dos muestras siguen o se aproximan a la
distribucin normal.

La Prueba de Hiptesis para la diferencia entre dos medias poblacionales es muy usada
ya que es comn encontrarse con situaciones o problemas que requieran la comparacin
de sus Medias. Por ejemplo, si se desea evaluar la eficiencia de dos tipos diferentes de
Estadstica I
Unidad 3. Prueba de hiptesis

gasolinas, se pueden probar en una muestra de automviles idnticos y que operen bajo
las mismas condiciones, para saber cul de ellas presenta una mayor eficiencia
energtica.

Los pasos sugeridos para realizar la prueba son muy semejantes a los vistos para el caso
anterior y de igual forma se tienen los Mtodos del estadstico o Valor Critico de z, y el
mtodo del valor P.

Veamos en qu consisten:

1) Dado un problema, el primer paso sera plantear la hiptesis nula H0 de
acuerdo al texto.
Se acostumbra plantearla de la siguiente manera:
H0: (
1

2
) = D
0
Dnde:

D
0
= es la diferencia especifica que se desea probar, generalmente tiene un
valor de cero: D
0
=0
2) El segundo paso sera plantear la hiptesis alterna H
a
de acuerdo al texto.
Como se ha visto la H
a
puede tener tres posibilidades

H
a
: (
1

2
) > D
0

H
a
: (
1

2
) < D
0

H
a
: (
1

2
) = D
0


3) se debe definir el nivel de significancia .
4) Se debe obtener una estadstica de prueba.
Para este caso se trabajar con el estadstico:



ste es un valor que se calcula con base en la informacin de la muestra que es el
elemento que sirve para hacer el contraste pues permite la decisin de rechazar o no la
hiptesis nula.

Para el caso concreto de la diferencia de las Medias poblacionales se deben tomar en
cuenta varias consideraciones:

- Las muestras son seleccionadas al azar
- El tamao de las muestra es mayor a 30 (25 para algunos autores)
Estadstica I
Unidad 3. Prueba de hiptesis

- Las muestras son seleccionadas de manera independiente

5) Con base a los resultados obtenidos se debe tomar una decisin en torno a
la hiptesis planteada.

La hiptesis H0 se debe rechazar cuando:

El valor de este estadstico obtenido en tablas es el que se va a comparar con el valor del
estadstico de prueba (obtenido por medio de la frmula).

Si la prueba es de cola superior y el valor del estadstico de prueba es mayor al valor del
estadstico de tablas, entonces se est en la zona de rechazo y por tanto se rechaza la
hiptesis nula y se acepta la hiptesis alterna.

Si la prueba es de cola inferior entonces el valor del estadstico de prueba deber ser
menor al valor del estadstico de tablas, para rechazar la hiptesis nula y se acepta la
hiptesis alterna. Si se tiene una prueba de dos colas se aplican las dos consideraciones
anteriores para rechazar la hiptesis H0.

Para el caso de usar el Mtodo del valor P, la hiptesis H0 se va a rechazar cuando p<.

Por ltimo se han de sacar conclusiones.

Ejemplo 7

En una preparatoria se aplic el examen ENLACE. Para saber los resultados de sus
alumnos el Director del plantel desea realizar un estudio estadstico, por lo cual se
contrata al personal capacitado para que tome dos muestras aleatorias de estudiantes.

La primera muestra de 40 alumnos arroj un promedio de 55 con una desviacin Estndar
de 10. La segunda muestra fue de 30 alumnos con un promedio de 51 puntos y una
Desviacin Estndar de 9. Se desea saber si existe alguna diferencia entre las dos
muestras. El estudio se desea probar con un nivel de confianza del 95%.

Solucin:

Se va a resolver utilizando el Mtodo del Estadstico de Prueba.
Los datos que se obtienen del ejemplo son los siguientes:
Muestra1:
n
1
=40,
1
=10,

1
= SS

Muestra 2:
Estadstica I
Unidad 3. Prueba de hiptesis


n
2
=30,
2
=9,

2
= S1
Nivel de confianza (1-)= 95%

Con estos datos se procede a formular la Prueba de Hiptesis.

El primer paso es plantear la hiptesis nula y la alterna:
H0: no hay una diferencia considerable entre las Medias de las dos muestras.

En tanto que la hiptesis alternativa establece que las Medias de las dos muestras son
diferentes.
H
a
: las medias son diferentes

De tal forma que expresadas en forma matemtica se tiene:
H0:
1
=
2


H
a
:
1
=
2
es una prueba de dos colas.
Ahora se debe definir el nivel de significancia .
Para este ejemplo se tiene un nivel de confianza (1-)= 95%
Por lo que se tiene un nivel de confianza del 5% sea el 0.05
Como es una prueba de dos colas, se tiene
u
2
=0.025

En este problema se tiene el caso conocido como desviacin estndar (y por tanto la
Varianza) de la poblacin. Tambin el tamao de la muestra permite asumir la distribucin
como normal y por tanto utilizar el estadstico z. los datos los podemos verter en un
grfico de la distribucin normal para que se visualice mejor el problema. Se tiene
entonces:

Estadstica I
Unidad 3. Prueba de hiptesis

Con este valor de =0.05 (
u
2
=0.025). Se observa un rea del 47.5% sea 0.475 y con
este valor se busca en las tablas el valor de z (valor terico).

Encontrndose que z= 1.96. Lo que corresponde para z=-1.96.

En el Tercer paso se va a calcular el estadstico z para verificar si ste es mayor en valor
absoluto al del valor crtico z obtenido en tablas.
Vemoslo en un diagrama:


Pasemos a calcular la estadstica de prueba:
Dado que la hiptesis H0:
1
=
2

Entonces se tiene que (
1
=
2
)=0, Lo que implica que D
0
= 0
El estadstico de prueba utilizado para dos Medias considerando la distribucin normal se
simplifica como sigue:



Sustituyendo los siguientes valores
Muestra 1: n
1
=40,
1
=10,

Muestra 2:n
2
=30,
2
=9,

En la frmula, se tiene:
Estadstica I
Unidad 3. Prueba de hiptesis


Resolviendo la ecuacin se llega a:

Z
calculado
=
4
2.28
= 1.75

Z
calculado
=1.75

El siguiente paso es tomar la decisin estadstica.

Si - Z
tabulado
sZ
calculado
s +Z
tabulado
entonces el estadstico cae en la zona de no rechazo por
tanto no se rechaza la hiptesis nula.

Si al contrario, se rechaza la H0 y se acepta la H
a
.
se tiene:
-1.96 s 1.75 s 1.96

Por lo tanto el estadstico no cae en la regin de rechazo. As que no se rechaza la H0.No
es que se est aceptando H0,simplemente no hay evidencia suficiente para rechazarla
con un nivel de significacin del 5%.

Por ltimo se realiza la conclusin:
Los resultados de la prueba muestran que no hay una diferencia significativa entre las
Medias (al menos, no para =0.05), por lo tanto se toma ese promedio como vlido.

Nota: Aqu la cuestin sera hacer la prueba con otro nivel , para ver si al modificar su
valor se sale de la zona de no rechazo.


Estadstica I
Unidad 3. Prueba de hiptesis

Actividad 2. Hiptesis simple y compuesta

A travs de esta actividad determinars si una hiptesis es aceptada o rechazada ,
tomando en cuenta las definiciones utilizadas en el subtema.

Instrucciones: Mediante el uso de un software estadstico, realice una Prueba de
Hiptesis de dos colas y elija un =5%.

1. Descarga el documento llamado Actividad 2. Hiptesis simple y compuesta

2. Resuelve el problema que se presenta en el documento, siguiendo el contenido
visto en el subtema 3.2.2.

3. Guarda tu documento con la siguiente nomenclatura MEST1_U3_A2_XXYZ.
Recuerda sustituir las XX por las dos primeras letras de tu primer nombre, la Y
por la inicial de tu apellido paterno y la por la inicial de tu apellido materno.

4. Espera la retroalimentacin de tu facilitador (a)




3.3. Pruebas para las varianzas (muestras grandes)

En el punto anterior se revisaron las pruebas para la Media y diferencias de Media, ahora
se har lo mismo pero usando las Varianzas.

En la unidad uno se estudi las medidas de tendencia central y las de dispersin. Como
ya se haba mencionado anteriormente, las medidas de dispersin tambin se conocen
como medidas de variabilidad y se utilizan para establecer cmo es la variacin de los
datos respecto al valor central. Los conceptos ms relevantes son la Varianza y la
Desviacin tpica o estndar.

Recuerda que la Media es una medida de tendencia central y la Varianza es una medida
de dispersin. La Desviacin estndar es la raz cuadrada de la varianza y la razn de
esto es slo para darle consistencia de unidades, para que no fueran cuadrticas. Por lo
tanto se puede trabajar tanto con varianzas como con Desviaciones estndar.

Algunos autores consideran muestras grandes el valor de 30 otros dicen que con 25
datos de la muestra es suficiente.
Tambin es importante recordar que cuando el tamao de la muestra es menor a estos
valores, pero la poblacin original sigue una distribucin normal entonces la muestra
tambin sigue la tendencia normal. Pero si el tamao de muestra es menor a estos
Estadstica I
Unidad 3. Prueba de hiptesis

valores y la distribucin de la poblacin no sigue a la normal entonces no se puede
considerar la muestra como normal y ser necesario por lo tanto utilizar otros mtodos.

En este tema se abordaran dos casos: cuando solo se tiene una Varianza y donde se
trabaje con dos Varianzas.


3.3.1 Para la Varianza de una poblacin

Cuando se desea realizar una Prueba de hiptesis para una varianza, se analiza una
muestra de la poblacin y se calculan los intervalos de confianza para la Varianza
(tambin se puede hacer para la Desviacin estndar).

La prueba de hiptesis sobre una Varianza se puede usar para determinar si la Varianza
(o la Desviacin estndar) de una poblacin (cuyo valor se desconoce), es igual a un valor
especificado por el investigador.

Esta prueba es muy til en la industria, para determinar si la Varianza en la produccin es
diferente a un estndar de la empresa.

El estadstico que se ha usado en unidades previas como estimador de la Varianza es:
s
2
1
2 ) (
1

=
n
x xi f
n
i


Ahora bien en esta unidad se ha estado trabajando con la distribucin z. Si se desea
trabajar con una distribucin s
2
que est basada en un muestreo aleatorio de una
distribucin normal unos datos de varianza y media especificas sera muy complicado. Por
lo que se recurre a la estandarizacin al igual que se hizo con la distribucin z.

, El estadstico estandarizado es:


Se le llama ji cuadrada. Y genera una distribucin de muestreo llamada distribucin de
probabilidad ji cuadrada. ste ser el estadstico de prueba para la Varianza de una
poblacin.


Dnde:

(n-1)= grados de libertad, n=tamao de la muestra.
Estadstica I
Unidad 3. Prueba de hiptesis


Y la ecuacin de densidad genera el siguiente tipo de grfico

1. Nota que empieza en cero debido a que la Varianza no puede tener valores
negativos. as que los valores de X
2
son mayores o iguales que 0.

2. Como la forma de la distribucin depende de los grados de libertad, es decir, de n-
1, se tendrn infinitas posibilidades.

3. Al igual que la distribucin normal, en la distribucin ji cuadrada el rea total bajo
la curva es igual a 1 o bien se dice que representa el 100%.

4. Este tipo de distribuciones no son simtricas como lo es la distribucin normal. la
distribucin ji cuadrada es sesgada a la derecha.

Lo que interesa de ella son los valores crticos que se reportan en tablas (al igual que la
distribucin z)

Ahora bien, (al igual que se hizo para la Media) para realizar la prueba de hiptesis para
la Varianza de una poblacin se sugieren los siguientes pasos.
- Primero se debe plantear la hiptesis nula. Generalmente ser:

- Despus se propone la hiptesis alternativa que como ya es sabido puede
tener tres posibilidades (>, =,<), cola superior, cola inferior y dos colas.

- Se trabaja con el estadstico de prueba:

- Se toma una decisin.
-
-
De igual manera que con la Media se tienen dos mtodos

Mtodo del valor crtico (o estadstico de prueba)
Estadstica I
Unidad 3. Prueba de hiptesis


Se va a rechazar H0 cuando el valor absoluto de X
2
calculado
sea mayor al de tablas (para la
prueba de dos colas), o bien cuando el valor de X
2
calculado
sea mayor al de tablas (para la
prueba de cola superior), o bien cuando el valor de X
2
calculado
sea menor al de tablas (para
la prueba de cola inferior).

En seguida se ejemplifican grficamente los casos de cola superior y dos colas.



Mtodo del valor P.

Simplemente se rechaza la H0 si el valor p <. para el caso de una prueba de dos colas se
rechaza la H0 si el valor p <
u
2
.

- Finalmente se concluye:

Como habrs notado, es prcticamente el mismo procedimiento que se sigui en la
prueba para la Media.

Ejemplo 8

Una clnica de tratamiento de la obesidad promete a sus clientes una reduccin sustantiva
de peso en kilogramos al ao. El gerente del negocio estima que la reduccin de peso
prometida es cierta con una dispersin de =2.

Se realiza un estudio estadstico para saber si efectivamente los pacientes bajan
sustantivamente de peso. Para lo cual se tom una muestra de 40 pacientes y se
obtuvieron los siguientes resultados:
Una reduccin de peso promedio de 12.075 kg anuales, con una desviacin tpica de
1.845 kilogramos.

La pregunta es se debe aceptar como vlida la promesa de la clnica?

Estadstica I
Unidad 3. Prueba de hiptesis

Solucin:

Se resolver utilizando el Mtodo del valor P, y ser utilizado un software estadstico.
Los datos que se pueden extraer del texto son los siguientes:

=2, as que
2
=4, n=40, s=1.845kg, =12.075 kg

Con estos datos se procede entonces a formular la prueba de hiptesis.

- Primeramente se plantea la hiptesis nula y la alterna:
H0: en efecto la Media prometida por la clnica es igual a la Media poblacional

H
a
: la Media prometida por la clnica es diferente. En este caso por tratarse de reduccin
de peso a los clientes les interesa saber si es verdad o por el contrario es menor (si fuese
mayor a la prometida no habra inconveniente).
De tal forma que expresadas en forma matemtica se tiene:
H0:
2
=4

H
a
:
2
<4 prueba de cola inferior o a la izquierda.

- Se define el nivel de significancia .
Para este ejemplo se tomar un nivel de significacin del 0.05. =5%.
Por lo que se tiene un nivel de confianza del 0.95 sea el 95%.

- Con los datos obtenidos anteriormente se ingresa al programa y realiza la prueba
de hiptesis.

- El programa arroja los siguientes resultados:

Estadsticas

N Desv.Est. Varianza
40 1.85 3.40


95% Intervalos de confianza unilaterales

Lmite Lmite
superiorsuperior
para Mtodo Desv.Est. varianza
Chi-cuadrada 2.27 5.17


Pruebas

Estadstica
Estadstica I
Unidad 3. Prueba de hiptesis

Mtodo de prueba GL Valor P
Chi-cuadrada 33.19 39 0.269

- Se toma la decisin estadstica.
Dado que el P valor es mayor al valor de .
0.269 > 0.05

Conclusin

La prueba seala que no hay suficiente evidencia para rechazar la hiptesis H0
Finalmente se concluye que como P valor es mayor al valor de y no se rechaza la H0 los
clientes de la clnica deben tomar como cierto lo que le asegura el gerente de la empresa.


3.3.2.Para la comparacin de Varianzas

Para hacer inferencias sobre la igualdad de las Desviaciones estndar o varianzas entre
dos poblaciones, basadas en muestras independientes y aleatorias, se recurre a los
procedimientos de prueba e intervalo de confianza de dos. En la prueba de hiptesis para
la comparacin de varianzas se recurre a la razn de varianzas muestrales:
2
1
2
2
s
s


Esta relacin tiene una distribucin de distribucin de probabilidad que en estadstica se
conoce como distribucin F. la grfica tpica para una distribucin F es la siguiente:


Al igual que en el caso de una Varianza se tiene que:
(n-1)= grados de libertad, n=tamao de la muestra.


Para que se asuma que la relacin de las Varianzas mustrales presente una distribucin
F, se debe de tener en cuenta que las muestras aleatorias debern ser independientes y
se obtendrn de cada una de dos poblaciones normales. Adems la variabilidad de las
Estadstica I
Unidad 3. Prueba de hiptesis

mediciones en las poblaciones deber ser idntica y por lo tanto podr ser medida con
una varianza comn. Esto es:

2
=
1
2
=
2
2


La prueba de hiptesis se realiza bsicamente en forma idntica que para la de una
varianza solo cambia el estadstico ji-cuadrada por el estadstico F.

- Primero se debe plantear la Hiptesis nula. Generalmente ser:


- Despus se propone la hiptesis alternativa que como ya es sabido puede
tener tres posibilidades (>,<,=), ya sea que se trate de una cola o de dos
colas.

- Se trabaja con el estadstico de prueba

Donde la Varianza muestral ms grande es:

- Se toma una decisin. De igual manera que con la Media se tienen dos
mtodos

Para el Mtodo del valor crtico (o estadstico de prueba)
Se va a rechazar H0 cuando el valor de F > F

(para una cola)


Y Se va a rechazar H0 cuando el valor de F > F 2 (para dos colas)
Para el mtodo del valor P.
Simplemente se rechaza la H0 si el valor p <.
-
- Finalmente se concluye que:



Ejemplo 9

Al realizar un estudio sobre una poblacin estudiantil, se tomaron dos muestras. Las
cuales arrojaron los siguientes datos:

Muestra1:
muestra n Desviacin. Estndar.
Estadstica I
Unidad 3. Prueba de hiptesis

1 42 1.96

Muestra 2:
muestra n Desviacin Estndar.
2 32 2.13

Realice una Prueba de Hiptesis utilizando un software estadstico.

Solucin:
Se resolver utilizando el Mtodo del valor P, y ser utilizado un software estadstico.
Los datos son suficientes para realizar la prueba, recuerda que aunque no se tenga el
dato de la varianza como sta es el cuadrado de la desviacin estndar los programas
estadsticos trabajan de manera idntica, ya sea que se ingrese el dato de la varianza o el
de la desviacin estndar.

Con los datos se procede a formular la prueba de hiptesis.

El primer paso es plantear la hiptesis nula y la alterna:
De tal forma que expresadas en forma matemtica se tiene:
H0:
H
a
:

Es una prueba de dos colas.

Ahora se debe de definir el nivel de significancia .
Para este ejemplo se tomar un nivel de significacin del 0.05. =5%.
Por lo que se tiene un nivel de confianza del 0.95, es decir, el 95%.
Con ellos ya se tienen los datos para ser ingresados en el programa y realizar la Prueba
de Hiptesis.

El programa arroja los siguientes resultados:



Prueba de IC para dos varianzas

* NOTA * Las grficas que no sean de intervalos no se pueden crear con
datos resumidos.


Mtodo

Estadstica I
Unidad 3. Prueba de hiptesis

Hiptesis nula Sigma(1) / Sigma(2) = 1
Hiptesis alterna Sigma(1) / Sigma(2) not = 1
Nivel de significancia Alfa = 0,05


Estadsticas

Muestra N Desv.Est. Varianza
1 42 1.960 3.842
2 32 2.130 4.537

Relacin de deviaciones estndar = 0.920
Relacin de varianzas = 0.847


Intervalos de confianza de 95%

IC para IC para
Distribucin relacin de relacin de
de los datos Desv.Est. varianza
Normal (0.653; 1,277) (0.426; 1.630)


Pruebas

Estadstica
Mtodo GL1 GL2 de prueba Valor P
Prueba F (normal) 41 31 0.85 0.611

El siguiente paso es tomar la decisin estadstica.

Dado que el P valor es mayor al valor de .
0.611 > 0.05
La prueba seala que no hay suficiente evidencia para rechazar la hiptesis H0
Finalmente se concluye que como el P es mayor al valor de no se rechaza la hiptesis
nula H0.

Nota: para todos los ejemplos se ha utilizado el software estadstico minitab16. (El
estudiante puede hacer uso del software que guste)


Estadstica I
Unidad 3. Prueba de hiptesis

Actividad 3. Prueba de Hiptesis para la media y para las desviaciones

A travs de esta actividad podrs realizar una Prueba de Hiptesis donde se involucre la
Media.

Instrucciones: Utiliza las definiciones del subtema anterior y aplcalo en la actividad,
mediante el uso del software estadstico (lenguaje R, u otro que conozcas), realiza la
prueba de hiptesis con un =5%

1. Descarga el documento llamado Actividad 3.Prueba de hiptesis para la Media

2. Resuelve el problema que se presenta en el documento, siguiendo el
contenido visto en el tema Prueba de Hiptesis para la media

3. Guarda tu documento con la siguiente nomenclatura MEST1_U3_A3_XXYZ.
Recuerda sustituir las XX por las dos primeras letras de tu primer nombre, la Y
por la inicial de tu apellido paterno y la por la inicial de tu apellido materno.

4. Espera la retroalimentacin de tu Facilitador (a)






3.4 Potencia de la Prueba

Hasta este momento has revisado conceptos como hiptesis nula, hiptesis alternativa,
los tipos de errores I y II. En este ltimo tema retomars esos conceptos para poder
entender lo que es la potencia de la prueba.

La potencia de una prueba se puede definir como la probabilidad de rechazar la hiptesis
nula cuando sta se debe rechazar. Esto quiere decir que la hiptesis nula es falsa y la
hiptesis alternativa es verdadera. En otras palabras, se dira que:

La potencia de la prueba es la probabilidad de rechazar correctamente una hiptesis nula
cuando sta es falsa.

Para poner la definicin en trminos matemticos es necesario recordar los tipos de
errores. En el primer tema de esta unidad se estudi en qu consiste el error del tipo I:
Rechazar la hiptesis nula cuando sta no se debe rechazar. La probabilidad de cometer
este tipo de error se conoce como y el error de tipo II es:

Estadstica I
Unidad 3. Prueba de hiptesis

No rechazar la hiptesis nula cuando s se debe de rechazar. La probabilidad de cometer
este tipo de error se conoce como .

Tanto como , pueden ser expresados en trminos de probabilidad. As se tiene que:
= la probabilidad de rechazar H
0
cuando H
0
es verdadera (error tipo I)
= la probabilidad de no rechazar H
0
cuando H
0
es falsa (error tipo II)

Considerando lo anterior, procedamos a definir la potencia de la prueba como:

Potencia= P (rechazar la hiptesis nula, H
0
cuando sta se debe rechazar)
Esta expresin tambin se puede poner en trminos del complemento, es decir:
Potencia= 1- P (no rechazar la hiptesis nula, H
0
cuando sta se debe rechazar)

En trminos del error se puede expresar como:
Potencia= 1- P (cometer error tipo II)
Potencia =1-

sta sera la expresin ms comn para la potencia de la prueba. Cabe sealar que la
potencia de la prueba es un concepto muy importante dado que es un indicador de la
cantidad de veces que se debe rechazar la hiptesis nula.

Finalmente, cabe sealar que la potencia de la prueba es una medida de la sensibilidad
de una prueba estadstica.


3.4.1 Lema de Neyman Pearson

En los temas anteriores se ha trabajado con ejemplos practicos sobre la prueba de
hiptesis, se han abordado varios casos sobre el contraste y sugerido algunas
actividades. Ahora se tratarn temas dentro del campo de lo terico, dicho lo anterior
pasemos a definir el Llema de Neyman- Pearson.

Encierto sentido se puede decir que este lema es el primer teorema de clase de decisin
completa.

El lema de Neyman demuestra que la prueba ptima para realizar un contraste de
hiptesis simples, es decir:
0 0
: u u e H
y
a a
H u u e : , consiste ante todo en la
comparacin del cociente de verosimilitudes con un umbral.

Tambin hay que mencionar que el lema, si bien proporciona siempre la mejor regin
crtica, no siempre porporciona la regin uniformemente ms potente (UMP), por ejemplo,
en las pruebas de hiptesis simples como:
0 0
: u u = H contra
0
: u u =
a
H
Estadstica I
Unidad 3. Prueba de hiptesis



3.4.2 Funcin Potencia

La potencia se defini como la probabilidad de que en una prueba de hiptesis se
rechace la hiptesis H0 siendo sta falsa, es decir, que se haya tomado la decisin
correcta.

Ya se mencion que la potencia es igual a 1-, y sabemos que es la probabilidad de
cometer el error tipo II. A medida que aumenta disminuye por lo tanto la potencia
aumenta.

Pero si aumenta tambin aumenta la probabilidad de cometer el error tipo I.

La prueba ms potente es aquella que optimiza la y la potencia de la prueba. Es decir
encontrar una combinacin ptima con y .

En seguida se sealan los factores ms importantes que afectan a la potencia:.
- El primer factor es el tamao de la muestra. cabe sealar que es conveniente
tomar muestras grandes, porque al aumentar el tamao muestral se va a obtener
informacin ms cercana de la poblacin, as que a muestras grandes, aumenta la
potencia.
- El segundo factor importante es el valor de (error tipo I), ya que a mayor valor
ser ms probable rechazar la hiptesis nula.
- El tercero considera que la variabilidad de la poblacin afecta a la potencia.
Cuando se tienen valores de pequeos aumenta la potencia, porque es ms fcil
detectar una diferencia.
- El cuarto, factor es la similitud (o no similitud) entre las poblaciones. Entre ms
similares son las poblaciones es ms difcil detectar una diferencia, as que la
potencia ser menor.

De acuerdo a estos factores se puede comentar que si se desea hacer una prueba, por
ejemplo, para comparar dos medicamentos en el mercado (los de patente y los llamados
genricos intercambiables) y detectar las diferencias entre ellos. Si los investigadores
desean aumentar la potencia de la prueba debern incrementar el tamao del muestreo,
para de este modo obtener ms informacin en torno a la poblacin. Tambin se
recomienda implementar buenas tcnicas de muestreo para que disminuya la Varianza
de error.

En seguida se utilizarn dos figuras para mostrar la prueba de hiptesis y su potencia.

Estadstica I
Unidad 3. Prueba de hiptesis

Se ha graficado la funcin de densidad para la H0 cuya altura media es
0
u . A la derecha se
ha graficado la distribucin de la
a
H y R.C es la regin crtica (est integrada por los
valores mayores al punto A).

El error tipo I (la probabilidad de rechazar H0 siendo cierta) o el nivel de significancia , es
la parte sombreada de la figura anterior.

El error tipo II (la probabilidad de no rechazar la H0 siendo falsa) es decir el valor , es la
cola rayada de la curva de la derecha de la siguiente figura.

La potencia (1-) est representada por la parte sombreada de la curva de la derecha de
la siguiente figura.

La decisin de rechazar H0 sucede cuando se obtiene un resultado mayor al punto A, pero
si es menor no se podr rechazar.

Con esto queda claro que la potencia y el nivel de significacin en una prueba de
hiptesis no son independientes. Lo que todo investigador quisiera es tener un mnimo
valor de y un mximo valor de potencia, pero esto no se puede lograr porque no son
independientes as que si disminuye tambin se reduce la potencia de la prueba.

sta es una forma de calcular la potencia de una prueba, de manera un tanto manual.
Actualmente en la era digital, slo hay que elegir el software adecuado, introducir los
datos, y analizar los resultados arrojados por el programa. En el mercado hay varios
paquetes de anlisis estadstico entre los que se pueden mencionar: Excel (la hoja de
clculo de Microsoft), minitab, spss, statgraphics, entre muchos otros.
Estadstica I
Unidad 3. Prueba de hiptesis

Cuando se tiene:
0 0
: u u = H contra
0
: u u =
a
H


Y se ha fijado un valor para . entonces la potencia de la prueba ya no tiene un valor
nico, dado que para cada valor de
0
u u = se tendr una distribucin alterna, y por lo
tanto una potencia,, ms bien una funcin potencia.

Se llama potencia de la prueba a la probabilidad de rechazar la hiptesis nula cuando
sta es falsa (cuando las hiptesis son simples), y se le llamar funcin potencia cuando
las hiptesis sean compuestas.



3.4.3 Prueba uniformemente ms potente

La prueba ms potente es aquella que optimiza la y la potencia de la prueba. La prueba
uniformemente ms potente, es la generalizacin de este hecho. Es decir, cuando se
tiene una prueba (o contraste) del tamao del nivel de significacin , y si este contraste
maximiza la potencia para todas las alternativas de la hiptesis alterna
a
H (Es decir para
todos los posibles valores del parmetro
a
) se dice que es un contraste (o una
prueba) uniformemente ms potente y se abrevia como UMP.

Donde:
= espacio paramtrico

0
,
a
= dos conjuntos disjuntos cuya unin es . El conjunto
0
es la particin de
asociada a H0 (en otras palabras contiene todos los posibles valores que puede tomar el
parmetro bajo la hiptesis nula) en tanto que
a
es la particin de asociada a H
a
.
= es un parmetro desconocido cualquiera.


Autoevaluacin

Es momento de realizar la Autoevaluacin, para ello sigue las instrucciones,
respondiendo a cada uno de los reactivos que se presentan.

Instrucciones: Lee detenidamente el problema y elige la respuesta que corresponda al
reactivo planteado a continuacin.

El secretario de transporte de la Ciudad de Mxico desea saber el tiempo promedio en el
cual circulan los trenes del Sistema de Transporte Colectivo Metro. Sus asesores le
aseguran que pasan 3 trenes (en promedio) cada 10 minutos.

Estadstica I
Unidad 3. Prueba de hiptesis

Se realiza un muestreo estadstico anotando la cantidad de trenes que pasan
efectivamente cada 10 minutos. Los resultados fueron un promedio de 4.5 trenes con una
= 3. Mediante el uso del software de su preferencia contesta lo que se te pide.

1. Para una prueba de dos colas con =5% Se rechazara H
0
?
a) S se rechaza porque p = 0.043 p <
b) S se rechaza porque p = 0.033 p <
c) S se rechaza porque p = 0.003 p <
d) No se rechaza porque p = 0.063 p >

2. Para una prueba de cola superior con =5% Se rechazara H
0
?

a) S se rechaza porque p = 0.005 p <
b) S se rechaza porque p = 0.023 p <
c) No se rechaza porque p = 0.013 p >
d) S se rechaza porque p = 0.002 p <

3. Para una prueba de cola inferior con =5% Se rechazara H
0
?
a) No se rechaza porque p = 0.998 p >
b) S se rechaza porque p = 0.043 p <
c) No se rechaza porque p = 0.533 p >
d) No se rechaza porque p = 0.063 p >

4. Para una prueba de dos colas con =10% Se rechazara H
0
?
a) Si se rechaza porque p = 0.043 p <
b) S se rechaza porque p = 0.003 p <
c) No se rechaza porque p = 0.533 p >
d) No se rechaza porque p = 0.063 p >

5. Para una prueba de cola inferior con =10% Se rechazara H
0
?
a) No se rechaza porque p = 0.998 p >
b) S se rechaza porque p = 0.043 p <
c) No se rechaza porque p = 0.533 p >
d) No se rechaza porque p = 0.063 p >


Para comparar tus respuestas revisa el documento Respuestas_autoevaluacin_U3,
ubicada en la pestaa de Material de Apoyo.


RETROALIMENTACIN

1-3 aciertos. Los conocimientos obtenidos no fueron suficientes, debes revisar
nuevamente el contenido de la unidad.
Estadstica I
Unidad 3. Prueba de hiptesis





Autorreflexiones

- Ejercicio de interiorizacin que te permite tomar conciencia de tus procesos de
aprendizaje, identificarlo y monitorearlo para regularlo y favorecer el desarrollo de la
habilidad autorreflexiva que enriquezca tu formacin y contribuya a tu crecimiento como
ser humano.

- Preguntas de Autorreflexin al final de cada unidad, elaboradas por los Facilitadores.



Cierre de la unidad

A lo largo de estas tres unidades se han expuesto los temas ms importantes de la
Estadstica.

En la unidad uno se revisaron los conceptos de la Estadstica Descriptiva que son la base
de todo estudio e investigacin estadstico: la Media, la desviacin estndar la varianza,
4-5 aciertos. Tienes un conocimiento claro del contenido de la unidad, sigue adelante!


Evidencia de Aprendizaje. Prueba de Hiptesis

Mediante esta actividad, podrs aplicar todos los conocimientos adquiridos en la unidad.
Utilizando la Prueba de Hiptesis de dos colas para las Varianza.

Instrucciones: Utiliza la prueba de hiptesis de dos colas para la varianza, puedes
utilizar algn programa estadstico para determinar la solucin.

1. Descarga el documento llamado EA. Prueba de hiptesis

2. Resuelve el problema que se plantea siguiendo los requisitos que se solicitan.

3. Guarda tu documento con la siguiente nomenclatura MEST1_U3_EA_XXYZ
Recuerda sustituir las XX por las dos primeras letras de tu primer nombre, la Y
por la inicial de tu apellido paterno y la Z por la inicial de tu apellido materno.

4. Enva el documento a tu Facilitador (a) mediante la herramienta de
Portafolio de Evidencias. Y espera su retroalimentacin.
Estadstica I
Unidad 3. Prueba de hiptesis

entre otros.

En la unidad dos se abordaron la Distribucin normal, el Teorema del Lmite Central y los
intervalos de confianza, que son el soporte para un buen entendimiento de las pruebas de
hiptesis vista en la presente unidad. As, hay un hilo conductor que recorre las tres
unidades.

Las pruebas estadsticas aprendidas en esta unidad son de suma importancia. Se
recomienda al estudiante, revisar los temas de las unidades cuantas veces sea necesario
hasta tener dominio sobre ellos, dado que, como ya se coment, son los pilares para
cualquier estudio posterior.


Para saber ms

La Estadstica es un campo muy amplio como para abarcarlo todo en un curso como este.
Existen muchas variantes sobre el tema que pueden interesar al alumno avanzado. En la
siguiente liga se exponen las variantes mencionadas.

http://personal.us.es/vmanzano/docencia/analisis/ejer/ProblemasDecision.pdf

Fuentes de consulta

Kuby, J. (2012). Estadstica elemental. Mxico: Cengage.
Ojer, L. (1990). Estadstica bsica. Madrid: Dossat.
Huntsberger, D. (1983). Elementos de Estadstica Inferencial. Espaa: Continental.