You are on page 1of 36

ESTADISTICA II

PROFESOR WALTER LOPEZ


Estadistica Inferencial: Estimacin para una y dos poblaciones. Medias y
Proporciones.
Definicin de estimacin

Cuando hemos observado un valor numrico especfico de nuestro estimador,


nos referimos a ese valor como una estimacin. En otras palabras, una
estimacin es un valor especfico observado de una estadstica. Hacemos una
estimacin si tomamos una muestra y calculamos el valor que toma nuestro
estimador en esa muestra. Suponga que calculamos la lectura media de un
odmetro (kilometraje) a partir de una muestra de taxis en sevicio y encontramos
que sta es de 160,000 kilmetros. Si utilizamos este valor especfico para
estimar el kilometraje de la flotilla de taxis completa, el valor obtenido de 160,000
kilmetros sera una estimacin. En la tabla 9 ilustramos varias poblaciones,
parmetros de poblacin, estimadores y estimaciones.

Estimador sesgado e insesgado.


Un estimador puntual es el valor numrico de una estadstica muestral empleado
para estimar el valor de un parmetro de la poblacin o proceso. Una de las
caractersticas ms importantes de un estimador es que sea insesgado. Un
estimador insesgado es una estadstica muestral cuyo valor esperado es igual al
parmetro por estimar. Un valor esperado es el promedio a largo plazo de la
estadstica muestral. La eliminacin de todo sesgo sistemtico est asegurada
cuando la estadstica muestral corresponde a una muestra aleatoria tomada de

ESTADISTICA II
PROFESOR WALTER LOPEZ
una poblacin o a un subgrupo racional tomado de un proceso. Ambos mtodos
de muestreo garantizan que la muestra sea insesgada, aunque no eliminan la
variabilidad del muestreo, o error de muestreo, como se explicar en la siguiente
seccin.

En la tabla 10 se presentan algunos de los estimadores puntuales de parmetros


de la poblacin de uso ms frecuente. En todos los casos, el estimador
apropiado de un parmetro de la poblacin es sencillamente la estadstica
muestral correspondiente.

Tabla 10

Una o Dos poblaciones


Intervalos de confianza para la diferencia entre dos medias con el uso de la
distribucin normal

ESTADISTICA II
PROFESOR WALTER LOPEZ

A menudo es necesario estimar la diferencia entre dos medias poblacionales,


como la diferencia entre los niveles salariales de dos empresas. El estimador
puntual insesgado de (1 - 2) CS (1- 2). El intervalo de confianza se elabora
en forma similar al usado para la estimacin de la media, excepto que el error
estndar pertinente para la distribucin de muestreo es el error estndar de la
diferencia entre medias. El uso de la distribucin normal se basa en las mismas
condiciones que en el caso de la distribucin de muestreo de la media, salvo que
estn implicadas dos muestras. La frmula empleada para estimar la diferencia
entre dos medias poblacionales con intervalos de confianza es

Cuando se conocen las desviaciones estndar de las dos poblaciones, el error


estndar de la diferencia entre medias es

Cuando se desconocen las desviaciones estndar de las poblaciones, el error


estndar estimado de la diferencia entre medias dado el uso apropiado de la
distribucin normal es

ESTADISTICA II
PROFESOR WALTER LOPEZ
Los valores de los errores estndar de las respectivas medias incluidos en estas
frmulas se calculan con las frmulas dadas, incluida la posibilidad de usar
factores de correccin por finitud cuando corresponda

Ejemplo. El salario medio semanal de una muestra de n = 30 empleados de una


gran empresa manufacturera es, = $280.00, con una desviacin estndar
muestral de s = $14.00. En otra gran empresa, una muestra aleatoria de n = 40
empleados por hora tiene un salario medio semanal de $270.00, con una
desviacin estndar muestral de s = $10.00. El intervalo de confianza de 99%
para la estimacin de la diferencia entre los niveles salariales medios semanales
de las dos empresas es

donde

ESTADISTICA II
PROFESOR WALTER LOPEZ
As, podemos afirmar que el salario promedio semanal de la primera empresa es
mayor que el promedio de la segunda Empresa por un monto de entre $2.23 y
$17.77, con una confianza de 99% en esta estimacin por intervalo. Advirtase
que los - tamaos de las muestras son suficientemente grandes para permitir el
uso de Z para aproximar el valor t.

Adems del intervalo de confianza de dos extremos, tambin puede elaborarse


un intervalo de confianza de un extremo -ara la diferencia entre medias.

Distribucin t e intervalos de confianza para la diferencia entre dos medias

El uso de la distribucin t en conjuncin con una muestra es necesario cuando

1 ) Se desconocen las desviaciones estndar a de la poblacin.

2) Las muestras son pequeas (n < 30). Si las muestras son grandes, los valores
t pueden ser aproximados por la normal estndar z.

3) Se supone que las poblaciones tienen una distribucin aproximadamente


normal (recuerde que el teorema central del lmite no puede aplicarse en
muestras pequeas).

ESTADISTICA II
PROFESOR WALTER LOPEZ
Adems de lo anterior, cuando se usa la distribucin t para definir intervalos de
confianza para la diferencia entre dos medias, no para inferencias sobre slo
una media poblacional, por lo general se requiere del siguiente supuesto
adicional:

4) Las dos varianzas poblacionales (desconocidas) son iguales, a 21 = 22

A causa del anterior supuesto de igualdad, el primer paso para determinar el


error estndar de la diferencia entre medias cuando procede el uso de la
distribucin t es combinar las dos varianzas muestrales:

El error estndar de la diferencia entre muestras basado en el uso de la varianza


combinada estimada 2 es

Con gl = n1, + n2 - 2, el intervalo de confianza es

Intervalos de confianza para la proporcin de la poblacin

ESTADISTICA II
PROFESOR WALTER LOPEZ

La distribucin de probabilidad aplicable a las proporciones es la distribucin


binormial de probabilidad. No obstante, los clculos matemticos asociados con
la determinacin de un intervalo de confianza para una proporcin poblacional
desconocida con base en el proceso de Bemoulli son complejos. Por lo tanto, en
todos los libros de texto orientados a aplicaciones se utiliza la distribucin normal
como aproximacin de la solucin exacta de intervalos de confianza para
proporciones. Esta aproximacin es adecuada cuando n 30 y tanto np como
nq 5 (donde q = 1 - p). Sin embargo, cuando la proporcin de la poblacin p
(o ) es desconocida, la mayora de los expertos en estadstica recomienda
tomar una muestra de n 100. Ntese que, en el contexto de la estimacin
estadstica, es desconocida, pero es estimada por ^p.

La varianza de la distribucin de proporciones sirve de base para el error


estndar. Dada una proporcin muestral observada, ^p, el error estndar de la
proporcin estimado es

En el contexto de la estimacin estadstica, la p (o ) de la poblacin se


desconoce, porque es justamente el valor por estimar. Si la poblacin es por
finitud, procede el uso del factor de correccin por finitud. Como en el caso del
error estndar de la media, por lo general se considera innecesario el uso de
esta correccin si n < 0.05 N.

ESTADISTICA II
PROFESOR WALTER LOPEZ

El intervalo de confianza aproximado para una proporcin poblacional es

Adems del intervalo de confianza de dos extremos, tambin puede


determinarse un intervalo de confianza de un extremo para la proporcin
poblacional.

Ejemplo. Una empresa de investigacin de mercado contacta a una muestra


aleatoria de 100 varones en una comunidad extensa y determina que una
proporcin muestral de 0.40 prefiere las navajas de afeitar fabricadas por el
cliente de esa empresa sobre todas las dems marcas. El intervalo de confianza
de 95% para la proporcin de todos los varones de la comunidad que prefieren
las navajas de afeitar del cliente de la empresa se determina de la siguiente
manera:

Por lo tanto, con una confianza de 95% estimamos la proporcin de todos los
varones de la comunidad que prefieren las navajas del cliente de la empresa con
un valor entre 0.30 y 0.50.

ESTADISTICA II
PROFESOR WALTER LOPEZ
Medias y proporciones
Estimacin de Parmetros
La teora de muestreo puede emplearse para obtener informacin acerca de
muestras obtenidas aleatoriamente de una poblacin conocida. Sin embargo,
desde un punto de vista prctico, suele ser ms importante y ser capaz de inferir
informacin acerca de una poblacin a partir de muestras de ellas. Dichos
problemas son tratados por la inferencia estadstica que utiliza principios de
muestreo. Un problema importante de la inferencia estadstica es la estimacin
de parmetros poblacionales o simplemente parmetros (como la media y la
varianza poblacionales), a partir de los estadsticos mustrales correspondientes
o estadsticos ( como la media y la varianza muestral.
Estimados sin Sesgo
Si la media de la distribucin muestral de un estadstico es igual al parmetro
poblacional correspondiente, el estadstico se denomina estimador sin sesgo del
parmetro; de otra manera, es denominado estimador sesgado. Los valores
correspondientes de dichos estadsticos se llaman estimados sin sesgo o
sesgados, respectivamente.
1.- La media de la distribucin muestral de las medias es x , la media
poblacional. Por lo tanto, la media muestral x es un estimado sin sesgo de la
media poblacional .

ESTADISTICA II
PROFESOR WALTER LOPEZ
2.- La media de la distribucin muestral de las varianzas es :
s2 = ( N-1/ N ) 2
donde 2 es la varianza poblacional y N es el tamao de la muestra .Entonces, la
varianza muestral s2 es un estimado sesgado de la varianza poblacional 2.
Usando la varianza modificada.
2 =( N/ N-1 )s2
Se encuentra que 2 = 2 , de modo que 2 es un estimado sin sesgo de 2 .Sin
embargo es un estimado de .En trminos de esperanza matemtica se poda
decir que un estadstico no esta sesgado si su esperanza es igual al parmetro
poblacional correspondiente. Por lo tanto, x y 2 no estn sesgados , porque E
Estimados Eficientes
Si las distribuciones mustrales de dos estadsticos tienen la misma media o
esperanza matemtica entonces el estadstico con la menor varianza se
denomina estimador eficiente de la media, mientras que el otro estadstico se le
llama estimador ineficiente. Los valores correspondientes de los estadsticos se
conocen, respectivamente, como estimadores eficientes. Si se consideran todos
los estadsticos posibles, cuyas distribuciones mustrales tienen la misma
media, aquel con la menor varianza suele denominarse el mejor o mas eficiente
estimador de dicha media.

10

ESTADISTICA II
PROFESOR WALTER LOPEZ
La distribucin muestral de la media y la mediana tienen la misma media; a
saber la media poblacional. Sin embargo, la varianza de la distribucin muestral
de las medias es mas pequea que la varianza de la distribucin muestral de las
medianas por lo tanto, la media muestral ofrece un estimado ineficiente de esta
De todos los estadsticos que estiman la media poblacional, la media muestral
ofrece el mejor o mas eficiente estimado. En la practica, suelen usarse los
estimados ineficientes debido a la relativa facilidad con que se obtienen algunos
de ellos.
Estimados por Punto y Estimados por Intervalo; su Confiabilidad
El estimado de un parmetro poblacional dado por un solo nmero se denomina
estimado puntual del parmetro. El estimado de un parmetro poblacional dado
por dos nmeros, entre los cuales se considera esta el parmetro, se denomina
estimado por intervalo del parmetro. Los estimados por intervalo indican la
precisin de un estimado y son, por lo tanto preferibles a los estimados por
punto.
Ejemplo: Si se dice que una distancia medida es de 5.28 metros se esta dando
un estimado por punto. Si por otro lado, la distancia es de 5.28 mas menos
0.03metros ( es decir , la distancia esta entre 5.25m y 5.31 m ) , se esta dando
un estimado por intervalo .
La informacin sobre el error o precisin de un estimado se conoce como
confiabilidad.

11

ESTADISTICA II
PROFESOR WALTER LOPEZ
Estimados por Intervalo de Confianza de Parmetros Poblacionales
Sean s y s la media y la desviacin estndar (error estndar), en ese orden, de
la distribucin muestral de un estadstico S. Entonces, si la distribucin muestral
de S es en formas aproximadas a la normal ( lo cual es verdadero para muchos
estadsticos si el tamao de la muestra es N mayor o menor que 30.

Intervalos de Confianza para Medias


Si el estadstico S es la media muestral x, entonces los limites de confianza de
95% y 99% para estimar la media poblacional estn dados por x mas menos
1.96 x y 2.50x respectivamente. De manera mas general , los limites de
confianza estn dados por x zc x donde zc que depende del nivel particular de
confianza deseado , usando los valores de x obtenidos se ve que los limites de
confianza para la media poblacional estn dados por :
X Zc /
si el muestreo se lleva a cabo a partir de una poblacin infinita o de una
poblacin finita con reemplazamiento y estn dados por :
X Zc /

12

ESTADISTICA II
PROFESOR WALTER LOPEZ
si el muestreo se realizo sin reempalzamiento de una poblacin de tamao finito
Np . generalmente , la desviacin estndar poblacional es desconocida ; por
consiguiente , para obtener los limites de confianza anteriores, se utiliza la
estimacin muestral o s .Esta mostrara ser satisfactoria cuando N se mayor o
menor que 30 para N menor que 30 , la aproximacin es pobre y se debe usar la
teora de pequeas muestras .
Intervalos de Confianza para Proporciones
Si el estadstico S es la proporcin de xitos en una muestra de tamao,
obtenida de una poblacin binomial en la que p es la proporcin de xitos es
decir la probabilidad de xito, entonces los limites de confianza para p estn
dados por la proporcin de xitos en la muestra de tamao N. Usando los
valores de p obtenidos, ve que los limites de confianza para la proporcin
poblacional estn dados por:
P Zc
Si el muestreo se efectu de una poblacin finita o de una poblacin infinita con
reemplazamiento y estn dados por:
P Zc
Si el muestreo se hizo sin el reemplazamiento de una poblacin de tamao finito
Np. Para calcular estos limites de confianza se puede usar el estimado muestral
P que por lo general, mostrara ser satisfactorio si N es mayor o igual a 30.

13

ESTADISTICA II
PROFESOR WALTER LOPEZ
Intervalos de Confianza para Diferencias y Sumas
Si S1 y S2 son dos estadsticos mustrales con distribuciones de muestreo
aproximadamente normales, entonces los limites de confianza se puede usar
para la diferencia de los parmetros poblacionales correspondientes a S1 y S2
estn dados por:
S1 y S2 zc s1 - s2
Intervalos de Confianza para Desviaciones Estndar
Los limites de confianza para la desviacin estndar de una poblacin
normalmente distribuida, estimados a partir de una muestra con desviacin
estndar s, estn dados por :
S + - Zc s = s Zc /
Para calcular estos limites de confianza se utiliza s o para estimar
Error Probable
Los limites de confianza de 50% de los parmetros poblacionales
correspondientes al estadstico S dados por S + - 0.675 s la cantidad de 0.675 s
es conocida como error probable de la estimacin.
7. Estadistica inferencial: Prueba de Hiptesis= introduccin, tipos de
error, prueba de hiptesis en una poblacin y dos poblaciones.

14

ESTADISTICA II
PROFESOR WALTER LOPEZ
Pruebas de hiptesis

El propsito de la prueba de hiptesis es determinar si el valor supuesto


(hipottico) de un parmetro poblacional, como la media de la poblacin, debe
aceptarse como verosmil con base en evidencias muestrales. Recurdese que
sobre distribuciones de muestreo, se dijo que, en general, una media muestral
diferir en valor de la media poblacional. Si el valor observado de una estadstica
muestral, como la media muestral, se acerca al valor paramtrico supuesto y
slo difiere de l en un monto que cabra esperar del muestreo aleatorio, el valor
hipottico no se rechaza. Si la estadstica muestral difiere de la supuesta en un
monto que no es posible atribuir al azar, la hiptesis se rechaza por inverosmil.

Se han desarrollado tres procedimientos distintos para la prueba de hiptesis,


todos los cuales conducen a las mismas decisiones cuando se emplean los
mismos estndares de probabilidad (y riesgo). De acuerdo con este mtodo, se
determinan los as llamados valores crticos de la estadstica de prueba que
dictaran el rechazo de una hiptesis, tras de lo cual la estadstica de prueba
observada se compara con los valores crticos. ste fue el primer mtodo en
desarrollarse, motivo por el cual buena parte de la terminologa de las pruebas
de hiptesis se deriva de l. Ms recientemente, el mtodo del valor P ha
cobrado popularidad a causa de ser el ms fcilmente aplicable a software de
cmputo. Este mtodo se basa en la determinacin de la probabilidad
condicional de que el valor observado de una estadstica muestral pueda ocurrir

15

ESTADISTICA II
PROFESOR WALTER LOPEZ
al azar, dado que un supuesto particular sobre el valor del parmetro poblacional
asociado sea en efecto correcto. El mtodo de intervalos de confianza se basa
en la observacin de si el valor supuesto de un parmetro poblacional est
incluido en el rango de valores que define a un intervalo de confianza para ese
parmetro.

Pero ms all del mtodo de prueba de hiptesis que se use, debe hacerse
notar que si un valor hipottico no se rechaza, y por lo tanto se acepta, ello no
constituye una "prueba" de que sea correcto. La aceptacin de un valor
supuesto de un parmetro indica simplemente que se trata de un valor verosmil,
con base en el valor observado de la estadstica muestral.

Pasos bsicos de la prueba de hiptesis con el mtodo de valor crtico

Paso1. Formule la hiptesis nula y la hiptesis alternativa. La hiptesis nula (H0


es el valor paramtrico hipottico que se compara con el resultado muestral. Se
le rechaza slo si es poco probable que el resultado muestral haya ocurrido
dado lo correcto de la hiptesis. La hiptesis alternativa (H1) se acepta slo si la
hiptesis nula es rechazada. En muchos libros de texto la hiptesis alternativa
tambin se designa como Ha.

Ejemplo

Un auditor desea probar el supuesto de que el valor medio de la

totalidad de las cuentas por cobrar de una empresa dada es de $260.00

16

ESTADISTICA II
PROFESOR WALTER LOPEZ
tomando una muestra de n = 36 y calculando la media muestral. El auditor
desea rechazar el valor supuesto de $260.00 slo si es claramente contradicho
por la media muestral, caso ste en el que el valor hipottico recibira el
beneficio de la duda en el procedimiento de prueba. Las hiptesis nula y
alternativa de esta prueba son H0 : = $260.00 y H1 :
$260.00.

Paso 2. Especifique el nivel de significancia por aplicar. El nivel de significancia


es el estndar estadstico que se especifica para rechazar la hiptesis nula. Si
se especifica un nivel de significancia de 5%, la hiptesis nula se rechaza slo si
el resultado muestral es tan diferente del valor hipottico que una diferencia por
ese monto o un monto superior ocurrira al azar con una probabilidad de 0.05 o
menos.

Ntese que si se usa el nivel de significancia de 5%, hay una probabilidad de


0.05 de rechazar la hiptesis nula aun siendo efectivamente cierta. Esto se llama
error tipo I La probabilidad del error tipo I siempre es igual al nivel de
significancia empleado como estndar para rechazar la hiptesis nula; se le
designa con la letra griega minscula (alfa), de modo que a designa tambin
al nivel de significancia. Los niveles de significancia de uso ms frecuente en la
prueba de hiptesis son los de 5% y 1%.
Ocurre un error tipo II si la hiptesis nula no se rechaza, y es por lo tanto
aceptada, cuando en realidad es falsa. La determinacin de la probabilidad del
error tipo II se explica. En la tabla correspondiente se resumen los tipos de

17

ESTADISTICA II
PROFESOR WALTER LOPEZ
decisiones y las posibles consecuencias de las decisiones tomadas en pruebas
de hiptesis.

Paso 3. Seleccione la estadstica de prueba. La estadstica de prueba ser ya


sea la estadstica muestral (el estimador insesgado del parmetro a prueba) o
una versin estandarizada de la estadstica muestral. Por ejemplo, para probar
un valor hipottico de la media poblacional, la media de una muestra aleatoria
tomada de esa poblacin podra servir como la estadstica de prueba. Sin
embargo, si la distribucin de muestreo de la media es normal, el valor de la
media muestral se convierte usualmente en un valor z, el cual funge entonces
como la estadstica de prueba.

Paso 4. Establezca el valor o valores crticos de la estadstica de prueba.


Habiendo especificado la hiptesis nula, el nivel de significancia y la estadstica
de prueba por usar, se establece entonces el(los) valor(es) crtico(s) de la
estadstica de prueba. Estos valores pueden ser uno o dos, dependiendo de si
estn implicadas las as llamadas pruebas unilaterales o bilaterales. En cualquier
caso, un valor crtico identifica el valor de la estadstica de prueba requerido para
rechazar la hiptesis nula.

Paso 5. Determine el valor de la estadstica de prueba. Por ejemplo, al probar un


valor hipottico de la media poblacional, se recolecta una muestra aleatoria y se

18

ESTADISTICA II
PROFESOR WALTER LOPEZ
determina el valor de la media muestral. Si el valor crtico fue establecido como
un valor z, la media muestral se convierte a un valor z.

Paso 6. Tome la decisin. El valor observado de la estadstica muestral se


compara con el valor (o valores) crtico(s) de la estadstica de prueba. Se
rechaza o no entonces la hiptesis nula. Si la hiptesis nula es rechazada, se
acepta la hiptesis alternativa. Esta decisin tendr relevancia a su vez para
otras decisiones por tomar por los gerentes de operacin, como la de si se est
sosteniendo o no cierto estndar de desempeo o cul de dos estrategias de
comercializacin seguir.

Prueba de una hiptesis referente a la media usando la distribucin normal

La distribucin normal de probabilidad puede usarse para probar un valor


hipottico de la media de la poblacin 1) si n 30, por efecto del teorema
central del lmite, o 2) cuando n < 30 pero la poblacin tiene una distribucin
normal y a es conocida.

Una prueba bilateral se aplica cuando nos interesa una posible desviacin en
cualquier direccin respecto del valor hipottico de la media. La frmula que se
emplea para establecer los valores crticos de la media muestral es similar a la
frmula para determinar los lmites de confianza para la estimacin de la media
de la poblacin, excepto que el valor hipottico de la media poblacional es en

19

ESTADISTICA II
PROFESOR WALTER LOPEZ
este caso el punto de referencia, en lugar de la media muestral. Los valores
crticos de la media muestral para una prueba de dos extremos, de acuerdo con
el hecho de si se conoce o no, son

Ejemplo. En relacin con la hiptesis nula formulada en el ejemplo anterior,


determine los valores crticos de la media muestral para probar la hiptesis al
nivel de significancia del 5%. Dado que se sabe que la desviacin estndar de
los montos de las cuentas por cobrar es = $43.00, los valores crticos son

Hiptesis: H0 := $260.00; Hi, : $260.00

Nivel de significancia: = 0.05

Estadstica de prueba: , con base en una muestra de n = 36 y con = 43.00

CR = valores crticos de la media muestral

En consecuencia, para rechazar la hiptesis nula la media muestral debe tener


un valor inferior a $245.95 o superior a $274.05. As, en el caso de una prueba
de dos extremos existen dos regiones de rechazo. Los valores z de 1.96 sirven

20

ESTADISTICA II
PROFESOR WALTER LOPEZ
para establecer los lmites crticos, dado que, por efecto de la distribucin normal
estndar, una proporcin de 0.05 del rea permanece en las dos colas, lo que
corresponde a la = 0.05 especificada.

Fig. 4

En lugar de establecer los valores crticos en trminos de la media muestral, en


la prueba de hiptesis los valores crticos suelen especificarse en trminos de
valores z. Para el nivel de significancia del 5% los valores crticos de z para una
prueba de dos extremos son -1.96 y + 1 .96, por ejemplo. Una vez determinado
el valor de la media muestral, se le convierte a un valor z para que pueda
comparrsele con los valores crticos de z. La frmula de conversin, segn si
ores conocida o no, es

21

ESTADISTICA II
PROFESOR WALTER LOPEZ

Ejemplo. En referencia al problema de prueba de hiptesis de los dos ejemplos


anteriores, supongamos que la media muestral es = $240.00. Determinamos si
la hiptesis nula debe rechazarse convirtiendo esta media a un valor z y
comparndolo con los valores crticos de 1.96, en esta forma:

Este valor de z se halla en la regin de rechazo de la cola izquierda del modelo


de prueba de hiptesis que aparece en la figura 5. De este modo, la hiptesis
nula es rechazada, y la alternativa, de que
$260.00, aceptada. Advirtase
que en el ejemplo se habra llegado a la misma conclusin comparando la media
muestral = $240.00 con los lmites crticos para la media identificados en la
figura 4.

Fig. 5

22

ESTADISTICA II
PROFESOR WALTER LOPEZ
Una prueba unilateral resulta apropiada cuando nos interesan posibles
desviaciones slo en una direccin respecto del valor hipottico de la media.
Podra ocurrir que al auditor del ejemplo no le interesara que el promedio real de
la totalidad de las cuentas por cobrar exceda de $260.00, sino slo que pudiera
ser inferior a $260.00. As, si el auditor le concede el beneficio de la duda al
supuesto establecido de que la media real es de al menos $260.00, las hiptesis
nula y alternativa son

Nota: En muchos libros de texto, la hiptesis nula anterior se enunciara como


HO :
$260.00. Por nuestra parte, hemos incluido nicamente el signo de
igual porque, incluso en una prueba de un extremo, el procedimiento se realiza
en relacin con este valor en particular. Para decirlo de otra manera, es la
hiptesis alternativa la que es unilateral.

En una prueba unilateral slo existe una regin de rechazo, de modo que la
prueba del ejemplo anterior es una prueba de la cola inferior. La regin de
rechazo de una prueba unilateral se encuentra siempre en la cola que
representa el sustento de la hiptesis alternativa. Como en el caso de una
prueba bilateral, el valor crtico puede determinarse para la media como tal o en
trminos de un valor z. Sin embargo, los valores crticos para pruebas
unilaterales se diferencian de aquellos para pruebas bilaterales, porque la
proporcin de rea dada se halla en su totalidad en una de las colas de la
distribucin. En la tabla 11 se presentan los valores de z necesarios para
23

ESTADISTICA II
PROFESOR WALTER LOPEZ
pruebas unilaterales y bilaterales. La frmula general para establecer el valor
crtico de la media muestral para una prueba unilateral, segn si a se conoce o
no, es

Obsrvese en las frmulas inmediatamente anteriores, que z puede ser


negativa, lo que resulta en una sustraccin del segundo trmino de cada
frmula.

Tabla 11 Valores crticos de Z en pruebas de hiptesis

Errores Tipo I y Tipo II en pruebas de hiptesis

En esta seccin consideraremos los errores tipo I y tipo II en relacin


estrictamente con pruebas unilaterales de una media hipottica. Sin embargo,
los conceptos bsicos aqu ilustrados se aplican tambin a otros modelos de
pruebas de hiptesis.

24

ESTADISTICA II
PROFESOR WALTER LOPEZ
La probabilidad mxima del error tipo I siempre es igual al nivel de significancia
empleado en la prueba de la hiptesis nula. Esto es as a causa de que, por
definicin, la proporcin de rea en la regin de rechazo es igual a la proporcin
de los resultados muestrales que ocurriran en esa regin en caso de que la
hiptesis nula sea cierta.

La probabilidad del error tipo II suele indicarse con la letra griega (beta). La
nica manera en que se te puede determinar es respecto de un valor especiffico
incluido en el rango de la hiptesis alternativa.

Ejemplo. La hiptesis nula es que la media de la totalidad de las cuentas por


cobrar es de $260.00 y la hiptesis alternativa que la media es inferior a esta
cantidad, prueba que habr de realizarse al nivel de significancia de 5%.
Adems, el auditor indica que una media de $240.00 (o menos) sera
considerada una diferencia material importante con el valor hipottico de
$260.00. Como en el caso anterior, = $43.00 y el tamao de muestra es n =
36 cuentas. La determinacin de la probabilidad del error tipo II implica que

1) formulemos las hiptesis nula y alternativa para esta situacin de prueba,

2) determinemos el valor crtico de la media muestral por emplearen la prueba


de la hiptesis nula al nivel de significancia de 5%,

25

ESTADISTICA II
PROFESOR WALTER LOPEZ
3) identifiquemos la probabilidad de error tipo I asociada con el uso del valor
crtico calculado en el paso anterior como base para la regla de decisin,

4) determinemos la probabilidad de error tipo II asociada con la regla de decisin


dado el valor medio alternativo especfico de $240.00.

La solucin completa es

3)

La probabilidad mxima de error tipo 1 es igual a 0.05 (el nivel de

significancia usado en la prueba de la hiptesis nula).

4)

La probabilidad de error tipo II es la probabilidad de que la media de la

muestra aleatoria sea igual o mayor de $248.21, dado que la media de la


totalidad de las cuentas en realidad $240.00.

26

ESTADISTICA II
PROFESOR WALTER LOPEZ
En la figura 6 se ilustra el mtodo seguido en el ultimo ejemplo. En general, el
valor crtico de la media determinado en relacin con la hiptesis nula se
"reduce" y se emplea como el valor crtico en relacin con la hiptesis alternativa
especfica. El problema ilustra la determinacin de la probabilidad del error tipo II
en una prueba bilateral.

Fig. 6

Cuando el nivel de significancia y el tamao de muestra se mantienen


constantes, la probabilidad del error tipo II disminuye a medida que el valor
alternativo especfico de la media se aleja del valor de la hiptesis nula y
aumenta a medida que el valor alternativo se acerca al valor de la hiptesis nula.
Una curva caracterstica operativa (C0) describe grficamente la probabilidad de
aceptar la hiptesis nula dados diversos valores alternativos de la media de la
poblacin. La figura es la curva CO aplicable a cualquier prueba de cola inferior
de una media hipottica al nivel de significancia de 5% basada en el uso de la
27

ESTADISTICA II
PROFESOR WALTER LOPEZ
distribucin normal de probabilidad. Ntese que es aplicable a cualquier prueba
de este tipo, porque los valores del eje horizontal han sido enunciados en
unidades del error estndar de la media. Para cualesquiera valores a la
izquierda de la probabilidad de aceptacin indica la probabilidad del error tipo
II. A la derecha de , las probabilidades indican la aceptacin correcta de la
hiptesis nula. Tal como lo indican las lneas punteadas, cuando = , la
probabilidad de aceptar la hiptesis nula es 1- o, en este caso, 1 - 0.05 =
0.95.

Fig. 7
Estimacin para una y dos poblaciones
NOTACIN GENERAL
A la hiptesis nula la denotamos por "H0:" y despus escribimos la afirmacin
que supone la nula. Por ejemplo, escribimos:

28

ESTADISTICA II
PROFESOR WALTER LOPEZ
H0: mu = 236

para querer decir la hiptesis de que el promedio de la poblacin es 236.


A la hiptesis alterna la denotamos, de igual manera, por "H1:". Por ejemplo, la
hiptesis de que menos del 43% de la poblacin prefiere nuestra marca la
denotamos
H1: p < 0.43
Para decidir si se rechaza o n la hiptesis nula vemos el valor de una
estadstica calculada de la muestra. A esta estadstica la llamamos estadstica
de prueba.
La decisin de rechazar se toma si la estadstica de prueba cae en una regin
que llamamos regin crtica o regin de rechazo.
Las regiones de rechazo se presentan de acuerdo a la hiptesis alterna.
Para determinar la regin crtica, tenemos en cuenta la significacin que
queremos para la prueba, sta se refleja en el valor crtico que se lee en la tabla
normal o t, segn sea el caso.
PRUEBAS COMUNES (con una muestra)
(1) PRUEBA z PARA UNA MEDIA
Hiptesis Nula:

29

ESTADISTICA II
PROFESOR WALTER LOPEZ
H0: mu = mu0
Estadstica de prueba:
zc = [ X-barra - mu0 ] / [ sigma / raiz(n)]
Regin Crtica:

Alternativa

Regin Crtica

H1: mu < mu0

zc < -z

H1: mu > mu0

zc > z

H1: mu <> mu0

zc < -z1 zc > z1

zc es la estadstica calculada de la muestra.

z es un valor ledo en la tabla normal, relacionado con la


significacin de la prueba.

z1 es, tambin un valor ledo en la tabla normal, pero distinto de z.

Esta prueba supone que sabemos el valor de sigma.


En el saln hacemos ejemplos de cmo funciona. Si Ud. no puede asistir al
saln debe revisar ejemplos y ejercicios en un libro de texto, en la seccin de
pruebas de hiptesis de una media.
EN CASO DE NO CONOCER sigma
Cuando sigma es desconocida hacemos alguna de estas dos cosas:

30

ESTADISTICA II
PROFESOR WALTER LOPEZ

Si n > 30. Usamos la misma prueba anterior pero al calcular zc lo


hacemos con la desviacin estndar de la muestra: s.

Si n <= 30. Usamos la prueba enterior con dos modificaciones

Usamos s en lugar de sigma al calcular zc

Los valores de la regin crtica los vemos en la tabla t de Student


en lugar de la normal; con n - 1 grados de libertad.

Hay que tener en cuenta que en el caso n <= 30 la prueba es vlida slo
si la poblacin de la que se extrae la muestra es normal. A esta prueba se
le llama: prueba t de una media
(2) PRUEBA z DE UNA PROPORCIN.
Hiptesis Nula:
H0: p = p0
Estadstica de prueba :
zc = [ p - p0 ] / [ raiz( {p0(1 - p0)} / n ) ]
Regin Crtica:

Alternativa

Regin Crtica

H1: p < p0

zc < -z

H1: p > p0

zc > z

H1: p <> p0

zc < -z1 zc > z1

31

ESTADISTICA II
PROFESOR WALTER LOPEZ
o

en el clculo de zc, la cantidad p es la proporcin observada en la


muestra.

en el denominador de zc se usa el valor que asigna la hiptesis


nula: p0

z es un valor ledo en la tabla normal, relacionado con la


significacin de la prueba.

z1 es, tambin un valor ledo en la tabla normal, pero distinto de z.

MS NOTACIN. DOS MUESTRAS INDEPENDIENTES DE DOS


POBLACIONES.
Estudiamos ahora una situacin especial. Nuestro inters no recae ahora en una
poblacin, sino en dos. Los casos ms frecuentes de esta situacin son:

Cuando se tienen dos poblaciones por comparar. Por ejemplo, cuando se


compara el rendimiento de dos establecimientos.

Cuando se tiene una misma poblacin, pero estudiada antes de alguna


intervencin y despus de la misma. Por ejemplo, si comparamos el
porcentaje de quejas despus de hacer una mejora administrativa y antes
de hacerla.

Cuando se comparan dos modos distintos de hacer las cosas, en una


misma poblacin. Por ejemplo, al comparar los rendimientos de dos tipos

32

ESTADISTICA II
PROFESOR WALTER LOPEZ
de empaque para un producto, en trminos de los costos y beneficios
asociados.
En trminos de parmetros, estudiamos:

La diferencia de promedios de las poblaciones: mu1 - mu2.

La diferencia de proporciones en las dos poblaciones: p1 - p2.

Podramos estar interesados en la diferencia de desviaciones estndares, pero


no vamos a enfatizar esa prueba en este curso.
Para probar hiptesis acerca de esas diferencias vamos a tomar dos muestras
independientes. Esto quiere decir que las observaciones individuales en una
muestra no estn relacionadas con las de la otra muestra. Por ejemplo, si le
damos un examen a los mismos alumnos antes y despus de darles un curso de
capacitacin, no estamos haciendo muestras independientes, si quisiramos
estudiar un problema as, deberamos estudiar las diferencias individuales de
antes y despus. En cambio, si estudiamos la diferencia en la proporcin de
quejas de los clientes antes y despus de hacer el entrenamiento, tenemos dos
muestras independientes (o casi), porque los clientes seleccionados para la
muestra "antes" y "despus" son independientes.
Como las muestras son independientes, los tamaos de las dos muestras no
tienen por que ser iguales y usamos la siguiente notacin:

33

ESTADISTICA II
PROFESOR WALTER LOPEZ
Estadstica

Muestra 1

Muestra 2

Tamao

n1

n2

Media

X-barra1

X-barra2

Desv. Estndar

s1

s2

Proporcin
p1
PRUEBAS COMUNES (con dos muestras)

p1

(3) PRUEBA z DE DIFERENCIA DE DOS MEDIAS.


Hiptesis Nula:
H0: mu1 = mu2
Estadstica de prueba:
zc = [ X-barra1 - X-barra2 ] / [ raiz{ (sigma1)^2 / n1 + (sigma2)^2 / n2 } ]
Regin Crtica:

Alternativa

Regin Crtica

H1: mu1 < mu2

zc < -z

H1: mu1 > mu2

zc > z

H1: mu1 <> mu2

zc < -z1 zc > z1

zc es la estadstica calculada de la muestra.

z es un valor ledo en la tabla normal, relacionado con la


significacin de la prueba.

z1 es, tambin un valor ledo en la tabla normal, pero distinto de z.

34

ESTADISTICA II
PROFESOR WALTER LOPEZ
Esta prueba supone que sabemos el valor de las desviaciones estndares de
ambas poblaciones.
En el saln hacemos ejemplos de como funciona. Si Ud. no puede asistir al
saln,consulte un texto en la seccin: prueba de diferencia de dos medias
EN CASO DE NO CONOCER LAS DESVIACIONES ESTNDARES.
Si tenemos muestras grandes: n1 > 30 y n2 > 30, hacemos la misma prueba,
pero al calcular la estadstica de prueba usamos s1 y s2.
Si tenemos muestras pequeas, hacemos la siguiente prueba.
(4) PRUEBA t DE DIFERENCIA DE DOS MEDIAS.
Hiptesis Nula:
H0: mu1 = mu2
Estadstica de prueba:
tc = [ X-barra1 - X-barra2 ] / [ s raiz{ 1 / n1 + 1 / n2 } ]
donde la s del denominador se calcula as
s = raiz[ { (n1 - 1)(s1)^2 + (n2 - 1)(s2)^2 } / {n1 + n2 - 2} ]
Para calcular esta tc, le sugiero que proceda as:

calcule X-barra y s de cada muestra.

calcule la s del denominador.


35

ESTADISTICA II
PROFESOR WALTER LOPEZ
o

finalmente calcule la tc.

Regin Crtica:

Alternativa

Regin Crtica

H1: mu1 < mu2

tc < -t

H1: mu1 > mu2

tc > t

H1: mu1 <> mu2

tc < -t1 tc > t1

t es un valor ledo en la tabla de Student, relacionado con la


significacin de la prueba.

t1 es, tambin un valor ledo en la tabla t, pero distinto de t.

Esta prueba se usa cuando las muestras son pequeas y suponemos que las
desviaciones estndares de las poblaciones son iguales. En este curso no
estudiamos qu hacer si las dos desviaciones estndares de las poblaciones
son diferentes y las muestras son pequeas.
Para usar la tabla t el nmero de grados de libertad es: n1 + n2 - 2.

36

You might also like