You are on page 1of 23

Distribucin muestral de diferencia de medias

Con frecuencia, el inters se centra en dos poblaciones. Puede ser que un


investigador desee saber algo acerca de las diferencias entre las medias de
dos poblaciones. Para este y otros casos, el conocimiento acerca de la
distribucin muestral de la diferencia entre dos medias es muy til.
Se tienen dos poblaciones distintas, la primera con media 1 y desviacin
estndar 1, y la segunda con media 2 y desviacin estndar 2. Se elige
una muestra aleatoria de tamao n1 de la primera poblacin y una muestra
independiente aleatoria de tamao n2 de la segunda poblacin; se calcula la
media muestral para cada muestra y la diferencia entre dichas medias. La
coleccin de todas esas diferencias junto con sus frecuencias, se llama
distribucin muestral de las diferencias entre medias o la distribucin muestral
del estadstico
La distribucin es aproximadamente normal para n 1 30 y n2 30. Si las
poblaciones son normales, entonces la distribucin muestral de medias es
normal
sin
importar
los
tamaos
de
las
muestras.
Sabemos que cuando n es grande, la distribucin muestral de medias tendr
aproximadamente una distribucin normal con una media igual a (la media de
la poblacin) y una desviacin estndar de / n . Con esto podemos deducir
que la media para esta distribucin muestral de diferencia de medias es igual a
las diferencia entre las medias reales de las poblaciones 1- 2. La varianza
es igual a ( 21/n1) + ( 22/n2). Y el error estndar de la diferencia entre las
medias muestrales es:
.
La frmula que se utilizar para el clculo de probabilidad del estadstico de
diferencia de medias es:

Este procedimiento es vlido incluso cuando el tamao de las muestras es


diferente y cuando las varianzas tienen valores diferentes.
Ejemplo: En un estudio para comparar los pesos promedio de nios y nias de
sexto grado en una escuela primaria se usar una muestra aleatoria de 20
nios y otra de 25 nias. Se sabe que tanto para nios como para nias los
pesos siguen una distribucin normal. El promedio de los pesos de todos los
nios de sexto grado de esa escuela es de 100 libras y su desviacin estndar
es de 14.142, mientras que el promedio de los pesos de todas las nias del
sexto grado de esa escuela es de 85 libras y su desviacin estndar es de
12.247 libras. Si

representa el promedio de los pesos de 20 nios y

es el

promedio de los pesos de una muestra de 25 nias, encuentre la probabilidad


de que el promedio de los pesos de los 20 nios sea al menos 20 libras ms
grande que el de las 25 nias.
Solucin: Datos:

1 = 100 libras
2 = 85 libras

1 = 14.142 libras
2 = 12.247 libras
n1 = 20 nios
n2 = 25 nias
=?

Por lo tanto, la probabilidad de que el promedio de los pesos de la muestra de


nios sea al menos 20 libras ms grande que el de la muestra de las nias es
0.1056.

Estimacin de la Diferencia entre dos Medias


En ciertos casos, se desea estimar la diferencia entre las medias de dos
poblaciones. Teniendo dos poblaciones donde el carcter que estudiamos en
ambas (X1 y X2) son v.a. distribuidas segn leyes gaussianas, podemos realizar
una
estimacin
de
la
diferencia
entre
dos
medias.
A partir de cada poblacin se extrae una muestra aleatoria independiente y de
los datos de cada una se calculan las medias muestrales x 1 y x 2. Sabemos
que el estimador x 1- x 2 proporciona una estimacin insesgada de 1 - 2,
que es la diferencia entre las medias de las poblaciones. La varianza del
estimador es ( 12/n1) + ( 22/n2).
Por
tanto,
para
obtener
una
estimacin
puntual
de
1- 2, se seleccionan dos muestras aleatorias independientes que no tienen
por qu ser necesariamente del mismo tamao, una de cada poblacin, de
tamao n1 y n2, se calcula la diferencia
, de las medias muestrales.
Intervalo para la diferencia de medias cuando se conoce la varianza:

Recordando a la distribucin muestral de diferencia de medias:

Al despejar de esta ecuacin 1 - 2 se tiene:

En el caso en que se desconozcan las varianzas de la poblacin y los tamaos


de muestra sean mayores a 30 se podr utilizar la varianza de la
muestra como una estimacin puntual.
Ejemplo: A un equipo de investigacin le interesa conocer la diferencia entre las
concentraciones de acido rico en pacientes con y sin mongolismo. En
una hospital para el tratamiento del retardo mental, una muestra de 12
individuos con mongolismo proporciona una media de x 1=
4.5mg/100ml. En un hospital general se encontr que una muestra de 15
individuos normales de la misma edad y sexo presenta un nivel medio
de x 2= 3.4. Si suponemos que las dos poblaciones de valores
muestran una distribucin normal y sus varianzas son iguales a 1,
calcular el intervalo de confianza del 95% para 1- 2.
Solucin: Para una estimacin puntual de 1- 2 se utiliza
= 4.5 3.4=1.1. El coeficiente de confiabilidad correspondiente al .95, que se
halla en la tabla normal, es 1.96. El error estndar es:
1
1

= 0.39
12 15

Por lo tanto el intervalo de confianza del 95% es:


1.1 1.96 (0.39)
1.1 0.8
(0.3 ; 1.9)
Se dice que se tiene una confianza del 95% de que la diferencia real 1- 2,
est entre 0.3 y 1.9 debido a que en muestreos repetidos el 95% de los
intervalos construidos de esa manera incluira la diferencia entre las
medias reales.
Intervalo para la diferencia de medias cuando se desconoce la varianza
Cuando se desconocen las varianzas de la poblacin y se requiere estimar la
diferencia entre las medias de dos poblaciones con un intervalo de
3

confianza, se puede utilizar la distribucin t para extraer el factor de


confiabilidad, siempre que las poblaciones sean normales o
supongamos que lo son.

1. Intervalo para la diferencia de medias homocedticas:


Si suponemos que las varianzas de dos poblaciones son iguales, las dos
varianzas de las muestras calculadas a partir de las muestras independientes
pueden construirse como estimaciones de una sola cosa, la varianza comn.
Esta varianza se obtiene calculando el promedio ponderado de las dos
varianzas de las muestras. Cada varianza de las muestras es ponderada en
base a sus grados de libertad. La estimacin conjunta se obtiene con la
formula:

Donde se ha definido a
como la cuasivarianza muestral ponderada de S 21 y
2
S 2.
Las varianzas se desconocen, el intervalo se distribuye entonces como una
de
Student
con
n1+n2-2
grados
de
libertad

Si 1es el nivel de significacin con el que deseamos establecer el intervalo


para la diferencia de las dos medias, calculamos el valor t n1+n2-1,1- /2 que deja
por encima de si /2 de la masa de probabilidad de Tn1+n2-2.
El intervalo de confianza al nivel 1- para la diferencia de esperanzas de dos
poblaciones con la misma varianza (aunque esta sea desconocida) es:

Ejemplo: Se efectuaron estudios sobre la concentracin media de amilasa en


suero de una poblacin sana. Las mediciones se efectuaron en una muestra de
15 individuos aparentemente saludables. La muestra proporcion una media de
96 unidades/100ml y una desviacin estndar de 35 unidades/100ml. Se
hicieron tambin las determinaciones de amilasa en el suero de 22 individuos
hospitalizados que forman una muestra independiente. La media y la
desviacin estndar de esta muestra son 120 y 40 unidades/ml,
respectivamente. La estimacin puntual de 1- 2 es de 120 96 =24. Se
desea construir un intervalo de confianza para la diferencia entre las
concentraciones medias de amilasa del suero en individuos aparentemente
sanos y la media para los pacientes hospitalizados.
Solucin: Suponemos que las dos poblaciones en estudio tienen una
distribucin normal y que sus varianzas son iguales. Primero, buscamos la
estimacin conjunta de la varianza comn como sigue:
S 2 = 14(35)2 + 21(40)2 / 15 + 22 2 = 1450

El intervalo de confianza del 95% para 1- 2 es:


4

(120-96) 2.0301

1450 1450

15
22

24 (2.0301)(12.75)
24 26
(-2 ; 50)

Se dice que se tiene un 95% de confianza de que la diferencia real 1- 2 esta


entre -2 y 50 ya que, al muestrear varias veces, el 95% de los intervalos as
construidos incluyen a 1- 2.
Ejemplo: Queremos estudiar la influencia que puede tener el tabaco con el
peso de los nios al nacer. Para ello se consideran dos grupos de mujeres
embarazadas (unas que fuman un paquete al da y otras que no) y se obtienen
los siguientes datos sobre el peso X, de sus hijos:

En ambos grupos los pesos de los recin nacidos provienen de sendas


distribuciones normales de medias desconocidas, y con varianzas que si bien
son desconocidas, podemos suponer que son las mismas. Calcular en cuanto
influye el que la madre sea fumadora en el peso de su hijo.
Solucin: Si queremos estimar en cuanto influye el que la madre sea fumadora
en el peso de su hijo, podemos estimar un intervalo de confianza para 1- 2,
lo que nos dar la diferencia de peso esperado entre un nio del primer grupo y
otro del segundo. El estadstico que se ha de aplicar para esta cuestin es:

donde

Consideramos un nivel de significacin que nos parezca aceptable, por ejemplo


=0.05, y el intervalo buscado se obtiene a partir de

95%
Con lo cual se puede decir que un intervalo de confianza para el peso esperado
5

en que supera un hijo de madre no fumadora al de otro de madre fumadora


est comprendido con un nivel de confianza del 95% entre los 0,068 Kg y los
0,731 Kg.

Contrastes para la diferencia de medias apareadas


En el anlisis de la diferencia de medias de dos poblaciones, se supone que las
muestras son independientes. Un mtodo que se utiliza con frecuencia para
averiguar la efectividad de un tratamiento o procedimiento experimental es
aquel que hace uso de observaciones relacionadas que resultan de muestras
no independientes. Una prueba de hiptesis que se basa en este tipo de datos
se conoce como prueba de comparaciones por parejas o para muestras
apareadas. Las muestras apareadas aparecen como distintas observaciones
realizadas sobre los mismos individuos. Un ejemplo de observaciones
apareadas consiste en considerar a un conjunto de n personas a las que se le
aplica un tratamiento mdico y se mide por ejemplo el nivel de insulina en la
sangre antes (X) y despus del mismo (Y). No es posible considerar a X e Y
como variables independientes ya que va a existir una dependencia clara entre
las dos variables. Si queremos contrastar el que los pacientes han
experimentado o no una mejora con el tratamiento, llamemos di a la diferencia
entre las observaciones antes y despus del tratamiento
di = xi-yi
El objetivo de la prueba de comparaciones por pares es eliminar al mximo las
fuentes de variacin por medio de la formacin de parejas similares respecto a
tantas variables como sea posible. En estos casos, en lugar de llevar a cabo el
anlisis con observaciones individuales, se puede utilizar como variable de
inters la diferencia entre los pares individuales de observacin.
Supongamos que la v.a. que define la diferencia entre el antes y despus del
tratamiento es una v.a. d que se distribuye normalmente, pero cuyas media y
varianza son desconocidas.
Si queremos contrastar la hiptesis de que el tratamiento ha producido cierto
efecto

En el caso en que H0 fuese cierta tendramos que el estadstico de contraste


que nos conviene es:

Donde
es la media muestral de las diferencias di y S d es la cuasivarianza
muestral de las mismas. El tipo de contraste sera entonces del mismo tipo que
el realizado para la media con varianza desconocida.
Cuando H0 es verdadera la estadstica de prueba sigue una distribucin t de
Student con n-1 grados de libertad.
1. Contraste bilateral: Consideramos el contraste de tipo

Entonces se define

y se rechaza la hiptesis nula cuando:

2. Contrastes unilaterales: En los dos tipos de contrastes unilaterales o de una


cola se utiliza el mismo estadstico:

Si el contraste es

entonces:
Se rechaza H0 si:

.
7

Para el test contrario

Se rechaza H0 si: Texp > t n-1 ,1- .


Si el contraste se realiza cuando
contraste es:

es conocida, entonces el estadstico del

y el tratamiento es anlogo en los tres casos.


Contrastes de diferencia entre medias poblacionales independientes
Este tipo de contraste tambin es aplicado para diferencia de medias, pero en
los casos en los que se comparan medias poblacionales para un carcter
determinado en dos poblaciones distintas. Sean dos poblaciones normales
N x , x y N y , y con x y y conocidas, de las cuales se extraen
dos muestras aleatorias e independientes de tamao nx y ny respectivamente.
Con un nivel de significacin dado, queremos realizar los siguientes
contrastes:
H 0 : x y d 0

H1 : x y d 0

1.

H 0 : x y d 0

H1 : x y d 0

2.

H 0 : x y d 0

H1 : x y d 0

3.

El caso ms frecuente es cuando d0=0. Sin embrago, es posible probar la


hiptesis de que la diferencia es igual que, mayor o igual que, menor o igual
que algn valor distinto de cero.

Utilizando el estadstico

zexp

x y d0
2
x2 y

nx n y

se tienen los siguientes contrastes.

Contraste de medias con varianzas conocidas:


De manera similar al caso del contraste para una media, queremos en esta
ocasin contrastar la hiptesis de que las dos poblaciones (cuyas varianzas
suponemos conocidas) slo difieren en una cantidad

frente a hiptesis alternativas que darn lugar a contrastes unilaterales o


bilaterales. Para ello nos basamos en la distribucin del siguiente estadstico de
contraste:

1. Contraste bilateral o de dos colas:

Se define entonces

Se acepta H 0 si:

z / 2 zexp z / 2

y el test consiste en:

2. Contrastes unilaterales o de una cola


Se utiliza en ambos caso el mismo estadstico utilizado para el contraste
bilateral:

Para el test

Se acepta H 0 si: zexp z

y para el contraste de significacin contrario:

Se acepta H 0 si: zexp z

Ejemplo: Un equipo de investigadores desea saber si los datos que han


recolectado proporcionan la evidencia suficiente para indicar una diferencia
entre las concentraciones medias de cido rico en el suero de individuos
normales e individuos con sndrome de Down. Los datos presentan las
concentraciones de acido rico en el suero de 12 individuos con sndrome de
Down y 15 individuos sanos. Las medias son x 1=4.5mg/100ml y x
2=3.4mg/100ml.
Solucin: El contraste es H0: 1- 2 = 0 o 1= 2
H1: 1- 2 0 o 1 2
Si =0.05, los valores crticos de z son 1.96. Se rechaza H0 a menos que
-1.96<zcalculada<1.96.

10

Clculo de la estadstica de prueba:


Z=

( 4.5 3.4) 0
1 / 12 1 / 15

1.1
=2.82
0.39

Como 2.82 es mayor que 1.96 se rechaza la hiptesis nula. Se concluye que,
de acuerdo con estos datos, hay indicios de que las medias de las poblaciones
son diferentes.
Contraste de medias homocedticas
Aplicable al caso en el que deseamos contrastar la diferencia de medias de dos
poblaciones independientes cuando slo conocemos que las varianzas de
ambas poblaciones son iguales, pero desconocidas. El problema a contrastar
es:

El estadstico que usaremos para el contraste ya lo hemos visto. Si suponemos


que H0 es cierta se tiene

Donde

es la cuasivarianza muestral ponderada de S 21 y S 22.

Se han perdido dos grados de libertad a causa de la estimacin de


mediante S 21 y S 22.

21=

2
2

1. Contraste bilateral
Para el contraste de significacin

Se tiene como en casos anteriores que el contraste adecuado consiste en


definir

Y rechazar o admitir la hiptesis nula siguiendo el criterio

11

2. Contrastes unilaterales
Cuando el contraste es unilateral del modo

El contraste se realiza siguiendo el mismo proceso que en otros realizados


anteriormente y utilizando el mismo estadstico, lo que nos lleva a

Y cuando el contraste de significacin es el contrario

Del mismo modo

Ejemplo: Un grupo de investigadores colecto datos acerca de las


concentraciones de amilasa en el suero de muestras de individuos sanos y de
individuos hospitalizados. Desean saber si es posible concluir que las medias
de las poblaciones son distintas. Los datos son las mediciones de amilasa en
suero de n2= 15 individuos sanos y n 1= 22 individuos hospitalizados. Las
medias muestrales y sus desviaciones estndar son las siguientes:
x 1=120 unidades/ml
s1=40 unidades/ml
x 2=96 unidades/ml
s2=35 unidades/ml
Solucin: El contraste es: H0: 1- 2 = 0
H1: 1- 2 0
Si definimos a =0.05, los valores crticos de t son 2.0301. Se rechaza H 0 a
menos que -2.0301<tcalculada<2.0301.
El clculo de la estadstica de prueba es:
S 2=

21(1600) 14(1225)
=1450
21 14

12

(120 96) 0

t=

24
1450 1450 =
=1.88

12.75
15
22

No es posible rechazar H0 porque -2.0301<1.88<2.0301. Es decir, 1.88 cae


dentro de la regin de aceptacin. Con base a estos datos no es posible
concluir que las dos medias de la poblacin son diferentes.
Contraste de medias no homocedticas
Es un tipo de contraste que se aplica en el caso ms problemtico, es decir
cuando slo conocemos de las dos poblaciones que su distribucin es normal,
y que sus varianzas no son conocidas y significativamente diferentes. El
contraste es:

En este caso el estadstico de contraste tendr una ley de distribucin muy


particular. Consistir en una distribucin t de Student, con un nmero de grados
de libertad que en lugar de depender de modo determinista de la muestra (a
travs de su tamao), depende de un modo aleatorio mediante las varianzas
muestrales. Concretamente, el estadstico que nos interesa es

donde f es el nmero de grados de libertad que se calcula mediante la frmula


de Welch

No desarrollamos en detalle los clculos a realizar, pues la tcnica para


efectuar los contrastes es anloga a las vistas anteriormente cuando las
varianzas son desconocidas e iguales.
Nota
Si lo que pretendemos contrastar es si las medias poblacionales de dos
muestras independientes obtenidas de poblaciones normales son

13

idnticas, esto se reduce a los casos anteriores tomando


decir, realizando el contraste:

, es

Distribucin Muestral de Diferencia de Proporciones


Muchas aplicaciones involucran poblaciones de datos cualitativos que deben
compararse
utilizando
proporciones
o
porcentajes.
Cuando el muestreo procede de dos poblaciones binomiales y se trabaja con
dos proporciones muestrales, la distribucin muestral de diferencia de
proporciones es aproximadamente normal para tamaos de muestra grande
(n1p1 5, n1q1 5, n2p2 5 y n2q2 5). Entonces p1 y p2 tienen distribuciones
muestrales aproximadamente normales, as que su diferencia p 1-p2 tambin
tiene
una
distribucin
muestral
aproximadamente
normal.
Cuando se estudi la distribucin muestral de proporciones se comprob que

=
= p y que p

1-

pq
por lo que se puede deducir que:
n

= p1-p2 y que

Si tenemos dos poblaciones suficientemente pequeas, podemos extraer de la


poblacin 1 todas las muestras aleatorias posibles de tamao n1 y calcular a
1.
partir de cada conjunto de datos de la muestra la proporcin de la muestra p
Lo mismo podemos hacer con la poblacin 2. Luego es posible calcular las
diferencias entre todos los pares posibles de proporciones muestrales, donde
1 y el otro un valor p
2. La distribucin
un miembro de cada par tiene un valor p
muestral de la diferencia ente las dos porciones de las muestras consiste en
todas las diferencias existentes acompaadas de sus frecuencias de
ocurrencias. La frmula que se utilizar para el clculo de probabilidad del
estadstico de diferencia de proporciones es:

Ejemplo: Los hombres y mujeres adultos de una ciudad grande en sus


opiniones sobre la promulgacin de la pena de muerte para personas culpables
de asesinato. Se cree que el 12% de los hombres adultos estn a favor de la
pena de muerte, mientras que slo 10% de las mujeres adultas lo estn. Si se
pregunta a dos muestras aleatorias de 100 hombres y 100 mujeres su opinin
sobre la promulgacin de la pena de muerte, determine la probabilidad de que

14

el porcentaje de hombres a favor sea al menos 3% mayor que el de las


mujeres.
Solucin: Datos:
PH = 0.12
PM = 0.10
nH = 100
nM = 100
p(pH-pM 0.03) = ?
Hay que tener en cuanta que debe incluirse el factor de correccin de 0.5 por
ser una distribucin binomial y que se est utilizando la distribucin normal.

Se concluye que la probabilidad de que el porcentaje de hombres a favor de la


pena de muerte, al menos 3% mayor que el de mujeres es de 0.4562.
Estimacin de la Diferencia de dos Proporciones
Muchas veces se tiene inters en conocer la magnitud de la diferencia entre
dos poblaciones, podemos comparar por ejemplo, entre hombres y mujeres,
dos grupos de edades, dos grupos socioeconmicos.
Un estimador puntual insesgado de la diferencia de proporciones de las
poblaciones se obtiene al calcular las diferencias de las proporciones de las
1 - p
2. Cuando n1 y n2 son de gran tamao y las proporciones de
muestras p
la poblacin no estn muy cerca de 0 o de 1, es posible aplicar el teorema del
lmite central y utilizar la teora de la distribucin normal para obtener los
intervalos de confianza.
Vamos a considerar que tenemos dos poblaciones de modo que en cada una
de ellas estudiamos una v.a. dicotmica (Bernoulli) de parmetros respectivos
p1 y p2. De cada poblacin vamos a extraer muestras de tamao n1 y n2
Si las muestras son suficientemente grandes ocurre que

15

Anteriormente, se vio el tema de la generacin de las distribuciones


muestrales, en donde se tena el valor de los parmetros, se seleccionaban dos
muestras y podamos calcular la probabilidad del comportamiento de los
estadsticos. Para este caso en particular se utilizar la distribucin muestral de
diferencia de proporciones para la estimacin de la misma. Recordando la
formula:

Despejando P1-P2 de esta ecuacin obtenemos un intervalo de confianza del


100(1 - ) para P1-P2 :

Donde Z se obtiene de la tabla de distribucin normal al nivel 1-/2.


Aqu se tiene el mismo caso que en la estimacin de una proporcin, ya que al
hacer el despeje nos queda las dos proporciones poblacionales y es
precisamente lo que queremos estimar, por lo que se utilizarn las
proporciones de la muestra como estimadores puntuales:
Ejemplo: Un artculo relacionado con la salud, reporta los siguientes datos
sobre la incidencia de disfunciones importantes entre recin nacidos con
madres fumadoras de marihuana y de madres que no la fumaban:

Usuaria

No Usuaria

Tamao Muestral

1246

11178

Nmero de disfunciones

42

294

Proporcin muestral

0.0337

0.0263

Encuentre el intervalo de confianza del 99% para la diferencia de proporciones.


Solucin: Representemos P1 la proporcin de nacimientos donde aparecen
disfunciones entre todas las madres que fuman marihuana y definamos P2, de
manera similar, para las no fumadoras. El valor de z para un 99% de confianza
es de 2.58.

16

-0.0064<P1-P2<0.0212
Este intervalo es bastante angosto, lo cual sugiere que P 1-P2 ha sido estimado
de manera precisa.
Contrastes sobre la diferencia de proporciones
Supongamos que tenemos dos muestras independientes tomadas sobre dos
poblaciones, en la que estudiamos una variable de tipo dicotmico (Bernoulli):

Si X1 y X2 contabilizan en cada caso el nmero de xitos en cada muestra se


tiene que cada una de ellas se distribuye como una variable aleatoria binomial,
de modo que los estimadores de las proporciones en cada poblacin tienen
distribuciones que de un modo aproximado son normales (cuando n1 y n2 son
bastante grandes)

El contraste que nos interesa realizar es el de si la diferencia entre las


proporciones en cada poblacin es una cantidad conocida

Si H0 fuese cierta se tendra que:

Desafortunadamente ni p1 ni p2 son conocidos de antemano y utilizamos sus


estimadores, lo que da lugar a un error que es pequeo cuando los tamaos
muestrales son importantes:

17

La prueba que se utiliza con ms frecuencia con relacin a la diferencia entre


las proporciones de dos poblaciones es aquella en la que su diferencia es cero.
Sin embargo, es posible probar que dicha diferencia es igual a algn otro valor.
Se pueden hacer pruebas unilaterales y bilaterales.
Siempre que la hiptesis nula sea p 1-p2=0, se supone que las proporciones de
las dos poblaciones son iguales. Esto permite combinar los resultados de las
dos muestras y obtener una estimacin ponderada de la proporcin comn
supuesta:
p = x1+x2 / n1+n2
Donde x1 y x2 son el nmero de la primera y segunda muestra que poseen la
caracterstica de inters. Esta estimacin ponderada se utiliza para calcular el
error estndar estimado para el estimador como sigue:

p (1 p) p (1 p)

n
n

El estadstico de contraste se convierte en:


Z=

( p p ) ( p p )

1. Contraste bilateral
El contraste bilateral sobre la diferencia de proporciones es

Entonces se define

y se rechaza la hiptesis nula si Zexp<-z1-

/2

o si Zexp>-z1-

/2

2. Contrastes unilaterales
En el contraste

18

Se rechazar H0 si Zexp< -z1- .


Para el test contrario

Se rechaza H0 si Zexp> -z 1- .
Ejemplo: En un estudio para comparar un nuevo tratamiento para la migraa
con el tratamiento habitual, 78 de los 100 individuos que recibieron el
tratamiento habitual respondieron favorablemente. De los 100 individuos que
recibieron el nuevo tratamiento, 90 respondieron satisfactoriamente.
Proporcionan estos datos la evidencia suficiente para afirmar que el nuevo
tratamiento es ms efectivo que el habitual?
Solucin: Se calculan:

= 78/100=0.78
p=

=90/100=0.90

90 78
=0.84
100 100

Las hiptesis son: H0=p2-p1 0


H1= p2-p1>0
Sea =0.05. El valor crtico de z es 1.645. Se rechaza H0 si el valor de z es
mayor que 1.645.
El clculo del estadstico de prueba es:
(0.90 0.78)

z=

(0.84)(0.16) (0.84)(0.16)

100
100

0.12
=2.32
0.0518

Como 2.32>1-645, se rechaza H0. Estos datos sugieren que el tratamiento es


ms efectivo que el habitual

EJERCICIOS DE DISTRIBUCION MUESTRAL:


1. Un investigador se siente inclinado a creer que los niveles de vitamina A en
el hgado de dos poblaciones de seres humanos tiene, cada una, una
distribucin normal. Se supone que las varianzas de las dos poblaciones son
las siguientes:

19

Poblacin 1:

21=19.600

Poblacin 2:

22=8100

Cul es la probabilidad de que una muestra aleatoria de tamao 15 de la


primer poblacin y otra de tamao 10 de la segunda poblacin proporcionen un
valor de
mayor o igual a 50, si no hay diferencia entre las dos medias de
la poblacin?
2. Se cree que en una ciudad el 20% de las familias tiene por lo menos un
miembro que sufre de algn malestar debido a la contaminacin atmosfrica.
=0.27. Si el valor
Una muestra aleatoria de 150 familias produjo un valor de p
del 20% es correcto, Cul es la probabilidad de obtener una proporcin
muestral mayor o igual de la muestra?
3. Si las concentraciones de acido rico en hombres adultos normales siguen
una distribucin aproximadamente normal, con una media y desviacin
estndar de 5.7 y 1 mg por ciento, respectivamente, encontrar la probabilidad
de que una muestra aleatoria de tamao 9 proporcione una media:
a. Mayor que 6
b. Menor que 5.2
c. Entre 5 y 6
1. En una poblacin de nios con retardo mental, se sabe que la proporcin de
los que son hiperactivos es de 0.40. Se extrajo una muestra aleatoria de
tamao 120 de esa poblacin y otra de tamao 100 a partir de otra poblacin
con el mismo problema. Si la proporcin de nios hiperactivos es la misma en
ambas poblaciones, Cul es la probabilidad de que la muestra proporcione
1- p
2 de 0.16 o mas?
una diferencia p
2. Supngase que una poblacin se compone de los siguientes valores: 1, 3,
5, 7, 9. Construir la distribucin muestral de x a partir de muestras de tamao 2
seleccionadas sin reemplazo. Calcular la media y la varianza.
3. Para una poblacin de hombres jvenes de 17 aos y otra poblacin de
mujeres de 17 aos, las medias y desviaciones estndar respectivamente del
grosor del pliegue subescapular son: para los varones 9.7 y 6.0; y para las
mujeres 15.6 y 9.5. Si se obtiene una muestra aleatoria simple de 40 varones y
otra de 35 mujeres a partir de dicha poblacin, Cul es la probabilidad de que
la diferencia entre las medias de las muestras (x chicas - xchicos) sea mayor que 10?
4. El resultado de una investigacin sanitaria revela que el 55% de los
individuos de la poblacin A y el 35% de los de la poblacin B no padecen
enfermedades cardiovasculares. Suponer que se extrae una muestra aleatoria
de tamao 120 a partir de la poblacin A, y una muestra aleatoria
independiente de tamao 130 de la poblacin B. Cul es la probabilidad de
A - p
B est entre
que las diferencias entre las proporciones de la muestras p
0.30 y 0.40)?

20

5. En una muestra al azar de 75 adultos, 35 de ellos consideran que el cncer


de mamas es curable. Si en la poblacin de la cual se extrajo la muestra, la
probabilidad real de quienes piensan que dicho tipo de cncer es curable es de
0.55, Cul es la probabilidad de obtener una proporcin muestral menor o
igual que la obtenida en esta muestra?

EJERCICIOS DE ESTIMACION:
1. En cierta comunidad se efectu un anlisis neurolgico a 110 empleados de
una fbrica de herbicidas, el cual mostr que 44 tenan anormalidades
neurolgicas. En una muestra de 150 residentes que no eran empleados de la
fbrica, 16 individuos mostraron anormalidades neurolgicas. Construir un
intervalo de confianza del 95% para la diferencia entre las proporciones de las
poblaciones.
2. En un experimento diseado para estimar el nmero promedio de latidos del
corazn por minuto para cierta poblacin, se encontr que el nmero promedio
de latidos por minutos para 49 personas era de 90. Si resulta lgico suponer
que esos 49 pacientes constituyen una muestra aleatoria y que la poblacin
sigue una distribucin normal, con una desviacin estndar de 10, calcular el
intervalo de confianza de 90% y 95% para .
3. Se llevo a cabo un estudio para comparar las concentraciones de lipoprotena de alta densidad en hombres adultos con trabajos sedentarios y con
trabajos manuales. Los datos de la muestra proporcionaron los siguientes
resultados:
Trabajadores sedentarios: x = 56.5, s =14.1, n=55
Trabajadores manuales: x = 51.3, s =13.5, n=50
Construir un intervalo de confianza del 95% para la diferencia entre las medias
de las poblaciones.
4. A nueve pacientes que sufren la misma incapacidad fsica, y por lo tanto son
comparables, se les pidi que llevaran a cabo cierta tarea como parte de un
experimento. El tiempo promedio necesario para realizar la tarea fue de siete
minutos con una desviacin estndar de dos minutos. Suponiendo que la
distribucin de datos es normal, construir intervalos de confianza del 90% y
95% para el tiempo medio real necesario para que este tipo de pacientes
efecte la tarea.
5. En un estudio diseado para establecer la relacin entre un medicamento y
cierta anomala en los embriones de pollo, se inyectaron con el medicamento
50 huevos fecundados al cuarto da de incubacin. En el vigsimo da de
incubacin se examinaron los embriones y se observ la presencia de la
anomala en 12 de ellos. Encontrar los intervalos de confianza del 95% y 99%
para p.
6. Veinticuatro animales de laboratorio con deficiencia de vitamina D fueron
divididos en dos grupos iguales. El grupo 1 recibi un tratamiento consistente
en una dieta que proporcionaba la vitamina D. El segundo grupo no fue tratado.

21

Al trmino del perodo experimental, se midieron las concentraciones de calcio


en suero, obtenindose los siguientes resultados:
Grupo tratado: x = 11.1mg/100ml, s = 1.5
Grupo sin tratamiento: x = 7.8mg/100ml, s = 2.0
Suponer que las poblaciones siguen una distribucin normal con varianzas
iguales y calcular los intervalos de confianza del 95% para la diferencia entre
las medias de las poblaciones.
7. Algunos estudios acerca de la enfermedad Alzheimer han demostrado un
incremento en la produccin de 14CO2 en pacientes con este padecimiento.
Durante un estudio, se obtuvieron los siguientes valores de a partir de 16
biopsias de neocorteza de pacientes con la enfermedad:
1009, 1280, 1180, 1255, 1547, 2352, 1956, 1080
1776, 1767, 1680, 2050, 1452, 2857, 3100, 1621
Suponer que la poblacin de tales valores presenta una distribucin normal con
una desviacin estndar de 350 y construir intervalos de confianza al 95% para
la media de la poblacin.
EJERCICIOS DE CONTRASTE DE HIPOTESIS:
1. Es posible concluir que los nios crnicamente enfermos tienden, en
promedio, a tener menos confianza en s mismos que los nios sanos? Se
aplic una prueba diseada para estimar la confianza en s mismos de 16 nios
crnicamente enfermos y a 21 nios sanos. Los puntajes medios y
desviaciones estndar fueron:
Nios enfermos: x =22.5 s=4.1
Nios sanos: x =26.9 s=3.2
Sea =0.05
2. En una muestra de 1500 residentes de un barrio de la ciudad, quienes
participaron en un programa selectivo de salud, 125 pruebas proporcionaron
resultados positivos en cuanto a la anemia de clulas falciformes.
Proporcionan estos datos la evidencia suficiente para indicar que la
proporcin de individuos con anemia de clulas falciformes en la poblacin
muestreada es mayor que 0.06? Sea =0.05.
3. Setenta pacientes que sufren de epilepsia se dividieron al azar en dos
grupos iguales. El grupo A recibi un tratamiento que inclua dosis diarias de
vitamina D. El grupo B recibi el mismo tratamiento con la excepcin de que a
este grupo se le dio un placebo en lugar de la vitamina D. El nmero medio de
ataques convulsivos observados durante el periodo de tratamiento en los
grupos fue x A=15 y x B=24. Las varianzas de las muestras fueron S 2A=8 y
S2B=12. Estos datos proporcionan evidencia suficiente para indicar que la
vitamina D es efectiva para disminuir el nmero de ataques convulsivos? Sea
=0.05
4. En una muestra de 49 adolescentes que se prestaron como sujetos para un
estudio inmunolgico, una variable de inters fue la prueba del dimetro de
reaccin de la piel a un antgeno. La media de la muestra y la desviacin
estndar fueron 21 y 11 mm de eritema, respectivamente. Es posible concluir

22

a partir de estos datos que la media de la poblacin es menor que 30? Sea
=0.05.
5. Se desea saber si los nios de dos grupos tnicos difieren con respecto a la
proporcin de anmicos. De cada grupo se extrajo una muestra de nios de un
ao de edad atendidos en cierto grupo de departamentos de salud locales en
un periodo de un ao. Se obtuvo la siguiente informacin respecto a la anemia:
Grupo tnico
1
2

Nmero de elementos
450
375

Nmero de anmicos
105
120

Proporcionan estos datos la suficiente evidencia para indicar una diferencia


entre las dos poblaciones con respecto a la proporcin de anmicos? Sea
=0.05.
6. Una muestra de 100 empleados de un hospital, los cuales haban estado en
contacto con sangre o sus derivados, fue examinada para averiguar si
presentaban evidencia serolgica de hepatitis B. Se encontr que 23 de ellos
presentaron resultados positivos. Es posible concluir a partir de estos datos
que la proporcin de la poblacin de individuos que presentaron resultados
positivos en la poblacin muestreada es mayor que 0.15? Sea =0.05
7. Se desea saber si es posible concluir que el consumo medio diario de
caloras de la poblacin rural de un pas en desarrollo es de menos de 2000.
Una muestra de 500 individuos produjo un consumo medio de 1985 y una
desviacin estndar de 210. Sea =0.05.

23

You might also like