You are on page 1of 43

ESTADISTICA I

Tema 5: Contraste de hip


otesis

I Planteamiento del problema


I Conceptos basicos: hip otesis nula y alternativa, tipos de errores,
nivel de significacion, regi
on crtica o de rechazo, tamano del test,
potencia
I Contrastes para la media de una distribuci
on
I Consistencia de tests. Tests insesgados y UMP
I p-valor
I Contrastes para dos muestras. Distribuci
on F de Fisher-Snedecor
I Lema de Neyman-Pearson. Tests
optimos
I Construccion de tests: test de raz
on de verosimilitudes, test
bayesiano.

Estadstica I (Mat/DG). Profesora: Amparo Ballo Tema 5: Contraste de hip


otesis 1
Planteamiento del problema. Conceptos b
asicos
El objetivo de la teora de contraste de hip
otesis es elegir entre dos
posibilidades excluyentes (hipotesis nula e hip
otesis alternativa)
relativas al valor de un parametro poblacional, a partir de la
informacion proporcionada por los datos muestrales.
Sea X1 , . . . , Xn una muestra aleatoria de una v.a. X con funcion
de distribucion F , donde .
Objetivo: Dada una particion del espacio parametrico
= 0 1 , deseamos decidir, en base a la muestra obtenida, si
0 o si 1 . Queremos contrastar

H0 : 0 (hip
otesis nula)
H1 : 1 (hip
otesis alternativa)

Un test para contrastar estas dos hip otesis consiste en proporcionar


una regla de decision que, a cada posible observacion de la muestra
(x1 , . . . , xn ), le asigne una decisi
on: aceptar o rechazar H0 .
Estadstica I (Mat/DG). Profesora: Amparo Ballo Tema 5: Contraste de hip
otesis 2
Los contrastes habituales (no aleatorizados) se definen mediante
una region crtica o regi on de rechazo R Rn , de tal manera que,
cuando (x1 , . . . , xn ) R, se rechaza la hip
otesis nula.

Espacio muestral
Decisin
Regin crtica
o de rechazo
R Rechazo H0

(x1,...,xn)
TEST
Regin de
aceptacin A
Acepto H0
(x1,...,xn)

Estadstica I (Mat/DG). Profesora: Amparo Ballo Tema 5: Contraste de hip


otesis 3
Es importante destacar que la metodologa de contraste de
hipotesis no demuestra la validez de la hip
otesis que se acepta
en cada caso (en el sentido en el que se demuestra algo mediante
un metodo deductivo, por ejemplo).

La manera correcta de interpretar los resultados es decir que los


datos disponibles proporcionan (o no proporcionan) evidencia
estadstica suficiente en contra de la hip
otesis nula. En todo caso,
la conclusion depende de informaci on incompleta y aleatoria,
procedente de una o varias muestras, y siempre existe la posibilidad
de cometer un error aceptando una hip otesis equivocada.

Los procedimientos que se utilizan habitualmente se suelen


denominar contrastes o tests de hip
otesis.

Estadstica I (Mat/DG). Profesora: Amparo Ballo Tema 5: Contraste de hip


otesis 4
Posibles errores de un test:
I Error de tipo I: Rechazar H0 cuando H0 es cierta.
I Error de tipo II: Aceptar H0 cuando H0 es falsa.

La funcion de potencia de un test con regi


on de rechazo R para
contrastar H0 : 0 frente a H1 : 1 es la funcion

n : [0, 1]
7 n () = P {(X1 , . . . , Xn ) R}

Lo que nos gustara:


Potencia = 1

Potencia = 0

0 1

Estadstica I (Mat/DG). Profesora: Amparo Ballo Tema 5: Contraste de hip


otesis 5
Lo que en realidad se suele hacer (teora de Neyman-Pearson):
1. Acotar la m axima probabilidad de error de tipo I.
Se fija un nivel de significaci
on (0, 1). Tpicamente
= 0, 05.
Se define el tama no de un test como la maxima probabilidad
de error de tipo I: max P (R) = max n ().
0 0
Se busca una regi
on de rechazo R tal que max P (R) .
0
2. Minimizar la probabilidad de error de tipo II. Se intenta
buscar una region de rechazo R que maximice la funcion de
potencia cuando 1 .

Las hip
otesis H0 y H1 no son sim
etricas.

Estadstica I (Mat/DG). Profesora: Amparo Ballo Tema 5: Contraste de hip


otesis 6
Como vemos, los test de hipotesis estan dise
nados para controlar la
probabilidad maxima de rechazar H0 cuando es cierta. En
consecuencia, suelen ser conservadores con la hipotesis nula:
hace falta mucha evidencia muestral para rechazar H0 .

Observemos que es posible que, con los mismos datos, H0 se


rechace para un nivel de significaci
on = 0.05 y se acepte para
= 0.01.

En una primera aproximaci on, los problemas de contraste de


hipotesis pueden clasificarse en problemas de una muestra (cuando
hay una sola poblacion de interes) y problemas de dos muestras
(cuando se quiere comparar dos poblaciones y se dispone de una
muestra de cada una de ellas). Presentaremos las ideas basicas en
el caso de los problemas de una muestra pero pueden extenderse
de modo analogo a los de dos muestras.

Estadstica I (Mat/DG). Profesora: Amparo Ballo Tema 5: Contraste de hip


otesis 7
Un ejemplo ilustrativo y sus consecuencias
Ejemplo: Se analiza un envo de botellas de aceite envasado con
un mecanismo del que se afirma que, en media, rellena las botellas
con 100 cl. de aceite. Examinada una muestra de 5 botellas se
obtiene que el promedio es 95 cl. y la cuasivarianza es 1.1.
Suponemos que la v.a. X = contenido de aceite (en cl.) en una
botella sigue una distribuci
on N(, ). Hay suficiente evidencia
emprica para afirmar que el contenido medio de las botellas no es
100 cl.?
Queremos contrastar
H0 : = 100, frente a H1 : 6= 100.
Otra posibilidad sera preguntarse si existe evidencia emprica
suficiente para afirmar que el consumidor recibe, en promedio,
menos cantidad de la que indica la etiqueta. En ese caso, el
planteamiento correcto sera contrastar
H0 : 100, frente a H1 : < 100.
Estadstica I (Mat/DG). Profesora: Amparo Ballo Tema 5: Contraste de hip
otesis 8
Ejemplo (cont.): Tenemos, por tanto, un problema del tipo:

contrastar H0 : = 0 frente a H1 : 6= 0

(siendo 0 un valor prefijado) a partir de una muestra X1 , . . . , Xn


extrada de N(, ).

on del test (0, 1) (por


Para ello prefijamos el nivel de significaci
ejemplo, = 0.05) y observamos que, si H0 fuera cierta,
0
X
tn1 . (1)
s/ n

Por otra parte, esta claro que deberamos sospechar que H0 es falsa
(y, por tanto, H1 es cierta) cuando x resulte estar suficientemente
alejada de 0 . El resultado (1) nos ayuda a decidir, de un modo
racional, que es lo que significa suficientemente alejada.

Estadstica I (Mat/DG). Profesora: Amparo Ballo Tema 5: Contraste de hip


otesis 9
Ejemplo (cont.): En efecto, dada una muestra x1 , . . . , xn , parece
muy natural decidir que H0 es falsa cuando tengamos

x 0
> tn1;/2 . (2)
s/ n

ya que, en este caso, tenemos una muestra que sera muy rara si
realmente H0 fuera cierta.
Observese que, de todos modos, hay una probabilidad , prefijada,
de cometer un error de tipo I (rechazar H0 siendo cierta).
Analogamente, si el problema hubiera sido contrastar

H0 : 0 frente a H1 : < 0 ,

un criterio razonable para rechazar H0 con un nivel de significacion


sera
x 0
< tn1; . (3)
s/ n

Estadstica I (Mat/DG). Profesora: Amparo Ballo Tema 5: Contraste de hip


otesis 10
Ejemplo (cont.): En el ejemplo del envasado de aceite x = 95,
s 2 = 1.1, n = 5. Por tanto,

x 0
= 10.66
s/ n

y como 10.66 > t4;0.025 = 2.776445, H0 : = 100 se rechaza al


nivel de significacion = 0.05 y, dado que
10.66 > t4;0.005 = 4.604095, tambien se rechaza al nivel 0.01.

Sin embargo, supongamos que hubieramos obtenido x = 98,


s 2 = 1.1, n = 5. Entonces

x 0
= 4.264014
s/ n

y la hipotesis H0 se rechazara al nivel = 0.05 pero NO se


rechazara al nivel 0.01.

Estadstica I (Mat/DG). Profesora: Amparo Ballo Tema 5: Contraste de hip


otesis 11
Ejemplo (cont.): En el ejemplo de las botellas, supongamos que
queremos contrastar

H0 : 100 frente a H1 : < 100.

Entonces el criterio para rechazar H0 con un nivel de significacion


sera
x 100
< t4; .
s/ 5
Supongamos que hubieramos obtenido x = 98. Entonces
x 100
= 4.2640. Como t4;0.01 = 3.7469, la hipotesis nula
s/ 5
H0 : 100 se rechaza al nivel 0.01 (y tambien por supuesto, al
nivel 0.05, ya que t4;0.05 = 2.1318).

Estadstica I (Mat/DG). Profesora: Amparo Ballo Tema 5: Contraste de hip


otesis 12
Algunas consecuencias y observaciones:

El anterior ejemplo es un solo un caso particular de contraste de


hipotesis, pero nos permite extraer algunas consecuencias y dar
algunas definiciones generales sobre la metodologa del contraste
de hipotesis.
I Asimetra de las hip
otesis: H0 se acepta a menos que se haya
obtenido suficiente evidencia estadstica en contra de ella. Por
esta razon, cuando H0 se acepta no debe pensarse que se ha
demostrado su validez. H0 representa la hip otesis que estamos
dispuestos a aceptar a menos que se obtengan fuertes indicios
en contra.
I Errores de tipo I y II: En todo caso siempre hay una
probabilidad positiva de cometer uno de los dos posibles errores:
rechazar H0 cuando es cierta (error de tipo I) o aceptar H0
cuando es falsa (error de tipo II).

Estadstica I (Mat/DG). Profesora: Amparo Ballo Tema 5: Contraste de hip


otesis 13
I El nivel de significaci
on: Los tests usuales estan construidos de
modo que la maxima probabilidad de cometer el error de tipo I
esta acotada por un valor prefijado , el nivel de significacion
(no confundir con el nivel de confianza de los intervalos).
I La decision de rechazar o aceptar H0 depende del nivel de
significacion elegido. Cuanto mas pequeno es mas
conservador se hace el test a favor de H0 , es decir, que para
aceptar H1 cuando es muy peque no, debemos tener mucha
evidencia estadstica.
I Cuando se toma una decisi on (aceptar o rechazar H0 ) debe
indicarse siempre el nivel de significaci
on del test que se ha
utilizado.
I Cuando se acepta H0 no debe pensarse que se ha demostrado
H0 sino que no se ha encontrado suficiente evidencia emprica
(al nivel prefijado ) en contra de H0 .

Estadstica I (Mat/DG). Profesora: Amparo Ballo Tema 5: Contraste de hip


otesis 14
I Cuando se acepta H1 debe recordarse tambien que la
interpretacion correcta es que los datos obtenidos
proporcionan suficiente evidencia estadstica al nivel para
aceptar H1 . Una muestra diferente (o un nivel de significacion
mas bajo) podran haber llevado a conclusiones distintas.
I Dualidad con los intervalos de confianza: en algunos casos de
hipotesis nula simple (i.e. del tipo H0 : = 0 ) el test usual
rechaza H0 (al nivel de significaci on ) si y s
olo si el intervalo
de nivel de confianza 1 no contiene al valor 0 .
Ejemplo: Si X N(, ) la regi on de rechazo
 
s
x 0 | tn1;/2
R = (x1 , . . . , xn ) : |
n
del contraste
H0 : = 0

H1 : 6= 0
equivale a
R = {(x1 , . . . , xn ) : 0
/ IC1 ()} .
Estadstica I (Mat/DG). Profesora: Amparo Ballo Tema 5: Contraste de hip
otesis 15
Contrastes para la media de una distribuci
on
En cada caso se rechaza H0 cuando (x1 , . . . , xn ) R.

Distribuci
on normal con varianza conocida: Sea X1 , . . . , Xn
una muestra aleatoria de X N(, ) con conocido.
 

H0 : = 0 R = (x1 , . . . , xn ) : |x 0 | z/2
n
 

H0 : 0 R = (x1 , . . . , xn ) : x 0 z
n
 

H0 : 0 R = (x1 , . . . , xn ) : x 0 z1
n

donde z es tal que (z ) = 1 siendo la funcion de


distribucion de la N(0, 1).

Estadstica I (Mat/DG). Profesora: Amparo Ballo Tema 5: Contraste de hip


otesis 16
Distribuci on normal con varianza desconocida: Sea
X1 , . . . , Xn una muestra aleatoria de X N(, ) con
desconocido.
 
s
H0 : = 0 R = (x1 , . . . , xn ) : |x 0 | tn1;/2
n
 
s
H0 : 0 R = (x1 , . . . , xn ) : x 0 tn1;
n
 
s
H0 : 0 R = (x1 , . . . , xn ) : x 0 tn1;1
n

Estadstica I (Mat/DG). Profesora: Amparo Ballo Tema 5: Contraste de hip


otesis 17
Tests de nivel aproximado (muestras grandes) para la
media de cualquier distribucion: Sea X1 , . . . , Xn una muestra
aleatoria de X con E(X ) = < .

H0 : = 0 , frente a H1 : 6= 0
 
x 0
R = (x1 , . . . , xn ) : > z/2

s/ n

H0 : 0 , frente a H1 : > 0
 
x 0
R = (x1 , . . . , xn ) : > z
s/ n

H0 : 0 , frente a H1 : < 0
 
x 0
R = (x1 , . . . , xn ) : < z
s/ n

Estadstica I (Mat/DG). Profesora: Amparo Ballo Tema 5: Contraste de hip


otesis 18
Tests de nivel aproximado (muestras grandes) para el
parametro p en una Bernoulli: Sea X1 , . . . , Xn una muestra
aleatoria de X Bernoulli(p).

H0 : p = p0 , frente a H1 : p 6= p0 .

El criterio de rechazo es (x1 , . . . , xn ) R, siendo




x p0
R = (x1 , . . . , xn ) : q > z/2
p0 (1p0 )

n

y analogamente para los tests con hip


otesis H1 unilaterales.

En el formulario que se puede descargar de la pagina web


hay una lista de las regiones crticas correspondientes a
los contrastes de uso mas frecuente.

Estadstica I (Mat/DG). Profesora: Amparo Ballo Tema 5: Contraste de hip


otesis 19
Contrastes para la varianza de una normal
Sea X1 , . . . , Xn una muestra aleatoria de X N(, ) con
desconocido.
(n 1)s 2
 
2 2
H0 : = 0 R=
/ (n1;1/2 , n1;/2 )
02
= {02
/ IC1 ( 2 )}

(n 1)s 2
 
H0 : 0 R= 2n1;
02
(n 1)s 2
 
H0 : 0 R= 2n1;1
02

Estadstica I (Mat/DG). Profesora: Amparo Ballo Tema 5: Contraste de hip


otesis 20
El concepto de p-valor
Dado un test, definido para todos los niveles de significacion
posibles, se define el p-valor, para unos datos prefijados, como el
nfimo de los valores para los cuales se rechaza la hipotesis nula
a un nivel de significaci
on .

P(x1 , . . . , xn ) = inf{ : H0 es rechazada al nivel }.

Cuanto mas pequeno es el p-valor, mas evidencia estadstica


aportan los datos a favor de H1 .

El p-valor se puede interpretar como la probabilidad de obtener un


valor al menos tan raro como el que se ha obtenido cuando H0
es cierta.

Estadstica I (Mat/DG). Profesora: Amparo Ballo Tema 5: Contraste de hip


otesis 21
Ejemplo: Los lagartos del desierto se esconden del calor en verano
para evitar que su temperatura corporal interna llegue al nivel letal
de 45o C. Se ha tomado una muestra para estudiar el tiempo X (en
minutos) requerido para que la temperatura de un lagarto alcance
los 45o C, partiendo de su temperatura normal mientras estaban en
la sombra. Se han obtenido los siguientes datos:
10,1 12,5 12,2 10,2 12,8 12,1
11,2 11,4 10,7 14,9 13,9 13,3

Suponiendo que X sigue una distribuci on N(, ) y, en base a


estos datos, puede concluirse que el tiempo medio requerido para
alcanzar la temperatura letal es menor que 13 minutos?

Estadstica I (Mat/DG). Profesora: Amparo Ballo Tema 5: Contraste de hip


otesis 22
Contrastes para dos muestras
Caso de muestras independientes:

Se tienen dos muestras X1 , . . . , Xn1 e Y1 , . . . , Yn2 de dos v.a. X e


Y . Ambas muestras se suponen independientes entre s. Se desea
contrastar hipotesis del tipo

H0 : 1 = 2

H0 : 1 2

H0 : 1 = 2

En los ejercicios propuestos se pueden encontrar varios ejemplos.

Estadstica I (Mat/DG). Profesora: Amparo Ballo Tema 5: Contraste de hip


otesis 23
Uno de los tests mas usuales es el de igualdad de medias para dos
poblaciones normales homocedasticas, es decir, con 1 = 2 :
Se puede probar que, bajo H0 : 1 = 2 ,
Y
X
q tn1 +n2 2
sp n11 + 1
n2

y, por tanto, una region crtica al nivel es


 r 
1 1
R = | x y | > tn1 +n2 2;/2 sp +
n1 n2

siendo
(n1 1)s12 + (n2 1)s22
sp2 =
n1 + n2 2
la varianza combinada (pooled variance).

Estadstica I (Mat/DG). Profesora: Amparo Ballo Tema 5: Contraste de hip


otesis 24
Para contrastar la hipotesis de homocedasticidad (igualdad de
varianzas) de dos poblaciones normales presentamos una nueva
distribucion auxiliar.
Sean Q1 y Q2 v.a. independientes con distribuciones 2n1 y 2n2 ,
Q1 /n1
respectivamente. La distribuci
on de se denomina F de
Q2 /n2
Fisher-Snedecor con n1 y n2 grados de libertad, Fn1 ,n2 .
2.0
1.5

n1=1, n2=1

n1=2, n2=1

n1=5, n2=2

n1=100, n2=1
c(0, 2)
1.0

n1=100, n2=100
0.5
0.0

0 1 2 3 4 5
range(x)

Estadstica I (Mat/DG). Profesora: Amparo Ballo Tema 5: Contraste de hip


otesis 25
Si s12 , s22 son la cuasi-varianzas de dos muestras independientes de
tama no n1 y n2 extradas, respectivamente, de dos poblaciones
N(1 , 1 ) y N(2 , 2 ), se tiene

(n1 1)s12 2 (n2 1)s22


n 1 , 2n2 1 ,
12 1
22

Por tanto, bajo H0 : 1 = 2 ,

s12
Fn1 1,n2 1 .
s22

De este resultado se derivan los tests para comparar 1 y 2 .

Estadstica I (Mat/DG). Profesora: Amparo Ballo Tema 5: Contraste de hip


otesis 26
s12
 
H0 : 1 = 2 R=
/ (Fn1 1;n2 1;1/2 , Fn1 1;n2 1;/2 )
s22
  2 
1
= 1 / IC1
22
 2 
s1
H0 : 1 2 R= > Fn1 1;n2 1;
s22
 2 
s1
H0 : 1 2 R= < Fn1 1;n2 1;1
s22

Estadstica I (Mat/DG). Profesora: Amparo Ballo Tema 5: Contraste de hip


otesis 27
Caso de muestras emparejadas:

Surge en aquellas situaciones con n1 = n2 en que Xi e Yi no son


independientes (porque corresponden, por ejemplo, a mediciones
sobre el mismo individuo antes y despues de un tratamiento).
Se reducen a problemas de una muestra para la muestra de
diferencias Di = Xi Yi .
Puede verse un ejemplo en los problemas de la Relacion 5.

Estadstica I (Mat/DG). Profesora: Amparo Ballo Tema 5: Contraste de hip


otesis 28
Consistencia de tests. Tests insesgados y UMP
Se dice que una sucesi
on de tests con un nivel prefijado es
consistente cuando

lim n () = 1, 1 = \ 0 .
n

Se dice que un test es insesgado cuando

n () 0 y n () 1 .

Se dice que un test con funci


on de potencia n es uniformemente
mas potente (UMP) dentro de una clase Bn, de tests de nivel
basados en muestras de tama no n cuando

n () n (), 1

siendo n la funcion de potencia de cualquier otro test de la clase


Bn, .

Estadstica I (Mat/DG). Profesora: Amparo Ballo Tema 5: Contraste de hip


otesis 29
El lema de Neyman-Pearson
Se considera el problema de hip
otesis simple y alternativa simple

H0 : = 0 frente a H1 : = 1 .

Denotemos fn (x1 , . . . , xn ; ) = ni=1 f (xi ; ).


Q
Dado (0, 1), supongamos que la regi on
 
fn (x1 , . . . , xn ; 1 )
R = (x1 , . . . , xn ) : >k
fn (x1 , . . . , xn ; 0 )

verifica P0 (R ) = . Entonces

P1 (R ) P1 (R),

siendo R la region crtica de cualquier otro test tal que P0 (R) .


En otras palabras, R es el test optimo de nivel para el problema
considerado.

Estadstica I (Mat/DG). Profesora: Amparo Ballo Tema 5: Contraste de hip


otesis 30
Demostraci on del lema de Neyman-Pearson: Denotemos
x = (x1 , . . . , xn )
Z Z
P1 (R ) P1 (R) = fn (x; 1 )dx fn (x; 1 )dx,
R R c R c R
pero, por definicion de R ,
Z Z
fn (x; 1 )dx k fn (x; 0 )dx
R R c R R c
y tambien
Z Z
fn (x; 1 )dx k fn (x; 0 )dx.
R c R R c R
Por lo tanto
Z Z 

P1 (R ) P1 (R) k fn (x; 0 )dx f (x; 0 )dx
c R c R
Z Z R R 
=k fn (x; 0 )dx fn (x; 0 )dx
R R
= k [P0 (R ) P0 (R)] 0. 
Estadstica I (Mat/DG). Profesora: Amparo Ballo Tema 5: Contraste de hip
otesis 31
Familias param
etricas con cociente de verosimilitudes
mon
otono y tests optimos
I Como construir tests
optimos en problemas que no sean de hipotesis
simple y alternativa simple?
I Consideremos el caso en que el modelo es de la forma f (; ), siendo
, donde R es un intervalo.
Qn
I Sea fn (x1 , . . . , xn ; ) = i=1 f (xi ; ).
I Supongamos que queremos contrastar H0 : 0 frente a H1 : > 0 .

Definicio n.- Se dice que f (|) es una familia parametrica con


cociente de verosimilitudes mon otono (CVM) si existe un
estadstico Tn (x1 , . . . , xn ) tal que, para todo 1 , 2 , con 1 < 2 , la
razon de verosimilitudes
fn (x1 , . . . , xn ; 2 )
fn (x1 , . . . , xn ; 1 )

es una funcion monotona no decreciente de Tn (x1 , . . . , xn ).


Estadstica I (Mat/DG). Profesora: Amparo Ballo Tema 5: Contraste de hip
otesis 32
Como consecuencia directa del Lema de Neyman-Pearson y de la
anterior definicion se tiene

Teorema.- Supongamos que f (; ) cumple la propiedad CVM y


que k es tal que
P0 {Tn > k } = .
Supongamos ademas que P {Tn = c} = 0, para todo y c.
Entonces, R = {(x1 , . . . , xn ) : Tn (x1 , . . . , xn ) > k } es la region
crtica de un test optimo (uniformemente mas potente) de nivel
para contrastar H0 : 0 frente a H1 : > 0 .

Un resultado analogo es valido para H0 : 0 frente a


H1 : < 0 aunque en este caso la propiedad CVM debe cumplirse
cambiando no decreciente por no creciente.

Estadstica I (Mat/DG). Profesora: Amparo Ballo Tema 5: Contraste de hip


otesis 33
Ejemplo: Sea f (; ) una uniforme en (0, ). La propiedad CVM se
cumple con Tn (x1 , . . . , xn ) = max{x1 , . . . , xn }. Por tanto, el test
optimo de nivel para H0 : 0 frente a H1 : > 0 es
 n
k
R = {(x1 , . . . , xn ) : max{x1 , . . . , xn } > k }, donde 1 =
0

es decir, k = exp n1 log(1 ) + log(0 ) .




Ejemplo: Si f (x; ) = e x 1[0,) Pn(x), la propiedad CVM se


cumple con Tn (x1 , . . . , xn ) = 1/ i=1 xi .
Por tanto, el test optimo de nivel para H0 : 0 frente a
H1 : > 0 es
n
1 X 1
R = {(x1 , . . . , xn ) : Pn > k } donde P0 { Xi < } = .
x
i=1 i k
i=1

El valor kP
se puede calcular teniendo en cuenta que, si = 0 ,
entonces ni=1 Xi (0 , n) porque X exp(0 ) = (0 , 1).

Estadstica I (Mat/DG). Profesora: Amparo Ballo Tema 5: Contraste de hip


otesis 34
Construccion de tests. Test de cociente de
verosimilitudes
Sea f (; ) donde = (1 , . . . , k ) Rk , siendo un
intervalo de Rk .
Dada una muestra x = (x1 , . . . , xn ), sea fn (x; ) = ni=1 f (xi ; ).
Q

Consideremos el problema de contrastar

H0 : i = ci , para i = 1, . . . , r (con r k)
H1 : i 6= ci para alg
un i = 1, . . . , r

El estadstico del contraste de raz


on de verosimilitudes es
sup0 fn (x; )
n = ,
sup fn (x; )

donde 0 = { : = (c1 , . . . , cr , r +1 , . . . , k )}.


El contraste de razon de verosimilitudes tiene como region de
rechazo R = {(x1 , . . . , xn ) : n (x1 , . . . , xn ) k }.
Estadstica I (Mat/DG). Profesora: Amparo Ballo Tema 5: Contraste de hip
otesis 35
Teorema.- Supongamos que
(i) El emv n es estimador consistente (en probabilidad) del
parametro .
(ii) Para todo x, la funcion log f (x; ) tiene derivadas parciales
terceras (respecto a las componentes j de ) continuas.
(iii) En las integrales que involucran a la funci
on f (x; ) se
pueden permutar las derivadas con el signo integral.
(iv) La matriz
 de2 informaci on de
 Fisher

I() = i j log f (X ; ) es invertible para cada .
1i,jk
Entonces, bajo H0 ,
d
2 log n 2r . (4)

Estadstica I (Mat/DG). Profesora: Amparo Ballo Tema 5: Contraste de hip


otesis 36
Aplicaci
on a tests de bondad de ajuste

Sea X una v.a. discreta que toma los valores a1 , . . . , ak .


Denotemos pi = P(X = ai ). Supongamos que se desea contrastar

H0 : pi = pi0 , i = 1, . . . , k

basado en una muestra x1 , . . . , xn . Observese que, en este caso,


con la notacion del teorema, r = k 1 porque cuando se fijan
k 1 probabilidades pi queda fijada la probabilidad restante.

Por tanto, H0 se rechaza al nivel cuando

2 log n > 2k1; ,

Estadstica I (Mat/DG). Profesora: Amparo Ballo Tema 5: Contraste de hip


otesis 37
Aqu el numerador de n es
n! Ok
p O1 . . . pk0 ,
O1 ! . . . Ok ! 10
siendo Oj = #{i : xi = aj } las frecuencias observadas de los distintos
valores de la variable [n
otese que, bajo H0 , (O1 , . . . , Ok ) tiene
on multinomial M(n; p10 , . . . , pk0 )]. El denominador de n es
distribuci
 O1  Ok
n! O1 Ok
... .
O1 ! . . . Ok ! n n

Sustituyendo en n es inmediato ver que el estadstico de contraste se


puede expresar en la forma
k  
X Oi
2 log n = 2 Oi log ,
ei
i=1

donde ei = npi0 , i = 1, . . . , k son las frecuencias esperadas (bajo H0 )


de los distintos valores de la variable en una muestra de tama no n.

Estadstica I (Mat/DG). Profesora: Amparo Ballo Tema 5: Contraste de hip


otesis 38
Un ejemplo cl
asico: el experimento de Mendel
En el famoso experimento de Mendel se
cruzaron plantas de guisantes con fenotipo
rugoso-amarillo con otras de fenotipo liso-
verde. En la segunda generaci on se podan
observar cuatro fenotipos (liso-amarillo,
rugoso-amarillo, liso-verde, rugoso-verde)
cuyas respectivas probabilidades, seg un la
teora de la herencia mendeliana, deban ser
9 3 3 1
p10 = , p20 = , p30 = , p40 = .
16 16 16 16
Observados n = 556 guisantes en la segunda
generaci
on del experimento se obtuvieron los
siguientes n
umeros de guisantes con estos
fenotipos:

O1 = 315, O2 = 101, O3 = 108, O4 = 32.

Estadstica I (Mat/DG). Profesora: Amparo Ballo Tema 5: Contraste de hip


otesis 39
Proporcionan estos resultados alguna evidencia en contra de la
teora mendeliana?
9 1
Aplicamos el test para contrastar H0 : p1 = 16 , . . . , p4 = 16 :

9 3 1
e1 = 556 = 312.75, e2 = e3 = 556 = 104.25, e4 = 556 = 34.75
16 16 16
En definitiva, el test de cociente de verosimilitudes compara las Oi
con las ei y rechaza la hipotesis nula cuando hay demasiadas
diferencias entre ellas. Esto se hace formalmente mediante el
estadstico
k  
X Oi
2 log n = 2 Oi log = 0.4754
ei
i=1

on 23 ) es 0.9281 lo
El p-valor (calculado a partir de la distribuci
que, por supuesto, no indica ninguna evidencia estadstica en
contra de H0 .

Estadstica I (Mat/DG). Profesora: Amparo Ballo Tema 5: Contraste de hip


otesis 40
Hay una controversia clasica en la historia de la ciencia en el
sentido de que los resultados de Mendel eran demasiado buenos,
es decir, haba demasiada concordancia entre las Oi y las ei (por
ejemplo, R.A. Fisher era de esta opinion; ver su artculo de 1936,
Has Mendels work been rediscovered?, en The Annals of
Science).

Se ha sugerido que este supuesto exceso de concordancia poda


deberse a un sesgo de repetici on (confirmation bias) producido
por la repeticion de los resultados hasta que las Oi concordasen
fuertemente con las ei . Tambien se ha conjeturado que alg un
ayudante de Mendel pudo actuar con exceso de celo
manipulando los resultados. En todo caso, las ideas basicas de
Mendel eran acertadas y han tenido una influencia decisiva.

Estadstica I (Mat/DG). Profesora: Amparo Ballo Tema 5: Contraste de hip


otesis 41
Construcci
on de tests. Test bayesianos
Se desea contrastar

H0 : 0 frente a H1 : \ 0 .

Como siempre, la informaci


on procede de una muestra x1 , . . . , xn .

La metodologa bayesiana supone que la densidad que ha generado


los datos es f (|) y que el parametro puede considerarse como
una v.a. con distribucion a priori (). A partir de aqu se calculan
la distribucion a posteriori (|x1 , . . . , xn ) dada por

fn (x1 , . . . , xn |)()
(|x1 , . . . , xn ) = R ,
fn (x1 , . . . , xn |)()d
Qn
donde fn (x1 , . . . , xn |) = i=1 f (xi ; ).

Estadstica I (Mat/DG). Profesora: Amparo Ballo Tema 5: Contraste de hip


otesis 42
El elemento fundamental en la inferencia bayesiana es siempre la
distribucion a posteriori. A partir de ella se pueden calcular las
probabilidades a posteriori de ambas hip otesis
Z
P{ 0 |x1 , . . . , xn } = (H0 |x1 , . . . , xn ) = (|x1 , . . . , xn )d,
0
P{ 1 |x1 , . . . , xn } = (H1 |x1 , . . . , xn ) = 1 (H0 |x1 , . . . , xn ),

y decidir dependiendo de sus valores. Tpicamente se optara por


H1 cuando
(H1 |x1 , . . . , xn ) ,
donde (0, 1) es un valor que se fija dependiendo de la gravedad
que se atribuya al error de tipo I (rechazar H0 cuando es cierta).

Observemos que la metodologa bayesiana de contraste de hipotesis


depende fuertemente de la elecci
on de la distribucion a priori .

Estadstica I (Mat/DG). Profesora: Amparo Ballo Tema 5: Contraste de hip


otesis 43

You might also like