You are on page 1of 95

249

8.1. Introduccin
8.1.1. Definiciones
8.1.2. Pasos para la realizacin de un test
8.2. Tests paramtricos.
8.2.1. Contrastes clsicos sobre los parmetros
de una distribucin Normal
8.2.2. Contrastes clsicos sobre los parmetros
de dos distribuciones normales independientes
8.2.3. Contrastes clsicos para una proporcin p
8.2.4. Contrastes clsicos para la comparacin de
dos proporciones
8.3. Tests no paramtricos
8.3.1. Contrastes para la bondad de ajuste
8.3.2 Contrastes de homogeneidad
8.3.3 Contrastes para la independencia de dos
caracteres
8.3.4 Contraste de aleatoriedad. Test de
rachas
8.3.5 Test de Kolmogorov-Smirnov
8.3.6 Test de los rangos signados de
Wilcoxon
8.3.7 Test de Mann-Whitney-Wilcoxon
8.4. Anlisis de la varianza
TEMA 8. Tests de hiptesis
250
1. Test de Hiptesis: Procedimiento estadstico
mediante el cual se investiga la verdad o falsedad de
una hiptesis acerca de una caracterstica de una
poblacin o un conjunto de poblaciones
!8.1. Introduccin
!8.1.1. Definiciones
1.1. Tests paramtricos: Conocida una v.a. con
una determinada distribucin, se establecen
afirmaciones sobre los parmetros de dicha
distribucin
1.2. Tests no paramtricos: Las afirmaciones
establecidas no se hacen en base a la distribucin
de las observaciones, que a priori es desconocida.
251
Establecemos la afirmacin: 10
Tests paramtricos:
Sea X
1
, X
2
,..., X
n
una m.a.s. de una v.a. X con
distribucin Normal, N ( , ).
Tests no paramtricos:
" Anlisis de la aleatoriedad de la muestra
" Una variable aleatoria X tiene una distribucin
Normal
" Dos variables aleatorias X e Y son independientes
" Dos muestras independientes proceden de la
misma poblacin
Ejemplos:
252
Ejemplos:
Test paramtricos:
Test no paramtricos:
H
1
: La muestra no se ha seleccionado
aleatoriamente
2. Hiptesis del test:
!Hiptesis nula ( H
0
) : Hiptesis que se plantea
en un problema de contraste
!Hiptesis alternativa ( H
1
) : Hiptesis contraria
a la hiptesis nula
0
1
: 10
: 10
H
H

>
H
0
: La muestra se ha seleccionado
aleatoriamente
253
3. Estadstico del test
!Llamamos Estadstico del Test o Estadstico de
Contraste a una variable aleatoria, con distribucin de
probabilidad conocida, y cuyos valores nos permiten
tomar la decisin de aceptar o rechazar la hiptesis
nula.
!Al valor concreto que toma el estadstico del test
para la muestra escogida se llama Valor
Experimental del Estadstico de Contraste
0 0
1 0
:
:
H
H


=
!
"
#

"
$
; X N
n

% &

' (
) *
1 2
, ,...,
n
x x x
1
1
n
i
i
x x
n
=
=
+
254
4. Errores asociados al contraste
!Error tipo I: Error que se comete al rechazar la
hiptesis nula, H
0
, cuando sta es cierta.
!Error tipo II: Error que se comete al no rechazar la
hiptesis nula, H
0
, cuando sta es falsa
Error tipo II () Correcto Falsa
Correcto Error tipo I () Verdadera
No rechazo Rechazo
H
0
!Potencia del test: Probabilidad que se tiene en el
contraste de detectar que H
0
es falsa.
[ ]
[ ]
0 0
Error tipo I
Rechazar / es verdadera
P
P H H
= =
[ ]
[ ]
0 0
Error tipo II
No Rechazar / es falsa
P
P H H
= =
[ ]
0 0
1 Rechazar / es falsa P H H =
255
# Ejemplo Contrate de Hiptesis
Contrastar si la media de una poblacin N ( ; )
con conocida, toma un valor =
0
1. Planteamiento del test:
2. Estadstico del test:
Bajo la hiptesis nula:
Se toma una m.a.s. concreta:
cuya media valdr:
Si H
0
es cierta, la mayora de los valores de la
media muestral deben estar prximos al valor
0.
0 0
1 0
:
:
H
H


=
!
"
#

"
$
; X N
n

% &

' (
) *
0
; X N
n

% &

' (
) *
1 2
, ,...,
n
x x x
1
1
n
i
i
x x
n
=
=
+
256
3. Criterio de decisin: Comprobar si el valor concreto
de la media muestral calculada, est o no muy alejado
de
0
!Rechazamos H
0
si la media muestral no est
prxima a
0.
!No rechazamos H
0
si la media muestral est
prxima a
0.
4. Determinacin de las zonas de rechazo y no
rechazo:
! Zona de rechazo: 100 % de los valores
restantes.
!Zona de no rechazo: 100(1 - ) % de los
valores ms cercanos a
0.
1
/ 2 / 2
Rechazo
Media muestral
No Rechazo

0.
Rechazo
257
5. Tipos de hiptesis. Regin Crtica. P-valor.
Contrastes unilaterales y bilaterales
!Hiptesis simples: La hiptesis asigna un nico
valor al parmetro desconocido, H: =
0
!Hiptesis compuestas: La hiptesis asigna varios
valores posibles al parmetro desconocido,
H: (
1
,
2
)
Compuesta - Compuesta
H
0
:
0
H
1
: <
0
Compuesta Compuesta
H
0
:
0
H
1
: >
0
Simple Compuesta
H
0
: =
0
H
1
:
0
258
!Regin de Rechazo o Regin Crtica: La formada
por el conjunto de los valores del estadstico de
contraste que nos llevan a rechazar la hiptesis nula
H
0
, se llama regin crtica (los puntos que delimitan la
regin crtica se llaman puntos crticos)
!Regin de No Rechazo Regin de Aceptacin:
Es la formada por el conjunto de los valores del
estadstico de contraste que nos lleva a aceptar la
hiptesis nula H
0
Al aplicar un contraste de hiptesis, clasificamos los
puntos del espacio muestral en dos regiones excluyentes
y complementarias:
Regin de rechazo
Regin de no
rechazo
259
!p-valor o nivel de significacin observado: Es
el rea que deja a la derecha el valor experimental
del estadstico.
!Elegido un nivel de significacin , se rechazar
H
0
si p <
p-valor
z
exp
z
!
p-valor
z
exp
z
!
No rechazar
hiptesis nula
Rechazar
hiptesis nula
0
Rechazar valor - p Si H ,
260
Regin crtica
Regin crtica
!Contrastes unilaterales y bilaterales:
" Si la hiptesis alternativa da lugar a una regin
crtica a ambos lados del valor del parmetro,
diremos que el test es bilateral o de dos colas
" Si la hiptesis alternativa da lugar a una regin
crtica a un solo lado del valor del parmetro,
diremos que el test es unilateral o de una sola cola
261
1. Fijar las hiptesis nula y alternativa
2. Buscar el estadstico del test que bajo la hiptesis
nula tenga un comportamiento conocido
!8.1.2. Pasos para la realizacin de un test
H
0
:
0
H
1
: <
0
H
0
:
0
H
1
: >
0
H
0
: =
0
H
1
:
0
Si el contraste es bilateral
Si el contraste es de una cola
(derecha)
Si el contraste es de una cola
(izquierda)
3. Determinar la regin crtica
4. Seleccionar una muestra de tamao n, para la cual
el estadstico del test tome un valor numrico (valor
experimental del estadstico de contraste)
5. Adoptar la decisin sobre el rechazo o no de la
hiptesis nula
262
Criterio de
rechazo
Estadstico de
contraste
Hiptesis
del test
Varianza Conocida
exp 2
z z


exp 2
z z

exp
z z

exp
z z


0
(0;1)
X
Z N
n

=
!8.2. Tests Paramtricos
!8.2.1. Contrastes sobre los parmetros de una
distribucin normal
( )
1 2
, ,..., m.a.s. de ;
n
X X X X N
!Contrastes sobre la media
0 1
0 0
:
:

=
H
H
0 1
0 0
:
:


>

H
H
0 1
0 0
:
:


<

H
H
263
Criterio de rechazo
Hiptesis
del test
Estadstico de contraste
Varianza Desconocida
0
1

n
X
T
n
S
t

=
exp 2; 1 n
t t


exp 2; 1 n
t t

exp ; 1 n
t t

exp ; 1 n
t t


0 1
0 0
:
:

=
H
H
0 1
0 0
:
:


>

H
H
0 1
0 0
:
:


<

H
H
264
# Ejemplo:
En un preparado alimenticio infantil se especifica que
el contenido medio de protenas es al menos del 42%.
Tratamos de comprobar esta especificacin y para ello
tomamos 10 preparados que analizamos para
determinar su contenido en protenas, obteniendo una
media del 40% y una cuasidesviacin tpica del 3.5%.
Es correcta la especificacin citada para un nivel de
significacin del 0.05, suponiendo normal la
distribucin de la variable contenido proteico?
X: Contenido Proteico,
( )
; X N
Contraste de Hiptesis:
0
1
: 42
: 42
H
H

!
#
<
$
5 . 3 ; 40 x ; 10 = = = s n
265
Estadstico de contraste:
Admitimos como correcta la especificacin
del preparado acerca del contenido
proteico
0.05
0.95
0.95 ; 9
t
exp
t
Contraste de Hiptesis:
0
1
: 42
: 42
H
H

!
#
<
$
0
1 n
x
S
n
t

0.95; 9 0.05; 9
0.05; 1.833 t t = = =
0 exp
40 42
1.8070
3.5
10
H t
!
"
#
"
$

= = , No rechazamos
5 . 3 ; 40 x ; 10 = = = s n
266
!Contrastes sobre la varianza
Media desconocida
Criterio de rechazo Hiptesis del test
Estadstico de contraste
( )
2
2
2
1
2
0
1

n
n S

=
2 2
1 2; 1
2 2
exp
2; 1
exp
n
n


2
2
exp
1 ; 1 n

2
2
exp
; 1 n

2 2
1
2 2
0
0
0
:
:

=
H
H
2
0
2
1
2
0
2
0
:
:


>

H
H
2
0
2
1
2
0
2
0
:
:


<

H
H
267
# Ejemplo:
La varianza habitual para la altura de los machos de
Lhasa Apso es de 0.25. Un criador est intentando
reducir esta cifra. Despus de un perodo de crianza
selectiva, se selecciona una muestra de 15 perros a los
que se mide, obteniendo una cuasivarianza muestral
de 0.21. Tenemos evidencias que nos permitan
afirmar que ha disminudo la variabilidad en la altura
de esta raza de perros?
X: Altura de los machos de Lhasa Apso
( )
; X N
Contraste de Hiptesis:
2
0
2
1
: 0.25
: 0.25
H
H

"
#
< "
$
21 . 0 ; 15
2
= = s n
268
No tenemos suficientes pruebas para sostener la
informacin de que la crianza selectiva haya reducido
la variabilidad en las alturas de los machos de Lhasa
Apso
0.95
0.05
2
0.95;14

2
exp

Estadstico de contraste:
( )
2
2
2
1
2
0
1
n
n S

=
Contraste de Hiptesis:
2
0
2
1
: 0.25
: 0.25
H
H

"
#
< "
$
2
0.95;14
0.05; 6.57 = =
2
0 exp
14 0.21
11.76 No rechazamos
0.25
H

!
= = ,
#
$
21 . 0 ; 15
2
= = s n
269
!8.2.2. Contrastes sobre los parmetros de dos
distribuciones normales independientes
!Contrastes sobre la diferencia de
medias
( )
1 2
, ,..., m.a.s. de ;
Y
Y Y
Y Y Y Y N
n

( )
1 2
, ,..., m.a.s. de ;
X
X X
X X X X N
n

" Varianzas conocidas
" Varianzas desconocidas, pero iguales
" Varianzas desconocidas, distintas o no.
Muestras grandes
270
Varianzas conocidas
Criterio de rechazo Hiptesis del test
Estadstico de contraste
( )
( )
0
2 2
0; 1
X Y
X Y
X Y
Z N
n n



=
+

exp
z z


exp
z z

exp 2
z z


exp 2
z z

0 :
0 :
1
0

=
Y X
Y X
H
H


0 :
0 :
1
0
>

Y X
Y X
H
H


0 :
0 :
1
0
<

Y X
Y X
H
H


271
Varianzas desconocidas, pero iguales
Criterio de rechazo Hiptesis del test
Estadstico de contraste
( ) 0
2
1 1

X Y
n n
p
X Y
X Y
T
S
n n
t

+

=
+

exp 2; 2
X Y
n n
t t
+

exp 2; 2
X Y
n n
t t
+

exp ; 2
X Y
n n
t t
+

exp ; 2
X Y
n n
t t
+

( )
( )
2 2
2
1 1
2
X Y
X Y
p
X Y
n S n S
S
n n
+
=
+
0 :
0 :
1
0

=
Y X
Y X
H
H


0 :
0 :
1
0
>

Y X
Y X
H
H


0 :
0 :
1
0
<

Y X
Y X
H
H


272
Varianzas desconocidas, distintas o no,
con n
x
, n
y
30
Criterio de rechazo Hiptesis del test
Estadstico de contraste
( )
( )
0
2 2
0; 1
X Y
X Y
X Y
Z N
S S
n n

=
+

exp
z z


exp
z z

exp 2
z z


exp 2
z z

0 :
0 :
1
0

=
Y X
Y X
H
H


0 :
0 :
1
0
>

Y X
Y X
H
H


0 :
0 :
1
0
<

Y X
Y X
H
H


273
# Ejemplo:
En un estudio sobre la angina de pecho en ratas, se
dividi aleatoriamente a 18 animales afectados en dos
grupos de 9 individuos cada uno. A un grupo se le
suministr un placebo y al otro un frmaco
experimental FL113. Despus de un ejercicio
controlado sobre una cinta sin fin, se determin el
tiempo de recuperacin de cada rata, obtenindose los
siguientes resultados:
Se puede concluir que el frmaco experimental tiende
a reducir el tiempo de recuperacin? (Se supone
igualdad en las varianzas poblacionales)
X: Tiempo de recuperacin de las ratas con placebo
Y: Tiempo de recuperacin de las ratas con el frmaco
9
329 seg.
45 seg.
X
X
n
x
S
=
=
=
9
283 seg.
43 seg.
Y
Y
n
y
S
=
=
=
FL113 Placebo
( )
( )
Y Y
X X
N Y
N X


,
,

Independientes
274
Estadstico de contraste:
Contraste de
Hiptesis:
0
1
:
:
X Y
X Y
H
H

!
"
#
>
"
$
0
1
: 0
: 0
X Y
X Y
H
H



!
"
#
>
"
$
( ) 0
2
1 1

X Y
n n
p
X Y
X Y
T
S
n n
t

+

=
+

( )
( )
2 2
2 2
2
1 1
8 45 8 43
1937
2 9 9 2
X Y
X Y
p
X Y
n S n S
S
n n
+
+
= = =
+ +
El frmaco experimental es eficaz en la reduccin
del tiempo de recuperacin en ratas con angina de pecho.
0.05 0.95
0.05;16
t
exp
t
0
16 ; 05 . 0
exp

746 . 1
22 . 2
H
t
t
Rechazamos ,
"
$
"
#
!
=
=
275
Medias desconocidas
Criterio de rechazo Hiptesis del test
Estadstico de contraste
exp 1 2; 2
X Y
n n
F F
+

exp 2; 2
X Y
n n
F F
+

exp ; 2
X Y
n n
F F
+

exp 1 ; 2
X Y
n n
F F
+

!Contrastes sobre la igualdad de


varianzas
2
1; 1
2
X Y
X
Y
n n
S
F F
S

=
2 2
1
2 2
0
0
0
:
:

=
H
H
2
0
2
1
2
0
2
0
:
:


>

H
H
2
0
2
1
2
0
2
0
:
:


<

H
H
276
# Ejemplo:
Se realiza un estudio de prcticas de prescripcin. El
propsito es analizar la prescripcin de digoxina, un
frmaco importante, potencialmente txico y
comnmente utilizado. El nivel de dosificacin para
los mayores de 64 aos debe ser menor que el de
personas ms jvenes. Se extraen muestras
independientes de cada grupo y se obtiene el nivel de
dosificacin para cada paciente seleccionado. Los
resultados son:
Edad 64 Edad > 64 aos
Se puede considerar que la dispersin en ambas
poblaciones es la misma?
X: Cantidad de digoxina en pacientes con > 64 aos
Y: Cantidad de digoxina en pacientes con ! 64 aos
41
0.265 mg./da
0.102 mg./da
X
X
n
x
S
=
=
=
29
0.268 mg./da
0.068 mg./da
Y
y
n
y
S
=
=
=
( )
( )
Y Y
X X
N Y
N X


,
,

Independientes
277
0.025
0.025
0.95
0.975; 40, 28
F
0.025; 40, 28
F
exp
F
Estadstico de
contraste:
2 2
0
2 2
1
:
:
X Y
X Y
H
H


!
=
"
#

"
$
Contraste de Hiptesis:
2
1; 1
2
X Y
X
Y
n n
S
F F
S

=
da mg s n
da mg s n
Y Y
X X
/ . 068 . 0 ; 29
/ . 102 . 0 ; 41
= =
= =
2
exp
2
0.025; 40, 28
0.975; 40, 28
0.025; 28, 40
0.102
2.25
0.068
2.05
1 1
0.515
1.94
F
F
F
f
!
" = =
"
"
= ,
#
"
"
= = =
"
$
Las varianzas poblacionales
son diferentes
0
H Rechazamos
278
Criterio de rechazo Hiptesis del test
Estadstico de contraste
exp
z z


exp
z z

exp 2
z z


exp 2
z z

!8.2.3. Contrastes para una proporcin


0 1
0 0
:
:
p p H
p p H

=
0 1
0 0
:
:
p p H
p p H
>

0 1
0 0
:
:
p p H
p p H
<

( )
( ) 1 ; 0
1

0 0
0
N
n
p p
p p
Z

=
279
# Ejemplo:
Entre los pacientes con cncer de pulmn, el 90% o
ms muere generalmente en el espacio de tres aos.
Como resultado de nuevas formas de tratamiento, se
cree que esta tasa se ha reducido. En un reciente
estudio sobre 150 pacientes diagnosticados de cncer
de pulmn, 128 murieron en el espacio de tres aos.
Se puede afirmar que realmente ha disminuido la tasa
de mortalidad al nivel = 0.1?
Estimacin muestral del parmetro:
0
1
: 0.9
: 0.9
H p
H p

!
#
<
$
Contraste de Hiptesis:
Estadstico de contraste:
( )
( ) 1 ; 0
1

0 0
0
N
n
p p
p p
Z

=
853 . 0
150
128
nes observacio N
xitos N

= = = p
280
0
1
: 0.9
: 0.9
H p
H p

!
#
<
$
Contraste de Hiptesis:
0.9 0.1
0.01; 0.4602 z z = = =
0
H , Rechazamos
0.1 0.9
0.1
z
exp
z
853 . 0

= p
( ) ( )
905 . 1
150
9 . 0 1 9 . 0
9 . 0 853 . 0
1

0 0
0
exp
=

=
n
p p
p p
z
281
Criterio de rechazo Hiptesis del test
Estadstico de contraste
exp
z z


exp
z z

exp 2
z z


exp 2
z z

!8.2.4. Contrastes para la comparacin


de dos proporciones
( )
( )
0
1
0
0
:
:
Y X Y X
Y X Y X
p p p p H
p p p p H

=
( ) ( )
( ) ( )
( ) 1 ; 0
1 1

0
N
n
p p
n
p p
p p p p
Z
Y
Y Y
X
X X
Y X Y X


=
( )
( )
0
1
0
0
:
:
Y X Y X
Y X Y X
p p p p H
p p p p H
>

( )
( )
0
1
0
0
:
:
Y X Y X
Y X Y X
p p p p H
p p p p H
<

282
# Ejemplo:
Se quiere comprobar la teora de que la vitamina C es
una ayuda en el tratamiento del cncer. Se examinaron
dos grupos de 75 pacientes cada uno. Al primero de
ellos se le dio 10 gr. de vitamina C diariamente y se
observ que 47 pacientes presentaron mejora. A los
pacientes del segundo grupo se les suministr un
placebo y 43 experimentaron mejora. Contrastar las
hiptesis:
Estimacin muestral de los parmetros:
0
1
: 0.04
: 0.04
X Y
X Y
H p p
H p p

!
"
#
>
"
$
Estadstico de contraste:
( ) ( )
( ) ( )
( ) 1 ; 0
1 1

0
N
n
p p
n
p p
p p p p
Z
Y
Y Y
X
X X
Y X Y X


=
57 . 0
75
43

63 . 0
75
47

= =
= =
Y
X
p
p
283
( )
( ) ( )
exp
0.63 0.57 0.04
= 0.75
0.63 1 0.63 0.57 1 0.57
75 75
Z

=

+
0
1
: 0.04
: 0.04
X Y
X Y
H p p
H p p

!
"
#
>
"
$
0
H , No rechazamos
exp
z z

0.05 0.95
0.05
z
exp
z
645 . 1
05 . 0
= z
284
El problema de bondad de ajuste consiste en
determinar a partir de un conjunto de datos
muestrales si estos son consistentes con una
distribucin de Probabilidad terica.
!8.3. Tests No Paramtricos
!8.3.1. Contrastes para la bondad de ajuste.
Partiendo de una muestra de n valores observados
x
1
, x
2
,..., x
n
de una v.a.. X con distribucin
supuesta F ( x ) , se plantea el siguiente contraste
de hiptesis:
0
1
: ( )
: sigue otra distribucin
H X F x
H X

!
#
$
285
!Planteamiento
" Sea n
i
, i = 1, 2,..., k, la frecuencia absoluta de
la i-sima clase
" Supongamos una cierta distribucin terica para X
cuyos parmetros poblacionales los estimamos a partir
de los datos muestrales.
" Si denotamos por p
i
la probabilidad asociada a la
clase i , los valores n p
i
sern los valores esperados
asociados a cada clase i .
" Consideremos una v.a. X, discreta o continua, y una
muestra aleatoria de tamao n de la distribucin de
dicha variable agrupada en k clases exhaustivas y
mutuamente excluyentes.
286
np
k
p
k
n
k
x
k
k
n 1 n
... ... ... ...
...
np
i
p
i
n
i
x
i
i
... ... ... ...
...
np
2
p
2
n
2
x
2
2
np
1
p
1
n
1
x
1
1
Valores
esperados
Prob.
Tericas
Fr.
Absolutas
empricas
Marca
de clase
Clases
Si algn valor esperado es menor que 5, np
i
< 5 ,
dicha clase se agrupar con otras contiguas, de
manera que en todas ellas dichos valores sean
mayores o iguales a 5, reducindose el nmero de
clases.
287
!Solucin del test
Criterio de rechazo
Estadstico de contraste
Hiptesis nula
( )
2
exp
; 1 k r
Y

( )
0
: H X F x
( )
( )
2
2
1
1
k
i i
k r
i
i
n
Y
n p
n p


=

=
+
" r es el nmero de parmetros estimados
de los que depende la distribucin terica
" k es el nmero de clases
288
Se mide el nmero de partculas que llegan a una
determinada zona procedentes de una
sustancia radioactiva en un corto espacio de
tiempo siempre igual, anotndose los
resultados en la siguiente tabla:
a) Ajustar una distribucin de Poisson
b) Calcular la probabilidad de que lleguen a dicha
superficie 0, 1, 2, ..., 6 partculas
c) Verificar la bondad del ajuste mediante un
contraste de la !
2
2 7 28 82 207 325 269
N de perodos
de tiempo
6 5 4 3 2 1 0 N de partculas
X = N de Partculas Radioactivas
Determinacin de los parmetros de la distribucin.
Dado que no los conocemos, los estimamos:
# Ejemplo:
!
1
1 0 269 1 325 .... 6 2
1.24
269 325 .... 2
n
i i
i
x n x
n


=
+ + +
= = = =
+ + +
+
( 1.24) X P =
289
( 0) 0.2898; ( 1) 0.3586 ; P X P X = = = =
( 4) 0.0285 ; ( 5) 0.007 P X P X = = = =
( 6) 0.0014 P X = =
( 2) 0.2222 ; ( 3) 0.919 P X P X = = = =
Clculo de probabilidades
Contraste de bondad de ajuste
( )
$
#
!
=
n distribuci otra sigue :
24 . 1 :
1
X H
P X H
o

290
1.288 0.0014 2 6
6.44 0.0070 7 5
1
n = 920
26.22 0.0285 28 4
84.548 0.0919 82 3
204.424 0.2222 207 2
329.912 0.3586 325 1
266.616 0.2898 269 0
Val. Esp.
np
i
Prob
np
i
Fr. Ab.
n
i
N de
Partc
Como el ltimo valor esperado es inferior a 5, unimos
las dos clases contiguas
0.5335
0.2092
0.1208
0.0767
0.0324
0.0731
0.0213
(n
i
-np
i
)
2
/np
i
7.728 0.0084 9 5 y 6
1
n = 920
26.22 0.0285 28 4
84.548 0.0919 82 3
204.424 0.2222 207 2
329.912 0.3586 325 1
266.616 0.2898 269 0
Val. Esp.
np
i
Prob
np
i
Fr. Ab.
n
i
N de
Partc
291
r = N de Parmetros estimados = 1
N de Gr. de Libertad, (k-1) - r = (6-1) -1 = 4;
( )
( )
2
2
1
1
k
i i
k r
i
i
n np
Y
np


=

=
+
Estadstico de contraste:
Los datos provienen de una distribucin de
Poisson
Criterio de rechazo:
( )
2
exp
; 1 k r
Y

Y
exp
2
0.05;3

0.05
0.95
( )
0
1
2
exp
2
4 ; 05 . 0
rechazamos No
5335 . 0
49 . 9
H
np
np n
Y
k
i
i
i i
,
"
"
$
"
"
#
!
=

=
=
+
=

292
Se quiere determinar si existe relacin entre dos
caractersticas diferentes de una poblacin, donde
cada caracterstica se encuentra subdividida en un
cierto nmero de categoras
" TABLA DE CONTINGENCIA
n
..
n
.s
...
n
.j
... n
.2
n
.1
Total
n
r.
n
rs
... n
rj
... n
r2
n
r1
A
r
...
... ... ... ... ... ...
...
n
i.
n
is
... n
ij
... n
i2
n
i1
A
i
...
... ... ... ... ... ...
...
n
2.
n
2s
... n
2j
... n
22
n
21
A
2
n
1.
n
1s
...
n
1j
... n
12
n
11
A
1
Total
B
s
...
B
j
... B
2
B
1
B
A
!8.3.2. Contrastes para la independencia de
dos caracteres
293
Total de la -sima fila
Total de la -sima columna
1
1
, 1, 2,..., .
, 1, 2,..., .
.
.
i
j
s
i ij
j
r
j ij
i
n n i r
n n j s
=
=
= =
= =
+
+
" La decisin de rechazar o no rechazar la hiptesis
nula de independencia de los dos caracteres, se basa
en el mal o buen ajuste entre las frecuencias
observadas y las frecuencias que se esperaran para
cada celda si H
0
fuese cierta
Valores esperados:
. . i j
ij
n n
n
e =
294
Correccin de Yates para continuidad
Si algn valor e
ij
es menor que 5, se aplica la
siguiente correccin por continuidad al estadstico del
test
Estadstico de contraste
( )
( )( )
2
2
1 1
1 1
0.5
r s
ij ij
r s
ij
i j
n e
U
e


= =

=
++

!Solucin del test
Criterio de rechazo
Estadstico de contraste
Hiptesis nula H
0
: A y B son independientes
( )
( )( )
2
2
1 1
1 1
r s
ij ij
r s
ij
i j
n e
U
e


= =

=
++

( )( )
2
exp
; 1 1 r s
U



295
Un psiclogo realiza una investigacin para determinar
si existe asociacin aparente entre el peso de un
muchacho y un xito precoz en la escuela. Se
selecciona una m.a.s. de 500. Se clasifica a cada uno
de acuerdo a dos criterios: el peso y el xito en la
escuela, obtenindose los siguientes resultados:
37 38 No
263 162 S
No S xito
Sobrepeso
A la vista de los datos, qu se puede decir sobre la
afirmacin del psiclogo?
Contraste de Hiptesis:
# Ejemplo:
0
1
: Los caracteres peso y xito son independientes
: Los caracteres peso y xito no son independientes
H
H
!
#
$
296
500 300 200 Total
75 37
(45)
38
(30)
No
425 263
(255)
162
(170)
S
Total No S xito
Sobrepeso
Clculo de los valores esperados, e
ij
. . i j
ij
n n
e
n
=
425 200
1 1
11
500
. .
n n
n
e

= =
297
Estadstico de contraste:
La obesidad y la precocidad en la escuela no son
independientes
( )
( )( )
2
2
1 1
1 1
r s
ij ij
r s
ij
i j
n e
U
e


= =

=
++

( ) ( )
( ) ( )
2 2
exp
2 2
162 170 263 255
170 255
38 30 37 45
4.18
30 45
U

= + +

+ + =
U
exp
2
0.05;1

0.05
0.95
( )( )
o
H s r
U
Rechazamos
84 . 3
1 1 1
18 . 4
2
1 ; 05 . 0
exp
,
"
"
$
"
"
#
!
=
=
=

298
El problema general es determinar si varias muestras
se pueden considerar procedentes de una misma
poblacin, en cuyo caso decimos que las muestras
son homogneas.
!8.3.3. Contrastes de homogeneidad
n
..
n
.p
...
n
.j
... n
.2
n
.1
Total
n
r.
n
rp
... n
rj
... n
r2
n
r1
A
r
...
... ... ... ... ... ...
...
n
i.
n
ip
... n
ij
... n
i2
n
i1
A
i
...
... ... ... ... ... ...
...
n
2.
n
2p
... n
2j
... n
22
n
21
A
2
n
1.
n
1p
...
n
1j
... n
12
n
11
A
1
Total
B
p
...
B
j
... B
2
B
1
Modalidades
Muestras
" TABLA DE CONTINGENCIA
299
!Solucin del test
Criterio de rechazo
Estadstico de contraste
Hiptesis nula
H
0
: Las muestras son homogneas
( )
( )( )
2
2
1 1
1 1
p
r
ij ij
r p
ij
i j
n e
U
e


= =

=
++

( )( )
2
exp
; 1 1 r p
U



300
Un grupo de personas ha sido expuesto a la
radiactividad de un vertedero con desechos atmicos.
Se realiza una investigacin para descubrir si hay
alguna asociacin entre la exposicin y el desarrollo de
una enfermedad en la sangre. Se eligen 300 personas
expuestas al peligro y 320 no expuestas y se estudia a
cada sujeto para determinar si tiene o no la
enfermedad. Qu se puede concluir a la vista de los
resultados?
272 48 No
248 52 S
No S
Radioactividad
Tiene la enfermedad
Contraste de Hiptesis:
# Ejemplo:
$
#
!
ad homogeneid hay No :
ad homogeneid Hay :
1
0
H
H
301
Clculo de los valores esperados, e
ij
. . i j
ij
n n
e
n
=
300 520
1 2
12
620
. .
n n
n
e

= =
620 520 100 Total
320 272
(268.39)
48
(51.61)
No
300 248
(251.61)
52
(48.39)
S
Total No S Radioactividad
Tiene la enfermedad
302
Estadstico de contraste:
( )
( )( )
2
2
1 1
1 1
p r
ij ij
r p
ij
i j
n e
U
e


= =

=
++

2 2
exp
2 2
(52 48.39) (248 251.61)
48.39 251.61
(48 51.61) (272 268.39)
0.62
51.61 268.39
U

= + +

+ + =
U
exp
2
0.05;1

0.05
0.95
No hay evidencia de asociacin entre enfermedad
sangunea y exposicin a esta fuente de radioactividad
( )( )
o
H p r
U
rechazamos No
84 . 3
1 1 1
62 . 0
2
1 ; 05 . 0
exp
,
"
"
$
"
"
#
!
=
=
=

303
Aplicaciones del test:
EJEMPLOS:
! En un proceso de produccin de unas
pldoras que se fabrican secuencialmente, la
periodicidad de rachas de pldoras defectuosas
puede ser significativa de la falta de aleatoriedad
en la produccin y sugerira la revisin del
proceso
! Se est examinando el nivel de
contaminacin atmosfrica de una ciudad, para
ello se toman mediciones de diferentes partes de
la ciudad. Se estudia si estas mediciones se han
realizado aleatoriamente por toda la ciudad y por
lo tanto los resultados del examen pueden
considerarse significativos.
$ Determinar la aleatoriedad en el orden de
aparicin de los valores de una variable
$ Determinar si una muestra se ha escogido
de manera aleatoria
!8.3.4. Contraste de aleatoriedad.
Test de rachas
304
Se define una racha como una sucesin de smbolos
idnticos consecutivos.
Ej: + + - - - + - - + + + + - - - (6 rachas)
Desarrollo del test:
Criterio de Rechazo Estadstico de contraste
Criterio de rechazo
(Tabla [F])
Estadstico de contraste
Valores grandes de n
i
:
R
I
= r
/2
R
S
= r
1-/2
R = r
Valores pequeos de n
i
( 20)
Supongamos una muestra de tamao n de una v.a.
dicotmica con valores posibles a
1
y a
2
.
Sean :
r, total de rachas en la muestra.
n
i
, el nmero de veces que aparece el
elemento a
i
en la muestra, i =1,2
n = n
1
+ n
2
, tamao de la muestra
S I
R R R R
exp , exp
( )
r r
N R ;
1
2
2 1
2 1
+
+
=
n n
n n
r
( )
( ) ( ) 1
2 2
2 1
2
2 1
2 1 2 1 2 1
+ +

=
n n n n
n n n n n n
r
( ) 1 ; 0 N
r
Z
r
r


2 exp
2 exp

z z
z z


305
Caso de variables cuantitativas
Cuando los datos muestrales sean
cuantitativos:
1. Se calcula la mediana muestral
2. Se representan por un signo -
los valores menores que la
mediana
3. Se representan por signo + los
valores mayores que la mediana
4. Se eliminan los valores iguales a la
mediana
5. Se aplica el test anterior
306
Ejemplo:
Se desea saber si en un proceso de fabricacin de pldoras,
la obtencin de stas en mal estado se produce de manera
aleatoria. Para ello se anota el estado de 50 pldoras
obtenidas en la cadena de produccin a una determinada
hora:
B: Buen estado D: Defectuosa
BDBDBBBDDBDBDDBDBBBBDBDBDBBDDDBDBD
BDBBDBBDBBBBDBDB
Parmetros: r = 35; n
1
= 29; n
2
= 21
( )
r r i
N R n , 20 , >
; 1
2
2 1
2 1
25.36
r
= +
+
=
n n
n n
( )
( ) ( )
3.41 "
r
=
+ +

=
1
2 2
2 1
2
2 1
2 1 2 1 2 1
n n n n
n n n n n n
0
975 . 0
025 . 0
exp
Rechazamos
96 . 1
96 . 1
827 . 2
41 . 3
36 . 25 35
H
z
z
r
z
r
r
,
"
"
"
$
"
"
"
#
!
=
=
=

0.025
z
/2
-z
/2
z
exp
$
#
!
ad aleatoried hay No :
ad aleatoried Hay :
1
0
H
H
Test de Hiptesis:
Hay algn fallo en el
proceso de obtencin
de las pldoras
307
Ejemplo:
Se puede considerar que el nmero de bacterias que
aparecen en un determinado cultivo al cabo de una semana
es aleatorio, o por el contrario habra que suponer que hay
algo en el cultivo que propicia el desarrollo de tales
bacterias? Los resultados a lo largo de 10 semanas de
observacin fueron los siguientes:
498, 490, 510, 505, 495, 496, 497, 501, 502, 520
Parmetros: r = 4 rachas ; n
1
= 5; n
2
= 5
[F] Tabla 20 , <
i
n
$
#
!
ad aleatoried hay No :
ad aleatoried Hay :
1
0
H
H
Test de Hiptesis:
Paso 1: Clculo de la Mediana Muestral
Ordenamos los datos: 495 496 497 498 501 502 505 510 520
( ) ( )
499.5 =
+
=
+
= , =
2
501 498
2
10
6 5
X X
Me n
Paso 2: Determinacin de la nueva secuencia:
- - + + - - - + + +
Aceptamos la aleatoriedad de los datos
Para = 0.01, R
I
=3, R
S
=9
R
I
r R
S
308
Aplicaciones del test:
$ Contrastar si un conjunto de datos muestrales
pueden considerarse procedentes de una
distribucin determinada
$ Alternativa al test Chi Cuadrado cuando el
modelo propuesto bajo la hiptesis nula es de tipo
continuo y el tamao muestral es pequeo
Ventajas del test Kolmogorov Smirnov frente
al test Chi Cuadrado:
! No requiere la agrupacin de los datos
en clases
! Es aplicable a muestras pequeas
Inconvenientes del test Kolmogorov Smirnov
frente al test Chi Cuadrado:
! Slo es vlido para modelos de tipo
continuo
!8.3.5. Test de Kolmogorov -- Smirnov
309
Regin crtica (Tabla
[G])
Estadstico de contraste
Desarrollo del test:
Sea X
1
, X
2
, ..., X
n
una m.a.s. de una v.a. X con
distribucin de tipo continuo.
Contraste:
$
#
!
F X H
F X H
n distribuci la sigue no
n distribuci la sigue
1
0
:
:
Fundamento del contraste:
Comparar la distribucin emprica, de la
muestra con la distribucin propuesta bajo H
0
,
F. Si esta comparacin revela diferencias
significativas, se rechaza H
0
( ) ( )

sup x F x F D
n
x
=
[ [ +

,
1 exp
d d
Solucin del test:
,

n
F
310
Clculo del estadstico D:
1. Se ordena la muestra
2. Para cada i = 1, 2,..., n, se calcula:
( )
( )
( )
( )
( ) { }
( )
( )
( )
( )
( )
( )
( )
( ) { }
n i
x F x F x F x F mx D
x F x F x F mx D
i i n i i n i
n
,..., 2
,

,
1
1 1 1 1
=
=
=

3. D
exp
= mx{D
i
, i = 1,2,...,n}
311
Ejemplo:
Realizar un test de Kolmogorov Smirnov, a nivel =
0.1, para contrastar si puede suponerse que los 10 datos:
10.5, 8, 15, 12.1, 12.1, 4.1, 12.1, 8, 10.5, 16
proceden de una distribucin normal N(10.84, 3.5)
1. Ordenados los datos de la muestra, construmos la tabla con
los valores D
i
0.070 0.930 1 16
0.082 0.882 0.9 15
0.160 0.640 0.8 12.1
0.161 0.641 0.5 10.5
0.109 0.209 0.3 8
0.073 0.027 0.1 4.1
D
i
x
(i)
( )
) (

i n
x F
( )
) (i
x F
{ } 027 . 0 1 . 0 , 027 . 0 max
$
#
!
-
.
/

209 . 0 3 . 0
, 209 . 0 1 . 0
max
2. D
exp
= mx{D
i
, i = 1,2,...,n} = 0.161
3. Regin Crtica, C =[D
1-
, +[ = [0.368, +[
4. Conclusin: 0.161< 0.368, por tanto, no se rechaza que
los datos procedan de una distribucin N(10.84; 3.5)
312
Aplicaciones del test:
$ Contrastar la hiptesis nula de que una
muestra X
1
, X
2
,..., X
n
procede de una v.a. X con
mediana Me
$ Contrastar la simetra de la distribucin de la
variable
Fundamento del contraste:
Si se dispone de una muestra X
1
, X
2
,..., X
n
procedente de una v.a. X de tipo continuo y
simtrica respecto a su mediana, Me, las
diferencias D
i
= X
i
Me, estarn distribudas de
forma simtrica respecto a 0
Las diferencias positivas y negativas de igual
magnitud absoluta sern igualmente probables
!8.3.6. Test de los rangos signados de Wilcoxon
313
Se llama Rango de X
i
a la posicin que ocupa | D
i
|
en la secuencia ordenada en orden creciente de los
valores absolutos de las diferencias D
i
.
Valores grandes de n ( n 25)
Valores pequeos de n ( n < 25)
"T
+
: Suma de los rangos de
los D
i
positivos
"T
-
: Suma de los rangos de
los D
i
negativos
H
1
: Me >m
H
1
: Me m
Hiptesis Nula H
0
: Me=m
H
1
: Me <m
Regin crtica (Tabla [H]) Estadstico de contraste
( ) ( )
+
= T t t T C
S I
, ,
( ) = =
+
2 ' tomando , ,T t C
S
( ) = =

2 ' tomando , ,
I
t T C
( )
( )( )
(
(
*
&
'
'
)
% + +
+
24
1 2 1
1
n n n
n n N T ,
Solucin del test:
314
Ejemplo:
Contrastar si 1, 1.1, -1.2, -0.8, 3 y 1.9 son valores de
una muestra X
1
, X
2
, ..., X
6
extrada de una poblacin
con distribucin continua y mediana Me = 0.2, o si
proceden de una poblacin con mayor mediana
Clculo de las diferencias D
i
:
En orden creciente quedaran
|D
1
| < |D
2
| < |D
4
| < |D
3
| < |D
6
| < |D
5
|
Los rangos de D
1,
, D
2
, ..., D
6
seran
respectivamente, 1, 2, 4, 3, 6 y 5
D
1
= X
1
- 0.2 = 0.8 D
4
= X
4
- 0.2 = -1
D
2
= X
2
- 0.2 = 0.9 D
5
= X
5
- 0.2 = 2.2
D
3
= X
3
- 0.2 = -2 D
6
= X
6
- 0.2 = -2.1
Estadsticos de Wilcoxon: T
+
= 1+2+6 = 9
T
-
= 4+3+5 = 12
$
#
!
>
=
2 0
2 0
1
0
. :
. :
Me H
Me H
Test de hiptesis:
A nivel =0.05 la regin crtica es C = [T
+
19],
como T
+
exp
= 9 C, no rechazamos H
0
315
Aplicaciones del test:
$ Contrasta la igualdad de las distribuciones de
dos v.a.
Dadas dos muestras de dos distribuciones
independientes de tipo continuo:
Y n
X n
F Y Y Y Y
F X X X X
y
x

de m.a.s.
de m.a.s.
2 1
2 1
; ,..., ,
; ,..., ,
Se formulan los contrastes:
$
#
!
>
=
$
#
!
<
=
$
#
!

=
Y X
Y X
Y X
Y X
Y X
Y X
F F H
F F H
F F H
F F H
F F H
F F H
:
:
:
:
:
:
1
0
1
0
1
0
1. Ordenar las n
x
+n
y
observaciones conjuntamente
2. Diferenciar de que muestra procede cada
observacin
3. Asignar rangos desde 1 hasta n
x
+n
y
a las
observaciones (salvo datos repetidos)
4. Calcular R
i
= Suma de los rangos asociados a
las observaciones de la muestra i, i = x, y.
5. Estadstico de Mann Whitney:
( )
i
i i
y x
R
n n
n n U
+
+ =
2
1
Nota: Las distribuciones de ambos estadsticos
(X, Y) estn relacionadas y proporcionan la misma
prueba.
Solucin del test:
!8.3.7. Test de Mann Whitney - Wilcoxon
316
Valores grandes de n ( n 25)
Valores pequeos de n ( n < 25)
R
(los resultados son los
mismos sea cual sea la
muestra escogida)
H
1
: F
X
>F
Y
H
1
: F
X
F
Y
Hiptesis Nula H
0
: F
X
= F
Y
H
1
: F
X
<F
Y
Regin crtica (Tabla [I ]) Estadstico de contraste
[ ] [ ] R r r R C
S I
, , =
[ ] 2 ' tomando , , = = R r C
S
[ ] 2 ' tomando , , = =
I
r R C
( ) ( )
(
(
*
&
'
'
)
% + + + +

12
1
;
2
1
y x y x y x i
i
n n n n n n n
N R
317
Ejemplo:
Indicar si, a nivel =0.1, hay evidencia de diferencia
entre las distribuciones a partir de los siguientes
datos, procedentes de distribuciones independientes
A: 5 10 3 2
B: 13 6 14 8
El resultado de las dos muestras ordenadas es:
2 3 5 6 8 10 13 14
Diferenciando los valores de una y otra muestra y
asignando los rangos, obtenemos:
2 3 5 6 8 10 13 14
A A A B B A B B
1 2 3 4 5 6 7 8
En este caso, n
x
= n
y
= 4, y considerando la
primera muestra resulta:
R
exp
=1+2+3+6 = 12 C=[R 11] [R 15],
por lo que no hay evidencia muestral para
creer que ambas distribuciones no sean
idnticas
$
#
!

=
Y
Y
F F H
F F H
X 1
X 0


:
:
Test de hiptesis:
318
El anlisis de la varianza es el mtodo que nos
permite determinar diferencias significativas
entre el efecto medio que producen los distintos
tratamientos o niveles del factor estudiado
!8.4. Anlisis de la Varianza
Anlisis de la varianza
Paramtrico No Paramtrico
De un factor
De ms de un
factor
319
Ejemplos:
! Una compaa farmacutica investiga los
efectos de tres compuestos. Se disea un
experimento que consiste en inyectar los
compuestos a 11 ratas de la misma especie y
anotar los tiempos que tardan en reaccionar. Los
animales se clasifican al azar en tres grupos A, B,
C. A los 4 animales del grupo A se les administra
el primer compuesto, a los 4 animales del grupo
B, el segundo compuesto y a los 3 del grupo C, el
tercero.
Si se producen diferencias entre las
reacciones de los tres grupos, stas se debern a
los compuestos, ya que las ratas se presuponen de
caractersticas similares. El tipo de compuesto es
el factor bajo estudio
! De un producto dado, se tomaron 14 muestras
similares y se procedi a un almacenaje
utilizando 5 mtodos diferentes. Transcurrido un
cierto periodo de tiempo, se determin la
cantidad de agua que contena cada muestra.
Claramente, las posibles diferencias entre las
cantidades de agua se debern al mtodo de
almacenamiento, que es el factor bajo estudio
320
Sean X
1
, X
2
, ..., X
k
v.a.i. con X
i
N (
i
, ), con
i
y desconocidos.
Para cada variable X
i
se considera una muestra
aleatoria de tamao n
i
:
i
in i i
X X X ,..., ,
2 1
siendo el tamao total de las k muestras:
+
=
=
k
i
i
n n
1
El contraste:
$
#
!

= = =
j i H
H
j i
k
algn para :
:
1
2 1 0

"
recibe el nombre de Anlisis de la Varianza de
una va (o un factor) de clasificacin (ANOVA)
A las k categoras de clasificacin se les dice
tratamientos
!Anova Paramtrico de un Factor
321
" Aleatoriedad de las muestras
" Independencia de las variables
" Normalidad de las distribuciones
" Homogeneidad de las varianzas
!Hiptesis del ANOVA paramtrico
322
Sean n
i
observaciones del tratamiento i
x =
ij i ij
e +
!MODELO
Se formula el test de hiptesis
0 1 2
1
:
: , para algn
k
i j
H
H i j


= = =

"
( ) n ,..., 2 , 1 , ; = i N X
i i

Siendo:

i

Media del tratamiento i

ij
e Errores experimentales
323
T
T
k
k
... ... .............................. ...
T
2
2
T
1
1
Medi
a
Total Observaciones Muestra
, , ,
1
1 12 11 n
x x x #
, , ,
2
2 22 21 n
x x x #
, , ,
2 1
k
kn k k
x x x #
1
x
2
x
k
x
x
Notacin:
k 1,2,..., i ,
1
=
+
=
=
i
n
j
ij i
x T
k i
n
T
x
n
x
i
i
n
j
ij
i
i
i
,..., 2 , 1 ,
1
1
=
+
= =
=
+ +
=
= =
k
i
n
j
ij
i
x T
1 1
n
T
x
n
x
k
i
n
j
ij
i
=
+ +
=
= = 1 1
1
" Total de las observaciones del tratamiento i,
" Media de las observaciones del tratamiento i,
" Total de todas las observaciones,
" Media total de todas las
observaciones,
!Clculos para el ANOVA:
324
Variabilidad Total de los datos: Desviacin de los
datos respecto de su media
( ) ( ) ( )
+ +
+
+ +
=
+ +

= = = = = =
k
i
n
j
i
k
i
n
j
i
ij
k
i
n
j
ij
i i i
x x x x x x
1 1
2
1 1
2
1 1
2
Variabilidad
dentro de los
grupos
= +
Variabilidad
total de los
datos
Variabilidad
entre grupos
VT = VNE + VE
Distribuciones de las varianzas bajo la hiptesis
nula de igualdad de medias:
2
2
k n
VNE

2
1
2

n
VT

2
1
2

k
VE

"
"
"
Bajo H
o
, VNE y VE
son independientes
,
( )
( )
k n k
F
VNE k
VE k n

, 1
1
!Descomposicin de la variabilidad
325
Tabla ANOVA de una va
n-1 VT
Total
n-k VNE
Dentro de
grupos
k-1 VE
Entre
grupos
Estadstico
del test
Varianzas Grados
de
libertad
Suma de
Cuadrados
Fuentes
de
variacin
1
2

=
k
VE
S
e
k n
VNE
S
R

=
2
1
2

=
n
VT
S
t
2
2
d
e
S
S
Rechazamos si
Criterio de rechazo
k n k
R
e
F
S
S

, 1
2
2
k n k
R
e
F
S
S

>
, 1 ;
2
2

326
Ejemplo:
Una compaa farmacutica investiga los efectos de 5
compuestos; el experimento consiste en inyectar los
compuestos a 12 ratas de caractersticas similares y anotar
los tiempos de reaccin. Los animales se clasifican en 5
grupos, administrndole a cada uno de ellos un compuesto
diferente. Se obtuvieron los siguientes resultados:
7.1 5
7.9, 8.5, 10.0 4
8.1, 6.4 3
7.4, 7.1 2
8.3, 7.6, 8.4, 8.3 1
Tiempo de reaccin
(minutos)
Familia
Se puede considerar a un nivel =0.05 que hay diferencias
significativas entre los compuestos?
Supondremos que se verifican las hiptesis de
" Aleatoriedad de las muestras
" Independencia de las variables
" Normalidad de las distribuciones
" Homogeneidad de las varianzas
necesarias para poder llevar a cabo un anlisis de la varianza.
327
Hiptesis nula: Los tiempos medios de reaccin
pueden considerarse idnticos en todos los grupos
Clculos:
Total
5
4
3
2
1
Compuesto
8.01 96.1 12
7.1 7.1 1 7.1
9.13 27.4 3 7.9, 8.5, 10.0
7.25 14.5 2 8.1, 6.4
7.25 14.5 2 7.4, 7.1
8.15 32.6 4 8.3, 7.6, 8.4,
8.3
T
i
n
i
Tiempos
i
x
( ) 30 . 4
1 1
2
=
+ +
=
= =
k
i
n
j
i
ij
i
x x VNE
"
"
( ) 01 . 7
1
2
=
+
=
=
k
i
i
i
x x n VE
$
#
!

= = = =
j i H
H
j
algn para , :
:
1 1
5 4 3 2 1 0


328
Tabla ANOVA:
n-1=11 VT =11.31 Total
S
R
2
= 0.61 n-k=7 VNE =4.30
Dentro de
grupos
2.8
S
E
2
= 1.75 k-1=4 VE = 7.01
Entre
grupos
Estadstico Varianzas
Grados
de
libertad
Suma de
Cuadrados
Fuentes
de
variacin
7 , 4
2
2
F
S
S
R
e
En nuestro caso:
A partir de las tablas se obtiene que
F
0.05;4,7
= 4.12 > 2.8
por lo que no se rechaza la hiptesis de
igualdad de medias
329
Comprobacin de las
hiptesis previas al ANOVA
" Aleatoriedad de las
muestras
$ Test de rachas
" Independencia
de las variables
" Normalidad de las
distribuciones
"Homogeneidad
de las varianzas
$ Test de Bartlett
$ Test de Bondad de
ajuste
$ Teorema Central del
Lmite
$ Test de Independencia
$ Anlisis de los
residuos
330
Homogeneidad de la varianza. Test de Bartlett
Sean X
1
, X
2
, ..., X
k
v.a. i. con X
i
N (
i
;
i
), con
i
y
i
desconocidos, i=1, 2, ..., k.
Para cada variable X
i
se considera una muestra
aleatoria de tamao n
i
:
i
in i i
X X X ,..., ,
2 1
siendo el tamao total de las k
muestras:
+
=
=
k
i
i
n n
1
Se plantea el contraste:
"
$
"
#
!

= = =
j i H
H
j i
k
algn para :
:
2 2
1
2 2
2
2
1
0

"
Criterio de rechazo
Estadstico de contraste
( ) ( )
2
1
1
2 2
1
ln 1 ln
1

= =

0
1
2
3
4
5
+

(
(
*
&
'
'
)
%
+
=
k
k
i
i i
k
i
i
s n s k n
c
B
( )
( )
;
ln 1
1
1
2
2
+

+

=
=
=
k
i
i
k
i
i i
k n
s n
s
( )
( )
(
(
(
(
*
&
'
'
'
'
)
%


+ =
+
=
+
=
k
i
i
k
i
i
k n
n k
1
1
1
1
1
1 3
1
1 c
2
1 k ; ! exp
" B

>
Solucin del test:
331
Ejemplo:
Se desea contrastar la eficacia de tres fertilizantes A, B y C.
El primero se aplica en 8 parcelas, el B en 6 parcelas y el C
en 12 parcelas. Las parcelas son de caractersticas similares
en cuanto a su fertilidad, por lo que se considera que las
diferencias en la produccin sern debidas al tipo de
fertilizante. Las toneladas producidas en cada parcela en una
temporada y para el mismo producto son:
Suponiendo que las tres muestras proceden de poblaciones
normales independientes, contrastar la igualdad de las
toneladas medias producidas con cada fertilizante.
3 6 7 4 6 3 6 7 3 8 4 3 C:
6 10 10 9 9 10 B:
7 4 8 5 6 5 7 6 A:
Supondremos que se verifican las hiptesis de
" Aleatoriedad de las muestras
" Independencia de las variables
" Normalidad de las distribuciones
necesarias para poder llevar a cabo un anlisis de la varianza.
y comprobaremos la ltima hiptesis
" Homogeneidad de las varianzas
mediante el test de Bartlett
Hiptesis nula: Los tres fertilizantes producen el
mismo resultado
332
Test de Bartlett:
2
3
2
2
2
1 0
: = = H
0.4337 9.4621 62 26 Total
1 / 11 11x0.5384 0.5384 38 38/11 12 C
1 / 5 5x0.3802 0.3802 12 12/5 6 B
1 / 7 7x0.2341 0.2341 12 12/7 8 A
1/ (n
i
-1) (n
i
-1) lns
i
2
lns
i
2
(n
i
-1) s
i
2
s
i
2
n
i
Muestra
( ) ( )
2
1
1
2 2
1
ln 1 ln
1

= =

0
1
2
3
4
5
+

(
(
*
&
'
'
)
%
+
=
k
k
i
i i
k
i
i
s n s k n
c
B
( )
( )
4307 . 0 ln
23
62
ln 1
2
1
1
2
2
= , =

=
+
=
+
=
s
k n
s n
s
k
i
i
k
i
i i
( )
( )
0652 . 1
1
1
1
1 3
1
1
1
1
=
(
(
(
(
*
&
'
'
'
'
)
%


+ =
+
=
+
=
k
i
i
k
i
i
k n
n k
c
Estadstico de contraste:
0
2
2 , 01 . 0
exp
rechazamos No
21 . 9
4168 . 0
H
B
,
"
$
"
#
!
=
=

333
ANOVA:
Clculos:
Total
C
B
A
Fert.
6.23 162 26
5 60 12 3 4 8 3 7 6 3 6
4 7 3 6
9 54 6 10 9 9 10 10 6
6 48 8 6 7 5 6 5 8 4 7
T
i
n
i
Produccin
i
x
Tabla ANOVA:
n-1=25 126.62 Total
(VT)
2.696 n-k=23 62
Dentro
grupos
(VNE)
11.98
32.31 k-1=2 64.62
Entre
grupos
(VE)
Estadstico Varianzas G.L. S.C. Fuentes
variacin
0
23 , 2 ; 01 . 0
exp
Rechazamos
66 . 5
98 . 11
H
f
f
,
"
$
"
#
!
=
=
334
Anlisis posteriores al ANOVA
En caso de rechazar la hiptesis nula de
igualdad de medias, qu medias son
diferentes?
Comparacin
de las medias
por parejas
Mtodo de
Scheff para
comparaciones
mltiples
Mtodo de Scheff para comparaciones mltiples:
Contraste de hiptesis:
-
.
/

=
0 :
0 :
1
0
L H
L H
+
=
=
k
i
i i
c L
1

0
1
=
+
=
k
i
i
c
siendo L una combinacin lineal de las medias de los
tratamientos:
y c
i
constantes verificando:
El mtodo de Scheff est basado en la
construccin de intervalos de confianza para
todos los posibles contrastes de la forma
indicada
335
( )
+ +
=
+

=
+
=
= =
= =
k
i
n
j
i
ij
k
i i
i
k
i i
i
d L
i
x x VNE
n
c
k n
VNE
n
c
S S
1 1
2
1
2
1
2
2 2
con
!Estimador insesgado de L:
!Varianza del
estimador:
+
=
=
k
i
i
i
x c L
1

Considerando:
Intervalo de confianza:
( ) ( ) [ ]
k n k L k n k L
F k S L F k S L

+
, 1 ; , 1 ;
1

, 1


Si para algn contraste L se obtiene un
intervalo que no contiene al 0, se rechaza
la hiptesis nula
Conclusin:
336
Ejemplo:
Se desea contrastar la eficacia de tres fertilizantes A,
B y C. El fertilizante A se aplica en 8 parcelas, el B
en 6 parcelas y el C en 12 parcelas. Las parcelas son
de caractersticas similares en cuanto a su fertilidad,
por lo que se considera que las diferencias en la
produccin sern debidas al tipo de fertilizante. Las
toneladas producidas en cada parcela en una
temporada y para el mismo producto son:
3, 4, 8, 3, 7, 6, 3, 6, 4,
7, 6, 3
C
10, 9, 9, 10, 10, 6 B
6, 7, 5, 6, 5, 8, 4, 7 A
Toneladas de producto Fertilizante
a) Supuesto que las tres muestras proceden de
poblaciones normales independientes con la
misma varianza, contrastar la igualdad de
produccin media en Tm. de las parcelas con
cada fertilizante
b) En caso de rechazar la igualdad en las
producciones, contrastar la produccin media
con el fertilizante A frente al C y la produccin
media con A y C frente a B, con =0.01
337
a) ANLISIS DE LA VARIANZA
Hiptesis nula: La produccin media es la misma
independientemente del fertilizante
Clculos:
Total
C
B
A
Fertilizante
6.23 162 26
5 60 12 3, 4, 8, 3, 7, 6,
3, 6, 4, 7, 6, 3
9 54 6 10, 9, 9, 10,
10, 6
6 48 8 6, 7, 5, 6, 5, 8,
4, 7
T
i
n
i
Produccin
i
x
n-1=25 126.62 Total
2.696
n-k=23 62.00 Dentro
grupos
11.98
32.31 k-1=2 64.62 Entre
grupos
Estadstico Varianzas G.L. S.C. Fuentes
variacin
F
0.01;2,23
= 5.66 < 11.98
por lo que se rechaza la hiptesis de igualdad
de medias
338
b) Comparaciones mltiples mediante el mtodo
de Scheff:
Contraste 1:
-
.
/

=
0 :
0 :
1 1
1 0
L H
L H
5616 . 0
12
1
8
1
696 . 2
1 5 6

2
3 1
1
1
=
(
*
&
'
)
%
+ =
= = =
L
S
x x L
Intervalo de confianza:
[ ]
[ ] 3.531 1.521,
2 5616 . 0 1 , 2 5616 . 0 1
23 , 2 ; 01 . 0 23 , 2 ; 01 . 0 1
=
= + = F F I
Contraste 2:
-
.
/

=
0 :
0 :
2 1
2 0
L H
L H
359 . 2
12
1
8
1
6
4
696 . 2
7 5 6 18 2

2
3 1 2
2
2
=
(
*
&
'
)
%
+ + =
= = =
L
S
x x x L
Intervalo de confianza:
[ ]
[ ] 12.167 1.832,
2 359 . 2 7 , 2 359 . 2 7
23 , 2 ; 01 . 0 23 , 2 ; 01 . 0 1
=
= + = F F I
L
1
=
1
-
3
; L
2
= 2
2
-
1
-
3
0I
1
, por lo que podemos
considerar
1
=
3
0I
2
, por lo que podemos
considerar 2
2

1
+
3
339
Aplicaciones del test:
Comparacin de tratamientos cuando
$ no es conocida la normalidad de las
distribuciones o no se verifica
$ la variable respuesta es cualitativa u ordinal
Test de Kruskal Wallis o Anlisis de la Varianza
de una va por rangos:
" Permite decidir si k muestras independientes
han sido extradas de la misma poblacin o de
poblaciones idnticas.
Hiptesis del test de Kruskal Wallis:
" Las observaciones han de estar medidas al
menos en la escala ordinal
" La variable de inters ha de tener como
base una distribucin continua
" Las poblaciones de las que se extraen las
muestras han de ser idnticas aunque pueden
diferir en la localizacin de la media
!Anova No Paramtrico
340
Sean:
( ) ( )
k
kn k k n
X X X X X X ,..., , ,..., ,..., ,
2 1 1 12 11
1
Desarrollo del test:
k muestras independientes de tamaos n
1
, n
2
, ...,
n
k
, respectivamente, de distribuciones continuas
$
#
!
central ia su tendenc en difieren ones distribuci Las :
idnticas son ones distribuci Las :
1
0
H
k H
1. Ordenar conjuntamente las N = n
1
, n
2
, ..., n
k
observaciones
2. Asignar rangos de 1 a N a las observaciones
3. Calcular R
i
= Suma de los rangos de las
observaciones de cada una de las muestras, i
=1,2,..., k
Fundamento del test:
El contraste determina si la disparidad entre los
R
i
respecto a los tamaos muestrales n
i
es
suficientemente significativa para sugerir el
rechazo de la hiptesis nula
Solucin del test:
341
Criterio de rechazo
Estadstico de contraste
( )
( )
2
1
1
2
1 3
1
12

=
+
(
(
*
&
'
'
)
%
+
+
=
k
k
i i
i
N
n
R
N N
H
2
1 exp
>
!,k
" H
342
Ejemplo:
Se desea comprobar si la intensidad del ruido influye en
la duracin de una cierta tarea laboral. Para ello se
tomaron tres muestras bajo tres niveles diferentes de
ruido (bajo, medio y alto) de los tiempos (en segundos)
empleados por obreros de caractersticas similares para
llevar a cabo dicha tarea, obtenindose los siguientes
datos:
34
30
28
42
45
21
25
24
18
16
15
20
25
Nivel 3 Nivel 2 Nivel 1
Contrastar la igualdad de los tiempos medios de
reaccin de ambos grupos
Diferenciando los valores de las muestras y asignando
los rangos, obtenemos:
15 16 18 20 21 24 25 25 28 30 34 42 45
1 1 1 1 2 2 1 2 3 3 3 3 3
1 2 3 4 5 6 7.5 7.5 9 10 11 12 13
343
Que en forma de tabla:
11
10
9
12
13
5
7.5
6
3
2
1
4
7.5
R
3
= 55 R
2
= 18.5 R
1
= 17.5
Nivel 3 Nivel 2 Nivel 1
El estadstico de contraste:
( )
( )
( )
( ) 45 . 9 1 13 3
5
55
3
5 . 18
5
5 . 17
1 13 13
12

1 3
1
12
2 2 2
1
2
= +
(
(
*
&
'
'
)
%
+ +
+
=
= +
(
(
*
&
'
'
)
%
+
+
=
=
N
n
R
N N
H
k
i
i
i
y como:
21 . 9
2
2 , 01 . 0
=
H
exp
= 9.45 > 9.21 ,Rechazamos la hiptesis nula
de igualdad entre los tiempos medios de reaccin

You might also like