You are on page 1of 79
13.1 INTRODUCCI6N 13.8 ANA.LlSIS UNILATERAL DE LA 13.2 ESCALAS DE MEDICI6N VARIANCIA POR JERARQuiAs DE

13.1 INTRODUCCI6N

13.8

ANA.LlSIS UNILATERAL DE LA

13.2 ESCALAS DE MEDICI6N

VARIANCIA POR JERARQuiAs DE KRUSKAL-WALLIS

13.3 PRUEBA DEL SIGNO

13.9

ANA.LISIS BILATERAL DE LA VARIANCIA POR JERARQUiAS

13.4 PRUEBA DE JERARQuIA SIGNADA DE WILCOXON PARA UBICACI6N

DE FRIEDMAN

13.5 PRUEBA DE LA MEDIANA

13.10

COEFICIENTE DE CORRELACI6N POR JERARQuIAs DE SPEARMAN

13.6 PRUEBA DE MANN-WHITNEY

13.11

ANA.LlSIS DE REGRESI6N NO

 

PARAMETRIC0

13.7 PRUEBA DE BONDAD DE AJUSTE DE KOLMOGOROV-SMIRNOV

13.12

RESUMEN

13.1

,

INTRODUCCION

Los procedimientos de inferencia estadfstica estudiados hasta este momenta se clasifican como estadisticas parametricas. La unica excepci6n es el uso de ji­ cuadrada en la prueba de bondad de ajuste y en la prueba de independencia. Estos usos de ji-cuadrada se clasifican como estadisticas no parametncas. Ahora la pregunta obvia es: ~cual es la diferencia? Para responder, es necesario recordar la naturaleza de los procedimientos de inferencia clasificados como parametricos. En cada situaci6n, el objetivo consistfa en estimar 0 probar una hip6tesis acerca de uno 0 mas parametros de la poblaci6n. Ademas, el elemento fundamental de estos procedimientos fue el conocimiento de la forma funcional de la distribuci6n de la poblaci6n de la cual se extrajeron las muestras que proporcionaron la base para la inferencia. Un ejemplo de una prueba estadfstica parametrica es la ampliamente utilizada prueba t. Los usos mas comunes de esta prueba son los de probar una hip6tesis acerca de la media de una sola poblaci6n 0 la diferencia entre las medias de dos poblaciones. Una de las suposiciones que fundamentan el uso valido de esta prueba es que la poblaci6n 0 poblaciones de donde proceden las muestras tienen, al menos, una distribuci6n aproximadamente normal.

658

13.2

ESCALAS DE MEDICION

659

En este capitulo se estudian procedimientos que no se centran en panimetros de poblacion ni dependen del conocimiento de la poblacion de la que se extraen las muestras. Estrictamente hablando, solo aquellos procedimientos que prueban hipotesis que no son afirmaciones acerca de los parametros de la poblacion, se clasifican como no parametricos, mientras que a aquellos que no hacen suposicion alguna acerca de la poblacion de la cual se extraen las muestras, se les conoce como procedimientos de libre distribucion. Pese a esta diferencia, se acostumbra utilizar los terminos no parametrico y de libre distribuciOn indistintamente y analizar los diversos procedimientos de ambos tipos bajo el titulo de estadisticas no parametricas. A partir de aqui se seguira este uso convencional. Lo expuesto anteriormente implica las dos siguientes ventajas de las estadfsticas no parametricas.

1.

Permiten la prueba de hipotesis que no son afirmaciones acerca de los valores de los parametros de la poblacion. Algunas pruebas de ji-cuadrada de bondad de ajuste y de independencia son ejemplos de pruebas que tienen estas ventajas.

2.

Las pruebas no parametricas pueden utilizarse cuando se desconoce la distribucion de la poblacion de la cual se extraen las muestras.

3.

Los procedimientos no parametricos son mas faciles de calcular y, en consecuencia, se aplican con mayor rapidez que los procedimientos parametricos. Esta puede ser una caracteristica conveniente en ciertos casos, pero cuando el tiempo no es un factor importante merece poca prioridad como criterio para elegir una prueba no parametrica.

4.

Los procedimientos no parametricos pueden aplicarse cuando los datos que sirven para el analisis constan simplemente de categorias 0 clasificaciones. Es decir, los datos pueden no estar basados en una escala de medicion 10 suficientemente solida como para permitir las operaciones aritmeticas necesarias para llevar a cabo los procedimientos parametricos. EI tema de las escalas de medicion se analiza con mas detalle en la siguiente seccion.

Aunque las estadfsticas no parametricas tienen ciertas ventajas, tambien deben reconocerse sus desventajas.

1. El uso de procedimientos no parametricos con datos que pueden manejarse con un procedimiento parametrico produce un desperdicio de informacion.

2. La aplicacion de algunas de las pruebas no parametricas puede ser muy laboriosa para muestras grandes.

13.2 ESCAIAS DE MEDICI ON

En la seccion anterior se menciona que una de las ventajas de los procedimientos estadisticos no parametricos es que pueden utilizarse con datos basados en una escala de medicion debil. Para comprender completamente el significado de esta afirmacion, es necesario conocer 0 entender el significado de medicion y de las

660

CAPITULO 13

ESTADISTICA NO PARAMETRICA

diversas escalas de medici6n que se utilizan con mas frecuencia. El lector puede consultar el capitulo 1 donde se estudian las escalas de medici6n. Muchas autoridades en la materia opinan que las pruebas estadisticas dife­ rentes requieren distintas escalas de medici6n. Aunque se crea que en la practica se sigue esta idea, existen puntos de vista alternativos.

13.3 PRUEBA DEL SIGNO

La prueba t, estudiada en los capitulos anteriores, no es estrictamente valida para probar: 1) la hip6tesis nula de que la media de una poblaci6n es igual a alglin valor en particular, 0 bien, 2) la hip6tesis nula de que la media de una poblaci6n de diferencias entre pares de medicinas es igual a cero, a menos que las poblaciones en cuesti6n sigan una distribuci6n normal. El casu 2 se reconocera como una situaci6n que se analiza mediante la prueba de comparaci6n por parejas en el capitulo 7. Cuando no es posible hacer suposiciones de normalidad 0 cuando los datos dispo­ nibles son categorfas en lugar de medidas sobre una escala de intervalos 0 de razo­ nes, debe buscarse un procedimiento opcional. Aun cuando se sabe que la prueba t es casi insensible a las violaciones de la suposici6n de normalidad, hay casos en que resulta preferible una prueba alternativa. Una prueba no parametrica que se utiliza con frecuencia y que no depende de los supuestos de la prueba t es la prueba del signo. Estaprueba se centra en la media­ na mas que en la media como una medida de tendencia central 0 de ubicaci6n. La mediana y la media seran iguales en distribuciones simetricas. La unica suposicion que fundamenta la prueba es que la distribuci6n de la variable de interes es conti­ nua. Esta suposici6n excluye el uso de datos nominales. La prueba del signo toma su nombre del hecho de que los signos mas y me­ nos, y no los valores numericos, proporcionan los datos utilizados en los calculos. Se ilustrara el uso de esta prueba primero en el casu de una sola muestra y, a conti­ nuaci6n, mediante un ejemplo que implique muestras por parejas.

EJEMPLO 13.3.1

Los investigadores desean saber si al instruir en cuidados y aseo personal a una mues­ tra de niiias con retraso mental mejorarfa su apariencia. Se eligi6 aleatoriamente a 10 niiias de una escuela para niiios con retraso mental, para que recibieran educacion especial sobre cuidado y aseo personal. Dos semanas despues de conduir el curso de instrucci6n, las niiias fueron entrevistadas por una enfermera y una trab.yadora so­ cial, quienes asignaron a cada niiia una calificaci6n basada en su apariencia general. Los investigadores creian que, como maximo, las calificaciones alcanzarfan el nivel de una escala ordinal. Crefan que aunque una calificacion de, digamos 8, representa­ ba una apariencia mejor que una de 6, no podfan decir que la diferencia entre las calificaciones de 6 y 8 era igual a la diferencia entre las calificaciones 8 y 10, 0 bien, que la diferencia entre las calificaciones de 6 y 8 representaba el doble de mejora que la diferencia entre las calificaciones 5 y 6. Las calificaciones se muestran en la tabla 13.3.1. Se desea saber si es posible conduir que la calificaci6n mediana de la pobla­ ci6n de la que se supone se extrajo la muestra es diferente de 5.

13.3

PRUEBA DEL SIGNO

661

TABLA 13.3.1

general de 10 ninas con reu'aso mental

Caliticaciones de apariencia

Nina

Calificaci6n

Nina

Calificaci6n

1

4

6

6

2

5

7

lO

3

8

8

7

4

8

9

6

5

9

10

6

Soluci6n:

1. Datos.

Ver el planteamiento del problema.

2. Supuestos.

Se supone que las mediciones se tomaron para una

variable continua.

3, Hip6tesis.

Ho: la mediana de la poblaci6n es 5. H A : la mediana de la poblaci6n es diferente de 5.

Sea 0: =.05.

4. Estadistica de prueba. La estadistica de prueba para la prueba del signo es el numero observado de signos mas 0 de signos menos. La naturaleza de la hip6tesis alternativa determina cual de estas es­ tadisticas de prueba es conveniente. En una prueba dada, cualquie­ ra de las siguientes hip6tesis alternativas puede ocurrir.

H A : P( +)

H

H

> PH alternativa unilateral

alternativa unilateral

< P(-)

A : P( +)

A : P( +) *-

P(-)

alternativa bilateral

Si la hip6tesis alternativa es

*- P(-) alternativa bilateral Si la hip6tesis alternativa es un numero suficientemente pequeno de signos menos

un numero suficientemente pequeno de signos menos causa el re­ chazo de Ho' La estadistica de prueba es el numero de signos me­ nos. En forma analoga, si la hip6tesis alternativa es

me­ nos. En forma analoga, si la hip6tesis alternativa es un numero suficientemente pequeno de signos

un numero suficientemente pequeno de signos mas causa el recha­ zo de Ho' La estadistica de prueba es el numero de signos mas. Si la hip6tesis alternativa es:

662

CAPITULO 13

ESTADISTICA NO PARAMETRICA

662 CAPITULO 13 ESTADISTICA NO PARAMETRICA un numero suficientemente pequeno de signos menos 0 signos mas

un numero suficientemente pequeno de signos menos 0 signos mas causa el rechazo de la hip6tesis nula. Se puede tomar como estadfs­ tica de prueba al signo que ocurra con menor frecuencia.

5. Distribuci6n de la estadistica de prueba. EI primer paso para de­

terminar la naturaleza de la estadfstica de prueba es analizar la tabla 13.3.1 para establecer cuales calificaciones caen arriba y cuales aba­ jo de la mediana supuesta de 5. Si el signo mas se asigna a las califi­ caciones que caen arriba de la mediana supuesta y el signa menos a las que caen por abajo, se obtienen los resultados que se muestran en la tabla 13.3.2. Si la hip6tesis nula fuera verdadera, esto es, si en efecto la mediana fuera 5, se esperarfa que el numero de calificaciones que caen por arriba y por abajo de 5 fuera casi igual. Esta forma de razonamiento sugiere otra manera en la que podrfa haberse enunciado la hip6tesis nuIa, a saber, que la probabi­ lidad de un signo mas es igual a Ia probabilidad de un signo menos. Estas probabilidades son, cada una, iguales a .5. Simb61icamente, la hip6tesis seria

cada una, iguales a .5. Simb61icamente, la hip6tesis seria En otras palabras, se espera casi el

En otras palabras, se espera casi el mismo numero de signos mas que de sig­ nos menos en la tabla 13.3.2 cuando Ho es verdadera. La observaci6n de esta tabla revela una preponderancia de signos mas; especfficamente, se observan ocho signos mas, un signa menos y un cero, el cual se asigno a la calificacion que cayo exactamente en la mediana. El procedimiento habitual para mane­ jar los ceros es eliminarlos del analisis y, en consecuencia, reducir n, el tamano de la muestra. Si se sigue este procedimiento, el problema se reduce a nueve observaciones, de las cuales ocho son signos mas y una es menos. Dado que el numero de signos mas y menos no es el mismo, uno se pregunta si la distribucion de los signos es suficientemente desproporcionada como para arrojar alguna duda sobre la hipotesis. Dicho de otra forma, Ia pregunta es si este pequeno numero de signos menos pudo ser unicamente resultado del azar cuando la hip6tesis nula es verdadera, 0 bien, si el numero es tan pequeno que un elemento que no es el azar (es decir, una hip6tesis nula falsa) es responsable de los resultados.

TABlA 13.3.2 Calificaciones pOl' arriba (+) y pOl' abajo (-) de la mediana hipotetica basada en los datos del ejemplo 13.3.1

Nina

1

2

3

4

5

6

7

8

9

10

Calificaci6n

0

+

+

+

+

+

+

+

+

relativa a Ia me­ diana hipotetica

13.3

PRUEBA DEL SIGNO

663

Con base en 10 expuesto en el capitulo 4, parece razonable concluir que las observaciones de la tabla 13.3.2 constituyen un conjunto de n variables aleatorias independientes de una poblaci6n de Bernoulli con parametro p. Si k es igual a la estadistica de prueba, la distribuci6n muestral de k es la distri­ buci6n binomial de probabilidad con parametro p .5, si la hip6tesis nula es verdadera.

La regIa de decisi6n depende de la hip6tesis

6. Regia de decision. alternativa.

Para H A : P( +) > P(-) se rechaza H Q , cuando Ho es verdadera, si la probabilidad de observar k 0 menos signos menos es me­ nor 0 igual que a.

se rechaza H o ' cuando Ho es verdadera, si

la probabilidad de obtener k 0 menos signos mas es menor 0 igual que a. Para H A : P( +)"* P(-) se rechaza H o ' cuando Ho es verdadera, si la probabilidad de obtener un valor de k tan extrema 0 mas que el valor calculado es igual ° menor que a/2.

Para H A : P( +) < P(-)

Para este ejemplo, la regIa de decisi6n es rechazar Ho' Si el valor p de la estadfstica de prueba es menor ° igual que .05.

7. Calculo de la estadistica de prueba. Es po sible determinar la pro­ babilidad de observar x 0 menos signos menos, cuando esta dada una muestra de tamano n y parametro p, mediante la evaluaci6n de la siguiente expresi6n:

P(k ~x In, P) = t" Ckpkq,,-k

k=O

Para este ejemplo se calcula

(13.3.1)

t" Ckpkq,,-k k=O Para este ejemplo se calcula (13.3.1) 8. Decisi6n estadistica. En la tabla B

8. Decisi6n estadistica. En la tabla B del apendice se encuentra

0.195

Con una prueba bilateral, un numero suficientemente pequeno de signos menos 0 signos mas puede provocar el rechazo de la hip6­ tesis nula. Ya que, en el ejemplo, se tiene un menor numero de signos menos, la atenci6n se centra en estos mas que en los signos mas. AI asignar a a el valor .05, se dice que si el numero de signos menos es tan pequeno que la probabilidad de observar tan pocos, 0 incluso menos, es menor que .025 (la mitad de a), se rechaza la hip6tesis nula. La probabilidad calculada .0195, es menor que .025. Por 10 tan­ to, se rechaza la hip6tesis nula.

P(k ~x 119, .5) =

664

CAPITULO 13

ESTADISTICA NO PARAMETRICA

9.

Conclusion.

Se concluye que la calificaci6n mediana no es 5.

10.

Valor de p. Para esta pmeba el valor de pes 2(.0195) =.0390 .•

Prueba del signo para parejus de datos Cuando los datos que van a analizarse constan de observaciones por parejas y no se satisfacen los supuestos que fundamentan la pmeba t, 0 la escala de medicion es debil, puede utilizarse la pme­ ba del signo para probar la hipotesis nula de que la mediana de las diferencias es igual a O. Una forma alternativa de enunciar la hip6tesis nula es la siguiente:

alternativa de enunciar la hip6tesis nula es la siguiente: De las calificaciones por parejas, se toma

De las calificaciones por parejas, se toma una, por ejempl0 y" y se resta de la otra calificaci6n Xi" Si Y, es menor que Xi' el signo de la diferencia es +, y si Y, es mayor que Xi' el signo de la diferencia es -. Si la mediana de las diferencias es 0, se esperaria que una pareja seleccionada al azar tuviera exactamente la misma proba­ bilidad de dar un signo + 0 - cuando se hace la resta. Puede enunciarse la hip6tesis nula como sigue:

Ho: P(+) = PH =

.5

En una muestra aleatoria formada por parejas, se esperarfa que el numero de sig­ nos + y sea casi igual. Si existen mas signos + 0 - que los que pueden atribuirse unicamente al azar, cuando la hipotesis nula es verdadera, se tendran ciertas dudas acerca de la veracidad de la hip6tesis nula. Mediante la prueba del signo, es posible determinar cuantos signos de uno u otro tipo son mas de los que pueden atribuirse unicamente al azar.

FJEMPLO 13.3.2

Un equipo de investigaci6n dental querfa saber si ensefiar a la gente a cepillarse los dientes serfa benefico. Se formaron doce parejas de pacientes de una clinica dental, con igualdad en factores como edad, sexo, inteligencia y calificaciones iniciales de higiene bucal. Un miembro de cada pareja recibi6 instrucci6n acerca de la forma de cepillarse los dientes y otros temas de higiene bucal. Seis meses despues, los 24 individuos fueron examinados y se les asigno una calificaci6n de higiene bucal mediante el examen de un especialista en la materia, quien ignoraba cuales perso­ nas hahfan recibido la instrucci6n. Una calificacion baja indica un alto nivel de higiene bucal. Los resultados se muestran en la tabla 13.3.3.

Solucion:

1.

Datos. Vease el planteamiento del problema.

2.

Supuestos. Se supone que la poblacion de diferencias entre los pares de calificaciones es una variable continua.

3.

HipOtesis.

Si las instrucciones producen efectos beneficos, este he­

cho se reflejara en las calificaciones asignadas a los miembros de cada par. Si se toman las diferencias entre Xi - Y" es de esperarse que haya mas signos - que signos + si la instrucci6n resulta benefica, pOIque

13.3

PRUEBA DEL SIGNO

665

TABlA 13.3.3

de 12 individuos que recibieron instrucciones

de higiene buca1 (Xi) y 12 individuos que no recibieron instrucciones (Y,)

Calificaciones de higiene bucal

Calificacion

Numero

Con instruccion

Sin instruccion

de pareja

(X)

(1')

1

1.5

2.0

2

2.0

2.0

3

3.5

4.0

4

3.0

2.5

5

3.5

4.0

6

2.5

3.0

7

2.0

3.5

8

1.5

3.0

9

1.5

2.5

10

2.0

2.5

11

3.0

2.5

12

2.0

2.5

una calificaci6n baja indica un nivel mayor de higiene bucal. Si, en efecto, la instrucci6n es benefica, la mediana de la poblaci6n supuesta de todas las diferencias serla menor que 0, es decir, negativa. En caso contrario, si la capacitaci6n no tiene efectos, la mediana de esta po­ blaci6n seria cero. Las hip6tesis nula y alternativa son, por 10 tanto:

Ho: la mediana de las diferencias es cero [P( +) = P(-I)J. H A : la mediana de las diferencias es negativa [P( +) < P(-)].

Seaa = .05.

4. Estadistica de prueba. signos +.

La estadistica de prueba es el numero de

5. Distribucion de la estadistica de prueba. La distribuci6n muestral de k es a una distribuci6n binomial con parametros n y .5 si Ho es verdadera.

6. Regia de decision.

Se rechazaH

o

si P(k:5

2

I 11, .5):5

.05.

7. Calculo de la estadistica de prueba. EI procedimiento es identico al que se utiliza para una sola muestra, una vez que se obtienen las diferencias para cada par. AI efectuar las restas, se obtienen los re­ sultados que aparecen en la tabla 13.3.4.

666

CAPITULO 13

ESTADISTICA NO PARAMETRICA

.TABLA 13.3.4

Signos de las diferencias ~ - ~) en las

calificaciones de higiene bucal de 12 individuos con inst.·uccion ~) y 12 individuos sernejantes sin instruccion (~)

Pareja

1

234

5

6

7

8

9

10

11

12

Signo de la diferencia de calificaciones

o

+

+

La naturaleza de las hipotesis indica una prueba unilateral, por 10 que la totalidad de ex = .5 esta asociada con la region de rechazo, que se compone de todos los valores de k (donde k es igual al numero de signos +) para los que la probabilidad deobtener una cantidad igualo menor de signos + atribuible al azar, cuando Ro es verdadera, es menor 0 igual que .05. En la tabla 13.3.4 se aprecia que el experi­ mento proporciona un cero, dos signos mas y nueve signos menos. Si se elimina el cero, el tamano real de la muestra es n = 11 con dos signos + y nueve signos -. En otras palabras, puesto que un numero "pequeno" de signos + causa el rechazo de la hipotesis nula, el valor de la estadistica de prueba es k = 2.

8. Decision estadistica.

Lo que se pretende es conocer la probabili­

dad de tener no mas de dos signos + en las once pruebas, cuando la hipotesis nula es verdadera. La respuesta se obtiene al evaluar la ex­ presion binomial adecuada. Para este ejemplo se tiene

P(k::; 2111, .5)= L 2 llC k (·5)k(.5)11-k

k=O

AI consultar la tabla B, se obtiene una probabilidad de.0327. Puesto que .0327 es menor que .05, es posible rechazar a Ro.

9. Conclusion.

Se concluye que la mediana de las diferencias es ne­

gativa. Esto es, se concluye que la capacitacion es benefica.

10. Valor de p.

Para esta prueba, p =.0327.

Prueba del signo con tablas "mayores que" Como se ha demostrado, la prueba del signo puede emplearse con una sola muestra 0 con dos de ellas, en las que cada miembro de una de las muestras se une con uno de los miembros de la otra para formar una muestra por parejas. Tambien se ha visto que la hipotesis alternativa puede conducir a una prueba unilateral 0 a una prueba bilateral. En cualquier caso, la atencion se centra en el signa menos frecuente y se calcula la probabilidad de obtener un numero menor 0 igual de signos de este tipo. Se utiliza el signo que se presenta con menos frecuencia como estadistica de prueba debido a que las probabilidades binomiales de la tabla B son probabilidades "menores 0 iguales que". AI utilizar el signa menos frecuente, es posible obtener la

13.3

PRUEBA DEL SIGNO

667

probabilidad directamente de la tabla B sin tener que hacer restas. Si las probabili­ dades de la tabla B fueron "mayores 0 iguales que", como las que suelen darse en las tablas de la distribucion binominal, se utilizada como estadistica de prueba el signo mas frecuente, para aprovechar la conveniencia de obtener directamente la probabilidad deseada sin tener que hacer resta alguna. De hecho, en estos ejemplos podric: utilizarse como estadistica de Hrueba el signa mas frecuente, pero dado que Ia tabla B contiene probabilidades "menores 0 iguales que", se tendda que hacer una resta para obtener la probabilidad deseada. Considere el ultimo ejemplo. Si se

utiliza como estadistica de prueba el signo mas frecuente, que es el signo -, el valor de la estadistica es 9. Asi, la probabilidad deseada es de 9 0 mas signos -, cuando n

11 y P = .5. Es decir, se necesita:

P(k?

9

I 11, .5)

Sin embargo, dado que la tabla B contiene probabilidades "menores 0 iguales que", debe obtenerse esta probabilidad mediante resta. Es decir,

P(k

?

9

I 11, .5) =

1 -

P(k

s

8

I 11, .5)

 

1

.9673

 

= .0327

que es el resultado obtenido anteriormente.

Tomano de la muestra En el capitulo 5 se estudia que, cuando el tamano de

la muestra es grande ypesta cercano a .5, la distribucion binomial puede ser aproxi­

mada por la distribucion normaL La regIa empirica utilizada dice que la aproxima­ cion normal es conveniente cuando np y nq son mayores que 5. Cuando p .5, como se establece en las hipotesis de los ejemplos estudiados, una muestra de ta­ mano 12 puede satisfacer la regIa empirica. Siguiendo este razonamiento, puede utilizarse la aproximacion normal cuando se usa la prueba del signo para probar la hipotesis nula de que Ia mediana 0 la mediana de las diferencias es 0 y n es mayor

o igual que 12. Dado que el procedimiento implica la aproximacion de una distri­ bucion continua mediante una distribuci6n discreta, en general, se utiliza la correc­

cion de continuidad de .5. Por 10 tanto, la estadistica de prueba es

z = -'----'-;=~-

.5-fr;

(13.3.2)

Ia cual se compara contra el valor de z a partir de la distribucion normal estandar correspondiente al nivel de significacion escogido. En la ecuacion 13.3.2, k + .5 se utiliza cuando k < n/2, y k .5 se utiliza cuando k > n/2.

Antilisis por oomputaoora Muchos paquetes de software estadfstico aplican la prueba del signo. Por ejemplo, si se utiliza el paquete MINITAB para aplicar la prueba del signa para el ejemplo 13.3.1, donde los datos estan almacenados en la columna 1, el procedimiento y los resultados sedan como los que se muestran en la figura 13.3.1.

668

CAPITULO 13

ESTADiSTICA NO PARAMETRICA

Datos:

C1:

4

5

8

8

9

6

10

7

6

6

Caja de dialogo:

 

Comandos de la sesi6n:

Stat >- Nonparametrics >- 1 -Sample Sign

 

MTB

>

STest

5

C1i

 

SUBC>

Alternative

O.

Teclear CI en Variables. Seleccionar Test median y teclear 5 en la caja de texto. Clic OK.

 

Resultados:

 

Prueba de signo para la mediana

 

Sign

test

of

median

=

5.00

versus

N.E.

5.000

 
 

N

BELOW

EQUAL

 

ABOVE

P-VALUE

MEDIAN

C1

10

1

1

8

0.0391

8.000

F-JERCICIOS

FIGURA 13.3.1

Procedimiento MINITAB Yresultados para el ejemplo 13.3.1.

13.3.1 Una muestra aleatoria de 15 estudiantes de enfermerfa present6 los siguientes resultados despues de una prueba para medir sus niveles de autoritarismo:

Numerode

Calificaci6n

Numerode

Calificaci6n

estudiante

de autoritarismo

estudiante

de autoritarismo

1

75

9

82

2

90

10

104

3

85

11

88

4

llO

12

124

5

115

13

llO

6

95

14

76

7

132

15

98

8

74

 

Pruebe en el nivel de significaci6n de .05 la hip6tesis nula que indica que la mediana de la calificaci6n para la poblaci6n de la que se extrae la muestra es 100, y determine el valor de p.

13.3.2 EI prop6sito de un estudio realizado por Vaubourdolle et ai. (A. 1) era investigar la influencia de la dihidrostestosterona (DHT) liberada a traves de la piel en la velocidad de eliminaci6n de etanol del plasma, para determinar si el efecto de inhibici6n de la DHT sobre la actividad

13.4

PRUEBA DE JERARQUiA DE WILCOXON

669

de la deshidrogenasa del alcohol ocurria en hombres sanos. Los individuos eran 10 hombres sanos que voluntariamente participaron en el estudio, con edades entre 25 y 44 aftos. Entre los datos que se recolectaron estan las siguientes concentraciones de testosterona (T) (nmoW) antes y despues del tratamiento con DHT:

Individuo:

2

3

4

5

6

7

8

9

10

Antes:

21.5

23.0

21.0

21.8

22.8

14.7

21.0

23.4

20.0

29.5

Despues:

9.4

17.2

13.0

6.4

4.8

4.5

10.7

15.6

12.5

7.7

FUENTE: M. VaubourdoIIe. J. Guechot, O. ChazouiIIeres, R. E. Poupon y J. Giboudeau, "Effect of Dihydrotestosterone on the Rate of Ethanol Elimination in Healthy Men", Alcoholism: Clinical and Expe­ rimental Research, 15 (No.2). 238-240. Copyrigth©, The Research Society of Alcoholism.

Con base en estos datos, ~esposible conduir que el tratamiento con DHT reduce las concen­ traciones de testosterona en hombres sanos? Sea a. = .01.

13.3.3 Una muestra de 15 pacientes con asma particip6 en un experimento para estudiar los efec­ tos de un nuevo tratamiento sobre la funci6n pulmonar. Una de las mediciones que se regis­ traron fue la de vohimen espiratorio forzado (litros) en 1 segundo (VEF j ) antes y despues de la aplicaci6n del tratamiento. Los resultados son los siguientes:

Individuo

Antes

Despues

Individuo

Antes

Despues

1

1.69

1.69

9

2.58

2.44

2

2.77

2.22

10

1.84

4.17

3

1.00

3.07

11

1.89

2.42

4

1.66

3.35

12

1.91

2.94

5

3.00

3.00

13

1.75

3.04

6

.85

2.74

14

2.46

4.62

7

1.42

3.61

15

2.35

4.42

8

2.82

5.14

 

Con base en estos datos, <!es posible concluir que el tratamiento incrementa de manera eficaz el niveldel VEFl? Sea a. = .05, Y calcule el valor de p.

13.4 PRUEBA DE JERARQuIA SIGNADA

DE WILCOXON

PARA UBICACION

En algunos casos se desea probar una hipotesis nula con respecto a la media de la poblacion, pero, por alguna razon, z y t resultan inadecuadas como estadisticas de prueba. Se exc1uye la estadistica z cuando se tiene una muestra pequena (n < 30) de una poblaci6n que a simple vista parece seguir una distribuci6n no normal y el teorema dellfmite central no es aplicable. La estadfstica t no es conveniente porque la distribucion de la poblaci6n de la que se extrae la muestra no se aproxima 10 suficiente a la normalidad. Cuando se presentan tales situaciones, normalmente se busca un procedimiento estadistico no parametrico. Como se ha visto, la prueba del signo puede utilizarse cuando los datos conforman una muestra simple 0 cuando se

670

CAPiTULO 13

ESTADISTICA NO PARAt'\1f~TRICA

presentan en pares. Sin embargo, si los datos para el amilisis son medidos al menos en una escala de intervalos, la prueba del signo tal vez no sea aconsejable pOI'que podrfa desperdiciarse mucha informaci6n contenida en los datos. Un procedimiento mas adecuado puede ser la prueba de jerarquia signada de Wilcoxon (1), la cual utiliza las magnitudes de las diferencias entre las mediciones y un supuesto parametro de ubicacion en lugar de (micamente los signos de las diferencias.

Supuestos

posiciones sobre los datos.

La prueba de Wilcoxon para ubicaci6n se basa en las siguientes su­

1.

La muestra es aleatoria.

2.

La variable es continua,

3.

La poblacion se distribuye simetricamente alrededor de su media f.l.

4.

La escala de medici6n es al menos de intervalos.

Hipotesis Las siguientes hip6tesis son hip6tesis nulas Gunto con las hipotesis

alternativas) que pueden probarse para alguna media de poblacion no conocida f.l o

'

a)

Ho : f.l

f.lo

b)

Ho : f.l ~f.lo

c)

Ho : f.l:S; f.lo

HA : f.let: f.lo

HA :f.l<f.lo

HA :f.l>f.lo

1.

Cuando se utiliza el procedimiento de Wilcoxon se llevan a cabo los siguientes caIculos:

Se resta la media hipott~tica f.lo de cada observacion Xi para obtener

Si cualquier Xj es igual a la media, de modo que d; = 0, entonces se elimina a

d j del calculo y se reduce, por consiguiente,

la n.

Se ordenan las jerarqufas con las d j utilizables de menor a mayor sin considerar

d j , designado por

Id;l, al establecer lasjerarquias con estos elementos. Sidos 0 mas valores de Id j I son iguales, a cada uno de enos se Ie asigna la media de las posicionesjerarquicas que ocupan los valores iguales. Si, por ejemplo, los tres mas pequenos son igua­ les, se les coloca en las posiciones 1, 2 y 3 dentro de las jerarquias, pero a cada uno se Ie asigna unajerarquia de (l + 2 + 3)/3= 2.

A cada jerarquia se Ie asigna el signa de la d j que produjo esa jerarqufa.

Se encuentra T+, que es la suma de lasjerarquias con signa positivo, y T_, que es la suma de las jerarquias con signa negativo.

Prueba estadi La estadistica de Wilcoxon es T + 0 dependiendo de la naturaleza de la hip6tesis alternativa. Si la hipotesis nula es verdadera, es decir, si la media verdadera de la poblacion es igual a la media hipotetica, y si las suposicio­ nes se cumplen, la probabilidad de observar una diferencia positiva d j = Xi - f.lo de una magnitud dada es igual a la probabilidad de observar una diferencia negativa de la misma magnitud, Entonces, al repetir el muestreo, cuando la hip6tesis nula es

2.

el signo de d Es decir, solo se considera el valor absoluto de

r

3.

4.

~tica

13.4

PRUEBA DE JERARQUIA DE WILCOXON

671

verdadera y las suposiciones se cumplen, el valor esperado de T+ es igual al valor esperado de T No es de esperarse que los valores de T+ y calculados a partir de una muestra dada sean iguales. Sin embargo, cuando Ho es verdadera, no se espera gran diferencia en sus valores. En consecuencia, un valor suficientemente pequeno de T+ 0 T_ causa el rechazo de Ho' Cuando la hipotesis alternativa es bilateral (1-1 =1= flo)' un valor suficientemente pequeno de T + 0 T_ causa el rechazo de Ho: fl = flo' La estadfstica de prueba, enton­ ces, sera T+ 0 T_, cualquiera que sea el mas pequeno. Para simplificar la notaci6n, al mas pequeno de los dos valores se Ie Hamara T. Cuando Ho: fl;::': flo es verdadera, se espera que la muestra proporcione un valor grande de T+. Por 10 tanto, cuando la hipotesis alternativa unilateral establece que la media verdadera de la poblaci6n es menor que la media hipotetica (fl < flo)' un valor

suficientemente pequeno de T + causa el rechazo de H ' YT + es la estadfstica de prueba. Cuando Ho: fl ~ flo es verdadera, se espera que la muestra proporcione un

valor grande de T

un valor suficientemente pequeno de T_ causa el rechazo de H ' y T_ es la estadistica de prueba.

o

Por 10 tanto, para la

hip6tesis alternativa unilateral H A : fl > flo,

o

Valores criticos Los valores criticos de la estadistica de prueba de Wilcoxon se encuentran en la tabla K del apendice. Los niveles exactos de probabilidad (P) se dan con cuatro decimales para todos los totales posibles de las jerarqufas (T) que pro­ porcionan un nivel diferente de probabilidad en el cuarto decimal de 0.000 I hasta 0.5000. Los totales de lasjerarqufas (T) se tabulan para todas las muestras de tama­ no n = 5 hasta n 30. A continuacion se enuncian las reglas de decision para las tres hipotesis alternativas:

a) H A : 1-1 =1= 1-1 0 , Se rechaza H 0 en un nivel de significacion a, si el valor calculado de T es menor 0 igual al valor T tabulado para n y una aJ2 preseleccionada. Alternativamente se puede consultar la tabla K con n y el valor calculado de T para ver si el valor P tabulado asociado con el valor calculado de T es menor o igual al nivel de significacion establecido. Si es asi, es posible rechazar H

b) H A : 1-1 < 1-1 0 , Se rechaza Ho en un nivel de significacion a, si T+ es menor 0 igual al valor de T en la tabla K para n y una a preseleccionada.

c) H A : fl > 1-1 0 , Se rechaza Ho a un nivel de significacion a, si T_ es menor 0 igual al valor de Ten la tabla K para n y una a preseleccionada.

'

o

EJEMPLO 13.4.1

EI gasto cardiaco (litros/minuto) se midi6 por termodilucion en una muestra aleatoria simple de 15 pacientes con cirugfa cardiaca en posicion lateral izquierda. Los resul­ tados fueron los siguientes:

4.91

4.10

6.74

7.27

7.42

7.50

6.56

4.64

5.98

3.14

3.23

5.80

6.17

5.39

5.77

Se pretende saber si es po sible conduir, con base en estos datos, que la media de la poblacion es diferente de 5.05.

672

CAPITULO 13

ESTADISTICA NO PARAMETRICA

Solucion:

1. Datos. Vease el planteamiento del problema.

2. Supuestos. Se supone que los requerimientos para la aplicaci6n de la prueba de jerarquias signadas de Wilcoxonse cumplen.

3. Hipotesis.

Ro: f.L

5.05

R A : f.L*

5.05

Sea a. 0.05.

4. Estadlstica de prueba.

La estadistica de prueba sera T + 0 T_, la

que sea mas pequena, y se designara Tala estadfstica de prueba.

5. Distribucion de la estadistica de prueba. Los valores crfticos de la estadistica de prueba se encuentran en la tabla K del apendice.

6. RegIa de decision. Se rechazara Ro si el valor calculado de T es

15, y a/2 ==.0240, el

menor 0 igual que 25, el valor crftico para n valor mas cercano a .0250 en la tabla K.

7. Catculo de Ia estadlstica de prueba. prueba se muestra en la tabla 13.4.1.

8. Decision estadistica. ble rechazar Ro'

EI calculo de estadistica de

Puesto que 34 es mayor que 25, no es posi­

Tabla 13.4.1

Calculo de la estadistica de prueba para el

ejemplo 13.4.1

Gasto

Jerarqula asignada

cardiaco

d.

=x.-5.05,

Jerarqula de Idil

de Idil

4.91

-.14

1

-1

4.10

-.95

7

-7

6.74

+1.69

10

+10

7.27

+2.22

13

+13

7.42

+2.37

14

+14

7.50

+2.45

15

+15

6.56

+ 1.51

9

+9

4.64

-.41

3

-3

5.98

+.93

6

+6

3.14

-1.91

12

-12

3.23

-1.82

11

-11

5.80

+.75

5

+5

6.17

+ 1.12

8

+8

5.39

+.34

2

+2

5.77

+.72

4

+4

T +

== 86, T_

== 34,

T

34

EJERCICIOS

673

Caja de dialogo:

Stat> Nonparametrics > 1-Sample Wilcoxon

Comandos de sesi6n:

MTB > WTEST 5.05 C1i SUBC> Alternative O.

Teclear Cl en Variables. 8eleccionar Test median. Teclear 5.05 en Ia caja de texto. Clic OK.

Resultados:

Prueba de jerarqu(a signada de Wilcoxon

TEST

OF MEDIAN

5.050

VERSUS MEDIAN N.E.

5.050

 
 

N

FOR

WILCOXON

ESTIMATED

N

TEST

STATISTIC

P-VALUE

MEDIAN

C1

15

15

86.0

0.148

5.747

FIGURA 13.4.1

Procedimiento MINITAB Yresultados para el ejemplo 13.4.1.

9.

Conclusion.

8e concluye que la media de la poblacion puede ser

5.05.

A partir de Ia tabla K se aprecia que el valor pes p =

Prueba de jerarquia signada de Wilcoxon para parejas iguales La prueba de Wilcoxon puede emplearse en parejas de datos bajo circunstancias en las que no es adecuado utilizar la prueba de t para comparacion de parejas estudiada en el capftulo 7. En estos casos se obtienen cada uno de los n d i valores, las diferencias entre cada uno de los n pares de mediciones. 8i IlD es igual a la media de la poblacion de esas diferencias, es posible seguir el procedimiento descrito previamente para probar cualquiera de las siguientes hipotesis nulas: Ho: IlD = 0, Ho: IlD S; 0 YHo: Il D ;::: o.

Muchos paquetes de software estadfsticos aplican

la prueba de jerarqufa signada de Wilcoxon. 8i, por ejemplo, los datos del ejemplo 13.4.1 se almacenan en la columna 1, es posible utilizar el paquete MINITAB para ejecutar la prueba como se muestra en la figura 13.4.1.

10. Valor de p.

2(.0757) =.1514.

AntilisisporcompuJadora

EjERCICIOS

13.4.1 Dieciseis animales de laboratorio fueron alimentados con una dieta especial desde su naci­ miento hasta 12semanas despues del mismo. EI aumento de peso (en gramos) de cada uno de elios fue como sigue:

63

68

79

65

64

63

65

64

76

74

66

66

67

73

69

76

~Es posible conduir a partir de estos datos que la dieta proporcion6 un aumento de peso menor que 70 gramos? Sea a =.05, y calcule el valor de p.

674

CAPiTULO 13

ESTADISTICA NO P ARAMETRICA

13.4.2 Un psic610go seleccion6 aleatoriamente una muestra de 25 estudiantes discapacitados. Las calificaciones de destreza manual de cada uno de los estudiantes son las siguientes:

33

53

22

40

24

56

36

28

38

42

35

52

52

36

47

41

32

20

42

34

53

37

35

47

42

lProporcionan estos datos suficiente evidencia para indicar que la calificaci6n media para las pohlaciones no es 45? Sea a = .05, Y calcule el valor de p.

13.4.3 En un estudio realizado por Davis et ai. (A-2) se comparo durante el recreo y durante las horas de clase ellenguaje de las madres dirigido hacia ninos con retraso mental y ninos con edad cronol6gica equivalente 0 con igual capacidad de reconocimiento del lenguaje. Los resultados fueron consistentes con la hip6tesis de que las madres de ninos con retraso mental igualan su comportamiento verbal a la capacidad de reconocimiento dellenguaje del nino. Entre los datos recolectados estin las siguientes mediciones respecto al numero de palabras por minuto durante el recreo para las madres de ninos con retraso (A) y para las madres de ninos de la misma edad pero sin retraso mentaI.(B):

A:

21.90

15.80

16.50

15.00

14.25

17.10

13.50

14.60

18.75

19.80

B:

13.95

13.35

9.40

11.85

12.45

9.95

9.10

8.00

14.65

12.20

FUENTE: Con autorizaci6n de Hilton Davis, Ph. D.

Con base en estos datos, les posible eoncluir que entre las madres de ninos con retraso mental, el numero promedio de palabras por minuto durante el reereo es mayor que entre las madres con hijos que no tienen retraso mental? Sea a = .01.

13.5 PRUEBA DE LA MEDIANA

La prueba de la mediana es un procedimiento no parametrico que puede emplearse para probar la hip6tesis nula de que dos muestras independientes fueron extrafdas de poblaciones con medianas iguales. Esta prueba, que se atribuye principalmente a Mood (2) y a Westenberg (3), se estudia tambien en Brown y Mood (4). Se ilustra el procedimiento por medio de un ejemplo.

FJEMPLO 13.5.1

~Existe diferencia entre el nivel de salud mental de los alumnos de secundaria de un area rural y un area urbana?

Soludon:

1.

Datos. Se aplic6 una prueba para medir el nivel de salud mental en dos grupos. La primera muestra aleatoria de 12 estudiantes varones se ex~o de una poblaci6n de estudiantes de una secundaria del area rural, y la segunda muestra aleatoria independiente de 16 estudiantes, tambien varones, se extrajo de una poblaci6n de estudiantes de una secundaria del areaurbana. Los resultados se muestran en la tabla 13.5.1. Para determinar si es posible conduir que hay una diferencia, se lleva a cabo una prueba de hip6tesis que utiliza la prueba de la mediana. Suponga que el nivel de significaci6n es de .05.

2.

Supuestos. Las suposiciones que fundamentan la prueba son: a) las muestras son elegidas independiente y aleatoriamente de sus respec­

13.5

PRUEBA DE LA MEDlANA

675

TABLA

salud mental de jovenes de secundaria

13.5.1

Calificaciones del nivel de

Escuela

Urbana

Rural

Urbana

Rural

35

29

25

50

26

50

27

37

27

43

45

34

21

22

46

31

27

42

33

38

47

26

23

42

46

25

32

41

 

tivas poblaciones; b) las poblaciones son de la misma forma y difieren solo en cuanto a su ubicacion, y c) la variable de interes es continua. El nivel de medicion debe ser, al menos, ordinal. No es necesario que las dos muestras sean del mismo tarnafio.

3.

Hipotesis.

 

Ho:Mu =M R HA:Mu-:f. MR

 
 

M

u es la calificacion mediana de la poblacion de la que se extrae la

muestra de estudiantes del area urbana, y M R es la calificacion me­

diana de la poblacion de estudiantes del area rural de la cual se extrae la muestra. Sea a =.05.

4.

Estadistica de prueba.

Como se muestra en el siguiente analisis,

la

estadfstica de prueba es X2, y se calcula, por ejemplo, mediante la

ecuacion 12.4.1 para una tabla de contingencia de 2 x 2.

5.

Distribucion de la estadistica de pr;ueba.

Cuando Ho es verdade­

ra

y las suposiciones se cumplen, X2 sigue una distribucion semejan­

te

a la de ji-cuadrada con 1 grado de libertad.

 

6.

RegIa de decision. Se rechaza Ho si el cilculo del valor de X2 es 2::

3.841 (dado que a = .05).

 

7.

Ci.ilculo de la estadistica de prueba. El primer paso para caIcu­ lar la estadfstica de prueba es calcular la mediana comiin de las dos muestras combinadas. Esto se hace arreglando las observacio­ nes en orden ascendente y, dado que el niimero total de observa­ ciones es par, obteniendo la media de los dos valores centrales. Para este ejemplo, la mediana es (33 + 34)/2 = 33.5.

A continuacion se determina para cada muestra el niimero de ob­ servaciones que caen por encima y por debajo de la mediana comtin.

676

CAPITULO 13

ESTADISTICA NO PARAMETRIC A

TABLA

de secundal'ia

13.5.2

Caliticaciones del mvel de salud mental de j6venes

Urbana

Rural

Total

Cantidad de calificaciones arriba de la mediana

6

8

14

Cantidad de calificaciones debajo de la mediana

10

4

14

Total

16

12

28

Las frecuencias resultantes se arreglan en una tabla de 2 X 2. La tabla 13.5.2 muestra los resultados de esta operadon. Si, en efecto, las dos muestras provienen de pobladones con la mis­ ma mediana, se puede esperar que aproximadamente la mitad de califi­ caciones en cada muestra este arriba de la mediana combinada y la otra mitad por debajo. Si se cumplen las condiciones relativas al tamafio de la muestra y las frecuencias esperadas para la tabla de contingencia de 2 x 2, como se estudia en el capitulo 12. puede utilizarse la prueba de ji-cuadra­ da con 1 grado de libertad para probar la hipotesis nula de igualdad de medianas en las poblaciones. Mediante la formula 12.4.1. se tiene que:

X2 =28[(6)(4)-8(10)]2 =2.33

(16)(12)(14)(14)

8. Decision estadistica. Puesto que 2.33 < 3.841. el valor crftico de ji-cuadrada con a .05 y 1 grado de libertad, no es posible rechazar la hip6tesis nula con base en estos datos.

9. Conclusion.

Se conduye que las dos muestras probablemente se

extrajeron de poblaciones con medianas iguales.

10. Valor de p. Puesto que 2.33 < 2.706, se tiene que p

> .10.

Manejo de valores iguales a la mediaaa A veces, uno 0 mas de los valores observados seran exactamente iguales a la mediana calculada y, por 10 tanto, no

importante observar que si n} + n 2 es

impar, al menos un valor siempre sera exactamente igual a la mediana. Esto lleva al problema de que hacer con las observaciones de este tipo. Una soluci6n es elimi­ narlas del analisis si n} + n 2 es grande y se tienen s610 unos cuantos valores que caen

en la mediana combinada, 0 bien, dividir las calificaciones en dos muestras: aque­ llas que son mayores que la mediana y las que no 10 son, en cuyo caso, las observa­ ciones que son iguales a la mediana se contaran en la segunda categorfa.

Extension de la prueba de la mediaaa La prueba de la mediana se extiende 16gicamente para el caso donde se quiere probar la hip6tesis nula que dice que k ~ 3 muestras son de poblaciones donde las medianas son iguales. Para esta prueba una tabla de contingencia de 2 X k puede elaborarse utilizando las frecuen­ cias que caen por arriba y por debajo de la mediana calculada a partir de las mues­ tras combinadas. Si se cumplen las condiciones como el tamafio de la muestra y las frecuencias esperadas, X2 puede calcularse y compararse con el valor crftico de ji­ cuadrada con k 1 grados de libertad.

caeran por arriba ni por debaJo de ella. Es

EJERCICIOS

677

Caja de dialogo:

Comandos de la sesion:

Stat >- Nonparametrics >- Mood's Median Test

MTB

>

Mood

Cl

C2.

Teclear Cl en Response y C2 en Factor. Clic OK.

 

Resultados:

Prueba de la mediana del estado de animo

 

Mood median

test

of

Cl

Chisquare

2.33

df

= 1

p

=

0.127

 

Individual

95.0%

CIs

C2

N<=

N>

Median

Q3-Ql

--------+----

----+-----

-+-­

1

10

6

27.0

15.0

(-+-----------------)

2

4

8

39.5

14.8

(-- ----

-+-

------)

 

--+---- ----+------ --+-------­

30.0

36.0

42.0

Overall median

= 33.5

A 95.0%

C.I.

for median

(I}

-

median(2}:

(-17.1,3.1)

 

FIGURA 13.5.1

Procedimiento MINITAB Yresultados para el ejemplo 13.5.1.

Malisis por computadora El calculo de la prueba de la mediana puede Ile­ varse a cabo con el paquete MINITAB. Para ilustrar el uso de este paquete con los datos del ejemplo 13.5.1, primero se almacenan las mediciones en la columna 1; en la columna 2 se almacenan los c6digos que identifican las observaciones que corresponden a los individuos urbanos (1) 0 rurales (2). La figura 13.5.1 muestra los resultados generados por el procedimiento de MINITAB.

FJERCIOOS

13.5.1 Se revisaron 15 expedientes de pacientes de dos hospitales y se asign6 una calificaci6n dise­ fiada para estimar el nivel de atenci6n recibida. Las calificaciones son las siguientes;

Hospital A: 99, 85, 73, 98, 83,88,99,80,74,91, 80,94,94,98,80

Hospital B; 78, 74, 69, 79, 57, 78, 79,68,59,91,89,55,60,55,79

ms posible concluir, en un nivel de significaci6n de .05, que las medianas de las dos pobla­ dones son diferentes? Determine el valor de p.

678

CAPITULO 13

ESTADISTICA NO PARAMETRICA

13.5.2 Se obtuvieron los siguientes valores de albfunina en el suero de 17 personas normales y 13 hospitalizadas.

AlbUmina en el suero (gllOO ml)

Albumina en el suero (gllOO ml)

Individuos

Individuos

Individuos

lndividuos

nonnales

hospitalizados

nonnales

hospitalizados

2.4

3.0

1.5

3.1

3.4

4.0

3.8

1.5

3.5

3.2

2.0

1.3

4.5

3.5

3.5

3.1

3.5

3.4

1.5

5.0

3.6

4.0

3.8

1.7

1.8

2.9

4.2

3.9

2.0

2.0

~Se podria conciuir, en el nivel de significacion de .05, que las medianas de las dos poblacio­ nes de las que se extrajeron las muestras son distintas? Determine el valor de p.

13.6 PRUEBA DE MANN-\VHlTNEY

La prueba de la mediana, que se analizo en la seccion anterior, no utiliza toda la informacion presente en las dos muestras cuando la variable de interes se mide por 10 menos en una escala ordinal. Reducir el contenido de informacion de una observa­ cion para concluir si cae 0 no por arriba 0 por debajo de una mediana comun, es desperdiciar informacion. Si, para probar la hipotesis deseada, se cuenta con un procedimiento que utilice una mayor cantidad de la informacion inherente en los datos, dicho procedimiento debe utilizarse siempre que sea posible. EI procedi­ miento no parametrico que puede utilizarse con frecuencia en lugar de la prueba de la mediana es la prueba de Mann-Whitney (5), algunas veces Hamada Mann-Whitney­ Wilcoxon. Esta prueba se basa en las jerarqufas de las observaciones, por 10 cual utiliza mas informacion que la prueba de la mediana.

Las suposiciones que fundamentan la prueba de Mann-Whitney son

las siguientes:

Supuestos

1.

Las dos muestras, de tamafios n y m, respectivamente, que se utilizan para el anaIisis han sido extrafdas de manera independiente y en forma aleatoria de sus poblaciones respectivas.

2.

La escala de medicion es por 10 menos ordinaL

3.

La variable de interes es continua.

4.

Si las poblaciones son diferentes, varian solamente en 10 que respecta a sus medianas.

Cuando se satisfacen estas suposiciones, puede probarse la hipotesis

nula de que las dos poblaciones denen medianas iguales contra cualquiera de tres alternativas posibles: 1) las poblaciones no tienen medianas iguales {prueba bilate­

Hip6tesis

13.6

PRUEBA DE MA-NN-WHITNEY

679

ral), 2) la mediana de la poblacion 1 es mayor que la mediana de la poblacion 2 (prueba unilateral), 0 bien 3) la mediana de la poblacion 1 es menor que la media­ na de la poblacion 2 (prueba unilateral). Si las dos poblaciones son simetricas, de modo que dentro de cada poblaci6n la media y la mediana son las mismas, las condusiones a las que se llega respecto a las medianas de las dos poblaciones se aplicara.n tambien a las medias de ambas poblaciones. El siguiente ejemplo ilustra e1 uso de la prueba de Mann-Whitney.

FJEMPLO 13.6.1

En un experimento disefiado para estimar los efectos de la inhalaci6n prolongada de oxido de cadmio, 15 animales de laboratorio sirvieron de sujetos para el experi­ mento, mientras que 10 animales similares sirvieron de control. La variable de inte­ res fue la concentracion de hemoglobina despues del experimento. Los resultados se muestran en la tabla 13.6.1. Se desea saber si es posible conduir que la inhala­ ci6n prolongada de 6xido de cadmio disminuye el nivel de hemoglobina.

Soludon:

1. Datos.

Vease la tabla 13.6.1.

2. Supuestos.

Se considera que las suposiciones para la prueba de

Mann- Whitney se cumplen.

TABlA 13.6.1

(gramos) en 25 animales de laboratorio

Determinacion de hemoglobina

Animales expuestos

Animales no expuestos

(X)

(Y)

14.4

17.4

14.2

16.2

13.8

17.1

16.5

17.5

14.1

15.0

16.6

16.0

15.9

16.9

15.6

15.0

14.1

16.3

15.3

16.8

15.7

16.7

13.7

15.3

14.0

680

CAPITULO 13

ESTADISTICA NO PARAMETRICA

3. Hipotesis.

Las hip6tesis nula y alternativa son las siguientes:

Ho:Mx~ My

HA:Mx<My

donde Mx es la mediana dt: la poblaei6n de animales expuestos al 6xido de eadmio y My es la mediana de la poblaci6n de animales no expuestos a la sustancia. Sea a .05.

4. Estadistica de prueba. Para ealcular la estadistica de prueba se proeede a eombinar las dos muestras, y las observaeiones se orde­ nan de menor a mayor teniendo presente a emil muestra perteneee eada observaci6n. A las observaciones de igual valor numerico se les asigna una jerarquia igual a la media de las posiciones en las que se encuentran "empatadas". Los resultados de este paso se muestran en la tabla 13.6.2.

TABlA

13.6.2

ejemplo 13.6.1

Datos originales y jerarquias,

X

Jerarquia

Y

Jerarquia

13.7

1

13.8

2

14.0

3

14.1

4.5

14.1

4.5

14.2

6

14.4

7

 

15.0

8.5

15.0

8.5

15.3

10.5

15.3

10.5

15.6

12

15.7

13

15.9

14

 

16.0

15

16.2

16

16.3

17

16.5

18

16.6

19

16.7

20

 

16.8

21

16.9

22

17.1

23

17.4

24

17.5

25

Total

145

13.6

PRUEBA DE MANN-WHITNEY

681

La estadistica de prueba es

T=S- n(n+l)

2

(13.6.1)

donde n es el numero de observaciones de la muestra X, y S es la suma de las jerarquias asignadas a las observaciones de la muestra de la poblacion de valores X. La eleccion de los valores de la mues­ tra que se marcan con X es aleatoria.

5. Distribucion de Ia estadistica de prueba.

Los valores crfticos de

la

distribucion de la estadistica de prueba se encuentran en la tabla

L

para varios niveles de cx.

6. RegIa de decision.

Si la mediana de la poblacion X es, en efecto,

mas pequena que la mediana de la poblacion Y, como se especifica en

la hipotesis alternativa, es de esperar (para muestras de igual tama­

no) que la suma de las jerarquias asignadas a las observaciones de la poblacion X sea menor que la suma de las jerarqufas asignadas a las observaciones de la poblacion Y. La estadfstica de prueba esta basada en este razonamiento en tal forma que un valor de T suficientemente pequeno causara que se rechace la hipotesis Ho: Mx;?: My. En general, para pruebas unilaterales del tipo que se muestra aquf, la regIa de decision es:

Rechazar Ho: Mx 2 Mysi el valor calculado de T es menor que w'" donde w,yes el valor critico de T, el cual se obtiene mediante la tabla L del apindice con n, el numero de observaciones de X; m, el numero de observaciones de Y, y ex, el nivel de significa­ ciOn elegido.

Si se utiliza el procedimiento Mann-vVhitney para probar

contra

Ho:Mx:S; My

HA:Mx >My

los valores suficientemente grandes de T causaran el rechazo, de tal forma que laregla de decision es:

Rechazar Ho: Mx s; Mysi el valor calculado de T es mayor que wl-c! donde w1-a nm w".

Para la situacion de la prueba bilateral con

My

HA:Mx* My

Ho:Mx

los valores calculados de T que sean suficientemente grandes 0 su­ ficientemente pequenos causaran el rechazo de Ho. La regIa de deci­ sion para este caso es:

682

CAPiTULO 13

ESTADiSTICANO PARAMETRICA

Rechazar Ho: Mx Mysi el·c(ilculo de T es menor que w aJ2 0 mayor que wl-(aI2l' donde waJ2 es el valor crituo del valor T para n, m y 0/2 dado en la tabla L del apendice, y W 1-(aJ2) = nm ­ w aJ2 '

Para este ejempIo, la regIa de decisi6n es:

Rechazar H 0 si el valor cdlculado de T es menor que 45, el valor crituo de la estadis­

tica de prueba para n = 15, m

10 y IX

,05 que se

encuentra en la tabla L.

La regi6n de rechazo para cada conjunto de hip6tesis se muestra en Ia figura 13.6.1.

7. CaIculo de la estadistica de prueba. Para este ejemplo se tiene, tal como se muestra en la tabla 13.6.2, S 145, de manera que

T=145

15(15+1) =25

2

8. Decision estadistica. AI consul tar Ia tabla Leon n = 15, m = lOy 0: = .05 se encuentra que el valor critico de w" es 45, Dado que 25 < 45, se rechaza Ho'

1-<>
1-<>

Ho:Mx~My

H A : Mx < My

1-<>
1-<>

W1- a

HO: Mx:5 My HA:Mx>My

1 <>
1
<>

Ho:Mx=My

H A : Mx 7' My

FlGUBA

13.6.1

Regiones de rechazo de la prueba Mann-Whitney para tres conjuntos de

hip6tesis.

13.6

PRUEBA DE MANN-WHITNEY

683

9. Conclusion. Se concluye que Mxes menor que My. Esto lleva ~con­ cluir que la inhalaci6n prolongada de 6xido de caduiio redu.£e la concentraci6n de hemoglobina.

10. Valor dep.

Puesto que 22 < 25 < 30, entonces, .005 > P >.001 .•

Aprox;maciOn a una muestra grande

Cuando nom es mayor que 20 no es

posible utilizar la tabla L del apendice para obtener los valores criticos de la prueba de Mann-Whitney. Cuando este es el caso, es posible calcular

T-mn/2

z =: --p======

+m+l)/l2

(13.6.2)

y comparar el resultado con los valores criticos de la distribuci6n normal estandar.

An61isis por computadora Muchos paquetes estadfsticos de software ejecu­ tan la prueba de Mann-Whitney. Con los datos de las dos muestras almacenados en las columnas 1 y 2, por ejemplo, MINITAB realizara la prueba bilateral 0 unilate­ ral. El procedimiento de MINITAB y los resultados para el ejemplo 13.6.1 se mues­ tran en la figura 13.6.2.

Caja de dialogo: Comandos de la sesion: Stat >- Nonparametrics >- Mann >- Whitney MTB
Caja de dialogo:
Comandos de la sesion:
Stat >- Nonparametrics >- Mann >- Whitney
MTB
>
Mann-Whitney
95.0
C1
C2;
SUBC
>
Alternative
-1.
Tec1ear Cl en First Sample y C2 en Second Sample.
En Alternative seleccionar menor que. Clic OK.
Resultados:
Prueba e intervalo de confianza de Mann-Whitney
C1
N
= 15
Median
15.300
C2
N
=
10
Media~
16.550
Point estimate
for
ETA1
-
ETA2
is
-1. 300
95.1
Percent c.r.
for
ETA1
-
ETA2
is
(-2.300,
-0.600)
W = 145.0
Test of ETA1 ETA2 vs. ETA1 < ETA2 is significant at 0.0030
The
test
is
significant at
0.0030
(adjusted
for
ties)

684

CAPITULO 13

ESTADISTICANO PARAMETRICA

FJERCICIOS

13.6.1 El prop6sito de un estudio realizado por Demotes-Mainard et ai. (A-3) era comparar la farma­ cocinetica de la cefpiramida (una cefalosporina) total y libre en voluntarios sanos yen pacien­ tes con cirrosis alcoh6lica. Entre los datos recolectados estan los siguientes valores de depuraci6n plasmatica (mVmin) despues de una sola inyecci6n intravenosa de 1 gramo de cefpiramida:

Voluntarios: 21.7,29.3,25.3,22.8,21.3,31.2,29.2,28.7,17.2,25.7,32.3 Pacientes con cirrosis alcoh61ica: 18.1, 12.3, 8.8, 10.3, 8.5, 29.3, 8.1, 6.9, 7.9, 14.6, 11.1

FUENTE: Utilizada con autorizaci6n de Fabienne Demotes-Mainard, Ph. D.

ms po sible conduir, con base en estos datos, que los pacientes con cirrosis alcoh6lica y los pacientes sin la enfermedad difieren con respecto a la variable de interes? Sea ex = .01.

13.6.2 Lebranchu et at. (A-4) dirigieron un estudio donde nueve individuos eran pacientes con inmunodeficiencia variable comtin (WC) y 12 individuos eran de control. Entre los datos recolectados estan las siguientes cifras de celulas CD4+T por mm 3 de sangre periferica.

Pacientes con WC: 623, 437, 370, 300, 330, 527, 290, 730, 1000 Controles: 710, 1260,717,590,930,995,630,977,530,710,1275,825

FUENTE: Utilizada con autorizaci6n del Dr. Yvon Lebranchu.

Con base en estos datos, ~esposible conduir que los pacientes WC tienen un nivel reducido

de ceIulas CD4+T? Sea ex

13.6.3 El prop6sito de un estudio realizado por Liu et al. (A-5) era caracterizar los cambios media­ dores, celulares y de permeabilidad que ocurren inmediatamente y 19 horas despues de una prueba de estimulaci6n broncosc6pica segmentaria de las vias respiratorias perifericas con antfgenos de ambrosia en individuos alergicos y moderadamente asmaticos.Ademas de los individuos con a~ma, el estudio induia individuos normales que no presentaban sfntomas de asma. Entre los datos recolectados esr;in las siguientes mediciones respecto al porcentaje de Ifquido recuperado de los sitios sometidos a la prueba de antfgenos despues de un lavado broncoalveolar.

.01.

Individuos normales: 70, 55, 63, 68,73,77,67 Individuos asmaticos: 64, 25, 70, 35, 43, 49, 62, 56, 43, 66

Fuente: Con autorizaci6n de Mark C. Liu, M. D.

Con base en estos datos, ~es posible conduir que bajo las condiciones descritas, se puede esperar recuperar menos fluido de los individuos asmaticos? Sea ex = .05.

13.7 PRUEBA DE BONDAD DE AJUSTE

DE KOLMOGOROV-SMIRNOV

Cuando se desea saber que tan bien se ajusta la distribuci6n de los datos de una muestra a una distribuci6n te6rica, la prueba conocida como prueba de bondad de ajuste de Kolmogorov-Smirnov es una alternativa para la prueba de ji-cuadra­ da de bondad de ajuste, la cual se estudia en el capitulo 12. La prueba debe su nombre ados matematicos rusos: A Kolmogorov y N. V. Smirnov, quienes presen­ taron dos pruebas muy parecidas en la decada de 1930. EI trabajo de Kolmogorov (6) se relaciona con el caso de una sola muestra, como se menciona en este capitulo. EI trabajo de Smirnov (7) trata el caso en el que

13.7

PRUEBA DE KOLMOGOROV.SMIRNOV

635

intervienen dos muestras y el interes central radica en probar la hip6tesis de igual­ dad entre las distribuciones de las dos poblaciones de origen. Ala prueba para Ia primera situaci6n se Ie conoce como prueba Kolmogorov-Smirnov para una sola muestra. La prueba para el caso de dos muestras es la prueba Kolmogorov-Smirnov para dos muestras, y no se estudia en este texto.

ajuste de Kolmogorov­

Smimov, se efect11a una comparaci6n entre alguna funci6n te6rica, FT(x), y una fun­ cion de distribucion acumulada muestral Fs(x). La muestra se extrae de manera aleatoria de una poblaci6n con una funcion de distribuci6n acumulada desconoci­ da F(x). Recuerdese (de la seccion 4.2) que una funcion de distribuci6n acumulada proporciona la probabilidad de que X sea menor 0 igual que un valor en particular, x. Es decir, por medio de la funci6n muestral de distribucion acumulada Fs(x), es posible determinar P(X S; x). Si existe un ajuste estrecho entre las distribuciones acumulada te6rica y muestral, entonces se apoya la hipotesis de que la muestra fue extrafda de una poblaci6n cuya funcion de distribuci6n acumulada especffica es FT(x). Sin embargo, si hay una discrepancia entre Ia funcion de distribucion acumu­ lada observada y la te6rica, y si dicha discrepancia es 10 suficientemente grande como para no atribuirla al azar cuando Ho es verdadera, la hip6tesis se rechaza. La diferencia entre la funci6n de distribuci6n acumulada teorica, Fix), y la muestral, Fs(x), se mide con la estadfstica D, la cual es la maxima distancia vertical entre FsCx) y FT(x). Cuando una prueba bilateral es conveniente, esto es, cuando las hipotesis son:

Estadisti~'flde prueba AI utilizar la prueba de bondad de

Ho: F(x) = FT(x) para toda x desde

H A : F(x)

~ FT(x) para al menos una x

OQ hasta + 00

la estadfstica de prueba es

D= sup I F,(x)

x

F,(x) In

(13.7.1)

la cual se lee "D es el mayor de los valores, sobre todas las x, del valor absoluto de la diferencia Fs(x) menos FT(X)". La hipotesis nula se rechaza en un nivel de significacion a si e1 valor calculado de D excede e1 valor que se muestra en la tabla M para I - a (bilateral) y el tamafio n de la muestra.

Supuestos Las suposiciones que fundamentan la prueba de Kolmogorov-Smimov son las siguientes:

1. La muestra es aleatoria.

2. La distribuci6n hipotetica Fix) es continua.

Cuando los valores de D se basan en una distribuci6n te6rica discreta, la prue­ ba es moderada. Cuando la prueba se utiliza con datos discretos, el investigador debe tener en mente que la probabilidad real de cometer un error de tipo I es, cuando mucho, igual que a, que es el nive1 de significaci6n establecido. La prueba

686

CAPITULO 13

ESTADISTICA NO PARAMETRICA

tambien es moderada si uno 0 mas parametros deben ser estimados a partir de los datos de la muestra.

EJEMPLO 13.7.1

Se efectuaron mediciones del nivel de glucosa en la sangre de 36 hombres adultos en ayuno, no obesos y aparentemente sanos. Estas mediciones se muestran en Ia tabla 13.7.1. Se pretende saber si es posible conduir que tales datos no pertenecen a una poblaci6n que sigue una distribuci6n normal, con una media de 80 y una desviaci6n estandar de 6.

Soludon:

1.

Datos. Vease la tabla 13.7. 1.

2.

Supuestos.

La muestra disponible es una muestra aleatoria simple

que se extrajo de una poblacion que sigue una distribuci6n continua.

3.

Hipotesis.

 

Ho: F(x)

FT(x) para toda x desde - 00 hasta + 00

 

H A : F(x) ':f:.F/x) para al menos una x

Sea a .05.

4.

Estadistica de prueba. Vease la ecuaci6n 13.7.1.

5.

Distribudon de Ia estadistica de prueba. Los valores crfticos de la estadistica de prueba para los valores elegidos de a se encuentran en la tabla M.

6.

RegIa de decision. Se rechaza H 0 si el valor calculado de D excede

.221, que es el valor crftico de D para n = 36 Ya

.05

7.

CaIcuIo de Ia estadistica de prueba. EI primer paso es calcular los valores de Fs(x), como se muestra en la tabla 13.7.2. Cada uno de los valores de F/x) se obtienen al dividir la fre­ cuencia acumulada correspondiente entre el tamaflO de la muestra.

Por ejemplo, el primer valor de Fs(x) = 2/36

Los valores de Fix) se obtienen al convertir cada valor obser­ vado de x en un valor de la variable normal estandar, z. En la tabla

.0556.

TABlA 13.7.1 Concentraciones (mg/l00 mI) de glucosa en la sangre en 36 varones no obesos, aparentemente sanos, en ayunas

75

92

80

80

84

72

84

77

81

77

75

81

80

92

72

77

78

76

77

86

77

92

80

78

68

78

92

68

80

81

87

76

80

87

77

86

13.7

PRUEBA DE KOLMOGOROV-SMIRNOV

637

TABlA 13.7.2

Valores de Fs(x) para el

ejemplo 13.7.1

 
 

Frecuencia

x

Frecuencia

acumulada

F.(x)

68

2

2

.0556

72

2

4

.1111

75

2

6

.1667

76

2

8

.2222

77

6

14

.3889

78

3

17

.4722

80

6

23

.6389

81

3

26

.7222

84

2

28

.7778

86

2

30

.8333

87

2

32

.8889

92

4

36

1.0000

36

D del apendice se encuentra el area entre - OQ Yz. Con estas areas

es po sible calcular los valores de FT(x). El procedimiento se resume en la tabla 13.7.3, yes similar al que se utiliza para obtener las frecuencias relativas esperadas en la prueba de bondad de ajuste

de ji-cuadrada.

La estadfstica de prueba D puede calcularse algebraicamente, o bien, determinarse graficamente al medir la distancia vertical mas

TABlA 13.7.3

de F~x) para el ejemplo 13.7.1

Pasos para el cileulo

x

z

= (x- 80)/6

68

-2.00

.0228

72

-1.33

.0918

75

-.83

.2033

76

-.67

.2514

77

-.50

.3085

78

-.33

.3707

80

.00

.5000

81

.17

.5675

84

.67

.7486

86

1.00

.8413

87

l.l7

.8790

92

2.00

.9772

688

CAPITULO 13

ESTADISTICA NO PARAMETRICA

ro

"0

S ro

E

::l

0

'" '"

.~

~

·0 '"

c

<I>

::J

0

~

LL

1.00

.90

.80

.70

.60

.50

.40

.30

.20

.10

68

70

72

D~ .16
D~ .16

74

76

78

80

82

84

86

88

90

92

94

x

FIGURA 13.7.1

Fs(x) y FT(x) para el ejemplo 13.7.1.

larga entre las curvas }~(x) y Fix) en una grafica. Las graficas de ambas distribuciones se muestran en la tabla 13.7.1. Un examen de las graficas de Fs(x) YFT(x) revelan que D '" .16 (.72 .56). A continuaci6n se calcula el valor de D de manera algebraica. L~s valores posibles de IFs(x) Fix) I se muestran en la tabla 13.7.4. Esta muestra que el valor exacto de D es .1547.

AI consul tar la tabla M se observa que el va­

lor calculadode D = .1547 no es significativo en ning(in nivel razo­

nable. Por 10 tanto, no procede el rechazo de H

9. La muestra tal vez proviene de la distribuci6n especi­

8. Decision estadistica.

'

o

Conclusion.

ficada.

TABlA 13.7.4 Calculo de IFix) - F :r<x)l para el ejeOlplo 13.7.1

x

de I Fix) - F :r<x)l para el ejeOlplo 13.7.1 x 6 8 .0556 .0228 .

68

.0556

.0228

.0328

72

.1111

.0918

.0193

75

.1667

.2033

.0366

76

.2222

.2514

.0292

77

.3889

.3085

.0804

78

.4722

.3707

.1015

80