You are on page 1of 84

ESTADISTICA NO PARAMETRICA

APLICACIN
Las pruebas de hiptesis realizadas en los captulos
anteriores respecto a los parmetros poblacionales
de medias, proporciones o varianzas son hechas
bajo supuestos a las poblaciones, tales como
supuestos de normalidad.
Lamentablemente no todas las poblaciones
cumplen con este supuesto, pero existen tcnicas
estadsticas tiles que no necesitan de supuestos
de las poblaciones conocidas como Pruebas No
Paramtricas o pruebas de distribucin libre.
Pruebas no paramtricas ms
utilizadas son
1. Prueba de signos
2. Prueba Chi cuadrado
2.1 Prueba de Bondad de ajuste
2.2 Prueba de Independencia y homogeneidad
3. Prueba de Kruskal Wallis
4. Correlacin de Rangos de Spearman
5. Prueba de rachas
Ventajas de los Pruebas no
paramtrica :
1. No requiere que hagamos la suposicin de
que las poblaciones distribuidas
normalmente.
2. Se aplican a datos categricos
3. Implican clculos ms sencillos, por lo tanto
son ms fciles de entender y aplicar
Desventajas de las pruebas no
paramticas :
1. Desperdician informacin, ya que los
datos originales se reducen a una forma
cualitativa
2. A menudo no son tan eficientes como
las prueba paramtricas por lo tanto se
necesita evidencias ms fuertes
PRUEBA DE SIGNOS
PRUEBA DE SIGNOS
Se le llama prueba del signo porque la
informacin contenida en la muestra
seleccionada se puede transformar en un
conjunto de signos ms y menos, y cuando se
hace la prueba no se hace uso de la magnitud
de los valores de la muestra, sino solamente
se consideran los signos.
PRUEBA DE SIGNOS
Se pueden probar estas aseveraciones:
1. Aseveraciones que incluyen datos apareados de
datos muestrales.
2. Aseveraciones que incluyen datos nominales.
3. Aseveraciones acerca de la mediana de una sola
poblacin.
REQUISITOS
1. Los datos muestrales se seleccionan
aleatoriamente
2. No existe el requisito de que los datos
muestrales provengan de una poblacin con una
distribucin particular, como la distribucin
normal
ESTADSTICO DE PRUEBA
1. Para n25
x : el nmero de veces que ocurre el signo
menos frecuente
n: el nmero total, de signos positivos y
negativos combinados
Los valores crticos x se encuentran en la Tabla
A-7
ESTADSTICO DE PRUEBA
1. Para n>25


x : el nmero de veces que ocurre el signo menos
frecuente
n: el nmero total, de signos positivos y negativos
combinados
Los valores crticos x se encuentran en la Tabla A-2
2
2
) 5 . 0 (
n
n
x
z
|
.
|

\
|
+
=
ASEVERACIN QUE INCLUYE
DATOS APAREADOS
Procedimiento:
1. Restamos cada valor de la segunda variable del valor
correspondiente de la primera variable
2. Registramos slo el signo de la diferencia que se
encontr en el paso 1. Excluimos los empates
Si dos conjuntos de datos tienen medianas iguales, el
nmero de signos positivos debe ser aproximadamente
igual al nmero de signos negativos
Ejemplo 1:
Medicin de inteligencia en nios
Las mediciones mentales de nios pequeos se hace
dndoles cubos pidindoles que construyan una torre tan alta
como sea posible. Un experimento de construccin de cubos
se repiti un mes despus, con el tiempo (en segundos)
listados. Utilice un nivel de significancia de 0.05 y pruebe la
aseveracin de que no hay diferencia entre los tiempos de la
primera y segunda prueba.
Nio A B C D E F G H I J K L M N O
Primera prueba 30 19 19 23 29 178 42 20 12 39 14 81 17 31 52
Segunda Prueba 30 6 14 8 14 52 14 22 17 8 11 30 14 17 15
ASEVERACIN QUE INCLUYE
DATOS NOMINALES
Datos nominales: incluyen nombres, etiquetas o categoras
Se aplican los signos ms o menos en forma arbitraria a las
categoras.
Ejemplo: Discriminacin por gnero
La cadena de restaurantes Hatters recibi acusaciones de
discriminacin por gnero por que slo contrat a 30
hombres junto a 70 mujeres solicitantes. Un representante de
la compaa acept que los solicitantes calificados son
aproximadamente la mitad hombres y la mitad mujeres, pero
adems asevera que Hatters no discrimina y el hecho de
que 30 de los ltimos 100 empleados nuevos sean hombres
es slo una casualidad. Utilice la prueba de signos con un
nivel de significancia de 0.05 y prueba la hiptesis nula de
que esta compaa contrata hombres y mujeres por igual.
ASEVERACIN ACERCA DE LA MEDIANA
DE UNA SOLA POBLACIN
Los signos positivos y negativos se basan en el valor que se
asevera para la mediana.
Ejemplo: Temperaturas corporales
El conjunto de datos 4 del Apndice B incluye temperaturas
corporales medidas en adultos. Utilice las 106 temperaturas
listadas para las 12:00 AM del da 2 con la prueba de signos,
para probar la aseveracin de que la mediana es menor que
98.6F. El conjunto de datos tiene 106 sujetos: 68 sujetos
con temperaturas por debajo de 98.6F, 23 sujetos con
temperaturas por encima de 98.6F y 15 sujetos con
temperaturas iguales a 98.6F
PRUEBA DE RANGOS
CON SIGNOS DE
WILCOXON
PARA DATOS APAREADOS
PRUEBA DE RANGOS CON
SIGNOS DE WILCOXON
Utiliza rangos ordenados de datos muestrales
consistentes en datos apareados
Se usa para probar las diferencias en las
distribuciones poblacionales y para probar la
aseveracin de que una muestra proviene de una
poblacin con una mediana especfica.

Planteamiento de hiptesis
H0: Los datos apareados .tienen diferencias que
provienen de una poblacin con una mediana igual
a cero
H1: Los datos apareados .tienen diferencias que
provienen de una poblacin con una mediana
diferente a cero.
Procedimiento:
1. Calcule d (restando el segundo valor menos el
primero), descarte d=0
2. Ignore los signos de las diferencias y ordene las
diferencias de la ms baja a la ms alta y
reemplace por el valor del rango
correspondiente.
3. Adjunte a cada rango el signo de la diferencia
de la que provino.
Procedimiento:
4. Calcule la suma de los valores absolutos de los
rangos negativos. Tambin de los rangos
positivos.
5. Utilice T que sea la ms pequea de las dos
sumas que se calcularon en el paso 4
6. Utilice n que sea el nmero de pares de datos
para los que la diferencia d no es cero
Procedimiento:
7. Determine el estadstico de prueba y los valores
crticos
8. Tome su decisin y conclusin apropiada
ESTADSTICO DE PRUEBA
Si n30 el Estadstico de prueba es T
Donde T es el ms pequeo de las siguientes
sumas:
1. La suma de los valores absolutos de los
rangos negativos de las diferencias d que no
sean ceros.
2. La suma de los rangos positivos de las
diferencias d que no sean ceros

El valor crtico de T se encuentra en la tabla A-8

ESTADSTICO DE PRUEBA
Si n>30 usar el siguiente estadstico de prueba


24
) 1 2 )( 1 (
4
) 1 (
+ +
+

=
n n n
n n
T
z
Los valores crticos de z se encuentran en la
tabla A-2


EJEMPLO 4
Remtase a los datos muestrales
apareados indicados y utilice la prueba
de rangos con signo de Wilcoxon para
probar la aseveracin de que los datos
apareados tienen diferencias que
provienen de una poblacin con una
mediana igual a cero. Utilice un nivel de
significancia de 0.05.

EJEMPLO 4 (CONTINUACIN)
PRUEBA DE LA SUMA DE
RANGOS DE WILCOXON
PARA DOS MUESTRAS
INDEPENDIENTES
PRUEBA DE LA SUMA DE
RANGOS DE WILCOXON
Utiliza rangos de datos muestrales consistentes en
muestras independientes
Se usa para probar la hiptesis nula de que las dos
muestras independientes provienen de poblaciones
con medianas iguales.
Es equivalente a la prueba de U de Mann-Whitney

Planteamiento de hiptesis
H
0
: Las dos muestras provienen de poblaciones
con medianas iguales

H
1
: Las dos muestras provienen de poblaciones
con medianas diferentes
Procedimiento:
1. Combine temporalmente las dos muestras en
una muestra grande y a cada valor muestral
reemplace su rango.
2. Calcule la suma de los rangos de las dos
muestras
3. Calcule el valor del estadstico de prueba z.
ESTADSTICO DE PRUEBA
R
R
R
z
o

=
2
) 1 (
2 1 1
+ +
=
n n n
R

12
) 1 (
2 1 2 1
+ +
=
n n n n
R
o
Valores Crticos
Los valores crticos se encuentran en la tabla A-2
EJEMPLO 5
Los trastornos psiquitricos
severos estn relacionados con
factores biolgicos? Un estudio
utiliz tomografa computarizada (TC)
por rayos X para reunir datos de
volmenes cerebrales de un grupo de
pacientes con trastorno obsesivo-
compulsivo y un grupo de control de
personas saludables.
EJEMPLO 5
La lista adjunta presenta los resultados
muestrales (en mililitros) para
volmenes del hemisferio derecho
Utilice un nivel de significancia de 0.01
y pruebe la aseveracin de que los
pacientes obsesivo-compulsivos y las
personas saludables tienen la misma
mediana de volmenes cerebrales.
EJEMPLO 5
Con base en este resultado, podemos
concluir que el trastorno obsesivo-
compulsivo tiene una base biolgica?

EXPERIMENTOS
MULTINOMIALES
PRUEBA DE BONDAD DE AJUSTE
PRUEBA DE BONDAD DE AJUSTE
La prueba de bondad de ajuste se
utiliza para determinar si la distribucin
de los valores en la poblacin se ajusta
a una forma particular planteada como
hiptesis.
Por ejemplo una distribucin uniforme
LAS HIPTESIS
H
0
: La poblacin sigue la distribucin ........

H
1
: La poblacin no sigue la distribucin
........

ESTADISTICO DE PRUEBA

=
c
i
i
i i
E
E O
1
2
2
) (
_
En donde:
O
i
es la frecuencia de los eventos observados en los
datos muestrales
E
i
es la frecuencia de los eventos esperados si la
hiptesis nula es correcta.
x es el nmero de categoras o clases.
i i
np E =
REGLA DE DECISIN
El estadstico de prueba
se conpara con el
valor crtico de la tabla _
2
con c 1 grados de
libertad con o grados de
significacin.
Si el valor de _
2
es mayor
que el valor crtico,
entonces rechazar la
hiptesis nula H
0

gl=k-1
X
2

F(x
2
)
RA
1-o

1-o
RR
o
FRECUENCIAS
ESPERADAS PEQUEAS
Cuando c > 2, si ms del 20% de las E
i
son
menores que 5, habr que combinar las
categoras adyacentes cuando sea
razonable hacerlo, reduciendo de este
modo el valor de c e incrementando los
valores de algunas de las E
i

EJEMPLO 6
El neumtico desinflado y la clase
perdida. Un cuento clsico se refiere a
cuatro estudiantes que van juntos en
un automvil y no llegan a un examen;
como excusa. Dijeron al profesor que
un neumtico se desinfl en el camino.
EJEMPLO 6 (continuacin)
En el examen de recuperacin, el
profesor pidi a los estudiantes que
identificaran el neumtico en particular
que se desinfl. Si en realidad no
tuvieron un neumtico desinflado,
seran capaces de identificar el mismo
neumtico?
EJEMPLO 6 (continuacin)
El autor pidi a otros 41 estudiantes
que identificaran el neumtico que ellos
seleccionaran. Los resultados estn
listados en la siguiente tabla (excepto el
de un estudiante que seleccion el
neumtico de refaccin). Utilice un nivel
de significancia de 0.05
EJEMPLO 6 (continuacin)
Utilice un nivel de significancia de 0.05
para probar la aseveracin del autor de
que los resultados se ajustan a una
distribucin uniforme. Qu sugiere el
resultado acerca de la capacidad de los
cuatro estudiantes de seleccionar el
mismo neumtico cuando en realidad
su excusa fue una mentira?
EJEMPLO 6 (continuacin)
Neumtico
Frontal
izquierdo
Frontal
derecho
Trasero
izquierdo
Trasero
derecho
Nmero
seleccionado
11 15 8 6
TABLAS DE
CONTINGENCIA
INDEPENDENCIA Y HOMOGENEIDAD
PRUEBA DE INDEPENDENCIA
La Prueba Chi-cuadrado de independencia tambin
permite la comparacin de dos atributos para
determinar si existe una asociacin entre ellos.
Cundo se utiliza?
Se utiliza cuando se quiere determinar si las variables
son independientes o dependientes respectivamente
una de la otra.
LAS HIPOTESIS
H
0
: Las variables (fila y columna) son
independientes.

H
1
: Las variables (fila y columna) son
dependientes.

ESTADSTICO DE PRUEBA


=
i
i i
E
E O
2
2
) (
_
Donde:
O
i
: Frecuencia Observada de la i-sima fila con la
j-sima columna
E
i
: Frecuencia Esperada de la i-sima fila con la
j-sima columna
n
i
: frecuencia de la i-sima fila
nj : frecuencia de la j-sima columna
n : tamao de la muestra
n
n n
E
j i
i
=
REGLA DE DECISIN
El estadstico de
prueba se compara con
el valor crtico de la
tabla _
2
con (f - 1)(c - 1)
grados de libertad con
o grados de
significacin.
Si el valor de _2 es
mayor que el valor
crtico,
entonces rechazar la
hiptesis nula H
0

gl=(f-1)*(c-1)
X
2

F(x
2
)
RA
1-o

1-o
RR
o
EJEMPLO 7
Existe discriminacin racial? La
discriminacin racial es la prctica polmica
sealar que alguien tiene una conducta
criminal con base en su raza, pas de origen u
origen tnico. La tabla adjunta resume
resultados de conductores seleccionados al
azar, detenidos por la polica en un ao
reciente (segn datos del Departamento de
Justicia de Estados Unidos, Bureau of Justice
Statistics).
EJEMPLO 7 (continuacin)
El uso de los datos de esta tabla dio
como resultado una pantalla de Minitab.
Utilice un nivel de significancia de 0.05
para probar la aseveracin de que el
hecho de ser detenido es independiente
de la raza y del origen tnico. Con base
en la evidencia disponible, podemos
concluir que hay discriminacin racial?

EJEMPLO 7 (continuacin)

Afroestadounidenses
y no hispanos
Caucsicos y no
hispanos
Detenidos por
la polica
24 147
No detenidos
por la polica
176 1253
PRUEBA DE HOMOGENEIDAD
Se prueba la aseveracin de que las
poblaciones tienen las mismas
proporciones de algunos caractersticas.
LAS HIPOTESIS
H
0
: Las proporciones de las poblaciones
son iguales

H
1
: Las proporciones de las poblaciones
no son iguales

EJEMPLO 8
La exactitud del escner es la
misma para las ofertas? En un
estudio de sistemas de cobro por
escner en almacenes, se utilizaron
muestras de compras para comparar las
lecturas por escner de los precios con
los precios etiquetados. La tabla
adjunta resume resultados de una
muestra de 819 artculos.
EJEMPLO 8 (continuacin)
Cuando los almacenes utilizan escner
para cobrar los artculos, las tasas de
error son las mismas para los artculos
con precio normal que para los artculos
en oferta? Cmo podra cambiar la
conducta de los consumidores si creen
que ocurren desproporcionadamente
ms cobros excesivos en los artculos
en oferta?

EJEMPLO 8 (continuacin)

Artculos con
precio normal
Artculos en
oferta
Cobros de menos 20 7
Cobros de ms 15 29
Precio correcto 384 364
PRUEBA DE KRUSKAL
WALLIS
PRUEBA H
PRUEBA DE KRUSKAL -
WALLIS O PRUEBA H
Se utiliza para probar que muestras (tres o ms
poblaciones) independientes provienen de
poblaciones con medianas iguales.
LAS HIPTESIS
H
0
:Las muestras provienen de
poblaciones con medianas iguales
H
1
: Las muestras provienen de
poblaciones con medianas que no
son iguales
ESTADSTICO DE PRUEBA

+
+
= ) 1 ( 3
) 1 (
12
2
n
n
R
n n
K
i
i
Donde: K = valor estadstico de la prueba de
Kruskal-Wallis.
n = tamao total de la muestra.
R
i
2
= sumatoria de los rangos elevados al cuadrado.
n
i
= tamao de la muestra de cada grupo.
REGLA DE DECISIN
El estadstico de prueba
(K) se compara con el
valor crtico de la tabla _
2
con c-1 grados de
libertad con o grados de
significacin.
Si el valor de K es mayor
que el valor crtico,
entonces rechazar la
hiptesis nula H
0


gl=k-1
X
2

F(x
2
)
RA
1-o

1-o
RR
o
EJEMPLO 10
Afecta el peso de un automvil las
heridas en la cabeza producidas en
un choque? Se obtuvieron datos de
experimentos de choques realizados por la
National Transportation Safety
Administration. Se compraron automviles
nuevos, se impactaron contra una barrera
fija a 35 mi/h y se registraron las
mediciones en un maniqu en el asiento
del conductor.
EJEMPLO 10 (continuacin)
Utilice los datos mustrales listados abajo
para probar las diferencias en las
mediciones de heridas en la cabeza (de
acuerdo con el Head Injury Criterion, HIC)
en cuatro categoras de peso. Existe
evidencia suficiente para concluir que las
mediciones de heridas en la cabeza para
las cuatro categoras de peso de
automviles no son las mismas?
EJEMPLO 10 (continuacin)
Sugieren los datos que los automviles
ms pesados son ms seguros en un
choque?

Subcompacto: 681 428 917 898 420
Compacto: 643 655 442 514 525
Mediano: 469 727 525 454 259
Grande: 384 656 602 687 360
PRUEBA DE
CORRELACIN DE
RANGOS DE SPEARMAN
CORRELACIN DE
RANGOS DE SPEARMAN
Se utiliza para probar una asociacin entre
dos variables con datos apareados.
LAS HIPTESIS
H
0
: = 0 ; No existe correlacin entre las dos
variables

H
1
: = 0 ; Si existe correlacin entre las dos
variables
COEFICIENTE DE CORRELACIN
DE SPEARMAN
) 1 (
6
1
2
2

=

n n
d
r
i
s
Donde :
d
i
: es la diferencia entre los puntajes de cada
observacin
n : Tamao de la muestra
Adems se debe cumplir que -1 sr
s
s 1
Sin empates
COEFICIENTE DE CORRELACIN
DE SPEARMAN
Empates
( ) ( )
2
2
2
2




=
y y n x x n
y x xy n
r
s
ESTADSTICO DE PRUEBA
Para muestras pequas (n30), se hace uso de la
tabla A-9.
Si r
s
se encuentra en el intervalo de los valores
crticos de la tabla A-9 entonces se acepta H
0

ESTADSTICO DE PRUEBA
Para muestras grandes (n>30) la distribucin de
r
s
se aproxima a la normal, donde el estadstico
de prueba es:
1 = n r z
s
Si el valor del estadstico de prueba es mayor
que el valor crtico de z al nivel de o/2 rechazar
H
0

-z
z
RA
RR RR
EJEMPLO 11
Grillos y temperatura. Se estudi la
relacin entre la temperatura y el nmero
de veces que un grillo chirra en un
minuto. Abajo se listan los nmeros de
chirridos por minuto y las temperaturas
correspondientes en grados Fahrenheit
(segn datos de The Song of Insects, de
George W. Pierce, Harvard University
Press).
EJEMPLO 11 (continuacin)
Existe evidencia suficiente para
concluir que existe una relacin entre el
nmero de chirridos por minuto y la
temperatura?

Chirridos en un minuto 882 1188 1104 864 1200 1032 960 900
Temperatura (en
o
F) 69,7 93,3 84,3 76,3 88,6 82,6 71,6 79,6
PRUEBA DE RACHAS
PRUEBA DE RACHAS
Utilizada para comprobar la
aleatoriedad de las muestras.
RACHA (G) : Una serie continua de uno
o ms smbolos
LAS HIPTESIS
Ho : Existe aleatoriedad en la muestra.

H
1
: No existe aleatoriedad en la muestra.
REGLA DE DECISIN
Cuando n
1
como n
2
son menores o iguales a
20
Usar la Tabla A-10
Si el valor de G no se encuentra entre los valores
crticos de las tablas entonces se rechaza H
0

PRUEBA DE RACHAS
Cuando n
1
como n
2
son mayores que 20
La distribucin de la muestra se aproxima a la
normalidad. Entonces se puede decir que tiene:
1
2
2 1
2 1
+
+
=
n n
n n
G

( ) ) 1 (
) 2 ( 2
2 1
2
2 1
2 1 2 1 2 1
+ +

=
n n n n
n n n n n n
G
o
Media
Desviacin estndar
ESTADSTICO DE PRUEBA
G
G
G
Z
o

=
Sigue una Distribucin Normal estandarizada
REGLA DE DECISIN
Si el valor de estadstico cae fuera de la
regin de aceptacin, H
0
se rechaza
EJEMPLO 12
Gneros de osos. El primer ejemplo de
esta seccin utiliz los gneros de los
primeros 10 osos del conjunto de datos 6
del apndice B. Realice una prueba de
rachas para detectar aleatoriedad
utilizando los gneros de los primeros 20
osos del conjunto de datos 6. A
continuacin se listan los gneros.
M M M M H H M M H H M M H M H M M H M M

You might also like