You are on page 1of 87

Lic.

Luz María Supo Zapata
Las pruebas de hipótesis realizadas en los capítulos
anteriores respecto a los parámetros poblacionales
de medias, proporciones o varianzas son hechas
bajo supuestos a las poblaciones, tales como
supuestos de normalidad.
Lamentablemente no todas las poblaciones cumplen
con este supuesto, pero existen técnicas
estadísticas útiles que no necesitan de supuestos de
las poblaciones conocidas como Pruebas No
Paramétricas o pruebas de distribución libre.
1. Prueba de signos
2. Prueba Chi – cuadrado
2.1 Prueba de Bondad de ajuste
2.2 Prueba de Independencia y homogeneidad
3. Prueba de Kruskal – Wallis
4. Correlación de Rangos de Spearman
5. Prueba de rachas
1. No requiere que hagamos la suposición de
que las poblaciones distribuidas
normalmente.
2. Se aplican a datos categóricos
3. Implican cálculos más sencillos, por lo tanto
son más fáciles de entender y aplicar
1. Desperdician información, ya que los
datos originales se reducen a una forma
cualitativa
2. A menudo no son tan eficientes como
las prueba paramétricas por lo tanto se
necesita evidencias más fuertes
Se le llama prueba del signo porque la
información contenida en la muestra
seleccionada se puede transformar en un
conjunto de signos más y menos, y cuando
se hace la prueba no se hace uso de la
magnitud de los valores de la muestra, sino
solamente se consideran los signos.
Se pueden probar estas aseveraciones:
1. Aseveraciones que incluyen datos apareados
de datos muestrales.
2. Aseveraciones que incluyen datos nominales.
3. Aseveraciones acerca de la mediana de una
sola población.
1. Los datos muestrales se seleccionan
aleatoriamente
2. No existe el requisito de que los datos
muestrales provengan de una población con
una distribución particular, como la
distribución normal
1. Para n≤25
x : el número de veces que ocurre el signo
menos frecuente
n: el número total, de signos positivos y
negativos combinados
Los valores críticos x se encuentran en la
Tabla A-7
1. Para n>25


x : el número de veces que ocurre el signo menos
frecuente
n: el número total, de signos positivos y negativos
combinados
Los valores críticos x se encuentran en la Tabla A-2
2
2
) 5 . 0 (
n
n
x
z
|
.
|

\
|
÷ +
=
Procedimiento:
1. Restamos cada valor de la segunda variable del valor
correspondiente de la primera variable
2. Registramos sólo el signo de la diferencia que se
encontró en el paso 1. Excluimos los empates
“Si dos conjuntos de datos tienen medianas iguales, el
número de signos positivos debe ser
aproximadamente igual al número de signos
negativos”
Los siguientes datos corresponden a temperaturas
máximas reales y el pronóstico de temperaturas máximas
de tres días. ¿Parece existir una diferencia?
Real Máxima 80 77 81 85 73 73 80 72 83 81 75 78 80 71 73 78 75 63
Pronóstico 3
días máxima
79 86 79 83 80 76 80 79 76 79 78 75 74 73 73 76 76 73
Real Máxima 63 70 77 82 81 76 77 76 74 66 66 62 71 68 66 71 58
Pronóstico 3
días máxima
75 68 77 83 78 75 77 72 74 74 68 72 72 73 66 68 62
Datos nominales: incluyen nombres, etiquetas o
categorías
Se aplican los signos más o menos en forma arbitraria a
las categorías.
A continuación se listan los pesos (en gramos) de
monedas de 25 centavos, acuñadas después de 1964,
seleccionadas al azar. Se supone que el peso de las
monedas tiene una mediana de 5.670 g. Utilice un nivel
de significancia de 0.05 para probar la aseveración de
que la mediana es igual a 5.670 g. Al parecer, ¿las
monedas están acuñadas según las especificaciones?
5.7027 5.7495 5.7050 5.5941 5.7247 5.6114
5.6160 5.5999 5.7790 5.6841
Los signos positivos y negativos se basan en el valor que
se asevera para la mediana.
Las temperaturas corporales medidas a 106 adultos. para
probar. con la prueba de signos, la aseveración de que la
mediana es menor que 98.6°F. El conjunto de datos tiene
106 sujetos: 68 sujetos con temperaturas por debajo de
98.6°F, 23 sujetos con temperaturas por encima de 98.6°F
y 15 sujetos con temperaturas iguales a 98.6°F
PARA DATOS APAREADOS
Utiliza rangos ordenados de datos muestrales
consistentes en datos apareados
Se usa para probar las diferencias en las
distribuciones poblacionales y para probar la
aseveración de que una muestra proviene de una
población con una mediana específica.

H0: Los datos apareados .tienen diferencias que
provienen de una población con una mediana
igual a cero
H1: Los datos apareados .tienen diferencias que
provienen de una población con una mediana
diferente a cero.
1. Calcule d (restando el segundo valor menos
el primero), descarte d=0
2. Ignore los signos de las diferencias y ordene
las diferencias de la más baja a la más alta y
reemplace por el valor del rango
correspondiente.
3. Adjunte a cada rango el signo de la
diferencia de la que provino.
4. Calcule la suma de los valores absolutos de
los rangos negativos. También de los rangos
positivos.
5. Utilice T que sea la más pequeña de las dos
sumas que se calcularon en el paso 4
6. Utilice n que sea el número de pares de datos
para los que la diferencia d no es cero
7. Determine el estadístico de prueba y los
valores críticos
8. Tome su decisión y conclusión apropiada
Si n≤30 el Estadístico de prueba es T
Donde T es el más pequeño de las
siguientes sumas:
1. La suma de los valores absolutos de los
rangos negativos de las diferencias d que
no sean ceros.
2. La suma de los rangos positivos de las
diferencias d que no sean ceros

El valor crítico de T se encuentra en la tabla
A-8

Si n>30 usar el siguiente estadístico de
prueba


24
) 1 2 )( 1 (
4
) 1 (
+ +
+
÷
=
n n n
n n
T
z
Los valores críticos de z se encuentran en la
tabla A-2


Remítase a los datos muestrales apareados
indicados y utilice la prueba de rangos con
signo de Wilcoxon para probar la aseveración
de que los datos apareados tienen
diferencias que provienen de una población
con una mediana igual a cero. Utilice un
nivel de significancia de 0.05.

EJ EMPLO 4 (CONTI NUACI ÓN)
PARA DOS MUESTRAS INDEPENDIENTES
Utiliza rangos de datos muestrales consistentes
en muestras independientes
Se usa para probar la hipótesis nula de que las
dos muestras independientes provienen de
poblaciones con medianas iguales.
Es equivalente a la prueba de U de Mann-
Whitney

H
0
: Las dos muestras provienen de
poblaciones con medianas iguales

H
1
: Las dos muestras provienen de
poblaciones con medianas diferentes
1. Combine temporalmente las dos muestras
en una muestra grande y a cada valor
muestral reemplace su rango.
2. Calcule la suma de los rangos de las dos
muestras
3. Calcule el valor del estadístico de prueba z.
R
R
R
z
o
µ ÷
=
2
) 1 (
2 1 1
+ +
=
n n n
R
µ
12
) 1 (
2 1 2 1
+ +
=
n n n n
R
o
Valores Críticos
Los valores críticos se encuentran en la tabla A-2
Prueba de hipótesis de la diferencia de la
antigüedad de automóviles y taxis. Cuando
el autor visitó Dublín en Irlanda, registró la
antigüedad de automóviles y taxis
seleccionados al azar. A continuación se
listan las antigüedades (en años). Utilice un
nivel de significancia de 0.05 para probar la
aseveración de que existe una diferencia
entre la mediana de la antigüedad de un
automóvil de Dublín y la mediana de la
antigüedad de un taxi de Dublín.
Podríamos esperar que los taxis fueran más
nuevos, pero, ¿qué sugieren los resultados?
12
1 (
2
2 1 2 1
2 1
+ +
÷
=
n n n n
n n
U
z
R
n n
n n U ÷
+
+ =
2
) 1 (
1 1
2 1
Es equivalente a la prueba de la suma de rangos de
Wilcoxon para muestras independientes
Donde:
PRUEBA DE BONDAD DE AJUSTE
La prueba de bondad de ajuste se
utiliza para determinar si la distribución
de los valores en la población se ajusta
a una forma particular planteada como
hipótesis.
Por ejemplo una distribución uniforme
H
0
: La población sigue la distribución ...

H
1
: La población no sigue la distribución ...

¿
=
÷
=
c
i
i
i i
E
E O
1
2
2
) (
_
En donde:
O
i
es la frecuencia de los eventos observados en los
datos muestrales
E
i
es la frecuencia de los eventos esperados si la
hipótesis nula es correcta.
x es el número de categorías o clases.
i i
np E =
El estadístico de prueba
se compara con el
valor crítico de la tabla _
2
con c – 1 grados de
libertad con o grados de
significación.
Si el valor de _
2
es mayor
que el valor crítico,
entonces rechazar la
hipótesis nula H
0

gl=k-1
X
2

F(x
2
)
RA
1-o

1-o
RR
o
Cuando c > 2, si más del 20% de las E
i
son menores que 5, habrá que combinar
las categorías adyacentes cuando sea
razonable hacerlo, reduciendo de este
modo el valor de c e incrementando los
valores de algunas de las E
i

El neumático desinflado y la clase perdida.
Un cuento clásico se refiere a cuatro
estudiantes que van juntos en un automóvil y
no llegan a un examen; como excusa. Dijeron
al profesor que un neumático se desinfló en
el camino.
En el examen de recuperación, el profesor
pidió a los estudiantes que identificaran el
neumático en particular que se desinfló. Si
en realidad no tuvieron un neumático
desinflado, ¿serían capaces de identificar el
mismo neumático?
El autor pidió a otros 41 estudiantes que
identificaran el neumático que ellos
seleccionarían. Los resultados están listados
en la siguiente tabla (excepto el de un
estudiante que seleccionó el neumático de
refacción). Utilice un nivel de significancia
de 0.05
Utilice un nivel de significancia de 0.05 para
probar la aseveración del autor de que los
resultados se ajustan a una distribución
uniforme. ¿Qué sugiere el resultado acerca
de la capacidad de los cuatro estudiantes de
seleccionar el mismo neumático cuando en
realidad su excusa fue una mentira?
Neumático
Frontal
izquierdo
Frontal
derecho
Trasero
izquierdo
Trasero
derecho
Número
seleccionado
11 15 8 6
Muertes por choques de automóviles.
Se seleccionaron al azar muertes por
choques de automóviles y los resultados
se incluyen en la siguiente tabla.
Utilice un nivel de significancia de 0.05
para probar la aseveración de que las
muertes por choques de automóviles
ocurren con la misma frecuencia en los
diferentes días de la semana

. ¿Cómo se explicarían los resultados? ¿Por
qué parece haber un número
excepcionalmente grande de muertes por
choques de automóviles los sábados?
INDEPENDENCIA Y HOMOGENEIDAD
La Prueba Chi-cuadrado de independencia
también permite la comparación de dos atributos
para determinar si existe una asociación entre
ellos.
¿Cuándo se utiliza?
Se utiliza cuando se quiere determinar si las
variables son independientes o dependientes
respectivamente una de la otra.
H
0
: Las variables (fila y columna) son
independientes.

H
1
: Las variables (fila y columna) son
dependientes.

¿
÷
=
i
i i
E
E O
2
2
) (
_
Donde:
O
i
: Frecuencia Observada de la i-ésima fila con la
j-ésima columna
E
i
: Frecuencia Esperada de la i-ésima fila con la
j-ésima columna
n
i
: frecuencia de la i-ésima fila
nj : frecuencia de la j-ésima columna
n : tamaño de la muestra
n
n n
E
j i
i
=
El estadístico de
prueba se compara con
el valor crítico de la
tabla _
2
con (f - 1)(c - 1)
grados de libertad con
o grados de
significación.
Si el valor de _2 es
mayor que el valor
crítico,
entonces rechazar la
hipótesis nula H
0

gl=(f-1)*(c-1)
X
2

F(x
2
)
RA
1-o

1-o
RR
o
Riesgos de trabajo. Utilice los datos en la tabla para
probar la aseveración de que la ocupación es
independiente de que la causa de muerte sea homicidio.
La tabla está basada en datos del Departamento del
Trabajo de Estados Unidos, Bureau of Labor Statistics.
Al parecer, ¿una ocupación en particular es más
proclive a los homicidios? De ser así, ¿cuál es?
Se prueba la aseveración de que las
poblaciones tienen las mismas
proporciones de algunos características.
H
0
: Las proporciones de las poblaciones
son iguales

H
1
: Las proporciones de las poblaciones
no son iguales

¿La exactitud del escáner es la misma para
las ofertas? En un estudio de sistemas de
cobro por escáner en almacenes, se
utilizaron muestras de compras para
comparar las lecturas por escáner de los
precios con los precios etiquetados. La tabla
adjunta resume resultados de una muestra de
819 artículos.
Cuando los almacenes utilizan escáner para
cobrar los artículos, ¿las tasas de error son
las mismas para los artículos con precio
normal que para los artículos en oferta?
¿Cómo podría cambiar la conducta de los
consumidores si creen que ocurren
desproporcionadamente más cobros
excesivos en los artículos en oferta?


Artículos con
precio normal
Artículos en
oferta
Cobros de menos 20 7
Cobros de más 15 29
Precio correcto 384 364
PRUEBA H
Se utiliza para probar que muestras (tres
o más poblaciones) independientes
provienen de poblaciones con medianas
iguales.
H
0
:Las muestras provienen de
poblaciones con medianas
iguales
H
1
: Las muestras provienen de
poblaciones con medianas que
no son iguales
¿
+ ÷
+
= ) 1 ( 3
) 1 (
12
2
n
n
R
n n
H
i
i
Donde: H = valor estadístico de la prueba de
Kruskal-Wallis.
n = tamaño total de la muestra.
R
i
2
= sumatoria de los rangos elevados al cuadrado.
n
i
= tamaño de la muestra de cada grupo.
El estadístico de prueba
(H) se compara con el
valor crítico de la tabla _
2
con c-1 grados de
libertad con o grados de
significación.
Si el valor de H es mayor
que el valor crítico,
entonces rechazar la
hipótesis nula H
0


gl=k-1
X
2

F(x
2
)
RA
1-o

1-o
RR
o
Debe aplicarse siempre que existan muchos empates:
divida H entre
N N
T
÷
¿
÷
3
1
Para cada grupo de observaciones empatadas en el
conjunto combinado de datos muéstrales, calcule
T = t
3
- t,
donde t es el número de observaciones que están
empatadas en el grupo individual.
N es el número de observaciones en todas las muestras
combinadas
Calcule t para cada grupo de valores empatados, luego
calcule el valor de T para cada grupo, y después sume
los valores T para obtener ∑T. El número total de
observaciones en todas las muestras combinadas es N.
Utilice este procedimiento para calcular el valor
corregido de H para el ejercicio 1.
Afecta el peso de un automóvil las
heridas en la cabeza producidas en un
choque? Se obtuvieron datos de
experimentos de choques realizados por
la National Transportation Safety
Administration. Se compraron
automóviles nuevos, se impactaron
contra una barrera fija a 35 mi/h y se
registraron las mediciones en un
maniquí en el asiento del conductor.
Utilice los datos muéstrales listados abajo
para probar las diferencias en las
mediciones de heridas en la cabeza (de
acuerdo con el Head Injury Criterion,
HIC) en cuatro categorías de peso. ¿Existe
evidencia suficiente para concluir que las
mediciones de heridas en la cabeza para
las cuatro categorías de peso de
automóviles no son las mismas?
¿Sugieren los datos que los automóviles más
pesados son más seguros en un choque?

Subcompacto: 681 428 917 898 420
Compacto: 643 655 442 514 525
Mediano: 469 727 525 454 259
Grande: 384 656 602 687 360
Se utiliza para probar una asociación
entre dos variables con datos apareados.
H
0
: µ = 0 ; No existe correlación entre las dos
variables

H
1
: µ = 0 ; Si existe correlación entre las dos
variables
) 1 (
6
1
2
2
÷
÷ =
¿
n n
d
r
i
s
Donde :
d
i
: es la diferencia entre los puntajes de cada
observación
n : Tamaño de la muestra
Además se debe cumplir que -1 sr
s
s 1
Sin empates
Empates
( ) ( )
2
2
2
2
¿ ¿ ¿ ¿
¿ ¿ ¿
÷ ÷
÷
=
y y n x x n
y x xy n
r
s
Para muestras pequñas (n≤30), se hace uso de la
tabla A-9.
Si r
s
se encuentra en el intervalo de los valores
críticos de la tabla A-9 entonces se acepta H
0

Para muestras grandes (n>30) la distribución
de r
s
se aproxima a la normal, donde el
estadístico de prueba es:
1 ÷ = n r z
s
Si el valor del estadístico de prueba es mayor
que el valor crítico de z al nivel de o/2
rechazar H
0

-z
z
RA
RR RR
Grillos y temperatura. Se estudió la
relación entre la temperatura y el
número de veces que un grillo chirría
en un minuto. Abajo se listan los
números de chirridos por minuto y las
temperaturas correspondientes en
grados Fahrenheit (según datos de The
Song of Insects, de George W. Pierce,
Harvard University Press).
¿Existe evidencia suficiente para concluir
que existe una relación entre el número de
chirridos por minuto y la temperatura?

Chirridos en un
minuto 882 1188 1104 864 1200 1032 960 900
Temperatura (en
o
F) 69,7 93,3 84,3 76,3 88,6 82,6 71,6 79,6
Utilizada para comprobar la
aleatoriedad de las muestras.
RACHA (G) : Una serie continua de uno
o más símbolos
Ho : Existe aleatoriedad en la muestra.

H
1
: No existe aleatoriedad en la muestra.
Cuando n
1
como n
2
son menores o iguales
a 20
Usar la Tabla A-10
Si el valor de G no se encuentra entre los
valores críticos de las tablas entonces se
rechaza H
0

Cuando n
1
como n
2
son mayores que 20
La distribución de la muestra se aproxima a la
normalidad. Entonces se puede decir que tiene:
1
2
2 1
2 1
+
+
=
n n
n n
G
µ
( ) ) 1 (
) 2 ( 2
2 1
2
2 1
2 1 2 1 2 1
÷ + +
÷ ÷
=
n n n n
n n n n n n
G
o
Media
Desviación estándar
G
G
G
Z
o
µ ÷
=
Sigue una Distribución Normal estandarizada
Si el valor de estadístico cae fuera de la
región de aceptación, H
0
se rechaza
Géneros de osos. Realice una prueba de
rachas para detectar aleatoriedad
utilizando los géneros de 20 osos. A
continuación se listan los géneros.
M M M M H H M M H H M M H M H M M H M M