You are on page 1of 16

0011 0010 1010 1101 0001 0100 1011

RECHAZO DE DATOS DE UNA SERIE

Gloria Mara Meja Z

45

0011 0010 1010 1101 0001 0100 1011

Cuando se escoge el nivel de significacin 0,05 ( 5%), tenemos un 95% de confianza de que hemos adoptado la decisin correcta y una probabilidad 0,05 de ser falsa.

Gloria Mara Meja Z

45

Cmo determina si un valor es realmente un valor atpico y cmo decide si debe continuar o no con el anlisis de datos? 0011 0010 1010 1101 0001 0100 1011 Uno de los problemas en el anlisis de datos es manejar los valores atpicos dentro de un grupo de datos. Un valor atpico es una observacin con un valor que no parece corresponderse con el resto de los valores en el grupo de datos.

Por lo general surgen dos preguntas: )Es este valor realmente un valor atpico? )Puedo eliminar este valor y continuar con el anlisis de datos?
Gloria Mara Meja Z

45

DATOS ATIPICOS
0011 0010 1010 1101 0001 0100 1011

Con respecto a la pregunta 2, debe saberse que las pruebas estadsticas se utilizan para identificar valores atpicos, no para retirarlos del grupo de datos. Tcnicamente, una observacin no debe retirarse a menos que una investigacin halle una causa probable para justificar esta accin

Gloria Mara Meja Z

45

DATOS ATIPICOS
0011 0010 1010 1101 0001 0100 1011

Si en la investigacin no se encuentra una causa probable, qu debe hacerse? Un enfoque sera realizar un anlisis de datos con el valor atpico y sin l. Si las conclusiones son diferentes, entonces se considera que el valor atpico tiene influencia y esto debera indicarse en el informe. Otra opcin es utilizar estimadores rigurosos para caracterizar los grupos de datos, tal como la mediana de la muestra en lugar de la media.

Gloria Mara Meja Z

45

RECHAZO DE DATOS
0011 0010 1010 1101 0001 0100 1011

Dos de las pruebas estadsticas utilizadas con mayor frecuencia en un grupo de datos son la prueba de Dixon y la prueba de Grubbs. La prueba de Dixon utiliza relaciones de las diferencias entre datos que parecen atpicos comparados con los valores del grupo de datos.

Gloria Mara Meja Z

45

RECHAZO DE DATOS
0011 0010 1010 1101 0001 0100 1011

Estas tcnicas estn diseadas para detectar un nico valor atpico en un grupo de datos, y por lo tanto no son adecuadas para la deteccin de mltiples valores atpicos. Una tcnica rigurosa y amplia para identificar eficazmente mltiples valores atpicos es el procedimiento para muchos valores atpicos con generalizacin extrema de la desviacin de Student.

Gloria Mara Meja Z

45

DIXON
0011 0010 1010 1101 0001 0100 1011

Por ejemplo, tomemos los datos 5.3, 3.1, 4.9, 3.9, 7.8, 4.7 y 4.3 Ordenando los datos: 3.1, 3.9, 4.3, 4.7, 4.9, 5.3, 7.8

El tamao de la muestra es 7, y la relacin utilizada es el espacio entre el valor atpico (7.8) y su vecino ms prximo (5.3) dividido por el espacio entre los valores ms grandes y ms pequeos en el grupo. Por lo tanto, el ndice de Dixon es: (7.8 5.3)/(7.8 3. ) = .5/4.7 = .53 Gloria Mara Meja Z

45

RECHAZO DE DATOS
0011 0010 1010 1101 0001 0100 1011

Este valor se compara con un valor crtico de una tabla, y el valor se declara valor atpico si supera ese valor crtico. Si Dcalculado>Dtabulado se rechaza el dato

El valor tabulado depende del tamao de la muestra, n, y de un nivel de confianza elegido, que es el riesgo de rechazar una observacin vlida. La tabla por lo general utiliza niveles de baja confianza tal como 1% o 5%. Para un n = 7 y un riesgo del 5%, el valor en la tabla es 0.507. El ndice de Dixon 0.532 excede este valor crtico, indicando que el valor 7.8 es un valor atpico.
Gloria Mara Meja Z

45

DIXON
0011 0010 1010 1101 0001 0100 1011

La prueba de Dixon se usa en un nmero pequeo de observaciones (menor a 26) y detecta elementos que se encuentren sesgados o que son extremos.
Para aplicar la prueba de Dixon se requiere de un nmero de observaciones igual o mayor a . En el caso que las se observaciones sean menores a utiliza como valor esperado el valor de preparacin.

Gloria Mara Meja Z

45

GRUBBS
0011 0010 1010 1101 0001 0100 1011

La prueba de Grubbs utiliza una estadstica de prueba, T, que es la diferencia absoluta entre el valor atpico, XO, y el promedio de la muestra (X) dividida por la desviacin estndar de la muestra, s. Para el ejemplo anterior, el promedio de la muestra es = 4.86 y la desviacin estndar de la muestra es = 1.48. La estadstica calculada de la prueba es:

Gloria Mara Meja Z

45

GRUBBS
0011 0010 1010 1101 0001 0100 1011

Para un n = 7 y un riesgo del 5%, el valor tabulado es 1.938 y el TCalculado = 1.99 excede este valor crtico, indicando que el valor 7.8 es un valor atpico.

Gloria Mara Meja Z

45

TEST DE GRUBB PARA DATOS SOSPECHOSOS 0011 0010 1010 1101 0001 0100 1011
Recomendado por las normas ISO G= Valor Sospechoso X S (Con el valor sospechoso incluido)

Si Gcalculada > Gtabulada el valor sospechoso se rechaza

Gloria Mara Meja Z

45

TEST Q DE DATOS SOSPECHOSOS

Aceptar o rechazar un resultado anmalo (outlier) Normalmente se producen al 0011 0010 1010 1101 0001 0100 1011 cometer errores o fallos en la metodologa aplicada.
Se ordenan los datos en forma creciente y se calcula Q

Q = desvo = Diferencia entre el dato sospechosos y su vecino ms cercano recorrido Diferencia numrica entre el dato de mayor valor y el de menor valor

Si Qcalculada > Qtabulada el dato se rechaza

Gloria Mara Meja Z

45

Ejemplo:
0011 0010 1010 1101 0001 0100 1011

Al efectuar una serie de rplicas para determinar la concentracin del in sulfato en una muestra de agua para riego se obtuvieron los siguientes resultados. Determinar si la medida 6.0 es un valor rechazable.
Medida Valor 5. 5. 3 5.5 4 5.6 5 6. 1. Se ordenan los datos en orden de valor decreciente 6. , 5.6, 5.5, 5. , 5. 2. Se calcula Q Q= (6. -5.6)/ (6. -5. ) = .4

3. Se compara Q calculado con Q tabulado para 5 medidas y un nivel de confianza del 9 . Qtab= .64 .4 < .64, luego el valor 6. no es rechazable

Gloria Mara Meja Z

45

CONCLUSIONES
0011 0010 1010 1101 0001 0100 1011

La ASTM E178, Prctica para manejar observaciones de valores atpicos, contiene muchos procedimientos estadsticos para realizar pruebas de valores atpicos. En esta norma se proveen otros criterios para valores atpicos nicos, as como pruebas para valores atpicos mltiples, y la norma tambin da pautas para la eleccin de la prueba. Una referencia ms amplia para la prueba de valores atpicos es el libro Valores atpicos en datos estadsticos, publicado por Wiley. Otra referencia til y ms prctica es el Volumen 16 de la Sociedad Estadounidense de Calidad (ASQ) "Referencias bsicas para el control de calidad, tcnicas estadsticas" Cmo detectar y manejar valores atpicos", ASQC Quality Press. En la prctica E178 de ASTM se indican otras referencias.

Gloria Mara Meja Z

45