INSTITUTO TECNOLÓGICO DE REYNOSA

SOFTWARE ESTADÍSTICO
EQUIPO NO. 10

DOCENTE: ING. ANA MARITZA RAMÍREZ GOVEA. MATERIA: ESTADÍSTICA INFERENCIAL ITURNO: MATUTINO. CARRERA: INGENIERÍA INDUSTRIAL. 3° SEMESTRE INTEGRANTES DEL EQUIPO:      GARCÍA SÁNCHEZ MARIO ALBERTO LOMBARD MONTERO WENDY MARICRUZ RODRÍGUEZ OLVERA KARLA ABIGAIL TORRES DE LA ROSA SANDRA NOHEMÍ ZERMEÑO GONZÁLEZ KARLA YESENIA

A: 28.NOV.2011 CD. REYNOSA, TAMPS.

PRUEBAS NO PARAMÉTRICAS
Se estudiarán las pruebas NO PARAMÉTRICAS, las cuales no requieren asumir

normalidad de la población y que en su mayoría se basan en el ordenamiento de los datos. Todas las pruebas vistas en este capítulo requieren que la población sea continua. El parámetro que se usa para hacer las pruebas estadísticas es la Mediana y no la Media. En MINITAB, para las pruebas no paramétricas se elige la secuencia: → Abrir programa. → Estadísticas. → No Paramétricos.

2

6. PRUEBA DE KOLMOGOROV-SMIRNOV (KS)
En estadística, la prueba de Kolmogórov-Smirnov (también prueba K-S) es una prueba no paramétrica que se utiliza para determinar la bondad de ajuste de dos distribuciones de probabilidad entre sí. Conviene tener en cuenta que la prueba Kolmogórov-Smirnov es más sensible a los valores cercanos a la mediana que a los extremos de la distribución. La prueba de AndersonDarling proporciona igual sensibilidad con valores extremos. En esta prueba también se está interesado en el grado de concordancia entre la distribución de frecuencia muestral y la distribución de frecuencia teórica, bajo la hipótesis nula de que la distribución de la muestra es f0(x,q) e interesa probar que no existe diferencia significativa. La prueba trabaja con la función de distribución (distribución de frecuencia acumulativa). Esta prueba pertenece al campo de la Estadística No Paramétrica. Sea F0(x) la función de distribución teórica para la variable aleatoria X, y representa la probabilidad de que la variable aleatoria X tome un valor menor o igual a x (también se interpreta como la proporción esperada de observaciones que tengan un valor menor o igual a x). Es decir: Sea Sn (x) la función de distribución empírica, calculada con base en los valores observados de la muestra n observaciones. Sn (x) representa la proporción de valores observados que son menores o iguales a x, y está definida como: Sn (x) = P ( X £ x/ dados los resultados muestrales) = m/n donde m es el número de valores observados que son menores o iguales a x.

3

PASOS A SEGUIR EN MINITAB:
1.-Generaremos 100 datos aleatorios con una Media= 264.6 y una Desviación Estándar de 32.02, de la siguiente manera: → Calc → Datos Aleatorios → Normal → Damos doble clic.

→ Rellenamos la pantalla con los datos que nos proporcionaron en el problema, como se observa en la imagen, y damos un clic más en aceptar.

→ Aparecerán 100 datos en la columna [Distribución Normal].

C1

Nos aseguramos que los datos se distribuyan normalmente con la prueba de KolmogorovSmirnov como sigue. → Estadísticas → Estadísticas Básicas → Prueba de Normalidad → Rellenamos los datos que nos piden: en variable seleccionamos C1 y ahí en donde dice prueba de normalidad seleccionamos Kolmogorov-Smirnov. → Presionamos Aceptar.

4

→ De ahí les aparecerá el grafico donde se observa la distribución de los datos.

El VALOR P > 0.05 para que los datos se distribuyan normalmente. Y como se puede observar en el grafico el Valor P > 0.100, lo que nos indica que los datos si se distribuyen normalmente y por lo tanto Aceptamos H₀ y rechazamos H₁.

5

PRUEBA DE ANDERSON-DARLIN
La prueba Anderson-Darling es, en general, más potente que la pruebas X2 de Pearson y la de Kolmogorov-Smirnov . Resulta lógico pensar que la X2 de Pearson es menos potente que la de Kolmogorov-Smirnov y la de Anderson- Darling debido a que trabaja con datos agrupados debido al agrupamiento. Hay pérdida de información. Por otro lado, la prueba KolmogorovSmirnov es menos sensible a desajustes que pudieran haber en las colas de la distribución, que la prueba Anderson- Darling (Easterling 1976; Stephens 1974, Cap 4). En particular, la prueba Anderson- Darling funciona mejor que cualquiera otra, cuando haya casos extraordinarios o aberrantes (outliers). La estadística Anderson-Darling está dada por la siguiente expresión: A 2 =-n- (1/n)Σ[(2i - 1) Ln(P ( i ) ) + (2n +1 - 2i)Ln{1 - p ( i ) }] Donde P(i) es el área bajo la curva normal para el intervalo (-oo,z( i ) ), o sea es la función distribución normal estándar evaluada en el i-ésimo elemento (en orden ascendente) de la muestra. Se presentan dos situaciones para la estadística Anderson-Darling: la primera en que se conocen los parámetros de la distribución llamado caso 0 (cero), y la otra en que se desconoce al menos uno de ellos (casos 1, 2 y 3). Situándonos en el caso de bondad de ajuste a la distribución normal se consideran los siguientes casos: Caso 0: µ y s2 conocidos. Caso 1: s2 conocida y µ desconocida y estimada por X. Caso 2: µ conocida y s2 desconocida y estimada por s(n) = Σ (x i - µ)2 /n Caso 3: ambos desconocidos, estimados por X y sn-1 = Σ (x i- x)2 /n-1 Para cada uno de los casos existe una tabla estadística para realizar la prueba de la hipótesis, Ho: "La muestra aleatoria proviene de una distribución normal". La estadística de Anderson-Darling se calcula para los cuatro casos de la misma manera; sin embargo, en el caso 3 se debe multiplicar por un factor de corrección el cual es: 1 + (0.75/n) + (2.25/n 2), que mejora la aproximación. La prueba Anderson-Darling para la bondad de ajuste normal, en el caso 0, se realiza siguiendo los siguientes pasos:

6

Supongamos que tenemos 40 pesos en libras de estudiantes varones. ¿Provienen estos datos d una distribución normal? 154 136 144 163 147 135 128 145 164 148 126 138 145 165 149 138 147 176 168 150 132 140 156 173 150 135 152 157 146 142 125 142 158 146 119 135 144 161 140 153

Ho: Los datos se ajustan a un modelo normal. Ha: Los datos no se ajustan a un modelo normal. PASOS A SEGUIR EN MINITAB: → Introducimos los 40 datos de los pesos en C1. → Estadísticas.

→ Estadísticas Básicas. → Mostrar Estadísticas descriptivas. → Aparecen estadísticas. → Estadísticas Básicas. → Prueba de Normalidad.

7

→ Rellenamos datos y seleccionamos la prueba de Anderson-Darling. → De ahí nos aparece el gráfico.

El VALOR P > 0.05 para que los datos se distribuyan normalmente. Y como se puede observar en el grafico el Valor P = 0.926, lo que nos indica que los datos si se distribuyen normalmente y por lo tanto Aceptamos H₀ y rechazamos H₁.

8

PRUEBA DE RYAN-JOINER
La prueba de Ryan - Joiner es usada para probar si una muestra viene de una distribución especifica. Esta prueba es una modificación de la prueba de Kolmogorov-Smirnov donde se le da más peso a las colas de la distribución que la prueba de Kolmogorov-Smirnov . En estadística, la prueba de Ryan - Joiner es una prueba no paramétrica sobre si los datos de una muestra provienen de una distribución específica. La fórmula para el estadístico determina si los datos (observar que los datos se deben ordenar) vienen de una distribución con función acumulativa F. Formulas: A2 = − N − S Donde:

El estadístico de la prueba se puede entonces comparar contra las distribuciones del estadístico de prueba (dependiendo que F se utiliza) para determinar el P-valor.

9

Ejemplo: En el método de Anderson Darling o Ryan Joiner, si el valor de probabilidad P de la prueba es mayor a 0.05, se considera que los datos son normales. Seguir los siguientes pasos: H₀= Los datos tienen una distribución normal H₁= Los datos NO tienen una distribución normal PASOS A SEGUIR EN MINITAB: 1.-Generaremos 100 datos aleatorios con una Media= 264.6 y una Desviación Estándar de 32.02, de la siguiente manera: → Calc. → Datos Aleatorios → Normal → Damos doble clic.

→ Rellenamos la pantalla con los datos que nos proporcionaron en el problema, como se observa en la imagen, y damos un clic más en aceptar.

10

→ Aparecerán 100 datos en la columna C1 [Distribución Normal].

Nos aseguramos que los datos se distribuyan normalmente con la prueba de Ryan-Joiner como sigue. → Estadísticas → Estadísticas Básicas → Prueba de Normalidad → Rellenamos los datos que nos piden: en variable seleccionamos C1 y ahí en donde dice prueba de normalidad seleccionamos Ryan-Joiner. → Presionamos Aceptar. → De ahí les aparecerá el grafico donde se observa la distribución de los datos.

11

Como el de la siguiente imagen:

El VALOR P > 0.05 para que los datos se distribuyan normalmente. Y como se puede observar en el grafico el Valor P > 0.100, lo que nos indica que los datos si se distribuyen normalmente y por lo tanto Aceptamos H₀ y rechazamos H₁.

Otra opción por medio de una gráfica de probabilidad normal, se tiene: → Gráfica. → Gráfica de Probabilidad. → Individual. Clic Aceptar. → Aparece Gráfica de Probabilidad.

12

→ En la variable seleccionan C1, y luego distribución dan clic en distribución normal. Luego Aceptar. →Los puntos deben quedar dentro del intervalo de confianza para indicar que es normal la distribución.

13

PRUEBA DE SHAPPIRO-WILK
En estadística, el Test de Shapiro–Wilk, se usa para contrastar la normalidad de un conjunto de datos. Se plantea como hipótesis nula que una muestra x1…xn proviene de una población normalmente distribuida. Fue publicado en 1965 por Samuel Shapiro y Martin Wilk. Se considera uno de los test más potentes para el contraste de normalidad, sobre todo para muestras pequeñas. El estadístico del test es:

Donde
  

x(i) (con el subíndice i entre paréntesis) es el número que ocupa la i-ésima posición en la muestra; = (x1 + ... + xn) / n es la media muestral; las constantes ai se calculan2

Donde

Siendo m1...mn son los valores medios del estadístico ordenado, de variables aleatorias independientes e idénticamente distribuidas, muestreadas de distribuciones normales. V es la matriz de covarianzas de ese estadístico de orden. La hipótesis nula se rechazará si W es demasiado pequeño. Es un contraste de ajuste que se utiliza para comprobar si unos datos determinados (X 1, X2,…, Xn) han sido extraídos de una población normal. Los parámetros de la distribución no tienen porqué ser conocidos y está adecuado para muestras pequeñas (n<50).Un contraste de ajuste tiene como objetivo comprobar si con base en la información suministrada por una muestra se puede aceptar que la población de origen sigue una determinada distribución de probabilidad, en nuestro caso, la distribución normal

14

PASOS A SEGUIR EN MINITAB: 1.-Generaremos 25 datos aleatorios con una Media= 152.05 y una Desviación Estándar de 48.09, de la siguiente manera: → Calc → Datos Aleatorios → Normal → Damos doble clic.

→ Rellenamos la pantalla con los datos que nos proporcionaron en el problema, como se observa en la imagen, y damos un clic más en aceptar. → Aparecerán 25 datos en la columna C1. → Realizaremos la prueba de Wilcoxon para 1 muestra. → Estadísticas. → No paramétricas. → Wilcoxon de 1 muestra.

→ Rellenamos los datos que nos piden: en variable seleccionamos C1 y ahí en donde dice media de la prueba rellenamos con 152 y damos clic en aceptar. → Nos aparece otra ventana

15

→ Gráfica. →Gráfica de Probabilidad. → Individual. Con distribución normal. → Y aparece el gráfico.

Mide el ajuste de la muestra a una recta, al dibujarla en papel probabilístico normal. Este tipo de representación también lo proporcionan algunos programas de estadística, de tal manera que nos permite además apreciar el ajuste o desajuste de forma visual: En escala probabilística normal se representa en el eje horizontal, para cada valor observado en nuestros datos, la función de distribución o probabilidad acumulada observada, y en el eje vertical la prevista por el modelo de distribución normal. Si el ajuste es bueno, los puntos se deben distribuir aproximadamente según una recta a 45º. En la imagen vemos que en este ejemplo existe cierta discrepancia. En cualquier caso siempre es adecuado efectuar una representación gráfica de tipo histograma de los datos, y comparar el valor de la media y la mediana, así como evaluar el coeficiente de asimetría y apuntamiento, además de llevar a cabo una representación en escala probabilística de la distribución de probabilidad esperada versus observada, como la de la figura.

16

Sign up to vote on this title
UsefulNot useful