You are on page 1of 8

Actividad SEMANA 5 Utilizar un proceso estadstico en el anlisis inferencial de datos, aplicando los principios ticos en todas las fases

del mtodo estadstico.

Como la Estadstica trabaja con nmeros, el procedimiento que utiliza es: a partir de unos datos numricos, obtener resultados mediante determinadas reglas y operaciones. Este procedimiento se denomina mtodo estadstico y comprende los siguientes pasos: Recuento, relevamiento o compilacin datos. Tabulacin y agrupamiento de datos. Representacin grfica. Medicin de datos. Inferencia estadstica. Prediccin. Una vez recopilados, ordenados y tabulados, los datos son analizados y procesados. A continuacin analizamos las etapas del proceso mediante el cual se puede llega al enunciado de conclusiones por el camino de la inferencia estadstica. 1. Recuento, relevamiento o recopilacin de datos. La etapa inicial consiste en la recoleccin de datos referidos a la situacin que se desea investigar. Estos datos brindan informacin sobre las caractersticas de los individuos pertenecientes a la poblacin objeto de estudio. 2. Tabulacin y agrupamiento de datos. Grficos. Los datos recopilados son convenientemente ordenados, clasificados y tabulados, es decir, dispuestos en tablas que facilitan la lectura. Los grficos permiten una interpretacin simple y rpida de los hechos y adems, pueden conducir a la eleccin de los mtodos ms adecuados para el anlisis de los datos. 3. Medicin de datos. En esta etapa, comienza la elaboracin matemtica y medicin de los datos. Se observa que los datos tienden a centrarse en torno de ciertos valores llamados parmetros o medidas de posicin (promedio, mediana, modo). Luego se analiza la dispersin de los datos con respecto a esos valores centrales, se definen entonces los parmetros o medidas de dispersin (desvos, desviacin estndar). 4. Inferencia estadstica. Prediccin. Despus de la medicin de datos, la Teora de la Probabilidad acude en ayuda de la Estadstica. Se deducen las leyes de inferencia que permiten predecir el comportamiento futuro de la poblacin investigada. En funcin de esa prediccin, los gobiernos estn en condiciones de

tomar medidas de prevencin cuando los resultados lo aconsejen. De esta manera, la Estadstica contribuye al mejoramiento del estado de una poblacin

EJEMPLO

Anlisis Descriptivo Inferencial

Comparacin de muestras

La comparacin de valores en dos o ms subgrupos de una poblacin total es relativamente fcil, bastara con comparar directamente los dos valores. El mismo procedimiento se utilizara si se tratase de proporciones o porcentajes calculados.

La situacin cambia cuando la comparacin se hace con una muestra probabilstica. En tal caso el investigador debe realizar pruebas especiales que permitan pronunciarse sobre la significacin estadstica que pueda tener la diferencia encontrada entre los valores comparados.

As si un grupo tiene una media de 24 en una variable y otro grupo una media de 26 en la misma variable debemos preguntarnos si esa diferencia tambin se da en la poblacin de la cual extrajimos la muestra, o la diferencia podra deberse al error de muestreo al cual estn sometidas, probabilisticamente, todas las muestras que se toman de una poblacin o universo.

Para resolver problemas como el anterior se usan de pruebas de significacin estadstica, que son propias para cada medida que se va a comparar.

La secuencia del clculo necesaria para su realizacin se expone a continuacin:

1 Formulacin de una hiptesis nula y de una hiptesis alternativa. Como lo sugiere su nombre, la hiptesis nula plantea que en la poblacin de la cual se extrajo la muestra no existe diferencia entre los valores de los subgrupos que se desean comparar (proporcin, media aritmtica). Sin embargo, como el investigador supone que existe una diferencia ( y pudo haberlo expresado as en una de las hiptesis de su estudio), formula una hiptesis alternativa que exprese que existe tal diferencia, que la misma es estadsticamente significativa, y que ella se da en la poblacin de la cual se extrajo la muestra.

2 Eleccin de una distribucin de muestreo. La mayora de las medidas estadsticas utilizadas en el anlisis de datos cuantitativos tienen distribuciones de probabilidad conocidas, como tambin algunas de ellas tienen ese tipo de distribuciones para diferencias entre dos medidas. En cada caso, esas distribuciones indican la probabilidad de que un cierto valor encontrado en una muestra se pueda dar en su correspondiente poblacin, o la probabilidad de que una diferencia de una cierta magnitud pueda darse entre subgrupos tomados muestralmente de una misma poblacin

Digamos que si se toman muchas muestras y en cada una de ellas se calcula una misma proporcin (como podra ser el caso de personas que estn de acuerdo con el control de la natalidad), entonces, el total de las proporciones de esas muestras se distribuye en la forma de la curva normal. Por esta propiedad de la distribucin de frecuencias - que tambin tienen otras distribuciones muestrales, como la que corresponde a la diferencia entre proporciones - sabemos que un 5% de todas las proporciones, convertidas en puntuaciones Z, quedan ms all de 1,96 unidades z; 2,5% son mayores y 2,5% son menores.

Es decir, la probabilidad de encontrar en una muestra una proporcin cuyo valor z sea superior o inferior a 1,96 z, es del 0,05.

En otras palabras, existe una probabilidad del 0,95 (o un nivel de confianza del 95%) que la proporcin encontrada se aleje menos de 1,96 z de la media de la distribucin, que la verdadera media aritmtica de la poblacin. Dicho en forma aproximada, que la diferencia encontrada sea la que corresponda, probabilisticamente, al error de muestreo.

No todas las medidas de las muestras de una poblacin se distribuyen segn la curva normal. Algunas de ellas lo hacen segn la distribucin t de Student, la distribucin F, o la Chi cuadrado

3. Eleccin de un nivel de significacin. De acuerdo con lo expuesto anteriormente las pruebas de significacin estadstica se basan en la teora de las probabilidades. Cuando el investigador realizar una de estas pruebas se pregunta. Cual es la probabilidad de que un valor como el encontrado en mi estudio se d al azar? Frente a esta pregunta hace una eleccin que define el riesgo probabilstico que tiene el aceptar su resultado. Podr decir, por ejemplo, que ese valor transformado a valores z o (T o F segn la estadstica apropiada) puede darse al azar en un 5% de las veces. Tal porcentaje recibe el nombre de nivel de significacin que convencionalmente se designa con la letra alpha.

Los siguientes valores de z definen reas de la curva normal que comprenden proporciones o porcentajes de casos valores de muestras- en ambos o en uno u otro lado de la curva normal, a partir de la media aritmtica:

a) % de casos a ambos lados del rea de la curva a partir de la media aritmtica

Z 1,64

% 90

Casos en los extremos El 10% restante queda en los dos extremos o zona de rechazo El 5% restante queda en

1,96

95

los dos extremos o zona de rechazo 2,55 99 El 1% restante queda en los dos extremos o zona de rechazo

Las terminaciones de la curva normal se denominan colas de la distribucin. Cuando tenemos base para suponer que una de las medidas de las muestras por comparar es mayor o menor que la otra, entonces las hiptesis alternativa se plantea como x1>x2; o x2>x1. En casos como este se utiliza una prueba de significacin de una cola. Si no existe esa base se utiliza una prueba de significacin de dos colas. , lo cual quiere decir que la diferencia en el universo podra se mayor o menor, en trminos probabilsticas, que la encontrada en el estudio.

Respecto al nivel de significacin, queremos recordar que un valor de z igual o inferior a 1,64 unidades z puede darse al azar un 5%, a la inversa, un valor superior a 1,64 significa que la probabilidad de darse al azar en las muestras de un universo es menor de 5%.

Ese valor calculado, decide la aceptacin o no de la hiptesis nula. Como se trabaja en base a probabilidades, existe el riesgo de rechazar la hiptesis nula cuando es correcta, con lo que se comete un error de tipo I. Este error se reduce cuando se baja el nivel de significacin. Pero al hacer eso se corre el riesgo de cometer un error de tipo II, es decir aceptar la hiptesis nula cuando existe diferencia entre los grupos comparados.

4 Clculo del estadstico de la prueba. Calcular el valor de z, o T, o f.

5 Aceptacin o rechazo de la hiptesis nula. Los valores de z, t, o F que puedan encontrarse en los clculos anteriores se comparan con valores que estn en tablas de los textos de estadstica con las correspondientes o con probabilidades para el nivel de significacin elegido por el investigador. Cuando el valor calculado es mayor que el de la tabla se rechaza la hiptesis nula y se acepta la hiptesis alternativa. Es decir, se acepta en trminos probabilsticos, que existe una diferencia estadsticamente significativa. Si el valor encontrado es menor que el de la tabla se acepta la hiptesis nula, pues el valor encontrado puede darse al azar ms veces de lo que nos lo permite el nivel de significacin., en otras palabras no existe significacin estadstica entre los grupos comparados.

Comparacin de dos medias En un grupo de 25 nios de 3 aos de edad sometidos a un procedimiento de estimulacin temprana, se encuentra despus de cierto grado de aplicacin, un aumento de 7,5 puntos en su promedio del nivel de desarrollo psicomotor, con una desviacin estndar de 6,5. A su vez en un grupo de control equivalente de otros 25 nios, no sometidos al programa de estimulacin temprana la diferencia entre sus mediciones antes y despus es de 6 puntos con una desviacin de 5,90. Podramos afirmar que existen diferencias significativas entre dichos promedios?

Pasos a seguir:

a) Proponer las hiptesis nula y alternativa b) Obtener el estadstico T que es el estadstico que compara medias en poblaciones pequeas independiente menores de 30 casos c) Se compara el valor T obtenido con el T de la tabla o se comparan las probabilidades obtenidas por el programa estadstico correspondientes.

Si la T obtenida es mayor que t la de la tabla se rechaza la hiptesis nula de no diferencias(o el nivel de probabilidad obtenido por el programa informtico menor que el nivel de significatividad elegido por el investigador)

Comparacin de dos proporciones

Supongamos que en una investigacin realizada en una comunidad, de la cual se ha tomado una muestra probabilsica, el 56% de un grupo de 150 personas con alto nivel de escolaridad dice que su situacin econmica ser mejor en los prximos aos. Por otro lado el 47% de otro grupo de la misma muestra de 120 personas de bajo nivel de escolaridad opina en el mismo sentido que el otro grupo. Es la diferencia entre ambos porcentajes estadsticamente significativa, o sea, existe diferencia con los mrgenes de error de muestreo del caso, en la comunidad de la cual se tomo la muestra?

Pasos a seguir a) Se plantea la hiptesis nula de no diferencias en las muestras y la alternativa b) Se elige el nivel de significacin en este caso un 0,05 ( 5%) c) Se determina la diferencia encontrada entre las proporciones d) Se contrasta el valor de z encontrado con 1,96. Si es menor cae en la zona de aceptacin de la hiptesis nula, si es mayor que 1,96 en la de rechazo de la hiptesis nula. Si se aceptase la hiptesis nula podramos afirmar no existe diferencia entre los dos subgrupos de diferente nivel de escolaridad en la percepcin de la situacin econmica del futuro.

Comparaciones Mltiples Comparacin de ms de 2 medias En el caso de que las comparaciones de las medias sean mltiples hay que realizar una prueba denominada anlisis de varianza. El anlisis de varianza

simple con una sola variable de clasificacin permite comparar tres o ms medias aritmticas de submuestras definidas por una variable independiente elegida por el investigador. Los supuestos de esta prueba son parecidos a los exigidos por la prueba t: nivel de intervalos, muestras probabilsticas independientes e igualdad de varianzas. Los pasos son parecidos a los anteriores: a) b) c) d) e) Formulacin de la hiptesis nula y una hiptesis alternativa Eleccin de la distribucin F Eleccin del nivel de significacin (5%) Calculo de la estadstica F Comparacin con el nivel estadstico terico o con el nivel de probabilidad

Ejemplo. Se desea hacer un experimento para comprobar el efecto de 3 mtodos de enseanzas en el rendimiento de una cierta asignatura. Para ello toma tres grupos independientes de estudiantes y los somete a tres mtodos de lectura: individual, exposicin y discusin. Al final del curso se comprueban los rendimientos medios con una misma prueba. Como se trata de ms de 2 medias hay que realizar un anlisis de varianza, se calculara F y en funcin de su valor se aceptara o rechazara la hiptesis nula.

Comparacin de ms de dos proporciones

La forma mas simple para determinar si existe asociacin entre varios porcentajes es calcular el estadstico Chi cuadrado y comparar ste ,como en los casos anteriores, con el valor terico de las tablas o si se utiliza el programa SPSS con el nivel de probabilidad obtenido. (Menor de 0,05 para rechazar la hiptesis nula).