Análisis Descriptivo Inferencial

Comparación de muestras
La comparación de valores en dos o más subgrupos de una población total es
relativamente fácil, bastaría con comparar directamente los dos valores. El
mismo procedimiento se utilizaría si se tratase de proporciones o porcentajes
calculados.
La situación cambia cuando la comparación se hace con una muestra
probabilística. En tal caso el investigador debe realizar pruebas especiales que
permitan pronunciarse sobre la significación estadística que pueda tener la
diferencia encontrada entre los valores comparados.
Así si un grupo tiene una media de 24 en una variable y otro grupo una media
de 26 en la misma variable debemos preguntarnos si esa diferencia también
se da en la población de la cual extrajimos la muestra, o la diferencia podría
deberse al error de muestreo al cual están sometidas, probabilisticamente,
todas las muestras que se toman de una población o universo.
Para resolver problemas como el anterior se usan de pruebas de
significación estadística, que son propias para cada medida que se va a
comparar.
La secuencia del cálculo necesaria para su realización se expone a
continuación:
1º Formulación de una hipótesis nula y de una hipótesis alternativa. Como
lo sugiere su nombre, la hipótesis nula plantea que en la población de la cual
se extrajo la muestra no existe diferencia entre los valores de los subgrupos
que se desean comparar (proporción, media aritmética). Sin embargo, como el
investigador supone que existe una diferencia ( y pudo haberlo expresado así
en una de las hipótesis de su estudio), formula una hipótesis alternativa que
exprese que existe tal diferencia, que la misma es estadísticamente
significativa, y que ella se da en la población de la cual se extrajo la muestra.
2º Elección de una distribución de muestreo.
La mayoría de las medidas estadísticas utilizadas en el análisis de datos
cuantitativos tienen distribuciones de probabilidad conocidas, como también
algunas de ellas tienen ese tipo de distribuciones para diferencias entre dos
medidas.
En cada caso, esas distribuciones indican la probabilidad de que un cierto valor
encontrado en una muestra se pueda dar en su correspondiente población, o la
probabilidad de que una diferencia de una cierta magnitud pueda darse entre
subgrupos tomados muestralmente de una misma población
Digamos que si se toman muchas muestras y en cada una de ellas se calcula
una misma proporción (como podría ser el caso de personas que están de
acuerdo con el control de la natalidad), entonces, el total de las proporciones
de esas muestras se distribuye en la forma de la curva normal.

la distribución F.5% son menores.que también tienen otras distribuciones muestrales. que la verdadera media aritmética de la población. 2. Elección de un nivel de significación. es del 0. Algunas de ellas lo hacen según la distribución t de Student.en ambos o en uno u otro lado de la curva normal. Cuando el investigador realizar una de estas pruebas se pregunta. ¿Cual es la probabilidad de que un valor como el encontrado en mi estudio se dé al azar? Frente a esta pregunta hace una elección que define el riesgo probabilístico que tiene el aceptar su resultado.sabemos que un 5% de todas las proporciones. probabilisticamente.96 95 2. Es decir. o la Chi cuadrado… 3.05. Los siguientes valores de z definen áreas de la curva normal que comprenden proporciones o porcentajes de casos – valores de muestras. como la que corresponde a la diferencia entre proporciones . quedan más allá de 1.96 z. No todas las medidas de las muestras de una población se distribuyen según la curva normal.96 unidades z. existe una probabilidad del 0. la probabilidad de encontrar en una muestra una proporción cuyo valor z sea superior o inferior a 1. convertidas en puntuaciones Z.55 99 Casos en los extremos El 10% restante queda en los dos extremos o zona de rechazo El 5% restante queda en los dos extremos o zona de rechazo El 1% restante queda en los dos extremos o zona de rechazo . De acuerdo con lo expuesto anteriormente las pruebas de significación estadística se basan en la teoría de las probabilidades. En otras palabras. por ejemplo.Por esta propiedad de la distribución de frecuencias .64 % 90 1.95 (o un nivel de confianza del 95%) que la proporción encontrada se aleje menos de 1. al error de muestreo.96 z de la media de la distribución. a partir de la media aritmética: a) % de casos a ambos lados del área de la curva a partir de la media aritmética Z 1. que ese valor transformado a valores z o (T o F según la estadística apropiada) puede darse al azar en un 5% de las veces.5% son mayores y 2. Podrá decir. Dicho en forma aproximada. que la diferencia encontrada sea la que corresponda. Tal porcentaje recibe el nombre de nivel de significación que convencionalmente se designa con la letra alpha.

o f. o T. Respecto al nivel de significación. se acepta en términos probabilísticos.5.Las terminaciones de la curva normal se denominan colas de la distribución. ¿Podríamos afirmar que existen diferencias significativas entre dichos promedios? . no sometidos al programa de estimulación temprana la diferencia entre sus mediciones antes y después es de 6 puntos con una desviación de 5. Si el valor encontrado es menor que el de la tabla se acepta la hipótesis nula. en otras palabras no existe significación estadística entre los grupos comparados. Los valores de z.64 significa que la probabilidad de darse al azar en las muestras de un universo es menor de 5%. 4º Cálculo del estadístico de la prueba. en términos probabilísticas. Calcular el valor de z. con una desviación estándar de 6. Si no existe esa base se utiliza una prueba de significación de dos colas. Ese valor calculado.90. o x2>x1. decide la aceptación o no de la hipótesis nula. Cuando el valor calculado es mayor que el de la tabla se rechaza la hipótesis nula y se acepta la hipótesis alternativa. . queremos recordar que un valor de z igual o inferior a 1. un aumento de 7. que la encontrada en el estudio. con lo que se comete un error de tipo I.5 puntos en su promedio del nivel de desarrollo psicomotor. A su vez en un grupo de control equivalente de otros 25 niños. En casos como este se utiliza una prueba de significación de una cola. es decir aceptar la hipótesis nula cuando existe diferencia entre los grupos comparados. lo cual quiere decir que la diferencia en el universo podría se mayor o menor. existe el riesgo de rechazar la hipótesis nula cuando es correcta. un valor superior a 1.. t. Es decir. pues el valor encontrado puede darse al azar más veces de lo que nos lo permite el nivel de significación. Pero al hacer eso se corre el riesgo de cometer un error de tipo II. entonces las hipótesis alternativa se plantea como x1>x2. Comparación de dos medias En un grupo de 25 niños de 3 años de edad sometidos a un procedimiento de estimulación temprana. Como se trabaja en base a probabilidades.64 unidades z puede darse al azar un 5%. Este error se reduce cuando se baja el nivel de significación. Cuando tenemos base para suponer que una de las medidas de las muestras por comparar es mayor o menor que la otra. 5º Aceptación o rechazo de la hipótesis nula. que existe una diferencia estadísticamente significativa. se encuentra después de cierto grado de aplicación. a la inversa. o F que puedan encontrarse en los cálculos anteriores se comparan con valores que están en tablas de los textos de estadística con las correspondientes o con probabilidades para el nivel de significación elegido por el investigador.

o sea. Si se aceptase la hipótesis nula podríamos afirmar no existe diferencia entre los dos subgrupos de diferente nivel de escolaridad en la percepción de la situación económica del futuro. existe diferencia con los márgenes de error de muestreo del caso. Si es menor cae en la zona de aceptación de la hipótesis nula. si es mayor que 1. Si la T obtenida es mayor que t la de la tabla se rechaza la hipótesis nula de no diferencias(o el nivel de probabilidad obtenido por el programa informático menor que el nivel de significatividad elegido por el investigador) Comparación de dos proporciones Supongamos que en una investigación realizada en una comunidad. de la cual se ha tomado una muestra probabilísica. El análisis de varianza simple con una sola variable de clasificación permite comparar tres o más medias aritméticas de submuestras definidas por una variable independiente elegida por el investigador.96.96 en la de rechazo de la hipótesis nula.Pasos a seguir: a) Proponer las hipótesis nula y alternativa b) Obtener el estadístico T que es el estadístico que compara medias en poblaciones pequeñas independiente menores de 30 casos c) Se compara el valor T obtenido con el T de la tabla o se comparan las probabilidades obtenidas por el programa estadístico correspondientes. Los pasos son parecidos a los anteriores: a) Formulación de la hipótesis nula y una hipótesis alternativa b) Elección de la distribución F . ¿Es la diferencia entre ambos porcentajes estadísticamente significativa. en la comunidad de la cual se tomo la muestra? Pasos a seguir a) Se plantea la hipótesis nula de no diferencias en las muestras y la alternativa b) Se elige el nivel de significación en este caso un 0. Los supuestos de esta prueba son parecidos a los exigidos por la prueba t: nivel de intervalos. Comparaciones Múltiples Comparación de más de 2 medias En el caso de que las comparaciones de las medias sean múltiples hay que realizar una prueba denominada análisis de varianza.05 ( 5%) c) Se determina la diferencia encontrada entre las proporciones d) Se contrasta el valor de z encontrado con 1. Por otro lado el 47% de otro grupo de la misma muestra de 120 personas de bajo nivel de escolaridad opina en el mismo sentido que el otro grupo. muestras probabilísticas independientes e igualdad de varianzas. el 56% de un grupo de 150 personas con alto nivel de escolaridad dice que su situación económica será mejor en los próximos años.

. exposición y discusión. Al final del curso se comprueban los rendimientos medios con una misma prueba. Se desea hacer un experimento para comprobar el efecto de 3 métodos de enseñanzas en el rendimiento de una cierta asignatura. se calculara F y en función de su valor se aceptara o rechazara la hipótesis nula. (Menor de 0. Como se trata de más de 2 medias hay que realizar un análisis de varianza.como en los casos anteriores. Para ello toma tres grupos independientes de estudiantes y los somete a tres métodos de lectura: individual.c) Elección del nivel de significación (5%) d) Calculo de la estadística F e) Comparación con el nivel estadístico teórico o con el nivel de probabilidad Ejemplo.05 para rechazar la hipótesis nula). con el valor teórico de las tablas o si se utiliza el programa SPSS con el nivel de probabilidad obtenido. Comparación de más de dos proporciones La forma mas simple para determinar si existe asociación entre varios porcentajes es calcular el estadístico Chi cuadrado y comparar éste .