You are on page 1of 7

Prueba t de Student.

Se utiliza para determinar si hay una diferencia significativa entre las medias de dos grupos, es decir que se utiliza cuando deseamos comparar dos medias. Se utiliza para la comparacin de dos medias de poblaciones independientes y normales. Asumimos que las variables dependientes tienen una distribucin normal. Especificamos el nivel de la probabilidad (nivel de la alfa, nivel de la significacin, p) que estamos dispuestos a aceptar (p < .05 es un valor comn que se utiliza).

Con una prueba t, tenemos una variable independiente y una dependiente. La variable independiente (por ejemplo sexo) solo puede tener dos niveles (hombre y mujer). Si la independiente tuviera ms de dos niveles, despus utilizaramos un anlisis de la variacin unidireccional (ANOVA). La prueba estadstica para t de Student es el valor t. Conceptualmente, la tvalor representa el nmero de unidades estndares que estn separando las medias de los dos grupos. Si nuestra t-prueba produce una t-valor que da lugar a una probabilidad de .01, decimos que la probabilidad de conseguir la diferencia que encontramos sera por casualidad de 1 de cada 100 veces.

Cuatro factores contribuyen para indicar si la diferencia entre dos medias de los grupos se puede considerar significativa: Cuanto mayor es la diferencia entre las dos medias, mayor es la probabilidad que una diferencia estadstica significativa existe. El tamao de la muestra es extremadamente importante en la determinacin de la significacin de la diferencia entre las medias. Aumentando el tamao de la muestra, las medias tienden a ser ms estables y ms representativas. Un nivel ms grande de la alfa requiere menos diferencia entre las medias (p <0 font="font">.05). Se debe utilizar una hiptesis (con dos colas) no directivas.

Asunciones subyacentes la prueba de t:

Las muestras se han dibujado aleatoriamente a partir de sus poblaciones respectivas. La poblacin se debe distribuir normalmente. Unimodal (un modo). Simtrico (las mitades izquierdas y derechas son imgenes espejo), el mismo nmero de gente arriba o abajo de la media.

Acampanado (altura mxima (moda) en el medio). Media, moda, y mediana se localizan en el centro. Asinttico (cuanto ms lejos se aleja la curva de la media, ms cercana ser el eje de X; pero la curva nunca debe tocar el eje de X). El nmero de personas en las poblaciones debe tener la misma varianza (s2 = s2).Si no es el caso se utiliza otro clculo para el error estndar. Existen 2 tipos de prueba t de Student

Test t para diferencia par ( grupos dependientes, test t correlacionado) : df= n (nmero de pares) -1

Esto se refiere a la diferencia entre las cuentas medias de una sola muestra de individuos que se determina antes del tratamiento y despus del tratamiento. Puede tambin comparar las cuentas medias de muestras de individuos que se aparean de cierta manera (por ejemplo los hermanos, madres, hijas, las personas que se emparejan en trminos de las caractersticas particulares).

Test t para muestras independientes Esto se refiere a la diferencia entre los promedios de dos poblaciones. Bsicamente, el procedimiento compara los promedios de dos muestras que fueron seleccionadas independientemente una de la otra. Un ejemplo sera comparar cuentas matemticas de un grupo experimental con un grupo de control.

Cmo decido qu tipo de t-prueba a utilizar? Error tipo I:

Rechaza una hiptesis nula que sea realmente verdad. La probabilidad de hacer un error tipo I depende del nivel alfa que se seleccion. Si se fij la probabilidad alfa en p < 05, entonces existe un 5% de posibilidades de hacer un error de tipo I. Se puede reducir la posibilidad de hacer un error tipo I fijando un nivel alfa ms pequeo (p < .01). El problema haciendo esto es que se aumenta la posibilidad de un error tipo II.

Error tipo II:

Falla en rechazar una hiptesis nula que sea falsa. La idea bsica para calcular una prueba de Student es encontrar la diferencia entre las medias de los dos grupos y dividirla por el error estndar (de la diferencia), es decir la desviacin de estndar de la distribucin de las diferencias. Un intervalo de confianza para una prueba t con dos colas es calculado multiplicando los valores crticos por el error de estndar y agregando y restando eso de la diferencia de las dos medias. El efecto tamao se utiliza para calcular la diferencia prctica. Si existen varios miles de pacientes, es muy fcil encontrar una diferencia estadsticamente significativa Saber si esa diferencia es prctica o significativa es otra pregunta. Con los estudios implicando diferencias de grupo, el tamao del efecto es la diferencia de las dos medias dividido por la desviacin estndar del grupo control (o la desviacin estndar media de ambos grupos si no hay grupo de control). Generalmente, el tamao del efecto es solamente importante si existe una significacin estadstica. Un efecto tamao de 2 se considera pequeo, 5 se considera medio, y 8 se considera grande.

Anlisis factorial El anlisis factorial intenta identificar variables subyacentes, o factores, que expliquen la configuracin de las correlaciones dentro de un conjunto de variables observadas. El anlisis factorial se suele utilizar en la reduccin de los datos para identificar un pequeo nmero de factores que explique la mayora de la varianza observada en un nmero mayor de variables manifiestas. Tambin puede utilizarse para generar hiptesis relacionadas con los mecanismos causales o para inspeccionar las variables para anlisis subsiguientes (por ejemplo, para identificar la colinealidad antes de realizar un anlisis de regresin lineal). El procedimiento de anlisis factorial ofrece un alto grado de flexibilidad: Existen siete mtodos de extraccin factorial disponibles. Existen cinco mtodos de rotacin disponibles, entre ellos el oblimin directo y el promax para rotaciones no ortogonales. Existen tres mtodos disponibles para calcular las puntuaciones factoriales; y las puntuaciones pueden guardarse como variables para anlisis adicionales.

Anlisis factorial: Descriptivos Estadsticos. Los descriptivos univariados incluyen la media, la desviacin tpica y el nmero de casos vlidos para cada variable. La solucin inicial muestra las comunalidades iniciales, los autovalores y el porcentaje de varianza explicada. Matriz de correlaciones. Las opciones disponibles son: coeficientes, niveles de significacin, determinante, inversa, reproducida, anti-imagen y KMO y prueba de esfericidad de Bartlett. KMO y prueba de esfericidad de Bartlett. La medida de la adecuacin muestral de Kaiser-Meyer-Olkin contrasta si las correlaciones parciales entre las variables son pequeas. La prueba de esfericidad de Bartlett contrasta si la matriz de correlaciones es una matriz identidad, que indicara que el modelo factorial es inadecuado. Reproducida. Matriz de correlaciones estimada a partir de la solucin factorial. Tambin se muestran las correlaciones residuales (la diferencia entre la correlacin observada y la estimada). Anti-imagen. La matriz de correlaciones anti-imagen contiene los negativos de los coeficientes de correlacin parcial y la matriz de covarianza anti-imagen contiene los negativos de las covarianzas parciales. En un buen modelo factorial la mayora de los elementos no diagonales deben ser pequeos. En la diagonal de la matriz de correlaciones anti-imagen se muestra la medida de adecuacin muestral para esa variable. Anlisis factorial: Extraccin Mtodo. Permite especificar el mtodo de extraccin factorial. Los mtodos disponibles son: Componentes principales, Mnimos cuadrados no ponderados, Mnimos cuadrados generalizados, Mxima verosimilitud, factorizacin de Ejes principales, factorizacin Alfa y factorizacin Imagen. Anlisis de componentes principales. Mtodo para la extraccin de factores utilizada p ara formar combinaciones lineales no correlacionadas de las variables observadas. El primer componente tiene la varianza mxima. Las componentes sucesivas explican progresivamente proporciones menores de la varianza y no estn correlacionadas unas con otras. El anlisis principal de las componentes se utiliza para obtener la solucin factorial inicial. No se puede utilizar cuando una matriz de correlaciones es singular. Mtodo de mnimos cuadrados no ponderados. Mtodo de extraccin de factores que minimiza la suma de los cuadrados de las diferencias entre las matrices de correlacin observad ay reproducida, ignorando las diagonales.

Mtodo de Mnimos cuadrados generalizados. Mtodo de extraccin de factores que minimiza la suma de los cuadrados de las diferencias entre las matrices de correlacin observada y reproducida. Las correlaciones se ponderan por el inverso de su unicidad, de manera que las variables que tengan un valor alto de unicidad reciban una ponderacin menor que aqullas que tengan un valor bajo de unicidad. Mtodo de mxima verosimilitud. Mtodo de extraccin factorial que proporciona las estimaciones de los parmetros que con mayor probabilidad ha producido la matriz de correlaciones observada, si la muestra procede de una distribucin normal multivariada. Las correlaciones se ponderan por el inverso de la unicidad de las variables, y se emplea un algoritmo iterativo. Factorizacin de ejes principales. Mtodo para la extraccin de factores que p arte de la matriz de correlaciones original con los cuadrados de los coeficientes de correlacin mltiple insertados en la diagonal principal como estimaciones iniciales de las comunalidades. Las saturaciones factoriales resultantes se utilizan para estimar de nuevo las comunalidades que reemplazan a las estimaciones previas de comunalidad en la diagonal. Las iteraciones continan hasta que el cambio en las comunalidades, de una iteracin a la siguiente, satisfaga el criterio de convergencia para la extraccin. Alfa. Mtodo de extraccin factorial que considera a las variables incluidas en el anlisis como una muestra del universo de las variables posibles. Este mtodo maximiza el Alfa de Cronbach para los factores. Factorizacin imagen. Mtodo para la extraccin de factores, desarrollado por Guttman y basado en la teora de las imgenes. La parte comn de una variable, llamada la imagen parcial, se define como su regresin lineal sobre las restantes variables, en lugar de ser una funcin de los factores hipotticos. Analizar. Permite especificar o una matriz de correlaciones o una matriz de covarianzas. Matriz de correlaciones. Es til si las variables de su anlisis se miden sobre escalas distintas. Matriz de covarianzas. Es til si se desea aplicar el anlisis factorial a varios grupos con distintas varianzas para cada variable. Extraer. Se pueden retener todos los factores cuyos autovalores excedan un valor especificado o retener un nmero especfico de factores. Mostrar. Permite solicitar la solucin factorial sin rotar y el grfico de sedimentacin de los autovalores.

Solucin factorial sin rotar. Muestra las saturaciones factoriales sin rotar (la matriz de configuracin factorial), las comunalidades y los autovalores de la solucin factorial. Grfico de sedimentacin. Grfico de la varianza que se asocia a cada factor. Este grfico se utiliza para determinar cuntos factores se deben retenerse. Tpicamente el grfico muestra la clara ruptura entre la pronunciada pendiente de los factores ms importantes y el descenso gradual de los restantes (los sedimentos). N mximo de iteraciones para convergencia. Permite especificar el nmero mximo de pasos que el algoritmo puede seguir para estimar la solucin. Anlisis factorial: Rotacin Mtodo. Permite seleccionar el mtodo de rotacin factorial. Los mtodos disponibles son: varimax, equamax, quartimax, oblimin directo y promax. Mtodo varimax. Mtodo de rotacin ortogonal que minimiza el nmero de variables que tienen saturaciones altas en cada factor. Simplifica la interpretacin de los factores. Criterio Oblimin directo. Mtodo para la rotacin oblicua (no ortogonal). Si delta es igual a cero (el valor por defecto) las soluciones son las ms oblicuas. A medida que delta se va haciendo ms negativo, los factores son menos oblicuos. Para anular el valor por defecto 0 para delta, introd uzca un nmero menor o igual que 0,8. Mtodo quartimax. Mtodo de rotacin que minimiza el nmero de factores necesarios para explicar cada variable. Simplifica la interpretacin de las variables observadas. Mtodo equamax. Mtodo de rotacin que es combinacin del mtodo varimax, que simplifica los factores, y el mtodo quartimax, que simplifica las variables. Se minimiza tanto el nmer o de variables que saturan alto en un factor como el nmero de factores necesarios para explicar una variable. Rotacin Promax. Rotacin oblicua que permite que los factores estn correlacionados. Esta rotacin se puede calcular ms rpidamente que una rotacin oblimin directa, por lo que es til para conjuntos de datos grandes. Mostrar. Permite incluir los resultados de la solucin rotada, as como los grficos de las saturaciones para los dos o tres primeros factores. Solucin rotada. Debe seleccionarse un mtodo de rotacin para obtener la solucin rotada. Para las rotaciones ortogonales, se muestran la matriz de configuracin rotada y la matriz de t ransformacin de factor. Para las

rotaciones oblicuas, se muestran las matrices de correlaciones de factor, estructura y patrn. Diagrama de las saturaciones factoriales. Representacin tridimensional de las saturaciones factoriales para los tres primeros factores. En una solucin de dos factores, se representa un di agrama bidimensional. Si slo se extrae un factor no se muestra el grfico. Si se solicita la rotacin, los diagramas representan las soluciones rotadas. N mximo de iteraciones para convergencia. Permite especificar el nmero mximo de pasos que el algoritmo puede seguir para llevar a cabo la rotacin.