La interpretación bivariante de los datos Tema 5

Lecturas: Capítulos 15 / 16. Análisis de los datos: pruebas de diferencias y asociaciones (Hair et al., 2010)

1

2

3

y una vez determinado el grado de asociación entre las dos variables. • Es lo que se denomina contraste de hipótesis o contraste de independencia. el cual se desarrollará a partir de las tablas de contingencia.Análisis bivariable • Una vez realizado un estudio descriptivo unidimensional abordaríamos el análisis bidimensional. • Por último. si la asociación o relación arrojada por el estadístico elegido es atribuíble a un error de muestreo (dicha relación no es genuina de la población que estudiamos). Vamos a obtener uno o varios números (estadísticos) que resumen el contenido informativo recogido en cada una de las celdas que se derivan del cruce de las variables. Este contraste tiene como hipótesis nula H0 la independencia (relación nula) frente a la dependencia H1 (algún tipo de relación entre las variables). que no son más que la extensión del concepto de tabla de frecuencias solo que aplicado a dos variables. no pudiendo generalizar los resultado obtenidos. o lo que es lo mismo. mediante el cual se establecerá la relación entre las variables. 4 . • El análisis bivariable tiene como objeto medir la asociación entre las dos variables que forman la tabla y nunca la relación entre las categorías de las variables. nos resta valorar si ésta es estadísticamente significativa.

¿ Existe una relación entre dos variables ? (Presencia de la relación: significativa o no) ¿ Cuál es la dirección de esta relación ? (Dirección de la relación: positiva o negativa) ¿ Cuál es la fuerza de esta relación ? (Fuerza de la relación: débil. moderada o poderosa) 5 . como segundo paso.Análisis bivariable • Se emplea. para evaluar las relaciones entre dos variables.

2. La prueba de Hipótesis Formular H0 antes que H1 Seleccionar la prueba Definir el nivel de significatividad Recoger datos y aplicar las pruebas Nivel de significatividad Valores de los coeficientes Aceptar o Rechazar H0 Draw Marketing Research Conclusion 6 Fuerza de la prueba .

Si la hipótesis nula no esta rechazada. Aceptar la hipótesis alternativa conduce a concluir con cambios.  La prueba de H0 es unidireccional porque H1 se expresa con una dirección.Etapa 1: Formular las Hipótesis  H0= La hipótesis nula establece el status quo.  H1=La hipótesis alternativa establece diferencias/asociación. 7 . no se puede concluir que haya asociación /diferencias. Si no fuera el caso. no efecto. no diferencia. se aplicaría una prueba bidireccional.

Etapa 2: Seleccionar la Prueba  La prueba estadística comprueba que se puede rechazar la H0 con los datos de la muestra. Medidas: test t de student 3. la Chi-2. el r de Pearson. Proporciones: Chi-2 2.  La prueba sigue una distribución conocida como el test t de student. 1. Mdias y desviación típica: test r de Pearson 8 .

5%.  Generalmente la significatividad en ciencias sociales se establece en 10%. 1% (correspondiente a los niveles de confianza de 90%.  El nivel en el que se identifica el estadístico de prueba crítica. 9 .Etapa 3: Definir el nivel de significatividad  El nivel al que queremos hacer un juicio sobre el parámetro de la población (hipótesis nula). 99%). 95%.

Variable nominal u ordinal Variable nominal u ordinal Variable intervalo o ratio Análisis estadístico de tablas de contingencias Análisis estadístico de las medias Variable intervalo o ratio Análisis estadístico de las medias Análisis estadístico de las correlaciones 10 .

tipos de contraste de dependencia / independencia dependiendo del tipo de variables Tipos de variables Ordinal y nominal Intervalo y ratio La relación Su dirección Su fuerza Sign test Chi 2 Distribución de las frecuencias Operador del test r de Pearson Valores de las medias V de Cramer Sign test r de Pearson R de Pearson Mixto Sign test t de Student y F de Fisher Eta => se debe calcular 11 .Análisis bivariable.

MSN. Hi5. Facebook. no)? ¿Los que más se conectan a Internet (Número de horas) están registrados en una red social (sí vs. Tuenti. edad vs nacionalidad….. Skype) a las que más se conectan? (relacion frecuencia de conexión-red social) ¿Hay más hombres que mujeres (hombre vs.Caso Redes Sociales Tipo de preguntas para las que se utiliza el análisis bivariable  ¿Cómo se relacionan las características de la muestra (edad vs sexo. no)? ¿Los que más se conectan a Tuenti (frecuencia de 1 a 5) a la vez usan frecuentemente el MSN (frecuencia de 1 a 5)? 12     . mujer) registrados en redes sociales (sí vs.)? ¿Cuáles son las redes sociales (MySpace.

no)? ¿Hay diferencia en la preferencia por la marca Coca Cola entre jóvenes y adolescentes? ¿Cuál es el nivel de satisfacción de las amas de casa jóvenes y mayores con el consumo del detergente X?   13 .Tipo de preguntas para las que se utiliza el análisis bivariable    ¿Esta relacionado el uso de internet con el género? La frecuencia de comer en restaurantes ¿difiere entre hombres y mujeres? ¿Hay más hombres que mujeres (hombre vs. mujer) registrados en redes sociales (sí vs.

1. Tabla de contingencias Objetivo: Se emplea para evaluar las relaciones entre dos variables nominales y/o ordinales Condiciones: Cada celda debe tener más de 5 observaciones Ejemplo: ¿El recuerdo de la publicidad influye significativamente sobre la intención de compra del producto? 14 .

Tablas de contingencia (variables nominales y ordinales) Utilizaremos para este paso el ejemplo de los datos del archivo Cruces.): 1.Selecciona: Analizar / Estadísticos Descriptivos / Tabla de contingencias 2.Selecciona “Estado civil” y pásalo a la caja. filas 3.Selecciona “Genero” y pásalo a la caja Columnas 15 . estado civil. ….sav •Tablas de frecuencias para datos cualitativos (ejemplos sexo.

86 mujeres solteras 81 hombres solteros 16 .

utilizar porcentajes: • Selecciona el botón Casillas. • En recuentos marcar Observado y Esperado • En porcentajes selecciona. Columna y Total. Fila. 17 .Mejor.

5.8% de las mujeres están solteras. 86. 4. 3. Quiere decir que el 51. 18 . 6. Recuento: Número de mujeres solteras.Mejor. valor que debiera tener este cruce para existir independencia.5% de los solteros son mujeres. Residuo: diferencia entre el valor esperado y el observado.7). % de Estado civil: cociente entre el valor de la casilla y el total de la fila (86/167). 2. Es decir. (86-85.7% de los entrevistados son mujeres y solteras. Implica que el 55. el 28. utilizar porcentajes: 1. % del total: cociente de la casilla entre el total de individuos (86/300). Frecuencia esperada: teniendo en cuenta todos los datos. % de Género: cociente entre el valor de la casilla y el total de la columna (86/154).

mientras que la H1 hipótesis que manejamos es que hay mas mujeres que hombres solteros La prueba Chi-cuadrado de Pearson se utiliza para determinar la significación estadística entre las distribuciones de frecuencia de dos o mas variables medidas con escala nominal en una tabulación cruzada para determinar si hay alguna asociación entre ellas.Contraste de hipótesis o contraste de independencia En el mismo cuadro de dialogo de tablas de contingencia. 19 . mediante el botón estadísticos elegiremos un estadístico (valor numérico) para la resolución del contraste de independencia. Cuando la significación es menor que 0. La H0 o hipótesis nula es que no existe relación entre sexo y estado civil.05 (significación estándar) podemos rechazar con seguridad la hipótesis nula Ho de que no hay relación entre las variables estudiadas y aceptar la hipótesis planteada o viceversa. En el caso que hemos tomado como ejemplo al tratarse de variables de tipo nominal u ordinal el estadístico de contraste es la Chi2 de Pearson.

H1 : Existe relaciones entre las dos variables  Podemos rechazar H0 y aceptar H1 si la significación del test de Chi 2 es inferior a 5%: p > 0.Estadístico: test de Chi2  El test de Chi 2 prueba las hipótesis siguientes: .05 : existe más de 5% de probabilidad de rechazar H0 mientras que H0 sea verdad = aceptamos Ho p < 0.05 : existe menos de 5% de probabilidad de rechazar H0 mientras que H0 sea verdad = rechazamos Ho 20 .H0 : No existe relaciones entre las dos variables .

Estadístico: test de Chi2 Para ello. marcamos continuar y aceptamos 21 . Abrimos el cuadro de dialogo estadísticos y marcamos Chi-cuadrado y Phi y V de Cramer que corresponde al tipo de variables (nominales que estamos analizando). En el cuadro de dialogo tendremos ya las dos variables ESTCIV en filas y GÉNERO en columnas. en nuestro ejemplo nos iremos a Analizar Estadísticos descriptivos  Tablas de contingencia.

El valor 0 indica que no hay asociación entre la fila y la columna. Los valores cercanos a 1 indican que hay gran relación entre las variables. 22 .Estadístico: test de Chi2 Interpretación  Presencia de la relación: estadística de Chi 2 p > 0.05 : existe más de 5% de probabilidad de rechazar H0 mientras que H0 sea verdad p < 0.05 : existe menos de 5% de probabilidad de rechazar H0 mientras que H0 sea verdad   Dirección de la relación: distribución convergente o divergente de las frecuencias en la tabla de contingencia Fuerza de la relación: V de Cramer que varia entre 0 y 1 en valor absoluto.

El test r prueba las hipótesis siguientes:    H0 : No existe relaciones entre las variables H1 : Existe relaciones entre las variables  Podemos rechazar H0 y aceptar H1 si la significación del test r de Pearson es inferior a 5% :  p > 0. Estadístico: Coeficiente de correlación r de Pearson  Los valores de la r de Pearson varían entre -1 y 1.2.05: existe menos de 5% de probabilidad de rechazar H0 mientras que H0 sea verdad  Estadístico: Coeficiente de correlación de Spearman cuando se trata de variables ordinales 23 .05 : existe más de 5% de probabilidad de rechazar H0 mientras que H0 sea verdad  p < 0. si se acerca a -1 existe una relación inversa y si se acerca 1 existe una relación directa. si el valor es cercano a 0 podemos decir que no existe relación entre ambas variables. Correlaciones   Objetivo: Se emplea fundamentalmente para evaluar las relaciones entre dos variables de intervalo o ratio.

2. Correlaciones (Variables de intervalo o Ratio)
Utilizaremos para este paso el ejemplo de los datos del archivo Cruces.sav Cuando se desee evaluar el grado de asociación o independencia de dos variables cuantitativas debe recurrirse a técnicas de correlación y/o regresión, aunque también es posible transformar una de ellas en una variable categórica u ordinal y luego aplicar un ANOVA. La correlación es una técnica matemática que evalúa la asociación o relación entre dos variables cuantitativas, tanto en términos de direccionalidad como de fuerza o intensidad, proporcionando un coeficiente de correlación (r de Pearson).

La regresión lineal simple es un modelo matemático que explora la dependencia entre dos variables cuantitativas (supone que en el modelo una es la variable dependiente y otra la independiente), tratando de verificar si la citada relación es lineal.
Con el programa SPSS para Windows se pueden llevar a cabo ambos procedimientos y explorar visualmente la relación entre dos variables cuantitativas a través de gráficos de dispersión (o nube de puntos).

24

 Podemos rechazar H0 y aceptar H1 si la significación del test r de Pearson es inferior a 5% : p > 0,05 : existe más de 5% de probabilidad de rechazar H0 mientras que H0 sea verdad. p < 0,05: existe menos de 5% de probabilidad de rechazar H0 mientras que H0 sea verdad. Aplicación SPSS

25



Interpretación
Presencia de la relación: estadística de r de Pearson significativa
Dirección de la relación: correlación positiva (directa) o negativa (inversa)


   

Fuerza de la relación
Valor de r de 0.00 a 0.25 implica una correlación baja. Valor de r de 0.25 a 0.50 implica una correlación moderada. Valor de r de 0.50 a 0.75 implica correlación buena. Valor de r de 0.75 o mayor, implica una excelente correlación.

26

Correlación r Correlación inversa -1<r<0 Correlación directa 0<r<1 27 .

28 .

29 . Coeficiente de correlación de Spearman cuando se trata de variables ordinales. Lineal y curvilínea: se utiliza para: 1. Determinar la forma de la línea de regresión 3.2. 2. Simple: cuando una variable independiente ejerce influencia sobre una variable dependiente. Lineal Simple y Múltiple 1. • • Coeficiente de correlación de Pearson se utiliza cuando las variables son métricas o de escala. MODELOS DE REGRESION (Resumen) • Procedimiento mediante el cual se trata de averiguar si existe relación de dependencia entre dos o más variables: conociendo los valores de una variable independiente se trata de estimar los valores de una o más variables dependientes. Predecir un dato desconocido de una variable partiendo de datos conocidos de otra variable. • Forma gráfica: diagrama de dispersión  recta o curvilínea. Múltiple: Cuando dos o mas variables independientes influyen sobre una variable dependiente. 2. 2. Determinar la relación de dependencia que tiene una variable sobre la otra. • Tipos de regresión: 1.

Para ello abrimos el archivo cruces . despues haremos lo mismo respecto a la relación entre NUMHIJOS y EDAD. el primer paso consistirá en recoger los datos que muestren los correspondientes valores de las variables consideradas y en representarlas después mediante un diagrama de dispersión.sav y abrimos Gráficos/ Dispersión/Puntos Marcamos en dispersión simple y hacemos clik en definir 30 . En nuestro ejemplo (cruces.Ejemplo: de correlación / regresión Diagramas de dispersión Para estudiar y medir si existe relación entre variables.sav) vamos a ver si existe relación entre la variable NUMHIJOS número de hijos y la variable EDUCAÑOS años estudiados (nuestra hipótesis es que quienes mas años han estudiado tienen menos hijos).

Diagramas de dispersión En el cuadro de dialogo que nos aparece colocamos la variable NUMHIJOS en el eje Y. y la variable EDUCAÑOS en el eje X y hacemos clik en aceptar y obtenemos el siguiente grafico de dispersión 31 .

En el recuadro variables introducimos EDUCAÑOS y NUMHIJOS. la H0 es que no hay relación entre el numero de años estudiados y el numero de hijos. Le damos a continuar y aceptamos 32 . Abrimos el menú Analizar / Correlaciones / Bivariadas. Abrimos el cuadro de diálogo opciones y marcamos Medias y desviaciones típicas. marcamos coeficiente de correlación de Pearson.Coeficiente de correlación r de Pearson Nuestra hipótesis H1 es que existe una relación entre el numero de hijos y el numero de años estudiados. prueba de significación bilateral y Marcar las correlaciones significativas. cuantos mas años estudiados menor numero de hijos.

00 correlación inversa baja  Si 0.25 correlación inversa moderada. los resultados de la r de Pearson nos dice que existe una correlación inversa y moderada ya que r<-0.    Interpretación Presencia de la relación: estadística de r de Pearson significativa Dirección de la relación: correlación positiva o negativa Fuerza de la relación  Si 0.25 (a mas años estudiados menos hijos).  Si 0.75 correlación inversa buena.50 correlación directa moderada.75 correlación directa buena. si -0.50>r>-0.25 correlación directa baja. si r<-0.00<r<0.75<r excelente correlación directa.05 aceptamos nuestra hipótesis y rechazamos la hipótesis nula H0 (no existe relación entre las variables) 33 .50<r<0. que coincidiría con nuestra hipótesis y como la significación es menor de 0.  Si 0.25> r>0. En nuestro caso.75 excelente correlación inversa.25<r<0.50>r>-0. si -0. si -0.

Regresión A continuación en el menú Analizar abrimos Regresión / Lineales. 34 . Introducimos la variable NUMHIJOS en el cuadro dependientes y EDUCAÑOS en de independientes y aceptamos.

indica el porcentaje de variación de la variable NUMHIJOS (número de hijos) explicado por la variable EDUCANOS (años estudiados). cuanto mayor es F mayor es la varianza en la variable dependiente (numero de hijos) explicada por la variable independiente (años estudiados). F compara la cantidad de varianza explicada con la de varianza inexplicada. 7. 35 . cuanto menor es el error mejor es ajuste a la línea de regresión y consecuentemente mejor el pronostico de la regresión Y=a+bX+ei La tabla ANOVA muestra la razón F de los modelos de regresión.8% Error estándar de estimación. se calcula de igual manera que en el ANOVA del análisis bivariable.Regresión Coeficiente de correlación Coeficiente de correlación al cuadrado.

La tabla también muestra el valor de la constante de la ecuación de regresión Y=a+bX+ei. así la ecuación sería la siguiente [NUMHIJOS=3.159X+1. la columna Sig.913 – 0.Regresión La tabla de coeficientes muestra el coeficiente de regresión de la variable EDUCAÑOS (años estudiados).913-0.617 Y X 36 . muestra la significación estadística del coeficiente de regresión para la medición realizada con la prueba t.617] constante Coeficiente de regresión Y=3. dicha prueba indica si el coeficiente de regresión es lo suficientemente diferente de 0 como para que sea estadísticamente significativo.159 * (valor de EDUCAÑOS)+1.

Introducimos la variable NUMHIJOS en el cuadro dependientes y EDUCAÑOS en de independientes.Regresión A continuación en el menú Analizar abrimos Regresión / estimación curvilínea. En modelos marcamos lineal y cuadrático hacemos click en aceptar 37 .

La correlación de Pearson es baja y negativa -0.Regresión Obtenemos un gráfico como el siguiente: Aunque el gráfico nos muestra una recta de tendencia de la relación de los datos se puede ver claramente que la curva de ajuste cuadrático representa mejor la relación. 38 .279 luego se trata de una correlación inversa y solo de forma moderada confirmaría nuestra hipótesis de que a mayor numero de años de estudio menos hijos.

Medias  Objetivo: Se emplea para evaluar las relaciones entre una variable nominal o ordinal y una variable intervalo o ratio.  Condiciones: Cada muestra tiene a lo menos 30 observaciones.  Estadísticos:     ¿ El salario medio de la empresa corresponde al salario medio nacional ? => Prueba t para una muestra ¿ El sexo influye sobre el salario medio ? => Prueba t para medias independientes ¿ El salario medio del servicio de informática es diferente del salario medio del servicio marketing ? => Prueba t para muestras relacionadas ¿ La nacionalidad influye sobre el salario medio ? => ANOVA de un factor 39 .3.

H1 : Existe diferencias en las medias. Aplicación SPSS 40 . Podemos rechazar H0 y aceptar H1 si la significación de los tests es inferior a 5% : – p > 0. – p < 0.05 : existe menos de 5% de probabilidad de rechazar H0 mientras que H0 sea verdad.05 : existe más de 5% de probabilidad de rechazar H0 mientras que H0 sea verdad.Los tests prueban las hipótesis siguientes: – – H0 : No existe diferencias en las medias.

    Interpretación Presencia de la relación: estadística de t de student o F de fisher Dirección de la relación: medias por grupo Fuerza de la relación Calculamos eta que puede tener el valor de 0 (relación nula) a 1 (relación fuerte): eta  t *t t * t  n1  n 2  2 41 .

Medias (Variables Nominal u Ordinal y de Intervalo o Ratio)  Objetivo: Se emplea para evaluar las relaciones entre una variable nominal u ordinal y una variable intervalo o ratio.3. ¿La región de procedencia influye sobre la satisfacción con el salario? => ANOVA de un factor.H1 : Existe diferencias en las medias Podemos rechazar H0 y aceptar H1 si la significación de los tests es inferior a 5% :  p > 0. ¿La media de satisfacción con el salario está relacionada con la media de satisfacción con el entorno de trabajo? => Prueba t para muestras relacionadas.  Condiciones: Cada muestra tiene por lo menos 30 observaciones. Los test prueban las hipótesis siguientes : .05 : existe menos de 5% de probabilidad de rechazar H0 mientras que H0 sea verdad 42 .  Estadísticos:     ¿El nivel de satisfacción medio con el salario es bueno? => Prueba t para una muestra (corresponde a un tipo de análisis univariado en el que el contraste se hace con una muestra teórica –bondad del ajuste-) ¿El sexo influye sobre la satisfacción con los compañeros? => Prueba t para muestras independientes (las muestras son hombres Vs mujeres).H0 : No existe diferencias en las medias .05 : existe más de 5% de probabilidad de rechazar H0 mientras que H0 sea verdad  p < 0.

Para ello abrimos el menú Analizar / Comparar medias /Prueba T para una muestra. Nuestra hipótesis H1 es que la media de satisfacción respecto al salario es baja y se sitúa por debajo de 3.Prueba t para una muestra: corresponde a un tipo de análisis univariado en el que el contraste se hace con una muestra teórica (bondad del ajuste). La H0 es que la media de satisfacción no es baja. 43 .

dejando marcado excluir casos según análisis si no lo está por defecto. Marcamos continuar y aceptar obteniendo el siguiente cuadro de resultados. abrimos el cuadro de dialogo opciones y ponemos el porcentaje en la casilla. 44 . en la casilla valor de prueba colocamos 3. como nuestra hipótesis es que la media de satisfacción con el sueldo es baja menor de 3.Prueba t para una muestra A continuación colocamos en variables para contrastar satsuel. para establecer el nivel de confianza del 95%.

la probabilidad de rechazar la H0 siendo cierta es de un 18. Así pues nuestra hipótesis no se cumple. Aceptamos la H0 45 . el nivel de satisfacción no está por debajo de 3 para la muestra observada. mayor que 0.3% cuando el límite de rechazo es del 5%. no sería adecuada.05 por lo que la decisión de rechazar la hipótesis nula H0.08 con lo que ya tenemos un indicio de que nuestra hipótesis podría no cumplirse. es decir.Prueba t para una muestra La media de satisfacción obtenida es de 3. la significación toma el valor 0.183.

En nuestro ejemplo nos vamos a Analizar / Comparar medias /Prueba T para muestras independientes. La hipótesis nula H0 es que el sexo no influye en la satisfacción con el salario. Le damos a continuar y aceptamos.Prueba t para muestras independientes Se utiliza cuando queremos comparar dos muestras independientes. 46 . para lo que pinchamos en Definir grupos e introducimos en cada grupo los valores que tomo ala variable GÉNERO 1 para femenino y 2 para masculino. por ejemplo ¿influye el sexo sobre el nivel de satisfacción con el salario? Nuestra hipótesis H1 es que el sexo influye en la satisfacción con el salario. Deberemos de introducir la definición de los grupos de la variable de agrupación. En el recuadro variables a contrastar introducimos la variable satisfacción con el sueldo satsuel y en la variable de agrupación introducimos la variable GÉNERO.

En este caso la dirección de la relación no tiene sentido estudiarla porque no existe tal relación. Podemos calcular Eta. con lo que rechazaríamos nuestra hipótesis y aceptaríamos la hipótesis nula que establecía que el sexo no influye sobre el nivel de satisfacción con el salario.130 es decir bastante mas alta de 0. que en este caso nos confirmará que la fuerza de la relación es muy baja eta  t *t t * t  n1  n 2  2 47 .05.Prueba t para muestras independientes Obtenemos los siguientes resultados En nuestro ejemplo la significación de la prueba T es de 0.

en estadísticos pedimos el calculo de eta y aceptamos 48 .Prueba t para muestras independientes Para calcular eta no vamos a la tabla de contingencias e introducimos GÉNERO en filas y satsuel en columnas.

49 . es decir muy cercano a 0 lo que indica que la fuerza de la relación es muy baja ya que estadísticamente no hay una relación significativa.Prueba t para muestras independientes Como podemos ver el valor de Eta es de 0.088.

por ejemplo ¿La media de satisfacción con el entorno de trabajo está relacionada con la media de satisfacción con los compañeros de trabajo? Nuestra hipótesis H1 es que las medias de ambas variables están relacionadas y son muy similares. 50 . en opciones ponemos 95 en el porcentaje del intervalo de confianza si no viene por defecto. La hipótesis nula H0 es que no existe relación entre ambas medias. Introducimos las variables satcompa satentor en el recuadro de variables emparejadas. le damos a continuar y a aceptar. En nuestro ejemplo nos vamos a Analizar / Comparar medias /Prueba T para muestras relacionadas.Prueba t para muestras dependientes o relacionadas Se utiliza cuando queremos comparar dos mediciones diferentes sobre la misma muestra.

Prueba t para muestras dependientes o relacionadas En este caso la prueba T nos indica que hay relación entre las variables ya que la significación es de 0. es decir aceptaríamos la hipótesis H1 de que hay relación entre las medias y rechazaríamos la H0 .000 muy por debajo de 0.05.

Prueba t para muestras dependientes o relacionadas Para calcular eta no vamos a la tabla de contingencias e introducimos satcompa en filas y satentor en columnas. en estadísticos pedimos el calculo de eta y aceptamos Según los datos de Eta obtenidos la fuerza de la relación es alta en ambas variables 52 .

•VD: va cuantitativa.05 rechazamos H0 53 53 .05 aceptamos H0 •Si p< 0. •Si p> 0. en la q deseamos comparar los grupos. •El estadistico quese utiliza para contrastar H es la f de fisher: refleja el grado de parecido entre las medias que se estan comparando. de escala.Anova de un factor • Sirve para comparar varios grupos en una va cuantitativa: es una generalización de la prueba t para dos muestras independientes. • VI o factor: va categórica q define a los grupos q qremos contrastar.

Abrimos Analizar / Comparar medias /ANOVA de un factor. la variable dependiente satisfacción con el salario ha de ser métrica de intervalo por lo que en la vista de variables tendremos que cambiar la variable de Ordinal a Escala. Para llevara a cabo nuestro calculo establecemos la hipótesis H1 que la región influye en la satisfacción mientras que la H0 es que no hay relación entre ambas. y en Factor introducimos REGIÓN. En opciones marcamos Descriptivos y aceptamos. 54 . Nuestra variable independiente es de tipo nominal o categórica.Anova de un factor ¿La región de procedencia influye sobre la satisfacción con el salario?. En la lista de dependientes introducimos la variable satsuel una vez que la hemos cambiado a variable de escala. REGIÓN.

menor de 0.Anova de un factor Los resultados nos dicen que hay relación entre la procedencia y la satisfacción con el salario ya que la significación de la F de Fisher es de 0.05 por lo que rechazamos la hipótesis nula 55 .000 o sea.

Conclusiones Tipos de variables Ordinal y nominal Intervalo y ratio Mixto La relación Sign test Chi 2 Su dirección Distribución de las frecuencias Operador del test r de Pearson Valores de las medias Su fuerza V de Cramer Sign test r de Pearson R de Pearson Sign test t de Student y F de Fisher Eta => se debe calcular 56 .

Conclusiones PRUEBAS DE ASOCIACIÓN PRUEBAS DE DIFERENCIAS O INDEPENDENCIA DIFERENCIAS TABLAS DE CONTINGENCIA CORRELACIONES REGRESION DIAGRAMA DE DISPERSION ANOVA ESTADISTICO R PEARSON/ SPEARMAN R PEARSON T STUDENT / F FISHER ESTADISTICO CHI CUADRADO ANOVA DE UN FACTOR T STUDENT 57 .

Caso Cine & Críticas Un instituto de estudios de marketing propone realizar una encuesta ad-hoc para medir con un cuestionario el impacto de (1) el interés hacia el cine. Utilizando SPSS. (6) la edad …………………. sacan los análisis univariables y bivariables siguientes..sobre el grado de consulta de críticas.  Interpretar y sacar conclusiones. (2) el tipo de películas. (5) el sexo. 58 . (4) la implicación hacia el cine. (3) la frecuencia de salida al cine.

5 8.5 2. Interpretación de los ANÁLISIS Análisis Univariables UNIVARIANTE Es tadísticos sexo N Moda Válidos Perdidos Frecuenc ia 61 59 120 s exo Porcentaje 50.5 32.2 35.0 Porcentaje válido 32.8 49.0 35.5 90.8 .1.0 Porcentaje válido .0 Porcentaje ac umulado .0 Núm er o de ve ce s al cine (m e s ) Frecuenc ia 1 3 3 2 1 1 6 24 1 1 1 39 7 15 3 12 120 Porcentaje .8 5.8 .8 49.680 Válidos No me interesa Me interes a un poco Me interes a mucho Total Frecuenc ia 39 39 42 120 Porcentaje 32.0 Porcentaje ac umulado 50.8 32.8 5.8 2.7 .8 36.5 2.8 12.3 9.2 34.0 V álidos Es tadísticos Número de veces al cine (mes) N Válidos 120 Perdidos 0 Media 30.0 100.3 5.8 .5 5.5 35.5 32.8 100.2 75.704 1 2 3 4 6 8 10 12 15 17 23 24 36 48 52 96 Total 59 .8 12.0 Porcentaje válido 50.0 100.00 .2 100.2 14.0 .5 2.5 1.7 .8 3.48 Desv .8 2.5 35.5 10.7 69. 25.0 87.0 100.0 100.0 120 0 1 Válidos hombre mujer Total Inte ré s para e l cine Es tadísticos Interés para el cine N V álidos Perdidos Mediana V arianz a 120 0 2.5 10.8 .0 100. típ.5 2.5 1.0 20.8 .2 100.0 20.8 .8 7.8 32.0 100.0 Porcentaje ac umulado 32.0 .5 65.5 5.

00 5.0 Válidos Es tadísticos edad N Media Desv .8% 582.75 N Media Desv .0 26.8 2.7% 72.0% 30. Mínimo Máx imo Válidos Perdidos a.33000 1.5 20.588 21 29 21 22 23 24 25 26 27 28 29 Total Es tadísticos Influenc ia social (total) 120 0 3.3 20.0 Porcentaje válido .$Pre fpe li Fre que ncies Respues tas Nº Porcentaje 64 9.0% 55.0% 87 12.3% 82 11.3% 26. Mínimo Máx imo Válidos Perdidos 60 .0 4. Tabulado el v alor 1.5% 10.7 20.93482 2.7% 66 9.6% 25 3.9% 48 6.36 5.5 87.0 26.91 1.8 67.8 1.7% 32 4.90 Cons ulta críticas (total) 120 0 3.6% 699 100.5% e dad Frecuenc ia 1 2 22 24 32 24 5 7 3 120 Porcentaje .5 100.3 20.0 4.3729 1.7 18.7 20.8 40.7 18.5 100.8% 60. típ.2575 .8 2.5 100.3% 63.0% 81.2 5.90223 1.0% Tipopeli a ac ción av entura biográfic a comedia drama miedo suspens ee bélico historia policíaco sc ienca fición mus ical Total Porcentaje de c as os 53.5 91.0% 68.9% 98 14.8 2. 120 0 24.7% 20.7 97.3% 40.0 Porcentaje ac umulado .00 6.4% 12 1. Agrupac ión de dicotomías .0598 .8 1.4% 37 5.73 Confianz a en si mismo (total) 120 0 5.2 5. típ.3% 72 10.2% 76 10.

6133 N No me interesa Me interesa un poco Me interesa mucho Total 39 39 42 120 Media 2.50 5.3. Interpretación de los Análisis Bivariables Interés cine * consulta críticas Impacto del interés hacia el cine sobre el grado de consulta de las críticas ANÁLISIS BIVARIANTE ANOVA Media grado de consulta de criticas Suma de cuadrados 19.50 5.21006 .00 1.246 191.37708 1.21249 .635 F 5.75 5.00 1.499 gl 2 117 119 Media cuadrática 9.4978 4.18017 .887 Sig.9551 3.1325 3.6791 3.3199 3.5904 3.33000 Error típico .75 1.31183 1.004 Inter-grupos Intra-grupos Total Descriptiv os Media grado de consulta de criticas Intervalo de confianza para la media al 95% Límite Límite inferior superior 2.9231 3.3483 2.2500 3.12518 1. .8209 3.623 1.12141 Mínimo 1.3729 Desviación típica 1.253 210.00 Máximo 5.75 61 .

138 Diferencia de medias .84581 F Media grado de consulta de criticas Se han asumido varianzas iguales No se han asumido varianzas iguales .37386 1. 1.2031 Desviación típ.658 t 1.3638 Error típ.16816 62 .503 1.18359 .136 .84324 . 1.27699 Error típ.198 Sig.35183 1.Tipo película * consulta críticas Impacto del tipo de película sobre el grado de consulta de las críticas Estadísticos de grupo Tipo de película: Acción acción Media grado de no consulta de criticas si N 56 64 Media 3.11813 . de la diferencia .0660 3.140 Sig. (bilateral) .8333 Desviación típ.3638 .15932 .5670 3. .16502 Error típ. de la media . de la media .496 gl 118 113.11556 -.15962 Prueba de muestras independientes Prueba de Levene para la igualdad de varianzas Prueba T para la igualdad de medias 95% Intervalo de confianza para la diferencia Inferior Superior -.24209 .24328 Estadísticos de grupo Tipo de película: Biográfica Media grado de consulta de criticas biográfica no si N 72 48 Media 3.

30832 F Media grado de consulta de criticas Se han asumido varianzas iguales No se han asumido varianzas iguales 7. (bilateral) .11271 F Media grado de consulta de criticas Se han asumido varianzas iguales No se han asumido varianzas iguales 1.5980 Error típ.23164 Estadísticos de grupo Tipo de película: Drama drama Media grado de no consulta de criticas si N 33 87 Media 2.257 Sig.06833 -.008 t -3.027 . .7674 Error típ. de la media .08321 -.11283 1. 1.23864 .196 t -2.12759 -1.24335 63 .878 Sig.14729 Prueba de muestras independientes Prueba de Levene para la igualdad de varianzas Prueba T para la igualdad de medias 95% Intervalo de confianza para la diferencia Inferior Superior -1.016 Diferencia de medias -.002 .22640 -. de la diferencia .216 -3.375 Sig.Prueba de muestras independientes Prueba de Levene para la igualdad de varianzas Prueba T para la igualdad de medias 95% Intervalo de confianza para la diferencia Inferior Superior -1.001 Diferencia de medias -.313 gl 118 110.236 -2.19372 .7674 -. de la diferencia .5980 -.457 gl 118 70. .9394 3. (bilateral) .29478 -.23994 -1.689 Sig.37383 Error típ.26745 .5374 Desviación típ.

23106 1.6911 -.042 Diferencia de medias .94253 F Media grado de consulta de criticas Se han asumido varianzas iguales No se han asumido varianzas iguales 7. . de la diferencia .15560 .443 Sig.Tipo de película: Bélico Media grado de consulta de criticas Estadísticos de grupo Desviación típ. 1.563 Sig.33705 64 .0405 Prueba de muestras independientes Prueba de Levene para la igualdad de varianzas Prueba T para la igualdad de medias 95% Intervalo de confianza para la diferencia Inferior Superior -.066 gl 118 91. de la media .05164 Error típ.158 Sig. (bilateral) .049 Diferencia de medias -.41755 1.99598 . de la media .00472 F Media grado de consulta de criticas Se han asumido varianzas iguales No se han asumido varianzas iguales 3.56245 Error típ.17289 bélico no si N 83 37 Media 3. de la diferencia .4805 Error típ.37738 -.2289 3.009 t 1.262 Sig.067 .355 -2.066 t -2.29341 .11003 -.27207 -1.26029 .31249 Prueba de muestras independientes Prueba de Levene para la igualdad de varianzas Prueba T para la igualdad de medias 95% Intervalo de confianza para la diferencia Inferior Superior -1.12630 .6911 Error típ.846 2.01856 .03489 . .4805 .5211 3. 1.23260 Estadísticos de grupo Tipo de película: Musical Media grado de consulta de criticas musical no si N 95 25 Media 3.050 gl 118 32.020 . (bilateral) .9200 Desviación típ.

000 120 120 . (bilateral) N Número de vec es al cine (mes ) edad Correlación de Pearson Sig.033 .744 120 .033 .007 .162 .438 .127 .000 120 .245** -.078 120 -. La c orrelac ión es s ignificante al nivel 0. edad sobre el grado de consulta de las críticas Cor relaciones Cons ulta críticas (total) 1 Influenc ia social (total) .024 120 120 -.168 120 1 120 **. número de veces al cine.000 120 120 -. confianza en sí mismo. 65 . (bilateral) N Confianza en s i mis mo Correlación de Pearson (total) Sig.717 120 -.205* .Influencia social.438 120 -.030 . (bilateral) N edad .240** .030 .162 . confianza en sí mismo.024 120 .078 120 Confianza en Número de si mismo veces al (total) cine (mes ) -.205* .717 120 .240** .323** .245** -.744 120 120 -.323** .008 120 .071 -.007 .01 (bilateral).504** .168 120 Cons ulta c rític as (total) Correlación de Pearson Sig.000 120 120 1 .05 (bilateral). salidas al cine. La c orrelac ión es s ignificativa al niv el 0. edad * consulta críticas Impacto de la influencia social.071 .504** 1 . (bilateral) N Influenc ia s ocial (total) Correlación de Pearson Sig.127 . (bilateral) N Correlación de Pearson Sig.008 120 120 1 120 . *.

de la media .160 Sig.308 Diferencia de medias . 1.23066 -.833 Sig.19802 Consulta de críticas (total) Prue ba de mues tras independie nte s Prueba de Levene para la igualdad de varianzas Prueba T para la igualdad de medias 95% Intervalo de confianz a para la diferencia Inferior Superior -.52104 Error típ.73394 F Cons ulta de críticas (total) Se han asumido varianzas iguales No se han as umido varianzas iguales 10.4959 3.23367 .Impacto del sexo sobre el grado de consulta de las críticas Es tadísticos de grupo sexo hombre mujer N 61 59 Media 3.24279 .73094 . de la diferenc ia .001 t 1. .025 gl 118 106.25014 .030 1. (bilateral) .24403 66 .2458 Desviación típ.25014 Error típ.305 .11383 1.14261 .