You are on page 1of 8

Tema-6-Resumen.

pdf

Martacm_01

Analisis de Datos en Psicologia I

2º Grado en Psicología

Facultad de Educación, Psicología y Ciencias del Deporte


Universidad de Huelva

Reservados todos los derechos.


No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
Marta Castillo Molero

Tema 6: Análisis descriptivo bivariable: Análisis de la relación entre una

No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
variable categórica y una variable cuantitativa.
1. Diseños bicondicionales transversales.

¿Existe relación entre las agresiones y la extraversión?

La estrategia de análisis más común para responder a esta pregunta es comparar las
distribuciones condicionales de la variable cuantitativa (extraversión) para cada uno
de los valores de la variable cualitativa (agresiones).

Simetría de las distribuciones condicionales:

Siempre que la distribución no sea claramente asimétrica, el análisis de este tipo de

Reservados todos los derechos.


relaciones suele realizarse mediante técnicas basadas en la comparación de las medias
de las distribuciones condicionales. Para explorar las distribuciones condicionales -
asimetría, existencia de outliers- es conveniente usar un diagrama de cajas múltiple.

Comparando las medias de las distribuciones condicionales:

Aunque aparentemente puedan existir ciertas diferencias -mostradas en los gráficos de


la derecha-, es conveniente cuantificar esas diferencias mediante algún estadístico.
Estos estadísticos son conocidos como estadísticos del tamaño del efecto.

1.1. Estadísticos de tamaño del efecto.

En el caso de la comparación de dos medias, el estadístico de tamaño de efecto más


usual es la diferencia estandarizada de las medias conocida como d de Cohen.

Sc = Desviación típica conjunta

1.2. Interpretación de la d de Cohen.

La d de Cohen indica el número de desviaciones típicas a las que se encuentra la media


de un grupo respecto a la media del otro.

d de Cohen Tamaño del efecto


0,2 Pequeño
0,5 Medio
0,8 Alto

a64b0469ff35958ef4ab887a898bd50bdfbbe91a-5009378
Marta Castillo Molero

1.3. Inferencias sobre las poblaciones.

¿Existe relación entre las variables en la población?

Es posible que las diferencias observadas en las muestras sean debidas a lo que se
denomina error muestral, esto es, los estadísticos muestrales no suelen coincidir con
los parámetros poblacionales.

Por ello, existen unos procedimientos estadísticos que pretenden cuantificar el grado

No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
de certidumbre con el que podemos afirmar que la relación observada en la muestra
existe en la población. Estos procedimientos se conocen como Contrastes de Hipótesis
Estadísticas.

Lógica de los Contrastes de Hipótesis:

1º Se parte del supuesto de que en la población no existe relación, esto es, no existen
diferencias entre las medias de ambos grupos (este supuesto se denomina
Hipótesis Nula -H0-).
2º Se calcula un Estadístico de Contraste. Para el tipo de relación que estamos

Reservados todos los derechos.


analizando el estadístico sería una t de Student para muestras independientes.

Error típico de la diferencia de las medias =

3º Se determina la probabilidad de obtener un valor del estadístico de contraste


como el obtenido o más extremo si la H0 fuera cierta.
4º Se concluye:
- Rechazando la H0 si esa probabilidad es muy baja.
- No rechazando la H0 en caso contrario.

Habitualmente el estándar para considerar esta probabilidad como muy baja es que
sea inferior a 0.05 (α o nivel de significación).

¿Cuál es la relación entre las variables en la población?

Otra cuestión importante a la hora de generalizar los resultados muestrales a la


población de referencia es cuáles son los parámetros de la relación en la población
estudiada.

Por ello, existen unos procedimientos estadísticos que pretenden determinar el valor
aproximado de los parámetros poblacionales de interés. Estos procedimientos se
conocen como procedimientos de Estimación de Parámetros.

Respuesta Coca-Cola Zero Azúcar. Demasiado bueno para explicarlo con palabras
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-5009378
Marta Castillo Molero

Lógica de la Estimación de Parámetros:

1º Se parte del supuesto de que en la población no existe relación, esto es, no existen
diferencias entre las medias de ambos grupos (este supuesto se denomina
Hipótesis Nula -H0-).
2º Se calcula el Error Típico del estadístico en el caso de que la H0 sea cierta. Para el
tipo de relación que estamos analizando calcularíamos el error típico de la
diferencia de medias.

No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
3º Se establece un Intervalo de Confianza alrededor del estadístico (diferencia de
medias) sumando y restando un número de veces el error típico. Este número
variará dependiendo del nivel de significación y otras características de los datos.

4º Se concluye con una probabilidad igual al nivel de confianza (complementario al

Reservados todos los derechos.


nivel de significación) el parámetro se encuentra en el intervalo establecido.

2. Diseños bicondicionales longitudinales.

Las inferencias estadísticas relativas a la comparación de dos medias obtenidas en


muestras relacionadas (diseños longitudinales bicondicionales), tienen la misma lógica
y se realizan de la misma forma que en el caso anterior. La única diferencia reside en la
forma de calcular el error típico.

donde SD = desviación típica de las puntuaciones diferencia.

3. Diseños multicondicionales transversales.

¿Existe relación entre el nivel de estrés y el neuroticismo?

Cuando la variable cualitativa tiene más de dos valores (nivel de estrés: bajo, medio,
alto), la estrategia de análisis más usual también consiste en la comparación de las
medias de las distribuciones condicionales de la variable cuantitativa (neuroticismo).

Cuando existen más de dos medias a comparar la comparación de medias se suele


realizar con unas técnicas de análisis conocidas como técnicas de análisis de la
varianza.

Equilibrio en tu día a día con el nuevo portátil Prestige 15. Entra ya y llévatelo
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-5009378
Marta Castillo Molero

3.1. Lógica del análisis de la varianza.

No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
Dos ideas importantes para el análisis de esas evidencias, si la variable a analizar es
cuantitativa. Son las siguientes:

1. Cuando no se tiene información adicional, la media es el mejor predictor de los


datos, esto es, la media es el valor que genera menos errores de predicción.

2. La varianza es una medida de los errores de predicción. Conceptualmente el error


de predicción puede entenderse como la distancia desde la predicción al dato real.
En principio, parecería lógico usar la suma o el promedio de las diferencias desde
cada dato a la media como una medida de la cantidad de error cometido al usar la
media como predictor. Sin embargo, puesto que, la medida del error de predicción

Reservados todos los derechos.


suele ser la suma o el promedio de las diferencias al cuadrado desde cada dato a la
media.

La suma de las SC anteriores -o la media ponderada de las MC anteriores- será un


indicador de la cantidad de error que se comete usando las medias de los grupos como
predictores. A esta suma se la denomina Suma Cuadrática Intragrupos (SC I) -o Media
Cuadrática Intragrupos (MCI)-.

En el ejemplo anterior la Suma Cuadrática Intragrupos será SCI = 4 +4 +2 =10.

Hasta ahora hemos visto dos indicadores del error de predicción:

- SCT Indicador del error de predicción cuando sólo se conoce la media total.
- SCI Indicador del error de predicción cuando se conoce la media de cada grupo.

La diferencia entre ambas sumas cuadráticas es un indicador de la ganancia predictiva,


y se denomina Suma Cuadrática Entregrupos (SCE).

En el ejemplo anterior la Suma Cuadrática Entregrupos será SCE = SCT – SCI = 18 - 10 =


8.

Cuanto mayor sea la SCE y menor la SCI mayor será la variabilidad entre grupos y
menor la variabilidad dentro de los grupos. Esto querrá decir que las diferencias entre
las puntuaciones se deberán fundamentalmente a las diferencias entre los grupos.

a64b0469ff35958ef4ab887a898bd50bdfbbe91a-5009378
Marta Castillo Molero

Y que, por tanto, la variable de agrupación nos permitirá predecir bastante


acertadamente las puntuaciones de los sujetos en la variable cuantitativa, o dicho de
otra forma, ambas variables tendrán una relación muy intensa.

Estadístico de tamaño del efecto

Un estadístico del tamaño del efecto derivado del análisis de la varianza es la eta al
cuadrado1 (η2).

No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
Interpretación de Eta cuadrado

Eta cuadrado Tamaño del efecto


0 – 0,01 Muy poco intensa
0,01 – 0,06 Poco intensa
0,06 – 0,14 Intensidad media
0,14 – 1 Muy intensa

Reservados todos los derechos.


Análisis de tendencias

Cuando la variable de agrupación es ordinal es posible analizar la tendencia de los


valores de la variable cuantitativa cuando aumentan o disminuyen los valores de la
variable de agrupación. Así, podremos distinguir dos tipos de tendencia:

- Tendencia creciente: cuando al aumentar los valores de la variable de agrupación


aumentan los valores de la variable cuantitativa, evaluado a través de las medias.
- Tendencia decreciente: cuando al aumentar los valores de la variable de
agrupación, disminuyen los valores de la variable cuantitativa, evaluado a través de
las medias.

3.2. Inferencias sobre las poblaciones.

1º Se parte del supuesto de que en la población no existe relación, esto es, no existen
diferencias entre las medias de los grupos (este supuesto se denomina Hipótesis
Nula -H0-).
2º Se calcula un Estadístico de Contraste. Para el tipo de relación que estamos
analizando el estadístico sería una F de Snedecor.

donde MCE es la media cuadrática entre grupos, y MCI es la media


cudrática intragrupos.

Llévate ya el portatil Modern 15, con la mayor duración de batería y fácil diseño para tu día a día
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-5009378
Marta Castillo Molero

siendo m el número de grupos.

siendo n el número de sujetos.

3º Se determina la probabilidad de obtener un valor del estadístico de contraste


como el obtenido o más extremo si la H0 fuera cierta.

No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
4º Se concluye:
- Rechazando la H0 si esa probabilidad es muy baja.
- No rechazando la H0 en caso contrario.

Habitualmente el estándar para considerar esta probabilidad como muy baja es que
sea inferior a 0.05 (α o nivel de significación).

Reservados todos los derechos.

Llévate ya el portatil Modern 14, ultraligero y compacto


a64b0469ff35958ef4ab887a898bd50bdfbbe91a-5009378

You might also like