You are on page 1of 10

C_Cruz2

www.wuolah.com/student/C_Cruz2

3365

Apuntes-Datos-1-tema-1-y-2.pdf
Apuntes Datos1

1º Diseño y Análisis de Datos en Psicología I

Grado en Psicología

Facultad de Psicología
Universidad de Sevilla

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su
totalidad.
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-2939680

DISEÑO Y ANÁLISIS DE DATOS 1 TEMA 1 y 2

INTRODUCCIÓN

Marcos conceptuales básicos para la universidad, la psicología y el análisis


de los datos

El análisis de datos es un conjunto de técnicas analíticas, que sirven para comparar grupos y relacionar
variables así como para detectar posibles diferencias y relaciones.

“Conjunto de procedimientos diseñados para resumir y organizar datos con el objetivo de extraer
información y elaborar conclusiones” (Prado, Ruiz y San Martín, 2009, p. 17)

Se puede fragmentar en tres partes bien diferenciadas.

1. Diseño de investigación (Plan de recogida de datos):


a. observacional, correlacional o experimental

2. Niveles de indagación:
a. Descriptivo (cómo son las cosas)
b. Relacional (cómo unas cosas se relacionan con otras
c. Explicativo ( por qué las cosas son como son)

3. Tipo de conclusiones

El análisis de datos se basa en datos. Para poder analizarlos es necesario asignar números a las
caracteristicas que se desea estudiar. Dependiendo del tipo de relaciones que se establezca entre los
valores (números) asignados a una característica, se establecen diferentes niveles de medida.

 CUALITATIVA / Nominal: sexo, estado civil, color de un estímulo…


 ORDINALES / Ordinal: (Escalas tipo Likert) Nivel de ansiedad…
 CUANTITATIVAS :
o Intervalos: Temperatura… (Cero es el punto arbitrario)
o De razón: Tiempo de reacción…( valor de cero indica ausencia de fenómeno)

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-2939680

DISEÑO Y ANÁLISIS DE DATOS 1 TEMA 1 y 2

TEMA 2: CONOCER UNA VARIABLE:


Recursos tabulares, gráficos y analíticos para describir el comportamiento de una variable
según su escala de medida y su distribución

VARIABLES CUALITATIVAS (o nominales): Los números expresan identidades


• Variable: Color del pelo
• Valores:
1. = Moreno
2. = Rubio
3. = Castaño
4. = Otros (no es más ni menos que “Moreno” (1), simplemente es distinto)

Los datos brutos se extrapolan a una tabla de frecuencias. Esta tabla nos sirve para trabajar con esos datos.

Si es estable una escala con una variable cualitativa (cada número se relaciona con cada uno de los valores de una
variable), los números utilizados expresan sólo identidad y nada más. En estos casos, el 10 no es mayor que
el 7, sólo indica una diferencia entre esos datos recogidos.

TABULACIÓN:
TABLA O DISTRIBUCIÓN DE FRECUENCIAS Forma particular de ordenar los datos basada en los valores concretos que
adopta una variable categórica y en el número de veces que se repite cada valor Objetivo: organizar y resumir la
información

Se organizan los datos de forma que resulte más sencillo conocer a situación sin tener que acudir a los datos
iniciales. Para esto se utiliza la tabla de frecuencias (número de veces que se repite un valor)

 FRECUENCIA ABSOLUTA (Recuento F1) = Número de personas (sujetos) total en la muestra:


Hombres= X, Mujeres = X+1
 FRECUENCIA RELATIVA = Número de personas / Total de sujetos. Este porcentaje en base 1

Frecuencia absoluta: se llama frecuencia absoluta de un valor Xi, y se simboliza por fi, al número de veces
que se repite dicho valor en la muestra

Frecuencia relativa o proporción: se llama frecuencia elativa de un valor Xi, y se simboliza por pi, al cociente
entre la frecuencia absoluta de ese valor y el tamaño de la muestra

Porcentaje: se llama porcentaje de un valor Xi, y se simboliza por Pi (% i ), a su frecuencia relativa


multiplicada por 100.

REPRESENTACIÓN EN TABLAS. SIMBOLOGÍA:

Xi = Valor de i en la variable X. Fi = Frecuencia del valor i. N= Registro de frecuencia (Fi =20; N=20)

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-2939680

DISEÑO Y ANÁLISIS DE DATOS 1 TEMA 1 y 2

Fórmula para calcular porcentajes:

Tabla de frecuencia que incluye porcentajes:

REPRESENTACIÓN POR GRÁFICA:

La más adecuada para este tipo de variables es el diagrama de sectores


(pictograma, ciclograma o gráfico de sectores). Agrupando los datos para
simplificar.

Es importante etiquetar los ejes. Con esta descripción del diseño se


facilita su interpretación y lectura. Siempre se debe configurar con
sencillez, claridad y fácil entendimiento.

Aunque en ocasiones se puede utilizar el diagrama de barras, (en eje X


valores de variable y en eje Y su frecuencia), se tiende a interpretar el orden de las barras como algo
importante, pero es aleatorio. Cuidado con esto ya que puede ser susceptible de sesgo voluntario por parte
de los investigadores para dar una interpretación acorde a lo deseado por estos.

Los mismos datos, pero con diferentes interpretaciones

REPRESENTACIÓN NUMÉRICA:

Para las variables cualitativas, la medida de representación será la Moda (Mo) y la medida de bondad de
la representación (BMo) será el porcentaje

Moda (Mo): Valor de una variable con mayor frecuencia. Este valor sólo representa a los sujetos que
perteneces a esa moda, pero es errónea con respecto al resto de valores. Aun así es el valor que menos
errores genera.

Índice de bondad de ajuste: Es un recurso que acompaña a una representación y que expresa cuán buena
es para representar al conjunto total de los datos. (Porcentaje)

MATIZACIONES:

En variables cualitativas dicotómicas o con pocos valores, no tiene sentido usar una representación
numérica, es más lógico usar una tala o gráfica.

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-2939680

DISEÑO Y ANÁLISIS DE DATOS 1 TEMA 1 y 2

Con una cantidad demasiado grande de datos para una variable, se recodifican los valores creando
categorías nuevas que surgen de la unión de las frecuencias de otras, reduciendo así las categorías o valores
de la variable. (Impensable un diagrama con más de 7 barras o una Mo con valores infinitesimales por su baja credibilidad y
mala interpretación)

 La agrupación de datos las hace más comprensibles


 Su representación numérica es la MODA
 El nivel de ajuste o % se suma a la MODA.
 La moda será buena, cuanto más frecuente sea.

VARIABLE ORDINAL: Los números representan identidades y orden.


Ejemplo: Variable bebida alcohólica = Valores de la variable: cerveza, vino, ginebra… Los valores son los
datos de una variable.

En una variable ordinal, se establece un cierto orden entre sus valores, con intervalo inexacto entre ellos,
por lo que podemos decir que 10 es mayor que 6, pero no cuánto

Extensiones: Variables cuasicuantitativas

Ciertos procesos de medida más elaborados permiten tratar algunas variables ordinales como si fueran
cuantitativas. Ejemplo: encuestas sobre ideología política con procedimientos muy comprobados y
aplicados a muestras muy grandes. Cuando una variable ordinal llega a un nivel alto de medida se considera
como cuasicuantitativa, lo que nos permite trabajar con ella como si fuese cuantitativa y facilitar el trabajo.

Limitaciones:

 ¿Dos “ninguno” (1) equivalen a un “casi nada” (2)?


o 2 es más que 1, pero no sabemos cuánto más. ¿Entendemos todos lo mismo?
o Ejemplo: ¿Qué distancia hay entre “de acuerdo” y “muy de acuerdo”?

REPRESENTACIÓN EN TABLAS (tabulación):

Similares a las cuantitativas

Sirven para trabajar con los percentiles

En ocasiones interesa recodificar datos e incluir dos variables muy similares (x1 malísimo y x2 muy malo, se
pueden agrupar/unificar bajo el concepto “opinión negativa)

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-2939680

DISEÑO Y ANÁLISIS DE DATOS 1 TEMA 1 y 2

Para facilitar nuestro trabajo, incluimos la tabla de


frecuencia acumulada (Fi) y el porcentaje acumulado
(ai)
En caso de existir demasiados valores como para utilizar
una tabla de frecuencias hay dos opciones: recodificar
por intervalos o utilizar representaciones

REPRESENTACIÒN GRÁFICA

Lo más recomendado es usar el diagrama de barras. Aprovechamos que la mayoría trabajamos


de izquierda a derecha para reflejar el orden de la variable. La existencia de “huecos” es especialmente
relevante en las variables cuasicuantitativas. Ese valor vacío se mantiene ya que puede proporcionar
información importante

REPRESENTACIÓN NUMÉRICA
Utilizaremos como medida de representación la MEDIANA (MD). Esta representa un valor de todos los
ofrecidos y evitaría que algunos datos fuesen ignorados.
Para calcular:

SIEMPRE que se utiliza el ÍNDICE DE REPRESENTACIÓN, hay que usar la medida de BONDAD DE LA
REPRESENTACIÓN.

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-2939680

DISEÑO Y ANÁLISIS DE DATOS 1 TEMA 1 y 2

Para medir la bondad de la mediana, utilizaremos la Mediana de distancias a la mediana o MAD. Cuanto
mayor sea la distancia, más error tendrá la mediana a estudiar. Se considera representativa Md si MAD no
supera el 50% del valor de esta.

REPRESENTACIÓN NUMÉRICA DE MAD:

INTERPRETACIÓN:

 Conforme mayor sea el valor de MAD, peor será Md para representar al conjunto de datos.
 No hay una norma para considerar si el valor de MAD es tolerable o excesivo, pero hay guías:
o Si MAD no supera el 50% de Md, Md es una buena representación numérica
o Si MAD=Md, la dispersión es muy elevada y Md no es una buena medida
o Entre 50% y 100%, vamos usar sentido común. Por ejemplo, valorando la teoría o
acudiendo a otras medidas

OTRAS MEDIDAS DE BONDAD DE LA REPRESENTACIÓN:


Amplitud intercuartil, amplitud semiintercuartil. Nos dan información sobre cuán buena es nuestra
mediana.

VARIABLES CUANTITATIVAS: Los números expresan identidades, orden, y distancias.


Nos da valores cuando realizamos cuestionarios, son las que más facilitan nuestro trabajo, aunque no las
más comunes
 Ejemplo:
o Ocho metros es el doble que cuatro
o Entre 3 y 7m hay la misma distancia que entre 11 y 15
 Sus tablas de frecuencia con iguales que las ordinales
 No son siempre las más frecuentes en Psicología
 Importancia de las unidades de medida

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-2939680

DISEÑO Y ANÁLISIS DE DATOS 1 TEMA 1 y 2

 Su representación gráfica son los histogramas (diagrama de barras con agrupación de valores y sin espacios
intermedios)

DIAGRAMA DE CAJAS:

Este tipo de gráfico aporta gran cantidad de información


sobre la distribución de frecuencias de una variable
CUANTITATIVA. A partir de un diagrama de cajas se puede
determinar el valor mínimo. Q1 Mediana, Q3 y Máximo y la
presencia de valores fuera de rango (Outliers)
Un valor extremo u OUTLIER, es un valor extremadamente
alto o bajo en relación al resto de datos.

Para determinar la presencia de estos valores:


1º Calcular el rango intercuartil (Q3-Q1)

2º Establecer un intervalo cuyo inferior es Q1 menos 1,5 veces el rango


intercuartil y cuyo límite superior es Q3 más 1,5 veces el rango untercuartil

3º Todo dato con un valor fuera de ese rango es outlier y por tanto objeto
de ser revisado de nuevo en nuestros datos iniciales
en busca de algún error

REPRESENTACIÓN NUMÉRICA:
MEDIA ARITMÉTICA

A la mediana no le afecta la media, le


afectan los valores anómalos. La media es

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-2939680

DISEÑO Y ANÁLISIS DE DATOS 1 TEMA 1 y 2

el valor que deja a ambos lados la misma cuantía. (Similar a una báscula):
Ejemplo:

La media aritmética minimiza la suma de errores cuadráticos. Sirve para repartir “peso” de los datos en
cantidades iguales a dos mitades, buscando equilibrio

La medida de bondad es parecida a MAD. En


este caso primero se eleva al cuadrado y
después se anula el resultado con una raíz
cuadrada. Así conseguimos la VARIANZA
TÍPICA, Tipo o estándar:

EJEMPLO GRÁFICO:

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-2939680

DISEÑO Y ANÁLISIS DE DATOS 1 TEMA 1 y 2

MATIZACIONES
Los valores tienen sentido cuando se encuadran en un rango determinado. Con el coeficiente de Pearson,
se elimina la unidad de medida y se expresan los datos siempre en %. Sirve para hacer cualquier tipo de
estudio.

Ejercicios introductorios:

http://asignatura.us.es/dadpsico/apuntes/EjConocerUnaVariable.pdf
https://www.superprof.es/apuntes/escolar/matematicas/estadistica/descriptiva/ejercicios-y-problemas-
de-estadistica-i.html

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.

You might also like