Análisis de Datos en Psicología

TEMA 1.
CONCEPTO DE PROBABILIDAD
1. Introducción
Estadística  su objetivo es utilizar datos de una muestra para inferir u obtener

conclusiones sobre las características de la variable en una población de referencia.
Normalmente disponemos de información parcial sobre la misma que obtenemos
eligiendo al azar alguno de sus elementos.
2. Experimento aleatorio y sucesos
Experimento aleatorio simple  acción bien definida con las características:

1. Tiene un conjunto conocido de resultados posibles.
2. No se puede predecir el resultado.
3. Es replicable un número infinito de veces.
Ejemplo: dado, moneda, una carta o una bola de una urna.
Espacio Muestral (E)  conjunto de resultados posibles en un experimento (sucesos

elementales).
E = {x1,x2,x3…..xn}
Tipos:
 Discreto finito  consta de un número finito de elementos.
 Discreto infinito  puedo contarlo pero puede ser infinito.
 Continuo infinito  los elementos del espacio muestral no se corresponde con
los números reales.
Suceso Muestral  un elemento del espacio muestral.
DIAGRAMA DE ARBOL –para construir un espacio muestral-
Sucesos aleatorios elementales  CCC, XXX o CXC.

Sucesos (generalmente)  conjunto de sucesos elementales que comparten alguna
característica particular (subconjuntos de E).
3. Definiciones sobre sucesos
a) Suceso seguro (E)

Todos los posibles elementos que caben dentro del espacio muestral.
“Sacar en un dado menos de 7”.
b) Suceso posible
Puede que ocurra o puede que no.
“Sacar en un número un 5”.
c) Suceso imposible (φ)

Conjunto vacío, sin elementos.
“Sacar más de un 6 en un dado”.
d) Sucesos compuestos
Combinaciones de dos o más sucesos elementales.
Teoría de Conjuntos
Se utiliza para trabajar con sucesos. Para representar los sucesos y observarlos de forma
visual se utiliza los diagramas de Venn.
e) Unión de A y B (A U B) [ó]
Suceso que contiene todos los resultados que pertenecen sólo a A, sólo a B o a ambos.
Propiedades:
1. A U B = B U A
2. A U A = A
3. A U Ø = A
4. A U E = E
5. Si A с (incluido) B entonces A U B = B
f) Intersección de A y B (A ∩ B) [y]
Suceso que contiene todos los resultados que pertenecen a ambos. Los que se repiten.
Propiedades:
1. A ∩ B = B ∩ A
2. A ∩ A = A
3. A ∩ Ø = A
4. A ∩ E = A
5. Si A с (incluido) B entonces A ∩ B = A
g) Suceso complementaria de A (Ā)

Suceso que contiene todos los resultados del espacio muestral que no pertenecen a A.
Propiedades:
1. =A
2. A U Ā = E
3. = E
4. A ∩ Ā = ø
5. Ē = ø
h) Sucesos mutuamente exclusivos o incompatibles

No tienen resultados en común, no se pueden verificar simultáneamente, es decir, si A
∩ B = Ø, o conjunto nulo o suceso imposible.
i) Diferencia de sucesos (A-B)
Subconjunto de E integrado por los sucesos que pertenecen al primero pero no al
segundo.
j) Implicación de sucesos (A B)
A implica a B si siempre que ocurre A, ocurre B.
“Sacar un dos” y “sacar un número par”.
4. Concepto de Probabilidad
4.1 Concepto de probabilidad clásico o “a priori”
Regla de Laplace  La probabilidad de un suceso es el resultado de:

casos favorables / casos posibles
Problemas:
- Los espacios son equiprobables (todos los elementos tienen las mismas opciones
de ser verificados al realizar el experimento aleatorio).
- Es aplicable solo a espacios muestrales finitos.
4.2 Enfoque frecuentista o “a posteriori”
Frecuencia absoluta  número de ocurrencias de un mismo suceso.

Frecuencia relativa  proporción de veces que aparece un suceso que se contabiliza
dividiendo la frecuencia absoluta que le corresponde por el número de veces que se
repite el experimento aleatorio.
Probabilidad  valor en que tiende a estabilizarse la frecuencia relativa del mismo,
cuando el número de veces que se ha repetido el fenómeno es suficientemente grande.
Ley del azar o ley de regularidad estadística  fenómeno de estabilización de las
frecuencias.
4.3 Perspectiva subjetiva

Probabilidad  grado de creencia que se tiene en su ocurrencia.
1.2 AXIOMAS Y TEOREMAS BÁSICO DE LA PROBABILIDAD (pág. 2)
Formulario 1
1.3 PROPIEDADES DE LA PROBABILIDAD (pág. 2) Formulario 2

TEMA 2. PROBABILIDAD CONDICIONADA
A / B  A condicionado por B, es decir, ocurrencia de A supuesto que ha ocurrido B.
“Aprobar sabiendo que ha dedicado un número alto de horas a estudiar”.
Suceso condicionado  suceso A condicionado por B, si la ocurrencia de B puede hacer

cambiar el valor de probabilidad de ocurrencia de A.
Sucesos independientes  si la ocurrencia de uno cualquiera de ellos no afecta a la

ocurrencia del otro.
2.1 SUCESOS CONDICIONADOS Y SUCESOS INDEPENDIENTES (pág. 3)

Formulario 3
Propiedades:
• Si dos sucesos A y B son independientes, entonces también:
 lo son A y
 lo son Ā y B
 lo son Ā y
2.2 TEOREMA DE LA PROBABILIDAD TOTAL (pág. 3)
Formulario 4
2.3 TEOREMA DE LA PROBABILIDAD TOTAL (pág. 3-4)

Formulario 5
TEMA 3. VARIABLES ALEATORIAS: FUNCIÓN DE PROBABILIDAD Y

FUNCIÓN DE DISTRIBUCIÓN
1. Definición de variable aleatoria
• Debido a su utilidad, va a ser necesario atribuir números a los elementos del

espacio muestral, ya que a veces no son numéricos.
También servirá para resumir datos.
La manera de atribuirlos se llama función.
Las variables aleatorias no son más que funciones que cumplen ciertos
requisitos.
• Consideremos un experimento con espacio muestral asociado E. Recibe el

nombre de variable aleatoria a un función X, que asigna un número real a cada
resultado posible sobre el espacio E (X: E  R).
E X “mujeres
seleccionadas”
MMM 3
MMH 2
MHM 2
HMM 2 E R (número real correspondiente a
MHH 1 “números de caras”)
HMH 1 XXX 0
HHM 1 CCC 3
HHH 0 CCX 2
CXC
XCC
CXX 1
XCX
XXC
• Por convención las V.A. se denotan (X, Y, Z…).

• Para los valores que toma la V.A. lo hacemos con (xi).
• Para las variables discretas, nos referimos a la probabilidad de que X tome un
valor dado x como P(X=x), que con frecuencia se simplifica a P(x).
Tipos de Variables Aleatorias

- Discreta  puede tomar un número finito o infinito de valores. Se definen sobre
espacios muestrales finitos o infinitos numerables (número de ratas que salen
por la izquierda o sacar un múltiplo de 3 en un dado).
- Continua  puede tomar un número infinito no numerable de valores. Se
definen sobre espacios muestrales infinitos no numerables (extraer una persona
al azar de una clase y anotar su altura o nivel intelectual –en escalas continuas-).
3.1 FUNCIÓN DE PROBABILIDAD DE UNA VARIABLE ALEATORIA

DISCRETA (pág. 5)
Formulario 6
Se denomina función de probabilidad de una variable aleatoria discreta a aquella que

asocia a cada valor de la variable la probabilidad de que ésta adopte dicho valor.
Se representa: f(xi)=p[X=xi]=pi
3.2 PROPIEDADES DE LA FUNCIÓN DE PROBABILIDAD (pág. 5)

Formulario 7
3.3 FUNCIÓN DE DISTRIBUCIÓN DE UNA VARIABLE ALEATORIA

DISCRETA (pág. 5)
Formulario 8
• Función de distribución de una v.a. discreta X es aquella que asocia a cada valor
de la variable (x) la probabilidad de que ésta adopte como mucho dicho valor.
(ese o cualquiera inferior).
• Se denota como F (xi), indicando: F(xi) = P (X=xi)
• La relación entre la función de distribución y la probabilidad inmediata: F (xi) =
(xi)
• Definimos la Función de Distribución como la función:
F(xi) = p (X≤xi) = [x=xj]
• También se llama función de distribución de probabilidades acumuladas (los
sumatorios del menor al mayor):
F (0)=p[x≤0]=1/8
F (1)=p[x≤1]=4/8
F (2)=p[x≤2]=7/8
F (3)=p[x≤3]=8/8
Representaciones gráficas
Diagrama de barras Diagrama acumulado
3.4 PROPIEDADES DE LA FUNCIÓN DE DISTRIBUCIÓN DE UNA

VARIABLE ALEATORIA DISCRETA (pág. 6)
Formulario 9
Nota: Propiedad 3 = para calcular la p. de distribución en un punto tengo que restarle el
anterior.
3.5 CARACTERÍSTICAS DE UNA VARIABLE ALEATORIA DISCRETA.

POSICIÓN Y DISPERCIÓN (pág. 6)
Formulario 10
Notas:
- mediana  50% a ambos lados.
- Moda  valor más repetido.
- Desviación típica (no está)  (X) =
3.6 y 3.7 PROPIEDADES DEL VALOR ESPERADO Y VARIANZA (pág. 7)

Formulario 11 y 12
x p(x) P(x) x*P(x) X2 X2*p(x)

0 0,125 0,125 0,000 0 0
1 0,375 0,500 0,375 1 0,375
2 0,375 0,875 0,750 4 1,500
3 0,125 1,000 0,375 9 1,125
1,500 3,000
E(X)=1,5
2
(X)=3-1,5=0,75
Md=1
Modas= 1 y 2
Variables aleatorias continúas
• Una variable aleatoria es continua si sus valores posibles son todos los
números reales de un intervalo, es decir, si dados dos valores siempre hay uno
intermedio.
• Puede tomar una infinidad no numerable de valores y por consiguiente la
probabilidad de que tome un valor es nula.
• No podemos hablar de la probabilidad de que la v.a. tome un valor, sino de la
probabilidad de que el valor que tome se encuentre en un intervalo
determinado.
• Sí es posible obtener la probabilidad acumulada hasta un cierto valor (función de
distribución) y a partir de ella ver como cambia la probabilidad acumulada en
cada punto. Estos cambios no serán probabilidades, sino densidad de
probabilidad.
• En la práctica las v.a. continuas se discretizan y podemos asignar probabilidades
a intervalos de valores.
3.8 DENSIDAD DE PROBABILIDAD DE UNA VARIABLE ALEATORIA

CONTINUA (pág. 8)
Formulario 13
3.9 FUNCIÓN DE DISTRIBUCIÓN DE UNA VARIABLE ALEATORIA

CONTINUA (pág. 8)
Formulario 14
3.11 PARÁMETROS DE UNA VARIABLE ALEATORIA CONTINUA (pág. 9)

Formulario 16
Forma de trabajo con las v.a. continuas:

TEMA 4. MODELOS DE DISTRIBUCIONES DE PROBABILIDAD PARA
UNA VARIABLE ALEATORIA
Introducción
- Para poblaciones inaccesibles.
- Se busca el modelo teórico adecuado:
 Variables de interés se ajustan a: binomial o normal.
 Instrumentos estadísticos (ji-cuadrado, T-student o F de
Snedecor).
Modelos probabilísticos para una variable aleatoria DISCRETA

4.1 DISTRIBUCIÓN DE BERNOULLI (pág. 11) Formulario 18
4.2 DISTRIBUCIÓN BINOMIAL (pág. 12) Formulario 19
4.4 DISTRIBUCIÓN DE POISSON (pág. 14) Formulario 21
O ley de sucesos raros. e=2.71828.
Modelos probabilísticos para una variable aleatoria CONTINUA

5.1.1 DISTRIBUCIÓN NORMAL (pág. 17) Formulario 24
- Función matemática. Primeros estudios de Moivre. Gauss y Laplace  curva de
Gauss o laplaciana.
- En análisis estadístico se utiliza y en las Ciencias Sociales y de la Salud.
- Muchos valores en el centro (en torno a la media) y menos en los extremos.
- Probabilidad entre dos puntos, > o >, pero nunca un punto.
- Extremos son asintóticos (no tocan la recta hasta el infinito en el eje X, abscisa).
- Mitades asimétricas.
REPRESENTACIÓN GRÁFICA
Características
- La curva entera no llega a valer 1, sino 0, .
- parámetros - población
- La media=mediana=moda  la mayoría de los valores.
S y - estadístico - muestra
- Valores x no tipificados; valores z tipificados.
- Dentro están los valores de probabilidad.
- Puntuación máxima en la ordenada (representado por ).
- Distribución simétrica y decrece tanto a la derecha como a la izquierda.
- Va decreciendo más o menos rápido dependiendo de la desviación típica.
- Los puntos de inflexión (cambio de curvatura) se encuentran en los puntos
correspondientes a la media ( ) 1S
- Cualquier combinación de variables aleatorias normales se ajusta también al
modelo normal.
5.1.2. DISTRIBUCIÓN NORMAL TIPIFICADA o estandarizada (pág. 18)
Formulario 25
- Z0,33 (probabilidad que acumulo –dentro de la tabla)= -0,44 (valor tabla, columna).
- P. de un intervalo  restando el > menos el <.
- Si se pide la Z, se mira la probabilidad dentro de la tabla. Ahora, destipificar
(conversión) para haya x: x = z * +
n=30 en binomial
z  siempre curva normal
S2 = =
5.2 APROXIMACIÓN DE LA BINOMIAL A LA NORMAL (pág. 18)

Formulario 26
Binomial  4 5 6 7 8  discreta
Normal  4---- -----5--------6-------7-------8  continua
- La distribución binomial pasar la a una normal. Cuanto > n, más se parece la

binomial a una normal.
- Procedimiento: 4 5 6 7 8
5.5 6.5
Puedo convertirlo tipificando los valores de una binomial si tengo los valores
n*p*q (varianza), pudiendo calcular su media y .
Corrección por continuidad poner medio punto por encima (si es <) y medio punto
por debajo (si es >)  en un intervalo (5≤x≤8) Se utiliza
4.5 8.5
P (Z= ) cuando la
Ejemplo p (x≤3) p (z≤ ) binomial >30.
TABLA: n = g.l.; dentro tabla = valores x; arriba = probabilidad.
5.3.1. DISTRIBUCIÓN CHI-CUADRADO (pág. 19) Formulario 27

- Más de una v.a. Una suma de v.a. al cuadrado (z12+z22+…). Si sumamos todas las
variables que se distribuyen según una normal tipificada, resulta una Ji-
Cuadrado.
- Viene definida por  n = grado de libertad (g.l.)  depende del número de
sumandos constituidos por esa variable. Paso a normal
Propiedades cuando
1. Siempre valores positivos. g.l.>30.
2. Asintótica por la derecha (nunca toca el eje de la X).
3. Asimétrica positiva (más valores en torno a los valores más bajos de la variable).
4. Cuando g.l. tiende a ∞ se aproxima mucho a la curva normal.
5.3.2 DISTRIBUCIÓN t DE STUDENT (pág. 19) Formulario 28

Una Ji-Cuadrado + Una Normal Tipificada = T-Student
Propiedades
1. Simétrica respecto a 0. Los valores negativos son complementarios en la tabla
(0.10-0.90; 0.05-0.95…).
2. 0 coincide con la media, moda y mediana.
3. A medida que se incrementan los g.l. la distribución t de Student se va
pareciendo a la normal.
5.3.3. DISTRIBUCIÓN F DE FISHER – SNEDECOR (pág.20) Formulario 29

Dos Chi-Cuadrado, con dos grados de libertad.
Propiedades
1. Siempre valores positivos.
2. Tienen como valor mínimo 0.
3. Asíntota por la derecha.
4. Distribución asimétrica y tiende a la normal conforme aumenta g.l.
Para hallar complementarios: V(x)=
TEMA 5. LA MEDIDA EN PSICOLOGÍA
1. Introducción
Fase de Análisis de datos dentro del Método Científico.
2. Escalas de medida
- Dependiendo del tipo de datos que estemos evaluando.
- A los datos le atribuimos un valor numérico en función de la escala de
medida (magnitud, intervalo y si tiene 0 absoluto).
Tipos de Escalas
Norminal y ordinal (cualitativas) - De intervalo y razón (cuantitavias)
a) Nominal
Categorías excluyentes y no existe relación de magnitud. Cualidades o atributos de la
variable [= o ≠]
b) Ordinal
Ordena las distintas modalidades o cualidades de las variables. No se cuanto mayor
es uno que otro [>, < o =]
c) Intervalos
La magnitud no tiene 0 absoluto (inicio arbitrario). Ejemplo la temperatura. Cantidad
[= o ≠]. No puedo decir que 28º es el doble que 14º, solo que hay 14º de diferencia.
No se puede hallar proporciones (mayoría variables psicológicas).
d) Razón
Propiedades de la de intervalos y posee 0 absoluto o natural que indica la ausencia de
cantidad.
Escalas de medición en las Ciencias del Comportamiento
Casi todas las variables psicológicas son de intervalos pero, matemáticamente se

consideran como de razón (cuestionario o test, al haber 0 absoluto).
Dependiendo de cómo lo mida puede pertenecer a una escala u otra.
3. Variables en la investigación psicológica

VI  manipulamos (directa o indirecta)
VD  medimos
V contaminadoras, extrañas o de control  distorsionan la VI
Variables estadísticas
1. Cualitativas
Escala nominal. Igualdad-desigualdad.
2. Cuasicuantitativas
Atribuye números pero solo para Ordinal. Igualdad-desigualdad-orden.
3. Cuantitativas
Intervalo o razón. Números y se puede realizar operaciones aritméticas. Dos tipos:
- Discretas: discontinuas. Entre un valor y otro no hay valores
intermedios (hijos).
- Continuas: entre dos valores hay ∞ valores intermedios (edad).
4. Organización de los datos y representaciones gráficas
4.1 Variables cualitativas (nominal)
• Tabulación de datos  valores de la variable Xi (i=1,…,k), frecuencia
absoluta (ni), proporción fi donde fi=ni y el porcentaje (%).
• Representación gráfica  Diagrama de rectángulos (también de sectores,
pictogramas).
4.2 Variables cuasicuantitativas (ordinal)

• Mismas características que las cualitativas pero se agrega la frecuencia
acumulada (también de los porcentajes y proporciones).
• Representación gráfica  Diagrama de barras y de barras acumuladas.
4.3 Variables cuantitativas discretas

• Igual que las anteriores.
• Representación gráfica  igual que la anterior.
DIAGRAMA DE TALLO Y HOJAS

Datos = 12, 12, 14, 15, 16, 20, 21, 23, 24, 25, 27, 33, 34, 36, 45, 45, 48.
Tallo o tronco = izquierda o decenas / Hoja = derecha o unidades.
1|22456
2|013457
3|346
4| 5 5 8
4.4 Variables cuantitativas continuas

• Entre una variable y otra hay infinitos valores. Dependerá del instrumento de
medida la precisión.
• Discretizamos la variable continúa al utilizar un instrumento de medida.
• 1.68 (intervalo elemental), 1.675 (límite exacto inferior) y 1.685 (límite exacto
superior).
• Amplitud del intervalo: mayor-menor.
• Marca de clase o punto medio del intervalo: (mayor + menor)/2. Xi con el que
vamos a trabajar, no con el intervalo.
• Amplitud total: el valor mayor menos el valor menor.
• Tabulación de datos  marca de clase (Xi), ni, fr., proporción, %, además de
fr., p. y % acumuladas.
• Representaciones gráficas  histogramas (siempre para continuas) y polígono
acumuladores o polígono de frecuencias.
TEMA 6. ESTADÍSTICOS DE POSICIÓN Y DE TENDENCIA CENTRAL
(Estadísticos y posición –cuantiles-)
Posición  el centro de la distribución de frecuencias resumido en el valor o valores

alrededor de los cuales se encuentran la totalidad de los datos.
• MEDIA ARITMÉTICA [Xi]

Definición
Es la medida resumen más utilizada.
Cálculo
ANEXO. (Pág. 65). Formulario 30. a) No agrupados y b) agrupados.
X nj Xj nj Xj
1-3 2 2 4
4-6 10 5 50
7-9 7 8 56
10-12 4 11 44
23 154
Media: 154/23=6,70
Tabla para Valores agrupados.
Características
- La media es sensible a los intervalos y a la variación de cada una de las
puntuaciones. Varía una puntuación y varía la media.
- Constituye el “centro de gravedad” de la distribución de frecuencias.
- El mejor índice y el mejor estimador de su parámetro.
No recomendable
- No es posible calcularla si el intervalo mínimo no tiene límite inferior y el
máximo superior. Si no podemos calcular los puntos medios no podemos
calcular la media que exige conocer los puntos medios de todos los intervalos.
- Cuando la distribución de frecuencias es muy asimétrica (puntuaciones
extremas).
- El nivel de medida de las variables para calcular su media debe ser al menos de
intervalo. No nominales ni ordinales.
Propiedades
1. La suma de todas las puntuaciones con respecto a su media es 0: i- )=0
2. Si a todos los datos le sumamos o multiplicamos una constante, la media
quedará aumentada por esa misma constante.
3. Una variable definida como la combinación lineal de otras variables (Y=aX+b)
tiene como media la misma combinación lineal de las medias que intervienen en
su definición: =a +b
4. Si sumamos diferentes variables, la media de la suma es la suma de las
respectivas medias: W=X+Y+Z  = + +
• MEDIANA [n]
Definición
Deja por debajo y por encima el 50% de los datos. Punto medio del intervalo.
Cálculo
a) Datos no agrupados:
Se ordena de < a >. PAR= los dos valores centrales y se calcula el punto medio.
IMPAR=el valor central.
b) Datos agrupados:
ANEXO. (Pág. 65). Formulario 30.
- Li-1  límite inferior del intervalo.
- N  total de las puntuaciones.
- Ni-1  frecuencia acumulada del intervalo anterior, en que está contenida
la mediana.
- ni  frecuencia absoluta del intervalo.
- ai  amplitud del intervalo.
Se debe encontrar siempre N/2 que es el valor intermedio y su intervalo.
Propiedades
1. La suma de las diferencias (en valor absoluto) de n con respecto a su mediana es
igual o menor que la suma de las diferencias en valor absoluto con respecto a
cualquier otro valor: i-k)≥ i-Md)
2. Es menos sensible al cambio de las puntuaciones que la media.
3. Es función de los intervalos elegidos (de su amplitud, número y límites de los
mismos).
4. Menos utilizado que la media.
5. Calculable aunque el intervalo máximo no tenga límite superior y/o el mínimo
tampoco (siempre que éstos intervalos no contengan dentro de sí más del 50% de
los datos).
6. Valor que deja por debajo y por encima el 50% de los datos.
7. Más recomendable que la media cuando es asimétrica.
• MODA
Definición
Es el valor que más se repite (mayor frecuencia).
Cálculo
1. Nivel de intervalo o de razón:
a) Datos no agrupados  valor que más se repite.
b) Datos agrupados  punto medio del intervalo con mayor frecuencia.
2. Nivel ordinal o nominal:
- Valor o categoría a la que corresponde la frecuencia máxima.
Propiedades
1. Muy fácil de calcular.
2. Inconveniente de no ser única. Dentro de una misma distribución pueden
aparecer dos o más valores a los que corresponda la frecuencia máxima o
distribuciones donde todos los intervalos tuvieran igual frecuencia
(distribuciones amodales).
3. Es función de los intervalos elegidos (de su amplitud, número y límites de los
mismos).
4. Calculable aunque el intervalo máximo no tenga límite superior y/o el mínimo
tampoco (siempre que éstos intervalos no contengan dentro de sí más del 50%
de los datos).
• CUARTILES
Definición
Valores de la variable que una vez ordenados los datos dejan por debajo de sí un
porcentaje determinado de los mismos.
a) Centiles o Percentiles:
- Divide la distribución de frecuencias en 100 partes iguales: P1,P2,…,P100
- Ejemplo: P30=valor que deja debajo de si el 30% de los datos.
b) Cuartiles:
- Divide la distribución de frecuencias en 4 partes iguales. En cada uno
hay un 25% de los datos.
- Q1=P25 Q2=P50=Md Q3=P75 Q4=P100
c) Deciles:
- Divide la distribución de frecuencias en 10 partes iguales. En cada uno
hay 10% de los datos.
- D1,D2,D3,…D10
Cálculo
a) Datos no agrupados:
Se calcula igual que la mediana, en realidad esta se corresponde con P50
b) Datos agrupados:
Los calculamos como Percentiles aunque sean cuartiles o deciles.
Misma fórmula que la mediana pero se añade k (el valor del percentil que
queremos calcular).
TEMA 7. ESTADÍSTICOS O MEDIDAS DE DISPERSIÓN O VARIABILIDAD
Variabilidad  indica si esas puntuaciones se encuentran muy próximas entre sí o muy

dispersas. La media indica solo la posición.
• Amplitud total o Rango

Definición
Diferencia entre la puntuación máxima y la mínima y está en la misma métrica que la
variable: Xmax-Xmin
Si tenemos en cuenta datos agrupados en intervalos es (Xmax-Xmin)-1
Propiedades
1. Es muy fácil de calcular.
2. Solo tiene en cuenta los datos extremos. No tiene en cuenta el resto.
No agrupados  no se repiten
• Desviación Media
Agrupados  ni y frecuencia
Definición
- Una forma intuitiva de definirla sería obteniendo las desviaciones de todas las
puntuaciones y sumarlas, pero por la propiedad de que la suma de desviaciones
es 0, esta opción no sirve.
- Dos soluciones:
a) Tomar las desviaciones en valor absoluto (se toma en Desviación
media)
b) Elevarlas al cuadrado (se toma en la varianza)
- La definimos como la media en valor absoluto de n puntuaciones respecto de su
media aritmética.
ANEXO. (Pág. 65). Formulario 31. a) No agrupados y b) agrupados.
Tiempo ni Xi ni Xi | Xi- | ni |Xi- |
1-15 4 8 32 12 48
16-30 4 23 92 3 12
31-45 2 38 76 18 36
10 200 96
=200/10=20 DM=96/100=9.6
Propiedades
1. Fácil de calcular e inteligible.
2. Se usa raramente debido a que los valores absolutos son muy poco manejables
matemáticamente.
3. No tiene buenas propiedades estadísticas y no es base de otros cálculos.
• Varianza [Sx] y Desviación Típica [Sx2]

Definición
Varianza  elevar las desviaciones al cuadrado y promediarlas, es decir, obtener la
media de las desviaciones al cuadrado.
Desviación Típica  raíz cuadrada de la varianza. Siempre positiva.
Sx= x2
Cálculo
a) No agrupados, aunque más cómodo: Sx2= ( 2
i /n)-
2
b) Agrupados, más cómodo: Sx2= ( 2

i /n)-
2
Propiedades
1. Conceptos más utilizados en Psicología.
2. Sensibles a cada una de las puntuaciones.
3. Son función de los intervalos elegidos (amplitud, su número y los límites).
4. La desviación típica viene expresada en las mismas unidades que los datos, no
ocurre lo mismo con la varianza que estaría al cuadrado (datos en m, desviación
en m, varianza en m2).
5. No serán calculables ni recomendables cuando no sea calculable o recomendable
la media como medida de tendencia central. Y será recomendable su uso cuando
lo sea la media.
6. Ambas como medida de variación serán siempre valores positivos (S2≥0 y S≥0)
7. En las transformaciones lineales, la varianza se ve afectada solamente por el
cambio de escala (constante multiplicativa), pero no por el cambio de origen
(constante aditiva)
Si sumamos una constante a un conjunto de puntuaciones, su varianza no se
altera.
Si multiplicamos una constante a un conjunto de puntuaciones, la varianza
quedará multiplicada por el cuadrado de la constante y la desviación típica por el
valor absoluto de esa constante.
• Amplitud Semiintercuartil
Definición
Semidistancia entre el tercer cuartil y el primer cuartil, es decir, entre el percentil 75 y el
percentil 25: Amp ó ASI = Q3-Q1/ 2
También se puede hablar de amplitud intercuartílica. Definido como la distancia entre el

tercer cuartil y el primer cuartil: AQ=Q3-Q1
Cálculo
Amplitud semiintercuartilica: basta con calcular los percentiles 75 y 25 y calcular la
semidistancia entre ambos.
Amplitud intercuartílica: calcular los percentiles 75 y 25 y calcular la distancia entre

ambos.
Propiedad
1. Recomendable cuando muy asimétricas y mediana como medida de tendencia
central (m.t.c.)
2. Podemos calcularlo en caso e que el intervalo máximo carezca de límite superior
y el intervalo mínimo de límite inferior, siempre que el primer y el tercer cuartil
no se encuentren dentro de esos intervalos (igual que la mediana).
3. Definida como la distancia entre dos puntos solo es calculable a nivel de
intervalos y de razón, pero no a nivel meramente ordinal.
4. Menos sensible que la varianza y la desviación típica.
• Coeficiente de Variación
Definición
Para hacer comparables ambas variabilidades (dos variables distintas: peso en gramos y
altura en centímetros) con variables de distinta naturaleza es necesario que vengan
expresadas en números abstractos.
Una medida será tomar Sx/ , este cociente es un número abstracto. Indica el número de
veces que el numerador contiene al denominador, independientemente de lo que ambos
signifiquen (cuantas desviaciones típicas hay en una media).
Cálculo =0 (puntuaciones
tipificadas)
ANEXO. (Pág. 65). Formulario 31. Media de Sx y Sx2 = 1
Propiedades
1. Adimensional (compara la variabilidad de diferentes variables o la misma
variable en diferentes grupos) y abstracta.
2. Para el cálculo de la media diferente de 0.
3. No se ve afectado por el cambio de escalas (multiplicación por una constante)
pero si de origen (suma de una constante).
Esto es, si a unas puntuaciones dadas les sumamos una cantidad, el CV cambiará
y si multiplicamos las puntuaciones por una cantidad el CV se mantendrá
constante.
TEMA 8. ÍNDICES DE FORMA DE LA DISTRIBUCIÓN –una variable-
Asimetría  grado en que los datos se reparten por encima y por debajo de la tendencia
central (examen fácil y difícil).
Asimetría positiva  valores bajos.

Asimetría negativa  valores altos.
CURTOSIS  analiza el grado de concentración que presentan los valores alrededor

de la zona central de la distribución.
Interpretación:
a) Mesocúrtica = 0  curva normal
b) Leptocúrtica > 0  empinada
c) Platicúrtica > 0  aplastada
TEMA 9. DESCRIPCIÓN CONJUNTA DE DOS VARIABLES: CORRELACIÓN
- Variables de tipo lineal (A↑,B↓; A↓,B↑, etc.)
- Para variables de intervalo (nominal u ordinal con otros procedimientos)
- Tipos de relación lineal:
a) Relación lineal positiva o directa: X↑ Y↑; X↓ Y↓; X↔ Y↔.
Motivación y rendimiento.
b) Relación lineral negativa o inversa: X↑ Y↓; X↓ Y↑; X↔ Y↔.
Tiempo de realización de una tarea y número de errores.
c) Relación nula: X ≠ Y ausencia de relación lineal, no ausencia de
relación.
Diagramas de dispersión (representación gráfica: nube de puntos)
Cuantificación de una relación lineal

COVARIANZA (Sxy)
Promedio de los productos cruzados de las puntuaciones diferenciales.
Al hablar de productos cruzados nos referimos al producto para cada sujeto o caso de
sus puntuaciones diferenciales en ambas variables (X e Y):
COVARIANZA datos no agrupados y agrupados. 2ªfórmula en las dos (Pág. 67)
Formulario 34
Interpretación
Sxy positivo: covarianza positiva
Sxy negativo: covarianza negativa
Sxy cero: ausencia de covariancia. Ausencia de relación lineal.
Propiedades
1. El índice es capaz de discriminar entre los tres tipos de relación lineal.
2. Problemas en la interpretación:
a) Depende de las unidades de medidas y de los grupos (sujetos,
hormigas,etc.)
b) Es un valor no acotado (carece de máximos y mínimos estables) con lo
cual no tenemos información sobre su cuantía y es difícil su
interpretación. No dice si la correlación es alta o baja, solo si es +, - o
nula.
Solución
COEFICIENTE DE CORRELACIÓN DE PEARSON (Rxy)
Mide también correlación lineal. Promedio de productos cruzados, pero no de las
puntuaciones diferenciales, sino de las puntuaciones típicas.
En la teoría la correlación de Pearson entre X e Y será: rxy= xi *zyi / n
La correlación nos es más que una covarianza hallada sobre las puntuaciones
tipificadas; por eso se dice que la correlación es una covarianza estandarizada o que es
una covarianza adimensional.
Fórmula teórica poco práctica, por eso se ha derivado en: rxy = Sxy / Sx*Sy
Cálculo (solo no agrupados, agrupados NO)

COEFICIENTE DE CORRELACIÓN DE PEARSON DATOS NO AGRUPADOS
(Pág. 67) Formulario 34
Propiedades
1. No puede valer menos de -1 y más que 1: -1 ≥ 0 ≤ 1.
Cercano a -1: correlación lineal negativa.
Cercano a 0: ausencia de correlación lineal.
Cercano a 1: correlación lineal positiva.
2. Es un valor adimensional, es invariante frente a cualquier unidad de medida –
permite comparar diferentes variables o la misma variable medida en diferentes
grupos-.
Valoración e interpretación de r
1. Hay que separar dos aspectos:
- Cuantía: grado en que la relación entre dos variables queda bien definida
con un índice de asociación lineal como R.
- Sentido: tipo de relación lineal (positiva, negativa o nula).
2. Su interpretación depende del campo de estudio:
- Fiabilidad Test-retest < 0.80 en cualquier test no adecuado.
- Test de personalidad r=30 muy importante.
3. Correlación nula no es ausencia de relación, si no ausencia de relación lineal.
4. Una relación lineal no implica una relación causal.
5. A veces se establecen entre las variables correlaciones espurias: parece existir
una relación entre dos variables y se debe al efecto de otras variables que al
tener una relación con las otras primeras, crea esta falsa relación.
TEMA 10. DESCRIPCIÓN CONJUNTA DE DOS VARIABLES: REGRESIÓN
- Problemas referentes a la predicción o pronóstico de los resultados en una de las
dos variables, conocidos los resultados en la otra.
- Es un paso más de la correlación. Regresión Y sobre X:
- Ejemplo: datos del peso y la altura  con los datos obtenidos, correlación un valor de X para
positiva, predigo otra muestra a partir de ellos. Si mide X, su peso será Y. calcular un valor de Y.
¡No al revés!
• Ecuaciones lineales o Función de la recta

- Se dice que la relación entre dos variables es lineal si entre ellas podemos
escribir la siguiente función: Y = a + b * X
Donde a y b son constantes.
- Cualquier función lineal puede identificarse por medio de dos cantidades:
 La primera es la constante aditiva o sumada, a, que se denomina
ordenada en el origen y que representa el valor que toma Y cuando X
vale 0, e indica el punto que la recta corta el eje de ordenadas.
 La otra cantidad es la constante multiplicativa, b, que se denomina
pendiente de la recta y se interpreta en términos de tasa de cambio, es
decir, en cuanto cambian los valores de Y por cada incremento unitario o
de unidad de X. Si b es negativo  recta inclinada hacia abajo
Si b es positivo  recta inclinada hacia arriba
• Regresión lineal simple

- Denominaciones de las variables:
 Variable predictora: la utiliza para hacer pronósticos (normalmente X)
 Variable criterio: aquella sobre la que hacemos los pronósticos
(normalmente Y)
- Objetivo  buscar la mejor recta de regresión de Y sobre X, es decir, la que
mejor permite predecir los valores de Y conocidos los valores de X. Deseamos
encontrar las constantes a y b, que se representarían como ayx y byx.
- La regresión no es simétrica al contrario de la correlación.
- El modelo de regresión lineal sigue el criterio de mínimos cuadrados que intenta
responder a: ¿qué modelo lineal es aquel con el que en caso de utilizarlo para la
predicción de Y cometeremos un error lo más pequeño posible?
RECTA DE REGRESIÓN DE Y SOBRE X. No agrupados (pág. 68).
Formulario 36

Análisis de Datos en Psicología

Uploaded by

Document Information

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Análisis de Datos en Psicología

Uploaded by

Copyright:

Available Formats

TEMA 1.

Estadística  su objetivo es utilizar datos de una muestra para inferir u obtener

2. Experimento aleatorio y sucesos

Experimento aleatorio simple  acción bien definida con las características:

Espacio Muestral (E)  conjunto de resultados posibles en un experimento (sucesos

DIAGRAMA DE ARBOL –para construir un espacio muestral-

Sucesos aleatorios elementales  CCC, XXX o CXC.

3. Definiciones sobre sucesos

a) Suceso seguro (E)

c) Suceso imposible (φ)

g) Suceso complementaria de A (Ā)

h) Sucesos mutuamente exclusivos o incompatibles

Regla de Laplace  La probabilidad de un suceso es el resultado de:

4.2 Enfoque frecuentista o “a posteriori”

Frecuencia absoluta  número de ocurrencias de un mismo suceso.

4.3 Perspectiva subjetiva

1.3 PROPIEDADES DE LA PROBABILIDAD (pág. 2) Formulario 2

Suceso condicionado  suceso A condicionado por B, si la ocurrencia de B puede hacer

Sucesos independientes  si la ocurrencia de uno cualquiera de ellos no afecta a la

2.1 SUCESOS CONDICIONADOS Y SUCESOS INDEPENDIENTES (pág. 3)

2.3 TEOREMA DE LA PROBABILIDAD TOTAL (pág. 3-4)

TEMA 3. VARIABLES ALEATORIAS: FUNCIÓN DE PROBABILIDAD Y

• Debido a su utilidad, va a ser necesario atribuir números a los elementos del

• Consideremos un experimento con espacio muestral asociado E. Recibe el

• Por convención las V.A. se denotan (X, Y, Z…).

Tipos de Variables Aleatorias

3.1 FUNCIÓN DE PROBABILIDAD DE UNA VARIABLE ALEATORIA

Se denomina función de probabilidad de una variable aleatoria discreta a aquella que

3.2 PROPIEDADES DE LA FUNCIÓN DE PROBABILIDAD (pág. 5)

3.3 FUNCIÓN DE DISTRIBUCIÓN DE UNA VARIABLE ALEATORIA

Diagrama de barras Diagrama acumulado

3.4 PROPIEDADES DE LA FUNCIÓN DE DISTRIBUCIÓN DE UNA

3.5 CARACTERÍSTICAS DE UNA VARIABLE ALEATORIA DISCRETA.

3.6 y 3.7 PROPIEDADES DEL VALOR ESPERADO Y VARIANZA (pág. 7)

x p(x) P(x) x*P(x) X2 X2*p(x)

Variables aleatorias continúas

3.8 DENSIDAD DE PROBABILIDAD DE UNA VARIABLE ALEATORIA

3.9 FUNCIÓN DE DISTRIBUCIÓN DE UNA VARIABLE ALEATORIA

3.11 PARÁMETROS DE UNA VARIABLE ALEATORIA CONTINUA (pág. 9)

Forma de trabajo con las v.a. continuas:

Modelos probabilísticos para una variable aleatoria DISCRETA

Modelos probabilísticos para una variable aleatoria CONTINUA

5.2 APROXIMACIÓN DE LA BINOMIAL A LA NORMAL (pág. 18)

- La distribución binomial pasar la a una normal. Cuanto > n, más se parece la

TABLA: n = g.l.; dentro tabla = valores x; arriba = probabilidad.

5.3.1. DISTRIBUCIÓN CHI-CUADRADO (pág. 19) Formulario 27

5.3.2 DISTRIBUCIÓN t DE STUDENT (pág. 19) Formulario 28

5.3.3. DISTRIBUCIÓN F DE FISHER – SNEDECOR (pág.20) Formulario 29

Norminal y ordinal (cualitativas) - De intervalo y razón (cuantitavias)

Escalas de medición en las Ciencias del Comportamiento

Casi todas las variables psicológicas son de intervalos pero, matemáticamente se

3. Variables en la investigación psicológica

4.2 Variables cuasicuantitativas (ordinal)

4.3 Variables cuantitativas discretas

DIAGRAMA DE TALLO Y HOJAS

4.4 Variables cuantitativas continuas

Posición  el centro de la distribución de frecuencias resumido en el valor o valores

• MEDIA ARITMÉTICA [Xi]

Variabilidad  indica si esas puntuaciones se encuentran muy próximas entre sí o muy

• Amplitud total o Rango

• Varianza [Sx] y Desviación Típica [Sx2]

b) Agrupados, más cómodo: Sx2= ( 2

También se puede hablar de amplitud intercuartílica. Definido como la distancia entre el

x p(x) P(x) xP(x) X2 X2p(x)