You are on page 1of 17

TEMA 1: INTRODUCCIN A LA

PSICOESTADSTICA
1. CONCEPTOS PRELIMINARES
La Psicologa como Ciencia Emprica observa un conjunto de eventos del mundo
real para descubrir las leyes que explican el comportamiento humano bajo
determinadas circunstancias y llevar a cabo un proceso de induccin o
generalizacin inductiva.

1.1 Observar y medir


Los eventos observables pueden verse influidos por numerosos factores o fuentes
de variacin que pueden ser difciles de identificar, medir y controlar .
Se necesita de una herramienta metodolgica especial, como es la estadstica y el
conjunto de procedimientos que posee.

1.2 Por qu usamos la Estadstica?


En situaciones deterministas una misma causa produce siempre un mismo
resultado.
En situaciones aleatorias una misma causa puede producir cualquier resultado
entre varios posibles. En las situaciones aleatorias es necesario recurrir a los
procedimientos proporcionados por la estadstica para poder extraer conclusiones
fiables.

1.3 El origen de la Estadstica


La estadstica nace de dos fuentes:

El clculo de probabilidades: aproximacin matemtica a los juegos de


azar.
Estadstica o ciencia del Estado: dedicada a llevar registros ordenados de
los datos del estado.

En el siglo XIX se unen para constituir la nueva estadstica.

2. DEFINICIN DE ESTADSTICA
Estudia cmo obtener conclusiones de la investigacin emprica mediante el uso de
modelos matemticos.
Definicin de Amn (1979): Una ciencia que recoge, ordena y analiza los datos de
una muestra, extrada de cierta poblacin, y que, a partir de esa muestra,
valindose del clculo de probabilidades, se encarga de hacer inferencias acerca de
la poblacin.
La estadstica se divide normalmente en dos partes: descriptiva e inferencial.
La estadstica descriptiva organiza, sintetiza y aclara la informacin
contenida en un conjunto (muestra) de datos empricos a travs de una serie
de procedimientos.
La estadstica inferencial generaliza, infiere o induce las propiedades de un
conjunto de datos empricos (muestra) al conjunto total de datos (poblacin) a
los que representan, a travs de una serie de estrategias como son el clculo
de probabilidades. Para poder extraer esta inferencia de la muestra a la
poblacin, es preciso que se haya efectuado una seleccin de los datos
adecuada, mediante las tcnicas de muestreo.

3. LA ESTADSTICA Y LA PSICOLOGA
La Estadstica es en s misma una ciencia que, por otro lado, sirve de instrumento
metodolgico para el desarrollo de otras ciencias.

En este sentido la

Psicoestadstica debe ser entendida como una herramienta metodolgica al servicio


de la investigacin emprica, siendo a travs de ella como se obtiene conocimiento
cientfico.

4. MEDIDA: DEFINICIN DE VARIABLE Y ESCALAS


DE MEDIDA
Una variable es una caracterstica que puede tomar diferentes valores.
Estos valores pueden ser de tipo cuantitativo, cualitativo .
Variables cuantitativas
Las variables cuantitativas son aquellas a las que puede asociarse un valor
numrico. Pueden ser discretas o continuas.

Se dice que la variable es discreta cuando no admite un valor intermedio entre dos
cualesquiera. Por ejemplo, el nmero de hijos.
Se dice que es continua cuando admite un valor intermedio entre dos cualesquiera.
Un ejemplo de este tipo puede darse cuando estamos midiendo un tiempo de
respuesta o la altura de una persona. En estos casos el nmero de valores distintos
ser en la prctica finito (en la prctica mediremos en segundos o en dcimas de
segundo, o centsimas, o milsimas,...) pero la continuidad de esta variable
aleatoria radica en el carcter continuo de lo que medimos, es decir, el hecho de
que entre dos valores posibles podramos obtener infinitud de valores ms si
tuvisemos aparatos de medida con la suficiente precisin. Este es el hecho
primordial que diferencia a una variable discreta de una continua.
Variables cualitativas
Las variables cualitativas son aquellas que expresan una cualidad "no medible"
cuyos valores no pueden ordenarse. Por ejemplo, el lugar de nacimiento o
determinados sntomas de una enfermedad.

TEMA 2: ESTADSTICA DESCRIPTIVA


UNIVARIADA
1. MATRIZ DE DATOS
La medicin de fenmenos aleatorios se inicia a partir de la clasificacin de las
observaciones en una matriz de datos. En esta matriz cada fila corresponde a toda
la informacin obtenida de cada uno de los casos observados y cada columna la
respuesta obtenida en cada tipo distinto de informacin .

Nombre Edad
Jorge
Jess
Luis
Ana

7
8
12
11

Nota
Lengua
9
9
7
8

Nota
Matemticas
8
8
5
5

2. TABLA DE FRECUENCIAS
Cuando se recogen los resultados de una observacin y confeccionamos la matriz
de datos, observamos que, normalmente, existen valores que se repiten. A veces,

determinados valores se repiten con ms frecuencia que otros. Es el caso de las


calificaciones de los alumnos, donde, en general, se producirn muchos ms 5, o 6
que 10.
La relacin que existe entre los posibles valores de respuesta y la frecuencia con
que se producen es lo que denominamos Distribucin de frecuencias.
La distribucin de frecuencias se representa usualmente como un cuadro o tabla
denominada tabla de frecuencias, donde en un eje se sitan los posibles valores
de la variable y en el otro las frecuencias asociadas a ese valor. En nuestro ejemplo
las notas de lengua seguiran la siguiente distribucin:
Xi

ni

La Frecuencia absoluta (ni) es el nmero de casos que hay en cada opcin de la


variable.
La suma de todas las frecuencias absolutas es siempre igual a n, siendo n el
nmero total de casos, y se expresa:

Frecuencia relativa ( fi ): Expresa los resultados en proporciones, comparando el


nmero de casos de cada categora de la variable con un valor de referencia, (el 1).
Nos informa si el nmero de casos en cada variable es grande o pequeo.
Se calcula como la frecuencia absoluta relativa al total y se expresa como:

Porcentaje: Nos informa si el nmero de casos en cada variable es grande o


pequeo, expresando los resultados en tantos por ciento, comparando el nmero de
casos de cada categora de la variable con un valor de referencia, el 100.

fi%= (fi)100

Porcentaje acumulado: Nos indica el porcentaje de casos inferiores o iguales a un


determinado valor de la variable.
Se calcula acumulando (sumando) los porcentajes anteriores al porcentaje
correspondiente a un determinado valor de la variable. Solamente tiene sentido si
los valores son ordinales.
En nuestro ejemplo, podemos construir la siguiente tabla de frecuencias:
TABLA DE FRECUENCIAS
Xi

ni

fi

Fi %

0,25

25%

0,25

50%

0,50

100%

3. REPRESENTACIONES GRFICAS
3.1. Diagrama de barras
La representacin grfica ms simple de una distribucin de frecuencias es el
diagrama de barras.
Cada barra representa una categora de la variable
que se est representando que ser ms o menos
larga segn el nmero de casos.
Es un diagrama adecuado para representar tanto
variables cuantitativas discretas como cualitativas.

Se representan los valores o categoras de la variable en el eje de abscisas (eje X),


y la frecuencia absoluta en el eje de ordenadas (eje Y) por medio de barras
(rectngulos).

3.2. Histograma
Cuando la variable es cuantitativa continua, la representacin grfica adecuada es
el histograma.
Cada barra-rectngulo representa un intervalo de categoras de la variable que se
est representando que ser ms o menos grande segn la proporcin de casos.
Obsrvese que en los casos de variables continuas, los diagramas de barra no son
los adecuados.

El nmero de tramos o intervalos en que se agrupa la informacin lo decide el


analista de datos teniendo en cuenta que si los intervalos son muy pequeos, se
pierde menos informacin pero la tabla se hace menos informativa de lo que
realmente est ocurriendo. Si los intervalos son demasiado grandes, puede
perderse excesiva informacin (imaginemos que tomamos intervalos de 50 kg, en
cuyo caso casi toda la poblacin estara comprendida en el tramo de 50 a 100 kg
con lo que poco podemos deducir).

4. ESTADSTICOS DESCRIPTIVOS
Los estadsticos descriptivos son medidas que resumen la informacin contenida en
los datos observados sobre la variable estudiada.

4.1. Medidas de tendencia central


Son un grupo de estadsticos que permiten ver lo dominante, lo tpico o la tendencia
de una distribucin de datos en el sentido de cules son sus valores medios.

La moda es el valor Xi que tiene la frecuencia ms elevada. Es el nico estadstico


que se puede utilizar con variables nominales.
La mediana resume, mediante un nmero, las caractersticas de una variable. Este
nmero es el valor del caso que ocupa la posicin central de la distribucin.
La mediana puede utilizarse con variables ordinales, ya que al tratarse de valores
ordenados se puede calcular el valor que ocupa la posicin central.
Si el nmero de casos de la muestra es impar, ser el valor Xi que queda en el
puesto (n+1)/2.
Si el nmero de casos de la muestra es par, ser la media entre los valores Xi que
queden en los puestos n/2 y (n/2)+1.

La media resume en un valor las caractersticas de una variable teniendo en cuenta


a todos los casos. Solamente puede utilizarse con variables cuantitativas.
Si los datos estn agrupados, la media se calcula como la suma de todos los
valores dividida entre el nmero total de casos.

Si los datos estn agrupados se calcula como la suma de todos los valores
multiplicados por su correspondiente frecuencia absoluta, dividida entre el nmero
total de casos.

4.2. Medidas de variacin o dispersin


A veces ocurre que las medidas de tendencias central, como la media, "engaan"
sobre la verdadera distribucin de la variable, en el caso de que sta sea muy
dispersa. Imagine que en una asignatura con 8 alumnos las calificaciones son

0,0,0,0,10,10,10,10. La media y la mediana resultan ser 5, valor muy alejado de lo


que sucede en realidad.
Las medidas de variacin o dispersin muestran la variabilidad de una distribucin,
indicando por medio de un nmero o estadstico si las diferentes puntuaciones de
una variable estn muy alejadas de la media.
Cuanto mayores son los valores de esos estadsticos ms variabilidad habr.
Cuanto menores son, ms homogneas son las puntuaciones respecto a la
media. De este modo se puede saber si todos los casos son parecidos o hay
grandes diferencias entre ellos.

El rango o recorrido es la medida de la variabilidad de una distribucin ms


sencilla. Mide la amplitud de una distribucin de frecuencias restndole al valor
mayor el valor menor.
Rango = Mximo - Mnimo
La varianza sesgada o varianza (S2x) mide la distancia existente entre los valores
de la muestra y la media. Se calcula como el promedio de las puntuaciones
diferenciales elevadas al cuadrado.

Al obtenerse como suma de cuadrados, la varianza siempre ser mayor que cero.
Mientras ms se aproxima a cero, ms concentrados estn los valores de la
muestra alrededor de la media. Por el contrario, mientras mayor sea la varianza
ms dispersos estn.
La desviacin tpica sesgada o desviacin tpica (Sx) es muy til para el estudio
de la variabilidad de los datos. Este valor acenta el efecto de las grandes
desviaciones y es siempre superior a la desviacin media. Se calcula como la raz
cuadrada de la varianza.

La mayor ventaja de la desviacin tpica se observar cuando estudiemos las


distribuciones denominadas normales.

La varianza insesgada
diferentes propiedades.

mide lo mismo que la varianza sesgada, aunque tienen

La desviacin tpica insesgada es por tanto:

4.3. Medidas de posicin


Estas medidas permiten conocer otros aspectos caractersticos de la distribucin
que no son los valores centrales.

Las medidas de posicin son estadsticos que indican la posicin relativa que ocupa
un sujeto en una distribucin de frecuencias.

Percentiles o Centiles Ck
Un centil es una puntuacin Xi que deja debajo de s un porcentaje acumulado K
CK=Xi donde K=1, 2, ., 99
Los centiles son 99 valores de la variable X que dividen la distribucin en 100
secciones ( cada una con la centsima parte de las n observaciones) . Son tiles
para hacer valoraciones de las puntuaciones de los sujetos en cuanto a su grupo
de referencia.
Estas puntuaciones indican la posicin relativa de un sujeto en su grupo de
referencia
Dependen de la forma de la distribucin de frecuencias.
Xi

ni

fi

Fi %

0,25

25%

0,25

50%

0,50

100%

En el ejemplo la puntuacin 8 es el centil 50 . Un 50% de los sujetos no supera la


puntuacin 8.
Clculo de Centiles
1) Clculo directo
K xi Fa 100

a) En puntuaciones observadas
b) En puntuaciones no observadas

K xi

xi xi 1

xi 1 xi 1 )

Fxi 1 Fxi 1 )

Fxi 1

Donde
xi es el valor cuyo centil se quiere determinar
x i-1 valor observado inmediatamente inferior a x i
x i+1 valor observado inmediatamente superior a x i
Fi+1 porcentaje acumulado valor inmediatamente superior

Fi -1 porcentaje acumulado del valor inmediatamente inferior


2) Clculo inverso
Si se desea conocer la puntuacin correspondiente a un centil
a) En puntuaciones observados CK=Xi
b) En puntaciones no observadas
( Fxi Fxi 1 )( xi 1 xi 1
X i 1
( Fxi 1 Fxi 1 )

C K Xi

Otras puntuaciones equivalentes son los deciles , y cuartiles ( Q1=C25, Q2=C50,


Q3=C75)

El recorrido Inter-cuartil (RIC) o amplitud Inter-cuartil es una medida que sirve


para ver la diferencia entre el primer cuartil y el tercer cuartil de una distribucin de
datos. Este estadstico se utiliza sobre todo en el anlisis exploratorio de los datos a
partir de medidas de posicin.
RIC = Tercer cuartil Primer cuartil

Puntuacin Diferencial o desviacin a la media,


Xi, es la diferencia de cada valor respecto a la media de la muestra en la que se
incluye.
Puntuacin diferencial < 0 : El valor Xi est por debajo de la media
Puntuacin diferencial = 0 : El valor Xi es igual a la media
Puntuacin diferencial > 0 : El valor Xi est por encima de la media

Puntuacin tpica
Zx es el valor Xi llevado a una escala de valores Z x, que son nuevas variables
expresadas en unidades de desviacin tpica y se interpreta como el nmero de
unidades de desviaciones estndar que tiene ese resultado por encima o por
debajo de la media.

Frmula para la tipificacin de cualquier puntuacin o valor Xi:

Zx < 0 : Puntuacin por debajo de la media


Zx = 0 : Puntuacin igual a la media
Zx > 0 : Puntuacin por encima de la media
Las variables tipificadas tienen una serie de propiedades que las harn muy tiles
para comparar resultados:

La media y la mediana coinciden y su valor es 0 y la varianza y desviacin


tpica es igual a 1.
Si la distribucin de la variable Z es normal, sus valores van desde - a + ,
aunque toma su valor asinttico (roza el eje X) a partir del -3 y +3
Se puede conocer la proporcin de casos en cualquier intervalo de la
distribucin. Por ejemplo, entre la media y -2 a +2 unidades de DT
(exactamente desde -1.96 a 1.96) estn comprendidos el 95% de los casos.

Proporciones, reas y probabilidad bajo la curva normal


Si la distribucin de una variable es normal podemos asociar directamente una
proporcin de la curva a una puntuacin. Eso es as debido al proceso de
estandarizacin.
En la siguiente figura se representa la distribucin normal con varios ejes de abcisas
,para una facilitar una mejor comprensin de las relaciones entre puntuaciones
directas, estndar(o tpicas) , proporciones, reas, percentiles, e incluso categoras
de puntuaciones directas.

El primer eje recoge las desviaciones estndar, y su necesaria coincidencia con el


tercer eje ( puntuaciones z) .
El segundo eje, ( equivalencia en percentiles) se encuentra relacionado con las
lneas verticales presentados bajo la curva. De tal modo que, la suma acumulativa,
de izquierda a derecha, de los porcentajes expresados dentro de la distribucin,
coincide con la magnitud del percentil presentado en el tercer eje.
El penltimo y ultimo eje de abcisas muestran los cociente intelectual de desviacin
y C.I. .
Se puede conocer proporciones, reas o probabilidades conociendo una o varias
puntuaciones directas mediante el proceso de estandarizacin. Y a la inversa,
partiendo de una proporcin o rea podemos obtener una puntuacin directa.
a) Si tenemos una puntuacin directa para obtener la proporcin o porcentaje :
1) Calculamos en primer lugar la puntuacin Z
2) con esta puntuacin z calculada se acude la tabla que resume las
proporciones de reas acumuladas hasta el punto z
http://www.uv.es/meliajl/Docencia/Tablas/ZColaIzq.PDF

B) Si nos dan la proporcin o porcentaje :


1) Desde la tabla obtenemos la puntuacin z normalizada
2) Transformamos la puntuacin segn la ecuacin:
Xi= z + Media
Ejemplo de clculo de proporcin o porcentaje
Ana acaba de ser evaluada con el WAIS y ha obtenido un resultado de 88. Qu
porcentaje de la poblacin tiene mejores resultados que l? y qu porcentaje
obtiene resultados ms bajos?. (El C.I se distribuye con Media 100 y desviacin 15)
1 Se estandariza la puntuacin z = (88-100)/15= - 0.8
2 En la tabla z buscamos la proporcin acumulada bajo la curva normal. La primera
columna contiene las puntuaciones z con un decimal, mientras que la segunda
columna incluye el segundo decimal. El punto de interseccin entre la columna y la
fila recoge la proporcin acumulada hasta esa puntuacin z. La interseccin entre la
fila -0.8 y la columna 0.0 da una proporcin de 0.2119.
Si a la unidad le restamos lo que queda por debajo de la z sabremos lo que queda
por encima de ese punto: 1 - 0.2119 = 0.781. Es decir que el 78% obtiene
resultados ms elevados que Ana, frente a un 21% a los que supera Ana.

Ejemplo de clculo de puntuacin


Entre qu valores se encuentra el 95% central de la poblacin general de C.I ?
Necesitamos conocer la puntuacin z asociada al 95% central. Si observamos la
tabla o el grfico observamos que el 95% est asociado a los valores -1,96, +1,96
Sustituyendo en la ecuacin
Xi= z + Media
Las puntuaciones son C.I.= 70,6 y C.I.= 129.4

4.4. Medidas de la forma de la distribucin

El concepto de asimetra o sesgo se refiere a si la curva que forman los valores de


la serie presenta la misma forma a izquierda y derecha de un valor central (media
aritmtica).
Segn el grado de asimetra una distribucin puede ser:

Simtrica: si existe la misma concentracin de valores a la derecha y a la


izquierda de la media.

Asimtrica positiva: si existe mayor concentracin de valores a la derecha


de la media que a su izquierda.

Asimtrica negativa: si existe mayor concentracin de valores a la izquierda


de la media que a su derecha.

Para medir el nivel de asimetra se utiliza el llamado Coeficiente de Asimetra de


Fisher, F1,,que viene definido:
k

(x X ) n
3

i 1

F1

N
S3

Los resultados pueden ser los siguientes:


F1 = 0 : Distribucin simtrica: igual que la normal
F1 > 0 : Distribucin asimtrica positiva: desplazada hacia la derecha.
F1 < 0 : Distribucin asimtrica negativa: desplazada hacia la izquierda.
La Curtosis o apuntamiento analiza el grado de concentracin que presentan los
valores alrededor de la zona central de la distribucin.
El patrn con el que se compara la forma del grfico es la distribucin normal.
Segn el grado de curtosis, una distribucin pueden ser:

Mesocrtica: presenta un grado de concentracin medio alrededor de los


valores centrales de la variable.

Leptocrtica: presenta un elevado grado de concentracin alrededor de los


valores centrales de la variable.

Platicrtica: presenta un reducido grado de concentracin alrededor de los


valores centrales de la variable.

Para medir el nivel de curtosis se utiliza el Coeficiente de Curtosis, definido por la


siguiente frmula:

( x x ) 4 ni
i 1 N
Cr
3
Sx 4
K

Los resultados pueden ser los siguientes:


Cr = 0 : Distribucin mesocrtica: igual que la normal.
Cr > 0 : Distribucin leptocrtica: ms apuntada que la normal.
Cr < 0 : Distribucin platicrtica: ms aplastada que la normal.

You might also like