Professional Documents
Culture Documents
Tema 2
Tema 2
2.1. INTRODUCCIÓN
Los fenómenos psicológicos no suelen ser constantes, por lo que será necesario que
junto a una medida que indique el valor alrededor del cual se agrupan los datos, se asocie una
medida que haga referencia a la variabilidad que refleje dicha fluctuación.
En este sentido pueden examinarse varias características, siendo las más comunes:
A lo largo de este tema y, siguiendo este orden, iremos estudiando los estadísticos que
nos van a orientar sobre cada uno de estos niveles de información: valores alrededor de los
cuales se agrupa la muestra, la mayor o menor fluctuación alrededor de esos valores, nos
interesaremos en ciertos valores que marcan posiciones características de una distribución de
frecuencias así como por su forma.
2.2.1. La Moda
ÍNDICES DE POSICIÓN.
MEDIA ARITMÉTICA
DATOS AGRUPADOS
3. Si a los valores de una variable se les suma una constante, la media de las nuevas
puntuaciones será igual a la media original más la nueva constante.
entonces
4. Si a los valores de una variable se les multiplica por una constante, la media de los
nuevos valores es igual al producto de la media original por el factor.
entonces
A pesar de las buenas propiedades que ofrece la media, ésta posee algunos
inconvenientes:
Uno de ellos es que es muy sensible a los valores extremos de la variable: ya que todas las
observaciones intervienen en el cálculo de la media, la aparición de una observación
extrema, hará que la media se desplace en esa dirección. En consecuencia,
no es recomendable usar la media como medida central en las distribuciones muy
asimétricas.
Depende de la división en intervalos en el caso de variables continuas.
Si consideramos una variable discreta, por ejemplo, el número de hijos en las familias de
Almería el valor de la media puede no pertenecer al conjunto de valores de la variable; por
ejemplo hijos.
La mediana (Md) es, una vez ordenados los datos, el valor que ocupa la posición
central en la distribución. Se la considera el “centro geográfico” de la distribución de
frecuencias.
Así, para los datos sin agrupar en intervalos habrá que tener en cuenta si el número de
datos es impar: en este caso será un dato el que ocupa la posición central en la distribución y
coincidirá con la median. Si por el contrario el número de datos es par, pero los dos datos
centrales son distintos, aproximaremos el valor de la mediana por la media aritmética de
ambos.
ÍNDICES DE POSICIÓN.
MEDIANA
Ejemplo
Consideramos una tabla estadística relativa a una variable continua, de la que nos dan
los intervalos, las marcas de clase Xi, y las frecuencias absolutas, ni.
Xi ni
1 2
2 1
3 4
4 3
5 2
Para calcular la media podemos añadir una columna con las cantidades niXi. La suma
de los términos de esa columna dividida por n = 12 es la media:
Xi ni Ni niXi
1 2 2 2
2 1 3 2
3 4 7 12
4 3 10 12
5 2 12 10
12 38
Un cuantil es un punto de una distribución de frecuencias que deja por debajo y por encima
de sí un conjunto de observaciones cuya proporción conocemos.
Deciles
Cuantiles Cuartiles
Percentiles
- Cuartiles. Dividen una escala numérica en cuatro partes iguales. Hay tres cuartiles: Q 1,
Q2 y Q3. Q1 deja por debajo de sí el 25 % de las observaciones; Q 2 deja por debajo de
sí el 50 % de las observaciones y coincide con la mediana; y Q 3 deja por debajo de sí
el 75 % de las observaciones.
- Deciles. Son los cuantiles que dividen la escala numérica en 10 partes iguales. Hay
nueve deciles.
- Percentiles. Dividen una escala numérica en 100 partes iguales. Hay 99 percentiles.
Md
Q1 Q2 Q3
D1 D2 D3 D4 D5 D6 D7 D8 D9
ÍNDICES DE POSICIÓN.
PERCENTIL K
Rango Percentil. Es el porcentaje de observaciones que deja por debajo de sí una puntación
concreta o conocida. Es decir, sería el opuesto del Percentil.
ÍNDICES DE POSICIÓN.
RANGO PERCENTIL
2.2.6. EJEMPLO
Xi ni Ni niXi
1 22 22 22
2 26 48 52
3 13 61 39
4 24 85 96
5 15 100 75
100 284
Los estadísticos de tendencia central o posición nos indican donde se sitúa un grupo
de puntuaciones. Los de variabilidad o dispersión nos indican si esas puntuaciones o valores
están próximos entre sí o si por el contrario están muy dispersas.
Si la mayoría de los datos de una distribución están muy próximos unos de otros, la
situación no es la misma que si las distancias entre los datos son grandes, aunque el valor del
estadístico que hayamos elegido para representar la tendencia central sea el mismo. En el
primer caso, nos encontramos ante una distribución que podemos considerar como muy
homogénea, es decir, las diferencias individuales son pequeñas; mientras que en el segundo
caso, la distribución refleja la existencia de diferencias individuales importantes, o lo que es
lo mismo, que existe heterogeneidad. De ahí el interés en conocer los estadísticos que miden
dispersión, para poder utilizarlos como complemento a los índices de posición que hemos
calculado (Amón, 1992; Botella, León y San Martín, 1993).
La desviación media guarda las mismas dimensiones que las observaciones. La suma
de valores absolutos es relativamente sencilla de calcular, pero esta simplicidad tiene un
inconveniente: desde el punto de vista geométrico, la distancia que induce la desviación
media en el espacio de observaciones no es la natural (no permite definir ángulos entre dos
conjuntos de observaciones). Esto hace que sea muy engorroso trabajar con ella a la hora de
hacer inferencia a la población.
ÍNDICES DE DISPERSIÓN.
DESVIACIÓN MEDIA
DATOS AGRUPADOS
a la media se compensan al haber términos en esa suma que son de signos distintos.
Para tener el mismo signo al sumar las desviaciones con respecto a la media podemos
realizar la suma con valores absolutos. Esto nos lleva a la Dm, pero como hemos
mencionado, tiene poco interés por las dificultades que presenta.
ÍNDICES DE DISPERSIÓN.
VARIANZA Y DESVIACIÓN TÍPICA
ÍNDICE DATOS SIN AGRUPAR DATOS AGRUPADOS
VARIANZA
DESVIACIÓN TÍPICA
1. Si a los valores de una variable se les suma una constante, las nuevas puntuaciones
tendrán la misma varianza.
entonces
2. Si a todos los valores de una variable se les multiplica por una constante, la varianza
de las nuevas puntuaciones será igual a la varianza original multiplicada por la
constante al cuadrado.
entonces
ÍNDICES DE DISPERSIÓN.
MEDIANA DE LAS DESVIACIONES ABSOLUTAS
MEDIANA DE LAS
DESVIACIONES
ABSOLUTAS
2.3.4. EJEMPLO
Xi ni Ni niXi
Calcular:
Para calcular el índice MAD, ordenamos de menor a mayor, de izquierda a derecha los
valores : 0,35 – 0,65 – 1,35 – 1,65 – 2,35. El índice MAD es la mediana de estos
valores (en este caso, el valor central):
Si la distribución es simétrica, los índices valdrán cero, si son menores que cero existe
asimetría negativa y si son mayores que cero existe asimetría positiva. Si existe asimetría
negativa en la distribución de frecuencias habrá más valores altos que bajos y si existe
asimetría positiva ocurre al contrario, hay más valores bajos que altos.
COEFICIENTE
1 DE FISHER
ÍNDICE DE
SESGO
BASADO EN
LOS TRES
CUARTILES
Distribuciones simétricas
Cuando los índices valgan cero la distribución de los datos será normal o mesocúrtica,
si son menores que cero la distribución es platicúrtica y si son mayores que cero será
leptocúrtica.
2 DE
FISHER
K DE
KELLEY
2.4.3. EJEMPLO
Xi ni Ni Xini
12 8 8 96 -4,8 23,04 -110,592 530,8416 184,32 -884,736 4246,7328
14 16 24 224 -2,8 7,84 -21,952 61,4656 125,44 -351,232 983,4496
16 15 39 240 -0,8 0,64 -0,512 0,4096 9,6 -7,68 6,144
18 13 52 234 1,2 1,44 1,728 2,0736 18,72 22,464 26,9568
20 10 62 200 3,2 10,24 32,768 104,8576 102,4 327,68 1048,576
22 6 68 132 5,2 27,04 140,608 731,1616 162,24 843,648 4386,9696
24 1 69 24 7,2 51,84 373,248 2687,3586 51,84 373,248 2687,3856
26 1 70 26 9,2 84,62 778,688 7163,9296 84,64 778,688 7163,9296
70 1176 17,6 206,72 1193,984 11282,1248 739,2 1102,08 20550,144
Mo = 14
P10 = 12,38
P25 = 14,09
P90 = 21,67
SIMETRÍA
CURTOSIS