You are on page 1of 16

Tema 2. Estadística con una variable.

TEMA 2. ESTADÍSTICA CON UNA VARIABLE.

2.1. INTRODUCCIÓN

Los fenómenos psicológicos no suelen ser constantes, por lo que será necesario que
junto a una medida que indique el valor alrededor del cual se agrupan los datos, se asocie una
medida que haga referencia a la variabilidad que refleje dicha fluctuación.

En este sentido pueden examinarse varias características, siendo las más comunes:

La tendencia central de los datos;

La dispersión o variación con respecto a este centro;

Los datos que ocupan ciertas posiciones.

La simetría de los datos.

La forma en la que los datos se agrupan.

El análisis descriptivo de una variable se refiere a aquellos procedimientos que nos


permiten resumir la información recogida en los datos, para cada una de las variables que se
estudian.

MEDIDAS REPRESENTATIVAS DE UN CONJUNTO DE DATOS ESTADÍSTICOS

Fundamentos del Análisis de Datos en Psicología


Área de Metodología de las Ciencias del Comportamiento
Universidad de Almería
Tema 2. Estadística con una variable.
10

A lo largo de este tema y, siguiendo este orden, iremos estudiando los estadísticos que
nos van a orientar sobre cada uno de estos niveles de información: valores alrededor de los
cuales se agrupa la muestra, la mayor o menor fluctuación alrededor de esos valores, nos
interesaremos en ciertos valores que marcan posiciones características de una distribución de
frecuencias así como por su forma.

2.2.- ÍNDICES DE TENDENCIA CENTRAL Y POSICIÓN

2.2.1. La Moda

Llamaremos moda (Mo) a cualquier máximo relativo de la distribución de


frecuencias, es decir, cualquier valor de la variable que posea una frecuencia mayor que su
anterior y su posterior.

La moda es el valor más frecuente, de forma que si se trata de datos no agrupados es el


valor que más veces se repite. Si es una variable cuantitativa discreta, es el valor de la variable
al que corresponde la frecuencia más alta. Si es una variable cuantitativa continua, es el
intervalo al que corresponde la máxima frecuencia, hablaríamos en este caso, de intervalo
modal.

Una distribución de frecuencias puede contar con una o varias modas.

2.2.1.1. Propiedades de la Moda

De la moda destacamos las siguientes propiedades:

 Es muy fácil de calcular.


 Puede no ser única.
 Es función de los intervalos elegidos a través de su amplitud, número y límites de los
mismos.
 Aunque el primero o el último de los intervalos no posean extremos inferior o superior
respectivamente, la moda puede ser calculada.

2.2.2. Centro de Gravedad de un grupo de datos: La Media Aritmética

La media aritmética es el punto en el que se concentra el peso de la distribución


de frecuencias. Se la considera el “centro de gravedad” de la distribución de frecuencias.

ÍNDICES DE POSICIÓN.
MEDIA ARITMÉTICA

DATOS SIN AGRUPAR

DATOS AGRUPADOS

2.2.2.1. PROPIEDADES DE LA MEDIA ARITMÉTICA

Fundamentos del Análisis de Datos en Psicología


Área de Metodología de las Ciencias del Comportamiento
Universidad de Almería
Tema 2. Estadística con una variable.
11

1. La suma de las diferencias de todas las puntuaciones respecto de la media es cero.

2. La suma de estas diferencias elevadas al cuadrado es mínima.

3. Si a los valores de una variable se les suma una constante, la media de las nuevas
puntuaciones será igual a la media original más la nueva constante.

entonces

4. Si a los valores de una variable se les multiplica por una constante, la media de los
nuevos valores es igual al producto de la media original por el factor.

entonces

5. La media total de un grupo de datos es igual a la media ponderada (por su tamaño


muestral) de las medias de cada grupo.

2.2.2.2. INCONVENIENTES DE LA MEDIA ARITMÉTICA

A pesar de las buenas propiedades que ofrece la media, ésta posee algunos
inconvenientes:

 Uno de ellos es que es muy sensible a los valores extremos de la variable: ya que todas las
observaciones intervienen en el cálculo de la media, la aparición de una observación
extrema, hará que la media se desplace en esa dirección. En consecuencia,
 no es recomendable usar la media como medida central en las distribuciones muy
asimétricas.
 Depende de la división en intervalos en el caso de variables continuas.
 Si consideramos una variable discreta, por ejemplo, el número de hijos en las familias de
Almería el valor de la media puede no pertenecer al conjunto de valores de la variable; por
ejemplo hijos.

2.2.3. Tendencia central de un grupo de puntuaciones: La Mediana

Fundamentos del Análisis de Datos en Psicología


Área de Metodología de las Ciencias del Comportamiento
Universidad de Almería
Tema 2. Estadística con una variable.
12

La mediana (Md) es, una vez ordenados los datos, el valor que ocupa la posición
central en la distribución. Se la considera el “centro geográfico” de la distribución de
frecuencias.

Así, para los datos sin agrupar en intervalos habrá que tener en cuenta si el número de
datos es impar: en este caso será un dato el que ocupa la posición central en la distribución y
coincidirá con la median. Si por el contrario el número de datos es par, pero los dos datos
centrales son distintos, aproximaremos el valor de la mediana por la media aritmética de
ambos.

ÍNDICES DE POSICIÓN.
MEDIANA

2.2.3.1. PROPIEDADES DE LA MEDIANA

1. La Mediana no se ve afectada por puntuaciones extremas.


2. El valor de la Mediana es función de los intervalos elegidos.
3. Cuando una distribución de datos es muy asimétrica, es preferible la Mediana como
índice de tendencia central, antes que la Media.
4. La Mediana es un índice de posición además de un índice de tendencia central.

2.2.4. RELACIÓN ENTRE MEDIA, MEDIANA Y MODA

En el caso de distribuciones unimodales, la mediana está con frecuencia comprendida


entre la media y la moda (incluso más cerca de la media).

En distribuciones que presentan cierta inclinación, es más aconsejable el uso de la


mediana. Sin embargo, en estudios relacionados con propósitos estadísticos y de inferencia
suele ser más apta la media.

En términos de la naturaleza de la variable, será necesario tener en cuenta ciertas


recomendaciones de cálculo.

Variables cualitativas: moda.


Variables cuasicuantitativas: moda y mediana.
Variables cuantitativas: moda, mediana y media.

Veamos un ejemplo de cálculo de estas tres magnitudes.

Fundamentos del Análisis de Datos en Psicología


Área de Metodología de las Ciencias del Comportamiento
Universidad de Almería
Tema 2. Estadística con una variable.
13

Ejemplo

Consideramos una tabla estadística relativa a una variable continua, de la que nos dan
los intervalos, las marcas de clase Xi, y las frecuencias absolutas, ni.

Xi ni
1 2
2 1
3 4
4 3
5 2

Para calcular la media podemos añadir una columna con las cantidades niXi. La suma
de los términos de esa columna dividida por n = 12 es la media:

Xi ni Ni niXi
1 2 2 2
2 1 3 2
3 4 7 12
4 3 10 12
5 2 12 10
12 38

La mediana es el valor de la variable que deja por debajo de sí a la mitad de las n


observaciones, es decir 6. Construimos la tabla de las frecuencias absolutas acumuladas, Ni, y
vemos que eso ocurre en la modalidad tercera, es decir,

Para el cálculo de la moda, lo primero es encontrar las puntuaciones modales,


buscando los máximos relativos en la columna de las frecuencias absolutas, ni. Vemos que
hay una moda, correspondiente a la modalidad Xi = 3. La moda se calcula como la puntuación
con la frecuencia absoluta (ni) más alta.

En este caso, la moda toma el valor 3.

Fundamentos del Análisis de Datos en Psicología


Área de Metodología de las Ciencias del Comportamiento
Universidad de Almería
Tema 2. Estadística con una variable.
14

2.2.5. Posición: Cuantiles, Deciles, Cuartiles, Centiles y Rango Percentil

Una característica descriptiva de un grupo de datos es su posición, es decir, el valor o


valores alrededor de los cuales se encuentra la totalidad de los datos (Amón, 1992; Botella,
León y San Martín, 1993).

Un cuantil es un punto de una distribución de frecuencias que deja por debajo y por encima
de sí un conjunto de observaciones cuya proporción conocemos.

Deciles
Cuantiles Cuartiles
Percentiles

- Cuartiles. Dividen una escala numérica en cuatro partes iguales. Hay tres cuartiles: Q 1,
Q2 y Q3. Q1 deja por debajo de sí el 25 % de las observaciones; Q 2 deja por debajo de
sí el 50 % de las observaciones y coincide con la mediana; y Q 3 deja por debajo de sí
el 75 % de las observaciones.
- Deciles. Son los cuantiles que dividen la escala numérica en 10 partes iguales. Hay
nueve deciles.
- Percentiles. Dividen una escala numérica en 100 partes iguales. Hay 99 percentiles.

Md

Q1 Q2 Q3

D1 D2 D3 D4 D5 D6 D7 D8 D9

P10 P20 P30 P40 P50 P60 P70 P80 P90

ÍNDICES DE POSICIÓN.
PERCENTIL K

Fundamentos del Análisis de Datos en Psicología


Área de Metodología de las Ciencias del Comportamiento
Universidad de Almería
Tema 2. Estadística con una variable.
15

Rango Percentil. Es el porcentaje de observaciones que deja por debajo de sí una puntación
concreta o conocida. Es decir, sería el opuesto del Percentil.

ÍNDICES DE POSICIÓN.
RANGO PERCENTIL

2.2.6. EJEMPLO

Xi ni Ni niXi
1 22 22 22
2 26 48 52
3 13 61 39
4 24 85 96
5 15 100 75
100 284

Calcular: , Md, Mo, Q1, Q3, P54,5, RP3

Fundamentos del Análisis de Datos en Psicología


Área de Metodología de las Ciencias del Comportamiento
Universidad de Almería
Tema 2. Estadística con una variable.
16

2.3.- ÍNDICES DE VARIABILIDAD

Los estadísticos de tendencia central o posición nos indican donde se sitúa un grupo
de puntuaciones. Los de variabilidad o dispersión nos indican si esas puntuaciones o valores
están próximos entre sí o si por el contrario están muy dispersas.

Si la mayoría de los datos de una distribución están muy próximos unos de otros, la
situación no es la misma que si las distancias entre los datos son grandes, aunque el valor del
estadístico que hayamos elegido para representar la tendencia central sea el mismo. En el
primer caso, nos encontramos ante una distribución que podemos considerar como muy
homogénea, es decir, las diferencias individuales son pequeñas; mientras que en el segundo
caso, la distribución refleja la existencia de diferencias individuales importantes, o lo que es
lo mismo, que existe heterogeneidad. De ahí el interés en conocer los estadísticos que miden
dispersión, para poder utilizarlos como complemento a los índices de posición que hemos
calculado (Amón, 1992; Botella, León y San Martín, 1993).

La dispersión de una distribución de frecuencias se suele evaluar en términos de la


distancia que existe entre los datos y un valor representativo del centro de la distribución. El
centro del grupo que se utiliza como referencia para establecer la expresión de los estadísticos
de dispersión suele ser la media aritmética o la mediana. Si la distribución de frecuencias es
homogénea, utilizaremos la media aritmética, en caso contrario, cuando existen valores
aislados muy alejados del resto de los datos, la representatividad de la media aritmética es
discutible y utilizaremos como centro la mediana (De la Fuente y García, 1998).

2.3.1. Desviación Media

Se define la Desviación Media (Dm) como la media de las diferencias en valor


absoluto de los valores de la variable a la media aritmética. Es un índice de dispersión basado
en la media y se mide en la misma unidad de medida que la variable original.

La desviación media guarda las mismas dimensiones que las observaciones. La suma
de valores absolutos es relativamente sencilla de calcular, pero esta simplicidad tiene un
inconveniente: desde el punto de vista geométrico, la distancia que induce la desviación
media en el espacio de observaciones no es la natural (no permite definir ángulos entre dos
conjuntos de observaciones). Esto hace que sea muy engorroso trabajar con ella a la hora de
hacer inferencia a la población.

Fundamentos del Análisis de Datos en Psicología


Área de Metodología de las Ciencias del Comportamiento
Universidad de Almería
Tema 2. Estadística con una variable.
17

ÍNDICES DE DISPERSIÓN.
DESVIACIÓN MEDIA

DATOS SIN AGRUPAR

DATOS AGRUPADOS

2.3.2. Varianza y Desviación Típica

Como forma de medir la dispersión de los datos hemos descartado:


 , pues sabemos que esa suma vale 0, ya que las desviaciones con respecto

a la media se compensan al haber términos en esa suma que son de signos distintos.
 Para tener el mismo signo al sumar las desviaciones con respecto a la media podemos
realizar la suma con valores absolutos. Esto nos lleva a la Dm, pero como hemos
mencionado, tiene poco interés por las dificultades que presenta.

Si las desviaciones con respecto a la media las consideramos al cuadrado, ,


de nuevo obtenemos que todos los sumandos tienen el mismo signo (positivo). Esta es además
la forma de medir la dispersión de los datos de forma que sus propiedades matemáticas son
más fáciles de utilizar. Vamos a definir entonces dos estadísticos que serán fundamentales en
el resto del curso: la varianza y la desviación típica.

La varianza, , se define como la media de las diferencias cuadráticas de n

puntuaciones con respecto a su media aritmética, es decir


La varianza no tiene la misma magnitud que las observaciones (por ejemplo, si las
observaciones se miden en metros, la varianza lo hace en metros 2). Si queremos que la medida
de dispersión sea de la misma dimensionalidad que las observaciones, bastará con tomar su
raíz cuadrada. Por ello se define la desviación típica, Sx, como

Las siguientes propiedades de la varianza y la desviación típica son importantes a la


hora de hacer un cambio de origen y escala a una variable:

 La Varianza y la Desviación Típica no se ven afectadas si al conjunto de valores de la


variable se le añade una constante
 Si además cada observación es multiplicada por otra constante, en este caso la Varianza
cambia en relación al cuadrado de la constante. La Desviación Típica cambia en relación
al valor absoluto de la constante.

Fundamentos del Análisis de Datos en Psicología


Área de Metodología de las Ciencias del Comportamiento
Universidad de Almería
Tema 2. Estadística con una variable.
18

ÍNDICES DE DISPERSIÓN.
VARIANZA Y DESVIACIÓN TÍPICA
ÍNDICE DATOS SIN AGRUPAR DATOS AGRUPADOS

VARIANZA

DESVIACIÓN TÍPICA

2.3.2.1. PROPIEDADES DE LA VARIANZA

Con carácter general, el estadístico de dispersión más adecuado para representar la


distribución de frecuencias es la varianza o la desviación típica, dado que en su cálculo
intervienen todas las puntuaciones de la distribución y son mejores estimadores de su
parámetro poblacional que otros estadísticos de dispersión.

1. Si a los valores de una variable se les suma una constante, las nuevas puntuaciones
tendrán la misma varianza.

entonces

2. Si a todos los valores de una variable se les multiplica por una constante, la varianza
de las nuevas puntuaciones será igual a la varianza original multiplicada por la
constante al cuadrado.

entonces

3. La varianza y la desviación típica son sensibles a la variación de cada una de las


puntuaciones. Y en el caso de agrupaciones de intervalos estarán en función de los
intervalos elegidos.

2.3.3. Índice M.A.D.

En las distribuciones de frecuencias en las que existen valores muy alejados de la


mayoría de los datos sabemos que la media aritmética no resulta una representación adecuada
del grupo y en su lugar es conveniente utilizar la mediana. En estos casos si se quiere estudiar
la dispersión de ese grupo habrá que utilizar un estadístico basado en la mediana, por ejemplo,
la Mediana de las Desviaciones Absolutas o MAD. El MAD es un valor numérico que viene
acompañado de la misma unidad de medida que la variable original.

Fundamentos del Análisis de Datos en Psicología


Área de Metodología de las Ciencias del Comportamiento
Universidad de Almería
Tema 2. Estadística con una variable.
19

ÍNDICES DE DISPERSIÓN.
MEDIANA DE LAS DESVIACIONES ABSOLUTAS
MEDIANA DE LAS
DESVIACIONES
ABSOLUTAS

2.3.4. EJEMPLO

Xi ni Ni niXi

1 22 22 22 -1,84 3,3856 74,4832 1,65 1,84 40,48


2 26 48 52 -0,84 0,7056 18,3456 0,65 0,84 21,84
3 13 61 39 0,16 0,0256 0,3328 0,35 0,16 2,08
4 24 85 96 1,16 1,3456 32,2944 1,35 1,16 27,84
5 15 100 75 2,16 4,6656 69,984 2,35 2,16 32,4
100 284 10,128 195,44 124,64

Calcular:

Del ejemplo anterior, tenemos que: y

Para calcular el índice MAD, ordenamos de menor a mayor, de izquierda a derecha los
valores : 0,35 – 0,65 – 1,35 – 1,65 – 2,35. El índice MAD es la mediana de estos
valores (en este caso, el valor central):

2.4.- ÍNDICES DE FORMA

Fundamentos del Análisis de Datos en Psicología


Área de Metodología de las Ciencias del Comportamiento
Universidad de Almería
Tema 2. Estadística con una variable.
20

El estudio de un determinado fenómeno mediante una variable estadística, en lo


referente a los aspectos descriptivos globales, no concluye con la determinación de los valores
centrales y de dispersión, aunque éstas sean las características fundamentales que debemos
tener en cuenta siempre. El estudio descriptivo se completa con el estudio de su forma. Los
estadísticos de forma se dividen en dos grupos: los estadísticos de asimetría o sesgo y los de
curtosis o apuntamiento.

2.4.1. Concepto y Cálculo de la Simetría y Asimetría

Una distribución es simétrica si al dividir su histograma en dos áreas de igual


superficie, ambas son reflejo la una de la otra. Será asimétrica positiva si presenta más
puntuaciones bajas que altas y, será asimétrica negativa, si presenta más puntuaciones altas
que bajas.

Si la distribución es simétrica, los índices valdrán cero, si son menores que cero existe
asimetría negativa y si son mayores que cero existe asimetría positiva. Si existe asimetría
negativa en la distribución de frecuencias habrá más valores altos que bajos y si existe
asimetría positiva ocurre al contrario, hay más valores bajos que altos.

ESTADÍSTICOS DE FORMA: ASIMETRÍA O SESGO.

COEFICIENTE
1 DE FISHER

ÍNDICE DE
SESGO
BASADO EN
LOS TRES
CUARTILES

Distribuciones simétricas

Fundamentos del Análisis de Datos en Psicología


Área de Metodología de las Ciencias del Comportamiento
Universidad de Almería
Tema 2. Estadística con una variable.
21

Curva (a). Distribución asimétrica positiva


Curva (b). Distribución asimétrica negativa

2.4.2. Concepto y Cálculo del Apuntamiento o Curtosis

Los estadísticos de apuntamiento indican si la distribución de los datos es más


apuntada o menos que un grupo de datos con distribución normal. Una distribución será
mesocúrtica si tiene el mismo apuntamiento que la distribución normal, será leptocúrtica si
es más apuntada que la normal y será platicúrtica si es menos apuntada que la normal.

Cuando los índices valgan cero la distribución de los datos será normal o mesocúrtica,
si son menores que cero la distribución es platicúrtica y si son mayores que cero será
leptocúrtica.

ESTADÍSTICOS DE FORMA: CURTOSIS O APUNTAMIENTO

2 DE
FISHER

K DE
KELLEY

Fundamentos del Análisis de Datos en Psicología


Área de Metodología de las Ciencias del Comportamiento
Universidad de Almería
Tema 2. Estadística con una variable.
22

2.4.3. EJEMPLO

Xi ni Ni Xini
12 8 8 96 -4,8 23,04 -110,592 530,8416 184,32 -884,736 4246,7328
14 16 24 224 -2,8 7,84 -21,952 61,4656 125,44 -351,232 983,4496
16 15 39 240 -0,8 0,64 -0,512 0,4096 9,6 -7,68 6,144
18 13 52 234 1,2 1,44 1,728 2,0736 18,72 22,464 26,9568
20 10 62 200 3,2 10,24 32,768 104,8576 102,4 327,68 1048,576
22 6 68 132 5,2 27,04 140,608 731,1616 162,24 843,648 4386,9696
24 1 69 24 7,2 51,84 373,248 2687,3586 51,84 373,248 2687,3856
26 1 70 26 9,2 84,62 778,688 7163,9296 84,64 778,688 7163,9296
70 1176 17,6 206,72 1193,984 11282,1248 739,2 1102,08 20550,144

Mo = 14

Fundamentos del Análisis de Datos en Psicología


Área de Metodología de las Ciencias del Comportamiento
Universidad de Almería
Tema 2. Estadística con una variable.
23

P10 = 12,38
P25 = 14,09
P90 = 21,67

SIMETRÍA

CURTOSIS

Fundamentos del Análisis de Datos en Psicología


Área de Metodología de las Ciencias del Comportamiento
Universidad de Almería
Tema 2. Estadística con una variable.
24

Fundamentos del Análisis de Datos en Psicología


Área de Metodología de las Ciencias del Comportamiento
Universidad de Almería

You might also like