Tema 2 (2016-2017)

Tema 2
Análisis descriptivos básicos para el estudio de

fenómenos sociales y educativos
1. La organización de los datos
2. Distribución de frecuencias
3. Representaciones gráficas
4. Medias de tendencia central y dispersión
5. Puntuaciones individuales
Covadonga Ruiz de Miguel

Curso 2016 - 2017
 La Estadística descriptiva básica:

 registra los datos en tablas y los representa en gráficos.
 calcula los estadísticos (medidas de centralización y de
dispersión), que describen el conjunto estudiado.
 ¿Para qué sirve?
 Para resumir la información que nos aportan las colecciones
de datos obtenidos en una investigación
 Cuando recogemos datos lo que tenemos son “colecciones de

números”, que a primera vista, no dicen nada.
 Imagina que hemos preguntado a un conjunto de N personas qué

opinión tienen acerca del servicio de cafetería de la Facultad.
 Las N respuestas se encuentran en una escala que va de 1 a 9,

donde 1 representa una total insatisfacción con el servicio,
mientras que 9 significa una satisfacción total.
 El resultado de la medición es el siguiente:

756865958657554585426646484343314
565854743534942634241363124 462474
246446758576565756 45416565554625
5654435594365732 44742182745575515
85 67667752565853 555
Tabla 1: Conjunto original de datos
Intenta responder a las siguientes preguntas:
 ¿Cuántas personas fueron encuestadas?
 ¿Cuál fue la respuesta más frecuente?
 ¿Cuántas personas tienen, como máximo, una satisfacción de cuatro
puntos en la escala?
756865958657554585426646484343314
565854743534942634241363124 462474
246446758576565756 45416565554625
5654435594365732 44742182745575515
85 67667752565853 555
Tabla 1: Conjunto original de datos
• Es difícil responder a las tres cuestiones. ¿Cuál es el problema?

• La dificultad para procesar mucha información de forma simultanea.
• La tabla 1 muestra demasiados datos y es preciso contar con mucha
paciencia (y una buena vista) para responder a las preguntas anteriores
con seguridad.
 ¿Qué hacer? Una solución sería organizar los datos de tal forma
que tengan una disposición que facilite la lectura.
 La primera acción sería ordenar los datos desde el que posee el

valor más pequeño hasta el que cuenta con el valor mayor.
 Esta tabla es más fácil de interpretar. No ha desaparecido ninguna

información; el único cambio está en la ordenación de los mismos
datos.
 No obstante, la solución es parcial, puesto que aún debe ser mejorada
 El valor 1 se encuentra presente en seis ocasiones. Podemos poner una
vez cada valor seguido por la cantidad de ocasiones en que
aparece, por su frecuencia.
 Una distribución de frecuencias es una tabla en la que aparecen
resumidos y organizados los datos, con informaciones sobre el
número de veces que se repiten, el valor más alto, mas bajo, etc..
sat
Frequency Percent Valid Percent Cumulative Percent
MISSING 3 1,961
1 6 3,922 4,000 4,000
2 11 7,190 7,333 11,333
3 12 7,843 8,000 19,333
4 30 19,608 20,000 39,333
5 40 26,144 26,667 66,000
6 25 16,340 16,667 82,667
7 14 9,150 9,333 92,000
8 9 5,882 6,000 98,000
9 3 1,961 2,000 100,000
1. Frecuencias absolutas: Número de veces que se repite un dato

2. Porcentaje: la frecuencia relativa multiplicada por 100. Facilita la interpretación.
3. Porcentaje válido: Es el dato anterior una vez eliminado los “valores perdidos”
4. Porcentaje acumulado: Dato anterior acumulando los datos anteriores.
sat
MISSING 3 1,961
1 6 3,922 4,000 4,000
2 11 7,190 7,333 11,333 11,333= 4,000+7,333
3 12 7,843 8,000 19,333
4 30 19,608 20,000 39,333
5 40 26,144 26,667 66,000
6 25 16,340 16,667 82,667
7 14 9,150 9,333 92,000
8 9 5,882 6,000 98,000
9 3 1,961 2,000 100,000 La muestra total, el 100%
153 100% 99,8%
 La tabla anterior puede “resumirse”, sobre todo si hay muchos

valores
MISSING 3 1,900
Hasta 3 29 18,9 19,300 19,333
Entre 4 y 6 95 62,1 63,3 82,667
Entre 7 y 8 23 15 15,3 98,000
Más de 8 3 1,9 2 100,000
Total 153 100,000 100,000
 En resumen: La distribución de frecuencias o tabla de frecuencias

es una ordenación en forma de tabla de los datos estadísticos,
asignando a cada dato su frecuencia correspondiente.
Para elaborar la tabla de frecuencias con EZAnalyze…
Si la variable es cualitativa…
EZAnalyze Results Report - Percentages
curso
MISSING 2 ,258
1 510 65,891 66,062 66,062
2 191 24,677 24,741 90,803
3 67 8,656 8,679 99,482
4 4 ,517 ,518 100,000
curso
MISSING 2 ,3
Primero 510 65,9 66,1 66,1
Segundo 191 24,7 24,7 90,8
Tercero 67 8,7 8,7 99,5
Cuarto 4 ,5 ,5 100,0
774 100,0 100,0 356,3
Recordar que en el caso de variables categóricas, hay que cambiar el

valor por el “nombre” de la categoría
Caso de variables cuantitativas

 Cuando la variable es numérica y tiene muchos valores, no tiene sentido presentar
la tabla tal cual aparece, hay que hacer intervalos, para ello tenemos que hacer
una transformación previa:
 Decidir los intervalos que vamos a elaborar
 Cambiar los valores de la variable por las etiquetas sobre la variable original y
 Hacer la distribución de frecuencias igual que en el caso anterior
V9(2)
MISSING 1 2,703
Entre 29 y 50 20 54,054 55,556 55,556
Hasta 28 8 21,622 22,222 77,778
Más de 50 8 21,622 22,222 100,000
 La representación gráfica contribuye a un mejor análisis
de los datos al proporcionar una información clara y
rápida de lo obtenido
 Facilita la comprensión del fenómeno considerado
 Pierde detalle de información pero se obtiene otro tipo
de información
 Hay muchos tipos de gráficos. Cada una de ellos es
adecuado para un estudio determinado, ya que no
siempre se puede utilizar el mismo para todos los casos.
 Los más comunes son:
Diagrama de barras
Diagrama de sectores
Diagrama de barras (o columnas)

 En uno de los ejes se representan los valores que puede tomar la variable;
en el otro se representa el % cada valor.
 Las barras o columnas tienen una altura proporcional a la frecuencia (o
%) que representan.
 Suele utilizarse para variables cualitativas ordinales
 Para una mejor interpretación, el eje donde se representan los % debe
estar siempre al 100%, y se debe incluir el valor del dato en cada barra o
columna.
Diagrama de sectores
 Se representan los datos en un círculo, de modo que la frecuencia
de cada valor viene dada por un trozo de área del círculo. Así, el
círculo queda dividido en sectores cuya amplitud es proporcional
a las frecuencias de los valores.
 Para variables categóricas (con pocas categorías)
Para representar variables numéricas

 Una opción para representar variables numéricas es calcular
algún descriptivo y representarlo gráficamente
 Si tenemos información, por ejemplo, de lo que han vendido 6
tiendas de la misma cadena en un mes, podemos calcular la
media de cada una y representarlo
Gráficos en Excel
 Para el caso de variables cualitativas
 Hacer primero una distribución de frecuencias (con Ezanalyze)
 Seleccionar los datos a representar (etiqueta de valor y valor
numérico, arreglando los decimales)
 Hacer el gráfico directamente con Excel (los de Ezanalyze son
menos vistosos y representa frecuencias, no porcentajes)
 No olvidar:
 Sustituir el valor de la primera columna por el nombre de la etiqueta
 Seleccionar para hacerlo dos datos adecuados (etiqueta y
porcentaje válido)
 Modificar lo que haga falta (poner títulos, nombres de categorías,
ejes al 100%…)
Gráfico de sectores
Gráfico de columnas
Poner eje a 100%
Eliminar “series1” si solo se
representa una variable
Insertar título
Insertar valores
4. Tendencia central y variabilidad
4. Medidas de tendencia central y dispersión
 ¿Qué son?
 ¿Cuáles hay?
 Media
 Mediana Medidas de tendencia central
 Moda
 Desviación típica
 Cociente de variación Medidas de dispersión o variabilidad
Medidas de tendencia central

Las MTC informan de la tendencia de los datos a agruparte en torno
a los valores centrales de la serie. Nos dan información de los valores
más representativos. Hablaremos de tres:
 MEDIA: La media aritmética de varias cantidades, es la suma de
todas las cantidades dividida entre el número de ellas. También se
llama promedio.
 MEDIANA: Se llama mediana de un conjunto de datos numéricos al
que ocupa el valor central. Es el punto de la distribución que deja
por debajo de si al 50% de las puntuaciones y por encima al otro
50%. No es un porcentaje, es una puntuación directa que parte la
distribución en dos porcentajes. Para calcularla, ordenamos las
cantidades de menor a mayor y elegimos la del medio.
 MODA: La moda es el valor que mayor frecuencia absoluta tiene
en un estudio estadístico, o sea el que se repite más. Puede ocurrir
que la moda no sea única, es decir, que haya más de un valor con
la frecuencia máxima. Se habla entonces de distribuciones
bimodales, trimodales ...
 Tenemos la variable ingresos mensuales, los resultados obtenidos al

calcular las MTC son los siguientes;
EZAnalyze Results Report - Descriptive1. En la tabla vemos que se le ha preguntado a 300
Statistics
sujetos, y que todos han respondido (hay 74 missing).
Ingresos 2. Por término medio, los sujetos tienen unos ingresos
mensuales mensuales de 1536,033 € (media).
N Valid: 300 3. También podemos decir que el 50% de los sujetos
N Missing: 74 tiene ingresos superiores a 1500€ y el otro 50% tiene
Mean: 1536,033 ingresos inferiores a 1500€ (mediana)
Median: 1500,000
4. En este caso no hay moda, porque no se ha repetido
Mode:
ningún valor
Std. Dev: 895,693
Minimum Value: 10,000 5. Por último podemos decir que el sujeto que más
Maximum Value: 3080,000 gana, gana 3080€ (Maximun value), y el que menos
gana, gana 10€ (Minimun value)
Medidas de variabilidad
 Las medidas de tendencia central no son suficientes para describir
un conjunto de datos, ya que solo nos informan de los valores más
representativos, pero no nos dicen nada acerca de cómo son los
datos (sujetos) de parecidos o diferentes entre si.
 Necesitamos otros estadísticos que nos den más información, y
estos son las medidas de variabilidad o dispersión.
 Una medida de variabilidad es un valor numérico que nos da idea
de la concentración o separación de los datos de una variable
alrededor de su media aritmética o promedio.
 Los más utilizados son la desviación típica y el coeficiente de
variación
Desviación típica (S)

Indica lo que se desvían por término medio las puntuaciones respecto
de la media
 Mide la dispersión de los datos respecto de la media aritmética
cuanto más grande, mayor dispersión tienen los datos.
 Solo adopta valores positivos.
 El valor 0 indicaría ausencia de variabilidad, todas las
puntuaciones serían iguales
 Tiene la misma unidad de medida que la variable (euros, metros,
puntos en examen...)
 Para interpretarlo hay que tener en cuenta la variable, no
podemos decir, como norma general, si un valor determinado,
es grande o pequeño.
Cociente de variación (CV)

 Sirve para comparar la variabilidad de dos variables de distinta
métrica
S
CV  x100
X
 También se la denomina variabilidad relativa. Es frecuente
mostrarla en porcentajes .
 Si para una determinada variable la media es 80 y la desviación
típica 20 entonces el CV es igual a 25%. (20/80=0,25*100=25). Esta
es la variabilidad relativa de la variable.
 Es una cantidad adimensional (no tiene la misma métrica que la
variable como las MTC o la S)
 Si el peso tiene CV=30% y la altura tiene CV=10%, podemos decir
que los individuos:
 Presentan más dispersión (o son más heterogéneos) en peso que en
altura, o
 Que son más homogéneos (parecidos) en altura
 Sobre el mismo ejemplo de antes la variable rendimiento en matemáticas, el

resultado obtenido al calcular la desviación típica es (se calcula también la
media para poder interpretar);
1. Statistics
EZAnalyze Results Report - Descriptive La desviación típica nos indica
que por término medio, los
sujetos ganan entre 2431,726€
Ingresos (1536,033+895) y 640,340€
N Valid: 300 (1536,033-895). Para interpretar
si es mucho o poco, debemos
N Missing: 7 tenemos en cuenta cuáles son
Std. Dev: 895,693 los valores máximo y mínimo
alcanzados en la variable.
2. Si quisiera saber la variabilidad
CV 58,312 relativa de la variable, diría que
es [(895,693/1536,033)*100] del
58,312%
Cuando utilizar cada estadístico de tendencia central
 Media: variables cuantitativas (medidas a nivel de intervalo o razón).

También puede calcularse con datos ordinales. Nunca con nominales.
 Mediana: variables al menos ordinales.
 Moda: para todas las variables, aunque más adecuada para caracterizar
datos categóricos.
 Desviación típica: sólo para variables cuantitativas (de intervalo o razón),
aunque también suele calcularse con datos ordinales
 Cociente de variación: siembre que se quiera comparar la dispersión de
dos variables cuantitativas de diferente métrica
Ejercicio con Excel

EZAnalyze Results Report -
Descriptive Statistics
V2 Métodos V7 Nivel de
V3 Asistenci V4 Madurez V5 Ambient V6 Nivel V8 Nivel
de vocabulario
aa lectora e familiar (1: socioeconó intelectual
enseñanza previo a E.P.
Educación (Medido con Bueno; 2: mico (1:Alto; (Medido con
de la lectura (Medido con
Infantil (1: SI, un test de 0 a Medio; 3: 2: Medio; 3: un test de 0
(1: A1; 2: A2 un test de 0
2: NO) 20) Bajo) Bajo) a 50)
y 3: A3) a 30)
N Valid: 36 36 36 36 36 36 36
N Missing: 1 1 1 1 1 1 1
Mean: 2,111 1,361 9,639 2,083 1,972 16,583 21,167
Median: 2 1 9,5 2 2 16 20
Mode: 3 1 10 2 2 14 20
Std. Dev: ,820 ,487 4,981 ,770 ,696 6,344 6,635
Minimum Value: 1 1 2 1 1 5 10
Maximum Value: 3 2 20 3 3 30 43
 Interpreta los estadísticos calculados

 Para las variables cuantitativas, calcula su variabilidad relativa e
indica en cual los sujetos son más homogéneos
EZAnalyze Results Report -
Descriptive Statistics
V15 Nivel
aspiraciones
V10
V11 V14 padres
Memoria V12 V13 Estilo
V9 Velocidad Comprensión Adaptación (1:Terminará
general Cálculo cognitivo
lectora (Medido lectora escolar los estudios
(Medido (Medido con (Medido con
con un test de 0 (Medido con (Medido con obligatorios;
con un un test de 0 un test de 0
a 80) un test de 0 a un test de 0 2: No
test de 0 a 30) a 18)
30) a 10) terminará los
a 40)
estudios
obligatorios)
N Valid: 36 36 36 36 36 36 36
N Missing: 1 1 1 1 1 1 1
Mean: 41,194 23,250 13,139 17,417 9,972 4,417 1,472
Median: 38,5 22 10,5 18,5 9,5 4 1
Mode: 50 30 10 19 8 4 1
Std. Dev: 15,371 6,818 8,619 5,779 4,151 2,298 ,506
Minimum Value: 17 10 2 7 3 1 1
Maximum Value: 70 37 30 28 18 9 2
Descriptiva con Ezanalyze
Es recomendable eliminar los

decimales que no aporten nada (,000)
La media con variables ordinales

 Puede calcularse, pero para interpretarla, hay que tener en cuenta lo que
significa cada categoría de la variable.
 Por ejemplo, si tenemos la variable Satisfacción con la Dirección
satisfacción satisfacción  Podríamos meter los datos en Excel como palabras o como
1 Nada números.
1 Nada
2 Muy Poco  Si solo queremos hacer un recuento de frecuencias, podemos
2 Muy Poco dejar las palabras
3 Normal satisfacción
3 Normal Frequency Percent Valid Percent Cumulative Percent
3 Normal Bastante 7 43,750 43,750 43,750
Mucho 2 12,500 12,500 56,250
4 Bastante
Muy Poco 2 12,500 12,500 68,750
4 Bastante
Nada 2 12,500 12,500 81,250
4 Bastante Normal 3 18,750 18,750 100,000
4 Bastante
4 Bastante  Pero si queremos calcular un estadístico (media), debemos
4 Bastante
4 Bastante “traducir” a números, de lo contrario sale un mensaje de error
5 Mucho
5 Mucho
 Si utilizamos la columna que tiene los números, obtenemos el estadístico
satisfacción
N Valid: 16
N Missing: 0
Mean: 3,313
 Y ya podemos interpretar la Satisfacción media de los sujetos encuestados

 Considerando que hemos codificado como Nada (1), Poco (2), Normal (3),
Bastante (4), Mucho (5)
 La media obtenida es de 3,3, por lo que los sujetos tienen una Satisfacción
Normal
 Existen diferentes formas de expresar la

puntuación de un sujeto
 Puntuaciones directas
 Puntuaciones típicas
 Percentiles y Cuartiles
Las puntuaciones directas y su

transformación
 Una puntuación directa es el dato aportado directamente por el instrumento de
medida, por ejemplo:
 Una altura de 1.65 m.,
 Un total de 25 respuestas correctas en una prueba objetiva,
 Un 5, que es como se ha codificado la respuesta muy de acuerdo en un
cuestionario
 Un 32, que es la suma de las respuestas a una escala de actitudes
 El símbolo habitual de las puntuaciones directas es Xi
 Estas puntuaciones directas no son siempre fáciles de interpretar, y tampoco son
comparables entre sí a no ser que procedan del mismo instrumento.
 Por ejemplo no es lo mismo
 Xi = 20, de 20 respuestas correctas en una prueba de 25 preguntas, que
 Xi = 20, de 20 respuestas correctas en una prueba de 50 preguntas
 Las puntuaciones directas necesitan con frecuencia algún tipo de transformación
para que aporten información útil o simplemente para poder interpretarlas con
facilidad, o para poder comparar resultados individuales obtenidos con
instrumentos distintos.
Puntuaciones “típicas”
 La transformación clásica de puntuaciones es su estandarización, su
transformación a puntuaciones típicas o estandarizadas, que expresan
cuántas desviaciones típicas se aparta una puntuación individual de la
media de su grupo.
 Dos puntuaciones típicas se pueden comparar la haber unidad de
medida, la desviación típica.
 El símbolo de las puntuaciones típicas es z (zeta minúscula); también suelen
denominarse simplemente puntuaciones zeta y a veces puntuaciones
estandarizadas (standard score en inglés).
 Su fórmula es:
 El valor de zi indica cuántas desviaciones típicas contiene la puntuación
directa
 El dato individual se expresa ahora en términos de desviaciones típicas por
encima o por debajo de la media
 Por ejemplo, imaginemos los resultados de tres sujetos en un examen en el
que la media ha sido 10 y la desviación típica es 2.
 El sujeto 1 obtiene una Xi = 12
 Si aplicamos la fórmula y transformamos las puntuaciones tenemos que:

 El sujeto 1 obtiene una zi = +1
 El sujeto 2 obtiene una zi = 0
 El sujeto 3 obtiene una zi = -1
 Pero ya sabemos su posición respecto de la media, y exactamente a
cuántas S está
 Al hacer una transformación lineal el orden de los sujetos sigue siendo el
mismo
 Al convertir las puntuaciones directas en puntuaciones típicas, podemos
situarlas en la “curva normal” (o Campana de Gauss) y saber cómo es el
sujeto respecto de su grupo de referencia
 Si solo se que
 El sujeto 2 obtiene una Xi = 10 No puedo decir cómo es cada sujeto
 Pero si calculo las puntuaciones típicas, El sujeto “mejor” es el 1,

 El sujeto 1 obtiene una zi = +1 porque ha obtenido una
puntuación superior a la
 El sujeto 2 obtiene una zi = 0 Ya puedo situarlas media (Zi=+1). ¿Cuánto
en la curva más? Una desviación típica,
 El sujeto 3 obtiene una zi = -1
es decir 10+2 puntos, 12
puntos
El sujeto “peor” es el 3, El sujeto 2 obtiene una
porque ha obtenido una puntuación exactamente
puntuación inferior a la igual a la media del grupo
media (Zi=-1). ¿Cuánto (Zi=0). 10+0=10
menos? Una desviación
típica, es decir 10-2 puntos, 8
puntos Sujeto 3 Sujeto 2 Sujeto 1
Zi=-1 Zi=0 Zi=+1
El orden de las puntuaciones no cambia

Memoria Z_Memoria Memoria Z_Memoria
8 -1,084 2 -1,517
31 ,574 4 -1,373
48 Mean: 23,040 1,800 5 -1,301
18 Std. Dev: 13,870 -,363 5 -1,301
21 -,147 5 -1,301
5 -1,301 8 -1,084
24 ,069 12 -,796
20 -,219 18 -,363
23 -,003 18 -,363
2 𝑋𝑖 − 𝑋 8 − 23,040 -1,517 19 -,291
18 𝑍= = = −1,084 -,363 20 -,219
27 𝑆 13,870 ,286 20 -,219
12 -,796 21 -,147
20 -,219 23 -,003
45 1,583 24 ,069
31 ,574 27 ,286
40 1,223 31 ,574
41 1,295 31 ,574
34 ,790 34 ,790
4 -1,373 37 1,006
5 -1,301 38 1,079
38 1,079 40 1,223
5 -1,301 41 1,295
37 1,006 45 1,583
19 -,291 48 1,800
Curva normal
 En estadística se llama distribución normal o campana de Gauss, a una de las
distribuciones de probabilidad de variable continua que con más frecuencia
aparece en fenómenos reales.
 Propiedades
 Es simétrica respecto de su media
 Es asintótica respecto del eje de abscisas
 La moda y la mediana son ambas iguales a la media
 Distribución de probabilidad en un entorno de la media:
 en el intervalo [μ - σ, μ + σ] se encuentra comprendida, aproximadamente, el
68,26% de la distribución;
 en el intervalo [μ - 2σ, μ + 2σ] se encuentra, aproximadamente, el 95,44% de la
distribución;
 en el intervalo [μ -3σ, μ + 3σ] se encuentra comprendida, aproximadamente,
el 99,74% de la distribución.
 Estas propiedades son de gran utilidad para el establecimiento de intervalos de
confianza. Por otra parte, el hecho de que prácticamente la totalidad de la
distribución se encuentre a tres desviaciones típicas de la media justifica los límites
de las tablas empleadas habitualmente en la normal estándar.
La curva normal
Las probabilidades en la Curva Normal

Abraham de Moivre, primero en
descubrir la distribución normal
Ejemplo de distribución normal:
el caso del cociente intelectual
 El cociente intelectual, también denominado coeficiente intelectual o CI en forma
abreviada (en alemán Intelligenz-Quotient, IQ), es una puntuación, resultado de
alguno de los test estandarizados diseñados para valorar la inteligencia.
 Las puntuaciones de CI se usan en muchos contextos distintos: como predictivos
de rendimiento escolar, indicadores de necesidades especiales educativas,
predictivos de rendimiento laboral, o por parte de sociólogos que estudian la
distribución de CI en poblaciones y las relaciones entre el CI y otras variables.
 Capacidad cognitiva nula CI 0-4
 Discapacidad cognitiva profunda CI 5-19
 Discapacidad cognitiva grave CI 20-34
 Discapacidad cognitiva moderada CI 35-54
 Discapacidad cognitiva leve CI 55-69
 Retraso Mental CI 70-84
 Debajo de la media CI 85-99
 Media de coeficiente intelectual establecida CI 100
 Encima de la media CI 101-114
 Inteligencia brillante CI 115-129
 Superdotación intelectual CI 130-139
 Genialidad intelectual CI 140-154
 Altas capacidades intelectuales CI 155-174
 Inteligencia excepcional CI 175-184
 Inteligencia profunda CI 185-201
 Inteligencia mayor a 201 CI > 201
 En el ejemplo anterior podemos ver que:

 Si un sujeto tiene un resultado igual a la media, su puntuación típica será
igual a cero
 Todos los que tengan una puntuación directa superior a la media
tendrán una puntuación típica con signo positivo
 Todos los que tengan una puntuación directa inferior a la media
tendrán una puntuación típica con signo negativo
 Todos los sujetos quedan distribuidos en torno a una media z = 0.

 El orden de los sujetos al transformar sus puntuaciones es el mismo, pero los
valores son muy diferentes
 Por lo general, estos valores conservan dos decimales y los valores
extremos tienden a estar entre -3 y +3, independientemente de la
magnitud de las puntuaciones originales. Es difícil superar estos valores.
 De todas las puntuaciones individuales, las típicas son las más interesantes
y útiles, ya que permiten comparar y valorar resultados individuales
Ejemplo de problema con

puntuaciones típicas
 En una clase hay 15 alumnos y 20 alumnas.
 El peso medio de los alumnos es 58,2 kg y el de las alumnas y 52,4
kg.
 Las desviaciones típicas de los dos grupos son, respectivamente,
3,1 kg y 5,1 kg.
 José y Ana pesan 65 kg. cada uno
 ¿Cuál de ellos puede considerarse más parecido a su grupo de
referencia?
65−58,2 65−52,4
𝑍𝐽𝑜𝑠é = = 2,1 𝑍𝐴𝑛𝑎 = 2,4
3,1 = 5,1
 José es más parecido a su grupo que Ana, si bien ambos están por
encima del peso medio.

 Una persona A mide 1,75 m (175cm) y reside en una ciudad donde
la estatura media es de 1,60 m (160cm)y la desviación típica es de
20 cm.
 Otra persona B mide 1,80 m (180cm) y vive en una ciudad donde la
estatura media es de 1,70 m (170cm) y la desviación típica es de 15
cm.
 ¿Cuál de las dos será más alta respecto a sus conciudadanos?
 La persona A es más alta respecto a sus conciudadanos que la

persona B.

 Las puntuaciones en las asignaturas de Biología y Geografía de un
estudiante fueron 7,5 y 8,2 respectivamente. La nota media en Biología fue
de 6,5 y en Geografía de 8. Además, las desviaciones típicas en ambas
asignaturas fueron de 1,3 en el caso de Biología y de 0,7 para Geografía.
En términos relativos, ¿en qué asignatura obtuvo mejor rendimiento
académico el alumno?
7,5−6,5 8,2−8
𝑍𝐵𝑖𝑜𝑙𝑜𝑔í𝑎 = = 0,77 𝑍𝐺𝑒𝑜𝑔𝑟𝑎𝑓í𝑎 = =0,29
1,3 0,7
Percentiles
 Son el resultado de dividir la distribución en 100 partes iguales.
 Cada percentil indica el % de sujetos que está por debajo de cada
puntuación
 Si un sujeto con una puntuación de 19 en un test supera al 45% de su
grupo, la puntuación 19 es el Pc45.
 El percentil indica la posición relativa del sujeto en el grupo. No es una
puntuación, no hace referencia a valores absolutos.
 Un sujeto que ocupe un percentil 98 en un examen de conocimientos
supera al 98% de su clase, pero no necesariamente sabe más que la
mayoría. A la inversa, un sujeto que ocupe el Pc5, puede saber lo
suficiente como para aprobar.
 Los Pc se interpretan y calculan dentro de del grupo de referencia. No
se pueden comparar percentiles de grupos diferentes
Percentiles
 Algunos percentiles tienen nombres y símbolos específicos:
 Deciles: Son los percentiles 10, 20, 30,,, y se simbolizan D1 (=P10), D2 (=P20)..
 Cuartiles: son los percentiles que dividen al grupo en cuatro partes iguales (cada
una con el 25% de los sujetos)
 Q3 (=P75). Deja por debajo al 75% de los sujetos y al 25% por encima
 Q2 (=P50). Es la mediana (medida de tendencia central). Deja por encima y
por debajo al 50% de los sujetos
 Q1 (=P25). Deja por debajo al 25% de los sujetos y al 75% por encima
 Limitación de los percentiles: no hay unidad constante entre ellos. No se puede
afirmar que quien ocupa el P80 sabe el doble que quien ocupa el P40.
 Ventajas:
 Fácil comprensión
 Muy utilizados en el diagnóstico psicopedagógico.
 Inconvenientes
 Falta de una unidad constante.
 No hay distribución homogénea de sujetos
 No susceptible de operaciones lo que limita su interpretación.
Ejercicios con percentiles

 Si tenemos información sobre el peso de un conjunto de sujetos ¿qué
posición ocupa el sujeto cuyo peso es superado por el 70% de los
individuos de una población?:
 Imagina que los resultados de este examen que estás haciendo se van
a publicar en forma de percentiles (en lugar de “notas”). ¿Qué
percentil te gustaría ocupar?
a) El Pc1, indicaría que soy el/la mejor.
b) El Pc50 me asegura que al menos tengo un 5.
c) El Pc95, seguro que es más que un aprobado.
d) El Pc95, aunque no es seguro que haya aprobado.
 Una vez que sabes que has aprobado, ¿que puntuación individual te
gustaría que fuese la tuya?
a) El Pc70.
b) El Q3.
c) El D2.
d) En realidad me daría igual, representan la misma puntuación.
Equivalencia de puntuaciones
0% 25% 50% 75% 100%
Q1 Q2 Q3
D1 D2 D3 D4 D5 D6 D7 D8 D9
P10 P20 P30 P40 P50 P60 P70 P80 P90

Ejemplo en SPSS
Estadísticos
Index of Socio-Economic and Cultural St at us

Estadísticos
N Válidos 1190
Index of Socio-Economic and Cultural St at us Perdidos 17
N Válidos 1190 Deciles 1 -1,5777240
Perdidos 17 2 -1,0283540
3 -,6802980
Percent iles 10 -1,5777240
4 -,3933880
20 -1,0283540 5 -,1008200
30 -,6802980 6 ,1815900
80 ,7574180 7 ,4212050
8 ,7574180
90 1,1816700
9 1,1816700
Puntuaciones individuales con Ezanalyze

Tema 2 (2016-2017)

Uploaded by

Document Information

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Tema 2 (2016-2017)

Uploaded by

Copyright:

Available Formats

Tema 2

Análisis descriptivos básicos para el estudio de

Covadonga Ruiz de Miguel

 La Estadística descriptiva básica:

 Cuando recogemos datos lo que tenemos son “colecciones de

 Imagina que hemos preguntado a un conjunto de N personas qué

 Las N respuestas se encuentran en una escala que va de 1 a 9,

 El resultado de la medición es el siguiente:

• Es difícil responder a las tres cuestiones. ¿Cuál es el problema?

 La primera acción sería ordenar los datos desde el que posee el

 Esta tabla es más fácil de interpretar. No ha desaparecido ninguna

1. Frecuencias absolutas: Número de veces que se repite un dato

 La tabla anterior puede “resumirse”, sobre todo si hay muchos

 En resumen: La distribución de frecuencias o tabla de frecuencias

Para elaborar la tabla de frecuencias con EZAnalyze…

Recordar que en el caso de variables categóricas, hay que cambiar el

Caso de variables cuantitativas

Diagrama de barras (o columnas)

Para representar variables numéricas

4. Medidas de tendencia central y dispersión

Medidas de tendencia central

 Tenemos la variable ingresos mensuales, los resultados obtenidos al

Desviación típica (S)

Cociente de variación (CV)

 Sobre el mismo ejemplo de antes la variable rendimiento en matemáticas, el

Cuando utilizar cada estadístico de tendencia central

 Media: variables cuantitativas (medidas a nivel de intervalo o razón).

Ejercicio con Excel

 Interpreta los estadísticos calculados

Descriptiva con Ezanalyze

Es recomendable eliminar los

La media con variables ordinales

 Si utilizamos la columna que tiene los números, obtenemos el estadístico

 Y ya podemos interpretar la Satisfacción media de los sujetos encuestados

 Existen diferentes formas de expresar la

Las puntuaciones directas y su

 Si aplicamos la fórmula y transformamos las puntuaciones tenemos que:

 Pero si calculo las puntuaciones típicas, El sujeto “mejor” es el 1,

El orden de las puntuaciones no cambia

Las probabilidades en la Curva Normal

 En el ejemplo anterior podemos ver que:

 Todos los sujetos quedan distribuidos en torno a una media z = 0.

Ejemplo de problema con

Ejemplo de problema con

 La persona A es más alta respecto a sus conciudadanos que la

Ejemplo de problema con

Ejercicios con percentiles

0% 25% 50% 75% 100%

P10 P20 P30 P40 P50 P60 P70 P80 P90

Index of Socio-Economic and Cultural St at us

Puntuaciones individuales con Ezanalyze

You might also like