Professional Documents
Culture Documents
Tema 2 (2016-2017)
Tema 2 (2016-2017)
¿Qué hacer? Una solución sería organizar los datos de tal forma
que tengan una disposición que facilite la lectura.
sat
Frequency Percent Valid Percent Cumulative Percent
MISSING 3 1,961
1 6 3,922 4,000 4,000
2 11 7,190 7,333 11,333
3 12 7,843 8,000 19,333
4 30 19,608 20,000 39,333
5 40 26,144 26,667 66,000
6 25 16,340 16,667 82,667
7 14 9,150 9,333 92,000
8 9 5,882 6,000 98,000
9 3 1,961 2,000 100,000
2. Distribución de frecuencias
sat
Frequency Percent Valid Percent Cumulative Percent
MISSING 3 1,961
1 6 3,922 4,000 4,000
2 11 7,190 7,333 11,333 11,333= 4,000+7,333
3 12 7,843 8,000 19,333
4 30 19,608 20,000 39,333
5 40 26,144 26,667 66,000
6 25 16,340 16,667 82,667
7 14 9,150 9,333 92,000
8 9 5,882 6,000 98,000
9 3 1,961 2,000 100,000 La muestra total, el 100%
153 100% 99,8%
2. Distribución de frecuencias
Si la variable es cualitativa…
EZAnalyze Results Report - Percentages
curso
Frequency Percent Valid Percent Cumulative Percent
MISSING 2 ,258
1 510 65,891 66,062 66,062
2 191 24,677 24,741 90,803
3 67 8,656 8,679 99,482
4 4 ,517 ,518 100,000
curso
Frequency Percent Valid Percent Cumulative Percent
MISSING 2 ,3
Primero 510 65,9 66,1 66,1
Segundo 191 24,7 24,7 90,8
Tercero 67 8,7 8,7 99,5
Cuarto 4 ,5 ,5 100,0
774 100,0 100,0 356,3
V9(2)
Frequency Percent Valid Percent Cumulative Percent
MISSING 1 2,703
Entre 29 y 50 20 54,054 55,556 55,556
Hasta 28 8 21,622 22,222 77,778
Más de 50 8 21,622 22,222 100,000
3. Representaciones gráficas
La representación gráfica contribuye a un mejor análisis
de los datos al proporcionar una información clara y
rápida de lo obtenido
Facilita la comprensión del fenómeno considerado
Pierde detalle de información pero se obtiene otro tipo
de información
Hay muchos tipos de gráficos. Cada una de ellos es
adecuado para un estudio determinado, ya que no
siempre se puede utilizar el mismo para todos los casos.
Los más comunes son:
Diagrama de barras
Diagrama de sectores
3. Representaciones gráficas
Diagrama de sectores
Se representan los datos en un círculo, de modo que la frecuencia
de cada valor viene dada por un trozo de área del círculo. Así, el
círculo queda dividido en sectores cuya amplitud es proporcional
a las frecuencias de los valores.
Para variables categóricas (con pocas categorías)
3. Representaciones gráficas
Gráficos en Excel
Para el caso de variables cualitativas
Hacer primero una distribución de frecuencias (con Ezanalyze)
Seleccionar los datos a representar (etiqueta de valor y valor
numérico, arreglando los decimales)
Hacer el gráfico directamente con Excel (los de Ezanalyze son
menos vistosos y representa frecuencias, no porcentajes)
No olvidar:
Sustituir el valor de la primera columna por el nombre de la etiqueta
Seleccionar para hacerlo dos datos adecuados (etiqueta y
porcentaje válido)
Modificar lo que haga falta (poner títulos, nombres de categorías,
ejes al 100%…)
3. Representaciones gráficas
Gráfico de sectores
3. Representaciones gráficas
Gráfico de columnas
Poner eje a 100%
Eliminar “series1” si solo se
representa una variable
Insertar título
Insertar valores
4. Tendencia central y variabilidad
¿Qué son?
¿Cuáles hay?
Media
Mediana Medidas de tendencia central
Moda
Desviación típica
Cociente de variación Medidas de dispersión o variabilidad
4. Tendencia central y variabilidad
Medidas de variabilidad
Las medidas de tendencia central no son suficientes para describir
un conjunto de datos, ya que solo nos informan de los valores más
representativos, pero no nos dicen nada acerca de cómo son los
datos (sujetos) de parecidos o diferentes entre si.
Necesitamos otros estadísticos que nos den más información, y
estos son las medidas de variabilidad o dispersión.
Una medida de variabilidad es un valor numérico que nos da idea
de la concentración o separación de los datos de una variable
alrededor de su media aritmética o promedio.
Los más utilizados son la desviación típica y el coeficiente de
variación
4. Tendencia central y variabilidad
V2 Métodos V7 Nivel de
V3 Asistenci V4 Madurez V5 Ambient V6 Nivel V8 Nivel
de vocabulario
aa lectora e familiar (1: socioeconó intelectual
enseñanza previo a E.P.
Educación (Medido con Bueno; 2: mico (1:Alto; (Medido con
de la lectura (Medido con
Infantil (1: SI, un test de 0 a Medio; 3: 2: Medio; 3: un test de 0
(1: A1; 2: A2 un test de 0
2: NO) 20) Bajo) Bajo) a 50)
y 3: A3) a 30)
N Valid: 36 36 36 36 36 36 36
N Missing: 1 1 1 1 1 1 1
Mean: 2,111 1,361 9,639 2,083 1,972 16,583 21,167
Median: 2 1 9,5 2 2 16 20
Mode: 3 1 10 2 2 14 20
Std. Dev: ,820 ,487 4,981 ,770 ,696 6,344 6,635
Minimum Value: 1 1 2 1 1 5 10
Maximum Value: 3 2 20 3 3 30 43
N Valid: 36 36 36 36 36 36 36
N Missing: 1 1 1 1 1 1 1
Mean: 41,194 23,250 13,139 17,417 9,972 4,417 1,472
Median: 38,5 22 10,5 18,5 9,5 4 1
Mode: 50 30 10 19 8 4 1
Std. Dev: 15,371 6,818 8,619 5,779 4,151 2,298 ,506
Minimum Value: 17 10 2 7 3 1 1
Maximum Value: 70 37 30 28 18 9 2
4. Tendencia central y variabilidad
satisfacción satisfacción Podríamos meter los datos en Excel como palabras o como
1 Nada números.
1 Nada
2 Muy Poco Si solo queremos hacer un recuento de frecuencias, podemos
2 Muy Poco dejar las palabras
3 Normal satisfacción
3 Normal Frequency Percent Valid Percent Cumulative Percent
3 Normal Bastante 7 43,750 43,750 43,750
Mucho 2 12,500 12,500 56,250
4 Bastante
Muy Poco 2 12,500 12,500 68,750
4 Bastante
Nada 2 12,500 12,500 81,250
4 Bastante Normal 3 18,750 18,750 100,000
4 Bastante
4 Bastante Pero si queremos calcular un estadístico (media), debemos
4 Bastante
4 Bastante “traducir” a números, de lo contrario sale un mensaje de error
5 Mucho
5 Mucho
4. Tendencia central y variabilidad
satisfacción
N Valid: 16
N Missing: 0
Mean: 3,313
5. Puntuaciones individuales
Puntuaciones “típicas”
La transformación clásica de puntuaciones es su estandarización, su
transformación a puntuaciones típicas o estandarizadas, que expresan
cuántas desviaciones típicas se aparta una puntuación individual de la
media de su grupo.
Dos puntuaciones típicas se pueden comparar la haber unidad de
medida, la desviación típica.
El símbolo de las puntuaciones típicas es z (zeta minúscula); también suelen
denominarse simplemente puntuaciones zeta y a veces puntuaciones
estandarizadas (standard score en inglés).
Su fórmula es:
5. Puntuaciones individuales
Puntuaciones “típicas”
El valor de zi indica cuántas desviaciones típicas contiene la puntuación
directa
El dato individual se expresa ahora en términos de desviaciones típicas por
encima o por debajo de la media
Por ejemplo, imaginemos los resultados de tres sujetos en un examen en el
que la media ha sido 10 y la desviación típica es 2.
El sujeto 1 obtiene una Xi = 12
El sujeto 2 obtiene una Xi = 10
El sujeto 3 obtiene una Xi = 8
Curva normal
En estadística se llama distribución normal o campana de Gauss, a una de las
distribuciones de probabilidad de variable continua que con más frecuencia
aparece en fenómenos reales.
Propiedades
Es simétrica respecto de su media
Es asintótica respecto del eje de abscisas
La moda y la mediana son ambas iguales a la media
Distribución de probabilidad en un entorno de la media:
en el intervalo [μ - σ, μ + σ] se encuentra comprendida, aproximadamente, el
68,26% de la distribución;
en el intervalo [μ - 2σ, μ + 2σ] se encuentra, aproximadamente, el 95,44% de la
distribución;
en el intervalo [μ -3σ, μ + 3σ] se encuentra comprendida, aproximadamente,
el 99,74% de la distribución.
Estas propiedades son de gran utilidad para el establecimiento de intervalos de
confianza. Por otra parte, el hecho de que prácticamente la totalidad de la
distribución se encuentre a tres desviaciones típicas de la media justifica los límites
de las tablas empleadas habitualmente en la normal estándar.
5. Puntuaciones individuales
La curva normal
5. Puntuaciones individuales
65−58,2 65−52,4
𝑍𝐽𝑜𝑠é = = 2,1 𝑍𝐴𝑛𝑎 = 2,4
3,1 = 5,1
José es más parecido a su grupo que Ana, si bien ambos están por
encima del peso medio.
5. Puntuaciones individuales
7,5−6,5 8,2−8
𝑍𝐵𝑖𝑜𝑙𝑜𝑔í𝑎 = = 0,77 𝑍𝐺𝑒𝑜𝑔𝑟𝑎𝑓í𝑎 = =0,29
1,3 0,7
5. Puntuaciones individuales
Percentiles
Son el resultado de dividir la distribución en 100 partes iguales.
Cada percentil indica el % de sujetos que está por debajo de cada
puntuación
Si un sujeto con una puntuación de 19 en un test supera al 45% de su
grupo, la puntuación 19 es el Pc45.
El percentil indica la posición relativa del sujeto en el grupo. No es una
puntuación, no hace referencia a valores absolutos.
Un sujeto que ocupe un percentil 98 en un examen de conocimientos
supera al 98% de su clase, pero no necesariamente sabe más que la
mayoría. A la inversa, un sujeto que ocupe el Pc5, puede saber lo
suficiente como para aprobar.
Los Pc se interpretan y calculan dentro de del grupo de referencia. No
se pueden comparar percentiles de grupos diferentes
5. Puntuaciones individuales
Percentiles
Algunos percentiles tienen nombres y símbolos específicos:
Deciles: Son los percentiles 10, 20, 30,,, y se simbolizan D1 (=P10), D2 (=P20)..
Cuartiles: son los percentiles que dividen al grupo en cuatro partes iguales (cada
una con el 25% de los sujetos)
Q3 (=P75). Deja por debajo al 75% de los sujetos y al 25% por encima
Q2 (=P50). Es la mediana (medida de tendencia central). Deja por encima y
por debajo al 50% de los sujetos
Q1 (=P25). Deja por debajo al 25% de los sujetos y al 75% por encima
Limitación de los percentiles: no hay unidad constante entre ellos. No se puede
afirmar que quien ocupa el P80 sabe el doble que quien ocupa el P40.
Ventajas:
Fácil comprensión
Muy utilizados en el diagnóstico psicopedagógico.
Inconvenientes
Falta de una unidad constante.
No hay distribución homogénea de sujetos
No susceptible de operaciones lo que limita su interpretación.
5. Puntuaciones individuales
Equivalencia de puntuaciones
Q1 Q2 Q3
D1 D2 D3 D4 D5 D6 D7 D8 D9
Ejemplo en SPSS
Estadísticos
Perdidos 17 2 -1,0283540
3 -,6802980
Percent iles 10 -1,5777240
4 -,3933880
20 -1,0283540 5 -,1008200
30 -,6802980 6 ,1815900
80 ,7574180 7 ,4212050
8 ,7574180
90 1,1816700
9 1,1816700
5. Puntuaciones individuales