You are on page 1of 17

SEMANA 6 – ESTADÍSTICA SOCIAL

ESTADÍSTICA SOCIAL

SEMANA 6

Medidas de dispersión y posición


SEMANA 6
Medidas de dispersión y posición

IACC-2020
1
SEMANA 6 – ESTADÍSTICA SOCIAL

APRENDIZAJES ESPERADOS
• Aplicar en contextos sociales de estudios,
medidas de dispersión para el análisis de
una muestra en el contexto de la
estadística social.

IACC-2020
2
SEMANA 6 – ESTADÍSTICA SOCIAL

APRENDIZAJES ESPERADOS ................................................................................................................. 2


INTRODUCCIÓN ................................................................................................................................... 4
1. MEDIDAS DE DISPERSIÓN ............................................................................................................ 5
1.1 RANGO................................................................................................................................. 6
1.2 VARIANZA Y DESVIACIÓN ESTÁNDAR .................................................................................. 7
2. APLICACIONES ........................................................................................................................... 13
COMENTARIO FINAL .......................................................................................................................... 15

IACC-2020
3
SEMANA 6 – ESTADÍSTICA SOCIAL

INTRODUCCIÓN
En el contenido anterior, se vio que existe del cálculo de la varianza. Como se verá
un conjunto de medidas para poder durante el transcurso de este contenido de
determinar cómo los valores de un conjunto estudio, para obtener el valor de la
de datos se centralizan o juntan. desviación estándar, se debe calcular la
varianza, y este cálculo se realiza a través de
Relacionado con las medidas de tendencia una sola fórmula y en un solo momento.
central, que corresponde a cómo los datos
se agrupan o tienden a estar más En la introducción del contenido de estudio
agrupados, también existen otras medidas pasado, se planteó que para poder
para indicar cómo los datos se dispersan. entender ambos conceptos (centralidad y
dispersión), se podía utilizar de ejemplo la
Dentro de las medidas que indican cómo se figura Nº 1, en la cual los puntos de color
dispersan los datos, se encuentran el rango, verde representan un conjunto de valores
la varianza y la desviación estándar. que están mucho más concentrados que los
puntos de color púrpura, los que
Para efectos pedagógicos, se explicará cada
representarían cómo los valores se
una de las medidas por separado. Sin
dispersan.
embargo, es necesario clarificar que la
varianza y la desviación estándar están La utilidad de estas medidas de dispersión al
relacionadas y corresponden a dos igual que las medidas de tendencia central,
momentos en los que se realizan ciertos cobran gran utilidad para considerar si una
cálculos. Dicho de otra manera, para muestra es representativa y entender la
efectos de cálculo, se explican de manera composición de los datos de un fenómeno o
separada, pero una surge del cálculo de la estudio.
otra, es decir, la desviación estándar surge

Figura Nº 1 Ejemplo de tipos de datos de una muestra

Fuente: material elaborado para esta


asignatura.

IACC-2020
4
SEMANA 6 – ESTADÍSTICA SOCIAL

1. MEDIDAS DE DISPERSIÓN
Las medidas de tendencia central y de variación están relacionadas. De hecho, y como se verá
más adelante, para poder calcular la dispersión de un conjunto de datos a través de la desviación
estándar, se toma como referencia la media aritmética (promedio) para su cálculo, ya que lo
que se calcula es a qué distancia está un valor, como por ejemplo la nota 1 de la figura Nº 2 del
promedio 5 del alumno 1.

También, llevado a casos reales, se podría establecer la gran diferencia de ingresos que existen en
nuestro país, existen estudios que mencionan que la renta promedio (media aritmética) en
nuestro país es de aproximadamente $550.000, lo cual es absolutamente válido, sin embargo, la
gran mayoría de los ingresos solo lo posee el 10% de la población, entonces ¿la media o promedio
de los ingresos es realmente representativa?

Lo importante es que se debe lograr una acabada comprensión del concepto de dispersión,
más allá de memorizar la fórmula de la desviación estándar para su cálculo. De hecho, se revisará
la fórmula de cálculo de la varianza y la desviación estándar con el único fin pedagógico de que se
entienda cuál es la lógica que está detrás de esta.

Por lo anterior, es extremadamente importante entender, en primer lugar, el concepto de


variación o dispersión de los datos. Por ejemplo: en la figura Nº 2 se muestra el promedio de notas
de 3 alumnos distintos, con una escala de notas que va de 1 a 10. Como se puede apreciar, los
promedios son iguales a 5, pero ¿sus notas son iguales?, ¿los 3 alumnos tienen el mismo
rendimiento?, ¿cuánto más o menos se alejan o dispersan sus notas del promedio?

Figura Nº 2 Ejemplo de dispersión de datos independiente de la media aritmética

Fuente: material elaborado para esta asignatura

Como se puede apreciar en la figura Nº 2 y en el gráfico de la figura Nº 3, si bien los 3 alumnos


tienen el mismo promedio, sus notas varían o se alejan de la media de distinta manera. De hecho,
el alumno 1 de la figura Nº 3 tiene notas muy lejanas del promedio o, dicho de otra manera, sus
notas se dispersan mucho de la media o promedio. Caso contrario e s el del alumno 3, cuyas

IACC-2020
5
SEMANA 6 – ESTADÍSTICA SOCIAL

notas son todas iguales o, dicho de otra manera, sus notas no se dispersan del promedio.

Figura Nº 3 Ejemplo de dispersiones

Fuente: material elaborado para esta asignatura.

1.1 RANGO
El rango, es una de las medidas de dispersión o variación más fáciles de calcular, ya que solo
depende de conocer los valores máximo y mínimo. Pero, por lo mismo, no es demasiado útil como
la varianza y la desviación estándar.

La definición de Triola, Pineda y Hernández establece que “el rango de un conjunto de datos es la
diferencia entre el valor máximo y el valor mínimo” (2009, p.93). Dicho de otra manera, el rango es
la distancia entre el valor o puntuación máxima y la mínima, por lo tanto, solo se puede aplicar a
variables cuantitativas.

Se tomará como ejemplo, el conjunto de valores que se ha utilizado desde la semana 5 d e


e s t u d i o para explicar el rango y su forma de cálculo, para lo cual basta con restar el valor mínimo
del valor máximo, tal como se señala en la figura Nº 4.

IACC-2020
6
SEMANA 6 – ESTADÍSTICA SOCIAL

Figura Nº 4 Ejemplo de Rango

Fuente: material elaborado para esta asignatura.

En la figura Nº 4 aparecen las 14 notas de los alumnos, en las cuales, el valor más alto es 7 y el valor
mínimo es 4, por lo que la distancia o rango del conjunto de valores es 3 (7 - 4 = 3).

Se puede revisar otro ejemplo. Si una persona sale de vacaciones en auto hacia el norte de Chile y
parte desde Santiago con destino a la Serena, es posible que el vehículo se detenga a los 20 km de
haber partido. Pues bien, si la Serena corresponde al kilómetro 430, y donde se detiene el auto es
el kilómetro 20, claramente el rango o la distancia que falta por recorrer es de 410 km.

Una utilidad simple del rango dentro del conjunto de medidas de variación o dispersión, es que
indica en qué “rango” se mueven o establecen los datos o entre qué límites, y cuál es el recorrido
máximo o distancia que tienen los valores considerando el valor mínimo o máximo.

1.2 VARIANZA Y DESVIACIÓN ESTÁNDAR


Como se planteó en la introducción, la varianza y la desviación estándar, si bien, son temas
independientes, se encuentran relacionados, ya que uno (desviación estándar) surge del cálculo del
otro (varianza).

La varianza y la desviación estándar señalan como las puntuaciones de una variable cuantitativa de
intervalo o razón se extienden a lo largo de una distribución de datos tomando como punto de
referencia la media o promedio.

La varianza y, por ende, la desviación estándar, se calculan determinando qué tan lejos está cada
puntuación o valor del promedio.

Para poder visualizar de mejor manera lo anterior, se utilizarán las 14 notas que se utilizaron en la
semana 5 de estudio para explicar las medidas de tendencia central y que se puede observar en
la figura Nº 5.

IACC-2020
7
SEMANA 6 – ESTADÍSTICA SOCIAL

Figura Nº 5 Ejemplo de Deviación

Fuente: material elaborado para esta asignatura.

Tal y como se puede apreciar, son los mismos valores que se utilizaron en la semana 5 para calcular
el rango. Se tiene la media, la mediana y la moda y, adicionalmente, se señala el valor de la
desviación estándar, que es de 0,78 puntos en escala de notas.

Para simplificar la explicación del concepto de dispersión y, por ende, de la variación y la


desviación estándar, se resumirán los 14 valores en una tabla de distribución de frecuencias junto
con un gráfico, como se puede apreciar en la figura Nº 6.

Figura Nº 6 Ejemplo de desviación

Fuente: material elaborado para esta asignatura.

En la tabla de la figura Nº 6, se pueden apreciar las 14 notas resumidas junto con el cálculo del
promedio (6,25). Como se indica en el gráfico que acompaña a la tabla, el promedio se encuentra
señalado con una flecha negra, y como indica, cómo los valores se concentran en torno a este.
Ahora, analizando el gráfico, no desde la concentración sino desde la dispersión, cada una de las
flechas azules indican a qué distancia o cuánto más o menos disperso se encuentra cada valor. Si
se tomara cada uno de los valores por separado, las preguntas serían:

• ¿A qué distancia o qué tan lejos está la nota 4,0 del 6,25 (media)?
• ¿A qué distancia o qué tan lejos está la nota 5,8 del 6,25 (media)?
• ¿A qué distancia o qué tan lejos está la nota 6,0 del 6,25 (media)?

IACC-2020
8
SEMANA 6 – ESTADÍSTICA SOCIAL

• ¿A qué distancia o qué tan lejos está la nota 6,2 del 6,25 (media)?
• ¿A qué distancia o qué tan lejos está la nota 6,3 del 6,25 (media)?
• ¿A qué distancia o qué tan lejos está la nota 6,8 del 6,25 (media)?
• ¿A qué distancia o qué tan lejos está la nota 7,0 del 6,25 (media)?

Esas distancias en las que se encuentra cada uno de los valores, son las que calculan la varianza y
la desviación estándar. Como se podrá observar, para ejemplos didácticos se formularon las
preguntas para cada uno de los 14 valores, pero en la práctica si se tienen 5.432 valores o datos
(ejemplo), no se expresa cada una de las distancias por separado de los 5.432 valores. La misma
lógica aplica para el cálculo de la media.

Para poder tener una mejor comprensión del cálculo y del valor de la varianza y de su resultado
final, la desviación estándar, se muestra la fórmula de cálculo para mostrar sus componentes y
cálculos respectivos.

En la figura Nº 7 se puede apreciar la fórmula de la desviación estándar (y la varianza).

Figura Nº 7 Formula de desviación estándar

Fuente: material elaborado para esta asignatura.

A continuación, se revisará la fórmula paso a paso para explicar cómo funciona y qué es lo que
calcula:

a) En primer lugar, se deben calcular las puntuaciones de desviación, que determinan a qué
distancia se encuentra cada uno de los valores de la media. Las puntuaciones de
desviación son la resta entre un valor “x” y la media, que se expresa así:

Figura Nº 8 (que significa (x-ẋ))

Fuente: material elaborado para esta asignatura.

IACC-2020
9
SEMANA 6 – ESTADÍSTICA SOCIAL

Una puntuación de desviación es cuánto se desvía o distancia de la media una puntuación


individual. En este caso, la nota 4,0 se desvía de la media en -2,25 puntos en escala de
notas.

b) Una vez que se calculan las puntuaciones de desviación, se elevan al cuadrado cada una de
estas, como se observa en la figura Nº 9

Figura Nº 9 Ejemplo del desarrollo de la fórmula de Varianza

Fuente: material elaborado para esta asignatura.

Se deben elevar al cuadrado, ya que, al realizar el cálculo por cada nota, algunos valores
serán negativos (se encuentran por debajo de la media) y otros positivos (se encuentran
por encima de la media), y el valor final de la varianza y, por ende, de la desviación
estándar se expresa en números positivos y no negativos.

El cálculo total que se tendría que realizar para cada una de las 14 notas se puede apreciar en la
figura Nº 10.

IACC-2020
10
SEMANA 6 – ESTADÍSTICA SOCIAL

Figura Nº 10 Ejemplo de sumatoria desarrollada

Fuente: material elaborado para esta asignatura.

Una vez que se calcula cada una de las puntuaciones de desviación y se elevan al cuadrado, se
deben sumar y dividir, en este caso, por n-1, debido a que es una muestra de datos pequeña, tal y
como se muestra en la figura Nº 11. Si n (tamaño de la muestra) es 14, entonces 14 - 1 = 13.

Figura Nº 11 Desarrollo de Formula de Varianza

Fuente: material elaborado para esta asignatura.

IACC-2020
11
SEMANA 6 – ESTADÍSTICA SOCIAL

Al elevar al cuadrado las distancias reales o puntuaciones de desviación, se produce el fenómeno


de que dichas distancias se duplican y, por ende, no reflejan las distancias reales. El valor que se
obtiene de 0,610384615 es lo que se conoce como varianza, que es la variación promedio de las
puntuaciones o valores en una distribución de datos. En la figura Nº 12 se puede apreciar cuáles
son los valores y el cálculo que se ha realizado hasta el momento con la fórmula de la desviación
estándar. Sin embargo, aún queda por despejar el símbolo de la raíz cuadrada.

Figura Nº 12 Conclusión de fórmula de Varianza

Fuente: material elaborado para esta asignatura.

Finalmente, para poder obtener la desviación estándar, se le aplica la raíz cuadrada a la varianza,
que es 0,610384615, tal como se muestra en la figura Nº 13.

Figura Nº 13 Calculo de Desviación Estándar

Fuente: material elaborado para esta asignatura.

Tal y como indica la pregunta en la figura Nº 13, corresponde entender qué significa el valor de la
desviación estándar de 0,78 puntos en escala de notas. Se podría decir que:

• Las notas se dispersan en 0,78 puntos del promedio.


• En promedio, las notas se dispersan en 0,78 puntos del promedio.

IACC-2020
12
SEMANA 6 – ESTADÍSTICA SOCIAL

A partir del punto anterior, corresponde plantear la definición de la desviación estándar: “la
desviación estándar de un conjunto de valores muestrales, es la medida de variación de los valores
con respecto a la media” (Triola, Pineda y Hernández., 2009, p.94). Lo que hace el cálculo de la
varianza y, por ende, de la desviación estándar, es calcular un promedio de las distancias en las
que se encuentra un conjunto de valores de la media. Esto es como el promedio simple que
se aprendió en la semana 5 y con la misma lógica de cálculo, solo que se calcula a partir de estas
distancias o dispersiones de los valores en relación a la media.

2. APLICACIONES
Muchos autores señalan que lo que se conoce como medidas de dispersión y, específicamente, lo
relacionado con la desviación estándar, resulta de tremenda importancia ya que el tema de la
variación es un concepto muy relevante en estadística (Triola, Pineda y Hernández., 2009). Lo
anterior, por cuanto el concepto de desviación, se utiliza en un conjunto de análisis estadístico y
es la pieza fundamental de lo que se conoce como inferencia estadística.

El concepto de variación, es usado frecuentemente por otras medidas estadísticas, como el sesgo
y el coeficiente de variación, temas que se revisarán el próximo contenido de estudio.

En términos más cotidianos y prácticos, el concepto de dispersión es utilizado en la vida diaria en


temas tan diversos como pueden ser los fondos de pensiones que administran las AFP, las notas
obtenidas por un grupo de alumnos o los pesos de los niños al nacer.

En el caso de las AFP, quien cotice en alguno de los 4 grupos que existe, podría tomar la decisión
de mantener sus recursos en aquel fondo que varíe menos mensualmente al optar por tomar
menos riesgo. O tal vez, alguien que quiera tomar más riesgos, desee mover sus recursos a aquel
fondo que renta más, pero cuyos movimientos mensuales son más variados o dispersos.

Por ejemplo, un bebé al nacer es pesado y medido, entre otras cosas. Al ser medido y pesado se
establece si su peso está dentro del promedio o, dicho de otra manera, si sus medidas no se
dispersan mucho del promedio o de la medida normal para un recién nacido

IACC-2020
13
SEMANA 6 – ESTADÍSTICA SOCIAL

• En los siguientes hipervínculos podrá revisar algunos


ejemplos de cómo realizar de forma correcta los cálculos de
la varianza y desviación estándar.
• https://bit.ly/2BPgQeo
• https://bit.ly/31QlVgY
• https://bit.ly/2Nh7oG3

IACC-2020
14
SEMANA 6 – ESTADÍSTICA SOCIAL

COMENTARIO FINAL
Las medidas de dispersión están conformadas, principalmente, por lo que se conoce como la
varianza y la desviación estándar.

La desviación estándar surge del cálculo de la varianza, y esta, a su vez, calcula a qué distancia o
qué tan disperso, en promedio, se encuentra un conjunto de valores en relación al promedio. Lo
último podría parecer un juego de palabras, pero resume el proceso de cálculo de la dispersión.

Para efectos pedagógicos, se utilizaron 14 valores para explicar el sentido de la dispersión, pero
en términos prácticos, el cálculo de la desviación estándar se realiza con un software de cálculo,
como Microsoft Excel o SPSS (Statistical Package for the Social Sciences) que es un Software de
análisis estadístico.

Más que el cálculo, se debe comprender el sentido de la dispersión, ya que su valor se utiliza como
base o referencia para otros tipos de cálculos y análisis, como son el sesgo y el coeficiente
de variación (temas que se verán durante la semana 7 de estudio).

• Si solo se observa o se toma como referencia la media o


promedio
Tomando para una
o analizando analizar
parteun
de conjunto
la historia,de
ya datos, se está no
que el promedio
indica qué tan dispersos o concentrados se pueden encontrar los datos.
Por lo anterior, para analizar un conjunto de valores se debe tomar en
cuenta la media y la desviación estándar.

IACC-2020
15
SEMANA 6 – ESTADÍSTICA SOCIAL

REFERENCIAS
Triola, M., Pineda, L. y Hernández, R. (2009). Estadística. 10.ª edición. México: Pearson Educación.

PARA REFERENCIAR ESTE DOCUMENTO, CONSIDERE:

IACC (2020). Medidas de dispersión y posición. Estadística Social. Semana 6.

IACC-2020
16
SEMANA 6 – ESTADÍSTICA SOCIAL

IACC-2020
17

You might also like