Professional Documents
Culture Documents
Otro
Otro
ESTADÍSTICA SOCIAL
SEMANA 6
IACC-2020
1
SEMANA 6 – ESTADÍSTICA SOCIAL
APRENDIZAJES ESPERADOS
• Aplicar en contextos sociales de estudios,
medidas de dispersión para el análisis de
una muestra en el contexto de la
estadística social.
IACC-2020
2
SEMANA 6 – ESTADÍSTICA SOCIAL
IACC-2020
3
SEMANA 6 – ESTADÍSTICA SOCIAL
INTRODUCCIÓN
En el contenido anterior, se vio que existe del cálculo de la varianza. Como se verá
un conjunto de medidas para poder durante el transcurso de este contenido de
determinar cómo los valores de un conjunto estudio, para obtener el valor de la
de datos se centralizan o juntan. desviación estándar, se debe calcular la
varianza, y este cálculo se realiza a través de
Relacionado con las medidas de tendencia una sola fórmula y en un solo momento.
central, que corresponde a cómo los datos
se agrupan o tienden a estar más En la introducción del contenido de estudio
agrupados, también existen otras medidas pasado, se planteó que para poder
para indicar cómo los datos se dispersan. entender ambos conceptos (centralidad y
dispersión), se podía utilizar de ejemplo la
Dentro de las medidas que indican cómo se figura Nº 1, en la cual los puntos de color
dispersan los datos, se encuentran el rango, verde representan un conjunto de valores
la varianza y la desviación estándar. que están mucho más concentrados que los
puntos de color púrpura, los que
Para efectos pedagógicos, se explicará cada
representarían cómo los valores se
una de las medidas por separado. Sin
dispersan.
embargo, es necesario clarificar que la
varianza y la desviación estándar están La utilidad de estas medidas de dispersión al
relacionadas y corresponden a dos igual que las medidas de tendencia central,
momentos en los que se realizan ciertos cobran gran utilidad para considerar si una
cálculos. Dicho de otra manera, para muestra es representativa y entender la
efectos de cálculo, se explican de manera composición de los datos de un fenómeno o
separada, pero una surge del cálculo de la estudio.
otra, es decir, la desviación estándar surge
IACC-2020
4
SEMANA 6 – ESTADÍSTICA SOCIAL
1. MEDIDAS DE DISPERSIÓN
Las medidas de tendencia central y de variación están relacionadas. De hecho, y como se verá
más adelante, para poder calcular la dispersión de un conjunto de datos a través de la desviación
estándar, se toma como referencia la media aritmética (promedio) para su cálculo, ya que lo
que se calcula es a qué distancia está un valor, como por ejemplo la nota 1 de la figura Nº 2 del
promedio 5 del alumno 1.
También, llevado a casos reales, se podría establecer la gran diferencia de ingresos que existen en
nuestro país, existen estudios que mencionan que la renta promedio (media aritmética) en
nuestro país es de aproximadamente $550.000, lo cual es absolutamente válido, sin embargo, la
gran mayoría de los ingresos solo lo posee el 10% de la población, entonces ¿la media o promedio
de los ingresos es realmente representativa?
Lo importante es que se debe lograr una acabada comprensión del concepto de dispersión,
más allá de memorizar la fórmula de la desviación estándar para su cálculo. De hecho, se revisará
la fórmula de cálculo de la varianza y la desviación estándar con el único fin pedagógico de que se
entienda cuál es la lógica que está detrás de esta.
IACC-2020
5
SEMANA 6 – ESTADÍSTICA SOCIAL
notas son todas iguales o, dicho de otra manera, sus notas no se dispersan del promedio.
1.1 RANGO
El rango, es una de las medidas de dispersión o variación más fáciles de calcular, ya que solo
depende de conocer los valores máximo y mínimo. Pero, por lo mismo, no es demasiado útil como
la varianza y la desviación estándar.
La definición de Triola, Pineda y Hernández establece que “el rango de un conjunto de datos es la
diferencia entre el valor máximo y el valor mínimo” (2009, p.93). Dicho de otra manera, el rango es
la distancia entre el valor o puntuación máxima y la mínima, por lo tanto, solo se puede aplicar a
variables cuantitativas.
IACC-2020
6
SEMANA 6 – ESTADÍSTICA SOCIAL
En la figura Nº 4 aparecen las 14 notas de los alumnos, en las cuales, el valor más alto es 7 y el valor
mínimo es 4, por lo que la distancia o rango del conjunto de valores es 3 (7 - 4 = 3).
Se puede revisar otro ejemplo. Si una persona sale de vacaciones en auto hacia el norte de Chile y
parte desde Santiago con destino a la Serena, es posible que el vehículo se detenga a los 20 km de
haber partido. Pues bien, si la Serena corresponde al kilómetro 430, y donde se detiene el auto es
el kilómetro 20, claramente el rango o la distancia que falta por recorrer es de 410 km.
Una utilidad simple del rango dentro del conjunto de medidas de variación o dispersión, es que
indica en qué “rango” se mueven o establecen los datos o entre qué límites, y cuál es el recorrido
máximo o distancia que tienen los valores considerando el valor mínimo o máximo.
La varianza y la desviación estándar señalan como las puntuaciones de una variable cuantitativa de
intervalo o razón se extienden a lo largo de una distribución de datos tomando como punto de
referencia la media o promedio.
La varianza y, por ende, la desviación estándar, se calculan determinando qué tan lejos está cada
puntuación o valor del promedio.
Para poder visualizar de mejor manera lo anterior, se utilizarán las 14 notas que se utilizaron en la
semana 5 de estudio para explicar las medidas de tendencia central y que se puede observar en
la figura Nº 5.
IACC-2020
7
SEMANA 6 – ESTADÍSTICA SOCIAL
Tal y como se puede apreciar, son los mismos valores que se utilizaron en la semana 5 para calcular
el rango. Se tiene la media, la mediana y la moda y, adicionalmente, se señala el valor de la
desviación estándar, que es de 0,78 puntos en escala de notas.
En la tabla de la figura Nº 6, se pueden apreciar las 14 notas resumidas junto con el cálculo del
promedio (6,25). Como se indica en el gráfico que acompaña a la tabla, el promedio se encuentra
señalado con una flecha negra, y como indica, cómo los valores se concentran en torno a este.
Ahora, analizando el gráfico, no desde la concentración sino desde la dispersión, cada una de las
flechas azules indican a qué distancia o cuánto más o menos disperso se encuentra cada valor. Si
se tomara cada uno de los valores por separado, las preguntas serían:
• ¿A qué distancia o qué tan lejos está la nota 4,0 del 6,25 (media)?
• ¿A qué distancia o qué tan lejos está la nota 5,8 del 6,25 (media)?
• ¿A qué distancia o qué tan lejos está la nota 6,0 del 6,25 (media)?
IACC-2020
8
SEMANA 6 – ESTADÍSTICA SOCIAL
• ¿A qué distancia o qué tan lejos está la nota 6,2 del 6,25 (media)?
• ¿A qué distancia o qué tan lejos está la nota 6,3 del 6,25 (media)?
• ¿A qué distancia o qué tan lejos está la nota 6,8 del 6,25 (media)?
• ¿A qué distancia o qué tan lejos está la nota 7,0 del 6,25 (media)?
Esas distancias en las que se encuentra cada uno de los valores, son las que calculan la varianza y
la desviación estándar. Como se podrá observar, para ejemplos didácticos se formularon las
preguntas para cada uno de los 14 valores, pero en la práctica si se tienen 5.432 valores o datos
(ejemplo), no se expresa cada una de las distancias por separado de los 5.432 valores. La misma
lógica aplica para el cálculo de la media.
Para poder tener una mejor comprensión del cálculo y del valor de la varianza y de su resultado
final, la desviación estándar, se muestra la fórmula de cálculo para mostrar sus componentes y
cálculos respectivos.
A continuación, se revisará la fórmula paso a paso para explicar cómo funciona y qué es lo que
calcula:
a) En primer lugar, se deben calcular las puntuaciones de desviación, que determinan a qué
distancia se encuentra cada uno de los valores de la media. Las puntuaciones de
desviación son la resta entre un valor “x” y la media, que se expresa así:
IACC-2020
9
SEMANA 6 – ESTADÍSTICA SOCIAL
b) Una vez que se calculan las puntuaciones de desviación, se elevan al cuadrado cada una de
estas, como se observa en la figura Nº 9
Se deben elevar al cuadrado, ya que, al realizar el cálculo por cada nota, algunos valores
serán negativos (se encuentran por debajo de la media) y otros positivos (se encuentran
por encima de la media), y el valor final de la varianza y, por ende, de la desviación
estándar se expresa en números positivos y no negativos.
El cálculo total que se tendría que realizar para cada una de las 14 notas se puede apreciar en la
figura Nº 10.
IACC-2020
10
SEMANA 6 – ESTADÍSTICA SOCIAL
Una vez que se calcula cada una de las puntuaciones de desviación y se elevan al cuadrado, se
deben sumar y dividir, en este caso, por n-1, debido a que es una muestra de datos pequeña, tal y
como se muestra en la figura Nº 11. Si n (tamaño de la muestra) es 14, entonces 14 - 1 = 13.
IACC-2020
11
SEMANA 6 – ESTADÍSTICA SOCIAL
Finalmente, para poder obtener la desviación estándar, se le aplica la raíz cuadrada a la varianza,
que es 0,610384615, tal como se muestra en la figura Nº 13.
Tal y como indica la pregunta en la figura Nº 13, corresponde entender qué significa el valor de la
desviación estándar de 0,78 puntos en escala de notas. Se podría decir que:
IACC-2020
12
SEMANA 6 – ESTADÍSTICA SOCIAL
A partir del punto anterior, corresponde plantear la definición de la desviación estándar: “la
desviación estándar de un conjunto de valores muestrales, es la medida de variación de los valores
con respecto a la media” (Triola, Pineda y Hernández., 2009, p.94). Lo que hace el cálculo de la
varianza y, por ende, de la desviación estándar, es calcular un promedio de las distancias en las
que se encuentra un conjunto de valores de la media. Esto es como el promedio simple que
se aprendió en la semana 5 y con la misma lógica de cálculo, solo que se calcula a partir de estas
distancias o dispersiones de los valores en relación a la media.
2. APLICACIONES
Muchos autores señalan que lo que se conoce como medidas de dispersión y, específicamente, lo
relacionado con la desviación estándar, resulta de tremenda importancia ya que el tema de la
variación es un concepto muy relevante en estadística (Triola, Pineda y Hernández., 2009). Lo
anterior, por cuanto el concepto de desviación, se utiliza en un conjunto de análisis estadístico y
es la pieza fundamental de lo que se conoce como inferencia estadística.
El concepto de variación, es usado frecuentemente por otras medidas estadísticas, como el sesgo
y el coeficiente de variación, temas que se revisarán el próximo contenido de estudio.
En el caso de las AFP, quien cotice en alguno de los 4 grupos que existe, podría tomar la decisión
de mantener sus recursos en aquel fondo que varíe menos mensualmente al optar por tomar
menos riesgo. O tal vez, alguien que quiera tomar más riesgos, desee mover sus recursos a aquel
fondo que renta más, pero cuyos movimientos mensuales son más variados o dispersos.
Por ejemplo, un bebé al nacer es pesado y medido, entre otras cosas. Al ser medido y pesado se
establece si su peso está dentro del promedio o, dicho de otra manera, si sus medidas no se
dispersan mucho del promedio o de la medida normal para un recién nacido
IACC-2020
13
SEMANA 6 – ESTADÍSTICA SOCIAL
IACC-2020
14
SEMANA 6 – ESTADÍSTICA SOCIAL
COMENTARIO FINAL
Las medidas de dispersión están conformadas, principalmente, por lo que se conoce como la
varianza y la desviación estándar.
La desviación estándar surge del cálculo de la varianza, y esta, a su vez, calcula a qué distancia o
qué tan disperso, en promedio, se encuentra un conjunto de valores en relación al promedio. Lo
último podría parecer un juego de palabras, pero resume el proceso de cálculo de la dispersión.
Para efectos pedagógicos, se utilizaron 14 valores para explicar el sentido de la dispersión, pero
en términos prácticos, el cálculo de la desviación estándar se realiza con un software de cálculo,
como Microsoft Excel o SPSS (Statistical Package for the Social Sciences) que es un Software de
análisis estadístico.
Más que el cálculo, se debe comprender el sentido de la dispersión, ya que su valor se utiliza como
base o referencia para otros tipos de cálculos y análisis, como son el sesgo y el coeficiente
de variación (temas que se verán durante la semana 7 de estudio).
IACC-2020
15
SEMANA 6 – ESTADÍSTICA SOCIAL
REFERENCIAS
Triola, M., Pineda, L. y Hernández, R. (2009). Estadística. 10.ª edición. México: Pearson Educación.
IACC-2020
16
SEMANA 6 – ESTADÍSTICA SOCIAL
IACC-2020
17