You are on page 1of 7

a. Medidas de dispersión.

Las medidas de dispersión tratan, a través del cálculo de diferentes fórmulas, de arrojar
un valor numérico que ofrezca información sobre el grado de variabilidad de una
variable. las medidas de dispersión son números que indican si una variable se mueve
mucho, poco, más o menos que otra. La razón de ser de este tipo de medidas es conocer
de manera resumida una característica de la variable estudiada. En este sentido, deben
acompañar a las medidas de tendencia central. Juntas, ofrecen información de un sólo
vistazo que luego podremos utilizar para comparar y, si fuera preciso, tomar decisiones.
Las medidas de dispersión más conocidas son: el rango, la varianza, la desviación típica
y el coeficiente de variación (no confundir con coeficiente de determinación).
El rango es un valor numérico que indica la diferencia entre el valor máximo y el
mínimo de una población o muestra estadística. Su fórmula es:

Donde:

 R → Es el rango.
 Máx → Es el valor máximo de la muestra o población.
 Mín → Es el valor mínimo de la muestra o población estadística.
 x → Es la variable sobre la que se pretende calcular esta medida.

Varianza

La varianza es una medida de dispersión que representa la variabilidad de una serie de


datos respecto a su media. Formalmente se calcula como la suma de los residuos al
cuadrado divididos entre el total de observaciones. Su fórmula es la siguiente:

∑ ( x i−x)2
2 i
σ =
N

 X → Variable sobre la que se pretenden calcular la varianza


 xi → Observación número i de la variable X. i puede tomará valores entre 1 y n.
 N → Número de observaciones.
 x̄ → Es la media de la variable X.

Desviación típica

La desviación estándar o desviación típica es una medida que ofrece información sobre
la dispersión media de una variable. La desviación estándar es siempre mayor o igual
que cero.

La desviación típica es otra medida que ofrece información de la dispersión respecto a


la media. Su cálculo es exactamente el mismo que la varianza, pero realizando la raíz
cuadrada de su resultado. Es decir, la desviación típica es la raíz cuadrada de la
varianza.


N

∑ ( x i−x)2
i
σ=
N

 X → Variable sobre la que se pretenden calcular la varianza


 xi → Observación número i de la variable X. i puede tomará valores entre 1 y n.
 N → Número de observaciones.
 x̄ → Es la media de la variable X.

Coeficiente de variación

Su cálculo se obtiene de dividir la desviación típica entre el valor absoluto de la media


del conjunto y por lo general se expresa en porcentaje para su mejor comprensión.

σx
CV =
¿ x̄ ∨¿ ¿

 X → Variable sobre la que se pretenden calcular la varianza


 σx → Desviación típica de la variable X.
 | x̄ | → Es la media de la variable X en valor absoluto con x̄ ≠ 0

Ejemplo

En una población de elefantes y otra de ratones. La población de elefantes tiene un peso


medio de 5.000 kilogramos y una desviación típica de 400 kilogramos. La población de
ratones tiene un peso medio de 15 gramos y una desviación típica de 5 gramos. Si
comparáramos la dispersión de ambas poblaciones mediante la desviación típica
podríamos pensar que hay mayor dispersión para la población de elefantes que para la
de los ratones.

Sin embargo al calcular el coeficiente de variación para ambas poblaciones, nos


daríamos cuenta que es justo al contrario.

Elefantes:  400/5000=0,08
Ratones:  5/15=0,33

Si multiplicamos ambos datos por 100, tenemos que el coeficiente de variación para los
elefantes es de apenas un 8%, mientras que el de las ratones es de un 33%. Como
consecuencia de la diferencia entre las poblaciones y su peso medio, vemos que la
población con mayor dispersión, no es la que tiene una mayor desviación típica.
b. Medidas de posición.
Las medidas de posición son indicadores estadísticos que permiten resumir los datos en
uno solo, o dividir su distribución en intervalos del mismo tamaño.
Las medidas de posición, por tanto, sirven para medir y para dividir.
Las medidas de posición se suelen dividir en dos grandes grupos: la de tendencia no
central y las centrales. Las medidas de posición no centrales son los cuantiles. Estos
realizan una serie de divisiones iguales en la distribución ordenada de los datos. De esta
forma, reflejan los valores superiores, medios e inferiores.
El cuartil: Es uno de los más utilizados y divide la distribución en cuatro partes iguales.
Así, existen tres cuartiles. Los valores inferiores de la distribución se sitúan por debajo
del primero (Q1). La mitad o mediana son los valores menores iguales al cuartil dos
(Q2) y los superiores son representados por el cuartil tres (Q3).
El quintil: En este caso, divide la distribución en cinco partes. Por tanto, hay cuatro
quintiles. Además, no existe ningún valor que divida la distribución en dos partes
iguales. Es menos frecuente que el anterior.
El decil: Estamos ante un cuantil que divide los datos en diez partes iguales. Existen
nueve deciles, de D1 a D9. El D5 se corresponde con la mediana. Por su lado, los
valores superiores e inferiores (equivalentes a los diferentes cuartiles) se sitúan en
puntos intermedios entre estos.

El percentil: Por último, este cuantil divide la distribución en cien partes. Hay 99
percentiles. Tiene, a su vez, una equivalencia con los deciles y cuartiles.
En los cuartiles se usan como parámetros el 1 (Q1), 2 (Q2 y 3 (Q3). En el caso de
deciles, quintiles o percentiles, se utiliza una fórmula similar y n/10, n/5 o n/100. De
manera que esa n es la posición, de 1 a 9 para los deciles, de 1 a 4 para los quintiles y de
1 a 99 para los percentiles
Por ejemplo, el quintil 2 sería 2/5, el decil 5 sería 5/10 y el percentil 50 sería 50/100.
Medidas de posición central
Estas nos permiten resumir la distribución de los datos en un solo valor central,
alrededor del cual se sitúan; mientras que las segundas dividen la distribución en partes
iguales. Estas ya han sido desarrolladas en otros artículos de Economipedia, por tanto,
nos limitaremos a ofrecer una información breve de cada una.

La media aritmética, geométrica o armónica: Son tres medidas centrales que nos indican
un promedio ponderado de los datos. La primera es la más utilizada y la más conocida
de las tres. La geométrica se aplica en series que muestran crecimientos porcentuales.
Por su parte, la armónica es útil en el análisis de inversiones en bolsa.
La mediana: En este caso, esta es la medida de posición central más reconocible. Divide
la distribución en dos partes iguales. De esta forma, expresa el valor mediano, que no
medio. Es muy útil en variables como los ingresos o salarios, a la vez que está muy
relacionada con la media y algunos de los cuantiles vistos.
La moda: Estamos ante una medida central de los valores más frecuentes. Por tanto, la
moda nos informa sobre aquellos que se repiten en más ocasiones. Esta medida es muy
útil en los estudios de mercado cuando medimos una impresión sobre un producto con
una escala likert.
Vamos a mostrar las principales fórmulas de los tres tipos de medias ponderadas más
utilizados. Todas ellas se pueden obtener en una hoja de cálculo.
i=1

Media aritmética
∑ xi
n
x=
N

√∏
t =1
N
Media geométrica G= xi
n

N
A= i=1
Media armónica n
∑ Xi
n i

c. Correlación lineal.
Dos variables se correlacionan cuando las mediciones de una variable cambian
simultáneamente con las medidas de la otra. Dos variables están correlacionadas si sus
medidas cambian juntas, de manera consistentes, de caso en caso.
El proceso para superar las mejores estimaciones de una variable dependiente (Y)
considerando su relación con una variable independiente (X) se llama correlación lineal
simple y análisis de regresión. (Simple se refiere al caso de dos variables. Con tres o
más variables se denomina correlación múltiple).
La correlación, también conocida como coeficiente de correlación lineal (de Pearson),
es una medida de regresión que pretende cuantificar el grado de variación conjunta entre
dos variables. El coeficiente de correlación es la medida específica que cuantifica la
intensidad de la relación lineal entre dos variables en un análisis de correlación. En los
informes de correlación, este coeficiente se simboliza con la r.
El coeficiente de correlación es el resultado de dividir la covarianza entre las variables
X y Y entre la raíz cuadrada del producto de la varianza de X y la de Y. Se realiza la
sumatoria del producto de las diferencias entre cada observación de cada variable y su
media correspondiente.
Correlación menor a cero: Si la correlación es menor a cero, significa que es negativa,
es decir, que las variables se relacionan inversamente. Cuando el valor de alguna
variable es alto, el valor de la otra variable es bajo. Mientras más próximo se encuentre
a -1, más clara será la covariación extrema.
La correlación estadística constituye una técnica estadística que nos indica si dos
variables están relacionadas o no. Por ejemplo, considera que las variables son el
ingreso y el gasto familiares. Se sabe que los aumentos de ingresos y gastos disminuyen
juntos.
d. Regresión lineal.
La regresión es su forma más sencilla se llama regresión lineal simple. Se trata de una
técnica estadística que analiza la relación entre dos variables cuantitativas, tratando de
verificar si dicha relación es lineal La regresión lineal aplicada en fabricación es una
técnica estadística para modelar e investigar la relación entre dos o más variables. Este
método es aplicable en muchas situaciones en las que se estudia la relación entre dos o
más variables o predecir un comportamiento, algunas incluso sin relación con la
tecnología. ¿Cómo se calcula la regresión lineal? La ecuación de regresión lineal simple
indica que el valor medio o valor esperado de y es una función lineal de x: E(y/x) = β0 +
β1 x. Si β1=0 entonces E(y/x) = β0 y en este caso el valor medio no depende del valor
de x, y concluimos que x y y no tienen relación lineal.
La regresión lineal permite predecir el comportamiento de una variable (dependiente o
predicha) a partir de otra (independiente o predictora). Tiene presunciones como la
linealidad de la relación, la normalidad, la aleatoriedad de la muestra y homogeneidad
de las varianzas.
e. Diagramas posibles en la regresión y correlación lineal.
Es una cuadrícula en dos dimensiones de las coordenadas de dos variables X y Y. Una
coordenada es un punto en un diagrama de dispersión donde se grafican los valores de
X y Y para un caso. Los estadísticos que acompañan al diagrama de dispersión sólo se
aplican a situaciones en las cuales las coordenadas caen en un patrón lineal. – aquel
donde las coordenadas del diagrama de dispersión caen en un patrón de un ovalo
alargado que se aproxima a la forma de una línea recta.
Los estadounidenses conscientes de la salud consultan a menudo la información
relacionada con los nutrientes que aparecen en los envases de los alimentos con el fin de
evitar los que contengan grandes cantidades de grasa, sodio o colesterol. La siguiente
información se tomó de ocho marcas distintas de queso americano en rebanadas:
Que variables Qué pares de variables espera usted que estén fuertemente relacionadas?
El colesterol y las calorías, porque en tabla se observa que dependiendo la cantidad de
colesterol es la cantidad de calorías que contiene cada producto, o podría ser al revés
que dependiendo la cantidad de calorías es la cantidad de colesterol que contiene cada
producto.
Referencias
Medidas de dispersión - Qué es, definición y concepto | 2022 | Economipedia

¿Qué es la correlación lineal? - OKUPO+

Ritchey, F. (2002). Estadística para las ciencias sociales: el potencial de la


imaginación estadística. Primera Edición. México. Editorial McGRAW –HILL.

COLECCIÓN BICENTENARIO: La matemática y el vivir bien. 5 quinto año. (2012).


Primera edición. Venezuela. Ministerio del Poder Popular para la Educación.

You might also like