Professional Documents
Culture Documents
Patricia Castillo
EJE 3
Pongamos en práctica
Introducción 3
Bibliografía 28
ÍNDICE
En el eje temático 2 estudiamos las medidas de tendencia central y las
medidas de tendencia central y las medidas de localización y su importancia
en la descripción resumida de un conjunto de datos estadístico:
La pregunta que se formula para este eje es: ¿Analizar e interpretar el
grado de variabilidad que existe entre los valores de una variable a través
de la varianza y la desviación típica de los datos, permite al estudiante
comparar la dispersión presente en dos o más variables, o en una variable
INTRODUCCIÓN
Considérese loslos
Considérese puntajes obtenidos
puntajes obtenidosen en
unauna
prueba de aptitud
prueba matemática
de aptitud por
matemática dosdos
por gru-
posgrupos
de estudiantes, los puntajes
de estudiantes, de cada
los puntajes grupo
de cada son:
grupo son:
Puntajes grupo A 69 72 69 73 69 68 68 70 73 69
Puntajes grupo B 91 90 47 50 90 88 45 87 70 42
Tabla 1. Puntajes obtenidos
Tabla 1.en una prueba
Medidas de aptitud matemática.
de dispersión
Fuente: Propia
El estudiante puede verificar que el cálculo de la media para cada grupo da como
resultado 70 puntos, pero si se observa la diferencia de los datos en relación con la
El estudiante puede
media, se tiene queverificar queAelhay
en el grupo cálculo de la media
desviaciones para cada
relativamente grupo dadecomo
pequeñas, hechoresul-
la
tado
máxima diferencia respecto a la media es de 3 unidades y la máxima separación se
70 puntos, pero si se observa la diferencia de los datos en relación con la media,
tiene que en elentre
encontrada grupo A hay desviaciones
cualquier par de datos es relativamente pequeñas,
de cinco unidades. Por sude hecho
parte, en lael máxima
grupo
diferencia respecto a la media es de 3 unidades y la máxima separación
B se encuentran desviaciones de hasta 21 unidades respecto a la media y una máxima encontrada
entre cualquier
separación par datos
entre de datos esunidades.
de 49 de cinco unidades. Por su parte,
Se tiene entonces que la en el grupo
media por síBsola
se encuen-
no es
tran desviaciones de hasta 21 unidades respecto a la media y una
un adecuado descriptor debido a que no da información de la gran variabilidad que máxima separación
entre datoseldegrupo
presenta 49 unidades.
B ni de laSe tiene entonces
homogeneidad delque
grupola media
A, esto por sí sola
refuerza la no
ideaesqueun las
ade-
cuado descriptor debido a que no da información de la gran variabilidad
medidas de tendencia central no resultan suficientes como recursos de análisis en que presenta
el grupo B ni
estudios de la homogeneidad
estadísticos, se requiere dedelotros
grupo A, esto refuerza
descriptores la idea
que midan que las medidas
la variabilidad de losde
tendencia central no resultan suficientes como recursos de análisis
datos y que se complementen con las medidas de tendencia central, estas nuevas en estudios esta-
dísticos, se requiere de otros descriptores que midan la variabilidad de los datos y que
medidas son las medidas de dispersión.
se complementen con las medidas de tendencia central, estas nuevas medidas son las
medidas de dispersión.
Importancia de las medidas de dispersión
Importancia
Las medidasde de las medidas
tendencia de dispersión
central tienen como objetivo el sintetizar los datos en un valor
representativo. Las medidas de dispersión nos dicen hasta qué punto estas medidas de
Las medidas de tendencia central tienen como objetivo el sintetizar los datos en un va-
tendencia central, son representativas como síntesis de la información. Las medidas de
lor representativo. Las medidas de dispersión nos dicen hasta qué punto estas medidas
dispersión cuantifican la separación, la dispersión, la variabilidad de los valores de la
de tendencia central, son representativas como síntesis de la información. Las medidas
de distribución respecto al la
dispersión cuantifican valor central, esladecir,
separación, son unlaindicador
dispersión, de cómo
variabilidad de lossevalores
agrupande la
o dispersanrespecto
distribución los datosalalrededor de unaes
valor central, medida
decir, de
sontendencia central.
un indicador de cómo se agrupan o
dispersan los datos alrededor de una medida de tendencia central.
En las medidas de dispersión se distingue entre medidas de dispersión absolutas, que no
En son
las medidas
comparablesde dispersión se distingue
entre diferentes muestrasentre medidas
y las relativasdequedispersión absolutas,
permitirán comparar que
no varias
son comparables
muestras. entre diferentes muestras y las relativas que permitirán comparar
varias muestras.
LasLas medidas
medidas de de dispersión
dispersión de mayor
de mayor uso uso en estudios
en estudios estadísticos
estadísticos son
son el el rango,
rango, la
la varian-
za,varianza, la desviación
la desviación estándarestándar o desviación
o desviación típica, ytípica, y el coeficiente
el coeficiente de variación.
de variación. En a
En cuanto
cuanto a varianza y desviación estándar o típica, se diferencian los casos poblacional
varianza y desviación estándar o típica, se diferencian los casos poblacional y muestral. y
Lasmuestral.
medidasLasde medidas de se
dispersión dispersión
calculansepara
calculan para variables
variables cuantitativas.
cuantitativas.
𝟐𝟐
𝝈𝝈𝝈𝝈𝟐𝟐 ==𝐕𝐕𝐕𝐕𝐕𝐕𝐕𝐕𝐕𝐕𝐕𝐕𝐕𝐕𝐕𝐕 𝐩𝐩𝐩𝐩𝐩𝐩𝐩𝐩𝐩𝐩𝐩𝐩𝐩𝐩𝐩𝐩𝐩𝐩𝐩𝐩𝐩𝐩
𝐕𝐕𝐕𝐕𝐕𝐕𝐕𝐕𝐕𝐕𝐕𝐕𝐕𝐕𝐕𝐕 𝐩𝐩𝐩𝐩𝐩𝐩𝐩𝐩𝐩𝐩𝐩𝐩𝐩𝐩𝐩𝐩𝐩𝐩𝐩𝐩𝐩𝐩
𝟐𝟐
𝑺𝑺𝑺𝑺𝟐𝟐 ==𝐕𝐕𝐕𝐕𝐕𝐕𝐕𝐕𝐕𝐕𝐕𝐕𝐕𝐕𝐕𝐕 𝐦𝐦𝐦𝐦𝐦𝐦𝐦𝐦𝐦𝐦𝐦𝐦𝐦𝐦𝐦𝐦
𝐕𝐕𝐕𝐕𝐕𝐕𝐕𝐕𝐕𝐕𝐕𝐕𝐕𝐕𝐕𝐕 𝐦𝐦𝐦𝐦𝐦𝐦𝐦𝐦𝐦𝐦𝐦𝐦𝐦𝐦𝐦𝐦
Por susu parte
Por parte lala desviación
desviación estándar,
estándar, también
también conocida
conocida como
como desviación
desviación típica,
típica,
Por su parte
corresponde la desviación
a la raíz estándar,
cuadrada también
positiva de conocida
la como
Varianza. Se desviación
debe típica,
distinguir
corresponde a la raíz cuadrada positiva de la Varianza. Se debe distinguir entre corres-
entre
ponde a la raíz cuadrada
desviación estándar
desviación positiva
estándar poblacional de la Varianza.
poblacional yy desviación Se debe
desviación estándar distinguir
estándar muestral. entre
muestral. Los desviación
Los símbolos
símbolos
estándar poblacional
empleados
empleados son:son: y desviación estándar muestral. Los símbolos empleados son:
EsEsimportante
importantehacer hacernotar
notarque
quelaladesviación
desviaciónestándar
estándarsesemidemideen enlas
lasmismas
mismasunidades
unidades
quelos losvalores
valoresde de lasobservaciones,
observaciones,por porlolotanto
tantoresulta
resultamás
másfácil
fácillalacomparación
comparación
Esque
importante hacer las
notar que la desviación estándar se mide en las mismas unidades
directa
directa de la desviación
de la desviación estándar con
estándar con la la media
media aritmética
aritmética y otras
y otras medidas de tendencia
que los valores de las observaciones, por lo tanto resulta más medidas de tendencia
fácil la comparación di-
central.LaLadesviación
central. desviaciónestándar
estándarseseinterpreta
interpreta comolalavariación
variaciónpromedio
promediode delos
losdatos
datos
recta de la desviación estándar con la mediacomo aritmética y otras medidas de tendencia
conrespecto
con
central. respecto aalalamedia.
La desviación media.
estándar se interpreta como la variación promedio de los datos
con respecto a la media.
Cálculode
Cálculo delalavarianza
varianzapara
paradatos
datosno noagrupados
agrupados
Decirque
Decir quelalavarianza
varianzaequivale
equivalealalpromedio
promediode delos
loscuadrados
cuadradosde delas
lasdesviaciones
desviacionesrespecto
respecto
aalalamedia,
media,significa
significaque
quepara
paracalcular
calcularlalavarianza,
varianza,primero
primerosesedebe
debehallar
hallarlaladesviación
desviaciónde de
cada observación respecto a la media, luego se halla el cuadrado de cada desviación yy
cada observación respecto a la media, luego se halla el cuadrado de cada desviación
sobreestos
sobre estoscuadrados
cuadradossesecalcula
calculaelelpromedio.
promedio.
Decir que la varianza equivale al promedio de los cuadrados de las desviaciones respecto
a la media, significa que para calcular la varianza, primero se debe hallar la desviación
de cada observación respecto a la media, luego se halla el cuadrado de cada desviación
y sobre estos cuadrados se calcula el promedio.
Para unun
Para conjunto
conjunto dedeobservaciones
observaciones dede datos nono
datos agrupados correspondientes
agrupados correspondientes a una
Para Para
Para
un unun conjunto
conjunto
conjunto de de observaciones
deobservaciones
observaciones dede
de datos
datos
datos no
nono agrupados
agrupados
agrupados correspondientes
correspondientes
correspondientes a auna
auna
auna
una po-
Para un
poblaciónconjunto
población de tamaño
de de
tamaño observaciones
𝑁𝑁 ,
𝑁𝑁 en
, enel que
el la
que dela datos
media
media no agrupados
aritmética correspondientes
poblacional
aritmética es
poblacional 𝝁𝝁,
es la
𝝁𝝁, a
fórmula
la una
fórmula que
que
población
blación dede
de tamaño
población tamaño
tamañoN, 𝑁𝑁en,𝑁𝑁en
el, en
el el
quequeque la media
lalamedia
media aritmética
aritmética
aritmética poblacional
poblacional
poblacional eses 𝝁𝝁,
𝝁𝝁, la
lafórmula
la, fórmula
fórmula que
que que
población
permite
permiteel de tamaño
cálculo
el cálculodede 𝑁𝑁
la , en
varianza
la el que
varianza es: la
es: media aritmética poblacional es 𝝁𝝁, la fórmula que
permite
permite el el
permite el cálculo
cálculo
cálculo de
dedela la varianza
lavarianza
varianza es:es:
es:
permite el cálculo de la varianza es:
𝑵𝑵 𝑵𝑵
𝟏𝟏 𝑵𝑵 𝑵𝑵
𝟐𝟐 𝟐𝟐 𝟏𝟏𝟏𝟏𝟏𝟏𝑵𝑵 𝟐𝟐 𝟐𝟐
𝝈𝝈 𝝈𝝈
𝟐𝟐𝝈𝝈=
𝟐𝟐 =𝟏𝟏
= (𝑿𝑿(𝑿𝑿
𝒊𝒊 −
(𝑿𝑿 − 𝝁𝝁)
− 𝝁𝝁) 𝟐𝟐 𝟐𝟐
𝝁𝝁)
𝝈𝝈 =
𝝈𝝈𝟐𝟐 = 𝑵𝑵 𝑵𝑵 (𝑿𝑿
(𝑿𝑿 −
𝒊𝒊
𝒊𝒊 − 𝒊𝒊 𝝁𝝁)
𝝁𝝁) 𝟐𝟐
𝑵𝑵
𝑵𝑵𝒊𝒊!𝟏𝟏𝒊𝒊!𝟏𝟏 𝒊𝒊
𝑵𝑵 𝒊𝒊!𝟏𝟏𝒊𝒊!𝟏𝟏
𝒊𝒊!𝟏𝟏
Si Si
se
Sisetrata
se dede
trata
trata una muestra,
una muestra,el el
promedio
promedio sesecalcula sobre
calcula una
sobre unaunidad
unidad menos
menosque
queel elel
Si se trata dede unauna muestra,
muestra, el el promedio
promedio se se calcula
calcula sobre
sobre unauna unidad
unidad menos
menos que
que el
Sitamaño
se
Si tamaño
se trata
trata de
de de
la
de una
una muestra,
muestra,
muestra,
la en
muestra, el
este
en promedio
el
este promedio
caso, si
caso, la
si se calcula
se
media
la media sobre
calcula
muestral
muestraluna
sobre
es unidad
una
𝑿𝑿,
es la menos
unidad
fórmula
la para
fórmula que
menosla
para elque el ta-
varianza
la
tamaño
tamaño de la muestra,
demuestra,
la muestra, en en este
este caso,
caso, si media
silala la media muestral
muestral es es 𝑿𝑿,
𝑿𝑿,, 𝑿𝑿, la fórmula
la fórmula para
para lavarianza
lala varianza
varianza
maño
tamaño
muestralde
muestral la
de en este caso, si media muestral es la fórmula para
laes:muestra, en este caso, si la media muestral es 𝑿𝑿, la fórmula para la varianza
es:es: varianza
muestral
muestral es:
muestral
muestral
es:es:
𝑵𝑵 𝑵𝑵
𝟏𝟏 𝟏𝟏𝟏𝟏 𝑵𝑵𝑵𝑵 𝑵𝑵
𝑺𝑺𝟐𝟐𝑺𝑺 =
𝟐𝟐𝟐𝟐
𝟐𝟐𝑺𝑺 =
𝟏𝟏
𝟏𝟏 (𝑿𝑿(𝑿𝑿
𝒊𝒊 − − −𝑿𝑿) 𝑿𝑿)
𝟐𝟐 𝟐𝟐
𝟐𝟐 𝟐𝟐
𝑺𝑺 = = (𝑿𝑿(𝑿𝑿 −
𝒊𝒊 𝑿𝑿) 𝑿𝑿)
𝑺𝑺𝟐𝟐 = 𝑵𝑵 −
𝑵𝑵
𝑵𝑵
𝑵𝑵 − −𝟏𝟏
− 𝟏𝟏𝟏𝟏 (𝑿𝑿
− 𝟏𝟏𝟏𝟏𝒊𝒊!𝟏𝟏𝒊𝒊!𝟏𝟏 𝒊𝒊 −
𝒊𝒊
𝒊𝒊
𝑿𝑿) 𝟐𝟐
𝑵𝑵 𝒊𝒊!𝟏𝟏𝒊𝒊!𝟏𝟏
𝒊𝒊!𝟏𝟏
EnEnestudios
estudios estadísticos,
estadísticos, cuando
cuando sesehalla
hallala la varianza
varianza muestral
muestral frecuentemente
frecuentemente lo lo
que sese
que
EnEn estudios
estudios estadísticos,
estadísticos, cuando
cuando se se halla
halla la la varianza
varianza muestral
muestral frecuentemente
frecuentemente lo lo
queque
se se
En
buscaestudios
busca
En busca
estudioses es estadísticos,
obtener
obtener
estadísticos, a a cuando
partir
partir
cuando de dese
ella
se halla
ella
hallauna la
una
la varianza
estimación muestral
estimación
varianza de dela
muestral frecuentemente
varianza
la varianza lo
poblacional. que
poblacional.
frecuentemente lo seLase
La
que
buscaes es obtener
obtenera apartir partirdedeella ellaunaunaestimación
estimacióndedela lavarianza
varianzapoblacional.
poblacional.LaLa
busca es
explicación obtener
minuciosa a partir
dede de
laella ella estimación
diferencia una enen estimación
laslas de la para
expresiones varianza poblacional.
calcular la varianza La
explicación minuciosa de la diferencia en las expresiones para calcular lalala
busca explicación
es obtener
explicación minuciosa
a partir
minuciosa de
de la
la diferencia
una
diferencia en las expresiones
de la varianza
expresiones para calcular
poblacional.
para calcular La varianza
explica-
varianza
varianza
explicación
poblacional
poblacional minuciosa
y la
yylalamuestralde
muestral la diferencia
supera
supera los los en
alcances las
alcances expresiones
dedeeste
este para
curso,
curso, calcular
pero
pero en la
fuentes varianza
más
ción minuciosa
poblacionalyde
poblacional la diferencia
lamuestral
muestralsupera en laslos
supera expresiones
losalcances
alcancesde para calcular
deeste
estecurso,
curso, peroenen
lapero
varianza fuentes
poblacional
enfuentes
fuentesmás más
másy
poblacional
rigurosas
rigurosas
la muestral se sey
supera la
demuestra muestral
demuestra el supera
porqué
el
los alcances porqué de
de de los
de
esteesta alcances
estadiferencia.
curso, de
diferencia. este curso, pero en fuentes
pero en fuentes más rigurosas se demues- más
rigurosas
rigurosas se se demuestra
demuestra el el porqué
porqué de esta
esta diferencia.
diferencia.
trarigurosas
el porqué sede
demuestra el porqué de esta diferencia.
esta diferencia.
Formula
Formula
Formula abreviada
abreviada
abreviada para
para
parael el
cálculo
cálculo dede la la
varianza
varianza poblacional
poblacional
Formula
Formula abreviada
abreviada para el el cálculo
cálculo de de
la la varianza
varianza poblacional
poblacional
Formula abreviadapara para elel cálculo
cálculo de dela lavarianza
varianza poblacional
poblacional
UnaUna
Unafórmula
fórmula
fórmula alternativa
alternativa
alternativa parapara
paracalcular
calcular
calcular la lala
varianza
varianza
varianzapoblacional,
poblacional,
poblacional, matemáticamente
matemáticamente
matemáticamente
Una Una fórmula
fórmula alternativa
alternativa para para calcular
calcular la varianza
la varianza poblacional,
poblacional, matemáticamente
matemáticamente equi-
Una fórmula
equivalente
equivalente a la
a alternativa
anterior,
la anterior,es: para
es: calcular la varianza poblacional, matemáticamente
valenteequivalente
equivalente
a la a laa anterior,
anterior, la anterior,
es: es:es:
equivalente a la anterior, es:
𝑵𝑵 𝑵𝑵
𝟏𝟏 𝟏𝟏𝟏𝟏𝑵𝑵𝑵𝑵 𝑵𝑵 𝟐𝟐 𝟐𝟐
𝟐𝟐 𝟐𝟐
𝝈𝝈 𝝈𝝈
𝟐𝟐 =
𝟏𝟏
𝟐𝟐 = 𝟏𝟏 𝑿𝑿𝒊𝒊𝑿𝑿𝑿𝑿𝟐𝟐𝒊𝒊 𝟐𝟐−−
𝝁𝝁 𝟐𝟐 𝟐𝟐
𝟐𝟐 𝟐𝟐
𝝁𝝁
𝝈𝝈𝟐𝟐𝝈𝝈= =𝑵𝑵𝑵𝑵 𝑿𝑿 𝟐𝟐 𝒊𝒊 − −
𝝁𝝁 𝟐𝟐𝝁𝝁
𝝈𝝈 = 𝑵𝑵𝒊𝒊!𝟏𝟏 𝑵𝑵𝒊𝒊!𝟏𝟏𝑿𝑿𝒊𝒊 − 𝝁𝝁
𝒊𝒊
𝑵𝑵 𝒊𝒊!𝟏𝟏 𝒊𝒊!𝟏𝟏
𝒊𝒊!𝟏𝟏
LaLa ventaja
ventaja que
que presenta
presenta esta última
esta última expresión
expresión eses
queque nono sese
requiere
requiere calcular
calcular cada
cadaunaunadede
LaLa ventaja
ventaja que
que presenta
presenta esta
esta última
última expresión
expresión es es
que quenono se se requiere
requiere calcular
calcular cada
cada una una
dede
La
Lalas ventaja
las
ventaja quepresenta
desviaciones,
desviaciones,
que presenta
aunque
aunqueesta
esta última
requiere
requiere
últimaqueexpresión
quesese calcule
expresión eses
calcule que
la que
la no
suma sederequiere
suma
no los
de
se los calcular
cuadrados
cuadrados
requiere cada
de
calcularde unauna
cada
cada
cada de
una
una
las desviaciones, aunque requiere que se calcule la suma
las desviaciones, aunque requiere que se calcule la suma de los cuadrados de cada una de los cuadrados de cada una
las
dede de
lasdesviaciones,
las observaciones.
las observaciones.
desviaciones, aunque
aunque requiere
requiere que se
que calcule
se la
calcule suma
la de
suma losdecuadrados
los de
cuadrados cada de una
cada
dede laslas observaciones.
observaciones.
unadede laslas
observaciones.
observaciones.
Ejemplo
Ejemplo
Ejemplo 5.1:5.1:
5.1:
Ejemplo 5.1:
Ejemplo 5.1:
Supóngase
Supóngase
Supóngase quequesese
que quiere
quiereestudiar
estudiar el el
nivel
nivel dede pureza
pureza dede sustancias
sustancias médicas
médicas producidas
producidas
Supóngase que se se quiere
quiere estudiar
estudiar el el nivel
nivel dede pureza
pureza dede sustancias
sustancias médicas
médicas producidas
producidas
Supóngase
enen un undia. Se
dia. que
tiene
Se se
tiene quiere
unauna estudiar
población
población deel
denivel
15 15 de
frascos
frascospureza
de de de
sustancia sustancias
sustancia y se
y médicas
realiza
se la
realiza producidas
prueba
la prueba sobre
sobre
enen unun dia.
dia. SeSe tiene
tiene una
una población
población dede 1515 frascos
frascos dede sustancia
sustancia y sey se realiza
realiza la la prueba
prueba sobre
sobre
encada
cada ununodia.
unodeSe
de tiene
ellos.
ellos.una
LosLospoblación
datos
datos de
registrados 15
registrados frascos
son sonlos de
que
los sustancia
quese muestran
se y
muestranse realiza
en la
en la prueba
siguiente
la siguiente sobre
tabla,
tabla,a aa
cada
cada unounodede ellos.
ellos. LosLos datos
datos registrados
registrados sonson loslos
queque se se muestran
muestran enenla la siguiente
siguiente tabla,
tabla, a
cada
partir
partiruno
dede de
los ellos.
cuales
los cualesLos
se datos
pide
se pide registrados
hallar
hallarla la
varianza sonpoblacional.
varianza los que se muestran en la siguiente tabla, a
poblacional.
partir de los cuales se pide hallar la varianza
partir de los cuales se pide hallar la varianza poblacional.
poblacional.
partir de los cuales se pide hallar la varianza poblacional.
Estadística - eje 3 Pongamos en práctica
7
Ejemplo 1. Varianza para el nivel de pureza de sustancias médicas producidas en
un día
𝟏𝟏𝟏𝟏
𝟏𝟏𝟏𝟏
𝟏𝟏𝟏𝟏 𝟎𝟎,𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎
𝟎𝟎, 𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎
𝝈𝝈𝝈𝝈𝟐𝟐𝟐𝟐 == 𝝁𝝁)𝟐𝟐𝟐𝟐 ==
(𝑿𝑿𝒊𝒊𝒊𝒊−− 𝝁𝝁)
(𝑿𝑿
𝟏𝟏𝟏𝟏
𝟏𝟏𝟏𝟏 𝟏𝟏𝟏𝟏
𝟏𝟏𝟏𝟏
𝒊𝒊!𝟏𝟏
𝒊𝒊!𝟏𝟏
𝝈𝝈𝝈𝝈𝟐𝟐𝟐𝟐 == 𝟎𝟎,
𝟎𝟎,𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎
𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎
Para
Para
Para usar
lalala
usar
usar fórmulaabreviada,
fórmula
fórmula abreviada,la
abreviada, lacolumna
la columna(4)
columna (4) da
(4)dadaelelelvalor
valor de
valordedelalalasumatoria
sumatoria requerida,
requerida,
sumatoria enen
en
requerida,
este
este
este caso
caso
caso elelel cálculocorrespondiente
cálculo
cálculo correspondientees:
correspondiente es:
es:
𝑵𝑵𝑵𝑵
𝟏𝟏𝟏𝟏 𝟐𝟐
𝝈𝝈𝝈𝝈𝟐𝟐𝟐𝟐 == 𝑿𝑿𝑿𝑿𝒊𝒊𝒊𝒊𝟐𝟐 −−𝝁𝝁𝝁𝝁𝟐𝟐𝟐𝟐
𝑵𝑵
𝑵𝑵
𝒊𝒊!𝟏𝟏
𝒊𝒊!𝟏𝟏
𝟏𝟏𝟏𝟏
𝟏𝟏𝟏𝟏
𝟏𝟏𝟏𝟏 𝟐𝟐
𝝈𝝈𝝈𝝈𝟐𝟐𝟐𝟐 == 𝑿𝑿𝑿𝑿𝒊𝒊𝒊𝒊𝟐𝟐 −−𝝁𝝁𝝁𝝁𝟐𝟐𝟐𝟐
𝟏𝟏𝟏𝟏
𝟏𝟏𝟏𝟏
𝒊𝒊!𝟏𝟏
𝒊𝒊!𝟏𝟏
𝟎𝟎,𝟒𝟒𝟒𝟒𝟒𝟒𝟒𝟒
𝟎𝟎, 𝟒𝟒𝟒𝟒𝟒𝟒𝟒𝟒
𝝈𝝈𝝈𝝈𝟐𝟐𝟐𝟐 == 𝟏𝟏𝟏𝟏𝟏𝟏))𝟐𝟐𝟐𝟐
−−((𝟎𝟎,𝟎𝟎,𝟏𝟏𝟏𝟏𝟏𝟏
𝟏𝟏𝟏𝟏
𝟏𝟏𝟏𝟏
𝝈𝝈𝝈𝝈𝟐𝟐𝟐𝟐 == 𝟎𝟎,
𝟎𝟎,𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎
𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎−− 𝟎𝟎,
𝟎𝟎,𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎
𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎
𝝈𝝈𝝈𝝈𝟐𝟐𝟐𝟐 == 𝟎𝟎,
𝟎𝟎,𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎
𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎
Sepuede
Se puedeobservar
observarque
quese
seobtiene
obtieneelelmismo
mismovalor
valorpor
porlas
lasdos
dosfórmulas.
fórmulas.
Se puede observar que se obtiene el mismo valor por las dos fórmulas.
Ejemplo5.2:
Ejemplo 5.2:
Ejemplo 2. Comparación de las calificaciones de dos cursos usando la varianza
Supóngaseque
Supóngase
Comparación que lospuntajes
los
de las puntajesen
enlalaprueba
calificaciones prueba
de deaptitud
de aptitud
dos cursos matemática
matemática
usando paralos
para
la varianza losgrupos
gruposAAyyBB
antescitados
antes citadoscorresponden
correspondenaadatos
datosdedemuestras.
muestras.Calcular
Calcularlalavarianza
varianzade
decada
cadamuestra.
muestra.
Grupo A 𝑿𝑿 = 𝟕𝟕𝟕𝟕
𝟐𝟐
𝑿𝑿𝒊𝒊 (𝑿𝑿 𝒊𝒊 − 𝑿𝑿)A
Grupo 𝑿𝑿 =(𝑿𝑿 𝒊𝒊 − 𝑿𝑿)
𝟕𝟕𝟕𝟕
69
𝑿𝑿𝒊𝒊 (𝑿𝑿𝒊𝒊 -1
− 𝑿𝑿) (𝑿𝑿𝒊𝒊 −1 𝑿𝑿)𝟐𝟐
72
69 2
-1 4
1
69
72 -1
2 1
4
73
69 3
-1 9
1
69
73 -1
3 1
9
68
69 -2
-1 4
1
68 -2 4
70
68 0
-2 0
4
73
70 3
0 9
0
69
73 -1
3 1
9
69 -1 𝟏𝟏𝟏𝟏 1
𝟏𝟏𝟏𝟏 (𝑿𝑿𝒊𝒊 − 𝑿𝑿)𝟐𝟐 = 𝟑𝟑𝟑𝟑
En En este
este casolalavarianza
caso varianza corresponde
corresponde
𝟖𝟖 a:
Tabla
a: 6. Varianza muestral 𝟐𝟐
𝟐𝟐
𝟏𝟏 𝟐𝟐
𝟐𝟐𝟐𝟐 𝒂𝒂ñ𝒐𝒐𝒐𝒐
𝑺𝑺 =
En este caso la varianza corresponde 𝟖𝟖 (𝑿𝑿 𝒊𝒊 − 𝑿𝑿)
a: = = 𝟒𝟒 𝒂𝒂ñ𝒐𝒐𝒐𝒐𝟐𝟐
𝟕𝟕
𝟏𝟏 𝒊𝒊!𝟏𝟏 𝟕𝟕 𝟐𝟐
𝟐𝟐𝟐𝟐 𝒂𝒂ñ𝒐𝒐𝒐𝒐
𝑺𝑺𝟐𝟐 = 𝟖𝟖 (𝑿𝑿 𝒊𝒊 − 𝑿𝑿) 𝟐𝟐
= = 𝟒𝟒 𝒂𝒂ñ𝒐𝒐𝒐𝒐𝟐𝟐
𝟕𝟕𝟏𝟏 𝟕𝟕 𝟐𝟐
𝟐𝟐𝟐𝟐 𝒂𝒂ñ𝒐𝒐𝒐𝒐
𝟐𝟐 𝒊𝒊!𝟏𝟏 𝟐𝟐
𝑺𝑺 = (𝑿𝑿𝒊𝒊 − 𝑿𝑿) = = 𝟒𝟒 𝒂𝒂ñ𝒐𝒐𝒐𝒐𝟐𝟐
𝟕𝟕 𝟕𝟕
𝒊𝒊!𝟏𝟏
𝝈𝝈 = 𝟎𝟎, 𝟎𝟎𝟎𝟎𝟎𝟎
Lo Lo
queque
indica que
indica queenenlaladesviación
desviación promedio de porcentajes
promedio de porcentajesdedeimpureza
impureza
es es
𝟎𝟎, 0, 058.
𝟎𝟎𝟎𝟎𝟎𝟎.
Ejemplo 5.
Ejemplo 5.5:
Calcular
Calcular la la desviación estándar
comparación de las muestras
de las calificaciones dede
dospuntajes obtenidos
cursos usando en la pruebaestán-
la desviación de
aptitud matemática por los grupos estudiantes A y B.
dar.
Y
=𝑩𝑩 =𝑺𝑺 𝟐𝟐𝑩𝑩 𝑺𝑺
𝑺𝑺𝑩𝑩 𝑺𝑺 =𝟐𝟐 =𝟒𝟒𝟒𝟒𝟒𝟒, 𝟕𝟕𝟕𝟕 𝟕𝟕𝟕𝟕
𝟒𝟒𝟒𝟒𝟒𝟒, … …
𝑩𝑩
El valor relativamente
El valor relativamente pequeño
pequeño de𝑺𝑺𝑺𝑺𝑩𝑩𝑨𝑨=𝑺𝑺
de =𝑨𝑨 𝟐𝟐𝟐𝟐,
𝟏𝟏, 𝟓𝟓𝟓𝟓𝟗𝟗𝟗𝟗,
= 𝟗𝟗𝟗𝟗,
𝟏𝟏, muestra
muestra quequelas las
desviaciones
desviacionesdel del
El valor
grupo,relativamente
es un pequeño de S = 1,94, muestra que las desviaciones del grupo, es
grupo, es valor cercano
un valor cercanoa 2,alo2,A que
lo queparece parece razonable
razonable al revisar los los
al revisar valores de las
valores de las
un El
valor cercano a 2, lo que parece razonable al revisar los valores de las observaciones
valor relativamente
observaciones pequeño
reales. Mientras quedeel 𝑺𝑺 𝑨𝑨 =
valor de 𝟏𝟏,𝑺𝑺de
𝟗𝟗𝟗𝟗,
𝑩𝑩 𝑺𝑺=𝑩𝑩muestra
𝟐𝟐𝟐𝟐, 𝟓𝟓𝟓𝟓 𝟓𝟓𝟓𝟓
= 𝟐𝟐𝟐𝟐, que
da unalasuna
desviaciones
medida delgran
de ladegran
reales.observaciones
Mientras que reales.
el valor Mientras
de SB =que 21,58el valor
da una medida da
de la gran medida
variabilidad la
en los
grupo, es un valor
variabilidad en los cercano
valores a 2,
observadoslo que parece
en losen puntajes razonable al
del grupo B. revisar los valores de las
valoresvariabilidad
observados enenloslos
valores observados
puntajes del grupo los
B. puntajes del grupo B.
observaciones reales. Mientras que el valor de 𝑺𝑺𝑩𝑩 = 𝟐𝟐𝟐𝟐, 𝟓𝟓𝟓𝟓 da una medida de la gran
Ejemplo
Ejemplo 6. 5.6:en
variabilidad
Ejemplo los valores observados en los puntajes del grupo B.
5.6:
Calcular de la desviación
Calcular de la desviación estándar muestral
estándar muestral de las deedades
las edades de undegrupo de estudiantes
un grupo de estudiantesde de
bachillerato,
Calcular
Ejemplo de5.6: tratado
la desviación
bachillerato, en elen
tratado ejemplo
estándar 5.3.
el ejemplomuestral
5.3. de las edades de un grupo de estudiantes
de Calcular
bachillerato, tratado en el ejemplo 3.
de la desviación estándar muestral de las edades de un grupo de estudiantes de
Solución:
bachillerato,
Solución:tratado en el ejemplo 5.3.
Solución:
Las edades son:son:
12, 14,
Las edades 12, 9,
14,10,
9, 11,
10, 9,
11,119,y1112yaños12 años y la yvarianza
la varianza es: es:
LasSolución:
edades son: 12, 14, 9, 10, 11, 9, 11 y 12 años y la varianza es:
Las edades son: 12, 14, 9, 10, 11, 9, 11𝑺𝑺y𝟐𝟐12 𝑺𝑺𝟐𝟐años
= y la𝟐𝟐varianza
𝟒𝟒 𝒂𝒂ñ𝒐𝒐𝒐𝒐
= 𝟒𝟒 𝒂𝒂ñ𝒐𝒐𝒐𝒐 𝟐𝟐 es:
𝟐𝟐muestra es: 𝟐𝟐
PorPor lo que
lo que
Por lo la desviación
la que
desviación estándar
estándar
la desviación de 𝑺𝑺lade
dela
estándar =
la 𝟒𝟒 𝒂𝒂ñ𝒐𝒐𝒐𝒐
muestra
muestra es:es:
𝐃𝐃𝐃𝐃𝐃𝐃𝐃𝐃𝐃𝐃𝐃𝐃𝐃𝐃𝐃𝐃ó𝐧𝐧 𝐞𝐞𝐞𝐞𝐞𝐞á𝐧𝐧𝐧𝐧𝐧𝐧𝐧𝐧
𝐃𝐃𝐃𝐃𝐃𝐃𝐃𝐃𝐃𝐃𝐃𝐃𝐃𝐃𝐃𝐃ó𝐧𝐧 𝐞𝐞𝐞𝐞𝐞𝐞á𝐧𝐧𝐧𝐧𝐧𝐧𝐧𝐧
𝐃𝐃𝐃𝐃𝐃𝐃𝐃𝐃𝐃𝐃𝐃𝐃𝐃𝐃𝐃𝐃ó𝐧𝐧 𝐞𝐞𝐞𝐞𝐞𝐞á𝐧𝐧𝐧𝐧𝐧𝐧𝐧𝐧
𝐂𝐂𝐂𝐂𝐂𝐂𝐂𝐂𝐂𝐂𝐂𝐂𝐂𝐂𝐂𝐂𝐂𝐂𝐂𝐂𝐂𝐂 𝐝𝐝𝐝𝐝 𝐯𝐯𝐚𝐚𝐚𝐚𝐚𝐚𝐚𝐚𝐚𝐚𝐚𝐚ó𝐧𝐧
𝐂𝐂𝐂𝐂𝐂𝐂𝐂𝐂𝐂𝐂𝐂𝐂𝐂𝐂𝐂𝐂𝐂𝐂𝐂𝐂𝐂𝐂 𝐝𝐝𝐝𝐝 𝐯𝐯𝐚𝐚𝐚𝐚𝐚𝐚𝐚𝐚𝐚𝐚𝐚𝐚ó𝐧𝐧 =
=
𝐂𝐂𝐂𝐂𝐂𝐂𝐂𝐂𝐂𝐂𝐂𝐂𝐂𝐂𝐂𝐂𝐂𝐂𝐂𝐂𝐂𝐂 𝐝𝐝𝐝𝐝 𝐯𝐯𝐚𝐚𝐚𝐚𝐚𝐚𝐚𝐚𝐚𝐚𝐚𝐚ó𝐧𝐧 = 𝐌𝐌𝐌𝐌𝐌𝐌𝐌𝐌𝐌𝐌 𝐚𝐚𝐚𝐚𝐚𝐚𝐚𝐚𝐚𝐚é𝐭𝐭𝐭𝐭𝐭𝐭𝐭𝐭
𝐌𝐌𝐌𝐌𝐌𝐌𝐌𝐌𝐌𝐌 𝐚𝐚𝐚𝐚𝐚𝐚𝐚𝐚𝐚𝐚é𝐭𝐭𝐭𝐭𝐭𝐭𝐭𝐭
𝐌𝐌𝐌𝐌𝐌𝐌𝐌𝐌𝐌𝐌 𝐚𝐚𝐚𝐚𝐚𝐚𝐚𝐚𝐚𝐚é𝐭𝐭𝐭𝐭𝐭𝐭𝐭𝐭
𝝈𝝈
𝝈𝝈
𝝈𝝈
𝑪𝑪𝑪𝑪
𝑪𝑪𝑪𝑪 =
=
𝑪𝑪𝑪𝑪 = 𝝁𝝁 ×𝟏𝟏𝟏𝟏𝟏𝟏% (𝐂𝐂𝐂𝐂𝐂𝐂𝐂𝐂 𝐩𝐩𝐩𝐩𝐩𝐩𝐩𝐩𝐩𝐩𝐩𝐩𝐩𝐩𝐩𝐩𝐩𝐩𝐩𝐩𝐩𝐩)
×𝟏𝟏𝟏𝟏𝟏𝟏% (𝐂𝐂𝐂𝐂𝐂𝐂𝐂𝐂 𝐩𝐩𝐩𝐩𝐩𝐩𝐩𝐩𝐩𝐩𝐩𝐩𝐩𝐩𝐩𝐩𝐩𝐩𝐩𝐩𝐩𝐩)
𝝁𝝁 ×𝟏𝟏𝟏𝟏𝟏𝟏% (𝐂𝐂𝐂𝐂𝐂𝐂𝐂𝐂 𝐩𝐩𝐩𝐩𝐩𝐩𝐩𝐩𝐩𝐩𝐩𝐩𝐩𝐩𝐩𝐩𝐩𝐩𝐩𝐩𝐩𝐩)
𝝁𝝁
𝑺𝑺
𝑺𝑺
𝑺𝑺 ×𝟏𝟏𝟏𝟏𝟏𝟏% (𝐂𝐂𝐂𝐂𝐂𝐂𝐂𝐂 𝐦𝐦𝐦𝐦𝐦𝐦𝐦𝐦𝐦𝐦𝐦𝐦𝐦𝐦𝐦𝐦)
𝑪𝑪𝑪𝑪 =
𝑪𝑪𝑪𝑪 =
𝑪𝑪𝑪𝑪
= ×𝟏𝟏𝟏𝟏𝟏𝟏% (𝐂𝐂𝐂𝐂𝐂𝐂𝐂𝐂 𝐦𝐦𝐦𝐦𝐦𝐦𝐦𝐦𝐦𝐦𝐦𝐦𝐦𝐦𝐦𝐦)
×𝟏𝟏𝟏𝟏𝟏𝟏% (𝐂𝐂𝐂𝐂𝐂𝐂𝐂𝐂 𝐦𝐦𝐦𝐦𝐦𝐦𝐦𝐦𝐦𝐦𝐦𝐦𝐦𝐦𝐦𝐦)
𝑿𝑿
𝑿𝑿
𝑿𝑿
El
El coeficiente
El coeficiente
coeficiente de
de variación
de variación es
variación es una
es una medida
una medida de
medida de dispersión
de dispersión relativa
dispersión relativa en
relativa en el
en el sentido
el sentido que
sentido que
que
El coeficiente
permiten de variación
realizar es una
comparaciones medida
entre de
la dispersión
variabilidad relativa
de dos en el sentido
poblaciones oque permite
muestras
permiten
permiten realizar comparaciones
realizar comparaciones entre la variabilidad
entre la variabilidad de dos poblaciones
de dos poblaciones o muestras
o muestras
realizar comparaciones
diferentes, entrecuando
particularmente la variabilidad
las de dos
variables a poblaciones
comparar no oestán
muestras
en las diferentes,
mismas
diferentes,
diferentes, particularmente
particularmente cuando
cuando las
las variables
variables a
a comparar
comparar no
no
particularmente cuando las variables a comparar no están en las mismas unidades. están
están en
en las
las mismas
mismasPor
unidades.
unidades.
unidades. Por
Por ejemplo,
ejemplo,
Por ejemplo, cuando
cuando
cuando se
se quiere
quiere
se quiere comparar
comparar la
la
comparar ladel variabilidad
variabilidad
variabilidad del
del ingreso
ingreso
del ingresode per-cápita
per-cápita
per-cápita
ejemplo, cuando se quiere comparar la variabilidad ingreso per-cápita Colombia,
cuyade
de Colombia,
Colombia,
de unidad
Colombia, cuya
cuya unidad
unidad
cuya unidad
de medida de
de
es el de
pesomedida
medida
medida es
es
($) y elesdeel
el peso
peso
ellos
peso ($)
($) y
y
($) y el
Estados el
el de
de los
los Estados
Estados
de los cuya
Unidos, Estados Unidos,
Unidos,
Unidos,
unidad cuya
cuya
cuya
de medida
unidad
unidad
es el de
de
Dólar. medida
medida es
es el
el Dólar.
Dólar.
unidad de medida es el Dólar.
Ejemplo
Ejemplo7. 5.7:
Ejemplo
Ejemplo 5.7:
5.7:
Hallar
Hallar
Hallar
Hallar el
el
el el coeficiente
coeficiente de
de
coeficientede
coeficiente variación
variación correspondiente
variación
devariación para el nivel de aaapureza
correspondiente
correspondiente los
los datos
los dedel
datos
datos del
del estudio
estudio del
estudio
sustancias del
del nivel
nivel de
nivel
médicas de
deprodu-
pureza
pureza
pureza
cidas en unde
de sustancias
dedía médicas
sustancias médicas
sustancias presentado
médicas presentado en
presentado en el
en el ejemplo
el ejemplo
ejemplo 5.1.5.1.
5.1.
Solución:
Solución:
Solución:
Solución:
Este
Este
Este
Este ejemplo
ejemplo
ejemplo
ejemplo corresponde
correspondea aaadatos
corresponde
corresponde datos
datos poblacionales
poblacionales
datospoblacionales por tanto
por
poblacionales por tanto
tanto se
tanto se usa
seusa
se la
usala
usa respectiva
lalarespectiva
respectiva
respectivanotación.
notación.
notación.
notación.
La
La
La La media
media
media
media aritmética
aritmética
aritmética y
y la
la
aritméticayyla varianza
varianza
la varianza tienen
tienen los
los
tienenlos
varianza tienen valores:
valores:
losvalores:
valores:
𝝁𝝁
𝝁𝝁 =
𝝁𝝁 = 𝟎𝟎,
= 𝟎𝟎, 𝟏𝟏𝟏𝟏𝟏𝟏
𝟎𝟎, 𝟏𝟏𝟏𝟏𝟏𝟏
𝟏𝟏𝟏𝟏𝟏𝟏
𝝈𝝈
𝝈𝝈 =
= 𝟎𝟎,
𝟎𝟎, 𝟎𝟎𝟎𝟎𝟎𝟎
𝟎𝟎𝟎𝟎𝟎𝟎
𝝈𝝈 = 𝟎𝟎, 𝟎𝟎𝟎𝟎𝟎𝟎
Por
Por tanto
Por tanto el
tanto el coeficiente
el coeficiente de
coeficiente de variación
de variación es:
variación es:
es:
Por tanto el coeficiente de variación es:
𝟎𝟎,
𝟎𝟎, 𝟎𝟎𝟎𝟎𝟎𝟎
𝟎𝟎, 𝟎𝟎𝟎𝟎𝟎𝟎
𝟎𝟎𝟎𝟎𝟎𝟎 ×𝟏𝟏𝟏𝟏𝟏𝟏%
𝑪𝑪𝑪𝑪
𝑪𝑪𝑪𝑪 =
=
𝑪𝑪𝑪𝑪 = 𝟎𝟎, ×𝟏𝟏𝟏𝟏𝟏𝟏%
×𝟏𝟏𝟏𝟏𝟏𝟏%
𝟎𝟎, 𝟏𝟏𝟏𝟏𝟏𝟏
𝟎𝟎, 𝟏𝟏𝟏𝟏𝟏𝟏
𝟏𝟏𝟏𝟏𝟏𝟏
𝑪𝑪𝑪𝑪
𝑪𝑪𝑪𝑪 =
𝑪𝑪𝑪𝑪 = 𝟑𝟑𝟑𝟑,
= 𝟑𝟑𝟑𝟑, 𝟗𝟗𝟗𝟗 %
𝟑𝟑𝟑𝟑, 𝟗𝟗𝟗𝟗 %
𝟗𝟗𝟗𝟗 %
𝑺𝑺 𝟐𝟐 𝒂𝒂ñ𝒐𝒐𝒐𝒐
𝑪𝑪𝑪𝑪 = ×𝟏𝟏𝟏𝟏𝟏𝟏% = ×𝟏𝟏𝟏𝟏𝟏𝟏%
𝑿𝑿 𝟏𝟏𝟏𝟏 𝒂𝒂ñ𝒐𝒐𝒐𝒐
Con este ejemplo finaliza el estudio de las medidas de dispersión para datos no
agrupados. Frente a la necesidad de apropiarse de los principios estudiados se hace
necesaria la minuciosa revisión de los ejemplos desarrollados y la aplicación de las
Lectura recomendada
estrategias de trabajo a los ejercicios propuestos en el taller, esto a su vez proporciona
bases para
Paraenfrentar
calculardenúmeros
mejor manera el estudio
estadísticos de medidas
y elaborar de dispersión
gráficos en Excel, para
le datos
recomiendo
agrupados, la lectura: a la sexta semana del módulo.
tema correspondiente
Estadística para administración
Rodríguez, J., Pierdant, A., y Rodríguez, C.
Páginas: 156 - 159.
Recuperado de: https://bit.ly/2MeWgLV
𝝈𝝈
𝑪𝑪𝑪𝑪 = ×𝟏𝟏𝟏𝟏𝟏𝟏% 𝐂𝐂𝐂𝐂𝐂𝐂𝐂𝐂. 𝐝𝐝𝐝𝐝 𝐯𝐯𝐯𝐯𝐯𝐯𝐯𝐯𝐯𝐯𝐯𝐯𝐯𝐯ó𝐧𝐧 𝐩𝐩𝐩𝐩𝐩𝐩𝐩𝐩𝐩𝐩𝐩𝐩𝐩𝐩𝐩𝐩𝐩𝐩𝐩𝐩𝐩𝐩
𝝁𝝁
𝑺𝑺
𝑪𝑪𝑪𝑪 = ×𝟏𝟏𝟏𝟏𝟏𝟏% 𝐂𝐂𝐂𝐂𝐂𝐂𝐂𝐂. 𝐝𝐝𝐝𝐝 𝐯𝐯𝐯𝐯𝐯𝐯𝐯𝐯𝐯𝐯𝐯𝐯𝐯𝐯ó𝐧𝐧 𝐦𝐦𝐦𝐦𝐦𝐦𝐦𝐦𝐦𝐦𝐦𝐦𝐦𝐦𝐦𝐦
𝑿𝑿
Calculo de varianza, desviación estándar poblacional y coeficiente de variación
para datos agrupados
Calculo de varianza, desviación estándar poblacional y coeficiente de
La varianza
variación de para
un conjunto de datos agrupados en clases corresponde al promedio pon-
datos agrupados
derado
de los cuadrados de las desviaciones de la marca de clase. A partir de una distri-
bución de frecuencias de datos agrupados, correspondientes a observaciones sobre una
La varianza
población, de un
la varianza conjunto
se puede de datos
calcular a partir agrupados en directa
de la formula clases de
corresponde
la definiciónalo
de lapromedio ponderado ambas
fórmula abreviada, de los cuadrados
fórmulas sede las desviaciones
muestran de la marca de clase.
a continuación.
A partir de una distribución de frecuencias de datos agrupados, correspondientes
!
a observaciones sobre una población,
𝟏𝟏 la varianza se puede calcular a partir de la
𝟐𝟐
formula directa de la definición o de 𝟐𝟐
𝝈𝝈 = 𝒇𝒇la fórmula abreviada,
𝒊𝒊 . 𝑿𝑿! − 𝝁𝝁
ambas fórmulas se
muestran a continuación. 𝑵𝑵
!!!
𝒌𝒌
𝟏𝟏 !
𝝈𝝈𝟐𝟐 = 𝒇𝒇𝒊𝒊 . 𝑿𝑿! − 𝝁𝝁𝟐𝟐
𝑵𝑵
𝒊𝒊!𝟏𝟏
La
La desviación
desviación estándar
estándar corresponde
corresponde a lala raíz cuadrada positiva del
del valor obtenido
La La
desviación estándar
desviación corresponde
estándar a laaaraíz
corresponde la raíz
raíz cuadrada
cuadrada
cuadrada positiva
positiva valor
del valor
positiva del obtenido
obtenido
valor como
obtenido
como varianza,
como varianza,
varianza, es decir:
es decir:
decir:
varianza,
como es decir: es
𝝈𝝈 = 𝝈𝝈 𝟐𝟐
𝝈𝝈 = 𝝈𝝈 𝟐𝟐
𝝈𝝈 = 𝝈𝝈𝟐𝟐
Mientras
Mientras que
que elel coeficiente
coeficiente de
de variación
variación corresponde
corresponde al
al cociente
cociente de
de la
la desviación
desviación
Mientras
estándar
Mientras que
y
que la
el el coeficiente
media de
aritmética,
coeficiente de variación
es decir:
variación corresponde
corresponde al al cociente
cociente de de
la la desviación
desviación están-
estándar yy la
estándar la media
media aritmética,
aritmética, es
es decir:
decir:
dar y la media aritmética, es decir:
𝝈𝝈
𝝈𝝈 ×𝟏𝟏𝟏𝟏𝟏𝟏%
𝑪𝑪𝑪𝑪
𝑪𝑪𝑪𝑪 =
=
𝝈𝝈 ×𝟏𝟏𝟏𝟏𝟏𝟏%
𝑪𝑪𝑪𝑪 = 𝝁𝝁
𝝁𝝁 ×𝟏𝟏𝟏𝟏𝟏𝟏%
𝝁𝝁
Dónde
Dónde
Dónde
Dónde 𝟐𝟐
𝝈𝝈
𝝈𝝈 𝟐𝟐 = Varianza poblacional
= Varianza poblacional
Varianza poblacional
𝝈𝝈𝟐𝟐 =
𝑵𝑵
𝑵𝑵 = = Tamaño de la población.
Tamaño de la población.
𝑵𝑵 = Tamaño de la población.
𝒌𝒌𝒌𝒌 = = Cantidad de clases.
Cantidad de clases.
𝒌𝒌 = Cantidad de clases.
𝒇𝒇𝒇𝒇𝒊𝒊 =
= Frecuencia de la i
Frecuencia de la i −
− esima clase.
esima clase.
𝒇𝒇𝒊𝒊𝒊𝒊 = Frecuencia de la i − esima clase.
𝑿𝑿
𝑿𝑿!! = = Punto medio o marca de la i
Punto medio o marca de la i −
− esima clase.
esima clase.
𝑿𝑿 ! = Punto medio o marca de la i − esima clase.
𝝁𝝁
𝝁𝝁 = = Media aritmética poblacional
Media aritmética poblacional
𝝁𝝁 = Media aritmética poblacional
𝜎𝜎𝜎𝜎 == Desviación estándar poblacional
Desviación estándar poblacional
𝜎𝜎 = Desviación estándar poblacional
𝐶𝐶𝐶𝐶
𝐶𝐶𝐶𝐶 = = Coeficiente de variación
Coeficiente de variación
𝐶𝐶𝐶𝐶 = Coeficiente de variación
Ejemplo
Ejemplo
Ejemplo10.6.1:
6.1:
Ejemplo 6.1:
Calcular
Calcular la
la varianza,
la varianza,
Calcular la
la desviación
la desviación
varianza, estándar
desviación estándar poblacional
poblacional
estándar yy el
el coeficiente
y el coeficiente
poblacional de variaciónde
coeficiente deco-
Calcular
variación
rrespondiente la a varianza,
correspondiente
la la
distribucióndesviación
a
de la estándar
distribución
frecuencias del de poblacional
frecuencias
estudio sobre y del
el coeficiente
estudio
habilidades en el de
sobre
manejo
variación correspondiente
variación correspondiente aa la la distribución
distribución de de frecuencias
frecuencias deldel estudio
estudio sobre
sobre
de habilidades
conceptos
habilidades enyen el manejo
principios
en elel manejode de conceptos
estadística.
manejo de
de conceptos y principios
conceptos yy principios de
principios de estadística
de estadística presentado
presentado en
estadística presentado en el
el
habilidades
ejemplo 4.1 de la semana 4. en el
ejemplo 4.1 de la semana
ejemplo 4.1 de la semana 4. 4.
Solución:
Solución:
Se necesita calcular
Se necesita calcular primero
primero la media poblacional 𝝁𝝁.. AAcontinuación
media poblacional continuación se
semuestra
muestrala
lainfor-
mación requerida para hallarla y el cálculo correspondiente.
información requerida para hallarla y el cálculo correspondiente.
2 11 20 15,5 67 1038,5
3 21 - 30 25,5 90 2295
22 11
1120
20 15,5
15,5 67
67 1038,5
1038,5
33 21
21--30
30 25,5
25,5 90
90 2295
2295
44 31
31--40
40 25,5
25,5 133
133 3391,5
3391,5
55 41
41--50
50 45,5
45,5 165
165 7507,5
7507,5
66 51
51--60
60 55,5
55,5 155
155 8602,5
8602,5
77 61
61--70
70 65,5
65,5 127
127 8318,5
8318,5
88 71
71--80
80 75,5
75,5 94
94 7097
7097
99 81
81--90
90 85,5
85,5 55
55 4702,5
4702,5
10 91
10 91--100
100 95,5
95,5 37
37 3533,5
3533,5
𝒌𝒌𝒌𝒌
𝑵𝑵𝑵𝑵==𝟗𝟗𝟗𝟗𝟗𝟗
𝟗𝟗𝟗𝟗𝟗𝟗 𝒇𝒇𝒇𝒇𝒊𝒊 𝒊𝒊. .𝑿𝑿𝑿𝑿! !==𝟒𝟒𝟒𝟒𝟒𝟒𝟒𝟒𝟒𝟒
𝟒𝟒𝟒𝟒𝟒𝟒𝟒𝟒𝟒𝟒
𝒊𝒊!𝟏𝟏
𝒊𝒊!𝟏𝟏
𝑘𝑘𝑘𝑘
𝟏𝟏𝟏𝟏 46690
46690
𝝁𝝁
𝝁𝝁 == 𝒇𝒇𝒇𝒇𝒊𝒊 𝒊𝒊. .𝑿𝑿𝑿𝑿𝒊𝒊 𝒊𝒊 ==
𝑵𝑵𝑵𝑵 𝑖𝑖=1
960
960
𝑖𝑖=1
𝝁𝝁𝝁𝝁==𝟒𝟒𝟒𝟒,
𝟒𝟒𝟒𝟒,𝟔𝟔𝟔𝟔
𝟔𝟔𝟔𝟔
Teniendo elel valor
Teniendo valor de
de lala media
media poblacional,
poblacional, es
es recomendable
recomendable elaborar
elaborar unauna tabla
tabla
cuyas
cuyas el
Teniendo columnas
columnas contengan
valor de contengan los valores
los valores es
la media poblacional, que
que intervienen
intervienen en
recomendable en el cálculo.
el cálculo.
elaborar La tabla
La tabla
una tabla cuyas
siguiente
siguiente muestra
muestra información
información utilizada
utilizada con
con cualquiera
cualquiera de
de las
las dos
dos fórmulas.
fórmulas.
columnas contengan los valores que intervienen en el cálculo. La tabla siguiente mues-
tra información utilizada con cualquiera de las dos fórmulas.
Solución:
Solución:
En la En
semana 3 el de
el estudio cálculo de la
la media media aritmética
aritmética poblacional
para datos agrupadospara la distribución
ya habíamos calculado este
de este ejemplo
valor, con un un valor de 𝝁𝝁 = 𝟏𝟏𝟏𝟏, 𝟕𝟕𝟕𝟕. Se
dioresultado Seprocede
procedeaacontinuación
continuación aacalcular
calcular la varianza
la varianza mediante el uso de la fórmula abreviada, para lo cual se presenta en la
siguiente tabla la información requerida.
2 [6, 8) 7 49 20 980
Tabla 11. Varianza abreviada para el estudio oftalmológico sobre una población de 200 pacientes.
Tabla 3. La
Fuente: varianza
Propia.
El cálculo de la varianza es el siguiente:
El cálculo de la varianza es el siguiente:
𝒌𝒌
𝟏𝟏 !
𝝈𝝈𝟐𝟐 = 𝒇𝒇𝒊𝒊 . 𝑿𝑿! − 𝝁𝝁𝟐𝟐
𝑵𝑵
𝒊𝒊!𝟏𝟏
𝟐𝟐
𝟑𝟑𝟑𝟑𝟑𝟑𝟑𝟑𝟑𝟑 𝒔𝒔𝒔𝒔𝒔𝒔𝟐𝟐 𝟐𝟐
𝝈𝝈 = − 𝟏𝟏𝟏𝟏, 𝟕𝟕𝟕𝟕 𝒔𝒔𝒔𝒔𝒔𝒔 = 𝟏𝟏𝟏𝟏𝟏𝟏, 𝟏𝟏𝟏𝟏 − 𝟏𝟏𝟏𝟏𝟏𝟏, 𝟑𝟑𝟑𝟑
𝟐𝟐𝟐𝟐𝟐𝟐
𝒌𝒌
𝟏𝟏 𝑵𝑵𝑿𝑿𝟐𝟐
𝑺𝑺𝟐𝟐 = 𝒇𝒇𝒊𝒊 . 𝑿𝑿𝟐𝟐𝒊𝒊 −
𝑵𝑵 − 𝟏𝟏 𝑵𝑵 − 𝟏𝟏
𝒊𝒊!𝟏𝟏
𝑺𝑺 = 𝑺𝑺𝟐𝟐
El coeficiente de variación es:
Ejemplo 12.
Medidas de dispersión para la cantidad de obras literarias leídas por 150 universitarios.
Solución:
Tabla 12. Varianza abreviada para el número de obras literarias leídas por 150 estudiantes
Tabla de
de ingeniería 4. La varianza
una universidad.
Por tanto la varianza está dada por:Fuente: Propia.
Por tanto la varianza está dada por:
𝒌𝒌
𝟏𝟏 𝑵𝑵𝑿𝑿𝟐𝟐
𝑺𝑺𝟐𝟐 = 𝒇𝒇𝒊𝒊 . 𝑿𝑿𝟐𝟐𝒊𝒊 −
𝑵𝑵 − 𝟏𝟏 𝑵𝑵 − 𝟏𝟏
𝒊𝒊!𝟏𝟏
𝟕𝟕𝟕𝟕𝟕𝟕𝟕𝟕𝟕𝟕, 𝟐𝟐𝟐𝟐
𝑺𝑺𝟐𝟐 =
𝟏𝟏𝟏𝟏𝟏𝟏
La La
utilidad de estos
utilidad criterios
de estos es que
criterios espermite decidirdecidir
que permite cuál medida de tendencia
cuál medida central se
de tendencia
considera
central se considera representativa del conjunto de datos. En el caso de conjuntosho-
representativa del conjunto de datos. En el caso de conjuntos de datos
mogéneos
de datos la media aritmética
homogéneos la semedia
considera como unse
aritmética valor representativo,
considera como en unel caso
valorde
conjuntos
representativo, en el caso de conjuntos de datos heterogéneos puede ser la
de datos heterogéneos puede ser preferible considerar otra medida como
mediana o laconsiderar
preferible moda. otra medida como la mediana o la moda.
proquest.com