You are on page 1of 19

Fundamentos de Estadística para 1

Odontología
MEDIDAS DE DISPERSION

INTRODUCCION:

Un importante concepto de la estadística es que ningún promedio por sí mismo da
una idea clara de la distribución del evento; aún cuando se consideren además los
extremos superior e inferior, no existirá una visión clara de la variabilidad de
fenómeno. Para entender este concepto bastará con revisar los dos siguientes
ejemplos:

Consideremos que se estudia un grupo de niños para determinar el número de
dientes temporales con alteraciones pulpares de tres zonas habitacionales
diferentes: urbana, suburbana y rural. Los datos son los que a continuación se
presentan:

Rural 0, 1, 2, 3, 5, 7 y 10.
Suburbana 2, 2, 3, 3, 3, 5 y 5.
Urbana 3, 3, 3, 3, 3, 3 y 3.

En este ejemplo puedes observar, tanto el valor de la media y la mediana es
igual a tres dientes temporales con alteración pulpar. Sin embargo, estos valores
no nos dan una idea clara acerca de la distribución del evento. Se mencionaba
además que para conocer la distribución se podría observar los extremos
superior e inferior de la serie, así como la mediana o la media aritmética, sin
embargo, esta situación tampoco es confiable ya que estos límites pueden ser
similares en las tres series, puede tener la misma media, y no por estas razones
deben tener distribuciones iguales. Daremos otras series con el mismo ejemplo
anterior, para que te sea más claro:

Rural 0, 1, 2, 3, 5, 7 y 10.
Suburbana 0, 0, 1, 3, 3, 5 y 10.
Urbana 0, 2, 3, 3, 4, 6 y 10.

Aquí puedes ver que los límites superior e inferior de las tres series son iguales,
así como la mediana. Lo que dificulta establecer si existen diferencias en la
distribución del evento en los tres grupos en estudio.

Para ayudar a comprender mejor la distribución y su comportamiento, es
necesario utilizar las llamadas medidas de dispersión o de variabilidad.
Estas medidas te permitirán conocer límites, rangos y cuánto se aleja cada
observación de la media, mostrándote si las medidas están muy próximas
o muy dispersas de la media. En otras palabras, cómo se distribuyen las
observaciones alrededor de ese promedio o esa mediana.

Observa las siguientes figuras para que comprendas mejor estos
conceptos:
2 Capítulo 10 Medidas de Dispersión

2. RANGO O RECORRIDO

El rango es conocido también como amplitud o recorrido o campo de
variación. El cálculo de esta medida es sumamente simple, sólo es
necesario restar al valor mayor el menor valor observado.

Como esta medida depende de los elementos extremos de la serie, de ahí
que no sea una muy buena medida de análisis. Pero desarrollemos un
ejemplo para que aprendas a calcularlo.

Se lleva a cabo un estudio en 20 Odontólogos, con el propósito de
establecer el tiempo que utilizan para realizar una extracción simple, los
datos aparecen ya ordenados a continuación (El tiempo fue estimado en
minutos):

20, 22, 22, 27, 29, 34, 35, 38, 41, 42, 43, 45, 51, 53, 53, 53, 56,
57, 62, 68

Para establecer el valor del rango, restaremos del valor máximo, el valor mínimo,
esto es: 68- 20 = 48. Este resultado se interpreta de la siguiente forma:

Entre cada odontólogo en estudio, existen hasta 48 minutos de diferencia en la
realización de una extracción simple.
Fundamentos de Estadística para 3
Odontología
3. DESVIACIÓN MEDIA

Este estadístico, establece la variabilidad con respecto al valor central y se
obtiene sumando todos los valores absolutos de las diferencias de los
valores observados menos la media, dividido entre el total de la
muestra.

En series simples, se utiliza la siguiente fórmula para calcular la desviación
media:
4 Capítulo 10 Medidas de Dispersión

n

X i
X
DM  i 1

n
De donde:

DM Desviación media
Xi Valor del dato o la observación (marca de clase)
X Media aritmética de la serie de datos
n Número total de observaciones o tamaño de la muestra

Ahora desarrollaremos un ejemplo para que aprendas a calcular e
interpretar esta medida.

Ejemplo N° 01
Supóngase que durante una semana un grupo de empleados trabajaron las
siguientes horas extras. Determinar la desviación media
6 hrs., 10, 15, 22, 26, 35

1. Calculando promedio

X = 6 + 10+ 15+ 22+ 26+ 35 = 19 hr.
6

DM. (6 -19) + (10-19)+ (15-19)+ (22-19)+ (26-19)+ (35-19) = 8.67
6

Ejemplo N° 02
Se estudia un grupo de escolares y se quiere determinar cuál es la
desviación media del número de colutorios de flúor recibidos por niño en el
esquema anual que es de doce autoaplicaciones, la serie que se presenta a
continuación ya está ordenada:

0, 0, 2, 2, 3, 5, 5, 5, 6, 7, 8, 9, 9, 9, 9, 10, 10, 10, 10, 10, 10, 10, 11,
11, 11, 11, 11, 11, 11, 12, 12, 12, 12, 12, 12, 12, 12, 12, 12, 12, 12,
12, 12, 12, 12, 12.

Lo primero que se debe calcular es la media aritmética, la cual se obtiene
sumando todos los valores y dividiendo este resultado entre el total de
observaciones:
n

 X i
i 1
X 
n
430
  9.3
46

Ahora se aplica la fórmula antes descrita para el cálculo de la desviación
media, esto es:
n

X i
X
123.2
DM  i 1
  2.68  3
n 46

Este resultado se interpreta así: existe una diferencia en promedio de hasta
tres autoaplicaciones de flúor del esquema de colutorios establecido, con
respecto a la media de lo ejecutado.

Ahora, para calcular la desviación media en datos agrupados se utiliza la
siguiente fórmula:
n

f i
mi  X
i 1
DM 
n
Consideremos el siguiente ejemplo: se quiere establecer la longitud
promedio en la dimensión vertical en 205 pacientes, observándose los
datos que a continuación se presentan en el siguiente cuadro:

Cuadro 10.1 Longitud de la dimensión vertical en 205 pacientes C.S.U.
"Dr. Gastón Melo". Milpa Alta
Longitud * Centros de Número de
clase (mi) fi  m i
casos ( fi )
6.0  6.4 6.2 12 74.4
6.5  6.9 6.7 11 73.7
7.0  7.4 7.2 82 590.4
7.5  7.9 7.7 77 592.9
8.0  8.4 8.2 23 188.6
TOTAL 205  f i mi  1520
* En milímetros

Primero se debe calcular la media aritmética, para lo cual se utilizará la
siguiente fórmula, recordando que son datos agrupados:
n

 fi 1
i mi
1520
X    7.41
n 205

Una vez calculada la media aritmética, se lleva a cabo la sumatoria de los
productos de la frecuencia de clase por los valores absolutos de las
diferencias de los centros de clase menos la media, el valor que se obtenga
se sustituye en el numerador de la fórmula, y el denominador tendrá el valor
del número total de observaciones:
Longitud * Centros de Número de mi  X f i mi  X
clase ( mi ) casos ( fi )
6.0  6.4 6.2 12 1.21 14.52
6.5  6.9 6.7 11 0.71 7.81
7.0  7.4 7.2 82 0.21 17.22
7.5  7.9 7.7 77 0.29 22.33
8.0  8.4 8.2 23 0.79 18.17
TOTAL 205 f i mi  X  80.05

n

f i
mi  X
80.05
DM  i 1
  0.3905  0.4
n 205

Este valor expresa que existe una diferencia hasta de cuatro milímetros con
respecto a la tendencia media de la misma.

VARIANZA Y DESVIACIÓN ESTÁNDAR

Como en una serie de observaciones existen valores mayores que la media
y otros menores, las desviaciones de la media resultarán ser unas positivas
y otras negativas y si se suman estas diferencias, obtenidas
algebraicamente, el resultado va a ser cero. En consecuencia, se podría
pensar que no existe dispersión, para evitar este error de apreciación, se
procede a elevar al cuadrado estas desviaciones (para no tener valores
negativos). A la suma de estas desviaciones cuadráticas dividida entre n
menos 1, es lo que se denomina varianza. Sin embargo, como se elevaron
las desviaciones al cuadrado, esta medida de dispersión estará expresada
2 2
en unidades cuadráticas (Kg o mg ), por lo que no tendrá interpretación,
por ello, extraemos la raíz cuadrada positiva y a esta medida se le
denomina desviación estándar, que representa la dispersión de la serie de
datos. Es importante hacer notar que el denominador siempre es ( n
1) cuando se trabaja con muestras.

De esta manera la varianza se calcula con la siguiente fórmula:

 n 2
 X i  X 
n
  Xi   n X
22

2 i 1 
s  i 1 
n1 n1
y la desviación estándar por medio de la fórmula:

X i  X 2  n 2
n
  Xi   n X
2

i 1 
s i 1

n1 n1
De donde:

s Desviación estándar
Xi Valor de la observación
X Media aritmética de la serie
n Número total de observaciones o tamaño de la muestra

Observa que hay dos fórmulas, no es que sean diferentes, de hecho la
segunda sale de la primera por medio del desarrollo del binomio, y esto se
hace con el fin de simplificar los cálculos ya que restar la media a cada una
de las observaciones y elevarlas al cuadrado para luego sumarlas, resulta
más complicado que elevar al cuadrado cada observación, sumarlas y
luego restarle el cuadrado de la media multiplicado por n.

Antes de desarrollar un ejemplo para que aprendas a calcular la desviación
estándar, es necesario hacer la siguiente consideración:

Esta medida establece la variabilidad de los valores observados con
respecto a la media aritmética de los mismos, por lo tanto cada valor
estimado de las desviaciones, tienen una representación proporcional de
los valores en cuanto a su distribución, esto es:

Si la distribución es normal (Gaussiana), la distancia de una desviación
estándar (1s) a un lado y otro de la media, incluye el 68.3% de los valores
de la distribución. Así mismo, la distancia de dos desviaciones estándar (2s)
a ambos lados de la media, incluye aproximadamente el 95.5% de la
distribución y el 99.73% estará incluido entre tres desviaciones estándar
(3s) de la media. Estas consideraciones, se pueden representar
gráficamente de la siguiente forma:

Ahora aplicaremos un ejemplo para calcular la desviación estándar en
series simples:

Se estudia en 24 estomatólogos, la calidad de ajuste en las coronas de
acero cromo que han colocado, midiendo la unión real entre la corona y el
tejido dentario (valores en micras), de donde se obtuvieron los siguientes
datos (serie ya ordenada):
0.04, 0.05, 0.07, 0.07, 0.07, 0.09, 0.10, 0.10, 0.13, 0.18, 0.18,
0.19, 0.22, 0.27, 0.42, 0.47, 0.51, 0.52, 0.56, 0.74, 0.78, 0.90,
0.90 y 0.95.

Primero se obtiene el valor de la media aritmética que para este ejemplo es
igual a 0.3546 micras.

Ahora debes calcular el valor de la sumatoria de los cuadrados de las
n
2
diferencias de los valores originales menos la media  X i X que es

i 1
igual a 2.1884 micras.

Finalmente el valor de n  1 es igual a 24  1 = 23 que es el número total de
estomatólogos en estudio menos uno. Sustituyendo en la fórmula tenemos:

(0.04  0.3546)2  ...  (0.95  0.3546) 2 2.1884
s    0.0951  0.3085  0.31
23 23

Este resultado indica, que el 68.3% de las coronas colocadas por este
grupo de estomatólogos mostraron un desajuste 2.1884  0.3085; es decir,
entre 1.88 y 2.50 micras. El desajuste en el 95.5% de las coronas que
fueron colocadas fue entre 2.1884  2(0.3085); es decir, entre 1.57 y 2.81
micras y en el 99.7% el desajuste fue entre 2.1884  3(0.3085), esto es,
entre 1.26 y 3.11.

Ahora veamos la fórmula que se utiliza para el cálculo de la desviación
estándar para datos agrupados:

n
 2  n 2
f im i  X    fi mi   n X
2

i 1 i 1 
s 
n1 n1

Observa el siguiente ejemplo: se quiere establecer la dosis terapéutica de
un antimicrobiano en procesos infecciosos bucales agudos, para lo cual se
tomaron 405 pacientes que presentaban abscesos agudos de origen
endodóntico. Los resultados aparecen en el siguiente cuadro:
Cuadro 10.2 Efecto positivo terapéutico antimicrobiano en pacientes
con absceso agudo de origen pulpar. I.M.S.O. Reforma. 1981
Dosis terapéutica * Centros de clase Número de casos resueltos
(frecuencia fi )
( mi )
100  300 200 4
400  600 500 27
700  900 800 132
1000  1200 1100 115
1300  1500 1400 127
TOTAL 405
* En miligramos

Ahora calculemos la desviación estándar:

Primero debes estimar el valor de la media aritmética que para este ejemplo
n

 f i mi
424200
es X  i 1
  1047.4074  1047.41 mg .
n 405

Para calcular la desviación estándar nos ayudaremos con la tabla siguiente:

Dosis Centros de Frecuencia n
terapéutica * clase ( mi ) fi f
i 1
i m2i

100  300 200 4 4(40 000) = 160 000
400  600 500 27 27(250 000) = 6 750 000
700  900 800 132 132(640 000) = 84 480 000
1000  1200 1100 115 115(1 210 000) =139 150 000
1300  1500 1400 127 127(1 960 000) =248 920 000
TOTAL 405 479 460 000
Sustituyendo en la fórmula de la desviación estándar

 n 2 2
  fi mi   n X 2
i 1  479460000  405(1047.4074)
s 
n1 404
479460000  405(1097062.2616)

404
35149784.0640
  87004.4160  294.9651  294.97
404

La interpretación de este valor es que en el 68.3% de los enfermos se
observó el efecto terapéutico antimicrobiano a partir de una dosis de 752.44
mg a 1342.38 mg (1047.4074  294.97).
COEFICIENTE DE VARIACIÓN

Se utiliza para comparar las dispersiones de dos muestras o para comparar
dos distribuciones diferentes y se obtiene dividiendo la desviación estándar
entre la media aritmética, y para obtenerlo en porcentaje se multiplica por
100.
La fórmula es la siguiente:
s
CV   100
X

El coeficiente de variación se interpreta de la siguiente forma:

0% < CV  10% variación pequeña
10% < CV  20% variabilidad aceptable
CV > 20% variabilidad grande

Para el ejemplo anterior del efecto positivo terapéutico antimicrobiano en
pacientes con absceso agudo de origen endodóntico, se tiene que el
coeficiente de variación es:

294.9651
CV   100  28.16%
1047.4074

Como el coeficiente de variación es superior al 20%, la variabilidad es muy
alta.

Consideremos otro ejemplo, sabemos que existe variabilidad en la
experiencia de caries en dentición permanente o secundaria en alumnos de
tres escuelas secundarias, sin embargo, se quiere determinar en cuál de las
tres existe mayor dispersión, los datos aparecen el siguiente cuadro:

Cuadro 10.3 Número de dientes afectados por caries por plantel
escolar. Medellín, Colombia. 1992
Escuela Secundaria
dientes Centros de sector A sector B sector C
afectados clase
0-3 1.5 3 7 6
4-8 6 32 11 14
9 - 12 10.5 57 62 59
13 - 16 14.5 89 71 97
17 - 20 18.5 45 63 88
21 - 24 22.5 12 21 13
25 - 28 26.5 1 0 0
TOTAL 239 235 277
Primero se calcula la media aritmética para cada uno de los planteles:

Plantel sector "A",
n
 f i mi
3(1.5)  32(6)    1(26.5) 3214.50
XA  i 1
   13.4498  13.45
n 239 239
Plantel sector "B",
n

 f i mi
7(1.5)  11(6)    21(22.5) 3395.00
XB  i 1
   14.4468  14.45
n 235 235
Plantel sector "C",
n

 f i mi
6(1.5)  14(6)    13(22.5) 4039.50
XC  i 1
   14.5830  14.58
n 277 277

Ahora calculemos la desviación estándar para cada plantel:

Plantel sector "A",
 n 2 2
  fi mi   n X 2 2 2 2
i 1  3(1.5)  32(6)    1(26.5)  239(13.4498)
sA  
n1 238
 21.4258  4.6288
Plantel sector "B",
 n 2
  fi mi   n X
2
2 2 2 2
i 1  7(1.5)  11(6)    21(22.5)  235(14.4468)
sB  
n1 234
 22.7399  4.7686
Plantel sector "C",
 n 2 2
  fi mi   n X 2 2 2 2
i 1  6(1.5)  14(6)  13(22.5)  277(14.5830)
sC  
n1 276
 18.8690  4.3438

Finalmente sustituyamos en la fórmula:
4.6288
CV A   100  34.42%
13.4498
4.7686
CVB  100  33.01%
14.4468
4.3438
CVC  100  29.79%
14.583

Con estos datos puedes observar que la experiencia de caries en el plantel
del sector "A" presenta mayor variabilidad, siendo la menor la del sector C.
Fácil, ¿verdad?

Cuadro resumen
Desviación media para series n

simples X
i 1
i
X
DM 
n
Desviación media para datos n

agrupados f
i 1
i
mi  X
DM 
n
Varianza para series simples n
 n 2
 X X
2
  Xi   n X
2
i
2 i 1 i 1 
s  
n1 n1
Desviación estándar para series n
  n 
 X X  X n
2 2 2
simples
i
X i
i 1 i 1 
s 
Desviación estándar para datos n1 n1
n
 2  n 2
 fi mi  X    fi mi   n X
2
agrupados
i 1 i 1 
s 
n1 n1
Coeficiente de variación s
CV    100
X