La distribuci6n normal
PUESTA EN ESCENA
‘Una encaesta sobre métadosanticonceptvosrevela que el me
do mus wsado em todo el mundo es la fase
sta noche ne, querido, tengo jagquecav,pronunciado por cualquiera de fs niembrs dela pareja
aséndose en una eneuestad
200 personas, se encontrs ques uilzaba un promeatio de
0 vee al ao,
con una DT de 15, ¢Podemos determinar gué porcentaje dela poblaci usa ete motivo al menos 115 vees
«al aio?, co menos de 70 veces, co wna cantidad comprendida entre 106 y 112?
nntes de que puedas contestar a estas preguntas
esenciales, necesitas tener alguna informacién
aa
onal, comenzanda con lo que entendemos por wise
teibucién normals, La hemos mencionado de pasada
coh los capitulos anteriores sin que la hayamos defini
do, Hemos legado al momento de la verdad y te dix
mos lo que se entiende por una distribucién normal y
Jo que realmente deseas saber acerca de ella,
1a curva normal ha aparecido en varias figuras an
teriores, como pos
ejemplo en la figura 3-6, pese a que
no fue debidamente indicada como tal. A menudo se la
dlenomina por un par de nombres distintos, camo eam=
pana de Gauss, o distribucién de Gauss. 1é:mino
scampanas viene de su forma! y lo de Gauss, de su
ddescubeidor.2? De esta manera, las denominaciones al:
io y reflejan caracteristicas de la
curva: su forma y su historia. Por desgracia, la denoni
naci6n esténdar carece de sentido; no hay nada impli
tamente «normals en esta distr¥bucién, ni sanoral»
POR QUE NOS INTERESAMOS
POR ESTA DISTRIBUCION?
Faisten varlas razones por las que la distribucién nor~
mal es importante, Primera, 1a mayoria de los tests es:
tadisticos que vamos a estudiar en este libzo dan por
supuesto que los datos provienen de una distribucion
normal. Segundo, con datos normalmemte distribui-
dos, la media y la variancia no dependen wna de ot
si aumentamos la media de una distribucién normal
su variancia puede permanecer intacta, Esto n0 es ciet
oen otras disttibuciones, Tercera, es de dominio paibli-
co que muchos fenémenos naturales estén, de hecho,
distribuides normalmente de una manera aproxima-
da. Es decir, si estamos midiendo la altura, peso, pre
sin sanguinea o nivel de dehidroepiandrosterona en.
ia orina en tin gran niimero de personas (grande sig
nifiea como minimo 1000), y trazamos los poligonos
de Lrecuencia de nuestros datos, cada uno de ellos se
aproximaré a la curva normal. Cada medida, por st
puesto, va a tener una media diferente, pero todas se
‘in mas 0 menos simétrieasrespecto de la media y pre
sentardn una forma que se asemeja a esa forma genera
Latinicadificuliad es que dicho parecido puede ser mis.
ilusorio que real, Lippman (en Wainer y Thissen, 1976)
Jo express muy bien; decia: «todo el mundo eree en la
teorla de ertores (la disteibucién norinal). Los ex
mentales, porque piensan que se trata de un teorema
matemético; los matematicos, porque piensan que se
trata de un hecho experimentaln, Aun nivel empiri
0, Migcet! (1989) examing las distribuciones de resul
tados de ms de 400 medidas psicol6gicas ampliamen
te usadas, como tests de éxito de aptitud, y Negé a la
conclusion de que las distribuciones que eran estric~
tamente normales eran tan raras como los dientes de
gallina!
La cuaria raz6n por la que la distribucién norm
importante es que, para cualquier distribueidn de da:
23
Petty
normal es
eens
payers
Aqui, vamos
rset
rer
erties
usarla,
‘Yh ido
al sfenmeno gong
pregunta cua
cosa au estadticoy
la primera cosa que wt
«a hacer es dibujar
de campane
2 Auge slo hay
caine seechaba de
espaldas, el propio
Friedrich Gauss
tenia ef aspeto de una
curva gausiana
» Bl pobre Alexander
Graham Bell decd
Si también hubiera
dlescbierto esta curva
hs abyfanes
sthorrado la de was,
4 Ast, puedes der que,
cen cierto semi, las
son ovale.
ee24
FIGURA 4-1
Distribucidn tesrica
del lanzamiento de
tun dado 600 veces,
FIGURA 4-2
‘Simulacion por
ordenador de la
media de la suma
de los resultados de
lanaar el dado 2, 4
8 veces en 600
‘castones cada tno.
LA NATURALEZA DE LOS DATOS VLA ESTADISTICA
tos si reunimos un gran niimero de muestras de un ta
rmaiio razonable (dentro de poco definiremos To que es
srazonable»), la distibucidn de las medias de tales mies
tras estard siempre normnalmente distibuida. Lo verda-
deramente importante de ello es que no es necesario
‘que los datos estén normalmente distibuidos para que
sea realmente Gert, debide alo que se lama el teore
‘ma central del limite,
El worema central det limite establece que si reun
imuestras del mismo tamaiio de una disttbucién
‘no normal, la disribucidin de sus medias ya seré
normal, siempre que las muestras seam
sufi
smvente grandes
{Cutén grande es «grandes? Como siempre, depen
de, Sila forma dela poblacidn es suficientemente proxi
‘ma a la normal, entonces wgrande» puede ser tan pk
quefio coino 2, Si, en cambio, es marcadamente diferente
de la normal, 10 0 20 puede ser suficiente grande. Para
‘estar seguros, sin embargo, habitualmente decimos que
‘cualquier cantidad por encima de 30 es suficiente en
‘asi todos los casos.
Povlemosihistraresto con otro experimento gedatken
Imaginemos que tenemos un dado que lanzamos 600
200
Numero de tiradas
$8 8 8
o 1 2 3 4 5 6
Numero sacado
‘Namero de
lanzamientos
por trada
Numero de tiradas
8 8
‘veces y anotamos el resultado de cada una de fas tea
das, Si el dado no fue eargado (ni lo estaba), no eabe
‘esperar que una cara aparecerd con mds frecuencia «
tra, En consceuencia, podemos esperar que cada ntime-
ro aparczca la sexta parte de las veces, con lo que obten-
ddremos un grifico como el de la figura 4-1. Esto, por
supuesto, no es una distribucién normal; debido a su
forma, se conoce como una distibucién rectangular.
Ahora, lancemos el dado dos veces y sumems los
resultados obtenidos. Las sumas tendrn un recoride
que va desde un minimo de 2 basta un maximo de 12,
pero ahora no pademos esperar que cada uno de los
rnimeros aparezea con la misma frecuencia. Solo hay
tuna forma de obtener un 2 (con un | eada una de Tas
vveces) 0 12 (mediante dos 6), pero das maneras de sa-
car 3 (un [ seguido de un 2, 0 un 2 seguidio de un 1), ¥
cinco formas de sacar 6. Por lo tanto, como hay mis
‘posbilidades de obtener los mimeros centraes, también
debemos esperar que saldrén mas a menudo que los de
Tos extremes. Esta tendencia se va acentuando en cuanto,
lanzamos el dado mas y mis veces.
-Hiimos una simulacién por ordenador de esta si-
1acin; los resultados se representan en la figura 4-2
ordenador «lanai el dado dos veees, sumné las pun-
Iaciones y las dividi6 por 2 (es decir, tomd la media
para una muestra de tamatio 2) 600 veces: despus,wlan-
26» ¢1 dado cuatto veces, sum tos puntos y los dividié,
por cuatro (la media de una muestra de tamafio 4) tam
bign en 600 ocasiones; y por fin, reptié juego lan-
zando el dado ocho veces y dividiendo por ocho. Di
gamos que lanzando el dado incluso dos veces, la
sisuibucién de medias perdié su forma rectangular y
comenzé a parecerse a una distribucién normal. Con
‘ocho lanzamientos, el parecido es mucho més acusado.
Esto funciona con cualquier distibucién, sin importa:
sise desvia mucho 0 no de la normal. Asfpues, el teore-
rma central del limite garantiza que, si tomamos mues-
tras de tama¥ios suficientemente grandes, aunque 10 lo
sean en exceso (asuficienten es més de 30), as medias
se aproximarén a la disteibuei6n normal
VALORES TIPIFICADOS
Antes de pasar a las caracteriticas propias de la distr
bucion normal, vamos hacer una breve parada, Sicien=
tos de variables estuvieran normalmente distsibuidas,
cada una de ellas con su propia media y su DT, neces:
tarfamos cientos de tablas para dar las especificaciones
precisas de las dstribuciones. Esto convertria a los ed
lores de esta tablas en extticos, pero también en me
dianamente locos. Asi los estadisticas ban encontrade
‘un metodo para translormar todas ls dstribuciones nor
‘males ce manera que siempre (las distibuciones, no lo:
estadisticos)tilicen la misma escala. La idea consiste
cn especificar en qué medida un valor determinado s
aparta de la media describiendo su situacibn en unida!
des de desviacién tipo (DT). Cuando transformamor
‘un valor cualquiera por este procedimiento, lamamo:
‘al resultado un valor tipificade.
Un valor tipitiado, abteviado come 20 Z, &s
tun procedimienio que permite expresar cualquier
valor inicial en téminos de unidades DT.LA DISTRIBUCION NORMAL
eS
rs . En Becede” awoctimas
la depresion_detadepresion
1153 Datos Media Medias y
3 115 plicados de oa desviaciones
+ 096 tabla 3-2 mo tipo de dos
7 8 ae escalas de
ce 17 10s eepresiéa
s 8
P9038
22037
LBs
we Andlogamente, para el valor 68 en la EAD:
EI valor tipificado
a-¥)
ap
Ln valor tipiticado se calcula restando la media dela
istribuetéin al valor correspondiente y dividiendo el re-
sultado por le DT. Para poder realizarlo, volvamos a la
tabla 3-2; observamos que los funcionatios civiles 10-
man wna media de 9,0 cafés al dia, con una DT de 5,22.
‘Un valor de | café al dla corresponde a
a9
522
42)
cs decir, ~1,53 unidades DT, 0 1.53 umnidades DT por
debajo de la media. Podemes hacer lo mismo con los
restates niimeros, que se han tepresentado en la tabla
41
Ademés de permitienos trabajar con una tinica tabla
4e la distribucidn normal, en lugar de tener que arte
slarnos con algunos centenares ce las mismas, los vale
res z tienen también otros usos. Nos permiten compa
rar valores procedentes de varios tests o medidas. Por
jemplo, existen varias escalas diferentes para medi el
srado de depresion, como el inventaro Bec la depre
sidi IBD: Beck y ottos, 1961) y laesala de auloevaluacién
de la depresién (EAD; Zung, 1965). BI tinkeo problema
‘std en que la escala TBD tiene 21 niveles, con valores
‘que varian de un minimo de @ hasta un maximo de 6,
ientras que la EAD tiene 20 niveles en la escala, con,
valores que varian en cada caso entre 25 y 100. gCcémo
puedo comparar valores de, por ejemplo, 23 en a esea-
Ja IRD con un valor de 68 en Ia escala EAD? Es muy
sencilla si conocemos la media y a DT de las dos esca
las, Para evitarte el problema de caleularlas te las he
‘mos faclitado graciosamente en la tabla 4-2. Lo que
podemos hacer ahora es tipificar ambos valores, Pata el
valor 23 en el IBD:
2-113
ze BOMB Ls
TF
co
68-5241
ge SOS est
105
Bs decir, estas transformaciones nos dicen qui
bos valores son equivalemtes. Los dos corresponden a
valores 2 de aproximadamente 1,5; es decir 1% «nia
des DT por encima de 1a media, Vamos a comprobar
estos céleulos. En el caso de los IBD, la Des 7,7, con lo
que 144 unidades DT es (1,5 7,7) = 11,6. SLatadimos
la media, 11,3, a esta cantidad obtenemos 22,9, que es
(redondeando) cl niimero dol que hemos partido, un
valor inicial de 23. Esto muestra también que si cono-
cemos la media y su DT podemos pasar de los valores
dados a valores 2 y reciprocamente. :No encuentras la
Hay que observar algunos puntos acerca de los valo:
res tpificados que pueden ilustrar el uso de los datos de
Ja tabla 4-1. En primer lugar, el valor iniial 9, que co-
rresponde a la media, lene um valor z igual a 0,0; esto
cs tranquilizador, ya que indica que no se desvia res
pecto de la media, Por supuesto, 0 siempre un con
junto de datos va a contener un valor exactamente igual
a sui medi; sin embargo, para comprobar nuestros,
caleulos, cualquier valor que esté préximo a la media
tendré un valor tipificado préximo a 0,0. Segundo, si
stumamos estos valores z, su summa es cero (aproximada
mente, salvo alain pequefo error de redondco). Esto
‘curr siempre si se usan la media y la DT a partir de
Ja muestra para transformar los datos iniciales en los
tipificados, Fs ¢! mismo motive por el que la desviacién
media es siempre cero: la desviacién promedio de valo
res respecto de su media es 0, incluso si los transforma
‘mos en unidades DT (u otras cualesquicra)
Pero no tenemos que usar la media y la DT de la
muestra de la que obtenemos los datos; las podemos
tomar de otra muestra o de toda la poblacién. Hacemos
esto cuanda comparamos los resultados de pacientes'de
un test de laboratorio con la poblacign general (presurni
blemente sana). Por ejemplo, si tomamos niveles de sue
+0 de ruibarbo de 100 pacientes que suren hiperruibar
bemia® y wansformamios los valores obtenidos a valores
tipificados usando la media y la DT de ellos, debemos
esperar que la suma de estos tiltimos sea igual a cero.
Pero si utilizamos la media y la DT que se deivan de un,
grupo de individuos nonnales® es posible que la suma
de los datos de todos los pacientes resulte positiva,
25
5 Un sindiome no fetal
‘que convierte fas
verdes y transforma sus
cabellos
Agu,
signifi
parecido
sano, no bien
RR