You are on page 1of 6
La distribuci6n normal PUESTA EN ESCENA ‘Una encaesta sobre métadosanticonceptvosrevela que el me do mus wsado em todo el mundo es la fase sta noche ne, querido, tengo jagquecav,pronunciado por cualquiera de fs niembrs dela pareja aséndose en una eneuestad 200 personas, se encontrs ques uilzaba un promeatio de 0 vee al ao, con una DT de 15, ¢Podemos determinar gué porcentaje dela poblaci usa ete motivo al menos 115 vees «al aio?, co menos de 70 veces, co wna cantidad comprendida entre 106 y 112? nntes de que puedas contestar a estas preguntas esenciales, necesitas tener alguna informacién aa onal, comenzanda con lo que entendemos por wise teibucién normals, La hemos mencionado de pasada coh los capitulos anteriores sin que la hayamos defini do, Hemos legado al momento de la verdad y te dix mos lo que se entiende por una distribucién normal y Jo que realmente deseas saber acerca de ella, 1a curva normal ha aparecido en varias figuras an teriores, como pos ejemplo en la figura 3-6, pese a que no fue debidamente indicada como tal. A menudo se la dlenomina por un par de nombres distintos, camo eam= pana de Gauss, o distribucién de Gauss. 1é:mino scampanas viene de su forma! y lo de Gauss, de su ddescubeidor.2? De esta manera, las denominaciones al: io y reflejan caracteristicas de la curva: su forma y su historia. Por desgracia, la denoni naci6n esténdar carece de sentido; no hay nada impli tamente «normals en esta distr¥bucién, ni sanoral» POR QUE NOS INTERESAMOS POR ESTA DISTRIBUCION? Faisten varlas razones por las que la distribucién nor~ mal es importante, Primera, 1a mayoria de los tests es: tadisticos que vamos a estudiar en este libzo dan por supuesto que los datos provienen de una distribucion normal. Segundo, con datos normalmemte distribui- dos, la media y la variancia no dependen wna de ot si aumentamos la media de una distribucién normal su variancia puede permanecer intacta, Esto n0 es ciet oen otras disttibuciones, Tercera, es de dominio paibli- co que muchos fenémenos naturales estén, de hecho, distribuides normalmente de una manera aproxima- da. Es decir, si estamos midiendo la altura, peso, pre sin sanguinea o nivel de dehidroepiandrosterona en. ia orina en tin gran niimero de personas (grande sig nifiea como minimo 1000), y trazamos los poligonos de Lrecuencia de nuestros datos, cada uno de ellos se aproximaré a la curva normal. Cada medida, por st puesto, va a tener una media diferente, pero todas se ‘in mas 0 menos simétrieasrespecto de la media y pre sentardn una forma que se asemeja a esa forma genera Latinicadificuliad es que dicho parecido puede ser mis. ilusorio que real, Lippman (en Wainer y Thissen, 1976) Jo express muy bien; decia: «todo el mundo eree en la teorla de ertores (la disteibucién norinal). Los ex mentales, porque piensan que se trata de un teorema matemético; los matematicos, porque piensan que se trata de un hecho experimentaln, Aun nivel empiri 0, Migcet! (1989) examing las distribuciones de resul tados de ms de 400 medidas psicol6gicas ampliamen te usadas, como tests de éxito de aptitud, y Negé a la conclusion de que las distribuciones que eran estric~ tamente normales eran tan raras como los dientes de gallina! La cuaria raz6n por la que la distribucién norm importante es que, para cualquier distribueidn de da: 23 Petty normal es eens payers Aqui, vamos rset rer erties usarla, ‘Yh ido al sfenmeno gong pregunta cua cosa au estadticoy la primera cosa que wt «a hacer es dibujar de campane 2 Auge slo hay caine seechaba de espaldas, el propio Friedrich Gauss tenia ef aspeto de una curva gausiana » Bl pobre Alexander Graham Bell decd Si también hubiera dlescbierto esta curva hs abyfanes sthorrado la de was, 4 Ast, puedes der que, cen cierto semi, las son ovale. ee 24 FIGURA 4-1 Distribucidn tesrica del lanzamiento de tun dado 600 veces, FIGURA 4-2 ‘Simulacion por ordenador de la media de la suma de los resultados de lanaar el dado 2, 4 8 veces en 600 ‘castones cada tno. LA NATURALEZA DE LOS DATOS VLA ESTADISTICA tos si reunimos un gran niimero de muestras de un ta rmaiio razonable (dentro de poco definiremos To que es srazonable»), la distibucidn de las medias de tales mies tras estard siempre normnalmente distibuida. Lo verda- deramente importante de ello es que no es necesario ‘que los datos estén normalmente distibuidos para que sea realmente Gert, debide alo que se lama el teore ‘ma central del limite, El worema central det limite establece que si reun imuestras del mismo tamaiio de una disttbucién ‘no normal, la disribucidin de sus medias ya seré normal, siempre que las muestras seam sufi smvente grandes {Cutén grande es «grandes? Como siempre, depen de, Sila forma dela poblacidn es suficientemente proxi ‘ma a la normal, entonces wgrande» puede ser tan pk quefio coino 2, Si, en cambio, es marcadamente diferente de la normal, 10 0 20 puede ser suficiente grande. Para ‘estar seguros, sin embargo, habitualmente decimos que ‘cualquier cantidad por encima de 30 es suficiente en ‘asi todos los casos. Povlemosihistraresto con otro experimento gedatken Imaginemos que tenemos un dado que lanzamos 600 200 Numero de tiradas $8 8 8 o 1 2 3 4 5 6 Numero sacado ‘Namero de lanzamientos por trada Numero de tiradas 8 8 ‘veces y anotamos el resultado de cada una de fas tea das, Si el dado no fue eargado (ni lo estaba), no eabe ‘esperar que una cara aparecerd con mds frecuencia « tra, En consceuencia, podemos esperar que cada ntime- ro aparczca la sexta parte de las veces, con lo que obten- ddremos un grifico como el de la figura 4-1. Esto, por supuesto, no es una distribucién normal; debido a su forma, se conoce como una distibucién rectangular. Ahora, lancemos el dado dos veces y sumems los resultados obtenidos. Las sumas tendrn un recoride que va desde un minimo de 2 basta un maximo de 12, pero ahora no pademos esperar que cada uno de los rnimeros aparezea con la misma frecuencia. Solo hay tuna forma de obtener un 2 (con un | eada una de Tas vveces) 0 12 (mediante dos 6), pero das maneras de sa- car 3 (un [ seguido de un 2, 0 un 2 seguidio de un 1), ¥ cinco formas de sacar 6. Por lo tanto, como hay mis ‘posbilidades de obtener los mimeros centraes, también debemos esperar que saldrén mas a menudo que los de Tos extremes. Esta tendencia se va acentuando en cuanto, lanzamos el dado mas y mis veces. -Hiimos una simulacién por ordenador de esta si- 1acin; los resultados se representan en la figura 4-2 ordenador «lanai el dado dos veees, sumné las pun- Iaciones y las dividi6 por 2 (es decir, tomd la media para una muestra de tamatio 2) 600 veces: despus,wlan- 26» ¢1 dado cuatto veces, sum tos puntos y los dividié, por cuatro (la media de una muestra de tamafio 4) tam bign en 600 ocasiones; y por fin, reptié juego lan- zando el dado ocho veces y dividiendo por ocho. Di gamos que lanzando el dado incluso dos veces, la sisuibucién de medias perdié su forma rectangular y comenzé a parecerse a una distribucién normal. Con ‘ocho lanzamientos, el parecido es mucho més acusado. Esto funciona con cualquier distibucién, sin importa: sise desvia mucho 0 no de la normal. Asfpues, el teore- rma central del limite garantiza que, si tomamos mues- tras de tama¥ios suficientemente grandes, aunque 10 lo sean en exceso (asuficienten es més de 30), as medias se aproximarén a la disteibuei6n normal VALORES TIPIFICADOS Antes de pasar a las caracteriticas propias de la distr bucion normal, vamos hacer una breve parada, Sicien= tos de variables estuvieran normalmente distsibuidas, cada una de ellas con su propia media y su DT, neces: tarfamos cientos de tablas para dar las especificaciones precisas de las dstribuciones. Esto convertria a los ed lores de esta tablas en extticos, pero también en me dianamente locos. Asi los estadisticas ban encontrade ‘un metodo para translormar todas ls dstribuciones nor ‘males ce manera que siempre (las distibuciones, no lo: estadisticos)tilicen la misma escala. La idea consiste cn especificar en qué medida un valor determinado s aparta de la media describiendo su situacibn en unida! des de desviacién tipo (DT). Cuando transformamor ‘un valor cualquiera por este procedimiento, lamamo: ‘al resultado un valor tipificade. Un valor tipitiado, abteviado come 20 Z, &s tun procedimienio que permite expresar cualquier valor inicial en téminos de unidades DT. LA DISTRIBUCION NORMAL eS rs . En Becede” awoctimas la depresion_detadepresion 1153 Datos Media Medias y 3 115 plicados de oa desviaciones + 096 tabla 3-2 mo tipo de dos 7 8 ae escalas de ce 17 10s eepresiéa s 8 P9038 22037 LBs we Andlogamente, para el valor 68 en la EAD: EI valor tipificado a-¥) ap Ln valor tipiticado se calcula restando la media dela istribuetéin al valor correspondiente y dividiendo el re- sultado por le DT. Para poder realizarlo, volvamos a la tabla 3-2; observamos que los funcionatios civiles 10- man wna media de 9,0 cafés al dia, con una DT de 5,22. ‘Un valor de | café al dla corresponde a a9 522 42) cs decir, ~1,53 unidades DT, 0 1.53 umnidades DT por debajo de la media. Podemes hacer lo mismo con los restates niimeros, que se han tepresentado en la tabla 41 Ademés de permitienos trabajar con una tinica tabla 4e la distribucidn normal, en lugar de tener que arte slarnos con algunos centenares ce las mismas, los vale res z tienen también otros usos. Nos permiten compa rar valores procedentes de varios tests o medidas. Por jemplo, existen varias escalas diferentes para medi el srado de depresion, como el inventaro Bec la depre sidi IBD: Beck y ottos, 1961) y laesala de auloevaluacién de la depresién (EAD; Zung, 1965). BI tinkeo problema ‘std en que la escala TBD tiene 21 niveles, con valores ‘que varian de un minimo de @ hasta un maximo de 6, ientras que la EAD tiene 20 niveles en la escala, con, valores que varian en cada caso entre 25 y 100. gCcémo puedo comparar valores de, por ejemplo, 23 en a esea- Ja IRD con un valor de 68 en Ia escala EAD? Es muy sencilla si conocemos la media y a DT de las dos esca las, Para evitarte el problema de caleularlas te las he ‘mos faclitado graciosamente en la tabla 4-2. Lo que podemos hacer ahora es tipificar ambos valores, Pata el valor 23 en el IBD: 2-113 ze BOMB Ls TF co 68-5241 ge SOS est 105 Bs decir, estas transformaciones nos dicen qui bos valores son equivalemtes. Los dos corresponden a valores 2 de aproximadamente 1,5; es decir 1% «nia des DT por encima de 1a media, Vamos a comprobar estos céleulos. En el caso de los IBD, la Des 7,7, con lo que 144 unidades DT es (1,5 7,7) = 11,6. SLatadimos la media, 11,3, a esta cantidad obtenemos 22,9, que es (redondeando) cl niimero dol que hemos partido, un valor inicial de 23. Esto muestra también que si cono- cemos la media y su DT podemos pasar de los valores dados a valores 2 y reciprocamente. :No encuentras la Hay que observar algunos puntos acerca de los valo: res tpificados que pueden ilustrar el uso de los datos de Ja tabla 4-1. En primer lugar, el valor iniial 9, que co- rresponde a la media, lene um valor z igual a 0,0; esto cs tranquilizador, ya que indica que no se desvia res pecto de la media, Por supuesto, 0 siempre un con junto de datos va a contener un valor exactamente igual a sui medi; sin embargo, para comprobar nuestros, caleulos, cualquier valor que esté préximo a la media tendré un valor tipificado préximo a 0,0. Segundo, si stumamos estos valores z, su summa es cero (aproximada mente, salvo alain pequefo error de redondco). Esto ‘curr siempre si se usan la media y la DT a partir de Ja muestra para transformar los datos iniciales en los tipificados, Fs ¢! mismo motive por el que la desviacién media es siempre cero: la desviacién promedio de valo res respecto de su media es 0, incluso si los transforma ‘mos en unidades DT (u otras cualesquicra) Pero no tenemos que usar la media y la DT de la muestra de la que obtenemos los datos; las podemos tomar de otra muestra o de toda la poblacién. Hacemos esto cuanda comparamos los resultados de pacientes'de un test de laboratorio con la poblacign general (presurni blemente sana). Por ejemplo, si tomamos niveles de sue +0 de ruibarbo de 100 pacientes que suren hiperruibar bemia® y wansformamios los valores obtenidos a valores tipificados usando la media y la DT de ellos, debemos esperar que la suma de estos tiltimos sea igual a cero. Pero si utilizamos la media y la DT que se deivan de un, grupo de individuos nonnales® es posible que la suma de los datos de todos los pacientes resulte positiva, 25 5 Un sindiome no fetal ‘que convierte fas verdes y transforma sus cabellos Agu, signifi parecido sano, no bien RR

You might also like