You are on page 1of 13
Modelos de distribucién 1 de probabilidad Introduccién, Modelos para variables discretas. 13.2.4. Distribucién uniforme. 13.2.2. Distribucién binomial. 13.2.3. Distribucién multinomial, Modelos para variables continuas. 13.3.1. Distribucién rectangular. 13.3.2. Distribucion normal. 13.3.3, tribucion x7 de Pearson. 13.3.4. Distribucion ¢ de Student. 13.3.5. Diswibucion F de Sne- decor. Problemas y ejer: 13.4.1, Soluciones. 13.2.2. Distribucién binomial La distribuci6n binomial es ina de las que se conocen desde mas antiguo, pues fue extensamente estudiada por Jacob Bemnouilli, y de hecho en muchos textos se dice que és la distribucién, del ‘nimero de aciertos en una serie de ehsayos de Bernouilli : Para que la'distribuciéa de probabilidad de ua varlable se ajusic al modelo binomial deben cumplirse una serie de requisitos. El primero es que se base en waa variable dicotomica. Esta variable dicotomica’no es todavia la variable binomial, pero su presencia es imprescindible para la generacién de.ésta. Ya vimos en capitu- los anteriores que una variable dicotémica es. una variable que solo admite dos valores, ¥ que habitualmente son los valores 1 y 0 (véase cundro 123). Estas variables de base pueden ser auténticas variables dicotémicas o variables dicotomi- zadas artilicialmente. Por ejemplo, la extraccién de um individuo de Ia poblacién y la asignacion de un { cn caso de ser varén y ua 0 ca caso de ser mujer, es uoa variable geauinamente dicotémica. En cambio, la extraccidn de un individuo de la poblacion y la asignacin de ut 1 si supera la puntuacidn 15 en:el test BDI. de. Beck para la depresion, y un 0 en oaso'contrario, es una variable dicotomizada artficialmente, Puesto que aunque el BDI tiene muchos posibtes resultados numéricos diferentes, nosotros los clasificamos en dos: los que cumplen la condicién de ser superiores a 15 ¥ los que no la cumplen. En general, las variables que estin ea Ja base de una variable binomial pueden definirse como aguellas que adoptan la regla de asignar un 131 se cumple una cierta condicin y un 0 si no’ se cumple. El segundo requisito es que haya una repeticion de m ensayos de la variable icotomica en los que la probabilidad de queen cada-repeticiOn se verifique la condiciéa, y por tanto s¢,asigne um J,.sea. constante. Dicho de otra forma, la verificaciéa de la condiciéa en cada ensayo debe ser independienterde-ta'verificacion cu los anteriores. A la probabilidad de verificacién de la condicién en cada ensayo independiente Ja representaremos por x. El tereer y iltimo requisito es que se defina una variable, X, como el «niimero de casos que en la secuencia de n ensayos dicotémicos veriican la condicién especifica- ‘dan, 0 Io que és lo mismo, el niimero de unos observados. Podemos resumir los requisitos para la generacion de una variable binomial de le siguiente forma: Si a) definimos una variable dicotémica a partir del cumplimiento 0 in- cumplimiento de una condicién; b) realizamos una secuencia de n observaciones de esos ensayos dicoté- micos en los que Ia probabilidad de verifcacién de la condicién en cada repeticién, x, es constante, y «)definimos una variable aleatoria, X, como el niimero de casos de esa secuencia en los que se cumple la condicién, entonces la variable X se ajusta un modelo binomial con parimetros n y x, y | 35 repecscata por BUG m, x) Pongamos por ejemplo el caso de tres ratas sin experiencia previa que son introducidas en tun laberinto en forma de T, en el que definimos la condicidn asalir por Ia izquierdan. La introduccién de cada rata en el laberinto es un, ensavo icotémico creado por el cumplimiento/incumplimiento de esa condicién. Dado que son ratas sin experiencia previa, la probabilidad de que cada una de ellas salga por 4a izquierda (cumpla Ia condicién) es la misma. Muy verosimilmente esa probabili dad sera 0,50, pero, incluso aunque no lo fuera, esto no seria un obstaculo. pues en este contexto lo importante es qu: m sea constante en todos los ensayos, sin importar cual sea ese valor. Por iltimo, definimos la variable X: «Nimero de ratas que salen por la izquierda», o utiizamos la definicida genérica «niimero de ensayos en los que verifica la condicion especificadan. En estas circunstancias podemos decir que la variable se distribuye segiin el modelo binomial con parimetros 3 y 0,50; 0, expresado de otra forma: BUX; 3, 0,50 De Ia forma de generar una variable aléatoria sus caracteristicas: ymial se deducen algunas de a) Los valores de una variable binomial oscilan entre 0 y n, donde n es el vitinero de ensayos dicotémicos realizados. Es decir, el nimero mas pequeio posible de casos en los que se verifica la condicién es ninguna'y el maximo es todos. 'b) Si representamos el resultado de cada ensayo dicotémico con ceros y unos, ¢l ‘alor que adopta ta variable no es mas que la suma de esa secuencia de unos y ceros. ‘Modelos de diswibucisn de probabilided | 315 El valor esperado de una variable binomial se obtiene a partir de las propie- dades de la suma de variables aleatorias y de la definicién de valor esperado, Dado ‘que una binomial es ta suma de una secuencia de m valores, y cada uno de ellos puede considerarse una variable aleatoria dicotémica, su valor esperado sera igual a Ja suma de los valores esperados de cada una de ellas. En el capitulo anterior vimos que el valor esperado de una variable dicotémica es igual a Ia probabilidgd de observar el valor 1, que hemos representado por x; por tanto: EX) = pate tet mln veces) ane a3.) 4) Siguiendo ta misma légica, obtenemos la varianza de una variable binomial: OX) =a telat (n veces) = sme = 9) (13.2) 2) Se demuest dada por la expres que la funcién de probabilidad de una variable binomial viene Sls) = (") vee (03.3) Dado que lo importante de los modelos de distribucion es que cuando una ajusta a ellos se puede facilitar el trabajo aplicando sus propiedades y caracteristicas, vamos a ver cémo esa aplicacién nos da los mismos resultados que los obtenidos al aplicar las fOrmulas generales. Asi, Ia funciéa de probabilidad obtenida mediante la frmula 13.3 es la misma que In obtenida mediante la aplica- ién del enfoque clisico 0 a priori. Por ejemplo, la variable del ejemplo anterior, referida a las ratas del laberinto, tendria Ia siguiente funciéa de proba ‘la mis:aa que obtuvimos por el procedimiento general en el cuadro 12.1}: : x f(%) 3 0,50? = 0,50 = 0,125 Go eel 0,50? + 0,50 = 0,375 ce fo a = 0,50! 0,50? = 0375 + 0,50° - 0,50? = 0,125 1 donde x = 31416 ye = 2,718, La forma compacta de representar, esto es, X— My 0) La formula 13.5 fue la que descubrié De Moivre, pero el uso del nombre curva normal para designarla ¢5 posterior. En tiempos de Galton ya se utilizaba este nombre, pero es seguro que el término es anterior a él Se’puede demostrar que al aplicar a este modelo las formulas del valor esperado yla varianza para variables aleatorias continuas (capitulo 12), se obtienen las dos constantes que hemos mencionado antes y que, una simple y la otca al cuadrado, intervienen en la formula. En concreto, la constante que aparece en el numerador del exponente ¢s el valor esperado (j), y la que aparece en el denominador de la formula y-en el del exponente es la varianza (0°). ‘Una consecuencia de esto ¢s que en el exponente podemos reconocer la formula de tipificacion, y por tanto para variables tipilicadas esta férmula toma un aspecto ‘mas sencillo, dado que la desviacion tipica es I y el valor especado 0. En conereto, si es una’ variable normal con valor esperado m y desviacidn tipica 0, y hacemos el cambio de variable, x= ° centonces la funcion de densidad de esta nueva variable sera: fe) Las variables cuya distribucigu s¢ ajusta al modelo normal adoptan una repre- sentacién, grifica como la de Ja figura 13.3, en la que se pueden apreciar alguns de las propiedades que vamos a enumerar a coatinuacién: a) Es ‘simétriea con respecto @ ua valor central(y), y ea ese valor central coinciden la media (0 valor esperado), la mediana (divide a la curva en dos zonas de ‘igual area a su izquierda y a su derecha) y la moda (es el punto de la curva con ‘maxima ordenada), 4) Es asintética con respecto al eje de abscisas; es decir, por mucho que se extienda, nunca llega.a tocar los ejes, y sélo en ico la altura de la curva Uegaria a ser igual a:0. ¢) Hay toda una familia de curvas normales, dependiendo de los valores de py & De entre ellas, la mas importante es aquella que tiene media" y desviacion tipica 1, y para la que Sheppard (1899) propuso el nombre de distribucién normal ‘unitaria, 4) Los puntos de inflexion se encuentran en los puntos correspondientes a la media mas/menos una desviacion tipica (x + 0). ¢) Cualquier combinacién lineal de variables aleatorias normales se ajusta también al modelo normal. La mayor parte del trabajo prictico con variables aleatorias normales consiste en hallar probabilidades asociadas a valores. Tal y como vimos en el capitulo anterior, esto significaria integrar la funcién de densidad entce los valores de interés. Para evitar tener que resolver este tipo de operaciones se han construido tablas apropiadas con las areas ya halladas (la primera de ellas fue publicada por Sheppard en 1902), y cuyo uso se basa en la aplicacién de un teorema de gran interés aplicado, ¥ que nosotros llamaremos teorema de tipificacién, Segiia este teorema, la funcida de ! distribucién asociada a un valor de una variable aleatoria, X, con distribucion normal, ¢s la misma que la funcién de distribucién de la tipilicada de ese valor en la normal unitaria (Fig. 13.4). Por eso las tablas se han construido sélo para la ‘ distribucion unitaria. Para obtener las areas asociadas a un valor de cualquier otra distribucién normal basta con tipificar ese valor (las tipicas son una transformacion lineal con media 0 y desviaciéa tipica 1, y por tanto su distribuciéa es la normal unitaria) y acudir con la z obtenida a la tabla correspondieate (apéndice B). Figura 10.4—Representacin grifica de fa equivalencia entre las funciones de distribucidn de valores de ‘variables normals y las de sus tpiicadas en la diinbucién normal unitara. ee | Anausis 08 oatas en psicoogia | Modelos de disibuciin de probabitited \/ 323 Dada su importancia, vamos a resaltar este teorema en un recuadro indepen- CUADRO 13.2 diente: - Ejemplos de obtencién de probabilidades asociadas a variables normoles ‘Segiin el teorema de tipificacién paca variables normales, la funcida de distri- Supongamos que layariable X se disiruye (50, 8) y queremos obtener las siguientes ~bucién asociada a un valor de {3.Vaciexble normal, ¥, es igual a la de la probabilidades:«) It observar un vAlor como macho igual a 56; 8 ade observar ua tipificada de ese valor en la distribuciéa normal unitaria. Es decir valor como minimo iil a S28, ye) de observar ua valor comprendido cate 408 y 483, Si a) X¥—+ NU, 0), y 0) En el primer caso se trata de obtener la probabilidad acumulada del valor 56, y para 4) formamos la variable =, = (X,— y/o i] “eto bests cou tiptiar y acudr con ese valor tpicnde le tole cle wetal |] unital, dado que esta nos proporcona directamente las reas izquieedas. Es deci entonees F(X) = Fle) donde 2 —+ (0, 1) ( eo *) : ZZ W < 59=P(z< 7 i ti h t Fara tcferimos a un valor concreto dela distibuciga normal unitaria uizare- | Ly} = Az < 075) = 07734 mos Ia letra = y a su derecha el subindice correspondiente a la probabilidad acurnu- Jada para ese valor. Asi, 0b 4) Enel segundo caso se trata de obtener el complementario dela probabildad acumula- Foe = 0,44 da‘del valor 528. Una via para ello consiste en halla la‘acumulada del valor 528 por el procedimtento descrito.en el apariado a}, y después restarta de I; es decir indica que en ta distibucién normal unitaria el’ valor. 0,44 tiene una probabilidad acumulada, 0 area izquierda, igual a 0,67. Obviamente, cualquier valor con un subindice menor de 0,50 sera negativo, mientras que el valor 0 tendria un subind © 0,50, puesto que el valor 0 es tanto Ia media como la mediana de Ia distribu. cin. i EI trabajo con variables aleatorias normals, al igual que con otras variables continuas, se reduce a la obtencién de las probabilidades de obtener ua valor menor | © igual que uno concreto (0 area izquierda de ese valor), la de obtener un valor | ‘mayor 0 igual que uno concreto (o area derecha de ese valor), o la de obtener un | I | PUK > 52,8) = 1 = PIX < 528) = one =(o< 22), (= <= 0,35) = 6) En el tercer caso se trata de obtener e}-frea acotada catre los valores 40,8 y 48,3. Tal y como vimos en el capitulo anterior, el procedimiento mis apropisdo paca llo consiste en hallar la diferencia entre Ja probabilidad acumulada del valor mayor y la del valor menor, es decir: t valor comprendido entre dos valores concretos (0 érea acotada por esos dos valo- Fes), El procedimiento para obtener ¢sas probabilidades consistird en aplicar el teorenia de tipiicacién y consultar la tabla, tal y como se describe en los ejemplos del cusdro 13.2, aunque con frecuencia lo que inieresa es la tarea inversé, es decir, a de identificar la puntuacién que deja una cantidad de arca concreta a su i2quierda 0 a su derecha; en él cuadro 13.3 hemos incluido algunos ejemplos de esto, en fos que PWOB < X < 483) = : lo que se busca es el valor para el que la probabilidad acumulada (0 su complemen : (mp2 ere B= 2) es taria) es igual 2 una cantidad conereta. 8 a La distribuciéa normal se utiliza también para obtener por aproximacién las = ALIS ¢ F< -021) = probabilidades asociadas a otros modclos. Ya hemos ‘mencionado el caso de la A aaa Sa nse binomial, del que ponemos algunos ejemplos en el euadro 13.4, pero también hay otras formulas de aproximacién que itemos exponiendo en conexidn con los mode. Jos a los que se refieren. = 04168 — 0.1251 = 0.2917 ‘Supongamos de nuevo que la variable X se distribuye (50, 8) y queremos obtener los | | | | | | CUADRO 133 i Ejemplos de obtencién de tas puntuaciones de una variable ‘iormal ae ‘con probabilidades concretas asociadas valores de ests variable para los cuales se curmplea las siguieates condiciones: a) aque! para el que la probabilidad de observae ua valor como mucho igual a él es 0.1736; 6) aquel para el que la probabilidad de observar un valor como minimo igual a a sea 08207, y ¢) aquellos dos valores que acoten el $0 por 100 ceatral del area. 2) Enel primer caso se trata de obtener ef valor que deja un area a su izquierda igual 20,1736, Por el teorema de tpificacién, y acudiendo a la tabla, comprobamos que se tata del valor cuya tipica sea igual 2 ~0,94, Basta con destpificar ese valor con respecto a la media y la desviaci6n tipica de la distribucién: nae = 094 = =O despejando, Xm 094-8 + 50 = 4248 1) Encl segundo caso se rato de obtener el valor que deja um ireaa su dereca igial 2 09207, Como la tabla asocia a cada valor su area inqucrda, y dado, que la puntuacion que deje a su aerecha un area igual a 0,9207 es el mismo que deja a su, iaquierda un valor igual a1 ~ 09207 = 06793, buseamos este valor de probabil | dad en la tabla y aplicamos el mismo procedimicato que antes: a 10) Se'trata de obtener aquellas dos puntuaciones que, tal y como aparece en la figura, dejen. 2 su inquierda y derecha, respectivamentc, areas iguales a 0,25. Seguin la tabla, esas puntuaciones tendran como tipicas los valores 0,67 y —0,67. Destpili- ‘amos eso dos valores y obtenemos fo siguiente:» - - . feoms = ~L4L = despejando, Xm 1d Rs 50 3877 09207 x 0 030, Seas = -0,67 = despejando, 025 X= -067-8 + 50 = 4464 x- fogs = 067 = despejando, é X= 067-8 + 50 = 5536-9 | Modelos de disvibucién de probebiided | 325 CUADRO 13.4 Aproximacién de la binomial a la normal Las probabilidades asociadas a valores de variables binomiales pueden obiencrse mediante un procedimiento de apcoximacién a la distribuciéa normal, En la figuea siguieote se aprecia que la curva que aparece al unic los extremos de las barras que fepresentan las funciones de probabilidad de un modelo A(1’; 10, 0,50) tienen ua cierto parecido a esa distribucion. Ese parecido es tanto mayor cuanto rods siméttica sea la istribucién y cuanto mayor sea el mimero de barras en las que se basa Esto se traduce en que el valor de x no sea demasiady extremo ni el valor esperado de la istribucion sea demasiado pequeio. Fle) + 0250 0.200. 0,150 0,100 0,050 0123465678 9 1 El procedimiento consiste en que para calcular la probabilidad acumulada de un valor ‘de una variable distribuida segin el modelo binomial se calcula la de ese mismo valor a waa distribucién normal eo la que el valor esperado y la varianza fueran los de la binomial original, y aplicando una correccién por coatinuidad. Esta correccién permite ‘mejorar la aproximacién adaptando el hecho de que la binomial es disereta y la normal continua. Para aplicar esta correcci6n lo que se hace es no tipificar el valor correspoo- dente, sino que se suma 0 resta media waidad para que el valor tipificado incluya completas las barras de los valores de interés, Veimoslo con alguoos ejemplos y comprobemos el grado de aproximacién que se consigue. ‘Supoagamos una variable, x, distribuida segio el modelo binomial con parimetcos 10 ¥ 040. Queremos obleber las probabilidades de observar: a) valores como méximo ‘iguales a 3; 6) valoces como minimo iguales a 6 y c) valores comprendidos eutce 5 y 8, ambos incluidos. 4} En el primer caso se urata de calcula a probebilidad acurmulada del valor 3, que sepium Ia tabla es 0.382. El valor que detemos tpilicar ex el que deja por debajo todos los valores de ioerés, y por eocima todos los dems, es decir 3,5. Como el valor esperado y la varianza dela binomia'son my n~ (J x}, sustituimos eo 4a formula de tipifcaciou: 35 — 10 - 040 u<'3y a(« 2) ote dtosy < osus ns) ( < BEES) «my < 030 = 0905 gh APENDICE B: CUADRO 134 fcontinuacién) a a ee cee ee oe 3 Sea eee ee as 2 abn cn envn enn te ndene -eneracnnanenneate a ZS [acc -enen-ensneneenacseenanantaneserneven o pie ee eee ee eases eee dese a ee ee ee 8 ean eee a ees aoe = = enRen ton enema nn eneerm ne enaTe - ee 8 wos nneencent een sana annennvemesennamne ae ennne sen ant sne wT AMene Het TRON is Met et ORR Hee TANTO ON TEN Se KBAR NOTA! te « eennasd otra tent em onn nena #82 <3 2338 3$/& gas ze3 is zig Z>4 aie 234 iS aoe ale aa% & 255 ale g32 7 Bey 71> S33 a eae w #32 ee . 2 a33 833 8 485 eae. ea aS ee re Bes ot eas b2ig 4" © gBe ele Bees 3 8 BRE [IF gagd << Fee sie Oe oe fips + 2 fy 8 a gags os ce rane foi azg- eBoy R235 fa ae fee & ) ) Q | 3 los las tablas de la binomial. Esta aproximacion es tanto mejor cuanto = P32 < > < 290) = 09981 ~ 06255 = 05726 a8 ge ae ie at ret ef gs 3g si ne ga fy #8 5s g 3 g i i : 8 7 ‘ z é Como puede apreciarse, en los tres casos se obtienen probabilidades lo suficientemente i a 4 i = : g i a a 2 z 2 i a

You might also like