You are on page 1of 7
Seccidm 3.4 Distribuciones empiticas 63 24. Encuentre la distribucién de probabilidad para cl babifidad para el total T de las tres monedas, Expr nimero de CD de jazz cuando se seleccionan cuatro. _se Ia distribucidn de probabilidad de forma graifica c acoleecién que consisteencincoCD —_mo un hisjograma de probabilidad, eldsica y tres de rock. Exprese 26. Se sacan tres bolas sucesivamente de una cajaq' una formula, contiene cuatro bolas negras y dos verdes, cada as reemplaza e ie cuatro de diez centavos y dos cuenire la distribt ‘os. Encuentre la distribucién de pro- ro de bolas verdes una eaja que ce de cinco c 3.4 Distribuciones empiricas en En las secciones anteriores el lector fue expuesto a conceptos acerca de distribucio. nes discretas y continuas. Los métedos de cdleulo de probabilidades dependen del conocimiento de la funcién de masa de probabilidad o funcién de densidad de pre babilidad. La funcién de probabilidad para el caso discreto y la funcidn de densidad @ el caso continuo son formas de caracterizar la distribucién de probabilidad pa- ra una poblacion o sistema. Obviamente, el usuario de los métodos estadisticos no puede generar suficien- te informacién o datos experimentales Para Caracterizar por completo la distribu- cion, Pero a menudo se utilizan conjuntos de datos para aprender acerca de ciertas Propiedades de Ia distribucién. Los cientificos ¢ ingenieros estdn acostumbrados a tratar con conjuntos de datos. La importancia de caracterizar o reswmir la naturale- za de las recopilaciones de datos debe ser obvia. Con frecuencia un resumen de un conjunto de datos por medio de una representacion grafica puede proporcionar mas informacion del sistema del que se tomaron los datos. En capitulos posteriores se explora con detalle el muestreo de distribuciones y la representacién de datos a fin de reforzar la inferencia estadistiea acerca de sis- temas cientificos. En esta seccién sélo introducimos algunas representaciones sim- ples pero a menudo efectivas que complementan el estudio de las distribuciones estadisticas. Por lo general, en un experimento que incluye una variable aleatoria continua la funcién de densidad f(x) se desconoce y se supone su forma. Para que la eleccion de f(x) sea razonablemente valida se necesita en su seleccién un buen juicio que se base en toda Ia informacién disponible. Los datos estadisticos, generados en gran cantidad, pueden ser muy titiles para estudiar el comportamiento de la distribucién si se presentan en una representaci6n tabular y grafica combinada denominada dia- grama de tronco y hojas. Para ilustrar la construccién de un diagrama de tronco y hojas, considere los datos de la tabla 3.1, que especifican la “vida” de 40 baterfas de coche similares que se registran al décimo de afio mds cercano, Se garantiza que las baterias duran tres Tabla 3.1 Vida de las baterias de automdvil 22 4. 35 45 a2) a7 3.0, 34 16 3.1 33 38 3 47 ae 43 34 3.6 29 Bid 3.9) 33 34 37 44 32 al 19 47 3.8 3.2 2.6 3.9 30 42 64 Capitulo 3 Variables aleat 18 y distribuciones de probabilidad Tabla 3.2 Diagrama de tronco y hojas de ts vida de las baterias 69 25669 (001111222333444556777889 4577 nero, se divide cada observaci¢ y una hoja de modo que el tronco repre: daa la parte decimal de! nimero. En ot 3 se designa como el trance y el digito T como la hoj para nuestros datos se listan de forma consecutiva e vertical en la tabla 3.2; las hojas se registran a Ia derecha de Ia linea en oposicidn al lor del troneo apropiado, De esta forma la hoja 6 del mimero 1.6 se ra en Jado opuesto del tronco 1; la hojat 5 del ntimero 2.5 se registra en cl lado opues- aitos. Pr consisten en un troneo o entero y la hoja corr el nimero 3.7 eld Los cuatro troncos 1, 2, 3.y 4 el lado izquierdo de una linen to del tronco 2; eteétera, El ntimero de hojas que se registran en el lado opuesto de cada tronco se resume en la columna de frecuenci: Eld de tranco y hoja de la tabla 3.2 contiene s6lo cuatro troncos y en consecuencia no proporciona una representacion adecuada de a distribucién, Para »s atimentar el mimero de troncos en nuestro a cabo esto es escribir cada valor de tronco ail y registrar las hojas 0, 1, 2, 3 y 4 del la- do opuesto del valor del trenco apropiado donde aparece por primera vez; y las ho- jas 5. 6, 7.8 y 9 del lado opuesto al mismo valor del tronco donde aparezea por segunda ver. Este diagrama de doble tronco y hojas modificado se ilustra en la tae bla 3.3, donde los troncos que corresponden a las hojas 0 a4 se codifican con el sitte bolo * y el tronco que corresponde a las hojas 5 a9 con el simbolo- Se puede lograr un aumento en el ntimero de troncas al escribir cada valor de tronca cinco veces a la izquierda de uni ficar los troncos con a para las hoj y 5, d para las hojas 6 y 7, ye para las hojas 8 y 9. Para los datos de la tabla lizaremos entonces los troncos 1d, Le, 2a, 2b, 2c, 2d y 2e para construir un diagra- ma de cinea troncos y hojas. n cualquier problema troncos. E: ‘oblema, necesita ma simple de Ile dos veces a la izquierda de la linea v clos de los augue nos guiamos por lo, debemos decidir los valores apropi isin se toma de forma un poco arbitrari Tabla 3.3 Diagrama de doble tronco y hojas para Ja vida de las baterias Hoja 69 a 1 S669 4 OO1111222333444 Is 5567778899 lo 13234 ‘i S77 a Seccién 3.4 Distribuciones empiricas 65 el tamafio de nuestra muestra. Por lo general, elegimos entre cinco y 20 troncos. En- {re mas pequefo ¢s el nimero de datos disponibles, menor es la cantidad de troncos a ionar. Por ejemplo, si los datos consisten en nimeros del 1 al 21 que repre- ntan la cantidad de personas en la fila de una cafeteri para 40 dias habiles que se seleccionan de manera aleatoria y elegimos un diagrama de doble troneo y hojas, los troncos serian 0*, 0); , 1*, 1- y 2* por lo que ala observacién més pequeiia | le corres, Ponde el tronco O* y la hoja 1, al ndmero 18 le corresponde el tronco 1. y la hoja 8, y ala observaci6n mayor 21 le corresponde el tronco 2* y la hoja 1. Por otro lado, si los datos consisten en cantidades de $8800 a $9600 que representan las mejores ven- tas de 100 automdviles nuevos de cierto distribuidor y clegimos un diagrama de un Solo tronco y hojas, los troncas serfan 88, 89, 89, .., ¥ 96 y las hojas contendrian dos digitos cada una. A un carro que se vende en $9385 le corresponderia un valor de tronco de 93 y la hoja de dos digitos 85. Las hajas de digitos miuiltiples que pertene- cen al mismo tronco por lo general se separan por comas en el diagrama de tronco y hojas. Los puntos decimales de los datos por lo general se ipnoran cuando todas los digitos a la derecha del punto decimal representan la hoja. Tal es el caso de las ta. blas 3.2 y 3.3, Sin embargo, si los datos consisten en mimeros que van de 21.8 a 74.9, debemos ¢legir los digits 2, 3, 4, 5, 6 y 7 como nuestros troncas de modo que un nu- mero como el 48.3 tenga un valor de tronco de 4 y una hoja de 8.3. El diagrama de tronco y hojas representa una forma efectiva de resumir datos. Otra forma es a través del uso de la distribucién de frecuencias donde los datos, que se agrupan en clases o intervalos diferentes, se pueden construir mediante el conteo de las hojas que pertenecen a cada tronco y al notar que cada tronco define un in- tervalo de clase. En la tabla 3.3 el troneo 1 con 2 hojas define el intervalo 1.0-1.9 que contiene 2 observaciones; el tronco 2 con $ hojas define el intervalo 2.0-2,9 que con- tiene 5 abservaciones; el tronco 3 con 25 hajas define el intervalo 3.0-3.9 con 25 ob- servaciones; y el troneo 4 con 8 hojas define el intervalo 4.0-4.9 que contiene § observaciones. Para el diagrama de doble tronco y hojas de la tabla 3.1 los troncos definen los siete intervalos de clase 1.5-1.9, 2.0-2.4, 2.5-2.9, 3.0-3.4, 40-44 y 45-4.9 con frecuencias 2, 1, 4,15, 10, 5 y 3, respec! ir cada frecuen- cia de clase entre el ntimero total de observaciones, obtenemos la proporcién del conjunto de observaciones en cada una de las clases. Una tabla que lista las frecuen- cias relativas se denomina distribucién de frecuencias relativas. La distribucion de frecuencias relativas para los datos de Ia tabla 3.1, que muestra los puntos medios de cada intervalo de clase se da en la tabla 3.4 Tabla 3.4 Distribucién de frecuencias relativas de a vide Freenencia, Frecuencia f relativa 2 1 4 15 10 5 3 66 Capitulo 3 Variables aleatorias y distribuciones de probabilidad ai 0.250}— 0.125 17-22 27 3237 42 47 Vida de la bateria (afios} Figura 3.7 Histograma de frecuencias relativas. La informacién que proporciona una distribucién de frecuencias relativas en forma tabular es mds fiicil de comprender si se presenta de forma grafica. Con el uso de los puntos medios de cada intervalo y las frecuencias relativas correspondientes, construimos un histograma de frecuencias relativas (figura 3.7) exactamente de la misma manera que construimos el histograma de probabilidad de la seccién 3.2. En la seceién 3.2 sugerimos que las alturas de los rectangulos se ajustaran de modo que las 4reas representasen probabilidades, Una vez hecho esto, el eje ver cal se puede omitir. Si deseamos estimar la distribucién de probabilidad f(x) de una variable aleatoria continua ¥ mediante una curva suave como en la figura 3.8, es im- Portante que los rectsingulos del histograma de frecuencias relativas se ajuste de mo- do que el area total sea igual a 1 La probabilidad de que una bateria dure entre 3.45 y 4.45 altos cuando se se- lecciona al azar de Ia linea de produccién infinita de tales baterias estd dada por el 4rea sombreada bajo la curva. Nuestra probabilidad estimada que se basa en las v das registradas de las 40 baterias serfa la suma de las éreas que contienen los rec- Tangulos entre 3.45 y 4.45, Aunque dibujamos una estimacién de la forma de f(x) en la figura 3.8, atin no tenemos conacimiento de su férmula o ecuaci6n y por tanto no podemos encontrar el rea sombreada. Como ayuda para comprender el método de estimacién de la formula para f(x), recordemos algo de geometria analitica elemental. Las pardbo- las, hipérbolas, circulos, elipses, etcétera, tienen formas bien conocidas de ecuacio- nes, y en cada caso reconoceriamos sus gréificas. Al pensar de manera inversa, si s6l0 tenemos sus griificas pero reconocemos su forma, entonces no es dificil estimar las constantes desconacidas © pardmetros y llegar a la ecuacin exacta. Por ejemplo, fix) 17-22 27 32 3.7 42 47 ida de Ia bateria (anos) Figura 3.8 Estimacién de ta funcién de densidad de probabilidat Seccion 3.4 Distribuciones empiricas 67 la curva parece tener la forma de una parabola, entonces sabemos que tiene una ecuacion de la forma f(x) = ax? + bx + ¢, donde a, b y ¢ son pardmetros que se pueden determinar mediante diversos procedimientos de estimacién. Muchas distribuciones continuas se pueden representar de manera grdfica me- diante la curva en forma de campana Caracteristica de la figura 3.8. La ecuacién de la funcién de densidad de probabilidad f(x) en este caso se conace tanto como la de una pardbola o la de un circulo y depende sélo de la determinacién de dos pa- rametros. Una vez que estos Pardmetros se estiman a partir de los datos podemos escribir la ecuacién estimada y, después, con el uso de las tablas apropiadas, encon- trar cualesquier probabilidades que elijamos. Se dice que una distribucién es simétriea si se puede doblar a lo largo de un eje vertical de modo que los lados coineidan, Una distribucién que carece de simetria con respect a un eje vertical se dice que es asimétrica o sesgada. La distribucién que se ilustra en la figura 3.9(a) se dice que esté sesgada a la derecha, pues tiene una cola derecha larga y una cola izquierda mucho més corta. En la figura 3.9(b) vemos que la distribucion es siméirica, mientras que en la figura 3.9(c) estd sesgada a la iz- quierda. (a) tb) te) Figura 3.9 Asimetria de los datos Al girar un diagrama de tronco y hojas en una direccién contraria a las mane- cillas del reloj en un dngulo de 90°, observamos que las columnas de hojas que re- sultan forman una imagen similar a un histograma. En consecuencia, si nuestro propésito principal al ver los datos es determinar la forma general de la funcién de densidad, rara vez sera necesario construir un histograma de frecuencias relativas. En el capitulo 6 consideraremos la mayor parte de las funciones de densidad impor- tantes que se utilizan en ingenieria y en investigaciones cientificas La distribucién acumulada de X, donde ¥ representa la vida de la bateria del coche, se puede estimar de forma geométrica mediante el uso de los datos de la ta- bla 3.4, Para construir dicha grafica, primero acomodamos nuestros datos como en Ja tabla 3.5, en una distribucién de frecuencias relativas acumuladas, y después gra- ficamos la frecuencia relativa acumulada menor que cada limite de clase contra ¢l correspondiente limite de clase como en la figura 3.10. Estimamos F(x) al dibujar una curva suave a través de los puntos, Los puntos de percentil, decil y cuartil se pueden leer répidamente en la distri- bucién acumulada. En Ia figura 3.10 las lineas punteadas indican que el percentil jcinco o primer cuartil y el séptimo decil son aproximadamente 3.05 y 3,70 anos, 68 Capitulo 3 Variables ateatorias y distribuciones de probabitidad i 3 Tabla 3.5 Distribucion de frecuencias vas acumuladas de la vida Frecuencia relativa Limites de clase ___ scumulada Menor que 1.45 0.000 Menor que 1.95 0.050 Menor que 2.45 0.075 Menor que 2.95 0.175 Menor que 3.45 0.550 Menor que 3.95 0.300 Menor que 4.45 0.925 Menor que 4.95 1.000 1.000 }- (O7E0 ie ae ie 0.500} a 0.250} --------- -, | 145-195 2.45 2.95 345 395 «45 4.95 * Vida de las baterias (afios) Figura 3.10 Distribucion continua acumulada Tespectivamente. Esto significa que 25% 0 una cuarta parte de todas las baterias de este tipo s¢ espera que duren menos de 3.05 afios, mientras que se puede esperar que 70% de tales baterfas duren menas de 3.70 afios, Ejercicios ees 1. Los resultados siguientes representan las cali ciones del examen final de un curso de estadistica el mental; 23 80 52 41 60 34 (a) Construya un diagrama de tronco y hojas para las calificaciones del examen en cl que 10s troncos sean 1,2,3,.. a oF 10 7 8 67 «9. 79 81 64 83 ao 17 32 95 15 34 76 82 57 AL 78 64 4 69 74 65 25 ta: 48 74 52 2 80. 88 84 63 m0 85 98 62 cit 80 82 55 a1 4 15 85 36 76 67 4B 9 61 (b) Determine una distribucion de frecuencias rela- livas, (c) Construya un histograma de frecuencias relativas, dibuje una estimacién de la grafica de f(x), y diseuta la asimetria de la distribucién, (d) Construya una distribucion de frecuencias rel vas acumuladas. (e) Dibuje una estimacién de la gréfica de F(x). (f) Estime el primer cuartil y el séptimo decil. 2. Los siguientes datos representan Ia duraciGn de la vida en aftos, medida al décimo mas cercano, dé 30 bombas de combustible similares: Seccidn 3.6 Distribuciones de probabilidad conjunta 69 33.13 04 65 02 23 LB 4.7 07 05 2.5 5.0 6.0 12 02 (a) Construya un diagrama de tronea y hojas para las vidas de las bombas de combustible, utilice el digito Ja iquierda del punto decimal como el tronco p cada observacion, (b) Determine una distribucion de frecuencias rel (c) Constru: dibuje una est la asimet n histograma de frecuencias relativas, cién de la grafica de f(x), y discuta fa de la distribucién (d) Construya una distribucién de frecuencias relati- vas acumulad: (¢) Dibuje una estim: (f) Estime el percent n de la grafica de F(x). 75. 4. Construya un diagrama de tronco y hojas para los datos de la ta 3.1, escriba cada tronce cinco ve- ees y después codifique los troncos como se describe (c) Construya una distribucion de frecuencias relati- vas acumulada (d) Dibuje una estimacién de la grdifica de F(x). {e) Estime el valor bajo el cual caen dos tercios de los miligramos, de 40-¢i- rrillos de cierta marca se registraron como sigue: Pores 109 1.92 2.31 228 174 1471.97 3. Los siguientes datos representan la duracién de 158 2.03 1 aa ie Ja vida, en segundos, de 50 moscas sometidas a un 211 186 190 151 nuevo atomizador en un experimento de laboratorio 164 O72 169 1.32 controlado: 179 246 1.88 167 17 20 10 9 23 13 12 19 18 24 137 193 140 164 209 ToGo a6) 7 10) 13. 7, 175 163 237 1.78 1.69 ie e a 8 2 7 ae i 10 1 (a) Construya un diagrama de tronco y hojas para los Bm ae ano a e ie datos en que los troneas son los digitos a la izquierda del punto decimal, cada uno repetido cinco veces de modo que las hojas de doble digito de 00 a 19 se aso- cien con los troncos codifieadas con la letra a, las hojas 20 a 39 se asocien can los troncos codificados con la le ra. De orma, un niimero como el 1.29 de tronco 1b y una hoja igual a 29. e una distribucién de frecuencias relativas (a) Construya un diagrama de doble tronco y hojas para la vida de las moscas. utilice los troncos 0*, 0-, T*, 1, 2*, 2: y 3* de modo que los troncos cadificados. con los simbolos + y - estén asociados, respectivamen- te, con las hojas ad y Sa 9, (b) Determine una distribucién de frecuencias relativas. tra b, eteét tiene un valo (b) Detern 3.5 Distribuciones de probabilidad conjunta Nuestro estudio de variables aleatorias y sus distribuciones de probabilidad en las seeciones anteriores se restringe a espacios muestrales unidimensionales, en los que registramos los resultados de un experimento como valores que toma una sola va- ble aleatoria, Habré situaciones, sin embargo, donde podemos encontrar que es deseable registrar los resultados simultancos de diversas variables aleatorias. Por ejemplo, podemos medir la cantidad de precipitado P y volumen V de gas liberado en un experimento quimico controlado, que dan lugar a un espacio muestral bidi- mensional que consiste en los resultados (p, 2), 0 podemos interesarnos en la dure- za Hy en la resistencia a la tensién T de cobre estirado en frio que conducen a los resultados (#, (). En un estudio para determinar la probabilidad de éxito en la facul- tad, que se basa en los datos de preparatoria, se puede utilizar un espacio muestral tridimensional y registrar para cada individuo su calificacion de la prueba de apt tud, su clasificacién en Ia clase de preparatoria y el promedio en puntos al final del primer ao en licenciatura

You might also like