You are on page 1of 16
Probabilidad los capitulos anteriores estudiamos viarias maneras de utilizar la estadistica descriptiva para organizar y resumir un conjunto de datos. Sin embargo, ademas de describir un grupo de observaciones, también podriamos estar interesados en investigar como emplear la infor- macién contenida en la muestra, para inferir las caracteristicas de la poblacién de la cual se tomé. Pero antes de hacerlo debemos establecer las bases. La inferencia estadistica se funda- menta en la teoria de probabilidades. En el capitulo 5 empleamos el término probabilidad como sinénimo de proporcién. Antes de brindar una definicién mas precisa, debemos expli- car el concepto de evento. Un evento es el elemento basico al cual se puede aplicar la probabilidad. Es el resultado de una observacién o un experimento, o la descripcién de un resultado potencial, Por ejemplo, podrfamos considerar el evento de que una mujer de 30 aftos de edad llegue hasta los 70 aflos, © el evento de que a la misma mujer se le diagnostique cncer cervical antes de cumplir los 40 afios. Otro evento podria ser el hecho de que una planta de energia nuclear particular sufra un accidente dentro de los préximos diez afios. Un evento sucede o no sucede. En el estudio de la probabilidad, los eventos se representan con letras mayiisculas, como 4, By C. Con los eventos se pueden efectuar varias operaciones. La interseccidn de dos even- tos A y B, denotada 4 7 B, se define como el evento “A y B”. Por ejemplo, sea 4 el evento de que una mujer de 30 affos de edad legue viva a su aniversario nimero 70, y B el evento de que su esposo de 30 afios de edad afin viva a los 70 afios de edad. La interseccién de Ay B seria el evento de que tanto la mujer de 30 afios como su esposo se encuentren vivos a los 70 aitos. La unidn de A y B, denotada A U B, es el evento “A 0 B, 0A y B”. En el ejemplo an- tes mencionado, la unidn de A y B seria el evento de que la mujer de 30 aitos o su esposo, también de 30 afios, vivan hasta los 70 afios, 0 que ambos vivan hasta cumplir 70 alos de edad. 125 126 Capitulo 6 Probabilidad El complemento de un evento A, que se denota A° oA es el evento “no A”. Como con- secuencia, A° es el evento de que la mujer de 30 afios de edad muera antes de cumplir 70 afios de edad, Estas tres operaciones —intersecci6n, unién y complemento— pueden utilizarse para describir incluso los casos més complicados en términos de eventos simples. Con el objeto de hacer més concreta esta idea, una figura denominada diagrama de Venn constituye un me- dio muy til para describir las relaciones entre eventos, En la figura 6.1, por ejemplo, el rea ‘entre cada recténgulo representa todos los resultados que posiblemente podrian ocurrir. Den- tro de los recuadros, los circulos rotulados con la A representan el subconjunto de resultados cen los que una mujer de 30 afos vive hasta los 70 afios, y los circulos rotulados con la letra B denotan los resultados para los cuales el exposo, de 30 afios, sobrevive a los 70 afios de edad. La interseccién de 4 y B esta representada por el area en {a cual los dos circulos se su- perponen; esta érea se encuentra sombreada en la figura 6.1 a. La unién de d y B se encuen- tra sombreada en la figura 6.1 b y es el area que corresponde A o B 0 ambos. El complemento de A, como lo muestra la figura 6.1 ¢, constituye todo el interior del recuadro que se locali- za fuera de A. / @ © FIGURA 6.1 Representacién de las operaciones con eventos mediante diagramas de Venn. 6.1 Operaciones con eventos y probobilidedes 127 Ahora estamos listos para analizar el concepto de probabilidad. Como sistema matema- tico, la teoria de probabilidad es se encuentra bien definida. Ya que tenemos la intencién de apli- carla necesitamos una definicién practica que funcione. Se han propuesto muchas definiciones de probabilidad. La que presentamos aqui se denomina definicién frecuentista, y establece que Si un experimento se repite n veces en condiciones esencialmente idénticas, y si el even- to A ocurre m veces, entonces, conforme 7m aumenta, la razén m/n se aproxima a un limi- te fijo, que es la disparidad de A, Piay= En otras palabras, la probabilidad de un evento A es la frecuencia relativa de que suceda — © la proporcién de veces que el evento ocurre— en ua gran cantidad de intentos repetidos ‘en practicamente las mismas condiciones. La naturaleza prictica de esta definicin la hace un poco vaga, aunque funciona bastante bien. Una aplicacién de la definicidn frecuentista consiste en determinar la disparidad de que tun varén recién nacido viva hasta cumplir el primer afio de edad. Consultese la tabla $.1, la tabla de vida de 1992 para la poblacién de Estados Unidos [1]. Entre los 100,000 individuos nacidos en este grupo —consideramos a estos varones “experimentos”—, el evento de que sobrevivan hasta su primer afio de vida ocurre 99,149 veces. Por tanto, 99,149 100,000 0.99149, P(un nifio sobrevive su primer affo de vida) = ‘Suponemos que las 100,000 repeticiones constituyen un mimero suficientemente grande que satisfacen la definicién frecuentista de probabilidad. El valor nimerico de una probabilidad se encuentra entre 0 y 1. Si un evento particu- lar sucede con certeza, ocurre en cada uno de los n intentos y tiene una probabilidad de n/n = 1, Sea A de nuevo el evento de que una mujer de 30 afios legue viva a los 70 aftos de edad. En este caso, P(A UA) = Plya sea A 0 A® 0 ambos) = P(una mujer de 30 afios de edad vive hasta la edad de 70 afios 0 no vive hasta los 70 afios) =1 puesto que es cierto el hecho de que la mujer viviré morird. En la figura 6.1 c, Ay A® Ile- nan juntos todo el recuadro, Ademés, observe que resulta imposible que 4 y A ocurran de manera simulténea. Si un evento jamés sucede, tiene una probabilidad O/n ~ 0. De aqui que P(A AD= PUA y A) = P(una mujer de 30 afios vive hasta los 70 © no vive hasta los 70 aiios) =0. Un evento que quiza jams ocurra se llama evento nulo, y se representa con el simbolo ¢. Por tanto, 4 7 A* = ¢, La mayoria de los eventos poseen disparidad es entre 0 y | 128 Copitulo 6 Probabilidad Con la definicién frecuentista de probabilidad de un evento 4, podemos calcular direc- tamente la probabilidad del evento complementario 4°, Si un experimento se repite m veces ‘en practicamente las mismas condiciones y el evento A ocurre m veces, el evento 4°, 0 no , debe ocurrir n — m veces. Por tanto, para un 7 grande, P(A). La probabilidad de que un recién nacido no sobreviva a su primer affo de vida es de 1 menos la probabilidad de que lo haga; es decir, 1 ~ 0.99149 = .00851. Se dice que dos eventos y B que no pueden ocurrir de manera simultinea son mutua- ‘mente excluyentes 0 disjuntos. Si A es el evento de que el peso de un recign nacido se encuen- tra debajo de 2000 gramos y B el evento de que se encuentre entre 2000 y 2499 gramos, por ejemplo, los eventos 4 y B son mutuamente excluyentes. Un vardn no puede encontrarse en ambos grupos de pesos al mismo tiempo. Por definicién, 4 7 B= @ y P(A 7 B)= O. En la fi- ‘gura 6.2, los circulos que no se superponen representan eventos mutuamente excluyentes. Cuando dos eventos son mutuamente excluyentes, la propiedad aditiva de la probabi- lidad indica que la probabilidad de que cualquiera de los dos eventos ocurra es igual a la probabilidad de los eventos individuales; es decir, P(AUB)= P(A) + PCB). Supongamos que sabemos que la disparidad de que el peso de un recién nacido se encuentre debajo de los 2000 gramos es de 0.025 y que la disparidad de que se encuentre entre 2000 y 2499 gramos es de 0.043. La probabilidad de que cualquiera de estos dos eventos ocurra, 0, andlogamente, la probabilidad de que el varén pese menos de 2500 gramos, es de P (AUB) = 0.025 + 0.043 = 0.068, FIGURA 6.2 Representacién con diogramas de Venn de dos eventos mutvamente excluyentes. 6.2 Disparidad condicional 129 La propiedad aditiva de la probabilidad puede extenderse al caso de tres 0 mas eventos mu- tuamente excluyentes. Si A), A,.... yA, Son n eventos tales que A, 0 A, = ¢, 4, 4, = 0, 6 y asi sucesivamente para todas las posibles parejas, entonces P(A, UA, UU A,) = PCA) + P(A,) + * + PLA, Si los eventos 4 y B no son mutuamente excluyentes, como en el caso de la figura 6.1 5, la propiedad aditiva de la probabilidad no tiene sentido. Sea A el evento de que el peso de un recién nacido se encuentre debajo de los 2000 gramos y B el evento de que se encuentre deba- jo de los 2500 gramos, Puesto que los dos sucesos pueden ocurrir al mismo tiempo —conside- re el caso de un varén cuyo peso al nacer sea de 1850 gramos— hay alguna area en la cual se superponen. Si sencillamente sumaramos las probabilidades de los sucesos individuales, esta ‘rea de superposicién se contaria dos veces. Por tanto, cuando dos sucesos no son mutuamen- te excluyentes, la probabilidad de que cualquiera de los sucesos ocurra es igual a la suma de las probabilidades individuales menos la probabilidad de su interseccién: P(A UB) = P(A) + PB) - P(A 9B). ‘A menudo nos interesa determinar la probabilidad de que un evento B ocurra, cuando cono- cemos el resultado de otro evento A. ,Acaso el acontecimiento previo de A hace que la dis- paridad de B cambie? Por ejemplo, en lugar de determinar la probabilidad de que una persona sobreviva hasta la edad de 65 afios, podriamos calcular la probabilidad de que el individuo so- breviva los siguientes cinco afios, dado que ha alcanzado la edad de 60 aiios. En este caso, nos topamos con una probabilidad condicional, La notacién P(B| A) se emplea para repre- sentar la probabilidad de que el evento B ocurra puesto que el evento A ya ha ocurrido. La propiedad multiplicativa de la probabilidad indica que la probabilidad de que dos eventos 4 y B ocurran, es igual a la probabilidad de A multiplicada por la probabilidad de B puesto que A ya ocurrid, Esto se puede expresar de la siguiente manera: P(A 9 B)= PCA) PB| 4). Y como nombrar A a uno de los eventos y B al otro constituye una decisién arbitraria, tam- bign es posible escribir P(A 9 B) = P(B) P(A| 8). Al dividir ambos miembros de la primera ecuacién entre P(4), obtenemos la formula de una disparidad condicional: PAO) P(A) Pe A) dado que P(A) # 0. Asimismo, tenemos que P(4 |B) = "EE. dado que P(B) #0. Ne —————————— 130 Capitulo 6 Probabilidad Si A es el evento de que un individuo se encuentra vivo a la edad de 60 afios, y B repre- senta el evento de que sobrevive hasta los 65 afios de edad, A > B es el evento de que el indi- viduo se encuentre vivo a los 60 y también a los 65 afios de edad. Es obvio que si alguien se encuentra vivo a los 65 afios de edad debié estar vivo a los 60 también. Por tanto, A ™ B senci- Hamente es el evento de que el individuo sobrevive al menos hasta su cumpleafios niimero 65. De acuerdo con la tabla de vida de 1992 para la poblacién de Estados Unidos, P(A) = P(un individuo vive hasta cumplir los 60 afios de edad) — 85,993 100,000 = 0,85993. En otras palabras, el evento 4 ocurre 85,993 veces de un total de 100,000 intentos. Asimismo, P(4 7B) = PCun individuo vive hasta cumplir los 65 afios de edad) — 80,145 100,000 = 0.80145. Por tanto, P(B | A) = P(un individuo vive hasta los 65 afios de edad | el individuo vive hasta los 60 aos de edad) = P(AnB) P(A) 0.80145 0.85993, = 0.9320. Una forma equivalente de calcular esta probabilidad consistiria en comenzar con las £85,993 personas que se encuentran vivas a la edad de 60 aflos y notar que el evento de super- vivencia hasta la edad de 65 afios ocurre 80,145 veces en estos 85,993 intentos. De aqui que 80.145 85,993 = 0.9320. P(B| A) = Si una persona vive hasta cumplir 60 afios de edad, su probabilidad de supervivencia hasta los 65 afios de edad es mayor que lo que era en el momento de nacer. Cuando tratamos con dos eventos tales que el resultado de uno de ellos no influya en el hecho de que el otro suceda o no suceda, se dice que los eventos son independientes, Si A y B son eventos independientes, P(A|B) = P(A) P(B|A) = PCB) 6.3. Teorema de Bayes 131 En este caso particular, la propiedad multiplicativa de la probabilidad puede escribirse de la siguiente manera: P(A. 7B) = P(A) PCB). Es importante notar que los términos independiente y mutuamente excluyente no sig- nifican lo mismo, Si 4 y B son independientes y el evento A ocurre, el resultado de B no se verd afectado. El evento B podria ocurrir 0 no, y P(B|A) = P(B). No obstante, sid y B son mutuamente excluyentes y el evento 4 ocurre, el evento B no ocurre. Por definicién, P(B|A) = 0 El capitulo 4 incluyé una presentacién de datos recopilado en la National Health Interview Survey (Consulta Nacional de Salud en Estados Unidos) de 1980-1981 [2]. Los datos per- tenecian a los dafios al oido por lesiones suftidas por individuos de 17 afios de edad y ma- yores. Las 163,157 personas incluidas en el estudio se subdividieron en tres categorias ‘mutuamente excluyentes: los individuos empleados, los desempleados y los que no pertene- cen a la fuerza laboral. Condicién Jaboral Poblacién Datos Empleados 98,917 552 Desempleados 7462 21 Fuera de la fuerza laboral | $6,778 368 Total 163,157 947 Sea E, el evento de que un individuo incluido en el estudio se encuentre empleado ac- tualmente, £, el evento de que la persona se encuentre actualmente desempleado y E, el evento de que el individuo no pertenezca a la fuerza laboral. Si suponemos que estas canti- dades son suficientemente grandes para satisfacer la definicién frecuentista de probabilidad, a partir de los datos disponibles, encontramos entonces que 98,917 PED) = 763.187 = 0.6063, 7462. 163,157 P(E2) = = 0.0457, 132 Capitulo 6 Probobilidad Si S es el evento de que un individuo en el estudio se encuentre actualmente emplea- do, desempleado o fuera de la fuerza laboral, S=E,UE,UEy Debido a que las tres categorias son mutuamente excluyentes, puede aplicarse: la propiedad aditiva de la probabilidad: P(S) = P(E, UE, U = P(E,) + PEE,) + PE) = 0.6063 + 0.0457 + 0.3480 = 1.0000. Cuando las probabilidades de eventos mutuamente excluyentes suman 1, se dice que los eventos son exhaustivos; en este caso no hay mas resultados posibles. Por tanto, toda perso- na incluida en el estudio debe ubicarse dentro de uno de los tres grupos. Sea ahora H el evento de que un individuo tenga un dafio en el ofdo provocado por una lesién. En conjunto, 947 PUD = 163,157 = 0,0058. ‘Al observar cada subgrupo de condicién laboral por separado, P(H | £,) = P(un individuo tiene un dato en el oido | el individuo se encuentra empleado) $52 98,917 = 0.0056, P(H | E>) = P(un individuo tiene un daiio en el ofdo | el individuo se encuentra desempleado) 27 7462 = 0.0036, P(H | £3) = P(un individuo tiene un dafo en el oido | el individuo no pertenece a la fuerza laboral) _ 368 36,778 = 0.0065. 6.3 Teorema de Bayes 133 La probabilidad de dafios en el oido es menor entre los individuos desempleados y mayor en- tre los que no pertenecen a la fuerza laboral Observe que H, el evento de que un individuo sufra un dafio al ofdo por lesién, puede expresarse como la unién de tres eventos mutuamente excluyentes: E, > H, el evento de que un individuo se encuentre empleado y sufta una lesién al oido; E, 0 H, el evento de que el individuo se encuentre desempleado y sufra un dafio al ofdo; y E, > H, el evento de que el individuo no pertenezca a la fuerza de trabajo y sufra un daito al oido. Asi, H=(E,O HUE, OW) UE, OB). Todo el que padezea un dafio en el ofdo puede ubicarse en una y s6lo una de estas tres cate- gorias. Puesto que las categorias son mutuamente excluyentes, podemos aplicar la propiedad aditiva; por tanto, PCH) = P[(E, 0H) U (Ey 0-H) U (Ey 0 A) P(E, OH) + P(E, 0-H) + P(E, 0H). Aceste hecho se denomina a veces ley de la probabilidad total, Ahora, al aplicar la propiedad multiplicativa a cada término del miembro derecho de la ecuaciGn por separado e introduciéndolo en las probabilidades previamente calculadas, PCH) = P(E, 0-H) + P(E, 0) H) + P(E, 0-H) = PEE,) POLE.) + PCE,) PCH |E,) + PCE) POEs) = 0,0034 + 0.0002 + 0.0023 = 0.0059. Estos cilculos se resumen en la siguiente tabla, donde i, el subindice del evento £, toma va- lores de 1 a3 Evento E; P(E) PH IE) P(E)P(H|E) Ey 0.6063 0.0056 0.0034 Ey 0.0487 0.0036 0.0002 Ey 0.3480 0.0065 0.0023 PH) 0.0059 Si ignoramos el error de redondeo en estos cdlculos, el valor de 0.0059 es el numero que ori- ginalmente obtuvimos como la probabilidad de que un individuo sufra un daito al oid por lesi6n, _ 947 163,157 = 0.0058 PH) 134 Capitulo 6 Probabilided El método més complejo de célculo, que utiliza la expresién P(E) = P(E,) P(H|E,) + PEE) P(E) + PE) PCBs), puede resultar util cuando sea imposible calcular P/H) directamente, Supongamos que ahora cambiamos nuestra perspectiva e intentamos encontrar P(E, |), la disparidad de que un individuo se encuentre empleado dado que éste sufre un da- fio al oido. La propiedad multiplicativa dela disparidad afirma que PCE, 0H) = PH) PEA; de aqui que P(E, | H) = PCH) ‘Al aplicar la propiedad multiplicativa al numerador del miembro derecho de la ecuacién, te- nemos Si utilizamos la identidad obtenida anteriormente, PCH) = P(E,) PUH|E,) + P(E) POH |E,) + P(E) POLE), Jo que da como resultado vy= ———_—_PevPeley) PEL H)= P(E, PCH | Ey) + PEs) PH |) + PEs) PUT | Es)" Esta expresién sélo en apariencia compleja, se conoce como teorema de Bayes. Al sustituir los valores numéricos de todas las probabilidades, La probabilidad de que un individuo se encuentre empleado y haya sufrido un dafio al ofde por lesidn es de aproximadamente 0.538. En este ejemplo particular, el resultado puede con- frontarse directamente con los datos originales. Entre las 947 personas con dafios al oido, 552 se encuentran empleadas. Por tanto, . 352 PEW) = 945 = 0.583. 6.4 Pruebas de diagnéstico 135 El teorema de Bayes no se restringe a situaciones en que los individuos caen en uno de estos tres diferentes subgrupos. Si 4,, A... 4, Son m eventos mutuamente excluyentes y ex- haustivos tales que P(4, UA, UU A,) = P(A) + PCA) + + PCA,) =1, el teorema de Bayes afirma que malae P(A) PB 1A) 1" PAYPBTA) ++ P(,)PBTA,) para cada i, 1

You might also like