You are on page 1of 18

Capítulo I

I Introducción a la probabilidad

1.1. MODELOS DETERMINISTICOS VS. MODELOS ESTADISTICOS

Aun reconociendo la idea como simplista, podemos entender la ciencia como la forma de
obtener modelos del comportamiento de la naturaleza a fin de comprenderla, modificarla, adaptarla a
las necesidades humanas.
La Matemática es para algunas ramas de la ciencia la herramienta básica. La Física, por
ejemplo, ha sabido aprovecharla de tal manera que muchas veces se la clasifica erróneamente como
ciencia exacta.
Lo cierto es que en muchos modelos de la Física, por ejemplo en cinemática, las previsiones
concuerdan con “adecuada precisión” con los resultados de la experiencia. Pero, ¿qué es “adecuada
precisión”? Es evidente que esto es relativo.
A título de ejemplo: en la caída libre, la fórmula:

1 2
d= gt (distancia, gravedad, tiempo)
2
modeliza este hecho.
Si la aplicáramos a una experiencia cualquiera, veríamos que la distancia medida no concuerda
con el resultado de la fórmula.
Se podría afirmar que el modelo debe “mejorarse” incluyendo por ejemplo: el efecto de la forma
del cuerpo, el rozamiento del aire, el viento, el cambio de gravedad al caer, etc.
Supuesto que este mejoramiento se puede realizar, ¿coincidirán ahora la medición y el cálculo?
Seguramente en e ste caso tampoco coincidirán con exactitud extrema. Solamente si la dife -
rencia entre ambos valores estuviera dentro de la precisión requerida, podríamos decir que el odelo
sirve o “es bueno”, y con ello nos daríamos por satisfechos.
Habremos encontrado e n este caso un modelo determinístico que satisface nuestros
requerimientos.
Pero, ¿qué sucede cuando esto no ocurre? Imaginemos la experiencia consistente en arrojar
una moneda al aire y ver si cae cara o cruz. ¿Podríamos armar el modelo de la trayectoria de la
moneda?
Necesitaríamos dos condiciones:
1) tener “ciencia” suficiente para la elaboración precisa del modelo: el movimiento no es
uniforme, hay efecto de rozamiento con el aire que es muy difícil de modelizar, hay rebote
semielástico contra el piso donde cae, etc. Nótese que es difícil modelizar atemáticamente el
comportamiento humano o animal, el movimiento de fluidos, el comportamiento económico, etc.
2) tener todos los datos para la aplicación del mismo: la energía inicial, la dirección, la masa, la
velocidad, el punto de aplicación de la fuerza, el tiempo de aplicación, la densidad del aire, el
movimiento del aire, los coeficientes de elasticidad, la forma, etc.
Cumplidas estas condiciones, seguramente podríamos prever la trayectoria de la moned a y
determinar así, sin lugar a dudas, la posición final en el momento de su detención (cara o cruz).

1

sin consid erar como resultado la experiencia anterior. Ud. podemos definir como espacio muestral el conjunto E = {cara. ¿Aceptaría Ud. este concepto juega un papel importante en la comprensión de la esta- dística matemática. podemos plantearnos cuáles son los resultado esperables de un experimento. para distintos experimentos: 2 . Pues bien. cobrar $800 si sacara poker al arrojar una vez 5 dados (sacar cuatro nú eros iguales de los cinco) y pagar 1 si esto no ocurriera? Aquí la cosa no es tan intuitiva y cualquier decisión no elaborada dejaría dudas. sin importar la experiencia física en sí.Estimación Bayesiana Entendamos lo difícil (o a veces imposible) que suele ser modelizar una realidad con precisión. por una razón o por otra el resultado será impredecible con certeza absoluta. o mejor dicho. a nuestras necesidades. jugar con una moneda y pagar 2 si saliera cara y cobrar 1 si salie ra cruz? Me imagino que no (a menos que tenga una enfermiza necesidad de juego). a menos que hayamos considerado útil hacer figurar el resultado “pérdida” en el espacio muestral. ¿Y para qué serviría entonces el odelo? Para tomar decisiones. Nos falta información. Ejemplos de espacios muestrales. Recuerde entonces que el espacio muestral es definido arbitrariamente. en la experiencia consistente en arrojar una moneda y observar la posición con que se detiene. ¿Qué hacer si no podemos prever a través de un modelo determinístico de qué manera va a caer una moneda arrojada al aire? Podemos construir un modelo estadístico. pero no siempre éste es previsible con certeza o precisión adecuadas. rotura de la moneda u otros? La respuesta correcta es: Depende: el espacio muestral es arbitrario. Para ello es que debemos aprender a armar modelos estadísticos y el primer paso es aprender qué es un espacio muestral. A pesar de esta imposibilidad de predicción: SI. armado su modelo estadístico que le hace tomar esta decisión. no será más que eso: armar modelos para el correcto análisis de la situación y la toma de decisiones acorde. cruz} . lo definiremos a nuestro antojo. 1. en este caso el cálculo de probabilidades. Intuitivamente ya tiene Ud. ¿Obtendremos con ello una predicción del resultado de la experiencia? Por supuesto que no. Este conjunto de resultados lo llamamos espacio muestral. pérdida. Cualquier resultado de la experiencia que no forma parte de nuestro espacio muestral sería como considerar no efectuada la misma. resolverá intuitivamente: ¿Aceptaría Ud. Por ejemplo.2. ya sabe de las probabilida des de cada resultado y sobre la base de ese modelo intuye que no le resultaría un juego ventajoso. ¿Es este espacio muestral completo? ¿No deberíamos incluir los resultados: canto. para analizar la situación con una medida cuantificada de la información disponible. por ahora la estadística. En general no cumplimos la segunda condición de conocer lo s datos iniciales. Veamos un ejemplo simple que Ud. ¿Qué haríamos si al arrojar la moneda ésta se pierde? Pues arrojaríamos otra. EL ESPACIO MUESTRAL Como ya dijimos: toda experiencia lleva a la obtención de un resultado. por lo tanto.

registrados es mayor a 2”. Capítulo I a) Experimento: observar si un día llueve o no llueve. c) Experimento: Arrojar 5 dados. 3 ases. suceso es un conjunto de resultados. E = {llueve. a esto se lo llama partición. USO DE DIAGRAMAS DE VENN Resulta conveniente durante el aprendizaje el uso de diagramas de Venn.1. oros.2. 1 as. 4 ases.2. Por ejemplo. con un gran r ecinto que simboliza el espacio muestral y subconjuntos que indican resultados y sucesos. Recuérdese que los resultados son disjuntos entre sí y la unión de todos los resultados genera el espacio muestral. definiendo día de lluvia: “el día en que la cantidad de mm. podríamos haber definido muchos otros espacios muestrales diferentes. “negro el 22”. no llueve} Nótese que en este caso debe definirse correctamente qué sig nifica el resultado “lluvia”. “par”. b) Experimento: extraer una carta de un mazo de cartas españolas.2. etc. Podremos definir el espacio muestral de varias formas según el objetivo de cálculo. O sea. 2 ases. son sucesos: “primer docena”. por ejemplo : E1 = {cada una de las cuarenta cartas} E2 = {espadas. sin dejar ambigüedades. 5 ases} Otra vez. 1. Ejemplo: en un espacio muestral donde las 37 casillas (numeradas del 0 al 36) de la ruleta son los 37 resultados. Algunos autores usan los términos evento o acontecimiento para nombrar lo que aquí llamamos suceso. “rojo”. copas} E3 = {as de espadas. E = {0 ases. SUCESOS Cualquier subconjunto de un espacio muestral es un suceso. bastos. 1. no as de espadas} Observe entonces que con esta experiencia podemos definir gran cantidad de espac ios muestrales a nuestra voluntad o interés. 3 .

Para el color de cabello.. Podemos entonces identificar los sucesos: “Mujer rubia” = {M R} “Hombre de 25 años” = {H 25} 4 . podemos definir los siguientes sucesos: {M} = “Mujer” {H} = “Hombre” {21}. podemos seguir los siguientes pasos: 21 22 23 24 25 26 27 28 E E E C R C R H H H M M M En cada paso dividimos el espacio muestral según cada clasificación disjunta que hemos descrito: Para el sexo. .. a “mujer”. {22}. y el suceso “rubio” estará den tro de este círculo. {23}. hacemos lo mismo: dividimos en dos el espacio. para graficar el espacio muestral.. Finalmente dividimos el espacio en 8 dibujando 7 líneas verticales para llegar al diagrama de la derecha.. dibujando una línea horizontal.. Aquí hemos hecho un círculo. sexo y color de cabello de un grupo de personas (de las cuales sabemos que sus edades están entre 21 y 28 años y sólo hay rubios y castaños).Estimación Bayesiana Ri Resultado r sub i E R1 Rj Resultado r sub j R2 ∅ Conjunto vacío Ri E Espacio muestral Entonces: Rj Ri Rj = ∅ para i ≠ j i =n Ri = E  Rn i =1 Ejemplo: sea una experiencia consistente en observar la edad. y “castaño” afuera.. {28} = “i años de edad” {R} = “Rubio” {C} = “Castaño” Entonces. Los resultados que están arriba de la línea corresponden a “hombre”. dividimos el espacio en dos. . teniendo en cuenta que esta nueva división también debe particionar en dos a los resultados ya existentes (“hombre” y “mujer”). y los que están debajo. {i}.

3.1.. Haremos valer los s iguientes axiomas (recuerde que la estadística es matemática. Si una persona debe apostar a sa car un rey de un mazo de barajas cambiará su apuesta (cambiará su probabilidad) bajo información de que la carta en cuestión es una figura. Distintos observadores con distinta información “medirán” distinta probabilidad para un mismo resultado. Siendo que: 5 . Capítulo I “Mujer rubia de 25 años” = {M R 25} “Persona de 25 años o menor” = {21  22  . No es una medida de la naturaleza como el peso o la dimensión.3.  25} “Menor de 25 años” = {21  22  23  24} “Mujer o mayor de 25” = {M  > 25} “Hombre rubio o mujer castaña” = { {H R}  {M C} } 1. su probabilidad respecto al resultado de una carrera es totalmente distinta a la probabilidad del que sólo sabe que los caballos tienen cuatro patas. Por ejemplo. LA PROBABILIDAD La probabilidad es el número de la estadística. Debemos considerar la probabilidad como una medida de la información que ten emos respecto de los resultados definidos en el espacio muestral.. Es importante observar que la probabilidad depende entonces del observador y no de la experiencia en sí misma. 1. para un experto en caballos de carrera que conoce todos los datos y antecedentes de los competidores. La probabilidad es una medida de la información. La asignación de probabilidades en un espacio muestral refleja cómo es la información que disponemos de esa experiencia. es una ciencia formal). Abreviaremos con la letra P el término probabilidad toda vez que no surjan dudas de su significado. LA MEDIDA DE LA PROBABILIDAD Mediremos la probabilidad con un número real.

2. Por ejemplo. su intersección es el conjunto vacío). Tercer axioma P(A B) = P(A) + P(B) ⇔ A  B=∅ (La P de la unión de dos sucesos es igual a la suma de las P respectivas si. Segunda: probabilidad del suceso complemento o negación Si A es el complemento de A (también llamado no A) implica que (A A = E) y (A  A = ∅) . o sea el 20%.2 pero atención. no podrá asignarse P a sucesos no considerados en el espacio muestral). así 20% equivale a 0. para n = 3 sucesos: P(A B C) = P(A) + P(B) + P(C) – P(A  B) – P(A  C) – P(B  C) + P(A  B  C) 6 . mientras que decir que la probabilidad de que una pieza sea defectuosa (en la muestra de 15) es el 20%. y solo si. hay que diferenciar cuando hablamos de un 20% de defectuosas como cantidad cierta de cuando representa la probabilidad individual de defectuosa. Segundo axioma P(E) = 1 (La P del espacio muestral es 1. podemos hablar de 15 piezas de las cuales 3 son defectuosas (cant idad cierta). Entonces resulta: P ( A ) = 1 − P ( A) Tercera: probabilidad de la unión (lógicamente no es el único desarrollo posible) P(A B) = P(A) + P(B) – P(A  B) Generalizando para n sucesos: k =n j =n j = n −1 i=n i = n −1 i = n− 2 i=n P( i =1 Ai ) = ∑ P( A ) − ∑ P( A i =1 i i =1 i  Aj ) + ∑ P( A i =1 i  Aj  Ak ) +  + (−1) n −1 P ( A1  A2   An ) j = i +1 j = i +1 k = j +1 así. puede implicar (con diferente probabilidad) desde tener ninguna hasta tener 15 defectuosas.Estimación Bayesiana A. CONSECUENCIAS INMEDIATAS DE LOS AXIOMA Primera: la probabilidad de un suceso es mayor o igual a 0 y menor o igual a 1: 0 ≤ P(A) ≤ 1 Note que es frecuente expresar una probabilidad como un porcentaje.3. 1. B identifican sucesos P(A) probabilidad del suceso A E el espacio muestral (conjunto de todos los resultados) Tomaremos como: Primer axioma P(A) ≥ 0 (La P de un suceso es un número mayor o igual a 0).

Esta fórmula es llamada definición clásica de probabilidad (aunque no debe ser considerada una definición) por cuanto ya era utilizada por los iniciadores del cálculo de probabilidades (Lapl ace. Ejemplo: si quisiéramos calcular las probabilidades de los resultados de la experiencia de arrojar dos monedas. Capítulo I 1. es correcto. lo felicitamos.3.. ha elegido el segundo esquema. ¿Acaso el espacio muestral no era arbitrario? Lo podemos definir a nuestro antojo. es correcto. = P(Ri ) = . Por definición de suceso (conjunto de c resultados).. también lo felicitamos. no pueda distinguir las monedas. Aunque Ud.).. En cuanto a las probabilidades ya no es así: “sabemos” que sacar una cara y una cruz pu ede darse de dos formas. será: c P ( A) = n donde c es la cantidad de resultados que forman el suceso y n la cantidad total de resultados equiprobables deinidos en E. n Observe que en última instancia la equiprobabilidad es un problema de información donde equiprobable es no tener ninguna información de referencia con respecto a alguno de ellos.3. Si Ud.? E1 E2 Resultado Probabilidad Resultado Probabilidad CC 1/3 CC 1/4 CyZ 1/3 ZC 1/4 ZZ 1/3 CZ 1/4 ZZ 1/4 En cuanto a la definición de espacio muestral: Si Ud. = P(Rn) (equiprobabilidad) n ∑ P( R ) = 1 i =1 i por segundo y tercer axioma Por este sistema de ecuaciones queda que la probabilidad asignada a cada resultado es 1 P ( Ri ) = siendo n la cantidad de resultados definidos en el espacio muestral. etc. así que 7 . los Bernoulli.. ha elegido el primer esquema. éstas son “distintas”. entonces podemos poner: P(R1) = P(R2) = P(R3) = . CALCULO DE PROBABILIDADES EN ESPACIOS DE RESULTADOS EQUIPROBABLES (definición clásica) Si un espacio está definido de tal manera que las probabilidades de cada resultado son iguales (hay equiprobabilidad). ¿cómo debería ser definido el espacio muestral? Definamos: CC sacar 2 caras CyZ sacar una cara y una cruz de alguna forma ZZ sacar 2 cruces ZC sacar una cara en una moneda y cruz en la otra CZ sacar una cruz y una cara en posición invertida a la anterior ¿Por cuál de estos dos espacios muestrales optaría Ud.

la P de aprobar el próximo examen de la materia? ¿Es para Ud. aunque en el mazo queden 39. con tal cl ima. Segunda: “a sentimiento” (o probabilidad subjetiva) Cuando “sabemos” que el espacio muestral no e equiprobable y “tenemos información” respecto de los resultados. La probabilidad correcta para el primero será: 1 1 1 P (CyZ ) = P(CZ ZC ) = P (CZ ) + P (ZC ) = + = 4 4 2 Verifiquemos ahora si Ud. no debemos despreciar el asignar probabilidades “a sentimiento”. Esta técnica se utiliza frecuentemente y con éxito más de lo que Ud. Hemos agregado como anexo I una síntesis de cálculo combinatorio para quien necesite un repaso del mismo. con tal árbitro. ha comprendido correctamente: Ud. ¿Cuál es la probabilidad de que salga as? ¿Cuál es el espacio muestral? Pues la P sigue siendo 1/6. no tiene información que haga diferenciar los resultados del espacio muestral.4. puesto que Ud. Suponga que le informo que tengo un dado absolutamente cargado (siempre sale la misma cara). Otra vez: si saco una carta de un mazo y yo la observo. ya sabe que la probabilidad de que salga “as” en un dado normal es 1/6. equiprobable aprobar y no aprobar? ¿Cuántas veces preguntamos “al que sabe” qué piensa de lo que puede ocurrir? En estos casos el “sentimiento” es insustituible. que seguirá formado por cada una de las caras del dado. Otra cosa sería si le dejaran recibir información del resultado de un primer tiro. ASIGNACION DE PROBABILIDADES EN UN ESPACIO MUESTRAL Existen tres únicas formas de asignar probabilidades a los resultados de un espacio muestral (o sea.Estimación Bayesiana habrá dos alternativas o formas de sacar una cara y una cruz (cada una de ellas tan probable co o sacar dos caras o dos cruces). que la información modifica la probabilidad. 1. las probabilidades correctas son las del segundo esquema. Pero para mí. contra tal otro. y derivaciones por formulaciones lógicas. será 9/39 si hubiera observado espadas y 10/39 si no hubiese sido espadas.? Sigue siendo 1/4. en tal cancha. si quisiéramos medir la P de que gane tal equipo de fútbol del cual “sabemos” que juega con t ales jugadores. ¿cuál es la P de que una segunda carta sea espadas para Ud. puede manejar correctamente las dos primeras. ¿Cuál es para Ud. que observé la primera carta. 8 . etc. después de tal campaña. los datos de partida de un modelo). n En estos casos de espacios equiprobables es necesario el manejo del cálculo combinatorio. Hasta este momento Ud. a saber: Primera: bajo condición de equiprobabilidad. Su espacio muestral está formado por cuarenta resultados equiprobables (cualquiera de las cuarenta cartas).. como forma de “contar “ los resultados del espacio muestral y/o de los sucesos que hayamos de inido. Luego. Por eje mplo. es más representativo un número “a sentimiento” que asignarle una P(ganar) = 1/3 por equiprobabilidad (que equivaldría al desconocimiento total). Ya ve Ud. 1 Aplicación de la fórmula clásica P ( Ri ) = . se imagina.

Ri . B. Esta forma. + P(A  Rn ) porque los resultados son disjuntos y por el tercer axioma.. será estudiada en el capítulo de interferencia estadística.20. FORMULA DE LA PROBABILIDAD TOTAL o de la descomposición en partes Supongamos un espacio muestral definido por n resultados Ri . definamos además un resultado A.5. 0. al elemento A. 9 ... {B}.. La P de que esto ocurra para cada uno de ellos es 0. Identificaremos con {A}. + P(A  Rn ) Sintéticamente: n P ( A) = ∑ P( A i =1  Ri ) FORMULA DE LA PROBABILIDAD TOTAL Vea que lo único que estamos diciendo es que el suceso A está formado por la unión de sus n partes y que su probabilidad se puede calcular como suma de las P de sus partes.... {C} los sucesos: encontrar. + P(A  Ri ) + . la P de encontrar B pero no C es de 0.. + P(A  Ri ) + . 1.27 y la P de encontrar solamente A es el 0... pero no crea que necesariamente con ella descarta las formas anteriores.. B y C que luego de un cierto periodo pueden encontrarse desgastados. Se sabe además que la P de encontrar A y B desgastadas es de 0. Ri . Su diagrama de Venn será: A R1 R1  A R2  A R2 Ri  A Ri Rn A Rn  Por lo mismo podemos escribir esta forma de uso frecuente: { A} = { A B} ⇔ P( A) = P ( A B) + P( A   B} {A    B) Ejemplo de resolución: En un equipo existen tres elementos A.22. Rn ) ] = = P(A  R1) + P(A  R2) + . Por ejemplo: Ri = pieza producida por máquina i (luego hay n máquinas) A = pieza defectuosa Recuerde el espacio muestral E = (R1 R2 .. la P de encontrar solamente A y B es el 0. P(A) = P(A  R1) + P(A  R2) + . Capítulo I Tercera: por anejo estadístico de la información... Rn ) Podemos hacer: P(A) = P(A  E) = P[A  (R1 R2 .47.45 y 0...12. En ciertos casos llegan a utilizarse los tres métodos en un mismo modelo. evidentemente muy utilizada. respectivamente. C con desgaste.40 respectivamente.

P( A C ) = P ( A) − P ( A B C ) − P( A B C ) = 0.47 P ( B) = 0.47 + 0.45 − 0.20 = 0.87 h) La P de no encontrar ele entos gastados.40 − 0.08 f) La P de encontrar C solamente.22 − 0.12 P( B C ) = 0. C ) = 1 − P( A C ) = 1 − 0.05 = 0. C )] =   P[( A B C) (A B C) (A B = P ( A B C ) + P ( B ) − P ( A B ) − P( A B C ) + P( A B C) = = 0.18 + 0.17 g) La P de encontrar alguna quemada (o sea. P ( A B C ) = P( A B ) − P( A B C ) = 0.18 − 0.27 P( A B C ) = 0.12 − 0. P (C A B ) = P (C ) − P ( B C ) − P ( A C B ) = 0. como lo es “encontrarlo desgastado”.45 P (C ) = 0. Su diagrama representativo es: A B C Los datos son: P ( A) = 0. TOTAL) b) La P de encontrar B y C con desgaste.87 = 0.18 − 0. pero éste de por sí no es un suceso.22 − 0. P( A C B) = P ( A C ) − P( A C B) = 0.10 = 0.18 c) La P de encontrar A y C. una o más de una o por lo menos una).Estimación Bayesiana Suele ser un error frecuente llamar como suceso a “elemento A“. no es algo que puede “ocurrir” en la experiencia.17 = 0.40 − 0.20 + 0. C ) = P ( A) + P ( B ) + P (C ) − P ( A B ) − P( A C ) − P ( B C ) + P( A C) =   P( A B B = 0.10 = 0.10 = 0.40 P( A B ) = 0.10 (aplicación de P.22 − 0. 47 − 0.45 + 0.12 = 0.20 Calculamos ahora: a) La P de encontrar las tres desgastadas.27 = 0.52 10 .15 − 0.05 e) La P de encontrar solamente B y C.22 P( A B C ) = 0.13   P( A B B i) La P de encontrar sólo un elemento gastado.15 − 0.08 + 0. P( B C ) = P( B) − P( B C ) = 0. P( B C A) = P( B C ) − P ( B C A) = 0.45 − 0.15 d) La P de encontrar A y C pero no B.

11 .04 es el porcentaje de piezas defectuosas de M2 referidas al total.20 al porcentaje de defectuosas dentro de las producidas por M1. pero ya es de uso generalizado la expresión P(D/ M1).16 Recuerde una aclaración anterior. el 16% de piezas defectuosas. poniendo el espacio como subíndice. P(D M2) = 0. Si consideramos el universo como el de todas las piezas. PROBABILIDAD CONDICIONAL Toda probabilidad está referida a un determinado y previamente definido espacio muestral. Y escribiremos P(D/ M1) = 0. si nuestro modelo se hubiera circunscripto en las piezas de la máquina 1 sería redundante escribirlo así y simplemente escribiríamos P(D). Resulta claro que habrá que diferenciar la forma de escribir porcentaje de defectuosas de M1. por lo que (teóricamente al menos) puedo llegar a tener desde ninguna hasta las 1000 defectuosas. y queremos expresar el porcentaje de defectuosas sobre el total de M1. P(D) = 0.16 es el porcentaje de defectuosas en el total de la producción. Estas probabilidades serán llamadas condicionales y observe que es un término relativo a la definición del espacio muestral general. Capítulo I 1.10 ⋅ 0. o sea. y a falta de indicación en contrario. de porcentaje de defectuosas en el total de la producción. P(M2/ D) al porcentaje de piezas producidas por M2 en el total de defectuosas. no implica que de 1000 piezas tengo exactamente 160 sino que es la probabilidad de que cualquiera de las 1000 piezas sea defectuosa. puesto q ue en este caso P(D / M1) = P(D). Posiblemente hubiese sido más claro usar como nomenclatura PM 1 ( D) . mostrando de alguna forma cuál es el 100% o espacio muestral al cual se refiere esa probabilidad.40 = 0.40 = 0. y del 10% si es producida por la máquina M2. Por ejemplo. se sabe que la probabilidad de que una pieza sea defectuosa si es producida por la máquina M1 es del 20%.20 ⋅ 0. en un modelo estadístico y salvo aclaración en contrario. de porcentaje de defectuosas de M2. tanto de M1 como de M2. el 10% y el 16% calculados anteriormente? En todo modelo habrá un solo gran espacio muestral. la probabilidad estará referida a ese espacio.12 es el porcentaje de piezas defectuosas producidas por M1 referidas al total. P(D M1) = 0. y el total de la producción está compuesto por un 60% de piezas (entre buenas y defectuosas) de M1 y el resto (40%) de M2.10 ⋅ 0. Se comprende que si quisiera calcular el porcentaje de piezas defectuosas en el total de la producción se debería calcular 0. P(D/ M2) = 0. En cambio. P(M1/ D) al porcentaje de piezas producidas por M1 en el total de defectuosas.16 ⋅ 0. pieza de máquina 2 ¿Cómo escribo el 20%. pieza de máquina 1 M2. se escribiría P(D / M1).60 + 0.60 = 0.10 al porcentaje de defectuosas dentro de las producidas por M2.6. En el planteo de un model o es frecuente necesitar o tener probabilidades referidas a espacios muestrales diferentes. Si defino los sucesos D: pieza defectuosa M1.

Nótese que P(M1/ D) + P(M2/ D) = P(M1  M2/ D) = 1 puesto que siempre {M1  M2} = E en cualquier subespacio. Calculamos ahora. nótese que “condicionar” es “saber”.20 = 20% P ( D) P( D ) 0. Tener la información que la pieza es de M1 hace que la “apuesta” sea con P de 0.16. por otra parte. sabiendo que la pieza es defectuosa.10. es el nuevo total. Si las probabilidades fueran proporcional es al área con los que simbolizamos los sucesos. o sea. ¿Cuál sería el espacio al que se refiere? La fórmula que relaciona entonces probabilidades condicionales con no condicionales es: P( A B) P ( A / B) = También usaremos P(A B) = P(A/ B) P(B) P( B) Es una definición pero que tiene su explicación implícita: es la proporción de una parte P(A B) dentro de otra P(B).Estimación Bayesiana Se podrá escribir P(A/ B C) o P(A/ B C). También será: P ( M 2 D) P ( D / M 2 ) P (M 2 ) 0. no es más que la fórmula de P total (ver pág. obsérvese que P(B/ B) = 1. Desde el punto de vista de la información. Aquí se ve nuevamente que la P depende de la información que uno posea. 9). mientras que si no tuviésemos tal información la P sería de 0. podríamos interpretar la probabilidad condicional P(A/ B) como la proporción que existe de A dentro de B: A E spacio M u estral B A B B Estar condicionado a B implica “olvidarse” de lo que está fuera de B. recordando que {D} = {D E} y {E} = {M1 M2}: P(D) = P(D E) = P(D M1) + P(D M2) = P(D/ M1) P(M1) + P(D/ M2) P(M2) fórmula que habíamos utilizado intuitivamente para calcular el 16% de defectuosas y que.12 P ( M 1 / D) = = = = 0.04 P (M 2 / D ) = = = = 0.80 = 80% P( D ) P( D ) 0. o también. Al saber que la pieza es de M2 la “apuesta” será con P de 0. dado que son P que pertenecen a espacios muestrales distintos. la P de que sea de M1 es el 80%. ambas definidas dentro de un todo (espacio muestral general).16 se lee: la P de que provenga de M1 una pieza defectuosa es el 80%. con dos o más  condicionamientos no tendría sentido. como si no existiera. 12 .20. P (M 1 D) P ( D / M 1 ) P (M 1 ) 0. o sea. Observe que nunca (salvo condiciones numéricas particulares) podrá aparecer en alguna fórmula de un modelo una suma o diferencia de probabilidades de diferente condicionamiento. pero nunca P(A/ B/ C). En cambio. es el nuevo espacio muestral.16 la probabilidad de que provenga de M2 una pieza defectuosa.

87 Una fórmula útil para desarrollar la intersección múltiple como producto de condicionales es: P(A B C) = P(A/ B C) P(B C) = P(A/ B C) P(B/ C) P(C) Nótese que. Clásica.25       P( A B C) P( A B C ) 0. 10 espadas en 40 cartas) 10 P( E1 ) = 40 Si sabemos E1 (que ya extrajimos una espada). Capítulo I Como ejemplo. 9: a) calculemos la P de encontrar A desgastado sabiendo que B lo está: P ( A B ) 0. hay diversas posibilidades de condicionar y desarrollar fórmulas equivalentes.10 P( A B / C ) = = = 0.25 P (C ) 0. luego: 9 P ( E 2 / E1 ) = 39 Con un razonamiento equivalente: 8 P ( E3 / E1  E2 ) = 38 La probabilidad buscada es: 10 9 8 P ( E3  E2  E1 ) = ⋅ ⋅ 40 39 38 13 .22 P( A B / A B C ) = = = = 0.22 P( B ) 0.18 d) la P de encontrar A y B sabiendo que hay por lo menos uno:   P[( A B ) ( A B C )] P( A B ) 0. retomemos el problema de los elementos que se desgastan de la pág. nos quedan 9 espadas y 39 cartas.45 b) la P de encontrar A y B sabiendo C: P[( A B) C] 0. B y C. por ej: P(A B C) = P(C/ A B) P(A/ B) P(B) Ejemplo: de un mazo de barajas españolas se extraen 3 cartas. siendo indistintos los sucesos A. Calcula r la probabilidad de sacar tres cartas de espadas sucesivamente (piense: ¿es necesario indicar que sea sucesivamente?). Definiremos: E1: sacar espada en la primera extracción E2: sacar espada en la segunda extracción E3: sacar espada en la tercera extracción Entonces la probabilidad pedida será: P(E1 E2 E3) = P(E3/ E1 E2) P(E2/ E1) P(E1) Aplicando equiprobabilidad (def.10 P( A / B C ) = = = 0.56 P( B C ) 0.40 c) la P de encontrar A sabiendo que están B y C: P ( A B C ) 0.22 P( A / B) = = = 0.

70 T juego al tenis P(T) = 0.Estimación Bayesiana pero podíamos haber desarrollado P(E3 E2 E1) = P(E1/ E2 E3) P(E2/ E3) P(E3) (formalmente es correcto) ¿Podemos hablar de una P(E3) siendo {E3} un suceso posterior en el tiempo a E1?. P(Ri ) es llamada “Probabilidad a priori” P(Ri / A) es llamada “Probabilidad a posteriori” Pero atención.60 T no juego P( T ) = 0. no es un concepto de antes y después temporal sino de “antes de información” y “después de información”. Aquí otra vez se ve el concepto de probabilidad como medida de la información. puedo no saber lo que ocurrió antes en el tiempo y evaluar lo que sé del suceso posterior. o de la P de que mi tío se esté afeitando en este momento o de la P de que el hombre pise el planeta Júpiter en el año 2020. Observe.7. o ¿P(E2/ E3) por la misma razón? Por supuesto que sí: la probabilidad es un problema de información. LA FORMULA DE BAYES Supongamos un espacio definido con n resultado Ri. podrá interesar el ordenamiento o secuencia en la que se producen los resultados y este ordenamiento podrá o no representar el tiempo en el modelo. 1. y su desarrollo escapa al objetivo de este libro. por otra parte. Muestra cómo se modifica la P de un resultado Ri bajo condición de “saber” A. se llama fórmula de Bayes. En cambio. que no es más que la aplicación de la definición de P condicional y la fórmula de P total. INDEPENDENCI Supongamos los siguientes sucesos y probabilidades: L día de lluvia P(L) = 0. Piense que puede hablar d e P de que Marco Polo haya visto al emperador de China un día 6 de septiembre. P ( Ri A) P( A / Ri ) P ( Ri ) P( A / Ri ) P ( Ri / A) = n = n = n P ( Ri ) ∑ P( R j =1 j A) ∑ P( R j =1 j A) ∑ P( A / R ) P( R ) j =1 j j Esto.8.40 14 . Cuando int erese el ordenamiento. luego P(E1) = 10/40. así el antes y el después temporal no interesan. 1. aunque es útil entender este concepto.30 L día de sol P( L ) = 0. estaremos en un capítulo de la estadística denominado “procesos aleatorios”. que no interesa saber que las extracciones son sucesivas: interesan los resultados del espacio muestral y la información sobre ellos y no la forma en que se obtienen. En los modelos estadísticos no interviene el tiempo que es una variable de la naturaleza. donde también se establece un suceso A.

P(T/ L) = 0. Situación 2: hay una intersección relativamente pequeña.12 0. P(T/ L) = 0 de que juegue al tenis si llueve P(L/ T) = 0 de que sea un día de lluvia si juego Nótese el gran cambio que se produce en la evaluación de las P en el caso de “saber”: Tenemos que la P de que un día se juegue al tenis (0. Situación 4: hay una intersección relativamente grande. salvo en la medida de las P condicionales que se hacen mayores a las no condicionadas (es como si a uno le gustara más jugar si hay lluvia).40 de que sea un día de lluvia si juego Este caso es equivalente al 2.30 P( L T ) P (T / L) = 0 0. Hay dependencia y fuerte. P(T/ L) = 0. Situación 5: hay inclusión de un suceso en otro. o sea. En este caso hay una gran dependencia entre los sucesos. tal es así que llegamos a la certeza con esa información (si juego al tenis.24 0.00 P ( L) P( L T ) P( L / T ) = 0 0.6) pasa a ser nula. Situación 3: será discutida por último.40 de que juegue al tenis si llueve P(L/ T) = 0. P(T/ L) = 0. Capítulo I y las siguientes 5 situaciones donde son válidas estas P y sólo cambian la P de la intersección P(L T) y por consiguiente las correspondientes P condicionales: L L L L L T T T T T Situació 1 2 3 4 5 disyunción dependencia independencia dependencia inclusión P(L  T) 0 0.50 P(T ) Situación 1: no hay intersección entre los sucesos (sucesos disjuntos).40 0. Tenemos que la P de que sea un día de lluvia también se anula al saber que se juega al tenis. sabiendo que llueve seguro que juego al tenis.60 0.30 0.18 0.80 1. aunque no como en el caso anterior.50 de que sea un día de lluvia si juego Este es el otro caso extremo en el que estaría mostrando una compulsiva necesidad de jugar en día de lluvia.80 de que juegue al tenis si llueve P(L/ T) = 0. Situación 3: (es la que más nos interesa discutir) es la situación de independencia.20 0. P(T/ L) = 1. seguro es un día de sol).00 de que juegue al tenis si llueve P(L/ T) = 0.20 de que sea un día de lluvia si juego En este caso también hay un cambio en las probabilidades. En este caso hay dependencia.60 = P(T) 15 .40 0.

que según dicen hace llover. de eso se ocupan las ciencias de la naturaleza. tenemos una P de ganar de 18 37 y 19 37 de perder. la física o aún la psicología. A la estadística no le interesa el porqué. simplemente eso es lo que se refleja en el cálculo y en las diferencias entre las P y no en una explicación de causa. como sería en este caso a firmar que soy capaz de “hacer llover” con sólo jugar al tenis. en este caso la meteorología. pero sí de información: si NO tenemos INFORMACION que nos haga cambiar la probabilidad de un suce so por el hecho de saber la ocurrencia del otro.) B = (llover hoy en Tokio) ¿Son independientes? Parecería que no. para calcular la P de ganar 2 veces en tres tiros (suceso A).Estimación Bayesiana P(L/ T) = 0. entonces: SON INDEPENDIENTES y sólo por eso. pero. G2. As. De alguna forma el saber que se está jugando implica saber que debe ser menos probable que sea en un día de lluvia. La estadística puede ayudar a orientar una ciencia que estudia la naturaleza hacia una explicación causal pero no a justificarla. por lo tanto los sucesos G1. Esta condición de independencia muestra cuán inútil es esperar que salga algunas veces color “negro” para jugar al “colorado”. la ruleta no “compensa” lo ocurrido en tiros anteriores. a nosotros no nos importa: nuevamente decimos que la estadística no se ocupa de las relaciones causa – efecto. Tampoco se modifica P(L) al saber que no se juega al tenis. En la no comprensión de este concepto se han elaborado muchas “mentiras estadísticas”. er do ¿Tenemos información suficiente para asegurar que. ya que depende de una decisión mía. Pero la estadística es lógica. O sea. se apiada de mí sabiendo que juego al tenis y cambia la situación meteorológica? ¿Es que hay algún fenómeno de la física o la meteorología que relacione mi juego de tenis con la lluvia? Nada de eso.30 ). tenemos: 16 . ¿por qué? ¿Porque la lluvia de Tokio no afecta a los choques en la esquina? ¿Afectaría la lluvia de Tokio los choques en otro lugar del mundo? ¿Quién puede afirmarlo o negarlo? De todas maneras. G3.efecto. cambie la P para el tercero? La respuesta es NO. es coherencia: decimos que de alguna forma las probabilidades miden la información que tiene el formulador del modelo. la información no modifica la probabilidad. Ejemplo: si jugamos a “color” en la ruleta. Pero. los sucesos ganar el primer tiro. si se ganó o perdió en el 1 o 2 tiro. G2 y G3 son independientes. la estadística no se ocupa de las relaciones causa . Por ejemplo. Ahora. Podrá haberlas o no.60 frente a P(L) = 0. el segundo y el tercero respectivamente. La definición de independencia puede darse como: A y B son sucesos independientes si. y sólo si: P(A / B) = P(A) ⇔ P(B / A) = P(B) ⇔ P(A B) = P(A) P(B) Preguntémonos ahora: puedo entender que cambie la P de jugar al tenis si llueve. porque “sabiendo que juego” aumenta la P de lluvia en el ejemplo de la situación 5 ( P(L/T) = 0. Identificaremos con G1. ¿por qué será que cambia la P de lluvia sabiendo que juego al tenis en los casos de NO independencia? ¿Es que San Pedro. Preguntémonos ahora si los sucesos: A = (producirse un choque el próximo Lunes en una esquina de Bs.30 = P(L) Significa que la información (c ondicionamiento) al saber que llueve no modifica la P(T). en la situación 2 el jugador tiene menos probabilidad de jugar si llueve P(T/L) que en un día cualquiera P(T).

aunque para algunos modelos será el factor ordenador de los resultados y el orden sí puede interesar.9. el tiempo no interviene en la estadística. La Probabilidad es una MEDIDA DE LA INFORMACION. siguiendo las reglas axiomáticas y lógicas) a los sucesos. las distinguiremos con la notación P(A/ B) (probabilidad del suceso A referido al B). llamado probabilidad. 17 . En todo modelo definiremos arbitrariamente a nuestro interés un espacio muestral que es el conjunto de los resultados considerados de nuestra experiencia a modelizar. La probabilidad está siempre referida a algún espacio muestral. crea modelos matemáticos de la realidad. SINTESIS La estadística es matemática aplicada y. La estadística no estudia causas . En ese caso estamos frente a un proceso aleatorio (o estocástico). aun un resultado es un suceso de un solo elemento. Llamamos suceso a cualquier subconjunto del espacio muestral. Cuando se utilicen probabilidades referidas a diferentes espacios muestrales. Los modelos estadísticos ayudan a entender y a tomar decisiones frente a una situación real. A cada resultado y coherentemente (o sea. Capítulo I P ( A) = P ( {G1   G2 G3 } {G1 G2 G3 } {G1 G2 G3 } ) por condición de independencia y disyunción: P(A) = P(G1) P(G2) [1 – P(G3)] + P(G1) [1 – P(G2)] P(G3) + [1 – P(G1)] P(G2) P(G3) Por condición de igualdad: P(G1) = P(G2) = P(G3) = p P(A) = 3 p2 (1 – p) 1. a lo sumo ay uda a las ciencias de la naturaleza a determinarlas. No siendo una ciencia de la naturaleza. Los diagramas de Venn representativos del espacio muestral son una buena forma de ayudarse a “ver” la modelización de una experiencia en los casos más elementales. les asignaremos un numero entre 0 y 1. estudia relaciones formales. como tal. su número es la Probabilidad.

FORMULAS UTILES a) Ninguna probabilidad puede ser negativa ó superior a 1.Estimación Bayesiana 1.10. y su generalización: P(A B C) = P(A/ B C) P(B/ C) P(C) g) Fórmula de Bayes: P( A / Ri ) P( Ri ) P ( Ri / A) = n ∑ P( A / R ) P( R ) i =1 i i h) Definición de independencia de sucesos: A y B independiente ⇔ P(A / B) = P(A) ⇔ P(B / A) = P(B) ⇔ P(A B) = P(A) P(B) 18 . y su generalización a n sucesos: B ) = P( A) + P( B) − P ( A  P( A B) d) Probabilidad total: n P ( A) = ∑ P( A i =1 Ri ) e) Definición de probabilidad condicional: P( A B ) P ( A / B) = P( B) f) Probabilidad de la intersección. 0 ≤ P ( A) ≤ 1 b) Probabilidad del complemento: P ( A) = 1 − P ( A) c) Probabilidad de la unión.