You are on page 1of 42
Parte I Estadistica descriptiva Capitulo 2 El tratamiento de los datos. Estadistica descriptiva [Es un enor capital dl teorizar antes de poscer datos. Insersiblemente uno ecmienza a alterar Jes hechas para encajates en Jas teorias, en hygar encajar las teorias en los hechos: Sherlock Holmes (A.C. Dayle), en Un esexindalo en Bohemia Resumen. Eh este capitulo aprenderemes métodas para resumir y desaibir conjuntes de datos a través de distintes tipos de tablas, gificos y medidas estarlisticess Palabras clave: datos cunntitatives, dates cualitativos, datos discrotos, datos contirmcs, distribucién de frecuencias, diggrama de barres, diagyama desectcres, histograma, media, mediana, moda, cuantiles, varianva, Spica, asimetria, datos atipicos. 2.1. Introduccién Obtenides a través de encuestes, expetimentos 0 cualquier otro conjunto de metas, las datos estadistices suelen ser tan mameroscs que resultan précticamente infitiles sino son resumidos de forma adecuadla, Para dllo la Estacistica utiliza tanto técnicas evéficas como mmétices algunas de las cuales describimos en este capitula, Podemes decir que existe uma dasificacién, un tanto artifical, de los dates, segjin s°refieran a ima poblacién tangible, en cuyo caso se conocenin todos Jos cas0s, 0 a una poblacién conceptual, en. cuyo caso silo se conecerd una muestra (aleatoria simple). Sin embanyp, esta chsificaciin no tiene ningiin eficto en lo rdativo alo que vamos a estudiar en este capitulo, 2.2. Tipos de datos Los dates (0 variables) pueden ser de dos tipas: cuantitatives y cualitativos. 19 Dpto de Estadéstion e LO. Universidad de Jaén Los datos cuantitativos son Jos que representan na cantidad reflejada en tna escala tmmézica, A su ver, pueden dasificarse como datos cuantitativos discretos si se refiaen al conteo de alguna caracteristica, 0 datos cuantitatives continuos si se refieen a na medida, Los datcs cualitativos 0 categéricos se refieren a caracteristicas de la poblacién que no pueden asociane: a cantidades con significado rmmérico, sino a caracteristicas que silo pueden chsificarse. ‘Bjemplo. Veamos algunos ejemplos de cada uno de estos tipas de variables: = En ejemplo del (aside de silico, la variable espesor es cnantitativa contima, = End ejemplo de los enjinetes, el didmetro de los cojineles es tna variable cuantitativa continua, = En el ejemplo de los niveles de plomo, se esté analizanelo si una mnxstra contiene niveles detect Les o no, Se trata, por tanto, de tna vatiable aulitativa con dos categpxias: sf contiene niveles detectales 0 no contiene niveles detectables. + Enel ejemplo de bs accidentes labarales, la variable mimero de aocidentes laborales es cuantitativa discreta, mientras que kas franjes horarias constituyen una variable cualitativa. 2.3. Métodos graficos y numéricos para describir datos cualitativos La forma més sencilla de describir de forma numérica una variable calitativa os determinar su distribucion de frecuencias. Por su parte, esta distribucign de frecuencias determina a su vez las representaciones prificas mis usuales, Supongames que tenemcs tma variable cualitativa, que toma ima sexie de posibles valores: (Categorias). F1 rmimeto de veoes que se da cada valor es la distribucién de frecuencias de la variable, Si en vez de dar a ‘mero de veces nos fijamos en la proporcién de veces, tencmas la distribucin de frecuencias relativas Las representaciones gpificas mis usuales sen los diagtames de banas y los diagrams de sectores. Tos diagramas de barras son una representacién de cada tina de las categpries de la variable mediante una barra colocada solte d eje X y cuya altuna sea la fiecuencia ola frecuencia relativa de dichas categpxias, Tos diagramas de sectares son cinciles dividides en tantos sectores como categgrias, sectores cuyo éngnlo debe ser proporcional a la frecuencia de carla categpxia, 2 Prof. Dr. Antonio José Siéez Castilio Apuntes de Estadistica para Ingenieros Cateerria Ejemplo. Tomames como poblacién los 98 reactores micleares: ms grandes en todo el rmmdo. Nos fijamcs en la variable 0 dato referente al pais dende estén localizados. Les datos serian io age gn, gen, en Fra sey Pin sch iy Benin Pane rn) Bsc Fnac nn Pres [Alena Aleman torn Fey psn Jpn Spin Sy Spy Spin ein Jpn din Jay Spiny Sc Siy Sc, Las distribaciones de frecuencias y de frecuencias rdativas podemos resumias en ima tabla de fre= ‘cuencias como la que aparece en el Cuadto 2 Por su parte, las 1epresentaciones mediante diagramas de barras y sectores de estos datos aparecen en la Figura 21 y la Figura 22 respectivamente. 2.4. Métodos gréficos para describir datos cuantitativos Si tenemos una variable cuantitativa diseta y ésta toma pocos valores, podemos tratarla como s fuera una variable cualitativa, calailar su distribucin de frecuencias y dibayjar un diagrama de barras. Ejemplo, En una empresa oon cadena de mentaje donde se empaquetan piemas en cajas se realiza 1m estudio sore la calidad de produccién. Los datos siguientes informan sobte el mime de piezas efectuosas enontradas en tia muestra de cajas examinadas: 000000111111111222222222233333334444444555566666777889 Prof. Dr. Antonio José Siéez Castilio 2 Dpto de Estadéstion e LO. Universidad de Jaén Jal dae Figura 2.1: Diagrama de barras. Figura 2.2: Diagrama de sectores. El diagrama de banas asociado aparecen en Ja Figura 2.3. Sin embargo, la mayoria de veniables cuantitativas son de tipo continuo, de manema que teman demasiados valres como para que la representacicn de sa dstuibucien de fiecuencias sea aii", Por dl el método grfico ins camin y tradicional para datos cuantitatives es el histograma, El histograma es uma variante del diagrama de banras dande se agyupan los valores dea variable en intervals para que estos intervales tengan frecuencias mayores que tno. Para obtener un histcezama de forma mamial deben seguinse los siguientes pascs: 1. Caleulamos niimero, V, de intervalos que vames a utilizar. Se recomienda qne sea aprosimadamente igual ala raiz cuadradla del rime de dates. Sin embargo, los programas estadistioos suelen utilizar otro método, Namado Método de Sturges, en el que N = (logy + 1), donde n es el rrimewo de datos y (Jos la fimcion parte entera, Terma micice walores may probablanente a mayor parte de dls sto apareara tna vez, por lo que la distribucien de fhecnencias sex cai siempre conssantee igual a 1. 2 Prof. Dr. Antonio José Siéez Castilio Apuntes de Estadistica para Ingenieros Figura 2.3: Diagrama de barras. 2. Caleulames dl rango, R, del histograma, que seri ligeramente més amplio que el rangp de Tos datos, 1 histograma debe comenzar en un nimero (,,) ligeramente por debajo del minimo de los datos y ‘terminar en 1m mimero (x7) ligeramente por encima del mimo. F1 rango del histograma sex, por tanto, R= x5p ~ me 3. Calculaancs la longitud, L, de los intervales, como dl cociente entre ol rango del histgrama y ol nimoro de intervals, es decir, L 4, Se construyen los V intervals: 1h = [2mtm +E) Ty = [Xp = Lym +2L) 1, = [2mm ~2L,2m + 3L) y= [am = N x Lym) 5. Para cadla intervalo, contames el niimexo de datos que hay en él, ¢s decir, la frecuencia del interval, 6. EI histograma es un diagrama de barras donde en el gje X se cdlocan Jos intervalos ¥ sobre ellos se construyen bares cuva altura sea la frecuencia o Ta frecuencia reativa del intervalo. En este caso, les Darras deében dibujanse sin espacio entre das, En ocasiones, en vez de temar la frecuencia relativa como altura de las barras, se toma dicha frecuencia relativa ocmo dea de las barrast en ese caso, s° habla de 1m histograma en escala de densilad. estén en dicho intevalo. Notas Por cuestiones que detallaremos mas adelante es impertante destacar que el porcentaje de datos que cae dentro de um intervalo es propercionall al érea de la barra que #8 construye sobre ese interval. Por ejemplo, si el dea de una barra es el 30% del étea total dl intervalo, entonces dl 30% de les datos Prof. Dr. Antonio José Siéez Castilio Dpto de Estadéstion e LO. Universidad de Jaén Figura 24: Histograma. Por otra parte, {qué pasaria si tamames un nme muy grande de datos? F nimero de intervalos el histograma sera también nmy grande, y las bamas serén may estrechas, de manera que en vez de parecer un diggrama de bamas, pareceria la grafica de una funcién teal de variable real, Hablaremos de esta funcion y del érea debajo de dla en breve, Por cierto, {cmo se calcula dl érea bajp esta funcién? ‘Bjemplo. Los datos siguientes comespandan al tiempo nevesario para procesar 25 trabajos en una CPU. LIT 161 L1G 138 353 123 376 191 096 4.75 O15 241 O71 002 159 O19 082 O47 216 201 am 075 259 307 14 ‘Vamos a caller un histogyama para esos datos. 1. Dado que VIE = 5, utilizaremos 5 intervales. 2. El minimo de les datos es 002 y el méstimo 4,75, de manera que podemos considderar camo rango él istograma el intervalo (0, 48), cuya lengitud (rangp del histograma) es 48 3, La lengituel de Jos intervals es, en ese casos 48 = 0.96. 4. Constrimos los intervalos: 1 = [0,0.96) Jy = (0.96, 1.92) Is = [1.92,288) I, = (2.88, 3.84) Is = (384,48) er Prof. Dr. Antonio José Siéez Castilio Apuntes de Estadistica para Ingenieros Calculamos la distribucion de frecuencia asodada a esos intervalos: ‘Tiempo de procesndo _Fecncia [0,0:96) 8 (0.96, 1.92) 8 (1.92, 2.88) 5 (2.88, 3.84) 3 381,48) 1 6. Finalmente, representamos 4 diggrama de barras (Figura 24). 2.5. Métodos numéricos para describir datos cuantitativos Es Gerto que un diagrama de bares o un histograma nos aytrlan a tener una imagen de cémo son Jos datos, pero normalmente es necesario complementar esa imagen mediante medidas que, de forma objetiva, descaiban hs caracteristicas generals del conjumto de datos, ‘Vamos a ver en este apartado ties tipos de matidas, que bisicamente responden a tres preguntas: por donde estén los datos (medidas de posiciin), emo de agrurados estén Ins datos (medidas de dispasiin) y qué {forma tienen los datos (medias dle forma). 2.5.1. Medidas de tendencia central Las medidas de tendencia central son medides de pericién que tratan de establecer un valor que pueda censideraase ef centro de los dates en algiin sentido, 25.11. Media Sea un conjunto de datos de tna variable cuantitativa, 2... 2». La media de les datos es Thies Esta matida es Ja més comin dentro de les de tervlencia central y correspande al centro de gravedad dle los dates. Es inmediato comprobar que si se realiza 1m cambio de orjgen y escala sobre los datos, del tipo y = ax +6, 1a media sufie d mismo cambio, es decir, 7 = a2 by De igual forma, si tenemos datas de la suma de dos o més variables, la media de la suma es Ja suma de las medias de cada variable, Prof. Dr. Antonio José Siéez Castilio B Dpto de Estadéstion e LO. Universidad de Jaén 25.1.2. Mediana ‘Sea un conjunto de datos de una variable cwntitativa, 23, ..,-Onlenemos la muestra de menor a mayor, Fay Ze La mediana es el valor de la variable que deja el mismo mimero de dates antes y despots que 4, una vex ordenados estos. El cilaulo de la mediana dependens ce si el nimero de datos, n, es par o impar: + Sines impary, Ja mediana sel valor que ocupa la pesicién "+ una vex quelos dates han sido ordenados (qx anilen creciente o decreciente), porcne éste es el valor central. Es decir: M. = (241) + Sins pars ]amedianacs hi modi avitntica de as ds observacionescentraess Chando n es par Jos dos ates que estén en el centro dela mestza ocupan las pesiciones 3 y $+ 1-Es deci: Mm, = “G29 | La mediana comrespemle exactamente con la idea de valer exntral de los datos. De hecho, puede ser un valor ins representativo de éstos que la media, va que es més robusta que la media. Vesanos qué significa esto en un ejemplo, ‘Bjemplo, Considereanos los datos signientes 0012345 Su matia es S224#2452485 — 9.1499, y su mediana 2 Pero imaginemos que por emer 0 por castalidad cbteemos tn mievo dato enormemente grande ' ' 10 oF ° 2 3 © ° lo ° me T T Serie 1 serie 2 Figura 2.8 Diggramas de caja de los datos dal espesor de las capas de didaddo de slicio Prof. Dr. Antonio José Sex Castillo Parte II Calculo de Probabilidades Capitulo 3 Probabilidad ‘Vemos que la tora de la probabilidad en el fondo 8310s sentido conn reiucido a Calcul m5 hace apreciar con exactitud lo que las mentes razonables toman por un tipo de instinto, indtuso sin ser capaces de darse cuentaf.. Es sorprendente que esta Ciencia, que suzi6 del anlisis de los Juegos de avar, Tega a ser dl objeto mss impertante del conocimiento Lnmane...| Las principales cuestiones de la vida son, en gran medida, metos problemas de probabilidad. Pierre Siman, Marqués de Laplace Resumen, Fl capitulo preporciona un tratamiento de Iosexperimentoscuyos resultados nose pueden predecit con oattezaa traws de conceptode probabilidad. Seanalizan las propiedades dela probabilidad y s intwoduce también d concepto de probabilidad cendiconada, que sue cuando un suceso modifica la asignacién de probabilidades previa. Palabras clave: experimento aleatorio, experimento deterministico, espacio nmestral, stoeso, probabilidad, probabilidad condicionala, indlepentlencia de suescs. 3.1. Introduccién En miestra vida cotidiana asociamos trsualmente ol concepto de Probabilidad a su calificativo probable, cersiderando probables aqudls eventos en Jos que tenemcs tin alto grado de ceencia en st ocurrencia, En esta linea, Probabilidad es tn concepto asociad a la medida del azar. También pensames en el azar vinculado, furrlamentalmente, con los juegps de azar, pero dese esa Cptica tan reducida se nos escapan otros :muchisimos ejemplos de fendmenos de la vida cotidiana o asociads a disciplines de distintas ciencias donde lar juga un papel fndlamental. Por citar algunos: Qué mimero de unidades de proxiueciin salen cada dia de tma cadena de mentaje? No existe un mimeo fio que pueda ser conocido a priow, sino um conjunto de posible valeres que poklrian darse, cada uno deellos cen im certo grado de certeza, + {Cuil os ol tamato de un paquete de informacién que se transmite a través de HTTP? No existe en realidad tm nimero fijp, sino que éste es desconocido a pricri. 39 Dpto de Estadéstion e LO. Universidad de Jaén + Cua es la pesicicn de im objeto detectado mediante GPS? Dicho sistema cbtiene, realmente, tna estimacién de dicha pesicién, pero existen mérgenes de error que determinan tma regién del plano donde el objeto s» encuentra con alta probebilidad. + {Qué muido se adhiee a una sefial que se envia desde un emisor a un reoeptar? Dependiendo de las caracteristicas del canal, dicho ruido sexs mis 0 menos elevante, pero su presencia no pods ser eanocida a priori, y deberd ser diferenciadla de la sefial primitiva, sin que se concvca ésta, teniendo en cuenta que se trata de un ruido aleatorio, En todos estes ejempls dl azar 65 um factor insoslayable para conocer el comportamiento da ferdmeno en esti, 3.2. Experimentos aleatorios y experimentos deterministicos En general, 1m experimento del que se ccnocen todes sts posibles resiltados y que, repetido en las mismas conliciones, no siempre proporciona los mismcs resultados s# conoce como experimento aleatorio. En centrapexiciin, im experimento deterministico es aqua donik les mismas condiciones aseguran que se obtengan Jos mismos resultaces. To a dl Célculo de Probabilidades busca es encontrar tia medida de la incerticumbre 0 de la oertidumbre «que se tiene de todes los posibles resultados, ya que jams (0 muy dificimente) se poet conocer a prion resultado de cualquier experimento donde el azar esté presente: a esta medida de la incertichumibre la denaminarernos prolbilidad. 3.3. Definicién de probabilidad ‘Tenemos, por tanto, que probabilidad es la asignacién que hacemos del grado de creencia que tenemos sobre 1h ocuencia de algp. Esta asignaciin, sin embargo, debe ser enherente, Esta nevesidad de que asignemes probabilidades adecuadamente se va a plasmar en esta seocién en tres reglas, conocidas camo amiomas, que debe cumplir cualquicr reparto de probabilidadles. 3.3.1. Algebra de conjuntos Si corsideramos un experimento aleatorio, podemes caracterizar Ics posibles resultacles de dicho experimento como conjuntes, Es de inter’s, por tanto, 1epasa’ los conceptos y propiedad bisicas dl algebra de ocnjuntos, En todoeste apartado no debemes alvidar que les conjuntos representan en rmestro caso los peribles resultados: de um experimento aleatorio. Un conjunto es ima coleccién de elementos, Se dice que B es m subconjunto de A si todos sus elementes lo sen también de A, y se notaré B.C A. TER mgjor que aceptanen dale di princi que la Fxfadética no es la cenda de la adivinactine tan silo se ocupa de anutifiear eine de inciertn es un evento y oesedonalent, de proponerestratesie de precicekn barack en dice anedltla de laiereidumbre, 40 Prof. Dr. Antonio José Siéez Castilio Apuntes de Estadistica para Ingenieros Para cala A se verifica CAC ACO. SiC c By BC Aentonees, CC A, Esto se conoce como propicdad trans Ta unién de B y A es 1m conjunto cuyes elementes son los elementos de A y B, y se nota AU B. Esta operacién veifica la propiedad conmutativa y asociativa, SiAC B, entones AUB = B Ta interseccién de A y B es el conjunto formado por los elementos comumes de A y B, y se nota AB o ANB, Esta operacién verifica la propiedad conmtativa, asociativa y distiibutiva respecto dela unin Dos conjuntes, A y 8, s dion mutuamente excluyentes, disjuntos o incompatibles si su interseccicn es vach, os decir, ANB = 0 Si dos conjuntos 4 y B son disiuntes, su unién suck notarse A+ By Tos cenjuntos 1,..., Av se dice mutuamente excluyentes si A; 1A; = 0 para todo i # j. Una particion es tma eoleccisn de conjuntes, Ai,... Avy tal qe: a) A\U..UAy =9 b) iA, = 8 para todo # # 5. El conjunto complemeniario de un canjinto A, 4 6 A*, esta formado por todas los elementos de 2 que no pesteneoen a A. Se sigue por tanto, AnA=0 ay =a SiBCASA SiA=BOA Finalmente, mencionemes las amadlas Leyes de Marganz ANB =A08. 3.3.2, Espacio muestral ‘Consideremos un experimento aleatcrio, Prof. Dr. Antonio José Séez Castillo aL Dpto de Estadéstion e LO. Universidad de Jaén 1 conjunto formado por todos los posibles resultaclcs del experimento aleatorio recibe el nombre de espacio muestral, y Jo notaremos habittalmente como 9. CCualenier subocnjinto de tm espacio muestra tecibe el nombre de suceso 0 evento. Hablaremos de ensayo o realizacién de 1m experimento aleatorio refir¥’ndonos a uma ejecucién de dicho expatimento, Asi, ditemos que en un ensayo ocurre um suceso 4 si = observa en dicho ensayo cualquier resultado indido en ol suceso A. ‘Una oleervacisn importante es que el espacio mestral no tiene par qué ser tien, s que deseemes observar del expetimento aleatorio, ejempks, que dependers ceo amos a poner este hecho de manifesto en lox siguientes: ‘Ejemplo. Si consideramos el Ianzamiento de un dado, un espacio mnestral seria N={1,2,34.5.6}. Les snceses mis dementales posibles son {1}, {2 {3}; {4}, {5} y {6}. Otros sucesos no elementals pueden sex {1,2}, {mayor que 2}, {ar}, « Sin embargo, supongamos que estamos lanzando un daclo porque no tenemos ninguma moneda a mano, ¥ silo deseames ver si el resultado es par o impar, En ese caso, el espacio muestral seria 8 = {par, impar}. Ejemplo. Un experimento habitual en Biclogia consiste en extraer, por ejemplo, peoes de un rio, hasta ar con un pez de tina especie que se desea estudiar, El nimero de peoes que habria que extraer hasta conscgnir ol ejemplar descarlo de la especie en estuctio formaria dl espacio muestral, = {1,2,3, ..}s 165 ‘que dl imestigadar desea chservar exactamente ol mimero de peces hasta extraer ese ejemplar deseado, Obséxvese que s trata de un conjunto no aectade, pero mmnerable, Como ejemplos de peeibes sucesos dle inten’s poxlniames poner Ics eventos {1,234.5}, {mayor o igual a Bhoew Supongames ahora que el investigador silo esta interesalo en comprobar si hacen falta mis de 5 ex- ‘racciones para cbtener im ejemplar de la especie en esturlio. En ee caso, ol espacio muestral seria = {> 5,55}. Ejemplo. Si considerammos ol experimento aleatcrio consistente en elegir un nimero absolutamente al azar entie Oy 1, tn espacio muestral seria = [0,1]. A diffrencia de los anteriores ejemplos, este espacio nmestral noes finito, ni siquiera numeable, Como ¢jemplo de sucess posibkes en este espacio muestral podemos destacar, entre ottos, {menor que 05} , {mayor que 0.25}, {menor que 0.75} Otto espacio nmestral podria ser obsarvar el valor decimal mayor més cercano, Por ejemplo, si sale 0.25, ime interes 0.3. En ese caso dl espacio nmiestral seria 9 = 0.1,0.2, 1. Este espacio mestral servi, or ejemplo, para sertear nimercs entre 1 y 10, sin més que mniltiplicar el resultado cbtenido par 10. 42 Prof. Dr. Antonio José Siéez Castilio Apuntes de Estadistica para Ingenieros En ests iltimes efamplos podems ver que hay ds grandes tipos de espacios muestrales seein el nimero de suvesos dlementales. Un espacio muestral se dice discreto si est formado por un conjunto finito o infinito mmerable de sucesos darentales. Por el contrario, un espacio muestral se dice contimo si est fermado par un conjunto no numerable de sucesos dlementales. 3.3.3, Funcién de probabilidad Dado un espacio mestral {0 comepomiente a un experimento alenterio, ma fimeién de probabilidad para ese espacio mnestral es cuakquier fincién que asigne a cada sticeso un mrimero en el intervalo [0,1] ¥ que verifique P(A] > 0, para cuakpier evento A P[g)=1. Dada ima colkerién de sucesbs 1, A2,.., An nmituamente excluyentes, és decir, tales que 4,0 A, = @ para todo i # 3, Pia Ad yrial Nota, Hay que notar que se puede dar mas de una funcion de probabilidad asociada al mismo espacio amysiral. Por ejemplo, asociado al espacio muestral © = {eara,eruz}, del lanzamiento de una moneda, pueden danse un mimero infinito no numerable de medidas de la probabilidads concretamente, asociadas a cada decciGn Pleara| =p Pleruz] =1—p, para cada p € (0,1). Aunque si la moneda no esta cargada, ccmo sucede habitualmente, se considera el cesoen que p= 3 Bjemplo. Volviendo sobre d lanzamiento del dado, # éste no esta cargado, podemos definir la siguiente fancién de probabilidad: 1 PUG) = 2, £=1,2,-..6. Prof. Dr. Antonio José Siéez Castilio 43 Figwa 3.1: Circuito En ew caso, podemos, a su ve, calcula algnmas probabilidades. Por ejemplo, P ({par}) = P[{2,4,6) = PQ} + PUA + PCH livia = pt Et pans. En este cilaido se ha tenido en cuonta la tercera condicén de la definicion axiomatica. Como consecuencia de la definicién se yerifican, entre otras, las siguientes prepiedadles, que alanis facilitan bastante los céleulos + Pp) =0. + Sea Aun stceso cualquier. Entonces, P [i] = - Pld) + Sean A y B dos sucesos cualescuiar. Entonces, P [A B] = P(A) ~ P[An B + Sean A y B dos sucesos cualesquiaa. Entonces, P [AUB] = P [A] + P[B] — P[A0 B] Ejemplo, H circuito que aparece an Ta Figira 3.1 est comstituido por dos intemuptores (switches) en paralela, La probabilidad de que cualquiera de ales esté cerrado es de 4. Para que pase corriente a través del cinito basta con que pase corriente por algumo de los dos interrup- tores, esto es, que al menos tno de ellos esté comado. Por tanto, si notamos por E al suveso que pase cormiente a tranes del cireuito y Ea suceso que el interruptor + esté cerrado, entonces, PIE)= PIE, = PIE) + Plz] - PB Fa = PINE) <1 Para conocer esta probabilidad de forma exacta necesitamos saber oGmo actiian de forma conyjunta ambos cineuites. 44 Prof. Dr. Antonio José Siéez Castilio Apuntes de Estadistica para Ingenieros Neds lewamientos [10 [10 | 20 [0 | 70 | 100 N® de caras: q a6 iain ss 04 [Oe [O06 [OARS [05055 [O50 (Cuadlro 341: Aproximacién frecuentista a la probabilidad de cara en el larzamiento de una moneda. 3.4. Interpretacién frecuentista de la probabilidad La interpretacion mis cemin al concepto de probabilidad tiene que ver con los prometlios de ocurtencia de Jos sucess del experimento en cuestin. Persemes en el lanvamiento de una moneda: si decimes que la probabilidad de cara es 0.5, entendemos que si Janzamos la moneda un gran niimero de veces y anotames el mimero de caras, ést2s sein mis O mencs la tmitad. Genexalizando este proceso, poxhiames decir que la probabilidad de m evento A, P(A] , Pal = Jin, 3 donde m4 es el mimero de ocurrencias de A en n ensayos del experimento. Esta interpretacién se conooe cemo definicién freeuentista de Ja protabitidad, Se trata de ma interpretacién de caxdicter eminentemente préctico parque permite ima apreximacién fisica al ooncepto de probabilidad, pero se ve Timitada par las complicacicnes que supane Ia definicién en términes de un Kmnite que, como tal, sé se aleanza en el infinito. Ademeés, deste 1m punto de vista realista, Zen qué ocasiones poxhemos repeti experimento im gran mimero de veces? [Rjemplb. Se han walizado 1000 Innzamiontos de una moneda, En el Cuadro 3-1 aparece un resumen de ee proceso, Puede observanse como cuanto mayor es el nimero de larzamientos, més se aprexima la fieeuencia {rdativa al valor £, de manera que podriamos pensar que la Probabilidad de cara es ignal que la probabilidad de cr e iguales ambas a 3, amnque esto silo es una suposécin, o tna aproximacién, ya que para aplicar Jestrictamente la definicin frecuentista debertamos contimar hasta el infinito, lo que resulta imposible, Esta interpretacién frecuentista de la probabilidad pemnite inferir Jo que podemas amar frecuencias espe- radas. Sim evento A tiene asignada na probabilidad P [4], entonces, si repetimcs el experimento aleatorio 1 veoes, lo més espemible es cue A ntimero de veces que se de el evento A ser’ n x P(A]. Mis adelante podkemos matizar con més rigor a qué nos referimos con Jo mas esperable. Ejemplo. Siguiendo con el ejemplo de la moneda, si la lanzamcs 348 veoes, lo esperable es que sagan alrededor de 348 x 0.5 = 174 caras. 3.5. Interpretacién subjetiva de la probabilidad Si nos dicen que la probabilidad de que Ilneva maiiana es da 35 %, jeGmo podemas interpretar esoen términes frecuentistas? No tiene sentido pensar en que podemes repetir el experiment da de mafiana nmichas veoes ¥ contar cudntas voces Ihieve. :Podsames pensar si hubiera muchas dias como el de maiiana, aprosimadamente Uoveria en el 35.% de ellos? Pero eso no tiene sentido parque el dia de maiiana es inion, Prof. Dr. Antonio José Siéex Castilio 45 Dpto de Estadésticn e LO. Universidad de Jaén La interpretacien subjetiva de la probabilidad tiene que ver con la vinculaciin de este cancepto con el grado de incertichmbre que tenemos sobre las cosas. Si tenemes um experimento alkatorio, dl resultado de dicho expatimmento es incierto, La probebilidad de im resultarlo del experimento es el grado de creencia que yo tengo an la oatrrencia de dicho resultado, Fie grado de creencia es personal, nego es subjetivo, pero Keicamente, ober estar aconle con la informacion que tenemas sobre dl experimento. 3.6. Espacio muestral con resultados equiprobables. Férmula de La- place Otro punto de vista que permite abordar el proceso de asignacién de probabilidarl a sucesos es a siguiente: continuando can el ejemplo de la maneda, en este experimento son dos los resultaclos posibles, y no hay’ razones para pensar que uno de dos es mis probable que otvo, asi que tiene sentido considerar que la protabilidad de cara y Ia probabilidad de cruz san ambas del 50%. En general, si el espacio nmestral est formado por V resultados posibles y todos ellos tienen la misma ptobabilidad (cquiprobables), pocrfamos decir que la probabilidad de um evento A, P [A], es Plal= donde N'4 es ol niimero de resultados favorables a la ocurrencia de A. sta formula, conocida como formula de Laplace también es fiundamentalmente prictica. Por ejemplo, nos pamnite deducir que P (cara) en el lanzamiento de tna moneda sin tener que lanvar la moneda un gran niimero de veces. Sin embargo, la definicién tiene dos grandes inconvenientes: ol conjunto de resultados posibles, .V, tiene que ser finito ¥, adams, toeles los resultados peritles deben tener la misma probabilidad (con Jo cual lo definido «queda implicitamente inmerso en la definicin). 3.7. Probabilidad condicionada. Independencia de sucesos Para introducir de manera intuit conerpto de probabilidad condlicienada debemes pensar en la probe Dilidadl como medida de la creencia en Ta ocurrencia de los sucesos. Persemos an tin experimento aleatorio y en tn suceso de dicho experimenta, A, en el que, en principio, tenemos im grado de avencia P [4]; perostupongames que conocemas algo dd resultado de dicho experiments, coneretamente, sabemos que ha ocurrido un suceso B, Parece Wégieo pensar que esa informacion conocida sobre el resultado del ens modificaré: meso grado de creencia en A: Ilamemos a este mievo grado de avencia P [A | B), probabilidad de A conocida B 0 probabilidad de A condicionada a B. [Rjemplo. Conskiarmo d suceo As d dia de hoy waa Iker yd sino Bol dia de hoy esta miblado. JObviamente, la prebabilidad P [4] ser mence que la probabilidad ? [A | 8], ya que dl hecho de que esté nublalo refuerza miestra creencia an que Thieves 46 Prof. Dr. Antonio José Siéez Castilio Apuntes de Estadistica para Ingenieros [Rjemplo. Consiloranos cl experimento alcatato de extracr una carta de una baraja espandla, Soa ol sues A: obtener ima sota, dl suceso #4; : cbtener una figura y el suceso B= obtener una carta de eopas Las distintas probabilidavles, condicionads 0 ro, bajo la definiciin clisica, son las siguicntes: dots 1 Plaj= asm = 4) 40 cartas — 10 dsotas 1 PIAL B= paras ~ 3 Lsotadecapas 1 PIA| Bal TOs 10 Cano puale vee, B; modifica la probabilidad a priegi, pero no ast Bz. Puade decitse que Bz no ofivee informacion acerca de A, 0 que A y By son independientes. ‘Vamos a dav a conlinuadon tna dbfinidon de probabilidad condicionada que respond? a esta idea de recalcular Ia probabilidad en fimeiin de la infermaciin existente, Ta probabilidad condicionada de un saceso A, conocido otro suceso 8, denotada por P[A |B], a PlAnB| Play a= PEA, siempre que P[B] #0. Una fimein de probabilidad condicionada P (+/] es una finckin de probabilidad en toda regla: por tanto, cumple las mismas prepiedades que cualquier fumciin de prebabilidad “Sin condicionar”, (Como hemes comentad, Ia idea de la probabilidad condicionada 5 utilizar la informacién que nos da un suites conocido sobre la oomrencia de otro suoesa, Pero, como ya hemes poesto de manifiesto en un ejemplo, no siempre tn stoeso da informacion sobre otro, En este caso se dice que ambos suoescs sen independientes, Por tantor Dos suoesos A y B se dicen independientes si P [A | B] = P [4], 0 equialentemente si P[B | A) = P[B), 0 equivalentemente si P (A 9 B] = P [A] x P[B] ‘Ejemplo. Continuando con d Ejemplo 3.3.3, lo més K¢ejeo es pensar que los dos interruptores actian db forma independiente, en cuyo caso P (F1 9 E:| = P [Bi] P(Fa] y tenemes que, PlE|= ‘Nota, Fs muy importante no confimir la prebabilidad ccndicionada de un suceso a otrocon la probabil dd de h intenseeciin de ambos sueeses. En la Fignra 3.2 punde verse la diferencia entre hs prebebilidades cendicionadas entre dos sucess y la probabilidad de si interseccién, Bn térmninos coloquiales, podemes Prof. Dr. Antonio José Siéex Castilio ar Dpto de Estadéstion e LO. Universidad de Jaén analizar estes probabilidades como dl cociente entre una parle y wn todo. Cuando la probabilidad es condicicnada ese todo es €1 sueeso que condiciona, Cuando la probabilidadl no es condicionada, ese todo ¢s todo dl espacio nmestral. En ambos casos esa parte es la interseeci6n Figura 3,2 Esquema acaca de la definicicn de probatilidad condicionadla, ‘Nota, También suck ser bestante contin Ja confusion entie sucesos independientes y sucesos incempae tibles o mutuamente exchiyentes, En este sentido, reconlemes que dos sucesos A y B son inccmpatibles o mutuamente exduyentes si ANB = 2, en ayo caso P[ANB| = 0. Por su parte, Ay B serdn independiantes si P [A B) = P [A] P (Ble Las diferenciss entre ambos conceptos son obvias, ‘Ejemplo. La probabilidad de que el producto no sea elaborado a tiempo es 0.05. Se solicitan tres pedides bl producto con Ia suficiente separacién en tiempo como para considerartos eventos indepndientes. 1. {Cua es la probabilidad de que todos los pedidos se envien a tiempo? En primer lngar, notemos £, al 810650 enviar a tiempo el pedo iésimo, Tn ese caso, sabemos que P(E, = 036. Por su parte, nos piden P(E, E20 Es} = P (Ey) PBs] P[Bs) = 0.95", dbido a que los pedlidos son independientes. 2. ,Cuall es Ja probabilidad de que exactamente un pedlido no se envie a tiempo? 48 Prof. Dr. Antonio José Siéez Castilio Apuntes de Estadistica para Ingenieros En este caso dd suceso que nes piden es mis complejer P[P, VE: 9 BsU Fi 0 £20 Bs UE: 0 E20 Bs] =P [EN ENB] +P [An 2B] +P: Bn Bs) = 0.05 « 0.957 + 0.05 x 0.957 +-0.05 x 0.95 = 0.135, donde se ha utilizado que los suceses EM E2 Es, Ei By y BLE, Es son incempatibles. 3, {CuAl es la probabilidad de que dos o més pedides no se envien a tiempo? “‘Tengamos en cuenta que ya hemos calculado la probabilidad de que todos se envien a tiempo y de que todos menos uno se envien a tiempo. Entances, P [des o més pedides no se envien a tiempo) 1 ~ P [todos se envien a tiempo U un pedido no se ene a tiempo] 1 = (0.95 + 0.135). Ejemplo, Considerames un proceso industrial como el que se escuematiza en la Figura 33, En dicho esquema se pone de manifesto que una unidad seré producidad con éxito si pasa en primer lugar un, ‘chequeo previo (A); después puede ser mantada directamente (B), redimensionada (C) y después mantada (D) oadaptada (E) y después montada (F); posterionmente debe ser pintada (G) y finalmente embalada, (FD). Consideremas que las probabilidades de pasar exitoramente cada subproceso son todas ellas ignales 20.95, y que los subprocesos tionen Ingar de forma inleperliante unos de otress Vamos a calcalar en ese5 condiciones la probabilidad de que una unidad sea exitosamente producida. Si nos damos cuenta, Ay G por B, por C y Dopor Ey H son inehdibles, mientras que una tnidad puede ser producida si pasa En notacién de cenyjntos, la tnidad sent rroducida si se da AN(BUCODUENF)NGNE. Como las procesos son indepenclientes 1mnos de otres, no tenemes: problemas con las probabilidades de las intersecciones, pero tenemos que calcuiar la probatilidad de ima unién de tres conjumtes, BUCAPUENF. En gpreral, P(AyUAgUAg) = P[(Ay U Aa) U Ay] = P (Ay U Aa] + P [A] = P [Aa U A) 1A PUA) 4 PlAx) PIAL Ax) 4 PLA] PLA AU AAI] Prof. Dr. Antonio José Siéez Castilio 49 Dpto de Estadéstion e LO. Universidad de Jaén = PAs] + P(As] - PIAL All + PLAS = (P[Ai M As] + P [Aa 9 As) — P [Ar A Af As) Ai] + P [Aa] + PLAY Pdi Aa| — PlAa sl ~ P42 As] + PIAL Aan As) En mest eso, P[BUCN DUENF| = P|B\+ PICND] + PlE F, = P|BNEND)- PIBNENF|-P[CnDN ENF] +P|BNCNDNENB| = 0.95 +2 x 0.95? — 20.95 — 0.954 + 0.95" = 0.9995247 ‘Ya estamos en condiciones dle obtener la probabilidad que se nes pide: P[An(BUCNDUENF)NGoH = P[A)PIBUC DUENFI|PIG| P| = 0.95 x (0.995247) x 0.95 x 0.95 = 0.8569675. En estos ejemplos, dl ciclo dela probabilidad de las interseociones ha resultado trivial porcqe los stoescs som indepentlientes. Son embargp, esto no siempre ocume. {Como podemos, en general, obtener la probalbilidad de la interseocién de dos 0 mas stoesos no necesetiamente independiontes? En el caso de silo dos sucesns, Ay B, podemos deducir que PIANB) = PIAIB| x PIB] directamente de la definicién de probabilidad condicianadla, A partir de esta fémnmila, por induecién, se puede obtener Ja Imada férmula producto, que se emia de la signiente forma: si Ay, Aa... Ay son sucescs de ‘un espacio mmestral no necessiamente independientes, s© yerifica PLA Az Oo Ag] = PIA/PLAg| At} PLAn| AL 12D Ana] 50. Prof. Dr. Antonio José Siéez Castilio Apuntes de Estadistica para Ingenieros Figura 33: Esquema del proceso industrial del ejemplo Bjemplo. Un kte de 50 aranddas contiene 30 aranddas cuyo groror exoete las especificaciones de diseio. Suponga que se seleecionan 3 aranddas al azar y sin reemplazo del lote, 1. ,Cual es la probabilidad de que las tres arandelas seleccionadas sean més gruesas qe las especie cacicnes de dliseiio? Comervames notando los sess / cacicnes de dliseiio, t= 1,2,3. sima arandsla extraida es mas gruesa que Tas especie Entonces, nos piden PAL Az Ag) = PAI] P(A /a,] P[As/asnaal 2. Cuil es Ia probabilidad de que la teroera amanda seloccicnada sea mis grursa que las especificee cones de diseiio si las dos rrimeras fueron mas delgadas que Ta especificacicn? lang.) = 2. PlAs/anal = % 3.8. Teorema de la probabilidad total y Teorema de Bayes Los signientes dos resultadles se conocen como ‘Teorema de Ia probabilidad total y Tearema de Bayes respectivamente, ¥ juiegan tmn importante papel a la hora de calcular probabililades. Las dos tatilizan ocmo Prof. Dr. Antonio José Siéez Castilio BL Dpto de Estadéstion e LO. Universidad de Jaén principal herramienta dl cancepto de probabilidad condicionada, ‘Teorema de la Probabilidad Total. Sea P una fimcién de probabilidad en un espacio mmestral. Sea (At... Ay} CF um particén dd espacio nmestral ® y sea B un suoeso cualquiera, Entonces, P(B|= P|B| Az) P|Ai]+...+ P|B| Ay] P(Aw] ‘Teorema de Bayes. En ess mists condiciones, si P [B] 40, PIB | AIPA P&I = Sig a Pl + +P 1B Tan PAW Ejemplo. Supongames que tenemos 4 cajas con componentes dectrénicas dentro. La caja 1 oontiene 2000 compenentes, con tn 5% de defectuaras; la caja 2 contiene 500 components, com tn 40% de efectuosass las cajas 3 y 4 centienen 1000 cemponentes, con tm 10% de defectucsas. 1 {Cul 6s la probabilidad de escoger al azar una componente defectucsa? Notemes D : componente defectuasa y C; : camponente de la caja sina. Entonces, s tiene que re 2000 4 *)* 2000 + 500 + 1000 + 1000 ~ 9 Pic, = ———_ 2 ed 3000+ 500-= 1000 1005 ~ 3 , 1000 2 PCI = sp B00 1000 1000 ~ 5 1000 2 PLC) Sopp S00 10007 1000 ~ 5 Ademis, P[D | Ci] = 0.05, PID | C,] = 0.4, PID | Cs] = 0.1 y PID| C, Utllzando d Teorema de la prolubilidad total, PID) = P[D| Ci] P[Ci] + PD | Ca] P [Ca] + PID PLCS + PID| C4) PICS oat 4012 4012 = 0.05 ie ae er) =0.1111 2. Si se esooge una componente al azar y resulta ser defectuosa, jcusl es la probabilidad de que pertnezca a la caja 1? PIDIGIPIC| _ 00 PID, ~ gam PIC, | D)= 52. Prof. Dr. Antonio José Siéez Castilio Apuntes de Estadistica para Ingenieros famero_en cada caja BF 3 Taal oor 0 2 OL 55 3 7 19 0. 0. L Tol 5210 seas) Chadlro 3.2: Acumuiladares. Bjemplo. Se dispomen tres cajas donde se almacenan acumuiladores segjin aparece en el Cuaelro 32. Se esoogp al azar tma caja ¥ de ella, a su vez, tm acurmiador, 1. {Cua es Ja probabilidad de que se haya seleocionadlo un acumulador de 00146? Notemes 0.010, 0.4F y LOuF ales sucesos extuer wn acumulador de 0.011F, 0.1jF y 10uF respoctivamente, De igual forma, notemos cl, 2 y 3 ales sucescs elegir la enja 1 la anja 2 y la caja &, respectivamente. Utilizando ol teorana de la probabilidad total, P(0.01pF) = P(0.0YuF jel] Plel] + P[0.01pF / 2] P[e2] + P(O.0wE / 201 951 251 5903 1453 * 2103 * 2453 25578 Pies] 0.23078. 2. Sila sido seleccionado un acummilador de 1.0}, jcul es la probabilidadl de que procada de la caja 1? Utilizando d teorema de Bayes, P(LOuF jet) P [el] Plel 1.008 = Por su parte, P(LOuF) = P[LOuF fel] Plel] + P[LOuF /02) P[e2| + P[LOpF /3] P [3 71, 801 1451 6205 3+ eg 7 ives 7 O88 luep Bjemplo. Siguiendo con el ejemplo de las aranddas con grosor fxera de las especificaciones de dliseo, {cual os la probabilidadl de que la tercera arandda seleccienada sea mis gruesa que las especificaciones ch diseio? PlAs] = PlAs|asnay]PIAL 0 Aa] + PlAs|aynas]PLAr 9 Aa +P\AalauntalP (At 0 Al + PlAslayntalPUA 9 Aa Prof. Dr. Antonio José Siéez Castilio 53. Dpto de Estadéstion e LO. Universidad de Jaén = PlAs|avnas]P[Ai|P[Aala] + PlAslayna,) P(A PlAala, +P[As| nay] P(A P[Aala,| + PlAsL Anas) PAP Ala, 283029 292030 BD 29 3020 BD jemplo. Fn el canal de conmnicacicnes temario que se desaibe en la Figura 34, se ha observaclo qe el digito 3 es enviado tres wees més frecuentamente que 1, y 2 des wees mis fiecuentemente que 1. Caloulemos la probabilidad de que un digito cualquiera enviado a trans del canal sea recibido carrectamente, En primer lugar, si notames P[X = 1] = p, entoncos P [X = 2] = 2p y P[X = 3] = 3p. Por otxa parte, camo PIX = 1+ P(X = +P [X= = 6p, se tione que 1 BPx Ahora, utilizando el teoreama de la probabilidad total, PIX ty Pix P (digito OK] = P (digitoOK | X = 1] P[X =1 + P[digitoOK {X = 2] P[X = | P|digitoOK / X = 3) P|X =3] = Ply =1/X = 1] P [x =1 +PIY =2/X =2)P[xX =] }PIY =3/X =3] P(X =3] L 1 1 a-atsa-gisa—yi- (=a) 5 +0-8)5 ago. Ejemplo. Contirmando oon el anterice, si se recibe un 1, jeul es Ta probabilidad de que se Inbiera exviado un 1? Utilizando ol tecrema de Baves, PY =1/X=1P[X= PIy=y PIX=1/¥ =1) B Prof. Dr. Antonio José Siéez Castilio Apuntes de Estadistica para Ingenieros Lena sys 0 Figura 34: Canal temario de comunicaciones con probabilidad de aice Por st parte, PY =1)=P(¥ =1/X=1)P[X =] 4 PY =1/X = 2 P[X =2] + PY =1/X =3) PIX =3] Boa tee} Tue , ta Pik= P+ Ba 28-37 3.9. Mas sobre el Teorema de Bayes La importancia del Teorema de Bayes en Estalstica va mmcho mas alla de su aplicacion como fémmla que facilita prebebilidades condicionachs, La filesofia que sulyace en él ua dado lugar a toda una forma de entender la Fxtaclistica, Tamada por ello Estadistion Bayesiana, Vannes tratar de explicar los fundamentes: de esta manera de entender el teorema. ‘Supongames que hay um suceso A sobre el que tenemes umn serio descomocimiento acerca de si se dao no se a, Tanto es asi que tenemos que determinar la probebilidad de dicho suceso, P [4]. Es importante entender «que nosotros scmcs conscientes de que A ha canrdlo 0 no ha ocunidet @ problema es precisamente que no sabemos qué ha pasado, Decimos que es impertante porque P [4] no representa la probabilidad de que. A ‘ocurra, Sino nnestro gyadlo de ceencia en que ha ocurrido. [Bs posible que no tengamos, en principio, dates para conocer de forma exacta cusl es la probabilidad de A. Ati asi, podriamos atreveries, como expertas en el tema, a dar una estimacién de dicha probabilidad, P |Al. A-esta probabilidad inical que damas la vamos a Hamar probabilidad a priori. Ahora bien, hemos dado una probabilidad a pricei P [4] sin ninguna informacion sobre A, Supengamos ahora Prof. Dr. Antonio José Siéez Castilio 5B Dpto de Estadéstion e LO. Universidad de Jaén «que tenemos mieva informacicn que nos dan’ pistas acerca de si A ba ocudo ono, y que dicha informacén stéireepgida en un sueeso que llamaremns B, En ese caso, podhiames y deberiames actualianr la probobitidad de Abasindonosen esta nueva informacién, proporcionando una meva probabilidad de 4 que tenga en cuenta By, es deci, P |A |p,, que Tamaremos probabilidad a posteriori, En esa actualizacién de la probabitidad es dende entra ol Tecrema de Bayes, ya que nos dice que PIB. al PIAL PBs [al PIAL + PIB: [al P [A] Obsérvese que Ia probabilidadl a postericai ¢s proporcional a la probabilidad a price, Finalmente, es my importante ver que podemos extender esta forma de trabajar aplicando el teonema de ‘na forma recursiva, Después de conocer 81, muestra rmieva probabilidad para A es P(A |p,)+ Abusando de 1h motacin, podemes decir que esa es nmestra meva probabilidad a pric y si, par ejemplo, tenemes més informacién sobre A, dada por otto stoeso Ba, informacién independiente de /), la meva prolubilidad a postericai seria PIA a] P (Bz lanns] P 1A Las] PIB: ane] P(A |e.) + P [Be lane.) PA la] - P (Ba |a PIA \a] PIB: a) PIA |.) + PIB2 la P [Als] PIA las] = Es muy importante cbservar que en este cociente P [A |p,] ocupa el lugar que antes oaupaba la probattilidad a priori, Ademés, esta segunda probabilidad a posteriori pockfa consideratse como la nmeva probabilidadl a priori para tina mieva aplicackin del teorema basada en el conocimiento de meva inférmacién dada por tm sticeso By, Este proceso de actualizacion de las probabilidades a priori basada en la informacion disponible puede realizar cuantas veces sa necesaio, ‘Vamos a ilustrar esto en un par de ejemplos. 3.9.1. Ejemplo del juez ‘Supongamnes que un juez debe decidir si un sospecheso es inooente o culpable. HI sabe que debe sex cuidadoao ¥y gatantista con Jos derechos ddl acusada, peto tambien por su. experiencia parte de tna creencia en que scspecharo puede ser culpable que, en cualquier caso, estima por debajo de Jo que realmente ave para, insisto, ser garantista con los derechos dd acusado, Pongames que estima esta probabilidad en un 10% Ahora empieza a examinar las pruebas, La primera de ellas es una prueba de ADN en la que el acussdo dio ositivor encontraton material genético en el arma del crimen que, seein la prucha, es suyo. Eka prueba de ADN dha positivo en el 99.5% de bs veces en que se comparan des ADN’s idénticos, pew también da pesitivo (erréneamente) en a 0.005% de las veces en. que se aplica a dos ADN’s distintos, Teniendo en cuenta esta informacién, 4 juez aplica por primera vez. dl teorema de Bayes oon Ios signientes datos: + P [culpable] = 0.1, que es la probabilidad a priori que el juez considera, + La probabilidael de que la prueba de ADN de positivo si dl acusadlo es culpable es, PLADN+ leutpatte] = 0.995. 56 Prof. Dr. Antonio José Siéez Castilio Apuntes de Estadistica para Ingenieros + La probabilidadl de que la prueba de ADN de positivo si dl acusado es inocente es P|ADN + |inocente] 0.00006. Ahora ya puede actualizar su grado de aeencia en la culpabilidad del sospechoeot PLADN+ leutpatie] X P leutpable] PADN$ Tostpate] & P oulpable] + PTADN+ [mooente] ® P [inocente] 0.995 x 0.1 TOH5 xO + 0.00005 x 09 P leulpable lanes 999548, Es der, ahora piensa que ol sospechoso es ailpable con un 99.9548 % de certeva, Fijémanos en que mestra ptobabilidad a priori aparece en los términos 0.1 en. mmmerador y 0.1 y 0.9 en a denomrinador. Esa, 0.1, a la probabilidad que tenfames antes de a prueba de que fuera ailpable (y 0.9 de que frera inooente); después de la prucha esa probabilidad es (0.090548 de que sea culpable (y 0.000452 de quesea inocente). Sin embargo, sospechoro insiste en su inocencia, y propone someterse a una prucha de un detector de mentiras. Les expertos saben que un culpable es capex de engafiar a esta micqina en el 10% de las veces, ¥ que la maquina dir 1% de las vooes que un inocente miente. Nuestro sospechoso se somete a la méiquina y ésta dice que es inocente. {Cua sex4 ahora la probabilidad que d jez asigna a la culpabilidad dl scepechoso? ‘Teniendo en cuenta que: + Plovaguina~ let = Oy © P [maquina lnccnte] = 001, debe aplicar de mevo dl Teorema de Bayes, corsiderando ahora que la proba ailpable es 99.9548%: dad a priori de que sea P (maguina~ \eutpaste| x P [culpable] Tipe] xP lewlpaBle] + Praguina= [ner 01 x0.999518 TTR ODONSTE (1 0.01) x (1 OTST) P eulpable moesine-] = Sagan xP Procent 0.9955431 Bs decir, arin con esa prueba negativa, 4 juez arin tiene un 99.55431 % de certidumbre de que el sospecloso aillpable, De mievo, podemos resumir este paso diciendo que antes de Ja segunda prueba nuestra probabilidad de que fuera culpable era de 0.999548 (que aparece en la mila ocupando la posicién de la probabilidad a priori), mientras que después de la segimda prueba esa probalilidad es (0955431. El proceso puede vere resumido en dl Cuadro 3.3. 3.9.2. Ejemplo de la maquina de deteccién de fallos En um proceso industrial de produeci’n en serie de capés de coche, existe ima miquina encargadla de detectar desperfectos que desechon una pieza de caps. Fka maquina est calibrada para detectar una pieva defectuosa cen tm 90% de acto, paw también detecta como defectuoses d 5% de las piezas no defectuosas. EL encargado de calideal estima, par estudics previes, que el parcentaje general de piezas defectuaws es dd 5%, ste encargado, consciente de que la méquina puede dar por buenas piezas que son defectucras, decide actuar de Ta sigqionte formas una pieza que sea detectada como no defecttosa pasard otras dos vores por la misina, méqquina detectora y sdlo sexs declarada no defectuasa cuando en ninguna de esas tres pruebas, de defectuasa, Prof. Dr. Antonio José Siéez Castilio oT Dpto de Estadésticn e ILO. Universidad de Jaén P [Cudpable] “Antes de ‘Después de Ja prueba Ja prueba. prueba: APN+ | OL FIRDN gee eB To — 0.900888 Cuadro 33: Esquema dl proceso iterativo dl teorema de Bayes en el ejemplo del juez. La probabilidad a priori (antes de cada pructa) es la que = utiliza en la formula para obtener la probabilidad a posteriori (Cespiiés de cada prucha). La probabilidad a posteriori (después) de tma trucha es la rrobebilidad a priori (antes) de la signiente pricha. ‘Supongames que una pieva pasa las tres veces y da no defectuosa: {cus es la probabilidad de que realmente sen no defectunsa? ‘Vamos a empezar notando adlectalamente Tos stoesos, Notaremos D al stoeso ser defectucsa y par + a dar positivo como defectucsa en Ia prucha de la mécpina, Sabemos que: = P[D| = 0.05, que es la probatilidad a prion; + Plt |) =09y = Pl+ll La probabilidad a pricti de que ima pieza sea no defectuosa es de 0.95, pero si os detectada como defectunsa ‘na primera vez, dicha probabilidad pasa a ser 5 PIF |p) P[D) P[DIc]= olP |p PIP] +P DPD) 0.95 x 0.95 = = o.9941901 0.95 x0. 0.1% 0.05 0.994490: Esa probhilidad pasa a ser la probabilidad a priavi para la segunda vez que da no defectuosa. Por tanto, la ptobabilidad de que sea no defectuosa si da negativo par segunda vez es P(T |p} 0.9944004 PUP ][p]09941004 + P[F [n] (1 0.9910900) _ 0.95 x 0.944904 95 xO.9TII0E 1 OT x, = 0.99% Tomaaay ~ 0004172 Finalmente, la probabilidad de que sea no defectuosa si da negativo por tercera vez es PF |5|0.99042' ~ PTF [p)0.9994172 + PTF |p] (1 — 0.994172) 0.95 x 0.999417 ~ doe xooonaT2 + 01x PID 9994172) 99998388. Como podemas ver, si una pieza da no defectucsa tres veces, la probabilidad de que sea realmente no defectucsa es altisima, del orden del 96.99%, asi que dl método ideado par el responsable de calidad parece cersistento. 58. Prof. Dr. Antonio José Saez Castillo Apuntes de Estadistica para Ingenieros rar “Antes de Ja prueba 0.85 Fe ar = 09001001 09914004 rma rT 0.994172 oso? | pepe 0,9990886 Cuadro 34: Exquema del proceso iterativo del teorema de Bayes en el ejemplo de la méuiina de deteccién de fallos. La probabilidadl a priori (antes de cada prueba) es Ia que se utiliza en la formula para obtener la ptobabilidad « pasterion: (despiés de cacla prucha). La probabilidad a posteriori (después) de tna prueba es 1h probailidad a priori (antes) de la siguiente prucha, Prof. Dr. Antonio José Séez Castillo Dpto de Estadésticn LO. Universidad de Jaén Prof. Dr. Antonio José Siéez Castilio

You might also like