Estadstica General Variables Aleatorias Discretas Modelos de Probabilidad
Ing. Sergio Anbal Dopazo Pgina 39 de 112
VARIABLES ALEATORIAS y DISTRIBUCIONES DE PROBABILIDAD
El concepto de una variable aleatoria nos permite pasar de los resultados experimentales a una funcin numrica de los resultados. Una variable aleatoria es una regla bien definida para asignar valores numricos a todos los resultados posibles de un experimento o fenmeno aleatorio (regla mediante la cual a cada uno de los resultados de un experimento se le asocia un nmero). Tambin se la puede definir como una descripcin numrica del resultado de un experimento (la variable aleatoria asocia un valor numrico con cada resultado posible). Por lo tanto se puede resumir que una variable aleatoria es una regla de asociacin. El valor numrico de la variable aleatoria depende del resultado del experimento.
La variable aleatoria: Primero es variable porque son posibles diferentes valores numricos. Segundo es aleatoria porque el valor observado depende de cul de los posibles resultados experimentales aparezca, y, adems, porque involucra la probabilidad de los resultados del espacio muestral. La variable aleatoria es una funcin de valor real definida sobre el espacio muestral, de manera que transforma todos los posibles resultados del espacio muestral en cantidades numricas.
Se pueden definir variables aleatorias cuyos nmeros de posibles valores es finito, o variables aleatorias cuyos valores son infinitos (sean contables o no), ya que una variable aleatoria es una caracterizacin cuantitativa de los resultados de un espacio muestral. Dependiendo de los valores numricos que asume, las variables aleatorias se pueden clasificar en variables aleatorias discretas y variables aleatorias continuas. Cabe aclarar que las variables aleatorias son discretas o continuas por su carcter intrnseco y no por como se las observa. Para ser rigurosos, para el caso continuo, el conjunto infinito debe ser no numerable; porque si fuera numerable, la variable, desde un punto de vista matemtico estricto, sera discreta. Ello no obstante, cuando un dominio tiene muchos valores posibles, se le asocia en la prctica un modelo o distribucin continua.
VARIABLES ALEATORIAS DISCRETAS
Una variable aleatoria r, es discreta si el nmero de valores que puede tomar es contable (ya sea finito o infinito), y si stos pueden arreglarse en una secuencia que corresponde con los enteros positivos. En general, todo lo que se quiere expresar de manera contable (cantidad de unidades defectuosas, cantidad de vehculos que arriban o parten, etc.), es una variable aleatoria discreta.
En resumen, una variable aleatoria es discreta si su conjunto de valores posibles es un conjunto discreto. Un conjunto es discreto si est formado por un nmero finito de elementos, o si sus elementos se pueden enumerar en secuencia de modo que haya un primer elemento, un segundo elemento, un tercer elemento, y as sucesivamente, en la lista. O sea que cada fenmeno aleatorio genera su propia variable.
En el captulo sobre procesamiento de los datos se estudi la forma de condensar la informacin contenida en una muestra o poblacin. Para una variable discreta, la forma ms simple de hacerlo era asignar a cada valor posible de la variable la frecuencia absoluta o relativa correspondiente.
Cabe destacar que toda variable aleatoria discreta r tiene un dominio bien definido entre valores extremos: Mx r mn
Si consideramos ahora un valor particular r de la variable aleatoria como un acontecimiento aleatorio, es indudable que su frecuencia relativa resulta una medida experimental de la probabilidad de su ocurrencia. Es posible entonces asociar a cada valor de r (variable aleatoria discreta) una Pgina 40 de 112 Ing. Sergio Anbal Dopazo
probabilidad, obtenindose entonces la denominada Funcin de Probabilidad (o funcin puntual de probabilidad o funcin masa de probabilidad) de la variable aleatoria considerada.
Una funcin de probabilidad (tambin llamada probabilidad puntual) ) r VA ( P ) r ( P = == = = == = , es una funcin que indica (o bien calcula) la probabilidad de que la variable aleatoria discreta en cuestin tome un valor exactamente igual a r. Es una funcin tal que se cumplen dos condiciones:
Primera condicin: r" " todo para 0 ) r VA ( P ) r ( P = == = = == =
Segunda condicin: ( (( ( ) )) ) [ [[ [ ] ]] ] 1 r P Mx mn r = == =
= == =
La segunda condicin refleja el hecho que el conjunto de acontecimientos correspondientes a los distintos valores de la variable aleatoria r es una particin de un Espacio Muestral.
Los pares ordenados [ [[ [ ] ]] ] ) r ( P ; r dan la distribucin de la variable aleatoria. La distribucin de probabilidad para una variable aleatoria discreta es una realizacin mutuamente excluyente de todos los resultados numricos posibles para esa variable aleatoria, de modo tal que la probabilidad de ocurrencia se relacione en particular con cada resultado. Estos valores de P(r), se pueden asignar de manera subjetiva y/o arbitraria (aplicando las reglas de clculo de probabilidades); o bien usando modelos matemticos de comportamiento aleatorio (razonamiento analtico).
En el razonamiento analtico, el analista parte de algunas suposiciones y deduce matemticamente la expresin de la funcin P(r). En la asignacin subjetiva y/o arbitraria, se utiliza cuando no es posible aplicar un modelo matemtico o bien no se puede realizar la experimentacin correspondiente; es un recurso terminal y los valores de P(r), se especifican de acuerdo a nuestro sentimiento o con la indicacin de la persona que mejor conoce el fenmeno en estudio y puede darnos una buena informacin; la utilidad de este procedimiento est dada por la razonable confiabilidad de la informacin disponible.
Veamos algunos ejemplos de asignacin subjetiva:
Ejemplo 1: Al tirar un dado me interesa saber el nmero que va a salir. Entonces la Variable Aleatoria r es: r = nmero que sale al tirar un dado equilibrado. El dominio de la variable aleatoria es: 6 r 1 . Su distribucin de probabilidades se visualiza en la siguiente tabla:
r 1 2 3 4 5 6 P(r) 6 1
6 1
6 1
6 1
6 1
6 1
En este ejemplo vemos como los pares ordenados [ [[ [ ] ]] ] ) r ( P ; r conforman un espacio muestral y se cumplen las dos condiciones de la funcin de probabilidad. Es una asignacin subjetiva porque suponemos que el dado est equilibrado, ya que si el dado no estara equilibrado y lo suponemos cargado de manera proporcional a su cara, la distribucin de probabilidades sera:
Estadstica General Variables Aleatorias Discretas Modelos de Probabilidad
Ing. Sergio Anbal Dopazo Pgina 41 de 112
r 1 2 3 4 5 6 P(r) 21 1
21 2
21 3
21 4
21 5
21 6
Tambin vemos como los pares ordenados [ [[ [ ] ]] ] ) r ( P ; r conforman un espacio muestral y se cumplen las dos condiciones de la funcin de probabilidad.
Ejemplo 2: Al tirar dos dados me interesa saber el nmero resultante de la suma de las caras que van a salir. Entonces la variable aleatoria r es: r = suma de las caras de dos dados equilibrados. El dominio de la variable aleatoria es: 12 r 2 . Su distribucin de probabilidades se visualiza en la siguiente tabla:
r 2 3 4 5 6 7 8 9 10 11 12 P(r) 36 1
36 2
36 3
36 4
36 5
36 6
36 5
36 4
36 3
36 2
36 1
Los pares ordenados [ [[ [ ] ]] ] ) r ( P ; r conforman un espacio muestral y se cumplen las dos condiciones de la funcin de probabilidad. Tambin es una asignacin subjetiva porque suponemos que los dados estn equilibrados y adems hemos usado para el resultado de la funcin de probabilidad, las reglas del clculo de probabilidades (que fueron desarrolladas en el captulo anterior).
A las distribuciones tipo del ejemplo 1 se las denomina distribuciones uniformes discretas o bien distribuciones rectangulares, y, a las distribuciones tipo del ejemplo 2 se las denomina distribuciones triangulares. Se ilustrar mejor en el grfico del polgono de probabilidad.
6 1
Ejemplo 1 Pgina 42 de 112 Ing. Sergio Anbal Dopazo
36 1 36 2 36 3 36 4 36 5 36 6
Ejemplo 2
As como en el procesamiento de datos, para algunas aplicaciones en general, se utilizan las Frecuencias Acumuladas; en variables aleatorias se utilizan probabilidades acumuladas, por lo que es conveniente definir a las Funciones de Distribucin de Probabilidad. Funcin de Distribucin:
= == = = == = = == = r mn r ) r ( P ) r VA ( P ) r ( F , calcula la probabilidad de que la variable aleatoria en cuestin tome un valor especfico menor o igual que r. En muchos casos tambin se utiliza:
= == = = == = Mx r ) r ( P ) r VA ( P ) r ( G , calcula la probabilidad de que la variable aleatoria en cuestin tome un valor especfico mayor o igual que r. Por lo que a la primera se la denomina funcin de probabilidades acumuladas izquierda y a la segunda funcin de probabilidades acumuladas derecha.
Se cumple: ) r ( P 1 ) r ( G ) r ( F + ++ + = == = + ++ +
De manera que podemos definir las siguientes relaciones funcionales:
) 1 r ( G ) r ( G ) 1 r ( F ) r ( F ) r ( P + ++ + = == = = == =
) 1 r ( G 1 ) r ( F + ++ + = == = , y ) 1 r ( F 1 ) r ( G = == =
) 1 B ( G ) A ( G ) 1 A ( F ) B ( F ) r ( P ) B r A ( P B A r + ++ + = == = = == = = == =
= == =
El lector ver como se cumplen las funciones de probabilidad y sus relaciones en los ejemplos desarrollados anteriormente.
Estadstica General Variables Aleatorias Discretas Modelos de Probabilidad
Ing. Sergio Anbal Dopazo Pgina 43 de 112
Al igual que en el procesamiento de datos se pueden definir los siguientes valores caractersticos:
Moda o Modo: o r Mo = == = ; es el valor de la variable aleatoria cuya probabilidad de ocurrencia es mxima. ( (( ( ) )) ) Mxima r P o = == = .
Mediana: e r Me = == = ; es el valor de la variable aleatoria tal que se cumplan las siguientes condiciones: ( (( ( ) )) ) ( (( ( ) )) ) 5 , 0 r F y 5 , 0 r F e 1 e
.
Esperanza Matemtica o Valor Medio: [ [[ [ ] ]] ]
= == = = == = = == = Mx mn r ) r ( P r ) r ( E ; (suele denominarse valor esperado de la variable o MEDIA), es el valor que toma el promedio de la variable aleatoria despus de infinitas observaciones. En el estudio de las funciones tericas de probabilidad, el valor medio es, generalmente, el parmetro ms importante. Si de un proceso aleatorio se extrae una muestra, el promedio de la misma es una medida experimental de la esperanza matemtica de la variable aleatoria, en la misma forma en que la frecuencia relativa lo es de la probabilidad. La esperanza no es una funcin de r, no depende de un valor particular de la variable, sino que es una caracterstica general de la distribucin.
Varianza: [ [[ [ ] ]] ] ( (( ( ) )) ) 2 Mx mn r 2 2 ) r ( P r ) r ( V ) )) ) ` `` `
= == = = == =
= == = ; es el valor esperado del cuadrado de las desviaciones de la variable aleatoria respecto a su esperanza matemtica. Mide la aleatoriedad misma de la variable, porque nos indica cuan dispersa puede ser la distribucin. Esta caracterstica es utilizada de manera usual para medir la dispersin de la variable.
Propiedades matemticas de la Esperanza Matemtica y de la Varianza. Sean x e y dos variables aleatorias independientes, y, a y b dos constantes, se demuestran las siguientes propiedades en la combinacin algebraica de dichos elementos:
2 y 2 x 2 2 R y x R a ; b a b y ax R + ++ + = == = = == = = == = 2 x 2 y 2 y 2 x 2 y 2 x 2 R y x R ; y x R + ++ + + ++ + = == = = == = = == =
Estas propiedades se cumplen en cualquier tipo de variable aleatoria independiente, ya sea discreta (como en este caso) o sea continua (como veremos ms adelante).
Si las variables aleatorias x e y, no son independientes, las propiedades de la varianza (en la combinacin algebraica de estas) cambian. Para desarrollar la varianza, debemos introducir el concepto de covarianza, sta es una medida de dispersin conjunta de dos variables aleatorias.
Desvo Standard: 2 ) r ( D = == = = == = ; (Desvo Estndar, Desvo Tpico o Dispersin), es el valor que mide la dispersin de los valores que toma la variable respecto a la esperanza matemtica.
Pgina 44 de 112 Ing. Sergio Anbal Dopazo
Coeficiente de Variacin: 100 Cv
= == = ; (o Dispersin Relativa) expresado en forma porcentual, con el mismo concepto visto en el procesamiento de datos. Cabe destacar que esta caracterstica, no es muy importante en las variables aleatorias discretas; pero en el caso de las variables aleatorias continuas, como veremos ms adelante, esta caracterstica adquiere vital importancia.
Coeficiente de Asimetra: ( (( ( ) )) ) [ [[ [ ] ]] ] 3 Mx mn r 3 3 r ) r ( P As
= == = = == =
= == = ; (es una caracterstica de forma), con el mismo concepto visto en el procesamiento de datos.
Cabe aclararas que si este coeficiente es mayor que cero, la distribucin tiene asimetra positiva, en cambio, si es menor que cero la distribucin tiene asimetra negativa. Si el coeficiente es nulo, diremos que la distribucin es simtrica y, en general, se cumple la propiedad de este tipo de distribuciones (Modo = Mediana = Esperanza Matemtica). Debemos sealar que el hecho que este coeficiente sea nulo, no implica necesariamente que la distribucin sea simtrica y puede no cumplirse la propiedad.
Coeficiente de Kurtosis: ( (( ( ) )) ) [ [[ [ ] ]] ] 4 Mx mn r 4 4 r ) r ( P Ku
= == = = == =
= == = ; (o Coeficiente de Aplastamiento o de Agudeza) es una caracterstica de forma, con el mismo concepto visto en el procesamiento de datos.
ESPERANZA MATEMTICA (o EXPECTATIVA) PARCIAL
En muchos problemas prcticos, especialmente aquellos problemas de decisin en que aparecen costos o ganancias con un nmero finitos de discontinuidades, resulta til la definicin de la esperanza matemtica parcial de la variable aleatoria o de una funcin de la misma.
La necesidad de la esperanza matemtica parcial aparece cuando se requiere calcular la esperanza matemtica de una funcin de una variable aleatoria tal que, ella misma o su derivada tiene un nmero finito de discontinuidades.
Esta se aplica como un poderoso procedimiento de anlisis que permite resolver un conjunto importante de problemas, en general de naturaleza econmica. Es una herramienta estadstica de decisin de suma utilidad en el clculo de valores esperados de variables econmicas atpicas. La idea de esta aplicacin de las esperanzas matemticas parciales fue propuesta por el estadstico Robert Schlaifer y el economista Howard Raiffa en sus obras (1967).
El uso de estas esperanzas matemticas parciales tiene aplicacin en variables con puntos de corte o bien variables cuya funcin es lineal a tramos; o bien variables que son funciones condicionales de una variable aleatoria simple. Permite estudiar o calcular los valores esperados de este tipo de variables aleatorias y obtener sus valores ptimos, tambin puedo calcular la famosa curva A-B-C (la cual realiza una clasificacin de elementos en un cierto orden de importancia respecto de un cierto criterio). Otro uso aparece cuando de una variable aleatoria no se quiera estudiar todo el dominio, de manera que tenemos distribuciones truncadas. Algunos ejemplos: Estadstica General Variables Aleatorias Discretas Modelos de Probabilidad
Ing. Sergio Anbal Dopazo Pgina 45 de 112
En una obra civil, la empresa constructora tiene un plazo de n das para concluirla. Si se atrasa, tiene una penalizacin de b U$s/da y si se adelanta recibe un premio de c U$s/da.
Se desea estipular el salario promedio de los individuos que ganan menos que el salario mnimo vital y mvil.
Los rollos de tela de 100 metros pueden tener cierta cantidad de fallas, si el nmero de fallas es menor que a, el rendimiento tiene un costo y si el nmero de fallas es mayor que a, el rendimiento tiene otro costo.
La demanda de camisas en temporada es variable. Si la empresa compra un lote de x camisas y las vende a todas tiene un determinado beneficio; pero si le sobran, el remanente se debe vender a otro precio
A la esperanza matemtica (que denominaremos TOTAL, porque tiene en cuenta a todo el dominio de la variable), que es el valor que toma el promedio despus de infinitas observaciones al darse todos los valores posibles de la variable aleatoria en cuestin, la habamos definido:
Esperanza Matemtica Total: [ [[ [ ] ]] ]
= == = = == = = == = Mx mn r ) r ( P r ) r ( E
Al igual que las funciones de distribucin de probabilidad, que se interpretan como una parte del espacio muestral, las expectativas parciales se pueden interpretar (de manera matemtica) como una parte de la esperanza matemtica, de modo que a la misma la podemos dividir en partes. Entonces definimos:
Expectativa Parcial Izquierda: [ [[ [ ] ]] ]
= == = = == = r mn r ) r ( P r ) r ( H . Hacemos el clculo tomando en cuenta los valores de la variable aleatoria menores o iguales que el valor r en cuestin (o sea a la izquierda de r).
Expectativa Parcial Derecha: [ [[ [ ] ]] ]
= == = Mx r ) r ( P r ) r ( J . Hacemos el clculo tomando en cuenta los valores de la variable aleatoria mayores o iguales que el valor r en cuestin (o sea a la derecha de r).
Como la sumatoria es un operador matemtico lineal tenemos:
[ [[ [ ] ]] ] [ [[ [ ] ]] ] [ [[ [ ] ]] ] ) r ( E ) r ( P r ) r ( P r ) r ( P r Mx mn r Mx 1 r r r mn r = == = = == = = == = + ++ +
= == = + ++ + = == = = == =
Observemos que la primer sumatoria corresponde a la expectativa parcial izquierda de los valores de la variable aleatoria menores o iguales que r; y la segunda sumatoria corresponde a la expectativa parcial derecha de los valores de la variable aleatoria mayores o iguales que r+1. De manera que podemos deducir lo siguiente:
) 1 r ( H ) r ( J ) 1 r ( J ) r ( H + ++ + = == = + ++ + + ++ + = == = , se demuestra que una expectativa se puede obtener a partir de la otra.
Pgina 46 de 112 Ing. Sergio Anbal Dopazo
Si quisiramos obtener la expectativa en un punto o bien en un intervalo de la variable, las expresiones son:
Expectativa Puntual: [ [[ [ ] ]] ] ) r ( P r ) r ( P r ) r ( E r r r p = == = = == =
= == = . Para un valor de la variable aleatoria exactamente igual que r.
Expectativa Parcial en un rango: ( (( ( ) )) ) [ [[ [ ] ]] ]
= == = = == = B A r ) r ( P r B r A E . Tomando en cuenta los valores de la variable aleatoria comprendidos entre A y B. Siendo estos pertenecientes al dominio de la variable aleatoria r en cuestin. Tambin se puede calcular mediante ( (( ( ) )) ) ) 1 B ( J ) A ( J ) 1 A ( H ) B ( H B r A E + ++ + = == = = == = .
Ejemplo: Tomemos en cuenta la variable que surge al tirar un dado y observar el nmero que sale. La distribucin de la variable aleatoria con sus funciones de probabilidad, se visualizan en la tabla de la pgina 4. El dominio de la variable es 6 r 1 . Recordemos el clculo de la esperanza matemtica de esta variable aleatoria:
Si realizamos la suma de las dos expectativas anteriores, tenemos comprendido al total del espacio muestral:
[ [[ [ ] ]] ] [ [[ [ ] ]] ] [ [[ [ ] ]] ] 5 , 3 5 , 2 1 6 21 6 15 6 6 ) r ( P r ) r ( P r ) r ( P r ) r ( E ) 4 ( J ) 3 ( H 6 1 r 6 4 r 3 1 r = == = + ++ + = == = = == = + ++ + = == = = == = + ++ + = == = = == = = == = + ++ +
= == = = == = = == =
Veamos de otra manera: calculemos la expectativa parcial izquierda de 2; luego la expectativa parcial entre 3 y 5; y luego la expectativa puntual de 6.
[ [[ [ ] ]] ] 5 , 0 6 3 6 1 2 6 1 1 ) r ( P r ) 2 ( H 2 1 r = == = = == = + ++ + = == = = == =
= == = ; ( (( ( ) )) ) [ [[ [ ] ]] ] 2 6 12 6 1 5 6 1 4 6 1 3 ) r ( P r 5 r 3 E 5 3 r = == = = == = + ++ + + ++ + = == = = == =
= == = ; [ [[ [ ] ]] ] 1 6 6 6 1 6 ) r ( P r ) 6 ( E 6 6 r p = == = = == = = == = = == =
= == = . Denotemos que todas son una parte del dominio completo de la variable aleatoria que si las sumamos nos da la esperanza matemtica.
Estadstica General Variables Aleatorias Discretas Modelos de Probabilidad
ESPERANZA MATEMTICA TRUNCADA (o PROMEDIOS TRUNCADOS)
Una aplicacin sencilla, prctica e intuitiva de las expectativas parciales es el clculo de los promedios truncados. Imaginemos, en el ejemplo del dado, que tiramos infinitas veces el dado y solamente promediamos los valores obtenidos en un rango de la variable aleatoria, sin considerar al resto de los valores observados. A dicho procedimiento se denomina truncamiento de la variable aleatoria (el truncamiento de una variable consiste en eliminar un intervalo de su dominio); por lo tanto el promedio obtenido solamente refiere a una parte de los valores observados descartando al resto de los otros valores obtenidos. El clculo de estos promedios se denota por medio de las siguientes expresiones:
Promedio Truncado Izquierdo: ) r ( F ) r ( H ) r VA ( T = == =
; realizamos un truncamiento a la izquierda (eliminamos valores de la variable aleatoria mayores que el valor r). O sea que tomamos en cuenta solamente los valores de la variable aleatoria menores o iguales que el valor r.
Promedio Truncado Derecho: ) r ( G ) r ( J ) r VA ( T = == =
; realizamos un truncamiento a la derecha (eliminamos valores de la variable aleatoria menores que el valor r). O sea que tomamos en cuenta solamente los valores de la variable aleatoria mayores o iguales que el valor r.
Promedio Truncado a dos Colas: ) 1 B ( G ) A ( G ) 1 B ( J ) A ( J ) 1 A ( F ) B ( F ) 1 A ( H ) B ( H ) B r A ( T + ++ + + ++ + = == =
= == =
; realizamos un truncamiento a la izquierda y a la derecha (eliminamos valores de la variable aleatoria menores que A y mayores que B). O sea que tomamos en cuenta solamente los valores de la variable aleatoria comprendidos en un rango del valor r. Tambin se puede calcular mediante la siguiente expresin: ( (( ( ) )) ) ) B r A ( P B r A E ) B r A ( T
= == =
.
Ejemplo: Tomando a la variable aleatoria que surge al observar el nmero que sale en un dado equilibrado al tirarlo de marea azarosa.
Si solamente tenemos en cuenta a los valores de la variable 3 r , truncamiento a la izquierda, y eliminamos los valores 4 r ; intuitivamente podemos deducir que el promedio de los valores 1; 2 y 3 es igual que 2. Confirmemos mediante el uso de la ecuacin correspondiente:
2 3 6 6 3 6 6 ) 3 ( F ) 3 ( H ) 3 r ( T = == = = == = = == = = == =
Si solamente tenemos en cuenta a los valores de la variable 4 r , truncamiento a la derecha, y eliminamos los valores 3 r ; intuitivamente podemos deducir que el promedio de los valores 4; 5 y 6 es igual que 5. Confirmemos mediante el uso de la ecuacin correspondiente:
Si solamente tenemos en cuenta a los valores de la variable 5 r 3 , truncamiento a dos colas, y eliminamos los valores 2 r y los valores 6 r ; intuitivamente podemos deducir que el promedio de los valores 3; 4 y 5 es igual que 4. Confirmemos mediante el uso de la ecuacin correspondiente:
4 3 12 6 3 6 12 6 1 6 4 6 6 6 18 6 2 6 5 6 3 6 15 ) 6 ( G ) 3 ( G ) 6 ( J ) 3 ( J ) 2 ( F ) 5 ( F ) 2 ( H ) 5 ( H ) 5 r 3 ( T = == = = == = = == =
= == =
= == =
= == =
= == =
Las aplicaciones mencionadas al principio (variables atpicas, variables condicionalmente lineales a tramos, etc.), las veremos en el desarrollo de cada uno de los modelos correspondientes.
Estadstica General Variables Aleatorias Discretas Modelos de Probabilidad
Ing. Sergio Anbal Dopazo Pgina 49 de 112
MODELOS (o DISTRIBUCIONES de PROBABILIDAD) de VARIABLES ALEATORIAS DISCRETAS
Para estudiar los modelos correspondientes a las variables aleatorias discretas, primero debemos introducirnos en los Procesos Fsicos de Observacin. Se reconocen en la naturaleza, en forma general, tres procesos bien diferenciados entre si: El proceso de Bernoulli, El proceso Hipergeomtrico y El proceso de Poisson.
PROCESO DE BERNOULLI (Jacques Bernoulli, 1654 1705):
La referencia bibliogrfica fue desarrollada en el captulo de probabilidades.
El proceso de Bernoulli es un proceso fsico de repeticiones de un determinado experimento en el cual observamos la ocurrencia o no de un determinado evento. Estos experimentos dan lugar a ensayos independientes repetidos, cada uno de los cuales tiene slo dos resultados posibles: xito (ocurre el evento deseado) o fracaso (no ocurre el evento deseado). Las condiciones en las que se realizan todas las pruebas deben ser iguales. A cada ensayo se llama experimento de Bernoulli. Los trminos xito y fracaso son meras etiquetas o convencionalismos; desafortunadamente, las etiquetas pueden ser engaosas en ocasiones (la bsqueda de la aparicin de una pieza defectuosa, en un proceso productivo de fabricacin, puede resultar en algunas aplicaciones, un xito).
Supongamos un proceso consistente en la ejecucin de una serie ordenada de pruebas o ensayos, cuyo resultado es aleatorio y puede clasificarse de acuerdo a la existencia o falta de un determinado atributo.
Las pruebas podran consistir, por ejemplo, en la tirada de una moneda o de un dado, o en la fabricacin de una pieza por una mquina o un proceso productivo.
Diremos que el resultado de una prueba ha sido un xito si se ha dado el atributo; en caso contrario hablaremos de un fracaso. As podran considerarse xitos en los casos anteriores la aparicin de una cara, la de un as y la de una pieza defectuosa; los acontecimientos complementarios, desde luego, se consideraran fracasos.
En un proceso de este tipo se cumplen las siguientes condiciones:
I) Independencia de las Pruebas: la probabilidad de un xito en una prueba, es independiente de que en la prueba anterior el resultado haya sido un xito o un fracaso.
II) Estabilidad: En una serie de ensayos, la probabilidad de un xito y por ende la probabilidad de un fracaso, permanece constante a lo largo de la misma.
Un Proceso de Bernoulli queda definido por un solo parmetro: La probabilidad de xito (p), que es la probabilidad (constante e independiente de las circunstancias) de la ocurrencia de un xito. Esta probabilidad cumple las caractersticas dadas en el captulo de clculo de probabilidades (o sea es un nmero real comprendido entre 0 y 1). Pese a ser un parmetro, que para el desarrollo de este captulo supondremos conocido, muchas veces el mismo es desconocido a los ojos del profesional que trata una problemtica basada en este proceso. Denotemos que si la probabilidad de la ocurrencia de un xito es p, la probabilidad de que se de un fracaso (en cada experimento realizado) es el complemento de p ( p 1 ), algunos autores a la probabilidad de fracaso la denominan q de manera convencional.
Pgina 50 de 112 Ing. Sergio Anbal Dopazo
Son ejemplos del proceso:
Tirar un dado equilibrado o viciado (cargado), Tirar una moneda, Sacar elementos con reposicin de una caja, Sacar muestras de elementos finitos de un proceso productivo o un proceso de la naturaleza (muestreo para el control de procesos), o sea la obtencin de una pieza defectuosa o buena de una mquina o de un proceso productivo que fabrica piezas en serie. En este ejemplo el proceso de Bernoulli se cumple en un perodo razonable, Sacar una muestra de un lote de tamao infinito, Todo proceso de experimentacin dnde la probabilidad del xito buscado sea constante e independiente de las circunstancias.
En el proceso de Bernoulli intervienen, adems del parmetro, dos elementos:
n, que es la cantidad de pruebas o experimentos realizados o bien a realizar (son valores enteros 1 n ); r, que es la cantidad de xitos encontrados o a encontrar (tambin valores enteros 0 r , y nunca superiores a n).
Dependiendo del elemento que se fija (parametriza), el otro elemento es una variable aleatoria.
En el caso del proceso productivo o la mquina, la condicin de estabilidad, no se cumplira si por desgaste o cambio de la herramienta, variara la frecuencia de los defectuosos o bien de los buenos. En este caso diremos que el proceso es condicionalmente estable, dado que dicha estabilidad se cumplir en un determinado intervalo de fabricacin. En el mismo caso, la condicin de independencia, tampoco se cumplira si, por ejemplo, obtuviramos piezas de una barra de material no perfectamente homogneo (o sea con fallas) y ocurriera con frecuencia que por efecto de una falla salieran dos o tres piezas defectuosas (en este caso el proceso es condicionado; y por lo tanto no se cumple el proceso de Bernoulli.
En el proceso de Bernoulli, podemos reconocer bsicamente dos modelos o distribuciones de probabilidad: El Modelo Binomial y El Modelo de Pascal, los cuales responden (recprocamente) a dos interrogantes:
a) Si se realiza una serie de n pruebas, qu probabilidad hay de que ocurran exactamente r xitos? b) Si se realiza una serie de pruebas a fin de obtener r xitos, qu probabilidad hay de que sea necesario llegar a efectuar exactamente n pruebas para obtener dichos xitos?
Tambin en el proceso de Bernoulli, podemos reconocer otros modelos: El Modelo de Bernoulli; El Modelo Geomtrico, El Modelo Binomial Negativo y El Modelo Multinomial.
A continuacin desarrollaremos los modelos bsicos.
Estadstica General Variables Aleatorias Discretas Modelos de Probabilidad
Ing. Sergio Anbal Dopazo Pgina 51 de 112
A. MODELO o DISTRIBUCIN de PROBABILIDAD BINOMIAL:
Adems del parmetro del proceso de Bernoulli p (probabilidad de xito constante en cada experimento), se fija el valor de n (cantidad de pruebas o experimentos a realizar o bien realizados), o sea que el valor de n se convierte en parmetro. El valor de n se fija antes de los experimentos.
Es uno de los modelos (o distribucin de probabilidad) discretos ms tiles. Sus reas de aplicacin incluyen inspeccin de calidad, ventas, mercadotecnia, medicina y otras aplicaciones.
La variable aleatoria es r (cantidad de xitos encontrados o bien a encontrar en n experimentos realizados o bien a realizar). Se debe observar que primero se realizan los experimentos y luego se cuentan los xitos obtenidos. Observemos que la variable aleatoria es un conteo del nmero de xitos en una determinada cantidad de experimentos con un criterio especificado.
Parmetros del Modelo: n y p Variable Aleatoria: r
Dominio de la Variable Aleatoria: n r 0 . La variable binomial de parmetros n y p, es la variable discreta que toma valores enteros comprendidos en el intervalo del dominio.
El modelo o funcin de probabilidad, describe (o calcula) la probabilidad de obtener exactamente r xitos en n experimentos o pruebas realizadas con una probabilidad de xito constante p, o sea en experimentos de tipo Bernoulli. Su expresin es:
( (( ( ) )) ) ( (( ( ) )) ) ) r n ( r ) r n ( r b p 1 p nCr p 1 p r n ) p ; n / r ( P ) r VA ( P
= == = | || | | || |
| || |
\ \\ \ | || | = == = = == =
Veamos la demostracin de esta expresin en el siguiente ejemplo: Se arroja un dado equilibrado buscando que salga un As; se quiere averiguar la probabilidad de que salgan exactamente 2 ases, en 3 tiradas consecutivas. Observemos que estamos en presencia de un proceso de Bernoulli, donde el xito es la obtencin de un as en cada tirada; p es la probabilidad de que salga un as en cada tirada, esta probabilidad es constante en cada tirada y vale 6 1 p = == = , se deduce que la probabilidad de fracaso (de que no salga As) es 6 5 p 1 q = == = = == = ; el nmero de experimentos a realizar es 3 n = == =
y la cantidad de xitos deseados es 2 r = == = . Si resolvemos el problema con los conceptos desarrollados en el captulo anterior, deberamos observar todas las combinaciones posibles en tres tiradas consecutivas de un dado equilibrado. La cantidad de posibles resultados es 8 y surge de realizar la siguiente cuenta 8 2 3 = == = , son 2 resultados posibles en cada tirada y se realizan un total de 3 tiradas, visualicemos en una tabla los posibles resultados:
De los 8 posibles resultados, slo 3 de ellos son favorables a las condiciones estipuladas
Los parmetros son: 3 n = == = (cantidad de tiradas) y 6 1 p = == = (probabilidad de xito).
La variable aleatoria es r (cantidad de ases a obtener en las 3 tiradas), con dominio 3 r 0 .
Primer Tirada Segunda Tirada Tercer Tirada xito xito xito Fracaso Fracaso Fracaso xito Fracaso Fracaso Fracaso xito Fracaso Fracaso Fracaso xito xito xito Fracaso xito Fracaso xito Fracaso xito xito Pgina 52 de 112 Ing. Sergio Anbal Dopazo
De manera que la probabilidad de obtener 2 ases en 3 tiradas se puede calcular con la siguiente expresin:
( (( ( ) )) ) ( (( ( ) )) ) ( (( ( ) )) ) [ [[ [ ] ]] ] ( (( ( ) )) ) ( (( ( ) )) ) ( (( ( ) )) ) ( (( ( ) )) ) ( (( ( ) )) ) ( (( ( ) )) ) ( (( ( ) )) ) ( (( ( ) )) ) ( (( ( ) )) ) ) p 1 ( p 3 p p ) p 1 ( p ) p 1 ( p ) p 1 ( p p E P E P F P E P F P E P F P E P E P E E F E F E F E E P ) 2 r ( P 2 3 2 1 3 2 1 3 2 1 3 2 1 3 2 1 3 2 1 = == = + ++ + + ++ + = == = = == = + ++ + + ++ + = == = = == = = == = = == =
Analicemos el resultado de la expresin: p (la probabilidad de que salga un as en cada tirada) est elevado a la cantidad de ases deseados 2 p ; el complemento de esta probabilidad p 1 q = == = (la probabilidad de que no salga un as en cada tirada) est elevado a la cantidad de no ases deseados ( (( ( ) )) ) ( (( ( ) )) ) p 1 p 1 1 = == = y el nmero 3 (representa el nmero de combinaciones favorables dentro de las 8 combinaciones posibles), este nmero se calcula con la siguiente expresin:
3 2 6 ! 1 ! 2 ! 3 2 3 C 2 3 = == = = == =
= == = | || | | || |
| || |
\ \\ \ | || | = == =
Ahora demostremos que el modelo es una funcin de probabilidad, para ello se debe cumplir con las 2 condiciones: la primera condicin se demuestra calculando las P(r), siendo todas mayores que cero; la segunda condicin ( (( ( ) )) ) [ [[ [ ] ]] ] ( (( ( ) )) )
= == =
= == = ( (( (
( (( (
| || | | || |
| || |
\ \\ \ | || | = == = = == = n 0 r ) r n ( r Mx mn r p 1 p r n 1 r P , se demuestra de la siguiente manera:
Partiendo del conocimiento (por el Binomio de Newton) de que:
( (( ( ) )) )
= == =
( (( (
( (( (
| || | | || |
| || |
\ \\ \ | || | = == = + ++ + n 0 i ) i n ( i n B A i n B A
Llamando p A = == = y p 1 B = == = , tenemos: ( (( ( ) )) ) ( (( ( ) )) ) [ [[ [ ] ]] ] 1 1 p 1 p p 1 p r n n n n 0 r ) r n ( r = == = = == = + ++ + = == = ( (( (
( (( (
| || | | || |
| || |
\ \\ \ | || |
= == =
Quedando demostrado que el modelo Binomial es una Funcin de probabilidad.
Funcin de Probabilidad Acumulada Izquierda:
= == =
( (( (
( (( (
| || | | || |
| || |
\ \\ \ | || | = == = r 0 x ) x n ( x b ) p 1 ( p x n ) p ; n / r ( F ) r VA ( P
Funcin de Probabilidad Acumulada Derecha:
= == =
( (( (
( (( (
| || | | || |
| || |
\ \\ \ | || | = == = n r x ) x n ( x b ) p 1 ( p x n ) p ; n / r ( G ) r VA ( P
Como r es una variable aleatoria discreta, se cumplen las relaciones funcionales dadas para la generalidad de ellas.
Estadstica General Variables Aleatorias Discretas Modelos de Probabilidad
Ing. Sergio Anbal Dopazo Pgina 53 de 112
Moda: o r Mo = == = ; verifica las siguientes condiciones: ( (( ( ) )) ) [ [[ [ ] ]] ] ( (( ( ) )) ) p p n Mo p 1 p n + ++ + < << < < << <
Mediana: e r Me = == = . Para la mayora de los casos la mediana es la parte entera de ( (( ( ) )) ) p n , y est dada por la siguiente expresin: ( (( ( ) )) ) p n . E . P Me = == =
Para otros casos no hay una expresin plausible para determinarla, por ello tambin se deben cumplir las siguientes condiciones:
( (( ( ) )) ) ( (( ( ) )) ) 5 , 0 p ; n / r F y 5 , 0 p ; n / 1 r F e b e b
Esperanza Matemtica: p n ) r ( E = == = = == =
Varianza: ( (( ( ) )) ) p 1 p n ) r ( V 2 = == = = == =
Se cumplen en este modelo las propiedades matemticas de la esperanza matemtica y de la varianza enunciadas en las generalidades.
Coeficiente de Asimetra: ( (( ( ) )) ) ( (( ( ) )) ) p 1 p n p 2 1 As 3
= == = = == =
Coeficiente de Kurtosis: ( (( ( ) )) ) [ [[ [ ] ]] ] ( (( ( ) )) ) p 1 p n p 1 p 6 1 3 Ku 4
+ ++ + = == = = == = . Este coeficiente tiende a 3 cuando n tiende a infinito, este resultado traduce la convergencia de la ley Binomial a la ley Normal. Cabe aclarar que en la ley normal, como veremos en el siguiente captulo, este coeficiente es exactamente igual a 3.
Expectativa Parcial Izquierda: ( (( ( ) )) ) ) p ; 1 n / 1 r ( F p n p 1 p x n x ) p ; n / r ( H b r 0 x ) x n ( x b = == = ( (( (
( (( (
| || | | || |
| || |
\ \\ \ | || | = == =
= == =
Este modelo, para ciertas restricciones, puede calcular en forma aproximada al modelo Hipergeomtrico; y puede ser calculado de forma aproximada por el modelo de Poisson o por el modelo Normal. (Ver las restricciones de la aproximacin en pginas: 109 110)
B. MODELO o DISTRIBUCIN de PROBABILIDAD de PASCAL:
Blaise Pascal (Clermont, Francia, 1623 Pars, Francia 1662) fue un matemtico, fsico, filsofo catlico y escritor. Sus contribuciones a las matemticas y las ciencias naturales incluyen el diseo y construccin de calculadoras mecnicas, aportes a la teora de la probabilidad, investigaciones sobre los fluidos y la aclaracin de conceptos tales como la presin y el vaco. Despus de una experiencia religiosa profunda en 1654, Pascal abandon las matemticas y la fsica para dedicarse a la filosofa y a la teologa.
Pgina 54 de 112 Ing. Sergio Anbal Dopazo
Adems del parmetro del proceso de Bernoulli p (probabilidad de xito constante en cada experimento), se fija el valor de r (cantidad deseada de xitos a obtener), o sea que el valor de r se convierte en parmetro. El valor de r se fija antes de los experimentos.
La variable aleatoria es n (cantidad de pruebas o experimentos necesarios para obtener r xitos deseados). Se debe observar que se van realizando los experimentos hasta obtener los xitos deseados (los experimentos paran cuando se encuentra el r -simo xito). Observemos que la variable aleatoria es un conteo del nmero de experimentos realizados o a realizar para la obtencin de una cantidad determinada de xitos con un criterio especificado.
Parmetros del Modelo: r y p (siendo 1 r ) Variable Aleatoria: n
Dominio de la Variable Aleatoria: n r . La variable de Pascal de parmetros r y p, es la variable discreta que toma valores enteros comprendidos en el intervalo del dominio, deberemos realizar como mnimo r pruebas.
El modelo o funcin de probabilidad, describe (o calcula) la probabilidad de necesitar exactamente n experimentos o pruebas para obtener r xitos deseados con una probabilidad de xito constante p, o sea en experimentos de tipo Bernoulli. Su expresin es:
( (( ( ) )) ) ) r n ( r pa p 1 p 1 r 1 n ) p ; r / n ( P ) n VA ( P
| || | | || |
| || |
\ \\ \ | || |
= == = = == =
Por las propiedades del modelo, se puede afirmar la siguiente igualdad:
) p ; n / r ( P n r ) p ; r / n ( P b pa = == =
Desarrollemos a continuacin las funciones de distribucin de probabilidad de este modelo y sus caractersticas (se puede observar, en las siguientes expresiones, la relacin matemtica con el modelo Binomial).
Funcin de Probabilidad Acumulada Izquierda:
) p ; n / r ( G ) p 1 ( p 1 r 1 x ) p ; r / n ( F ) n VA ( P b n r x ) r x ( r pa = == = ( (( (
( (( (
| || | | || |
| || |
\ \\ \ | || |
= == =
= == =
Funcin de Probabilidad Acumulada Derecha:
) p ; 1 n / 1 r ( F ) p 1 ( p 1 r 1 x ) p ; r / n ( G ) n VA ( P b n x ) r x ( r pa = == = ( (( (
( (( (
| || | | || |
| || |
\ \\ \ | || |
= == =
= == =
Para ambas funciones de distribucin se deben usar programas apropiados o bien planillas de clculo que tengan esta distribucin. Si se quiere usar tablas notemos que las tres funciones tienen una relacin con el modelo Binomial.
Como n es una variable aleatoria discreta, se cumplen las relaciones funcionales dadas para la generalidad de ellas.
Estadstica General Variables Aleatorias Discretas Modelos de Probabilidad
Ing. Sergio Anbal Dopazo Pgina 55 de 112
Las caractersticas de este modelo tienen el mismo concepto que lo desarrollado para la generalidad de las variables aleatorias discretas, con las particularidades que se muestran a continuacin:
Moda: o n Mo = == = ; no hay una expresin plausible para determinarla.
Mediana: e n Me = == = ; no hay una expresin plausible para determinarla, por ello tambin se deben cumplir las siguientes condiciones:
( (( ( ) )) ) ( (( ( ) )) ) 5 , 0 p ; r / n F y 5 , 0 p ; r / 1 n F e pa e pa
Esperanza Matemtica: p r ) n ( E = == = = == =
Varianza: ( (( ( ) )) ) 2 2 p p 1 r ) n ( V
= == = = == =
Se cumplen en este modelo las propiedades matemticas de la esperanza matemtica y de la varianza enunciadas en las generalidades.
Coeficiente de Asimetra: ( (( ( ) )) ) p 1 r p 2 As 3
= == = = == =
Coeficiente de Kurtosis: [ [[ [ ] ]] ] ( (( ( ) )) ) p 1 r 6 p 6 p 3 Ku 2 4
+ ++ + + ++ + = == = = == =
Expectativa Parcial Izquierda: ( (( ( ) )) ) ) p ; 1 r / 1 n ( F p r p 1 p 1 r 1 x x ) p ; r / n ( H pa n r x ) r x ( r pa + ++ + + ++ + = == = ( (( (
( (( (
| || | | || |
| || |
\ \\ \ | || |
= == =
= == =
C. MODELO o DISTRIBUCIN de PROBABILIDAD GEOMTRICO/A:
Adems del parmetro del proceso de Bernoulli p (probabilidad de xito constante en cada experimento), se fija el valor de r = 1 (cantidad deseada de xitos a obtener).
La variable aleatoria es n (cantidad de pruebas o experimentos necesarios hasta obtener el xito deseado). Se debe observar que se van realizando los experimentos hasta obtener el primer xito encontrado (los experimentos paran cuando se encuentra el primer xito).
Denote, el lector que este modelo se puede estudiar como un caso particular del modelo de Pascal.
Ejemplos: la cantidad de veces que hay que tirar un dado para sacar un as, la cantidad de tiros necesarios en un blanco hasta obtener el acierto, etctera.
Pgina 56 de 112 Ing. Sergio Anbal Dopazo
D. MODELO o DISTRIBUCIN de PROBABILIDAD MULTINOMIAL:
Este modelo es una generalizacin del modelo Binomial, cada prueba o experimento puede tener ms de dos resultados posibles (por ejemplo: 1 calidad, 2 calidad y descarte). Este modelo se presenta cuando el resultado de una experimentacin puede clasificarse de acuerdo a ms de dos atributos. Por lo tanto son varios xitos buscados a la vez, siendo la coleccin de atributos incompatibles entre si. Se pueden definir varios parmetros del proceso de Bernoulli p 1 , p 2 , , p k
(probabilidad de los varios xitos constantes en cada experimento), se fija el valor de n (cantidad de pruebas o experimentos a realizar o bien realizados), o sea que el valor de n se convierte en parmetro.
Las variables aleatorias son r 1 , r 2 , , r k (cantidad de los distintos xitos encontrados o bien a encontrar en n experimentos realizados o bien a realizar). Observemos que las variables aleatorias son un conteo del nmero de los distintos xitos encontrados o bien a encontrar.
Parmetros del Modelo: n y p 1 , p 2 , , p k Variable Aleatoria: r 1 , r 2 , , r k
Dominio de la Variable Aleatoria: 0 r i .
Hay que tener en cuenta las siguientes restricciones o propiedades:
n r k 1 r i = == =
= == = y 1 p k 1 p i = == =
= == =
El modelo o funcin de probabilidad, describe (o calcula) la probabilidad de obtener exactamente r 1 , r 2 , , r k xitos en n experimentos o pruebas realizadas con probabilidades de xito constantes p 1 , p 2 , , p k , o sea en experimentos de tipo Bernoulli. Su expresin es:
= == = ( (( (
( (( (
= == = = == = = == = = == = k 1 i i r i k 2 1 k 2 1 mu k k 2 2 1 1 ! r p ! n ) p ,..., p , p ; n / r ;...; r ; r ( P ) r VA ;...; r VA ; r VA ( P
Como r i son variables aleatorias discretas, se cumplen las relaciones funcionales dadas para la generalidad de ellas.
Esperanza Matemtica: ( (( ( ) )) ) i r i p n r E i = == = = == = .
Varianza: ) p 1 ( p n ) r ( V i i 2 r i i = == = = == =
Estadstica General Variables Aleatorias Discretas Modelos de Probabilidad
Ing. Sergio Anbal Dopazo Pgina 57 de 112
PROCESO HIPERGEOMTRICO
El proceso Hipergeomtrico es un proceso fsico de repeticiones de un determinado experimento en el cual observamos la ocurrencia o no de un determinado evento. Estos experimentos dan lugar a ensayos repetidos, los cuales no son independientes entre s, y, tambin, al igual que en el proceso de Bernoulli, tienen cada uno slo dos resultados posibles: xito (ocurre el evento deseado) o fracaso (no ocurre el evento deseado). Las condiciones en las que se realizan todas las pruebas no son iguales, porque a medida que ocurre un resultado de una prueba, ste condiciona el resultado de la siguiente prueba.
En un proceso de este tipo se cumplen las siguientes condiciones:
I) Las Pruebas no son independientes: la probabilidad de un xito en una prueba, est condicionada por el resultado de la prueba anterior (si fue un xito o un fracaso, entonces habr un xito o un fracaso menos respectivamente).
II) No Estabilidad: En una serie de ensayos, la probabilidad de un xito no permanece constante a lo largo de la misma.
III) Poblacin, Lote o Universo Finito: A diferencia del proceso de Bernoulli (que se da en una poblacin infinita), este proceso se da en una poblacin acotada o finita.
Un proceso Hipergeomtrico queda definido por dos parmetros: total de elementos, posibles, que intervienen en el experimento a realizar, o tamao del lote a examinar N; y la cantidad total de xitos en el total de elementos posibles o en el lote a examinar R. Pese a ser dos parmetros, que para el desarrollo de este captulo supondremos conocidos, muchas veces los mismos son desconocidos a los ojos del profesional que trata una problemtica basada en este proceso. Cabe aclarar que en la mayora de las aplicaciones se suele conocer el tamao del lote a examinar N.
Son ejemplos del proceso:
Nmeros salidos en una lotera, Sacar elementos sin reposicin de una caja, Sacar una muestra de un lote de tamao finito (muestreo para aceptacin de un lote), Todo proceso de experimentacin dnde la probabilidad del xito buscado en cada experimento condicione a la probabilidad del xito del siguiente experimento (o sea que la probabilidad del xito no es constante).
Este proceso surgi a partir de la necesidad del control de calidad de lotes acotados, pero dada la evidente imposibilidad de conocer la composicin del lote, este proceso se usa para verificar los supuestos declarados por los fabricantes y proveedores. La tendencia actual es el control de los procesos a los cuales les cabe perfectamente el proceso de Bernoulli.
Si en este proceso las extracciones del lote se realizan con reposicin o bien se realizan en un lote de tamao infinito, este proceso se convierte en el proceso de Bernoulli.
En el proceso Hipergeomtrico intervienen, adems de los dos parmetros, dos elementos:
n, que es la cantidad de pruebas o experimentos realizados o bien a realizar, o mejor dicho la muestra extrada (son valores enteros 1 n , y nunca superiores a N); Pgina 58 de 112 Ing. Sergio Anbal Dopazo
r, que es la cantidad de xitos encontrados o a encontrar (tambin valores enteros 0 r , y nunca superiores a n ni a R).
Dependiendo del elemento que se fija (parametriza), el otro elemento es una variable aleatoria.
En el proceso Hipergeomtrico, podemos reconocer dos modelos o distribuciones de probabilidad bsicos: El Modelo Hipergeomtrico y El Modelo de Pascal Hipergeomtrico o HiperPascal, los cuales responden (recprocamente) a dos interrogantes:
a) Si se extrae una muestra de n elementos de un lote de tamao N conteniendo un total de xitos R, qu probabilidad hay de encontrar exactamente r xitos en esa muestra? b) Si se extrae una serie de elementos de un lote de tamao N (conteniendo un total de xitos R), a fin de encontrar r xitos, qu probabilidad hay de que sea necesario llegar a extraer exactamente una muestra de n elementos para obtener dichos xitos?
Tambin en el proceso Hipergeomtrico, podemos reconocer a otro modelo: El Modelo Hipergeomtrico Multivariado o Multipergeomtrico.
A continuacin desarrollaremos los bsicos.
A. MODELO o DISTRIBUCIN de PROBABILIDAD HIPERGEOMTRICO/A
Adems de los dos parmetros del proceso Hiergeomtrico N (tamao del lote o total de elementos a experimentar) y R (cantidad total de xitos en el lote o en los elementos a experimentar), se fija el valor de n (cantidad de pruebas o experimentos a realizar o bien realizados, o sea el tamao de la muestra a extraer del lote en cuestin), o sea que el valor de n se convierte en parmetro. El valor de n se fija antes de las extracciones.
La variable aleatoria es r (cantidad de xitos encontrados o bien a encontrar en n extracciones realizadas o bien a realizar, o sea en la muestra extrada). Se debe observar que primero se extrae la muestra y luego se cuentan los xitos obtenidos. Observemos que la variable aleatoria es un conteo del nmero de xitos en una determinada cantidad de extracciones con un criterio especificado.
Parmetros del Modelo: n, N y R Variable Aleatoria: r, siendo R r
Dominio de la Variable Aleatoria: ( (( ( ) )) ) [ [[ [ ] ]] ] [ [[ [ ] ]] ] R ; n Mn r R N n ; 0 Mx .
El modelo o funcin de probabilidad, describe (o calcula) la probabilidad de obtener exactamente r xitos en n extracciones realizadas o bien en una muestra de un lote de tamao N que contiene R xitos, o sea en experimentos de tipo Hipergeomtrico. Su expresin es una simple aplicacin de la frmula de Laplace (cantidad de casos favorables sobre la cantidad de casos posibles, o sea resultados totales equiprobables):
| || | | || |
| || |
\ \\ \ | || | | || | | || |
| || |
\ \\ \ | || |
| || | | || |
| || |
\ \\ \ | || | = == = = == = n N r n R N r R ) R ; N ; n / r ( P ) r VA ( P h
Estadstica General Variables Aleatorias Discretas Modelos de Probabilidad
Ing. Sergio Anbal Dopazo Pgina 59 de 112
Desarrollemos a continuacin las funciones de distribucin de probabilidad de este modelo y sus caractersticas.
Funcin de Probabilidad Acumulada Izquierda:
= == = ( (( ( ( (( ( ( (( ( ( (( ( ( (( (
( (( (
| || | | || |
| || |
\ \\ \ | || | | || | | || |
| || |
\ \\ \ | || |
| || | | || |
| || |
\ \\ \ | || | = == = r mn x h n N x n R N x R ) R ; N ; n / r ( F ) r VA ( P
Funcin de Probabilidad Acumulada Derecha:
= == = ( (( ( ( (( ( ( (( ( ( (( ( ( (( (
( (( (
| || | | || |
| || |
\ \\ \ | || | | || | | || |
| || |
\ \\ \ | || |
| || | | || |
| || |
\ \\ \ | || | = == = Mx r x h n N x n R N x R ) R ; N ; n / r ( G ) r VA ( P
Para ambas funciones de distribucin se deben usar tablas, programas apropiados o bien planillas de clculo que tengan esta distribucin.
Como r es una variable aleatoria discreta, se cumplen las relaciones funcionales dadas para la generalidad de ellas.
Las caractersticas de este modelo tienen el mismo concepto que lo desarrollado para la generalidad de las variables aleatorias discretas, con las particularidades que se muestran a continuacin:
+ ++ + + ++ + + ++ + 2 N 1 n R nR Mo 2 N 1 n R N nR
Mediana: e r Me = == = . No hay una expresin plausible para determinarla, por ello tambin se deben cumplir las siguientes condiciones:
( (( ( ) )) ) ( (( ( ) )) ) 5 , 0 R ; N ; n / r F y 5 , 0 R ; N ; n / 1 r F e h e h
Esperanza Matemtica: ( (( ( ) )) ) N R n r E = == = = == =
Varianza: ( (( ( ) )) ) | || |
| || |
\ \\ \ | || |
| || |
| || |
\ \\ \ | || | = == = = == = 1 N n N N R 1 N R n r V 2 . Si observamos las ecuaciones de la esperanza matemtica y de la varianza, vemos una similitud con el modelo binomial; salvo que en la varianza se agrega un factor de correccin por finitud de la poblacin | || |
| || |
\ \\ \ | || |
1 N n N , este factor tiende a 1 cuando el tamao del lote N tiende a infinito. Cabe aclarar que cuando los experimentos se realizan con poblaciones de tamao acotado o finito, siempre Pgina 60 de 112 Ing. Sergio Anbal Dopazo
la varianza se ve afectada por este factor. A este factor tambin se lo llama coeficiente de exhaustividad.
Se cumplen en este modelo las propiedades matemticas de la esperanza matemtica y de la varianza enunciadas en las generalidades.
Coeficiente de Asimetra: ( (( ( ) )) ) ( (( ( ) )) ) ( (( ( ) )) ) ( (( ( ) )) ) ( (( ( ) )) ) ( (( ( ) )) ) [ [[ [ ] ]] ] n N R N R n 2 N 1 N n 2 N R 2 N As 3
= == = n N n 6 Nn 2 n N R N N R 3 n N n 6 1 N N n N R N 3 N 2 N nR 1 N N 2 2 2 2 4
Expectativa Parcial Izquierda: ) 1 R ; 1 N ; 1 n / 1 r ( F N R n ) R ; N ; n / r ( H h h = == =
Se puede afirmar que se cumplen las siguientes igualdades:
) R N ; N ; n / r n ( P ) R ; N ; n N / r R ( P ) n ; N ; R / r ( P ) R ; N ; n / r ( P h h h h = == = = == = = == =
) R N ; N ; n N / n R N r ( P ) R ; N ; n / r ( P h h + ++ + = == =
) R N ; N ; n / r n ( G ) R ; N ; n N / r R ( G ) n ; N ; R / r ( F ) R ; N ; n / r ( F h h h h = == = = == = = == =
) R N ; N ; n N / n R N r ( F ) R ; N ; n / r ( F h h + ++ + = == =
Este modelo, para ciertas condiciones y restricciones, se puede calcular en forma aproximada por el modelo Binomial. (Ver las restricciones de la aproximacin en pginas: 109 110)
B. MODELO o DISTRIBUCIN de PROBABILIDAD PASCAL HIPERGEOMTRICO o HIPER-PASCAL
Adems de los dos parmetros del proceso Hipergeomtrico N (tamao del lote o total de elementos a experimentar) y R (cantidad total de xitos en el lote o en los elementos a experimentar), se fija el valor de r (cantidad deseada de xitos a obtener), o sea que el valor de r se convierte en parmetro. El valor de r se fija antes de las extracciones a realizar.
La variable aleatoria es n (cantidad de extracciones necesarias o muestra necesaria para obtener r xitos deseados). Se debe observar que se van realizando las extracciones hasta obtener los xitos deseados (las extracciones paran cuando se encuentra el r -simo xito). Observemos que la variable aleatoria es un conteo del nmero de extracciones realizadas o a realizar para la obtencin de una cantidad determinada de xitos con un criterio especificado.
Estadstica General Variables Aleatorias Discretas Modelos de Probabilidad
Ing. Sergio Anbal Dopazo Pgina 61 de 112
Parmetros del Modelo: r, N y R, siendo N R r 1
Variable Aleatoria: n
Dominio de la Variable Aleatoria: ( (( ( ) )) ) r R N n r + ++ + . La variable Hiper-Pascal es la variable discreta que toma valores enteros comprendidos en el intervalo del dominio, deberemos realizar como mnimo r extracciones.
El modelo o funcin de probabilidad, describe (o calcula) la probabilidad de necesitar exactamente n extracciones o muestra para obtener r xitos determinada de un lote de tamao N que contiene R xitos, o sea en experimentos de tipo Hipergeomtrico. Su expresin es:
| || | | || |
| || |
\ \\ \ | || | | || | | || |
| || |
\ \\ \ | || |
| || | | || |
| || |
\ \\ \ | || |
= == = | || | | || |
| || |
\ \\ \ | || | | || | | || |
| || |
\ \\ \ | || |
| || | | || |
| || |
\ \\ \ | || | = == = = == = R N 1 r 1 n r R n N n N r n R N r R n r ) R ; N ; r / n ( P ) n VA ( P pah
Se puede demostrar que el modelo es una funcin de probabilidad. Esta demostracin no ser desarrollada.
Se puede afirmar que se cumple la siguiente igualdad:
) R ; N ; n / r ( P n r ) R ; N ; r / n ( P h pah = == =
Desarrollemos a continuacin las funciones de distribucin de probabilidad de este modelo y sus caractersticas (se puede observar, en las siguientes expresiones, la relacin matemtica con el modelo Hipergeomtrico).
Funcin de Probabilidad Acumulada Izquierda:
) R ; N ; n / r ( G x N r x R N r R x r ) R ; N ; r / n ( F ) n VA ( P h n r x pah = == = ( (( ( ( (( ( ( (( ( ( (( ( ( (( (
( (( (
| || | | || |
| || |
\ \\ \ | || | | || | | || |
| || |
\ \\ \ | || |
| || | | || |
| || |
\ \\ \ | || | = == =
= == =
Funcin de Probabilidad Acumulada Derecha:
) R ; N ; 1 n / 1 r ( F x N r x R N r R x r ) R ; N ; r / n ( G ) n VA ( P h Mx n x pah = == = ( (( ( ( (( ( ( (( ( ( (( ( ( (( (
( (( (
| || | | || |
| || |
\ \\ \ | || | | || | | || |
| || |
\ \\ \ | || |
| || | | || |
| || |
\ \\ \ | || | = == =
= == =
Para ambas funciones de distribucin se deben usar programas apropiados o bien planillas de clculo que tengan esta distribucin. Si se quiere usar tablas notemos que las tres funciones tienen una relacin con el modelo hipergeomtrico.
Pgina 62 de 112 Ing. Sergio Anbal Dopazo
Como n es una variable aleatoria discreta, se cumplen las relaciones funcionales dadas para la generalidad de ellas.
Las caractersticas de este modelo tienen el mismo concepto que lo desarrollado para la generalidad de las variables aleatorias discretas, con las particularidades que se muestran a continuacin:
Moda: o n Mo = == = . No hay una expresin plausible para determinarla.
Mediana: e n Me = == = . No hay una expresin plausible para determinarla, por ello tambin se deben cumplir las siguientes condiciones:
( (( ( ) )) ) ( (( ( ) )) ) 5 , 0 R ; N ; r / n F y 5 , 0 R ; N ; r / 1 n F e pah e pah
Esperanza Matemtica: ( (( ( ) )) ) ) 1 R ( ) 1 N ( r n E + ++ + + ++ + = == = = == =
Varianza: ( (( ( ) )) ) 2 2 1 ) 2 R ( ) 2 N ( ) 1 r ( n V ) )) ) ` `` `
( (( (
( (( (
+ ++ + + ++ + + ++ + = == = = == =
Se cumplen en este modelo las propiedades matemticas de la esperanza matemtica y de la varianza enunciadas en las generalidades.
Coeficiente de Asimetra: No hay una expresin plausible para determinarlo.
Coeficiente de Kurtosis: No hay una expresin plausible para determinarlo.
Expectativa Parcial Izquierda:
) 1 R ; 1 N ; 1 r / 1 n ( F ) 1 R ( ) 1 N ( r ) R ; N ; r / n ( H pah pah + ++ + + ++ + + ++ + + ++ + + ++ + + ++ + = == =
El Proceso de Poisson con sus modelos relacionados ser desarrollado ms adelante en las pginas 103 a 108.