You are on page 1of 19

modelos probabilisticos DISTRIBUCIN GEOMTRICA En el marco de repeticiones independientes de Pruebas de Bernoulli con parmetro P se define otro tipo de experimento

o como el nmero de pruebas necesarias hasta conseguir que ocurra el evento A por primera vez. Este experimento se denomina experimento Geomtrico y define una variable aleatoria Geomtrica. El modelo Geomtrico es una variable aleatoria que se define como el nmero de repeticiones independientes de una Prueba de Bernoulli hasta que ocurre el evento A. Notas: La variable aleatoria tomar cualquier valor entero mayor o igual a uno. El modelo Geomtrico se denotar como G(p), donde p es la probabilidad de que ocurra el evento A en cada Prueba de Bernoulli. La asignacin de probabilidades de cada valor de la variable esta dada por la ecuacin 1

Ecuacin 1 Como consecuencia de la Ecuacin 1, la funcin de distribucin acumulativa de probabilidades, la funcin de densidad de probabilidades y la funcin de probabilidad vienen dadas por las ecuaciones 2, 3 y 4, respectivamente.

La Tabla 1 muestra los valores esperados ms importantes correspondientes al modelo Geomtrico. Tabla 1: Valores Esperados ms Importantes para el Modelo Geomtrico.

Para darse una idea se plantean los siguientes ejemplos: Ejemplo 1:La probabilidad de que ocurra el evento A en una Prueba de Bernoulli es 0.6. Cul es la probabilidad de que se necesiten exactamente 5 pruebas para conseguir el resultado A por primera vez?. La variable aleatoria as definida se corresponde con el modelo Geomtrico con parmetro p = 0.6. La probabilidad que se solicita viene dada por

Ejemplo 2:Considere una caja con R pelotas rojas y A pelotas amarillas. Se va a realizar un muestreo con reposicin hasta obtener una pelota amarilla. Cul es la

probabilidad de que realicen exactamente 3 extracciones para conseguir la primera pelota amarilla?. La variable aleatoria as definida se corresponde con el modelo Geomtrico con parmetro p =A/A+R . La probabilidad que se solicita viene dada por

Ejemplo 3:Un estudiante tiene probabilidad de 0.8 de aprobar el curso de probabilidades. De no aprobar el curso en este trmino lo inscribe de nuevo hasta que lo apruebe. Cul es la probabilidad de que necesite inscribirse ms de tres veces para aprobar el curso?. La variable aleatoria definida como el nmero de veces que se toma el curso de probabilidades hasta aprobarlo se corresponde con el modelo Geomtrico con parmetro p = 0.8 (se supone aqu que el valor de p permanece constante de un trmino a otro). La probabilidad que se solicita viene dada por

Nota: La Texas Instrument (TI89), con su aplicacin flash del programa de Probabilidad y Estadstica, en el caso de la distribucin Geomertrica, se da por la opcion F5, seccion F. DISTRIBUCIN exponencial La Definicin de un Modelo Poisson implica el nmero de veces que ocurre un cierto resultado en un intervalo de tiempo dado. Asociado a este modelo se puede estudiar el tiempo entre la ocurrencia de dos resultados consecutivos el cual, en consecuencia, ser un valor aleatorio. Uno de los modelos ms sencillos que permite

estudiar esta variable es el Modelo Exponencial que debe su nombre a la forma de su funcin de densidad de probabilidades. Definicin 6.3: El modelo Exponencial es una variable aleatoria donde la funcin de densidad de probabilidades viene dada por la Ecuacin 1. Notas: La variable aleatoria se define para valores reales mayores que cero. El modelo Exponencial se denotar como EXPON(), donde es un parmetro que representa el inverso del tiempo promedio entre la ocurrencia de dos eventos consecutivos.

Ejemplo 1: Para una variable aleatoria exponencial con parmetro calcule la funcin de distribucin acumulativa de probabilidades. Aplicando la Propiedad 3.5.2.2 se tiene

Ejemplo 2: Para una variable aleatoria exponencial con parmetro = 2, calcule la probabilidad de que la variable tome valores mayores a su valor esperado. Segn la Tabla 6.3, el valor esperado ser E{X} = 1/ = 0.5. Entonces, la probabilidad solicitada ser

Ejemplo 3: El tiempo de atencin al cliente en la taquilla de un banco sigue una variable aleatoria exponencial con un promedio de 5 minutos, calcule la probabilidad de que ese tiempo sea mayor a su valor esperado. Segn la Tabla anterior, el parmetro ser igual a 1/E{X} = 1/5 = 0.2. Entonces, la probabilidad solicitada ser

Distribucin Hipergeometrica El modelo Hipergeomtrico es una variable aleatoria que se define como el nmero de objetos del tipo A en un muestreo sin reposicin de tamao n en una poblacin de N objetos donde k de ellos son del tipo A. Notas: La variable aleatoria tomar cualquier valor entero entre cero y n pero debe cumplir con las restricciones de ser menor o igual a k y mayor o igual que (n + k N). El modelo Hipergeomtrico se denotar como H(N, k, n), donde N es la cantidad de objetos en la poblacin, k es el nmero de objetos tipo A en la poblacin y n es el tamao de muestra sin reposicin. La asignacin de probabilidades de cada valor de la variable est dada por la ecuacin 1.

Como consecuencia de la Ecuacin 1, la funcin de distribucin acumulativa de probabilidades, la funcin de densidad de probabilidades y la funcin de probabilidad vienen dadas por las ecuaciones 2, 3 y 4, respectivamente.

Ejemplo 1:Considere una caja con R pelotas rojas y A pelotas amarillas. Se va a realizar un muestreo sin reposicin de tamao 3. Cul es la probabilidad de que se extraigan exactamente 3 pelotas amarillas?. La variable aleatoria definida como el nmero de pelotas amarillas en el MSR de tamao 3 de la caja mencionada se corresponde con el modelo Hipergeomtrico con parmetros N = R + A, k = A y n = 3. La probabilidad que se solicita viene dada por

Ejemplo 2:Considere una caja con R pelotas rojas y A pelotas amarillas. Se va a realizar un muestreo sin reposicin de tamao 3. Cul es la probabilidad de que se extraigan ms pelotas amarillas que rojas?. La variable aleatoria definida como el nmero de pelotas amarillas en el MSR de tamao 3 de la caja mencionada se corresponde con el modelo Hipergeomtrico con parmetros N = R + A, k = A y n = 3. La probabilidad que se solicita viene dada por

Note que los clculos que involucra el modelo Hipergeomtrico se pueden volver muy engorrosos para valores grandes de sus parmetros. Distribuciones Multinomial

La distribucin multinomial es similar a la distribucin binomial, con la diferencia de que en lugar de dos posibles resultados en cada ensayo, puede haber mltiples resultados: Ejemplo de distribucin binomial: a unas elecciones se presentaron 2 partidos polticos: el POPO obtuvo un 70% de los votos y el JEJE el 30% restante. Cul es la probabilidad de que al elegir 5 ciudadanos al azar, 4 de ellos hallan votado al JEJE? Ejemplo de distribucin multinomial: a esas elecciones se presentaron 4 partidos polticos: el POPO obtuvo un 40% de los votos, el JEJE el 30%, el MUMU el 20% y el LALA el 10% restante. Cul es la probabilidad de que al elegir 5 ciudadanos al azar, 3 hayan votado al POPO, 1 al MUMU y 1 al LALA? La distribucin multinomial sigue el siguiente modelo:

Donde: X1 = x1: indica que el suceso X1 aparezca x1 veces (en el ejemplo, que el partido POPO lo hayan votado 3 personas) n: indica el nmero de veces que se ha repetido el suceso (en el ejemplo, 5 veces) n!: es factorial de n (en el ejemplo: 5 * 4 * 3 * 2 * 1) p1: es la probabilidad del suceso X1 (en el ejemplo, el 40%) Veamos el ejemplo:

Luego: P = 0,0256

10

Es decir, que la probabilidad de que las 5 personas elegidas hayan votado de esta manera es tan slo del 2,56% Nota: 0 es igual a 1, y cualquier nmero elevado a 0 es tambin igual a 1 Veamos otro ejemplo: En una fiesta, el 20% de los asistentes son espaoles, el 30% franceses, el 40% italiano y el 10% portugueses. En un pequeo grupo se han reunido 4 invitados: cual es la probabilidad de que 2 sean espaoles y 2 italianos? Aplicamos el modelo:

Luego P = 0,0384 Por lo tanto, la probabilidad de que el grupo est formado por personas de estos pases es tan slo del 3,84%. MODELO GAMMA. En el modelo Normal se puede apreciar la relacin existente entre los posibles valores que pueden tomar los parmetros y , y la forma que adquiere la curva de densidad de probabilidades al observar las Figuras 6.6 y 6.7. Una de las principales caractersticas que se desprenden de esas figuras es el carcter simtrico del fenmeno normal alrededor del valor esperado. En aquellos casos en los cuales es importante que los posibles valores de la variable sean asimtricos, el modelo Gamma explica satisfactoriamente el fenmeno.

11

Definicin 1: El modelo Gamma es una variable aleatoria donde la funcin de densidad de probabilidades. Notas: La variable aleatoria se define para los reales positivos. El modelo Gamma se denotar como GA(, ), donde y son constantes positivas. () es la funcin Gamma, definida por la ecuacin 6.10. Como propiedades de la funcin Gamma se pueden destacar las siguientes:

Asignndole distintos valores a los parmetros a y b se obtienen distintos miembros de la familia Gamma que tienen sus nombres propios debido a la popularidad de los mismos. Las Definiciones 6.8, 6.9 y 6.10 destacan los tres miembros ms comunes. Definicin 2: El modelo Gamma Estndar es una variable aleatoria Gamma donde = 1 y es variable por lo que su funcin de densidad de probabilidades viene dada por la Ecuacin 6.11.

Modelo Chi Cuadrado

12

Es una variable aleatoria Gamma donde = 2 y = v/2 (v entero positivo) por lo que su funcin de densidad de probabilidades viene dada por la Ecuacin 1. Notas: El modelo Chi Cuadrado se denotar como (v). El parmetro v en la se denomina `grados de libertad'.

Las Figuras muestran la funcin de densidad para el modelo Gamma general, Gamma Estndar y ChiCuadrado para distintos valores de y , en cada caso.

13

Ejemplo1: Digamos que 900 estudiantes expresan su voluntad por celebrar el aniversario de la institucin organizando uno de dos eventos: una acto solemne en el templo universitario o una actividad deportiva en el estadio de ftbol. Una vez hecha la encuesta se tiene que 495 alumnos prefieren la actividad deportiva y 405 se inclinan por el acto solemne. Existe una diferencia significativa entre los estudiantes en su preferencia por la actividad deportiva? La prueba estadstica para determinar la significatividad de la diferencia en las frecuencias observadas es la prueba llamada Chi Cuadrada. Para el caso que nos ocupa, se supone que si no hay diferencia en la preferencia de los alumnos de una manera perfecta, tendramos 450 alumnos eligiendo el acto solemne y otros 450 eligiendo las actividades deportivas. Esa es la frecuencia de respuestas esperadas en el caso de una igualdad absoluta. Pero tenemos frecuencias observadas un poco diferentes en un caso son 495 y en el otro 405, lo que deseamos saber es si esa diferencia observada es significativa. Lo que se hace al aplicar la frmula de chi cuadrada es restar al nmero de frecuencias observadas, el nmero de

14

frecuencias esperadas; elevar esta diferencia al cuadrado, lo que hace que todos los valores asuman un valor positivo, y luego se divide el cuadrado obtenido entre el las frecuencias esperadas. Esto se hace de manera independiente para cada una de las categoras. Una vez terminado este paso, se suman los resultados obtenidos en cada categora y ese valor resultante de la suma es el valor Chi cuadrada observado, el cual deber ser comparado con el valor Chi cuadrada crtico segn el nivel alpha de significatividad escogido y los grados de libertad correspondientes. En el caso de nuestro ejemplo se trata de dos categoras, lo que conduce a un grado de libertad. A continuacin el proceso para calcular el valor Chi cuadrada 1A favor del acto solemne: Frecuencias observadas = 405 Frecuencias esperadas = 450

2. A favor del acto deportivo: Frecuencias observadas = 495 Frecuencias esperadas = 450

3. Se suman los valores obtenidos en cada grupo para obtener el valor de chi cuadrada. 4.5 + 4.5 = 9.00 4. Se compara este valor con el valor correspondiente a un grado de libertan en la tabla de Chi cuadrado y se encuentra que el valor crtico de 2para un grado de libertad a un nivel alpha = .05 a dos colas es = 3.8941

15

Siendo que el valor Chi cuadrada ( 2) obtenido es mayor que el valor crtico, se desacredita la hiptesis nula que afirma que no existe diferencia significativa entre las frecuencias observadas y se concluye que la diferencia es significativa. Esto quiere decir que en menos de 5 casos de cada cien, una diferencia como la del valor igual o mayor al observado de Chi cuadrado en este caso ( 2 =9), puede ser atribuida a la seleccin de la muestra (azar). Ejemplo No. 2 Supongamos que en una escuela las estadsticas de aos pasados muestran que, la comisin de admisin tiende a aceptar 4 alumnos por 1 que se rechaza. Y en el presente ao una comisin constituida por un grupo diferentes de personas, acept 275 y rechaz 60. Se puede decir que esta nueva comisin difiere de manera significativa con la razn de rechazo de la anterior comisin? Corresponde en este caso calcular 2 para esta razn de rechazo comparada con la tradicional. De manera que tratndose de 330 casos en total, si la comisin anterior hubiera actuado se esperara que aceptaran 264 alumnos y rechazaran 66. As pues tomamos estos nmeros (razn 4:1) como las frecuencias esperadas en cada caso.

Al comparar el valor 2 obtenido con el valor crtico de un grado de libertad y .05 de significatividad a dos colas vemos

16

que el valor crtico (3.841) es mayor que el observado por lo que no se puede desacreditar la hiptesis nula y se concluye que la nueva comisin no muestra una poltica diferente a la de la comisin anterior. Prueba 2 para determinar la independencia de variables. En los ejemplos anteriores se han limitado a tomar decisiones respecto a categoras en una variable a partir de un solo grupo. Pero esta prueba puede ser utilizada para probar la significatividad de la diferencia entre dos o ms grupos respecto una o varias variables cuando el grupo o grupos estn clasificados por categoras. Eso es lo que se denomina prueba de independencia. Ntese que se puede utilizar para determinar independencia entre los grupos o entre las variables. A manera de ejemplo se presenta a continuacin datos obtenidos en una investigacin realizada por Silvana Poblete de Araya entre estudiantes universitarios, quienes evaluaron el desempeo de alguno de sus maestros. Se trata de un total de 780 estudiantes y para servir como nuestro ejemplo, se busca determinar si el sexo del estudiante y el sexo del maestro al cual le toc evaluar, son dependientes. Se puede calcular, a partir de los valores en las columnas y filas, que participaron un total de 328 varones y 452 mujeres los cuales evaluaron a 544 profesores y a 236 profesoras.

Las cifras que aparecen el cada recuadro representa, la superior, el nmero de frecuencias observadas (f o) y la que aparece abajo es el nmero de frecuencias esperadas (f e). Si procedemos a determinar la diferencia entre las frecuencias observadas y las esperadas y luego las elevamos al cuadrado y dividimos el resultado entre las frecuencias esperadas en 17

cada recuadro estaremos listos para sumar estos valores resultantes y computar la chi cuadrada que en este caso es 40.37. En lo que respecta a los grados de libertad, estos se calculan restando 1 al nmero de filas y de columnas y multiplicando el resultado entre s. GL = (columnas 1) (filas 1) = (2 1) (2 1) = (1) (1) = 1 Al buscar el valor 2 para 1 grado de libertad y .05 de significatividad a dos colas, encontramos el valor 3.841 que es menor que 40.37 por lo que se desacredita la hiptesis nula que afirma que el gnero del alumno y el gnero del maestro evaluado son independientes, conduciendo a la conclusin de que en este estudio, el gnero del estudiante que hizo la evaluacin y el gnero del maestro evaluado, son variables dependientes (es decir que tiene cierto grado de asociacin). Siendo que un valor 2 como el obtenido o mayor slo puede ser atribuido a factores aleatorios en 5 o menos de cada 100 casos. Ntese que en este caso estamos probando una especie de relacin entre la variable gnero del estudiante y gnero del maestro evaluado, pero no utilizamos la terminologa de las correlacin. En ese caso en lugar de decir que las variables estn relacionadas, decimos que son dependientes. Esto se explica dado el "bajo" nivel de medicin de las variables (nominal). Tambin el investigador debe cuidarse de no confundir este concepto de dependencia con la terminologa propia de estudios de causalidad donde hablamos de variables dependientes e independientes. Nota: La Texas Instrument (TI89), con su aplicacin flash del programa de Probabilidad y Estadstica, en el caso de la distribucin chisquare, se da por la opcin F5, seccin 8. Adems en el modulo de Excel se puede desarrollar por medio de una tabla. Ejemplo del metodo para calcular ChiSquare: Intervalo Li 0 Marca Cl. Ls 1 0,5 Fobs. Oi Oi 11 F teorica ni 13,45849 (oini)2/ni 0,449098 18

1 2 3 4 5 6 7 8 9 10 11

2 3 4 5 6 7 8 9 10 11 INFINITO

1,5 2,5 3,5 4,5 5,5 6,5 7,5 8,5 9,5 10,5 12,5

8 9 7 6 5 4 2 3 3 1 1

10,43964 8,097945 6,281509 4,872515 3,77957 2,931782 2,274159 1,764046 1,368356 1,061423 3,670561

0,57012 0,100483 0,082182 0,260896 0,394079 0,389214 0,033051 0,865953 1,94559 0,003554 1,942999

INTERVALOS SELLECCIONADOS Li Ls MARCA Oi 0 1 0,5 11 1 2 1,5 8 2 3 2,5 9 3 4 3,5 7 4 INFINITO 25

ni 13,45849 10,43964 8,097945 6,281509 21,71 ji**2

(oini)**2/ni 0,449098 0,57012 0,100483 0,082182 0,498577 1,70046

Los O'is y Ni's para el intervalo 4infinto se obtienen sumando las correspondientes columnas desde el LI=4 hasta el 11

19