DISTRIBUCIONES DE PROBABILIDAD (RESUMEN) VARIABLE ALEATORIA: un experimento produce observaciones numricas que varan de muestra a muestra. Una VARIABLE ALEATORIA se define como una funcin con valores numricos definida sobre un espacio muestral. Y es aleatoria porque los valores implican un suceso numrico aleatorio. CLASIFICACIN. VAR. ALEA. DISCRETA.-es una variable que solo puede asumir un conjunto numerable de valores. Ejemplos: el nmero de tornillos en un lote de una produccin industrial, el nmero de hogares que tienen luz elctrica en cierta zona, el nmero de personas en una fila que compraran su boleto para una funcin de cine, etc. VAR. ALEA. CONTINUA.- es una variable que puede asumir el nmero infinitamente grande de valores correspondientes a los puntos sobre un intervalo de lnea recta. Ejemplos: La estatura de una persona, la presin arterial, tiempo de vida de una clula, volumen de lluvia que cae en un da en una selva, la resistencia a la tensin, en kilos por centmetro cuadrado, de un cable de acero de 1 cm de dimetro. Distribuciones de probabilidad para var. alea. discretas; binomial, hipergeomtrica, geomtrica, poisson. Distribuciones de probabilidad para var. alea. continuas; normal, gamma, exponencial, t-student, chi-cuadrada y F- snedecor. Para cada distribucin se deben conocer sus propiedades y aprender a utilizar las tablas de distribucin que faciliten el clculo de las probabilidades. DISTRIBUCIONES DE PROBABILIDAD PARA VARIABLES ALEATORIAS DISCRETAS Binomial - El experimento consiste en n intentos repetidos - Los resultados de cada uno de los intentos puede ser xito o fracaso - La probabilidad de xito p, permanece constante para todos los intentos. - Los intentos repetidos son independientes. - Formula b(x, n, p) = xCn p x q n-x donde x: 0, 1, 2, n = np 2 = npq 2 Ma. Guadalupe Medina Torres, E A 2010
Hipergeomtrica - Una muestra aleatoria de tamao n se selecciona sin reemplazo de un total de N resultados o artculos totales. - K resultados o artculos del total de N pueden clasificarse como xitos y N K como fracasos - Frmula h(x, N, N, k) = K C X
(N K) C (n x) / N c n = nk/N 2 = (N-n) / (N-1) . n . k/N (1- k/N) Geomtrica - Si repetidos intentos independientes pueden resultar en un xito con una probabilidad p y en un fracaso con una probabilidad de q = 1-p, entonces la distribucin de probabilidad de la variable aleatoria X, el nmero del intento en el cual ocurre el primer xito es: - g(x, p) = p q x-1 donde x= 1, 2, 3, = 1 / p 2 = (1-p) / p 2
Poisson - La distribucin de probabilidad de la variable aleatoria de Poisson X, que representa el nmero de resultados que ocurren en un intervalo de tiempo dado o regin especfica indicado por t, es: - p(x, ) = p(x, t) = e -t (t) x / x! x: 0, 1, 2, . Donde t es la tasa promedio de resultados por unidad de tiempo o regin y e = 2.71828 - = 2 = t - Cuando n tiende a y p tiende a 0 y = np permanece constante: se aproxima binomial a la poisson, esto es b(x, n, p) p(x, ) DISTRIBUCIONES DE PROBABILIDAD PARA VARIABLES ALEATORIAS CONTINUAS Distribucin normal o gaussiana - La funcin de densidad de la curva normal est definida por la siguiente ecuacin:
F(x) =
1
e (-1/2)[(x- )/o] 2
2to
3 Ma. Guadalupe Medina Torres, E A 2010
- La curva normal tiene forma de campana. La media, la moda y la mediana de la distribucin son iguales y se localizan en el centro de la distribucin. La distribucin de probabilidad normal es simtrica alrededor de su media. Por lo tanto, la mitad del rea bajo la curva est antes del punto central y la otra mitad despus. El rea total bajo la curva es igual a 1. - La curva normal se aproxima de manera asinttica al eje horizontal conforme se aleja de la media en cualquier direccin. Esto significa que la curva se acerca al eje horizontal conforme se aleja de la media, pero nunca lo llega a tocar. - La distribucin normal estndar. z = x o
TIPIFICACIN 4 Ma. Guadalupe Medina Torres, E A 2010
Por tanto su funcin de densidad es
y su funcin de distribucin es
siendo la representacin grfica de esta funcin
a la variable Z se la denomina variable tipificada de X, y a la curva de su funcin de densidad curva normal tipificada.
Caracterstica de la distribucin normal tipificada (reducida, estndar) 5 Ma. Guadalupe Medina Torres, E A 2010
- No depende de ningn parmetro - Su media es 0, su varianza es 1 y su desviacin tpica es 1. - La curva f(x) es simtrica respecto del eje OY - Tiene un mximo en este eje - Tiene dos puntos de inflexin en z =1 y z = -1 - Si x es una variable aleatoria binomial con = np 2 = npq, entonces la forma de lmite de la distribucin de : z = x o Cuando n , es la distribucin normal estndar n(z, 0, 1) Distribucin t-student - Es una distribucin de probabilidad que surge del problema de estimar la media de una poblacin normalmente distribuida cuando el tamao de la muestra es pequeo n 30 y la desviacin estndar poblacional no se conoce. - Es una distribucin continua. - Tiene forma de campana. - La distribucin t tiene una media de cero, es simtrica respecto de la media. y se extiende hasta el infinito en ambas direcciones. - No hay una distribucin t, sino una "familia" de distribuciones t. todas con la misma media cero, pero con su respectiva desviacin estndar diferente de acuerdo con el tamao de la muestra n. - La distribucin t es ms baja y dispersa que la distribucin normal. Cuando el tamao de la muestra se incrementa, la distribucin t se aproxima a la normal. - Su funcin de densidad es: f ( t ) = I |( v + 1)| / 2 ( 1 + t ) ( v + 1 ) / 2 I ( v / 2 )
t v v
6 Ma. Guadalupe Medina Torres, E A 2010
- T = - s
n
- Con grados de libertad = n - 1 Grados de Libertad Los grados de libertad son el nmero de valores que se pueden elegir libremente para llegar a un resultado, por ejemplo, supongamos que tenemos una muestra de tres elementos, la cual tiene una media de 8. a + b + c = 8 3 Para asignar valores a los elementos que forman la muestra, podemos hacerlo libremente en dos de ellos pero al asignar el valor al tercero debemos hacer un clculo para que el resultado sea correcto. Entonces se dice que hay 2 grados de libertad, porque dos valores (n - 1) se asignaron libremente y uno en funcin de los otros valores y el resultado. 7 Ma. Guadalupe Medina Torres, E A 2010
Distribucin chi cuadrada
- La distribucin chi cuadrada es una curva asimtrica a la derecha, se dice que tiene sesgo positivo. - Se utiliza en estadstica inferencial para pruebas de hiptesis. - Teorema. Si y S 2 son la media y la varianza de una muestra (n) tomada de una poblacin normal con media y varianza o 2 , entonces - a) y S 2 son independientes. - b) La variable aleatoria tiene una distribucin Chi Cuadrado con n-1 grados de libertad. - Tabulacin. La funcin de distribucin no puede calcularse en forma analtica; sin embargo, ha sido tabulada para diferentes valores de la probabilidad acumulada, y para varios grados de libertad. En algunas tablas se presenta la cola hacia la izquierda (probabilidad acumulada), y en otras la cola hacia la derecha. - Notacin. Usaremos la notacin para denotar el valor de la distribucin Chi cuadrado con v grados de libertad y una cola de P o hacia la derecha (o una probabilidad acumulada de 1- hacia la izquierda). - Problema: Haciendo uso de la relacin existente entre las distribuciones gama y chi cuadrado, demuestre que la varianza de la varianza poblacional est dada por -
Ejemplo. Suponga que el espesor de un componente de un semiconductor es una dimensin crtica. El proceso de produccin de tal caracterstica se distribuye normalmente con una desviacin estndar de 0.6 milsimas de pulgada. Para controlar el proceso se toman muestras peridicas de veinte 8 Ma. Guadalupe Medina Torres, E A 2010
piezas, y se define un lmite de control con base en una probabilidad de 0.01 de que la varianza muestral exceda dicho lmite, si el proceso est bajo control. - Qu se puede concluir si para una muestra dada la desviacin estndar es 0.84 milsimas de pulgada? - Solucin. La variable aleatoria de inters para nuestro caso es . Si denotamos por LSC el lmite superior de control, entonces tenemos que se debe cumplir que: - - Por lo tanto, debemos buscar en la tabla de la distribucin Chi Cuadrado, con 19 grados de libertad, el valor que tenga una probabilidad hacia la derecha de 0.01 ( hacia la izquierda de 0.99), denotado por , correspondiente a 36.19, el cual debe satisfacer la siguiente desigualdad: - Se acepta si O tambin se acepta si
Por lo tanto el criterio de decisin se puede expresar en una de las dos formas siguientes: - a) Se calcula = Como X 2 = 37.24 > 36.19 la muestra no proviene de un proceso con una desviacin estndar de 0.60. - b) Se calcula S 2 = .84 2 = 0.7056. Como 0.7056 > 0.6857 se llega a la misma conclusin de que no es probable que la muestra tomada provenga de una poblacin con una desviacin estndar de 0.60 milsimas de pulgada.
Distribucion F- Snedecor o Fisher-Snedecor DISTRIBUCIN F Es la distribucin muestral aplicable para la relacin de dos varianzas. Teorema. Si U y W son dos variables aleatorias independientes, cada una con distribucin Chi Cuadrado con v1 y v2 grados de libertad, respectivamente, entonces la distribucin de la siguiente variable aleatoria
9 Ma. Guadalupe Medina Torres, E A 2010
est dada por:
y se denomina "distribucin F con v1 y v2 grados de libertad" (v1 grados de libertad en el numerador y v2 grados de libertad en el denominador). Notacin. Usaremos la notacin para denotar el valor de la distribucin F con v1 grados de libertad en el numerador, v2 grados de libertad en el denominador y una probabilidad acumulada de P o hacia la derecha (o una probabilidad de 1-P(1- ) hacia la izquierda). Puede demostrarse que , si se invierte la definicin de la distribucin F. La aplicacin principal para la cual se desarroll la distribucin F es la comparacin de dos varianzas (de poblaciones normales). Sea una muestra aleatoria (n 1 ) tomada de una poblacin normal con varianza , y sea otra muestra aleatoria (n 2 ) tomada de una poblacin normal con varianza . Si queremos realizar alguna inferencia sobre la igualdad o no de las varianzas, nos podemos basar en el hecho que las siguientes relaciones
son variables aleatorias con distribuciones Chi cuadrada con v1 y v2 grados de libertad, respectivamente, y con las cuales podemos construir la distribucin F. El siguiente teorema clarifica este aspecto.
Teorema. Si y son las varianzas muestrales de dos variables aleatorias independientes de tamaos n1 y n2 tomadas de poblaciones normales con varianzas y , entonces, la relacin
tiene una distribucin F con n1 -1 y n2 -1 grados de libertad. 10 Ma. Guadalupe Medina Torres, E A 2010
Tabulacin. De nuevo, la funcin de distribucin no puede calcularse en forma analtica; sin embargo, ha sido tabulada para diferentes valores de la probabilidad acumulada, y para varios grados de libertad en el numerador y en el denominador. Para cada valor de la probabilidad debe calcularse una tabla diferente. Los valores de las probabilidades dados en las tablas corresponden a las probabilidades de exceder los respectivos valores de F, es decir, presentan las colas a la derecha del valor respectivo de F. Las tablas estn construidas bajo la suposicin de que la distribucin original de las variables aleatorias es normal.