You are on page 1of 8

ALGUNAS DISTRIBUCIONES DE PROBABILIDAD DISCRETAS IMPORTANTES

A continuación se presentan varias distribuciones de probabilidad discretas, desarrollando su forma


analítica a partir de ciertas suposiciones básicas acerca de los fenómenos del mundo real. El
comportamiento de una variable aleatoria discreta queda descrito por su distribución de probabilidad sin
importar si ésta se representa de forma gráfica mediante un histograma, en forma tabular o con una
fórmula. Como las observaciones que se generan en diferentes experimentos estadísticos tienen con
frecuencia el mismo tipo general de comportamiento, las variables aleatorias discretas asociadas con estos
experimentos se pueden describir esencialmente con la misma distribución de probabilidad y por lo tanto
se pueden representar mediante una sola fórmula.

1. DISTRIBUCIÓN UNIFORME DISCRETA

Es la más sencilla de las distribuciones de probabilidad discreta, se caracteriza porque la variable aleatoria
toma sólo un número finito de valores posibles, cada uno con la misma probabilidad.

Distribución uniforme discreta. Si la variable aleatoria discreta X toma los valores x1, x2, …, xk, con la
misma probabilidad, entonces la distribución uniforme discreta está dada por:

1
f ( x; k ) = , donde x = x1 , x2 ,..., xk .
k
Se puede observar en la expresión anterior que la distribución uniforme discreta depende del parámetro
k.

Teorema 1. La media y la varianza de la distribución uniforme discreta f(x; k) son:


k k

 xi  (x i −  )2
= i =1
y 2 = i =1
.
k k

2. DISTRIBUCIÓN BINOMIAL

Muchos problemas de estadística se refieren a situaciones conocidas como “pruebas repetidas”. Por
ejemplo, quizá se quiera conocer la probabilidad de que 1 de 5 remaches se romperá en una prueba de
tensión, la probabilidad de que 9 de 10 focos duren por lo menos 1000 horas, la probabilidad de que al
menos 60 unidades de las que forman un envío estén en buen estado, la probabilidad de que 45 de 300
conductores detenidos en un control carretero usen el cinturón de seguridad. En cada caso anterior se está
tratando con un número de “pruebas” e interesa la probabilidad de obtener un cierto número de “casos
favorables”. Al tomar el lenguaje de los juegos de azar, se dice que en cada uno de estos ejemplos se está
interesado en la probabilidad de obtener x éxitos en n ensayos o en otras palabras, x éxitos y n – x fracasos
en n intentos. En resumen, un experimento consiste a menudo en ensayos repetidos, cada uno con dos
posibles resultados que se denominan éxito y fracaso. Experimentos como los indicados se conocen como
experimentos binomiales o experimentos de Bernoulli.

Experimento binomial o experimento de Bernoulli. Es aquel que posee las siguientes propiedades:
1. El experimento consiste de n ensayos repetidos.
2. Cada ensayo proporciona un resultado que puede clasificarse como éxito o fracaso.
3. La probabilidad de éxito, designada por p, permanece constante de un ensayo a otro. La probabilidad
de fracaso es q = 1 – p.
4. Los n ensayos son independientes.
1
Distribución binomial. La distribución de probabilidad de la variable aleatoria binomial X, que representa
el número de éxitos en n pruebas independientes es:
n
b( x; n, p ) =   p x q n − x , x = 0, 1, 2…, n.
 x
Donde p es el número de éxitos, q = 1 – p es el número de fracasos en un experimento binomial.

Teorema 2. La media y la varianza de la distribución binomial b(x; n, p) son:


 = np y 2 = npq.

3. DISTRIBUCIÓN MULTINOMIAL

Una generalización inmediata de la distribución binomial se presenta cuando cada prueba o experimento
tiene más de dos posibles resultados, las probabilidades de los resultados respectivos son las mismas en
cada ensayo y todos los ensayos son independientes. Un experimento como el descrito anteriormente se
llama experimento multinomial.

Experimento multinomial. Un experimento multinomial posee las siguientes propiedades:

1. El experimento consta de n ensayos idénticos.


2. El resultado de cada ensayo cae en una de la k clases o celdas.
3. La probabilidad de que el resultado de un solo ensayo caiga en la celda i es pi, donde i = 1, 2, …, k y
no cambia de ensayo a ensayo. Además, p1 + p2 + p3 + … + pk = 1.
4. Los ensayos son independientes.
5. Las variables aleatorias estudiadas son X1, X2, …, Xk, donde Xi es igual al número de ensayos en los
que el resultado cae en la celda i. Obsérvese que X1 + X2 + X3 + … + Xk = n.

Un experimento multinomial es por ejemplo, cuando en una encuesta de opinión se les pregunta a las
personas entrevistadas si están a favor de cierto candidato, en contra o están indecisos; o bien, cuando
muestras de productos manufacturados se clasifican como excelentes, arriba del promedio, promedio o
por abajo del promedio.
La distribución multinomial se denotará como f(x1, x2, … , xk; p1, p2, … , pk, n).

Distribución multinomial. Si una prueba dada puede conducir a los k resultados E1, E2, …, Ek con
probabilidades p1, p2, …, pk, entonces la distribución de probabilidad de las variables aleatorias X1, X2,
…, Xk, que representan el número de ocurrencias para E 1, E2, …, Ek en n pruebas independientes es
n!
f ( x1 , x 2 ,..., x k ; p1 , p 2 ,..., p k , n) = p1x1 p 2x2  p kxk .
x1! x 2 !... x k !
k k
Con  xi = n y
i =1
p
i =i
i = 1.

4. DISTRIBUCIÓN HIPERGEOMÉTRICA
El muestreo de una población finita puede realizarse en una de dos formas. Es posible seleccionar y
examinar un objeto, y luego devolverlo a la población para su posible reselección, o seleccionarlo,
examinarlo y mantenerlo (no reintegrarlo a la población), lo que impide su reselección en extracciones
subsiguientes. La primera forma de selección se llama muestreo con reemplazo, y la segunda, muestreo
sin reemplazo. La primera garantiza que las extracciones sean independientes. En el muestreo sin
reemplazo, las extracciones no son independientes. Así pues, si se usa el muestreo sin reemplazo deja de
2
ser binomial la variable aleatoria X que es el número de éxitos en n intentos. En vez de ello, corresponde
a la llamada distribución hipergeométrica.
En general, en una distribución hipergeométrica interesa la probabilidad de seleccionar x éxitos de los k
artículos considerados como éxitos y n – x fracasos de los N – k artículos que se consideran fracasos
cuando se selecciona una muestra aleatoria de tamaño n de un total de N artículos. Este tipo de
experimento recibe el nombre de experimento hipergeométrico. Un experimento hipergeométrico posee
las siguientes propiedades:
1. Una muestra aleatoria de tamaño n se selecciona sin reemplazo de un total de N resultados o artículos
totales.
2. k resultados o artículos del total de N se pueden clasificar como éxitos y N – k como fracasos.

Distribución hipergeométrica. La distribución de probabilidad de la variable aleatoria hipergeométrica


X, que representa el número de éxitos en una muestra aleatoria de tamaño n seleccionada de un total de
N resultados posibles, de los que k son considerados éxitos y N – k fracasos, es:
 k  N − k 
  
 x  n − x 
h( x; N , n, k ) = , x = 0, 1, 2, …, n, además x  k y n – x  N – k.
N
 
n
Teorema 3. La media y la varianza de la distribución hipergeométrica h(x; N, n, k) son:
nk N −n k k 
= y 2 =  n  1 −  .
N N −1 N N

Relación de la distribución hipergeométrica con la binomial (la distribución binomial como una
aproximación de la distribución hipergeométrica)

Cuando el tamaño n de la muestra es relativamente pequeño en relación con el total N de resultados (una
regla general es que n/N  0.05), no existe mucha diferencia entre el muestreo con reemplazo y el muestreo
sin reemplazo; entonces es posible usar la distribución binomial con los parámetros n y p = k/N como una
aproximación del la distribución hipergeométrica.

5. DISTRIBUCIÓN HIPERGEOMÉTRICA MULTIVARIADA

La distribución hipergeométrica se puede extender para tratar el caso donde los N resultados o artículos
se pueden dividir en k celdas A1, A2, …, Ak con a1 elementos en la celda 1, a2 en la celda 2, …, ak
elementos en la celda k. Lo que interesa ahora es la probabilidad de que una muestra aleatoria de tamaño
n proporcione x1 elementos de A1, x2 elementos de A2, …, xk elementos de Ak. Esta distribución de
probabilidad se denotará por:
f(x1, x2, …, xk; a1, a2,  , ak, N, n).

Distribución hipergeométrica multivariada. Si N resultados o artículos se pueden dividir en las k celdas


A1, A2, …, Ak con a1, a2, ..., ak elementos, respectivamente, entonces la distribución de probabilidad de
las variables aleatorias X1, X2, …, Xk, que representan el número de elementos que se seleccionan de A1,
A2, …, Ak en una muestra aleatoria de tamaño n, es:
 a1  a 2   a k 
     
 x1  x 2   x k  k k
f ( x1 , x 2 ,..., x k ; a1 , a 2 ,..., a k , N , n ) = con  i x = n y  ai = N .
N i =1 i =1
 
n
3
6. DISTRIBUCIÓN BINOMIAL NEGATIVA

La distribución binomial negativa es una distribución que se puede considerar como lo “inverso” de la
distribución binomial. En el contexto binomial, la variable aleatoria X representa el número de éxitos
obtenidos en una serie de n ensayos de Bernoulli independientes e idénticos, n es un número fijo, mientras
que el de éxitos varía de un experimento a otro. La variable aleatoria binomial negativa corresponde al
número de ensayos necesario para obtener precisamente k éxitos, de modo que con ella el número de
éxitos es fijo y el número de ensayos cambia de un experimento a otro. En particular, la variable aleatoria
binomial negativa surge en situaciones caracterizadas por las propiedades siguientes:

Propiedades binomiales negativas

1. El experimento consiste en una serie de ensayos de Bernoulli independientes e idénticos, cada uno con
probabilidad p de éxito.
2. Los ensayos se observan hasta obtener exactamente k éxitos, donde el experimentador fija el valor de
k.
3. La variable aleatoria X es el número de ensayos para lograr los k éxitos.

Distribución binomial negativa. Si pruebas independientes repetidas pueden tener como resultado un
éxito con probabilidad p y un fracaso con probabilidad q = 1 – p, entonces la distribución de probabilidad
de la variable aleatoria X, que representa el número de la prueba en la que ocurre el k-ésimo éxito, es:
 x − 1 k x − k
b * ( x; k , p ) =   p q , x = k, k + 1, k + 2, … .
 k − 1
Teorema 4. La media y la varianza de la distribución binomial negativa b*(x; k, p) son:
k k  1  kq
= y  2 =  − 1 = 2 .
p p p  p

7. DISTRIBUCIÓN GEOMÉTRICA
Cuando en la distribución binomial negativa k = 1, se tiene una distribución de probabilidad para el
número de pruebas que se requieren para el primer éxito, está distribución de probabilidad se llama
distribución geométrica.

Propiedades geométricas

1. El experimento consiste en una serie de ensayos. El resultado de cada ensayo se puede clasificar como
éxito o fracaso (ensayo de Bernoulli).
2. Los ensayos son idénticos e independientes, en el sentido de que el resultado de uno no tiene efecto en
el resultado de ninguno de los demás. La probabilidad de éxito, p, es la misma de un ensayo a otro.
3. La variable aleatoria X denota el número de ensayos necesarios para obtener el primer éxito.

Distribución geométrica. Si pruebas independientes repetidas pueden tener como resultado un éxito con
probabilidad p y un fracaso con probabilidad q = 1 – p, entonces la distribución de probabilidad de la
variable aleatoria X, que representa el número de la prueba en el que ocurre el primer éxito, es:
g (x; p ) = pq x−1 , x = 1, 2, 3, … .

Teorema 5. La media y la varianza de una variable aleatoria que sigue la distribución geométrica son:
4
1 1− p q
= y 2 = 2 = 2 .
p p p

8. DISTRIBUCIÓN DE POISSON

Experimentos de Poisson. Son experimentos que producen valores numéricos de una variable aleatoria
X, que representa el número de resultados que ocurren durante un intervalo de tiempo dado o en una
región específica. El intervalo dado de tiempo puede ser de cualquier duración, desde un minuto, un día,
una semana, un mes o inclusive un año. La región específica puede ser un segmento de recta, un área, un
volumen, o quizá una pieza de material.

Propiedades del proceso de Poisson

1. El número de resultados que ocurren en un intervalo de tiempo o región específica es independiente del
número que ocurre en cualquier otro intervalo o región específica.
2. La probabilidad de que un solo resultado ocurra durante un intervalo muy corto o en una región pequeña
es proporcional a la longitud del intervalo o al tamaño de la región y no depende del número de resultados
que ocurren fuera de este intervalo o región.
3. La probabilidad de que ocurra más de un resultado en ese breve lapso de tiempo o que caiga en una
pequeña región es insignificante.

Distribución de Poisson. La distribución de probabilidad de la variable aleatoria X, que representa el


número de resultados que ocurren en un intervalo de tiempo dado o región específica que se denota con t,
es:
e − t ( t ) x
p( x; t ) = , x = 0, 1, 2, … .
x!
Donde  es el número promedio de resultados por unidad de tiempo o región.

Teorema 6. La media y la varianza de la distribución de Poisson p(x; t) tienen el valor t.

Relación de la distribución de Poisson con la binomial (la distribución de Poisson como aproximación
de la distribución binomial)

Si n es grande y p cercana a 0, se puede usar la distribución de Poisson, con  = np, para aproximar
probabilidades binomiales. Si p es cercana a 1, aún se puede utilizar la distribución de Poisson como
aproximación a la binomial mediante el intercambio de lo que se define como éxito y fracaso, de esta
forma cambia p a un valor cercano a 0.

Teorema 7. Sea X una variable aleatoria binomial con distribución de probabilidad b(x; n, p). Cuando
n→, p → 0, y  = np permanece constante, entonces:

b(x; n, p) → p(x; ).

Los pasos siguientes pueden usarse en la solución de un problema de Poisson:


1. Determinar la unidad de medición básica que se usa.
2. Determinar el número promedio de casos del evento por unidad. Este número se denota con .
3. Determinar la magnitud o tamaño del periodo de observación. Se denota con t.

5
4. La variable aleatoria X, es el número de ocurrencias del evento en el intervalo de tamaño t,
correspondiente a una distribución de Poisson, con parámetro  = t.

EJEMPLOS Y EJERCICIOS DE DISTRIBUCIONES DISCRETAS ESPECIALES

1. Se diseña un complicado sistema electrónico con cierta cantidad de componentes de seguridad en sus
subsistemas. Uno de ellos cuenta con cuatro componentes idénticos, cada uno con probabilidad de fallar
de 0.2 en menos de 1 000 horas. El subsistema funcionará si dos de los cuatro componentes están
trabajando. Suponga que cada uno opera de manera independiente.
a) Encuentre la probabilidad de que dos de los cuatro componentes rindan más de 1 000 horas.
b) Encuentre la probabilidad de que el subsistema funcione más de 1 000 horas.

SOLUCIÓN

Sea X una variable aleatoria binomial que representa el número de componentes que funcionan después
de 1 000 horas, con n = 4 y x = 0, 1, 2, …, 4; de la información proporcionada se tiene que la probabilidad
de que un componente funcione después de 1 000 horas es p = 1 – 0.2 = 0.8 y la distribución de
probabilidad de la variable aleatoria binomial X es:

 4
b( x; n = 4, p = 0.8) =  (0.8) (0.2 ) con x = 0, 1, 2, …, 4.
x 4− x

 x
 4
a) Se pide P( X = 2 ) =  (0.8) (0.2 ) =
4−2 96
= 0.1536
2

 2 625
b) El subsistema funcionará más de 1 000 horas si dos (o más) de los cuatro componentes están trabajando,
es decir, si X  2, por tanto se pide encontrar P(X  2).
4
 4  4  4
P( X  2) =  b( x; n = 4, p = 0.8) =  (0.8) (0.2) +  (0.8) (0.2 ) +  (0.8) (0.2 ) =
608
= 0.9728
2 2 3 1 4 0

x=2  2  3  4 625
2. La probabilidad de que un paciente se recupere de una enfermedad gastrointestinal es de 0.8. Suponga
que se sabe que 20 personas contraen la enfermedad.
a) ¿Cuál es la probabilidad de que sanen 14 pacientes? R. 0.109
b) ¿Qué probabilidad existe de que se recuperen por lo menos 10? R. 0.999
c) ¿Cuál es la probabilidad de que sanen por lo menos 14, pero no más de 18? R. 0.844
d) ¿Qué probabilidad hay de que se recuperen 16 como máximo? R. 0.589

SOLUCIÓN
Sea X la variable aleatoria binomial que representa el número de pacientes que se recuperan de la
enfermedad, con n = 20, x = 0, 1, 2, …, 20, p = 0.8 y q = 1 – 0.8 = 0.2. La distribución de probabilidad de
X será entonces:
 20 
b( x; n = 20, p = 0.8) =  (0.8) (0.2) , x = 0, 1, 2, …, 20.
x 20 − x

 x
¡¡¡Resolver los 4 incisos!!!
3. Un fabricante de ceras para pisos produce dos nuevas marcas, A y B, las cuales desea someter a la
evaluación de las amas de casa para determinar cuál es mejor. Los dos tipos de cera, A y B, se aplican a
la superficie del piso de 15 casas. Suponga que en realidad los dos tipos de cera son de la misma calidad.
a) ¿Cuál es la probabilidad de que 10 o más amas de casa prefieran la marca A? R. 0.151
b) ¿Qué probabilidad existe de que 10 o más prefieran la marca A o la B? R. 0.302
6
4. Una empresa de exploraciones petroleras tiene suficiente capital para financiar diez perforaciones. La
probabilidad de éxito de una de ellas es de 0.1. Suponga que las perforaciones son independientes.
Encuentre la media y la varianza del número de exploraciones exitosas. R.  = 1, 2 = 0.9

5. En cierta ciudad un sábado por la noche el canal 13 tiene el 50% de espectadores, el canal 11 el 30% y
el canal 2 tiene el 20%. Determine la probabilidad de que entre o telespectadores de esa ciudad
seleccionados al azar en una noche de sábado, 5 estén viendo el canal 13, 2 estén viendo el canal 11 y uno
esté viendo el canal 2.

SOLUCIÓN
Se está en presencia de una distribución multinomial, donde:
Datos:
x1 = 5 p1 = 0.50
x2 = 2 p2 = 0.30
x3 = 1 p3 = 0.20
n=8  = 1.0
 𝑓 (𝑥1 = 5, 𝑥2 = 2, 𝑥3 = 1; 𝑝1 = 0.50, 𝑝2 = 0.30, 𝑝3 = 0.20, 𝑛 = 8) =
8!
(0.505 )(0.302 )(0.201 ) = 0.0945
5!2!1!

6. Las probabilidades de que un delegado a cierta convención llegue por aire, autobús, automóvil o tren
son 0.4, 0.2, 0.3 y 0.1, respectivamente. ¿Cuál es la probabilidad de que entre nueve delegados a esta
convención seleccionados al azar, tres lleguen por aire, tres por autobús, uno en automóvil y dos en tren?
7. Suponga que la quinta parte de las semillas de un lote de 40no se encuentra en buenas condiciones, Si
se seleccionan sin reemplazo 20 semillas de las 40, ¿cuál es la probabilidad de que 7 de estas semillas
seleccionadas no estén en buenas condiciones?

SOLUCIÓN

Sea X la variable aleatoria hipergeométrica igual al número de semillas en malas condiciones de entre las
20 seleccionadas, entonces x = 1, 2, …, 8; ya que la quinta parte de 40 es 8.
En este problema además: k = 8 (porque 40/5 = 8), N = 40, n = 20. Por lo que la distribución de
probabilidad de X está dada por la expresión:

 8  32 
  
 x  20 − x 
h( x; N = 40, n = 20, k = 8) = , x = 0, 1, 2, …, 8.
 40 
 
 20 
Lo que se pide es P (X = 7) , entonces sustituyendo en la expresión anterior se tiene:
 8  32 
  
P(X = 7) = h( x = 7; N = 40, n = 20, k = 8) =    = 0.02
7 13
 40 
 
 20 

8. En un almacén se tienen 10 impresoras, de las cuales 4 están defectuosas. Una compañía selecciona
cinco de las máquinas al azar, suponiendo que todas funcionan bien. ¿Cuál es la probabilidad de que las
cinco máquinas sean no defectuosas?
7
9. Un club de estudiantes extranjeros tiene como miembros a 2 canadienses, 3 japoneses, 5 italianos y 2
alemanes. Si se selecciona al azar un comité de 4, encuentre la probabilidad de que:
a) Todas las nacionalidades estén representadas.
b) Todas las nacionalidades estén representadas excepto los italianos.

10. Se aplican análisis a los obreros de una empresa que fábrica material aislante, a fin de detectar la
existencia de asbesto en sus pulmones. La fábrica tiene que mandar tres obreros, con indicaciones
positivas de asbesto, a un centro médico para realizar más pruebas. Si 40% de los trabajadores tienen
indicaciones positivas de asbesto en los pulmones, encuentre la probabilidad de que se tengan que
examinar a diez operarios para encontrar tres “positivos”.

11. Un estudio geológico indica que un pozo exploratorio debería dar petróleo con una probabilidad de
0.2. ¿Cuál es la probabilidad de que:
a) El tercer descubrimiento ocurra en la quinta perforación?
b) El primer descubrimiento ocurra en la tercera perforación?

12. En un almacén particular los clientes llegan al mostrador de caja, conforme una distribución de Poisson
con un promedio de siete por hora. En una hora dada, ¿cuál es la probabilidad de que:
a) No lleguen más de tres clientes?
b) Lleguen al menos dos clientes?
c) Lleguen exactamente cinco clientes?

13. Una vendedora se da cuenta de que la probabilidad de venta en una entrevista única es
aproximadamente 0.03. ¿Cuál es la probabilidad de que ella haga al menos una venta al tener 100
compradores posibles?

14. Una ciudad vecina considera una petición de anexión de 1200 residencias contra una subdivisión del
condado. Si los ocupantes de la mitad de las residencias objetan ser anexados, ¿cuál es la probabilidad de
que en una muestra aleatoria de 10, al menos 3 estén a favor de la anexión?

You might also like