sarz020 informePracticat
Estadisticas para las ciencias de la computacion
UNIVERSIDAD POLITECNICA
SALESIANA
ECUADOR
Integrantes : Katherine Barrera, Pedro Orellana, Ivan Ulloa, Jorge Yela
Tema : Distribucién hipergeometrica y Poisson
Distribuci6én hipergeometrica
Qué es la distribucién hipergeometrica?
La distribucién hipergeométrica es una distribucién discreta que modela el niimero de eventos en una
muestra de tamajio fijo. Cada elemento de la muestra tiene dos resultados posibles (es un evento o un no
evento).
+ Caracteristicas.
+ Las muestras no tienen reemplazo, por lo que cada elemento de la muestra es diferente.
= Las probabilidades asociadas a cada uno de los resultados no son constantes.
Distribucion Hipergeométrica, N = 10, M = 6,
n=3
. | |
o -
Distribucién de Poisson
a
5
Qué es la distribucién de Poisson?
La distribucién de Poisson es una distribucién de probabilidad discreta que se aplica a las ocurrencias de
algtin suceso durante un intervalo determinado.
file: /UsersipecrulnformePracticat html 2nosai2020 informePractica’
+ Caracteristicas.
+ Se usa al determinar un evento que se repite varias veces en un intervalo de tiempo.
+ Es muy importante tener en cuenta que las ocurrencias tienen que ser aleatorias y no contener
ningtin vicio que favorezca a una concurrencia sobre otra,
0.40
0.35
0.30
30.25
% 0.20
=
0.15
0.10
0.05
Documento web
Estadistica descriptiva y distribuciones de probabilidad. Solano, H. L., & Alvarez, C. R. (2005). Universidad
del Norte.
hi=es8lr=&id=3Tkb8HJ5toUC&oi=fnd&pg=PR 11 &dq=distribuciones*de+probabilidad&ots=ISgSW98tRI&sig=kt
NcPbds)
Distribicion Poisson
Se usa al determinar un evento que se repite varias vecesen un intervalo de tiempo,
teniendo en cuenta que las variables utilizadas deben ser aleatorias. En la formula
tenemos
file: /UsersipecrulnformePracticat html anos1ar2020 informePracticat
e = =Xes la ocurrencia u objeto
e Kndmero de eventos en el
qk .
P(e =k) =e intervalo
kt e Antmero medio de
resultados
Comoejemplo de esta distribucién:
Tenemos que una pagina de una empresa pequefia recibe 100 visitas como media
al dia, lo que mostraremos acontinuacién es la probabilidad de que estas llamadas
puedan llegar a ser 10000. Visualizaremos como la probabilidad disminuye a
medida que se aleja de la media.
Necesitaresmos los médulos de scipy.stats:
In [5]:
from scipy.stats import poisson
import seaborn as sb
El método poisson.rvs() puede calcular automaticamente la distribucion
In [28]:
data_binom = poisson.rvs(mu=100, size=10000)
Graficamos e| resultado con la herramienta distplot de] médulo seaborn. Podemos
ver que cada barra simboliza la probabilidad calculada para ese valos.
file: /UsersipecrulnformePracticat html 4nosai2020 informePractica’
In [29]:
ax = sb.distplot(data_binom,
kde=True,
color="blue’,
hist_kws={"linewidth": 1, ‘alpha':1})
ax.set(xlabel='Poisson', ylabel='Frecuencia’)
out[29]:
[Text(@, 0.5, "Frecuencia'), Text(@.5, @, ‘Poisson')]
005
008
Frecuencia
oon
0.00
@ 0 300 0 140
Poisson
En conclusién podemos decir que la distribucién de Poisson nos ayuda a visualizar
como las probabilidades se distribuyen con relaci6n a la media aritmética de las
muestras. Al momento que graficamos visualizamos como la probabilidad que el
suceso ocurra va aumentando por la izquierda y disminuyendo por la derecha, a
medida que se acerca al valor promedio
Distribucioén Discreta Hipergeométrica
Formula:
k\ (N-k) N=tamaiio de poblacién
x) ln- K =n? individuos que...
gpxX=D= weet MARES .
N n=tamano de la muestra
n x= valor que toma la variable
file: /UsersipecrulnformePracticat html snos1ar2020 informePracticat
Nes la poblacion que contiene un ntimero finito de elementos
nes una muestra de elementos seleccionados de N de forma aletoria
K es el numero de elementos de N que cumplen con la caracteristica deseada
X es el numero de elementos de n que cumplen con la caracteristica deseada
N-k respresetan los elementos que no tienen la caracteristica deseada de la
poblacion.
n-x respresetan los elementos que no tienen la caracteristica deseada de la
muestra
Ejemplo:
De un lote de 40 microcomponentes, cada uno se denomina aceptable si no tiene
mas de tres defectuosos. El procedimiento para muestrear el lote es la seleccién de
cinco componentes al azar y rechazar el lote si se encuentra un componente
defectuoso. :Cual es la probabilidad de que se encuentre exactamente un
defectuoso en la muestra si hay tres defectuosos en todo el lote?
DATOS: k N= 40 m:
Para la generacién de graficos matplotlib.pyplot:
In [32]:
import matplotlib.pyplot as plt
Para funciones estadisticas (scipy.stats) Este médulo contiene una gran cantidad de
distribuciones de probabilidad, asi como una creciente biblioteca de funciones
estadisticas.
In [33]:
import scipy.stats as stats
Para funciones matematicas de alto nivel para operar con esos vectores o matrices
(numpy)
In [34]:
import numpy as np
Ingresamos las variables
In [35]:
Ny n, m= 40, 5, 3
Utilizamos la funcion hypergeom que esta en el modulo status de la libreria scipy
fle:iC:/UsersipedrlinformePracticat.htm anos1ar2020 informePracticat
In [64]:
hipergeometrica = stats.hypergeom(N, n, m) # Distribucion
nes numero de muestras
In [65]:
x = np.arange(@, n+1)
print (x)
[e12345]
Creamos la funcion de probablidad para n nuimeros
In [70]:
mp = hipergeometrica.pmf(x) # Funcién de Masa de Probabilidad
print (#mp)
[@.66244939 @.30111336 @.0354251 @.00101215 @. 2.
]
In [75]:
print (x, mp)
[@ 123 45] [0.66244939 @.30111336 0.0354251 0.0101215 2.
e. ]
file: /UsersipecrulnformePracticat html
70sarz020 informePracticat
In [74]:
plt.plot(x, fmp, '-")
plt.vlines(x, @, fmp, colors='r', lw=1, alpha=
plt.title('Distribucion Hipergeométrica' )
plt.ylabel('probabilidad')
plt.xlabel(‘valores')
plt.show()
Distribucién Hipergeométrica
os
os.
04
03
probabilidad
02
on
00 y
0 1 2 3 a 5
valores
file: /UsersipecrulnformePracticat html aiosarz020 informePracticat
In [73]:
aleatorios = hipergeometrica.rvs(100) # genera aleatorios
cuenta, cajas, ignorar = plt.hist(aleatorios, 20)
plt.ylabel(‘frequencia')
plt.xlabel(‘valores')
plt.title(‘Histograma Hipergeométrica')
plt.show()
Histograma Hipergeométrica
frequencia
8 #8 8 838
025 050 075 100 125 150 175 200
valores
Resulto por la formula:
p(X=k)=(mk)(N-mn-k (Nn) p(X=1)
p(x = 1) = (3C1)(37C4) (40€5)
Ble 1) = 3! 1! + 37! 4! 40! 5! p = (3* 2 * 1) (1)(2* 1) * (37 * 36 + 35 * 34 + 333 +
ae) (4* 3 2 #1) (40 * 39 * 38 « 37 * 36 + 35...) (54 4*3% 2% 1)
p= (x= 1) = (3)(66045) (658008)
p= 0.3011
file: /UsersipecrulnformePracticat html sn0