Professional Documents
Culture Documents
Una variable aleatoria tendrá una función de densidad o una función de probabilidad.
Existe una gran cantidad de variables aleatorias cuya función no se conoce de antemano.
Para obtenerla se deben recolectar datos (realizar el experimento), y a partir de ellos
describir las características de esa variable aleatoria, éstas funciones se conocen como
distribuciones empíricas.
Otras variables aleatorias pueden determinarse o suponerse sobre la base de
consideraciones teóricas, a partir de las cuales surge una función matemática que cumple
con las propiedades de las funciones de distribución o de las funciones de densidad (para
variables discretas o continuas respectivamente). Estas variables para las que la forma o
expresión matemática de su función se deduce son las que tienen distribuciones de
probabilidad teóricas.
Una distribución de probabilidad teórica puede tomarse como modelo para
explicar y/o describir el comportamiento de una variable de interés, y así podrá utilizarse
para realizar predicciones y calcular probabilidades asociadas a los valores posibles de esa
variable. Este modelo es una representación simplificada de la realidad.
Vamos a estudiar distribuciones de probabilidad teóricas discretas y continuas que
son de gran aplicación en las Ciencias Naturales:
binomial (b)
D. de probabilidad discretas poisson (p)
hipergeométrica (h)
normal (n)
D. de probabilidad continuas t de Student (t)
Chi cuadrado (X2)
F de Snedecor (F)
DISTRIBUCIÓN BINOMIAL
En muchos casos el experimento aleatorio que realizamos puede tener sólo dos resultados
posibles, mutuamente excluyentes, a los que arbitrariamente llamamos éxito y fracaso.
Por ejemplo: seleccionar un animal y registrar si es macho o hembra.
Cada uno de los resultados tiene una probabilidad asociada: si p = probabilidad del
resultado “éxito”, q = (1 - p) será la probabilidad del otro resultado (“fracaso”).
Un ensayo con sólo dos resultados posibles se denomina ensayo de Bernoulli. Una
sucesión de n de estos ensayos se denomina proceso de Bernoulli si cumple con las
siguientes condiciones:
∗ El experimento consiste de n intentos repetidos, donde n es constante; es decir el
ensayo se repite n veces.
∗ Para cada ensayo existen sólo dos resultados posibles, mutuamente excluyentes:
éxito y fracaso.
∗ La probabilidad de un éxito p es la misma en cada ensayo.
A partir de un ensayo de Bernoulli se puede definir una variable aleatoria discreta que
tendrá una distribución de probabilidad denominada distribución binomial.
Una variable con distribución binomial se define como
X : número de éxitos en n ensayos independientes
Función de distribución binomial
n
f ( x) = b( x; n, p ) = p x q ( n− x ) para x = 0, 1, 2, ..., n
x
xi Probabilidad
0 0,016
1 0,140
2 0,422
3 0,422
DISTRIBUCIÓN HIPERGEOMÉTRICA
Cuando se realiza un experimento que consiste en repetir un ensayo n veces, en el que los
resultados posibles de cada ensayo son éxito y fracaso, pero los resultados de cada ensayo
no son independientes, no podemos aplicar la función de distribución binomial para
calcular las probabilidades. Los ensayos repetidos no formarían un proceso de Bernoulli.
Un caso en el que se considera que los ensayos no son independientes es cuando el
experimento consiste en muestreos sucesivos sin reposición de una población finita,
compuesta por elementos que pueden ser clasificados en dos categorías mutuamente
excluyentes (a los que llamaremos arbitrariamente éxito y fracaso). En ese caso las
probabilidades de éxito de cada ensayo no serían independientes.
A partir de ensayos de este tipo se puede definir una variable aleatoria discreta que
tendrá una distribución de probabilidad denominada distribución hipergeométrica. Esta
variable se define como
X: número de éxitos en n ensayos repetidos no independientes entre sí
Para deducir la función de distribución hipergeométrica debemos conocer las cantidades
N, n y k.
N: número de elementos en la población = tamaño de la población
n: número de elementos en la muestra = tamaño de la muestra
k: número de éxitos en la población = número de elementos en la población que
presentan la característica de interés a la que arbitrariamente se denomina “éxito”.
Podemos deducir que (N – k) = n° de fracasos en la población y (n – x): n° de fracasos en la
muestra.
función de distribución hipergeométrica
k N − k
x n − x
f ( x) = h( x; N , n, k ) = para x = 0, 1, 2,...,n
N
n
k ( N − k ) 3 5
n (n − x) 1 3 = 3.10 = 0.429
N 8 70
x 4
k k N − k N − n
E( X ) = µ = n V ( X ) = σ 2 = n
N N N N − 1
Ejemplos: número de pejerreyes macho en una muestra de 6 peces tomada sin reposición
de un estanque de cría, número de plantas enfermas en una muestra simultánea de 3
plantas tomadas de un lote de 30 plantas sanas y 50 enfermas, número de alumnos de
Biología en una muestra de 20 alumnos tomada sin reposición de la Facultad de Ciencias
Naturales.
DISTRIBUCIÓN DE POISSON
Una variable aleatoria podría surgir de observar el número de ocurrencias de un hecho (nº
de éxitos) en una unidad especificada. Por ejemplo: el número de hormigueros por ha, el
número de peces capturados por hora de pesca, el número de semillas por vaina, el
número de bacterias por litro de agua, etc.
Ejemplos: número de hojas por planta, número de nidos por árbol, número de huevos por
nido, número de semillas por fruto, número de crías por camada.
Ejemplo 1: Se sabe que el 60% de la descendencia de cierta especie de ratones es de color negro. Si
se analizan camadas de tamaño 10 de esta especie, cuál será la probabilidad de se registren:
a) 2 crías de color negro. b) más de 5 crías de color negro. c) entre 2 y 5 crías de color negro. d)
no más de 4 crías de color negro.
Solución:
X: número de ratones de color negro en una camada de 10.
X tiene distribución binomial ya que el hecho de que una cría sea de color negro no incide sobre el
color de otra cría, los ensayos (cada uno de los 10 nacimientos) son independientes.
los parámetros son: n = 10, p = 0.6 → X ∼ b (n = 10; p = 0,6)
b) Aplicamos la función para cada valor de la variable que incluye el suceso y luego sumamos
P (X > 5 ) = P (X = 6) + P (X = 7) + P (X = 8) + P (X = 9) + P (X = 10) = 0.633
También podemos deducir esta probabilidad como P (X > 5 ) = 1 - P (X ≤ 5)
c) P (2 ≤ X ≤ 5) = P (X = 2) + P (X = 3) + P (X = 4) + P (X = 5) =
= P ( X ≤ 5 ) - P ( X ≤ 1) = 0.367 - 0.002 = 0.365
También podemos deducir esta probabilidad como P (2 ≤ X ≤ 5) = P (X ≤ 5) + P (X ≤ 1)
d) P (X ≤ 4) = P (X = 4) + P (X = 3) + P (X = 2) + P (X = 1) + P (X = 0) = 0.166
Ejemplo 2: Se sabe que el número medio de colonias de bacterias que se forman por día en un
experimento de laboratorio es 4. a) ¿Cuál es la probabilidad de que se formen 6 colonias en un
día?
Solución:
X: n° de colonias formadas por día
X tiene distribución de poisson ya que se define el número de éxitos (que se forme una colonia) en
una unidad especificada (un día)
El parámetro es: λ = 4 → X ∼ p (λλ = 4)
P (X = 6) aplicando la función
e − λ . λx e −4 .4 6
f ( x ) = p( x ; λ ) = f (6) = = 0,104
x! 6!
b) ¿Cuál es la probabilidad de que se formen 11 colonias en 3 días?
X: n° de colonias formadas cada 3 días (cambió la unidad especificada, ahora es tres días)
X tiene distribución poisson pero cambió su parámetro, ya que se triplicó el tamaño de la unidad,
entonces: λ = 4x3 = 12 → X ∼ p (λλ = 12).
X ∼ h (k = 142, N = 420, n = 4)
DISTRIBUCIÓN NORMAL
0,40
0,30
0,20 σ
0,10
0,00
-4,00 -3,00 -2,00 -1,00 0,00 1,00 2,00 3,00 4,00
µ
6. El área bajo la curva entre los puntos (µ + una desviación estándar) y (µ - una
desviación estándar) corresponde aproximadamente al 68 % del área total de la curva.
En símbolos: P( µ - σ < x < µ +σ σ ) = 0,682.
Entre µ ± 2 se encuentra aproximadamente el 95 % del área total de la curva, es decir:
P(µ - 2 σ < x < µ + 2 σ) = 0,954.
Entre µ ± 3 se encuentra aproximadamente el 99 % del área total de la curva, o sea :
P(µ - 3 σ < x < µ + 3 σ) = 0,998.
Esta última característica permite aproximar variables de recorrido finito a la
distribución normal.
7. La distribución normal queda completamente determinada por sus parámetros µ y σ.
La media µ está comprendida entre - ∞ y +∞. La varianza σ²debe ser finita (σ²> 0).
Distintos valores de µ desplazan la curva sobre el eje de las x; distintos valores de σ²
determinan el mayor o menor grado de curtosis de la curva.
x−µ
Z=
σ
Cada valor Z nos dice a qué distancia está el valor de la media, esa distancia está medida
en “número de unidades de desviación estándar” o “número de desviaciones tipificadas”
Por ejemplo:
Z = 1,3 significa que el valor de la variable está a una distancia equivalente a 1,3 unidades
de desviación típica por encima de la media.
Z = - 2,7 significa que el valor de la variable está a 2,7 unidades de desviación típica por
debajo de la media
Solución:
X: altura de plantas de maíz
Parámetros: µ = 12 cm y σ = 1 cm
Normal(12,1): p(evento)=0,1587
0,40
11,7 − 12
Z= = −0,3
0,20
0,10
1 0,00
= P (Z ≤ -0,3) = P( Z ≥ 0,3) = 0,3821 8 9 11 12 13 15 16
10 − 12 0,30
Z= = −2 0,20
1 0,10
12,5 − 12 0,00
Z= = 0,5 8 9 11 12 13 15 16
1
0,30
12,5 − 12 14 − 12
Z= = 0,5 Z= =2
0,20
1 1 0,10
0,00
8 9 11 12 13 15 16
P( 12,5 ≤ X ≤ 14) =
= P( 0,5 ≤ Z ≤ 2) = P (Z ≥ 0,5) – P( Z ≥ 2) =
= 0,3085 – 0,0228 = 0,2857
0,10
DISTRIBUCIÓN t DE STUDENT
Se tiene una población de N elementos y se está estudiando una variable de tipo continua
X. Podemos suponer que: X ∼ n (µ , σ)
Si extraemos una muestra de n individuos a los cuales se les mide dicha variable en
estudio, obtenemos los siguientes datos:
X 1, X 2, X 3, . . . , X n
Estos valores también se distribuirán en forma normal ∼ n (µ , σ). Si la muestra es
representativa de la población de origen, es lógico suponer que las observaciones muestrales
también son variables aleatorias con media µ y desviación típica σ.
Efectuando una transformación z obtenemos la siguiente serie de variables normales
estandarizadas:
Z 1, Z 2, Z 3, . . . , Z n
Si hacemos el cociente:
Ζi
t= ≈ tδ i = 1, 2, 3 ,. . . , n
Z 1 + Z 2 + Z 3 + ...+ Z n / n
Esta variable que simbolizamos con t tiene distribución t de Student con δ grados de
libertad.
La variable con distribución t de Student se define como el cociente entre una
variable normal estandarizada y la raíz cuadrada de la suma de variables
aleatorias normales dividido n.
Características de la distribución t:
− El campo de variación es de - ∞ a ∞
− Tiene forma de campana simétrica
− La media vale 0, la desviación típica es mayor que 1
− Comparada con la distribución normal estandarizada (Z), es más alta en las
colas y más baja en el centro.
− El área total debajo de la curva de distribución t es igual a 1
− Existe una familia de distribuciones t cada una de las cuales depende de los
grados de libertad (δδ ).
− Cuanto mayor es δ más se parece la distribución a la normal estandarizada.
Para grados infinitos de libertad (en la práctica cuando δ ≤ 30) las curvas son
iguales.
− El parámetro que define a la distribución t es δ.
0,28 t de student
Densidad
0,18
0,09
0,00
-8,66 -4,33 0,00 4,33 8,66
Variable
0,24
d=3
0,18
Densidad
0,12 d = 12
d = 30
0,06
0,00
0,00 5,00 10,00 15,00 20,00
Variable
DISTRIBUCIÓN F DE SNEDECOR
Si definiéramos dos variables X2, podremos efectuar el cociente entre estas dos
variables, dividiendo a cada una por sus correspondientes grados de libertad, obteniendo
una distribución F de Snedecor
χ δ2 / δ 1
F= 1
≈ F(δ 1 ,δ 2 )
χδ / δ 2
2
2
1,2
1,0
Densidad
0,7
0,5
0,2
0,0
0,00 2,00 4,00 6,00 8,00
Variable
Propiedad recíproca:
Si X es una variable ~ F (δ1; δ2) y Y = 1 /X , tendrá una distribución ~ F (δ2; δ1).
Una F con δ1 y δ2 grados de libertad que acumula una probabilidad α es igual a la
recíproca de una F con los grados de libertad cambiados de orden (δ2 , δ1) y una
probabilidad igual a 1 - α
1
F( δ 1 ,δ 2 ;α ) =
F ( δ 2 , δ 1 ;1 − α )
Al calcular los desvíos de cada valor respecto de la media, uno de ellos no resulta
independiente ya que debe cumplir con la restricción impuesta por la propiedad de la
media: ∑(xi - x ) = 0. Por lo tanto, uno de los desvíos no es linealmente independiente del resto
⇒ los grados de libertad se calculan como (n - 1).
Valores xi (xi - x ) La media de estos valores es 7.
3 (3 - 7) = - 4 Si calculamos los desvíos de cada valor respecto de
6 (6 - 7) = -1 la media vemos que suman cero.
12 (12 - 7) = 5
sumatoria 0