Professional Documents
Culture Documents
MÓDULO 6
1
Probabilidad y Estadística Módulo 6
Í NDI CE
2
Probabilidad y Estadística Módulo 6
DISTRIBUCIÓN NORMAL
20 18
15 13
10
10 8
4 5
5 3 2
0
9
6
-5
-6
-6
-6
-7
-7
-7
-8
-8
-8
56
59
62
65
68
71
74
77
80
83
Talla
3
Probabilidad y Estadística Módulo 6
Los diagramas como estos son muy comunes, existe una gran concentración de casos en la
zona central y pocos individuos en los extremos.
Definición:
Una distribución de probabilidad sigue una distribución normal con media µ y desviación
estándar σ , que se denota como N ( µ , σ ) , si la función de densidad tiene una representación
gráfica campanular, positiva, continua, simétrica respecto a la media, donde se ubica su punto
máximo.
3) Todas las curvas son simétricas con respecto a la vertical que pasa por el punto máximo.
4) Todas las curvas normales tienen forma de campana; cerca de su punto máximo son
convexas, poseen dos puntos de inflexión en X = µ − σ y en X = µ + σ , donde se transforman en
cóncavas.
6) Debido a su simetría en las leyes normales, media aritmética, mediana y moda coinciden y
todas corresponden al punto máximo de la curva.
La distribución normal queda definida por dos parámetros, su media y su desviación típica
y la representamos así N ( µ X ;σ X ) .
2
1 x−µ
−
1 2 σ
La función de densidad es: f ( X ) = .e con X ∈ R, cuya gráfica es
2 π .σ
del tipo
4
Probabilidad y Estadística Módulo 6
Para cada valor de µ X y de σ X la función de densidad es distinta, por lo que se obtiene una
familia de distribuciones normales.
Si la variable aleatoria continua X tiene por función de densidad, la función anterior, se dice
que X es una variable aleatoria normal con media µ y desviación estándar σ. Esta fórmula fue
deducida por Gauss (Alemania, 1777 - 1855) y por ello se la conoce como “ley gaussiana” o
“campana de Gauss”.
Como en toda variable aleatoria continua, el área determinada por el intervalo (a;b) , debajo
de la curva y por encima del eje x, es la probabilidad P ( a ≤ X ≤ b ) asociada a tal intervalo.
Si, por el contrario, mantenemos constante µ y hacemos variar σ, cuanto mayor sea su valor
más aplanada será la curva y viceversa.
Los valores de la distribución normal se encuentran tabulados, pero para poder usar la tabla
es necesario efectuar un cambio de variable. Recordemos que en toda VAC la probabilidad de
que X tome un valor exacto es nula, por lo tanto toda expresión de probabilidad que se relacione
con la variable aleatoria normal debe indicarse como intervalo. Para calcular la probabilidad
P ( a ≤ X ≤ b ) debe hallarse el área contenida debajo de la campana de Gauss entre x = a y x
= b, lo que implica la resolución de una integral definida en cuyo integrando aparece la función de
densidad antes definida. Como esta integral no resulta fácil de calcular los valores de la
probabilidad para la VAN han sido recopilados en tablas, con el inconveniente que representa
confeccionar una tabla para cada par de valores posibles de µ y σ.
Para salvar este obstáculo se realiza un cambio de variable reemplazando la variable X por
X −µ
una nueva Z, definida como: Z= Esta nueva variable se llama variable estandarizada
σ
o tipificada y su distribución “distribución normal típica”.
5
Probabilidad y Estadística Módulo 6
En efecto:
a f FH X σ− µ IK = E FH σX − σµ IK = E FH σX IK − E FH σµ IK = E aσX f − σµ = σµ − σµ = 0
E Z =E
Var a Z f = E a Z f − E a Z f = E
2 2F X − µ I − 0 = E FG X − 2 Xµ + µ IJ =
2
2
2 2
H σ K H σ K 2
= EG
F X IJ − 2 µ E a X f + µ = E d X i − 2 µ + µ = E d X i − µ =
2 2 2 2 2 2 2
Hσ K 2
σ σ 2 2
σ 2
σ 2
σ σ 2
σ2 2
Ed X i − µ
2 2
σ 2
= =1
σ2 σ2
Definición:
La distribución de una variable aleatoria normal con media cero y desviación estándar uno se
llama distribución normal estándar.
1 2
1 −(Z )
Su función de densidad es f ( Z ) = .e 2
2π
6
Probabilidad y Estadística Módulo 6
Ejemplos:
P ( 2 ≤ X ≤ 4 ) = P ( 0, 2 ≤ Z ≤ 0, 6 ) = P ( Z ≤ 0, 6 ) − P ( Z ≤ 0, 2 ) 0, 7257 − 0, 5793 =
= 0,1464 ≅ 14%
7
Probabilidad y Estadística Módulo 6
k −3
PZ ≤ = 0, 67 de tabla resulta:
2
k −3
P ( Z ≤ 0, 44 ) = 0, 67 ∴ = 0, 44 ⇒ k = 3,88
2
1) Una explotación agropecuaria sabe que el incremento de peso de sus cerdos en seis
meses sigue una distribución normal con media 16 kg. y desviación estándar 2 kg.
Definimos a la VAN X : incremento de peso de cada cerdo
a)¿Qué probabilidad existe de que un cerdo engorde menos de 18 kg. en 6 meses?
b) ¿Qué probabilidad existe de que un cerdo engorde más de 14 kg. pero menos de 18
kg.?
2) Los 600 soldados de un cuartel poseen una altura que se distribuye normalmente con
media 166 cm y σ = 12 cm.
a) Hallar el número aproximado de soldados cuya altura esté comprendida entre los 165
cm y 182 cm.
b) ¿cuántos medirán más de 190 cm?
c) Si se debe formar un batallón con el 4% de los soldados más altos, ¿a partir de qué
altura deben seleccionarse éstos?
8
Probabilidad y Estadística Módulo 6
ACTIVIDAD 1
2) Una encuesta entre los habitantes de cierta ciudad indicó que el ingreso promedio
era de $450, con una dispersión de $50. Admitiendo una distribución normal para la
variable “ingreso”, calcular:
2.1* el porcentaje de habitantes con renta superior a $550.
2.2* el porcentaje de habitantes con renta comprendida entre $500 y $525.
2.3* el nivel de renta, a partir del cuál encontramos el 10% de mayores ingresos.
3) Si una determinada marca de batidoras tiene una vida útil media de 8 años y una
desviación típica de 0,6, respondiendo el experimento a una distribución normal.
Calcular:
3.1* la probabilidad de que una batidora dure más de 6 años
3.2* ¿Qué porcentaje de batidoras durarán entre 6 y 8 años?
3.3* ¿Qué porcentaje de batidoras durarán más de 14 años?
4) Una industria produce piezas con diámetros distribuidos según una ley normal con
media 0,80 cm y desviación típica 0,04 cm. Si la sección de control de calidad exige
que las piezas tengan un diámetro entre 0,75 y 0,85 cm, siendo rechazadas las piezas
en caso contrario. Si se examina una muestra de 1.000 piezas, ¿cuántas es de esperar
que sean rechazadas?
5) La distribución de los salarios de 2.000 trabajadores tiene una media de $700 y una
desviación estándar de $60. Si la distribución es normal, hallar:
5.1* ¿Cuántos trabajadores ganan $600 o más?
5.2* ¿Cuántos trabajadores ganan $820 o más?
5.3* ¿Cuántos trabajadores ganan entre $550 y $790??
6) El diámetro de una especie forestal, a los 10 años de vida, tiene una media de 45
cm y una varianza de 16 cm.
6.1* ¿Qué porcentaje de ellos tendrán un diámetro menor de 33 cm?
6.2* ¿Qué porcentaje de ellos tendrán más de 48 cm?
6.3* ¿Qué porcentaje de ellos tendrán un diámetro entre 39 y 47 cm?
6.4* ¿Qué porcentaje de ellos tendrán un diámetro entre 32 y 38 cm?
9
Probabilidad y Estadística Módulo 6
10) Suponga que en cierta zona de una ciudad, el número de apagones (interrupciones
en el suministro de energía eléctrica) por mes sigue aproximadamente una
distribución normal con media µ X = 9.5 apagones y una desviación estándar de
σ X = 4.3 . Calcule la probabilidad de que en un mes cualquiera en dicha zona ocurra
entre 8 y 10 apagones inclusive.
Una explotación agropecuaria sabe que el incremento de peso de sus cerdos en seis meses
sigue una distribución normal con media 16 kg. y desviación estándar 2 kg.
Definimos a la variable aleatoria normal X : incremento de peso de cada cerdo
¿Qué probabilidad existe de que un cerdo engorde menos de 18 kg. en 6 meses?
10
Probabilidad y Estadística Módulo 6
Como regla general puede decirse que esta aproximación se puede usar si np o n.pq son al
menos 5.
11
Probabilidad y Estadística Módulo 6
Ejemplo:
12
Probabilidad y Estadística Módulo 6
ACTIVIDAD 2
2) Una prueba de opción múltiple tiene 80 preguntas cada una con cuatro respuestas
posibles de las que sólo una es la correcta. ¿Cuál es la probabilidad de que al azar se
obtengan de 25 a 30 respuestas correctas?
DISTRIBUCIÓN t DE STUDENT
Esta distribución fue desarrollada por Gosset, con el seudónimo de Student. Gosset (1908)
era empleado de una cervecería que desaprobaba la publicación de trabajos de investigación por
13
Probabilidad y Estadística Módulo 6
parte de sus empleados, por lo que usó el seudónimo de Student. La distribución t se asemeja al a
distribución normal estándar, en que ambas son campanas simétricas con media µ X = 0 , pero
posee mayor dispersión.
La mayoría de las veces no se conoce la desviación estándar de la población de la cual se
extraen muestras aleatorias. Para muestras de tamaño n ≥ 30 , se proporciona una buena estimación
de σ X al calcular el valor de s.
Si no se conoce σ y el número de observaciones en la muestra es menor de 30, se puede
utilizar la desviación estándar de la muestra s como una estimación de σ, pero no es posible usar
la distribución Z como estadístico de prueba. El estadístico de prueba adecuado es la distribución t.
Si el tamaño de la muestra es pequeño, los valores de s varían considerablemente de muestra
X −µ X
a muestra y la distribución de la variable aleatoria se desvía notablemente de una
s
n
distribución normal estándar. El modelo matemático que usamos es la distribución de un
X −µX
estadístico t , donde t = s , donde X la media de la muestra, µ X es la media de la
n
población, y s es la desviación típica de la muestra.
Propiedades de la distribución t
14
Probabilidad y Estadística Módulo 6
Grados de Libertad
Existe una distribución t distinta para cada uno de los posibles grados de libertad. Por lo que
es necesario conceptualizarlos y para ello los definimos como el número de valores que podemos
elegir libremente.
Por ejemplo supongamos que estamos tratando con dos valores de muestra, a y b, y sabemos
que tienen una media de 18.
a+b
Simbólicamente la situación es: = 18
2
¿Cómo podemos encontrar los valores que a y b pueden tomar en esta situación? La
respuesta es que a y b pueden ser cualesquier valor cuya suma entre los dos sea 36. Suponga que
sabemos que a tiene el valor de 10. Ahora b ya no es libre de tomar cualquier valor, sino que debe
10 + b
tomar el valor de 26 ya que si a = 10 , = 18 .
2
De modo que 10 + b = 36 b = 26
La situación de este ejemplo se puede generalizar para cualquier (n) en donde dada la media
de los valores sólo quedan (n -1) elementos que pueden definirse libremente y uno es función de la
media y el resto de los elementos.
ACTIVIDAD 3
1) Determinar:
1.1* t 0 ,05;1 5 = 1.2* P ( - 0,87 ≤ t 13 ≤ 2,65) =
1.3* P ( t30 ≤ k ) = 0.90
15
Probabilidad y Estadística Módulo 6
Las gráficas de las funciones de densidad de una distribución chi-cuadrado depende de sus
grados de libertad, como se muestra en la siguiente representación:
f(χ2)
2 GL
4 GL
8 GL
χ2
ACTIVIDAD 4
1) Hallar:
1.1* P ( χ2 11 ≤ 21,92 ) = 1.2* P ( χ2 12 ≥ k ) = 0.10
2
1.3* P ( 11,65 ≤ χ 19 ≤ 22,72) = 1.4* P ( χ162 < 11,91) =
1.5* P ( 3, 94 < χ102 < 12.55 ) =
16
Probabilidad y Estadística Módulo 6
2) Dada una variable aleatoria con distribución χ 2 con 30 grados de libertad hallar:
2.1* La probabilidad de que la variable tome valores inferiores a 18,49.
2.2* La probabilidad de que la variable tome valores superiores a 46,98.
2.3* La probabilidad de que la variable tome valores entre 14,95 y 40,26.
2.4* La probabilidad de que la variable tome valores inferiores a 13,79 o superiores a
50,89.
2.5* El valor de la variable no superado por el 5%.
Propiedades de la distribución F
1
se toma la siguiente relación F( α ) ,m ,m =
1 2 F(1−α ) ,m ,m
2 1
17
Probabilidad y Estadística Módulo 6
ACTIVIDAD 5
18
Probabilidad y Estadística Módulo 6
Respuestas a ejercicios
ACTIVIDAD 1
ACTIVIDAD 2
ACTIVIDAD 3
ACTIVIDAD 4 ACTIVIDAD 5
19