You are on page 1of 20

1 El papel de la estadística en la ingeniería.

1.1 EL MÉTODODE LAINGENIERIAYEL PENSAMIENTO
ESTADÍSTICO
1.1.1 La ingeniería y la solución de problemas
Un ingeniero es alguien que resuelve problemas de interés para la sociedad medi-
ante la aplicación e…ciente de principios cientí…cos. Los ingenieros llevan a cabo
esta tarea perfeccionando un producto o un proceso existente o bien diseñando
un producto o proceso nuevo que satisfaga las necesidades de los consumidores.
El método de la ingeniería o cientí…co es el enfoque aplicado para formular y re-
solver estos problemas. Los pasos del método de la ingeniería son los siguientes:
1. Desarrollar una descripción clara y concisa del problema.
2. Identi…car, al menos de manera tentativa, los factores importantes que
afectan el problema o que pueden jugar un papel en su solución.
3. proponer una solución para el problema, utilizando los conocimientos
cientí…cos o de la ingeniería del fenómeno bajo estudio. Consignar todas las
limitaciones y/o supuestos del modelo.
4. Realizar los experimentos apropiados y recolectar datos para probar o
validar el modelo tentativo o las conclusiones planteadas en los pasos 2 y 3.
5. Re…nar el modelo con base en los datos observados.
6. Manipular el modelo para contribuir a desarrollar una solución del prob-
lema.
7. Realizar un experimento apropiado para con…rmar que la solución prop-
uesta del problema es efectiva a la vez que e…ciente.
8. Sacar conclusiones o hacer recomendaciones con base en la solución del
problema.
El campo de la estadística trata de la recolección, presentación, análisis y
uso de datos para tomar decisiones, solucionar problemas y diseñar productos y
procesos. Debido a que diversos aspectos del ejercicio de la ingeniería implican
trabajar con datos, resulta evidente la importancia de ciertos conocimientos
de estadística para cualquier ingeniero. Especí…camente, las técnicas pueden
constituír una poderosa ayuda para diseñar, desarrollar y mejorar procesos de
producción.
Los métodos estadísticos se utilizan como ayuda para describir y entender
la variabilidad.
Por variabilidad se entiende que observaciones sucesivas de un sistema o
fenómeno no producen exactamente el mismo resultado. Por ejemplo, consid-
érese el rendimiento del tanque de gasolina de un automóvil. Se recorre siempre
el mismo kilometraje con cada tanque de combustible? Desde luego que no;
de hecho, en ocasiones el kilometraje recorrido varía considerablemente. Esta
variabilidad observada en el rendimiento depende de muchos factores, como las
condiciones de manejo, los cambios en el estado del vehículo con el tiempo, el
tipo y octanaje de la gasolina usada, y posiblemente hasta las condiciones me-
tereológicas que hayan prevalecido recientemente. Estos factores representan
1
fuentes de variabilidad potenciales en el sistema. La estadística proporciona
un marco para describir esta variabilidad y para saber cuáles de las fuentes
de variabilidad son más importantes o cuáles tienen el mayor impacto sobre el
rendimiento por tanque de gasolina.
La variabilidad también está presente cuando se abordan problemas de in-
geniería. Por ejemplo, supóngase que un ingeniero está diseñando un conector
de nylon que usará en un motor de automóvil. El ingeniero está considerando
establecer la especi…cación del diseño del espesor de la pared en 3/32 de pul-
gada, pero se encuentra un tanto inseguro acerca del efecto dde esta decisión
sobre la fuerza de desconexión del conector. Si la fuerza de desconexión es muy
débil el conector puede provovar una avería cuando esté instalado en un motor.
Se hacen ocho unidades prototipo y se miden las fuerzas de desconexión, pro-
duciendo los siguientes datos (en libras-pie): 12.6, 12.9, 13.4, 12.3, 13.6, 13.5,
12.6, 13.1. Como se anticipaba, la fuerza de desconexión no es la misma para
todos los prototipos.
Estos datos se pueden representar mediante un diagrama de puntos. El
diagrama de puntos es una grá…ca muy útil para ilustrar un número reducido
de datos, digamos hasta unas 20 observaciones. Esta grá…ca permite ver con
facilidad dos características de los datos: la localización, o parte de en medio,
y la dispersión o variabilidad.
Cuando el número de observaciones es reducido, suele ser dí…cil identi…car
algún patrón de variabilidad especí…co, aun cuando el diagrama de puntos es una
forma conveniente para observar cualquier característica inusual de los datos.
También es posible describir numéricamente las característica de los datos.
Por ejemplo, la localización o tendencia central de los datos puede caracterizarse
con el promedio aritmético ordinario o media. Debido a que lo más común es
considerar los datos como una muestra, nos referiremos a la media aritmética
como la media muestral.
De…nición
Si las n observaciones de una muestra se denotan por x
1
; x
2
; :::; x
n
; entonces
la media muestral es
x =
x
1
+ x
2
+; :::; +x
n
n
=
n

i=1
x
i
n
(1)
Ejemplo 1-1
La media muestral de la fuerza de desconexión de las ocho observaciones
realizadas en los conectores proptotipo es 13.0.
La media muestral es el valor promedio de todas las observaciones del con-
junto de datos. Por lo general, estos datos son una muestra de observaciones
que se ha seleccionado de una población de observaciones más grande. En este
caso, la población podría componerse de todos los conectores que se venderán
2
a los consumidores. en ocasiones existe una población física real como un lote
de pastillas de silicio producidas en una fábrica de semiconductores. También
podría considerarse el cálculo del valor promedio de todas las observaciones de
una población. A este promedio se le llama media poblacional y se denota
por la letra griega (mu).
Cuando hay un número …nito de observaciones (digamos N) en la población,
entonces la media poblacional es
=
N

i=1
x
i
N
(2)
La media muestral, x; es una estimación razonable de la media poblacional
. por tanto, el ingeniero que diseña el conector utilizando un espesor de la
pared de 3/32 de pulgada concluiría, con base en los datos, que una estimación
de la fuerza de desconexión media es 13.0 libras-pie.
Aun cuando la media muestral es útil, no comunica toda la información
acerca de una muestra de datos. la variabilidad o dispersión de los datos puede
describirse con la varianza muestral o la desviación estándar muestral.
De…nición
Si x
1
; x
2
; :::; x
n
; es una muestra de n observaciones entonces la varianza
muestral es
s
2
=
n

i=1
(x
i
÷ x)
2
n ÷1
(3)
La desviación estándar muestral es la raíz cuadrada positiva de la varianza
muestral.
Cálculo de s
2
Para encontrar el valor de s
2
es necesario hacer el cálculo de x; de n sustrac-
ciones y de n cuadrados y sumar las operaciones. Si las observaciones originales
o las desviaciones x
i
÷x no son números enteros, el manejo de las desviaciones
x
i
÷x puede ser tedioso y quizá sea necesario trabajar con varios decimales para
asegurar la precisión numérica. Una fórmula de cálculo más e…ciente para la
varianzxa muestral se obtiene de la siguiente manera:
s
2
=
n
P
i=1
(xi x)
2
n1
=
n
P
i=1
(x
2
i
+x
2
2xxi)
n1
=
n
P
i=1
x
2
i
+nx
2
2x
n
P
i=1
xi
n1
3
y puesto que x = (1=n)
n

i=1
x
i
; esta última ecuación se reduce a
s
2
=
n

i=1
x
2
i
÷

n
P
i=1
xi

2
n
n ÷1
(4)
Ejemplo
Varianza y desviación estándar del ejercicio anterior...
Análogo a la varianza muestral, s
2
; existe una medida de variabilidad de
la población llamada varianza poblacional. Se usa la letra griega
2
para
denotar la varianza poblacional. la raíz cuadrada positiva de
2
, o , denotará
la desviación estándar poblacional.
Cuando la población es …nita y se compone de N valores, la varianza pobla-
cional puede de…nirse como

2
=
N

i=1
(x
i
÷)
2
N
(5)
Se indicó que la media muestral puede usarse como como una estimación de
la media poblacional. De manera similar, la varianza muestral es una estimación
de la varianza poblacional.
Obsérvese que el divisor de la varianza muestral es el tamano de la muestra
menos 1 (n ÷1), en tanto que el de la varianza poblacional es el tamano de la
población N. Si se conociera el valor exacto de la media poblacional , entonces la
varianza muestral podría encontrarse elevando al cuadrado la desviación prome-
dio de las observaciones muestrales alrededor de : En la práctica, casi nunca
se conoce el valor de ; por lo que es necesario usar la suma del cuadrado de las
desviaciones alrededor del promedio muestral x: Sin embargo, las observaciones
x
i
tienden a estar más próximas a su promedio, x; que a la media poblacional,
: Por lo tanto, para compensar este hecho se usa n÷1 como divisor, en lugar de
n: Si se usara n como divisor en la varianza muestral, se obtendría una medida
de variabilidad que es, en promedio, consistentemente menor que la verdadera
varianza poblacional
2
:
Otra forma de visualizar lo anterior es considerar la varianza muestral s
2
como una medida basada en n ÷1 grados de libertad. El término grados de
libertad resulta del hecho de que las n desviaciones x
1
÷ x; x
2
÷ x; :::; x
n
÷ x;
siempre suman cero, por lo que al especi…car los valores de cualesquiera n÷1 de
estas cantidades automáticamente se determina la única que queda. Por tanto,
sólo n ÷1 de las n desviaciones x
i
÷x; están determinadas libremente.
Además de la varianza muestral y la desviación estándar muestral, el rango
muestral, la diferencia entre la observación más grande y la más pequena, es
una medida útil de la variabilidad. El rango muestral se de…ne como sigue.
4
De…nición
Si las n observaciones de una muestra se denotan por x
1
; x
2
; :::x
n
; entonces
el rango muestral es
r = max (x
i
) ÷min(x
i
) (6)
Enn general, cuando la variabilidad de los datos muestrales aumenta, el
rango muestral se incrementa.
El cálculo del rango muestral es encillo, pero ignora toda la información de
los datos muestrales entre el valor más pequeno y el más grande. Por ejemplo, las
dos muestras 1,3,5,8, 9 y 1,5,5,5,9 tienen el mismo rango (r = 8): Sin embargo,
la desviación estándar de la primera muestra es s
1
= 3:35, en tanto que la de la
segunda muestra es s
2
= 2:83:La variabilidad es, en efecto, menor en la segunda
muestra.
En ocasiones, cuando el tamano de la muestra es pequeno, digamos n < 8
o 10, la pérdida de información asociada con el rango no es demasiado grave.
Por ejemplo, el rango tiene un uso generalizado en el control estadístico de la
calidad, donde los tamanos de la muestras de 4 o 5 observaciones son bastantes
comunes.
2 Resumen y presentación de datos
2.1 LA IMPORTANCIA DEL RESUMEN Y LA PRE-
SENTACIÓN DE DATOS
En anterior capitulo se introdujeron la media muestral, lavarianza muestral,
la desviación estándar muestral y el diagrama de puntos como técnicas para
resumir datos. Los resúmenes y las representaciones de datos bien elaborados
son esenciales para el pensamiento estadístico correcto, ya que pueden enfocar
al ingeniero en características importantes de los datos o proporcionar ideas
acerca del modelo que debería emplearse para la solución del problema.
La computadora se ha convertido en una herramienta importante para la
reperesentación y el análisis de datos. Aún cuando muchas técnicas estadísti-
cas sólo requieren una calculadora de mano, ese enfoque puede requerir mucho
tiempo y esfuerzo, mientras que una computadora llevará a cabo las tareas con
mayor e…ciencia.
2.2 DIAGRAMA DE TALLO Y HOJAS
El diagrama de puntos es una representación de datos útil para muestras pe-
quenas, hasta (digamos) unas 20 observaciones. Sin embargo, cuando el número
5
de observaciones es más o menos grande, otras representaciones grá…cas pueden
resultar más convenientes.
Por ejemplo, sean los siguientes datos, son datos de la resistencia a la com-
presión en libras por pulgada cuadrada (psi, por sus siglas en inglés) de 80
ejemplares de una nueva aleación aluminio-litio sujeta a evaluación como posible
material para elementos estructurales de aeronaves. Los datos se registraron en
el orden de las pruebas y en este formato no comunican sobre la resistencia a la
compresión. No es sencillo responder a preguntas tales como: "’Qué porcentaje
de los ejemplares están abajo de 120 psi? ". Debido al gran número de observa-
ciones, construír el diagrama de puntos de estos datos resulta dispendioso. Sin
embargo, se cuenta con representaciones más e…caces para conjunto grandes de
datos
105 221 183 186 121 181 180 143
97 154 153 174 120 168 167 141
245 228 174 199 181 158 176 110
163 131 154 115 160 208 158 133
207 180 190 193 194 133 156 123
134 178 76 167 184 135 229 146
218 157 101 171 165 172 158 169
199 151 142 163 145 171 148 158
160 175 149 87 160 237 150 135
196 201 200 176 150 170 118 149
Un diagrama de tallo y hoja es una forma adecuada de obtener una rep-
resentación visual informativa de un conjunto de datos x
1
; x
2
; :::; x
n
; donde cada
número x
i
tiene al menos dos dígitos. Para construir un diagrama de tallo y
hoja, cada número x
i
se divide en dos partes: un tallo, compuesto por uno o
más de los primeros dígitos, y una hoja, compuesta por los dígitos restantes.
Como ilustración, si los datos consisten en información del porcentaje entre 0
y 100 de piezas defectuosas en lotes de obleas de semiconductores, entonces el
valor el valor 76 puede dividirse en el tallo 7 y la hoja 6. En general, deberán ele-
girse relativamente pocos tallos en comparacióncon el número de observaciones.
La mejor elecciónsuele ser entre 5 y 20 tallos. Una vez que se ha elegido un
conjunto de ellos, se enlistan en el margen izquierdo del programa. En seguida
de cada tallo se enlistan todas las hojas correspondientes a los valores de los
datos observados en el orden en que se van encontrando en el conjunto de datos.
EJEMPLO 2-1
Para ilustrar la construcción de un diagrama de tallo y hoja, considérense
los datos de la resistencia a la cpmpresión de la tabla anterior. Se seleccionarán
como valores del tallo los números 7, 8 , 9,...,24. El diagrama de tallo y hoja se
muestra en la …gura 2-1
Diagrama de tallo y hoja para X
Frecuencia Tallo y hoja
2,00 Extremos (=<87)
1,00 0 . 9
6
22,00 1 . 0011122233333344444444
45,00 1 . 555555555555666666666677777777778888888999999
8,00 2 . 00001222
2,00 Extremos (>=237)
Stem width: 100,00
Each leaf: 1 case(s)
La representación ordenada de tallo y hoja hace relativamente sencillo de-
terminar características de los datos, tales como los percentiles, los cuartiles y
la mediana. La mediana muestral es una medida de la tendencia central que
divide los datos en dos partes iguales, la mitad qwue queda abajo de la mediana
y la mitad que queda arriba de ella. Si el número de observaciones es par, la
mediana está a la mitad de los valores centrales medx =
X
(
n
2
)
+X
(
n
2
+1
)
2
:
Si el número de observaciones es impar, medx = x
(
n+1
2
)
: En ambos casos
x
(n)
indica el n ÷ esimo dato ordenado.
La moda muestral es el valor de los datos que ocurre con mayor frecuencia.
Los datos también pueden dividirse en más de dos partes. Cuando un con-
junto ordenado de datos se divide en cuatro partes iguales, los puntos de división
se denominan cuartiles. El primer cuartil o cuartil inferior, q
1
; es un valor que
tiene aproximadamente una cuarta parte (25%)de las observaciones abajo de
él y aproximadamente 75% de las observaciones arriba. El segundo cuartil, q
2
;
tiene aproximadamente la mitad (50%) de las observaciones abajo de su valor.
El segundo cuartil es exactamente igual a la mediana. El tercer cuartil; q
3
;
tiene aproximadamente tres cuartas partes (75%) de las observaciones abajo de
su valor. Como en el caso de la mediana, los cuartiles pueden no ser únicos.
(Obtener los cuartiles del ejemplo)
En general, el percentil 100 k
0
esimo es un valor de los datos tal que aprox-
imadamente el 100k% de las observaciones está en este valor o abajo del mismo
y aproximadamente el 100(1-k)% de ellas se encuentra arriba de él. Por último,
puede usarse un rango intercuartílico, de…nido como IQR = q
3
÷ q
1
; como
medida de variabilidad. El rango intercuartílico es menos sensible a los valores
extremos de la muestra que el rango muestral ordinario.
2.3 DISTRIBUCIONES DE FRECUENCIAS E HISTOGRA-
MAS
Una distribución de frecuencias es un resumen de datos más compacto que
un diagrama de tallo y hoja. Para construir una distribución de frecuencias, el
rango de los datos debe dividirse, a los que acostumbra llamarse intervalos de
clase o celdas. De ser posible, los intervalos de clase deberán ser de la misma
anchura a …n de reforzar la información visual de la distribución de frecuencias.
7
La selección del número de intervalos de clase deberá hacerse con criterio para
que pueda desarrollarse una representación razonable. El número de intervalos
de clase depende del número de observaciones y del grado de dispersión de
los datos. Una distribución de frecuencias que emplea muy pocos intervalos de
clase o demasiados no será informativa. En general, se encuentra que entre 5
y 20 intervalos de clase son satisfactorios en la mayoría de los casos y que el
número de intervalos de clase deberá incrementarse con n. Elegir un número de
intervalos de clase aproximadamente igual a la raíz cuadrada del númeronúmero
de observaciones suele dar buenos resultados en la práctica.
En la siguiente tabla se muestra la distribución de frecuencias para los datos
de la resistencia a la compresión. Puesto que el conjunto de datos contiene 80
observaciones, y como
_
80
~
= 9; se supone que entre 8 y 9 celdas proporcionará
una distribución de frecuencia satisfactoria. Los valores más grande y más
pequeno son 245 y 76, respectivamente, por lo que los intervalos de clase deben
cubrir un rango de al menos 245 ÷ 76 = 169 unidades en la escala psi. Si
se desea que el límite inferior del primer intervalo empiece un poco antes del
valor más pequeno y que el límite superior del último intervalo de clase esté un
poco después del valor más grande, entonces la distribución de frecuencia podría
empezar en 70 y terminar en 250. Este es un intervalo o rangode 180 unidades
psi. Nueve intervalos de clase, cada uno de 20 psi de anchura, producen una
distribución de frecuencias razonable, por lo que la distribución de frecuencias,
se basa en nueve intervalos dde clase.
Intervalo de clase Frec. Frec. Rel. Frec. Rel. Acum.
70 _ x < 90 2 0:0250 0:0250
90 _ x < 110 3 0:0375 0:625
110 _ x < 130 6 0:0750 0:1375
130 _ x < 150 14 0:1750 0:3125
150 _ x < 170 22 0:2750 0:5875
170 _ x < 190 17 0:2125 0:8000
190 _ x < 210 10 0:1250 0:9250
210 _ x < 230 4 0:0500 0:9750
230 _ x < 250 2 0:0250 1:0000
8
2.4
9
3 Probabilidad
3.1 Espacios muestrales y eventos
De…nición
Un experimento aleatorio es aquel que puede producir resultados diferentes,
aún cuando se repita siempre de la misma manera.
De…nición
Al conjunto de todos los resultados posibles de un exprimento aleatorio se
le llama espacio muestral. El espacio muestral se denota por S:
Ejemplo 3.1
Consíderese un experimento en el que se selecciona un conector y se mide su
espesor. Los valores posibles del espesor dependen de la resolución del instru-
mento de medición, así como de los límites superior e inferior del espesor. Sin
embargo, podría resultar conveniente de…nir el espacio muestral simplemente
como la recta real R:
S = R
Aún cuando no puede ocurrir un valor negativo del espesor.
Si el único objetivo del análisis es considerar si una pieza particular tiene
espesor bajo, medio o alto, entonces el espacio muestral podría tomarse como
el conjunto de los tres resultados
S = ¦bajo; medio; alto¦
Si el único objetivo del análisis es considerar si una pieza particular cumple
o no con las especi…caciones de fabricación, entonces el espacio muestral podría
simpli…carse al conjunto de los dos resultados
S = ¦s{; no¦
que indica si la pieza cumple o no con las especi…caciones.
Ejemplo 3.2
Si se seleccionan y miden dos conectores, entonces la extensión de la recta
real R llevará el espacio muestral al plano
S = R R
Si el único objetivo del análisis es considerar si las piezas particulares cumplen
o no con las especi…caciones de fabricación, entonces cualquiera de las dos puede
cumplir con ellas o no. Se abrevian sí y no como s y n. Si el par ordenado sn
10
indica que el primer conector cumple con las especi…caciones y el segundo no lo
hace, entonces el espacio muestral puede representarse por los cuatro resultados
S = ¦ss; sn; ns; nn¦
Si sólo nos interesarámos en el número de piezas de la muestra que cumple
con las especi…caciones, el espacio muestral podría resumirse como
S = ¦0; 1; 2¦
Como otro ejemplo, considerése un experimento en el que el espesor se mide
hasta que un conector no cumple con las especi…caciones. El espacio muestral
puede representarse como
S = ¦n; sn; ssn; sssn; ssssn; y así sucesivamente¦
En los experimentos aleatorios que impliquen seleccionar artículos de un
lote, se indicará si el artículo seleccionado se reemplaza o no antes de selec-
cionar el siguiente. Por ejemplo, si el lote se compone de tres artícilos ¦a; b; c¦
y el experimento consiste en seleccionar dos artículos sin reemplazo el es-
pacio muestral puede representarse como S = ¦ab; ac; ba; bc; ca; cb¦ : Sin em-
bargo, si los artículos se reemplazan antes de seleccionar el siguiente, se dice
que el muestreo es con reemplazo. Entonces, los resultados posibles son
S = ¦aa; ab; ac; ba; bb; bc; ca; cb; cc¦ :
3.2 Eventos
De…nición
3.2.1 Un evento es un subconjunto del espacio muestral de un ex-
perimento aleatorio.
Dado que los eventos son subconjuntos, es posible usar las operaciones básicas
con conjuntos tales como la unión, intersección y el complemento para formar
otros eventos de interés.
Ejemplo 3.3
En el ejemplo anterior, suponga que el conjunto de todos los resultados
para los que al menos una pieza cumple con las especi…caciones se denota por
E
1
:Entonces
E
1
= ¦ss; sn; ns¦
El evento de que ninguna dde las dos piezas cumpla con las especi…caciones,
denotado por E
2
; solo contiene el resultado, E
2
= ¦nn¦ : Otros ejemplos de
eventos son E
3
= ?; el conjunto vacío y E
4
= S; el espacio muestral.
11
Si E
5
= ¦sn; ns; nn¦ ; entonces
E
1
' E
5
= S E
1
¨ E
5
= ¦sn; ns¦ E
0
1
= ¦nn¦
De…nición
Se dice que dos eventos, denotados como E
1
y E
2
son mutuamente ex-
cluyentes si E
1
¨ E
2
= ?
Las leyes de Morgan implican que (A' B)
0
= A
0
¨B
0
y (A¨ B)
0
= A
0
'B
0
;
además A¨ B = B ¨ A y A' B = B ' A
3.3 Interpretación de la probabilidad
De…nición
Un espacio muestral es discreto si contiene un conjunto …nito (o contable-
mente in…nito) de resultados.
Siempre que un espacio muestral conste de N resultados posibles que son
igualmente factibles, la probabilidad de cada resultado es 1=N:
De…nición
Para un espacio muestral discreto, la probabilidad de un evento E; denotada
como P (E) ; es igual a la suma de las probabilidades de los resultados en E:
Ejemplo
Un experimento aleatorio puede producir uno de los resultados ¦a; b; c; d¦
con probabilidades 0:1; 0:3; 0:5; 0:1, respectivamente. Sea que A denote el evento
¦a; b¦ ; B; el evento ¦b; c; d¦ y C el evento ¦d¦ :
Entonces
P (A) = 0:1 + 0:3 = 0:4
P (B) = 0:3 + 0:5 + 0:1 = 0:9
P (C) = 0:1
Además, P (A
0
) = 0:6; P (B
0
) = 0:1 y P (C
0
) = 0:9: Además puesto que
A ¨ B = ¦b¦ ; P (A¨ B) = 0:3:Puesto que A ' B = ¦a; b; c; d¦ ; P (A' B) =
0:1 + 0:3 + 0:5 + 0:1 = 1: Puesto que A¨ C es el conjunto vacío P (A¨ C) = 0
3.3.1 Axiomas de probabilidad
La probabilidad es un número que se asigna a cada miembro de una colección
de eventos de un experimento aleatorio que satisface las siguientes propiedades.
Si S es el espacio muestral y E es cualquier evento en un experimento aleato-
rio,
1) P (S) = 1
12
2) 0 _ P (E) _ 1
3) Para dos eventos E
1
y E
2
con E
1
¨E
2
= ?; P (E
1
' E
2
) = P (E
1
)+P (E
2
)
De los axiomas anteriores se deducen las siguientes propiedades
a. P (?) = 0
b. P (E
0
) = 1 ÷P (E)
c. Si E
1
¸ E
2
; entonces P (E
1
) _ P (E
2
)
3.4 Reglas de adición
P (A' B) = P (A) + P (B) ÷P (A¨ B) (7)
Si A y B son eventos mutuamente excluyentes, entonces
P (A' B) = P (A) + P (B) (8)
Pruébese para tres eventos
P (A' B ' C) = P (A) + P (B) + P (C)
÷P (A¨ B) ÷P (A¨ C) ÷P (B ¨ C) + P(A¨ B ¨ C) (9)
De…nición
Se dice que los eventos de una colección E
1
; E
2
; :::; E
k
son mutuamente ex-
cluyentes si para todos los pares E
i
¨ E
j
= ?:
Para una colección de eventos mutuamente excluyentes,
P (E
1
' E
2
' ::: ' E
k
) = P(E
1
) ' P(E
2
) ' ::: ' P(E
k
) (10)
3.5 Probabilidad condicional
La probabilidad de que un evento B ocurra cuando se sabe que ya ocurrió algún
evento A se llama probabilidad condicional y se denota por P (B [ A) : El
símbolo P (B [ A) por lo general se lee "la probabilidad de ocurra B dado que
ocurrió A". O simplemente "la probabilidad de B dado A":
De…nición
La probabilidad condicional de B, dado A; se de…ne como
P (B [ A) =
P (A¨ B)
P (A)
; si P (A) > 0
Ejemplo
13
La probabilidad de que un vuelo programado normalmente salga a tiempo
es P (D) = 0:83; la probabilidad de que llegue a tiempo esP (A) = 0:82; y la
probabilidad de que salga y llegue a tiempo es P (D ¨ A) = 0:78: Encuentre la
probabilidad de que un avión a) llegue a tiempo, dado que salió a tiempo y b)
salió atiempo, dado que llegó a tiempo.
Eventos independientes
De…nición
Dos eventos A y B son independientes si y sólo si
P (B [ A) = P (B) y P (A [ B) = P (A) :
De otra forma, A y B son dependientes.
3.6 Reglas multiplicativas
Teorema
Si en un experimento pueden ocurrir los eventos A y B; entonces P (A¨ B) =
P (A) P (B [ A) :
Teorema
Dos eventos A y B son independientes si y sólo si
P (A¨ B) = P (A) P (B)
3.7 Regla de Bayes
Teorema de probabilidad total
Si los eventos B
1
; B
2
; :::B
k
constituyen una partición del espacio muestral S
tal que P (B
i
) ,= 0 para i = 1; 2; :::k; entonces para cualquier evento A de S,
P (A) =
k

i=1
P (B
i
¨ A) =
k

i=1
P (B
i
) (A [ B
i
)
Teorema (Regla de Bayes) Si los eventos B
1
; B
2
; :::B
k
constituyen una
partición del espacio muestral S donde P (B
i
) ,= 0 para i = 1; 2; :::; k; entonces
para cualquier evento A en S tal que P (A) ,= 0;
P (B
r
[ A) =
P (B
r
¨ A)
k

i=1
P (B
i
¨ A)
=
P (B
r
) P (A [ B
r
)
k

i=1
P (B
i
) P (A [ B
i
)
para r = 1; 2; :::; k
14
4 Variables aleatorias ydistribuciones de proba-
bilidad
4.1 Concepto de variable aleatoria
De…nición
Una variable aleatoria es una función que asocia un número real con cada
elemento del espacio muestral.
Se utilizará una letra mayúscula, X, para denotar una variable aleatoria y
su correspondiente minúscula, x; en este caso, para uno de sus valores.
Ejemplo
Se sacan dos bolas de menera sucesiva sin reemplazo de una urna que contiene
cuatro bolas rojas y tres negras. Los posibles resultados y los valores y de la
variable aleatoria Y , donde Y es el número de bolas rojas, son
Espacio muestral y
RR 2
RB 1
BR 1
BB 0
Ejemplo
El empleado de un almacén regresa tres cascos de seguridad al azar a tres
empleados de un taller siderúrgico que ya los habían probado. Si Smith, Jones y
Brown, en ese orden, reciben uno de los tres cascos, liste los puntos muestrales
para los posibles órdenes de regreso de los cascos y encuentre el valor m de la
variable aleatoria M que representa el número de asociaciones correctas.
Solución
Si S; J y B representan los cascos de Smith, Jones y Brown, respectivamente,
entonces los posibles arreglos en los que se pueden regresar los cascos y el número
de asociaciones correctas son
Espacio muestral m
SJB 3
SBJ 1
JSB 1
JBS 0
BSJ 0
BJS 1
15
De…nición
Si un espacio muestral contiene un número …nito de posibilidades o una
serie interminable con tantos elementos como números enteros existen, se llama
espacio muestral discreto.
De…nición
Si un espacio muestral contiene un número in…nito de posibilidades igual al
número de puntos en un segmento de línea, se llama espacio muestral continuo.
Una variable aleatoria se llama variable aleatoria discreta si se puede
contar su conjunto de resultados posibles. Como los posibles valores de Y en el
ejemplo anterior son 0,1 y 2 y los valores de M en el ejemplo anterior son 0,1 y
3, se sigue que Y y M son variables aleatorias discretas. Cuando una variable
aleatoria puede tomaer valores en una escala continua, se le denomina variable
aleatoria continua.
En la mayor parte de los problemas prácticos, las variables aleatorias con-
tinuas representan datos medidos, como son todos los posibles pesos, alturas,
temperaturas, distancias o peíodos de vida, mientras que las variables aleatorias
discretas representan datos contados, como el número de artículos defectuosos
en una muestra de k artículos o el número de accidentes de carretera por anio
en un estado dado. Nótese que las variables aleatorias Y y M de los ejemp-
los anteriores representan datos contados, Y el número de bolas rojas y M el
número de asignaciones correctas de los cascos.
4.2 Distribuciones discretas de probabilidad
Si se supnen pesos iguales para los eventos simples del ejemplo de las asigna-
ciones de los cascos, la probabilidad de que ningún empleadom obtenga de vuelta
su casco correcto, es decir, la probabilidad de que M tome el valor cero, es 1/3.
Los valores posibles m de M y sus probabilidades son
m 0 1 3
P (M = m)
1
3
1
2
1
6
Note que los valores de m agotan todos los caso posibles y por ello las
probabilidades suman 1.
De…nición
El conjunto de pares ordenados (x; f (x)) es una función de probabilidad, fun-
ción masa de probabilidad o distribución de probabilidad de la variable aleatoria
discreta X si, para cada resultado posible x;
1. f (x) _ 0:
16
2.

x
f (x) = 1:
3. P (X = x) = f (x) :
Ejemplo
Un embarque de 8 microcomputadores similares para una tienda contiene
tres que están defectuosos. Si una escuela hace una compra al azar de dos de
estas computadoras, encuentre las distribuciones de probabilidad para el número
de defectuosas.
Solución
Sea X una variable aleatoria cuyos valores x son los números posibles de com-
putadoras defectuosas que compra la escuela. Entonces x puede ser cualquiera
de los números 0,1 y 2. Ahora bien,
f (0) = P (X = 0) =
_
3
0
__
5
2
_
_
8
2
_ =
10
28
f (1) = P (X = 1) =
_
3
1
__
5
1
_
_
8
2
_ =
15
28
f (2) = P (X = 2) =
_
3
2
__
5
0
_
_
8
2
_ =
3
28
En tonces la distribución de probabilidad de X es
x 0 1 2
f (x)
10
28
15
28
3
28
De…nición
La distribución acumulada F (x) de una variable aleatoria discreta X con
distribución de probabilidad f (x) es
F (x) = P (X _ x) =

tx
f((t) para ÷·< x < ·:
Para la variable aleatoria M, el número de asociaciones correctas en el ejem-
plo anterior, se tiene
F (2:4) = P (M _ 2:4) = f (0) + f (1) =
1
3
+
1
2
=
5
6
La distribución acumulada de M es
F (m) =
_
¸
¸
_
¸
¸
_
0 para m < 0
1
3
para 0 _ m < 1
5
6
para 1 _ m < 3
1 para m _ 3
Ejemplo
17
Si una agencia de autos vende 50% de su inventario de cierto vehículo ex-
tranjero equipado con bolsas de aire.
a) Encuentre una fórmula para la distribución de probabilidad del número
de autos con bolsas de aire entre los siguientes cuatro vehículos que venda la
agencia.
b) Encuentre la distribución acumulada, mediante el uso de F (x) ; veri…que
que f (2) =
3
8
:
Solución
a) Como la probabilidad de vender un auto con bolsas de aire es 0.5, los 2
4
=
16 puntos del espacio muestral tienen la misma probabiloidad de ocurrencia. Por
tanto, el denominador para todas las probabilidades, y también para nuestra
función, es 16. Para obtener el número de maneras de vender tres modelos con
bolsas de aire, necesitamos considerar el número de formas de dividir cuatro
resultados en dos celdas con tres modelos con bolsas de aire asignadas a una
celda, y el modelo sin bolsas de aire asignado a la otra. Esto se puede hacer de
_
4
3
_
= 4 formas. En general, el evento de vender x modelos con bolsas de aire
y 4 ÷x modelos sin bolsas de aire puede ocurrir de
_
4
x
_
formas, donde x puede
ser 0; 1; 2; 3 o 4: Entonces, la distribución de probabilidad f (x) = P (X = x) es
f (x) =
_
4
x
_
16
para x = 0; 1; 2; 3; 4
b) F (0) = f (0) =
1
16
;
F (1) = f (0) + f (1) =
5
16
F (2) = f (0) + f (1) + f (2) =
11
16
F (3) = f (0) + f (1) + f (2) + f (3) =
15
16
F (4) = f (0) + f (1) + f (2) + f (3) + f (4) = 1:
De aquí
F (x) =
_
¸
¸
¸
¸
¸
¸
_
¸
¸
¸
¸
¸
¸
_
0 para x < 0
1
16
para 0 _ x < 1
5
16
para 1 _ x < 2
11
16
para 2 _ x < 3
15
16
para 3 _ x < 4
1 para x _ 4
Entonces, f (2) = F (2) ÷F (1) =
11
16
÷
5
16
=
3
8
Grá…ca de barras.
Histograma de probabilidada.
Grá…ca de la distribución acumulada.
18
4.3 Distribuciones continuas de probabilidad
Una variable aleatoria continua tiene una probabilidad cero de tomar exacta-
mente cualquiera de sus valores. En consecuencia, su distribución de probabili-
dad no se puede dar en forma tabular. Nótese que cuando X es continua,
P (a < X _ b) = P (a < X < b) + P (X = b) = P (a < X < b) :
Al trabajar con funciones continuas, f (x) por o general se llama función
de densidad de probabilidad o simplemente función de densidad de X.
Una función de densidad de probabilidad se construye de modo que el área
bajo su curva limitada por el eje x sea igual a 1cuando se calcula en el rango de
X para el que se de…ne f (x) :
De…nición
La función f (x) es una función de densidad de probabilidad para la variable
aleatoria continua X, de…nida en el conjunto de números reales R, si
1. f (x) _ 0; para toda x ¸ R:
2.
_
1
1
f (x) dx = 1:
3. P (a < X < b) =
_
b
a
f (x) dx
Ejemplo
Suponga que el error en la temperatura de reacción, en

C; para un experi-
mento de laboratorio controlado es una variable aleatoria continua X que tiene
la función de densidad de probabilidad
f (x) =
_
x
2
3
; ÷1 < x < 2
0; en otro caso
(a) Veri…que la condición 2 de la de…nición anterior.
(b) Encuentre P (0 < X _ 1) :
De…nición
La distribución acumulada F (x) de una variable aleatoria continua X con
función de densidad f (x) es
F (x) = P (X = x) =
_
x
1
f (t) dt para ÷·< x < ·
Como consecuencia inmediata de la de…nición anterior se puede escribir los
dos resultados,
P (a < X < b) = F (b) ÷F (a) y f (x) =
dF(x)
dx
; si existe la derivada.
Ejemplo
19
Para la función de densidad del ejemplo anterior, encuentre F (x) ; y utilícela
para evaluar P (0 < X _ 1) :
20