You are on page 1of 59

UNIVERSIDAD POPULAR DEL CESAR

FACULTAD DE CIENCIAS B

ASICAS Y EDUCACI

ON
DEPARTAMENTO DE MATEM

ATICAS Y ESTAD

ISTICA
Notas de clase
Probabilidad y Estadstica
Trabajo que presentare a la Universidad Pop-
ular del Cesar con el proposito de ascender a
la categora de Profesor Titular.
HUMBERTO BARRIOS E.
Docente Asociado
Magister en Ciencias Estadstica
Candidato Doctor en Estadstica
Un Compromiso Nuevo Para Construir Academia
Valledupar, Colombia
ii
No se lo que le parezco al mundo; pero para m mismo tengo la impresion de ser solamente
como un muchacho jugando a la orilla del mar, y divirtiendome en encontrar de tanto en tanto
un guijarro mas liso que los demas, o una concha mas hermosa de lo habitual, mientras el gran
oceano de la verdad se extiende a un por descubrir ante m.
Isaac Newton.
Aprender sin pensar es in util, pensar sin aprender es peligroso.
Confusio.
El pensamiento estadstico sera un da tan necesario para el ciudadano eciente como la ca-
pacidad de leer y escribir.
H. G. Wells.

Indice general
1. ESTADISTICA DESCRIPTIVA 1
1.1. INTRODUCCI

ON . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.2. DESCRIPCIONES DE UN CONJUNTO DE MEDICIONES . . . . . . . . . . . . . . . . . . 3
1.2.1. DISTRIBUCIONES DE FRECUENCIAS . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.2.2. M

ETODO GR

AFICO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
1.3. MEDIDAS NUM

ERICAS DESCRIPTIVAS . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
1.3.1. MEDIDAS DE TENDENCIA CENTRAL . . . . . . . . . . . . . . . . . . . . . . . . 9
1.3.2. MEDIDAS DE DISPERSI

ON . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
1.3.3. OTRAS MEDIDAS DESCRIPTIVAS . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
1.4. EJERCICIOS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
2. PROBABILIDAD 26
2.1. INTRODUCCI

ON . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
2.2. CONJUNTOS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
2.3. PROPIEDADES B

ASICAS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
2.4. Diferentes maneras de asignar probabilidades . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
2.4.1. Probabilidad clasica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
2.4.2. Probabilidad frecuentista . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
2.4.3. Probabilidad subjetiva . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
2.5. PROBABILIDAD CONDICIONAL . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
2.6. EVENTOS INDEPENDIENTES . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
2.7. EJERCICIOS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
3. VARIABLES ALEATORIAS 56
3.1. VARIABLES ALEATORIAS DISCRETAS . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
3.2. VARIABLES ALEATORIAS CONTINUAS . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60
3.3. VALOR ESPERADO Y VARIANZA DE UNA VARIABLE ALEATORIA . . . . . . . . . . . 64
3.4. FUNCIONES GENERADORAS DE MOMENTOS . . . . . . . . . . . . . . . . . . . . . . . . 70
iv
v
3.5. EJERCICIOS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
4. DISTRIBUCIONES DISCRETAS 83
4.1. Distribucion Binomial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83
4.2. Distribucion Poisson . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87
4.3. Distribucion Geometrica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91
4.4. Distribucion Binomial Negativa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95
4.5. DISTRIBUCI

ON HIPERGEOM

ETRICA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97
4.6. EJERCICIOS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100
5. DISTRIBUCIONES CONTINUAS 106
5.1. Distribucion Uniforme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 106
5.2. Distribucion Normal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108
5.3. Funcion Gamma . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110
5.4. Distribucion Gamma . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111
5.5. Distribucion Chi Cuadrado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113
5.6. EJERCICIOS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 114
6. VECTORES ALEATORIOS Y DENSIDADES CONJUNTAS 115
6.1. INTRODUCCI

ON . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115
6.2. Distribuciones de probabilidad condicional . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 122
6.3. Variables aleatorias independientes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 124
6.4. Variables aleatorias independientes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 126
6.5. Valor esperado y momentos para distribuciones conjuntas . . . . . . . . . . . . . . . . . . . . 127
6.6. La distribucion multinomial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 136
6.7. Distribucion normal bidimensional . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 138
6.8. EJERCICIOS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 141
7. DISTRIBUCIONES MUESTRALES Y TEOREMA DEL LIMITE CENTRAL 145
7.1. INTRODUCCI

ON . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 145
7.2. DISTRIBUCIONES MUESTRALES DE ESTAD

ISTICAS . . . . . . . . . . . . . . . . . . . . 146
7.3. Teorema Central del Limite . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 151
7.4. Distribucion muestral de S
2
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 153
Captulo 1
ESTADISTICA DESCRIPTIVA
1.1. INTRODUCCI

ON
Estamos en una epoca en la que nos agobian acontecimientos y n umeros, las llamadas, estadsticas,
acerca de cualquier tema comprensible. Se escuchan o se leen indagaciones de los medios de comunicaciones
del n umero de personas desplazadas por la violencia a las que ayuda el gobierno, el n umero de hectareas
sembradas de coca radicadas diariamente por el actual gobierno y cronicas deportivas sobre el n umero
promedios de goles en los partidos de f utbol en una semana determinada. En este sentido para mucha gente,
el termino estadstica signica descripcion numerica. En un sentido mas amplio, se puede establecer que
el objetivo de la estadstica es hacer inferencias con respecto a una poblacion a partir de la informacion
contenida en una muestra y proporcionar una medida (probabilidad) correspondiente para la bondad de
la inferencia. Es decir, la estadstica trata del dise no de experimento o encuestas (investigacion) mediante
muestras para obtener una cantidad determinada de informacion a un costo mnimo y del uso optimo de
esta informacion para sacar conclusiones (inferencias inductivas) con respecto a una poblacion.
En estadstica la inferencia es inductiva porque se proyecta de lo especico (la muestra) hacia lo general
(poblacion). En un procedimiento de esta naturaleza siempre existe la posibilidad de error. Nunca se tendra
el cien por ciento de seguridad sobre una proporcion en la que se basa la inferencia estadstica. Sin embargo,
lo que hace de la estadstica una ciencia (separandola del arte de adivinar la suerte) es que, unida a cualquiera
proposicion o armacion, existe una medida de la conabilidad de esta. En estadstica se mide la conabilidad
en terminos de probabilidad (un tema que se estudiara mas adelante). En otras palabras, para cada inferencia
estadstica se identica la probabilidad de que la inferencia sea correcta. En estadstica la inferencia es
inductiva porque se proyecta de lo especico (la muestra) hacia lo general (poblacion). En un procedimiento
de esta naturaleza siempre existe la posibilidad de error. De ning un modo se tendra el 100 % de seguridad
sobre una proporcion en la que se basa la inferencia estadstica. Sin embargo, lo que hace de la estadstica una
ciencia (separandola del arte de adivinar la suerte) es que, unida a cualquiera proposicion o armacion, existe
1
Universidad Popular del Cesar Humberto Barrios 2
una medida de la conabilidad de esta. En estadstica se mide la conabilidad en terminos de probabilidad
(un tema que se estudiara mas adelante). En otras palabras, para cada inferencia estadstica se identica la
probabilidad de que la inferencia sea correcta. Los problemas estadsticos se caracterizan por los siguientes
cuatro elementos:
(a) La poblacion de interes y el procedimiento cientco que se emplea para seleccionar la muestra.
(b) La muestra y el analisis matematico de la informacion.
(c) Las inferencias estadsticas que resulten del analisis de la muestra.
(d) La probabilidad o conabilidad de que las inferencias sean correctas.
Para comprender la naturaleza de la estadstica inferencial, es necesario precisar algunos conceptos.
Denicion 1.1. Una poblacion es el conjunto de todas las mediciones de interes para determinado problema.
En estadstica, poblacion es un concepto mucho mas general del que tiene el concepto com un de esta palabra.
En este sentido, una poblacion es cualquier coleccion ya sea de un n umero nito de mediciones o una
coleccion grande, virtualmente innita, de datos acerca de algo de interes.
Denicion 1.2. Una muestra es un subconjunto de la poblacion que contiene las mediciones obtenidas me-
diante un experimento. De esta forma, una buena muestra es aquella que reeja las caractersticas esenciales
de la poblaci on de la cual se obtuvo.
En estadstica, el objetivo de las tecnicas de muestreo es asegurar que cada observacion en la poblacion
tiene una oportunidad igual e independiente de ser incluida en la muestra. Tales procesos de muestreo
conducen a una muestra aleatoria. Las observaciones de la muestra aleatoria se usan para calcular ciertas
caractersticas de la muestra llamadas estadsticas. Las estadsticas se usan como base para hacer inferencias
de ciertas caractersticas de la poblacion, que reciben el nombre de parametros.
En cada uno de los siguientes casos se describe la poblacion correspondiente, el objetivo inferencial y que es
lo que se hara para obtener una buena muestra.
Ejemplo 1.1. Un ingeniero desea estimar el consumo semanal promedio de agua por familias en Valledupar.
Poblacion: Todas las familias que viven en Valledupar.
Objetivo inferencial: Estimar el consumo semanal promedio de agua por familias.
Muestra: Tomar un subconjunto de todas las familias de Valledupar, de tal manera que estas familias sean
representativas.
Universidad Popular del Cesar Humberto Barrios 3
Ejemplo 1.2. Un ingeniero electronico desea determinar si la duracion promedio de cierto tipo de transis-
tores supera las 500 horas.
Poblacion: En este caso, la poblacion puede estar constituida por todos los transistores producidos por una
fabrica durante una semana o tambien se puede considerar los que se pueden fabricar en el futuro. En este
caso, la poblacion es virtualmente innita.
Objetivo inferencial: Estimar si la duracion promedio de cierto tipo de transistores supera las 500 horas.
Muestra: Seleccionar una muestra aleatoria de la produccion de un lote de varios das.
1.2. DESCRIPCIONES DE UN CONJUNTO DE MEDICIONES
1.2.1. DISTRIBUCIONES DE FRECUENCIAS
En el sentido mas amplio, hacer inferencias implica la descripcion parcial o total de un fenomeno u objeto
fsico. Por consiguiente, un preludio necesario a la explicacion de como hacer inferencias, es la elaboracion
de un metodo para describir un conjunto de n umeros. La descripcion debe ser tal, que el conocimiento de las
medidas descriptivas nos permita tener una apreciacion clara del conjunto de datos. Ademas es de esperarse
que la descripcion posea un sentido pragmatica, para que el conocimiento de las medidas descriptivas de una
poblacion nos ayude a resolver un problema practico no estadstico, por ejemplo, en la toma de decisiones.
Ejemplo 1.3. Si se seleccionaron aleatoriamente en un proceso de fabricacion de una semana, 100 bateras
para hallar alg un tipo de regularidad en el proceso de fabricacion. Los siguientes datos representan el tiempo
de duracion en das de las 100 bateras:
Tabla 1. Tiempo de duracion de 100 bateras.
177.85 221.42 156.52 153.29 107.28 188.38 219.60 156.98 184.17 173.29
221.20 152.72 176.78 172.92 181.74 185.40 110.83 150.69 177.74 167.26
163.74 233.66 151.08 169.24 173.91 229.03 191.72 108.62 117.67 134.61
204.76 180.61 154.85 175.69 146.21 186.92 167.82 187.72 221.80 155.55
200.15 133.95 174.49 199.55 191.00 164.76 186.64 174.97 168.69 162.42
205.69 138.77 176.49 160.16 226.12 188.06 154.82 185.05 187.47 184.20
198.75 173.74 164.96 168.49 124.12 148.58 202.68 158.85 164.15 166.37
226.07 191.27 195.24 181.66 160.44 193.03 139.64 167.37 217.61 183.10
122.49 224.46 186.87 104.40 173.38 194.10 180.98 151.22 197.55 171.63
218.23 236.11 175.62 149.76 157.99 199.16 143.73 202.34 208.33 178.06
Si quisieramos buscar alg un tipo de regularidad en este conjunto de datos sera imposible encontrarla a
simple vista. Para identicar los patrones en un conjunto de datos es necesario agrupar las observaciones
Universidad Popular del Cesar Humberto Barrios 4
en un n umero relativamente peque no de clases que no se intercepten entre s, de tal manera que no exista
ninguna ambig uedad con respecto a la clase que pertenece una observacion en particular. El n umero de
observaciones que caen en una clase recibe el nombre de frecuencia de clase (f
i
), mientras que el cociente
de una frecuencia de clase con respecto al n umero de observaciones (n) en la muestra se conoce como
frecuencia relativa (f
i
/n) de la clase. Los lmites de las clases se denominan fronteras de clases, y el
promedio aritmetico entre los lmites superior (L
i
) e inferior (L
s
) recibe el nombre de marca de clase o
punto medio de clase (x
i
).
El n umero de clase que se emplean para clasicar a un conjunto de datos depende del n umero total de
observaciones. Si el n umero de observaciones es relativamente peque no, el n umero a emplear sera cinco o
mas. Si existe un n umero sustancial de datos, el n umero de clases debe ser de quince clases o menos. Es decir,
el n umero de clases que se deben tomar no debe ser mayor a quince ni menor de cinco. Un n umero muy
peque no de clases puede ocultar la distribucion real del conjunto de datos, mientras que una muy numerosa
puede dejar sin observaciones a algunas clases, limitando de esta forma su uso.
Una buena practica es la creacion de clases que tengan longitudes iguales. Esto puede lograrse tomando
la diferencia entre los valores extremos del conjunto de los datos, lo que se conoce como rango (R), y
dividiendolo sobre el n umero de clases, el resultado sera aproximadamente la longitud para cada clase. Sin
embargo, existen casos donde esta regla no se puede aplicar o no debe aplicarse. Como ilustracion, tomemos
los datos de la tabla 1, para establecer un esquema de agrupamiento para este conjunto de datos y determinar
las frecuencias de clases, frecuencias relativas de clases, marcas de clases y fronteras de clases. Agrupar los
datos en clases de igual longitud.
El rango = valor mayor - valor menor = 236.11 104.40 = 131.71
Supongase que se decide tomar diez clases = 10
Longitud de clase = 13.171 = 13.
Para establecer las fronteras de cada clase, es necesario considerar la unidad mas cercana con respecto a la
cual se mide las observaciones. As, las diez clases a considerar son:
104 117, 118 131, 132 145, 146 159, 160 173, 174 187, 188 201,
202 215, 216 229, 230 243.
Por lo tanto, una manera de representar a un conjunto de datos es como se muestra en la tabla siguiente:
Tabla 2. Distribucion de frecuencias correspondiente a la duracion de 100 bateras, seleccionadas de manera
aleatoria, de la produccion de una fabrica en una semana.
Universidad Popular del Cesar Humberto Barrios 5
Tabla 2. Distribucion de frecuencias
L
i
L
s
L
I
L
S
x
i
f
i
fi
n
F
i
Fi
n
104 117 103.5 117.5 110.5 4 0.04 4 0.04
118 131 117.5 131.5 124.5 3 0.03 7 0.07
132 145 131.5 145.5 138.5 5 0.05 12 0.12
146 159 145.5 159.5 152.5 15 0.15 27 0.27
160 173 159.5 173.5 166.5 18 0.18 45 0.45
174 187 173.5 187.5 180.5 23 0.23 68 0.68
188 201 187.5 201.5 194.5 14 0.14 82 0.82
202 215 201.5 215.5 208.5 5 0.05 87 0.87
216 229 215.5 229.5 222.5 10 0.10 97 0.97
230 243 229.5 243.5 236.5 3 0.03 100 1
Donde
L
i
limite inferior de la clase i-esima.
L
s
limite superior de la clase i-esima.
x
i
marca de clase de la clase i-esima.
L
I
limite inferior real de la clase i-esima.
L
S
limite superior real de la clase i-esima.
f
i
frecuencia absoluta de la clase i-esima.
fi
n
frecuencia relativa de la clase i-esima.
F
i
frecuencia acumulada absoluta de la clase i-esima.
Fi
n
frecuencia acumulada relativa de la clase i-esima.
La Tabla 2 de frecuencias proporciona mucha mas informacion a simple vista que los datos originales, Tabla 1.
En un estudio de la vida de las bateras, hay muchas preguntas que pueden ahora responderse. Que fraccion
o porcentaje de las bateras puede esperarse de la poblacion en estudio tengan una duracion entre 174 a 187
das?
Es claro, que si la muestra es el reejo de la poblacion, o como dicen mis compa neros de la UPC es rep-
resentativa, entonces la respuesta es 0.25, es decir, el 25 %. Muchas preguntas mas se pueden responder
con la tabla anterior, como por ejemplo, Cuantas bateras fallaran antes de 187 horas? La respuesta a esta
pregunta sera sumar todas las frecuencias que ocurren antes de 187, esto es, sumar las frecuencias: 4 %,
Universidad Popular del Cesar Humberto Barrios 6
32 %, 15 %, 16 %, 25 %, y 15 % lo que suma 68 %. La suma de las frecuencias (f
i
) de las observaciones cuyos
valores son menores o iguales al lmite superior de una clase dada se denomina frecuencia acumulada (F
i
).
De la misma manera se denen la frecuencia acumulada relativa (F
i
/n).
1.2.2. M

ETODO GR

AFICO
Otra manera util de representar los datos de una muestra es a traves de gracos. El principal objetivo de
la representacion graca de las frecuencias de clases como las frecuencias acumuladas es mostrar el perl de
distribucion de los datos. El conocimiento de este perl es util en varias formas, para los analisis apropiados
para las inferencias estadsticas o con el n de comparar los perles de dos o mas conjunto de datos.
Histograma de frecuencias. El histograma de frecuencias se construye levantando rectangulos con centros
en las marca de clases, con base de longitud igual a la longitud real del intervalo de clase (L = L
S
L
I
) y
altura igual a la frecuencia de la respectiva clase, en un eje de coordenadas. Para la distribucian de frecuencias
de la Tabla 2, el histograma de frecuencias es:
Polgono de frecuencias. Los polgonos de frecuencias son otra forma de representar gracamente distribu-
ciones de clases (o distribuciones relativas de clases). Para construir un polgono de frecuencias se nalamos
en el eje horizontal las marcas de clases, en el eje vertical las frecuencias correspondientes y en los extremos
se a naden dos clases con frecuencia cero, en un sistema de coordenadas, y conectamos con segmentos los
puntos sobre el plano. Para la distribucion de frecuencias de la Tabla 2, el polgono de frecuencias es:
Universidad Popular del Cesar Humberto Barrios 7
Los histogramas y los polgonos de frecuencias son parecidos. Como se puede observar en los gracos anteri-
ores. Pero se pueden se nalar las ventajas de los histogramas, las que se pueden resumir as: los rectangulos
muestran cada clase de la distribucion por separado y el area de cada rectangulo, en relacion con el resto,
muestra la proporcion del n umero total de observaciones que se encuentra en cada clase.
Los polgonos, sin embargo, tambien poseen ciertas ventajas, de las cuales se pueden resaltar: el polgono de
frecuencias es mas sencillo que el histograma, traza con mas claridad el perl de patron de los datos y por
ultimo, el polgono se vuelve mas liso y parecido a una curva conforme aumenta el n umero de clases y el
n umero de observaciones. Un polgono como el que acabamos de describir, alisado mediante el aumento de
clases y de puntos de datos, se conoce como curva de frecuencias.
Ojiva. Para gracar la distribucion de frecuencias acumulada (o relativa acumulada), sobre un eje de coor-
denadas, se ubican los limites reales de las clases sobre el eje horizontal contra las frecuencias acumuladas
(o relativas acumuladas) en el eje vertical y se unen todos los puntos consecutivos. Para la distribucion de
frecuencias acumulada de la Tabla 2, la ojiva de las frecuencias acumuladas (o relativas acumuladas) es:
Universidad Popular del Cesar Humberto Barrios 8
En este contexto el principal uso de la distribucion acumulada (o acumulada relativa) es lo que com unmente
se denomina como cuantiles. Con respecto a una distribucion relativa acumulada, se dene un cuantil como el
valor bajo el cual se encuentra una determinada proporcion de los valores de la distribucion. En la proxima
seccion se dara una formula para calcular los cuantiles correspondiente a una distribucion de frecuencia
acumulada.
1.3. MEDIDAS NUM

ERICAS DESCRIPTIVAS
Las descripciones gracas de los datos presentadas en la seccion anterior proporcionan una informacion
util respecto al conjunto de mediciones, pero no es adecuado para hacer inferencias, sobre todo porque
ningunas de las representaciones (tablas y gracas) no estan bien denidas. Por ejemplo, se podran elaborar
muchos histogramas similares a partir del mismo conjunto de mediciones. Para poder hacer inferencias con
respecto a una poblacion, basada en la informacion contenida en una muestra y medir la conabilidad de la
inferencia, en terminos de probabilidades, se requieren cantidades obtenidas de expresiones rigurosamente
denidas para analizar la informacion de la muestra. Es posible obtener, mediante las matematicas, ciertas
propiedades de esas cantidades muestrales y establecer conclusiones probabilsticas con respecto a la valides
de las inferencias.
Las cantidades que se pretenden denir son medidas numericas descriptivas de un conjunto de datos. Se
buscan n umeros que describan la distribucion de frecuencias para cualquier conjunto de mediciones.
Existen dos medidas de interes para cualquier conjunto de datos: la localizacion de su centro y su variabilidad.
Universidad Popular del Cesar Humberto Barrios 9
1.3.1. MEDIDAS DE TENDENCIA CENTRAL
Las medidas de tendencia central de un conjunto de datos es la disposicion de estos para agruparse ya
sea alrededor del centro o de ciertos valores numericos. Existen principalmente tres medidas de tendencia
central: la media, la mediana y la moda.
Denicion 1.3. Sean x
1
, x
2
, x
3
, . . ., x
k
marcas de clases con frecuencias de clases f
1
, f
2
, f
3
, . . . f
k
,
respectivamente, en una distribucion de frecuencias. Entonces la media es
x =
1
n
k

i=1
x
i
f
i
(1.1)
Donde n = f
1
+ f
2
+ f
3
+ . . . + f
k
. En el caso, f
1
= f
2
= f
3
= . . . = f
k
= 1 entonces los datos se dicen
no agrupados. As, la formula para la media se convierte en
x =
1
n
n

i=1
x
i
(1.2)
La media es una medida apropiada de tendencia central para muchos conjuntos de datos. Sin embargo,
dado que todas las mediciones se emplean para su calculo, el valor de la media puede afectarse por la
existencia de algunos valores extremos.
Denicion 1.4. La mediana en un conjunto de datos no agrupados, ordenados de menor a mayor, es el
valor medio si el n umero de datos es impar o el promedio de los dos valores centrales cuando el n umero de
datos es par. Se notara la mediana por x.
Para el caso de datos agrupados o para una distribucion de frecuencias, se procede como sigue:
(a) Se identica la clase mediana, la cual sera la que contiene el elemento para el cual la mitad de todas las
observaciones es menor y la otra mitad es mayor.
(b) L
m
= limite real inferior de la clase mediana
(c) f
m
= frecuencia de la clase mediana
(d) F
m1
= frecuencia acumulada anterior a la clase mediana
(e) c = ancho real de la clase mediana
(f) n = n umero de observaciones en la muestra o tama no de muestra.
Por consiguiente, la ecuacion para la mediana con datos agrupados sera:
x = L
m
+
n
2
F
m1
f
m
c (1.3)
Universidad Popular del Cesar Humberto Barrios 10
Puesto que la mediana es un valor que se basa en la secuencia ordenada de las n mediciones, es necesario
saber que la existencia de valores extremos y agregado muy alto de observaciones, no afecta su valor, en este
sentido la mediana es mejor que la media. Generalmente los conjuntos de datos que describen informacion
de ingresos caen en esta categora.
Denicion 1.5. La moda para un conjunto de datos no agrupados es el valor de las observaciones que ocurre
con mayor frecuencia. La cual notaremos por: M
o
.
Cuando los datos se encuentran agrupados en una distribucion de frecuencias, se puede suponer que la moda
esta localizada en la clase de mayor frecuencia. Para determinar un solo valor para la moda a partir de esta
clase modal, identica:
(a) L
Mo
= limite real inferior de la clase modal
(b)
1
= frecuencia de la clase modal menos la frecuencia que se encuentra inmediatamente por encima de
ella
(c)
2
= frecuencia de la clase modal menos la frecuencia que se encuentra inmediatamente por debajo de
ella
(d) c = ancho real de la clase modal
Entonces se utiliza la siguiente ecuacion:
M
o
= L
Mo
+
_

1

1
+
2
_
c (1.4)
En muchas ocasiones en una serie de datos, puede ocurrir mas de una observacion con la misma frecuencia.
En este caso, se dice que la distribucion de frecuencias es multimodal. Como en todos los aspectos de la
vida, el azar puede desempe nar un papel importante en la organizacion en un conjunto de mediciones. En
ocasiones, el azar hace que un solo elemento no representativo se repita lo suciente para ser el valor mas
frecuente del conjunto de mediciones. Es por esta razon que rara vez se utilice la moda de un conjunto de
datos no agrupados como medida de tendencia central.
Se explicaran el c ulculo de la media, mediana y moda con los ejemplos siguientes:
Ejemplo 1.4. (Para datos no agrupados). El tiempo de reparacion, medido en horas, de un instrumento
electronico tiene un comportamiento aleatorio. Los tiempos de reparacion de 16 de tales instrumentos, elegidos
a traves de un mecanismo aleatorio, son los siguientes:
5, 6, 3, 6, 11, 7, 9, 10, 2, 4, 10, 6, 2, 8, 1, 5,
Universidad Popular del Cesar Humberto Barrios 11
Calcular la media, mediana y moda de este conjunto de datos.
Para calcular la media se utiliza la formula (1.2), es decir,
x =
1
n
n

i=1
x
i
=
1
16
(5 + 6 + 3 + 6 + 11 + 7 + 9 + 10 + 2 + 4 + 10 + 6 + 2 + 8 + 1 + 5) = 5.94
Para el caso de la mediana se ordenan los datos de menor a mayor, como en este caso el n umero de
elementos es par, la mediana sera el promedio de los dos valores centrales.
1, 2, 2, 3, 4, 5, 5, 6, 6, 6, 7, 8, 9, 10, 10, 11
Es decir,
x =
6 + 6
2
= 6
La moda en una serie de datos es el valor con mayor frecuencia, en este caso el valor con mayor frecuencia
es el 6. Entonces
M
o
= 6
Ejemplo 1.5. (Para datos agrupados). Con la distribucion de frecuencias de la tabla 2. Calcular la media,
mediana y moda.
Solucion
De la distribucion de frecuencias correspondiente a la duracion de 100 bateras, para calcular la media
multiplicamos las marcas de clases por las respectivas frecuencias de clase y dividimos por las suma de las
frecuencias. Es decir,
x =
1
n
L

i=1
x
i
f
i
=
1
100
[110.50(4) + 124.50(3) + 138.50(5) + 152.50(15) + 166.50(18)
+ 180.50(23) + 194.50(14) + 208.50(5) + 222.50(10) + 236.50(3)] = 176.44
Otra manera para calcular la media es utilizando la tabla 2, en este caso multiplicamos las marcas de clases
por sus respectivas frecuencias. As:
Universidad Popular del Cesar Humberto Barrios 12
Tabla 3. Tiempo de duracion de 100 bateras.
x
i
L
i
L
s
f
i
x
i
f
i
110,5 103,5 117,5 4 442.00
124,5 117,5 131,5 3 373.50
138,5 131,5 145,5 5 692.50
152,5 145,5 159,5 15 2287.50
166,5 159,5 173,5 18 2997.00
180,5 173,5 187,5 23 4151.50
194,5 187,5 201,5 14 2723.00
208,5 201,5 215,5 5 1042.50
222,5 215,5 229,5 10 2225.00
236,5 229,5 243,5 3 709.50
total 100 17644.00
x =
1
n
L

i=1
x
i
f
i
=
1
100
(17644.00) = 176.44
Para calcular la mediana de la distribucion de frecuencias de la Tabla 3.
(a) Se identica la clase mediana, la cual sera la que contiene el elemento para el cual la mitad de todas las
observaciones es menor y la otra mitad es mayor. Por lo tanto la clase mediana es: 173.5-187.5.
(b) L
m
= limite real inferior de la clase mediana = 173.5
(c) f
m
= frecuencia de la clase mediana = 23
(d) F
m1
= frecuencia acumulada anterior a la clase mediana = 45
(e) c = ancho real de la clase mediana = 14
(f) n = n umero de observaciones en la muestra o tama no de muestra = 100.
Por consiguiente, la ecuacion para la mediana con datos agrupados sera:
x = L
m
+
_
n
2
F
m1
f
m
_
c = 173.5 +
_
50 45
23
_
14 = 176.54
Para determinar el valor para la moda, identicamos la clase modal es: 173.5-187.5.
(a) L
Mo
= lmite real inferior de la clase modal= 173.5
(b)
1
= frecuencia de la clase modal menos la frecuencia que se encuentra inmediatamente por encima de
ella = 25-16 = 9
Universidad Popular del Cesar Humberto Barrios 13
(c)
2
= frecuencia de la clase modal menos la frecuencia que se encuentra inmediatamente por debajo de
ella = 25 -15 = 10
(d) c = ancho real de la clase modal = 14
Entonces se utiliza la siguiente ecuacion:
M
o
= L
Mo
+
_

1

1
+
2
_
c = 173.5 +
_
9
9 + 10
_
14 = 180.13
Cuando se trabaja un problema en estadstica, se debe decidir cual de las medidas de tendencia central se
va ha utilizar. Por ejemplo, si la distribucion es simetrica, es claro que en este caso solo tienen una moda.
Por lo tanto el mismo valor para la media, la mediana y la moda. En tales casos, no es necesario escoger la
medida de tendencia central, pues ya esta hecha la seleccion, cualquiera de ellas es una buena opcion.
En una distribucion sesgada positiva. Es decir, sesgada hacia la derecha, la moda se encuentra en el punto
mas alto de la distribucion, la mediana esta a la derecha de la moda y la media se encuentra todava mas a
la derecha de la moda y la mediana. Es decir, se tiene la siguiente relacion:
M
o
< x < x
En una distribucion sesgada negativa. Es decir, sesgada hacia la izquierda, la moda se encuentra en el
punto mas alto de la distribucion, la mediana esta hacia la izquierda de la moda y la media se encuentra
todava mas a la izquierda de la moda y la mediana. Es decir, se tiene la siguiente relacion:
M
o
> x > x
Cuando la poblacion esta sesgada negativamente o positivamente, con frecuencia la mediana resulta ser
la mejor medida de posicion, debido a que siempre esta entre la moda y la media. La mediana no se ve
inuida por la frecuencia de aparicion de un solo valor como es el caso de la moda, ni se distorsion con la
presencia de valores extremos como la media.
En cualquier otro caso, no existen reglas universales para la aplicacion de la media, la mediana o la moda
como medidas de tendencia central para diferentes poblaciones. Cada caso debera considerarse de manera
independiente, de acuerdo con las lneas generales que se ha analizado.
1.3.2. MEDIDAS DE DISPERSI

ON
Las medidas de tendencia central de un conjunto de mediciones solamente localizan el centro de la
distribucion de los datos. Por si mismo, no ofrecen una descripcion adecuada de los datos. Por ejemplo, dos
conjuntos de mediciones podran tener sus distribuciones de frecuencias muy diferentes pero con la misma
Universidad Popular del Cesar Humberto Barrios 14
media. La diferencias entre dos distribuciones, puede estar en variacion o dispersion a ambos lados de la
media. Una descripcion adecuada de los datos requiere de la denicion de una medida de variabilidad de los
datos. La medida mas com un de variabilidad usada en la estadstica es la varianza, que es una funcion de
las desviaciones (o distancia) de las mediciones con respecto a su media.
Denicion 1.6. Sean x
1
, x
2
, x
3
, . . ., x
k
marcas de clases con frecuencias de clases f
1
, f
2
, f
3
, . . . f
k
,
respectivamente, en una distribucion de frecuencias. Entonces la varianza es
s
2
=
1
n 1
k

i=1
(x
i
x)
2
f
i
(1.5)
Donde n = f
1
+ f
2
+ f
3
+ . . . + f
k
. En el caso, f
1
= f
2
= f
3
= . . . = f
k
= 1 entonces los datos se dicen no
agrupados. As, la formula para la varianza se convierte en
s
2
=
1
n 1
n

i=1
(x
i
x)
2
(1.6)
La varianza es util en la comparacion de la variacion relativa de dos conjuntos de mediciones, pero solo
aporta informacion con respecto a la variacion en un solo conjunto cuando se interpreta en terminos de la
desviacion estandar. La desviacion estandar de un conjunto de medidas es la raz cuadrada positiva de la
varianza, es decir,
s =

s
2
(1.7)
La varianza y la desviacion estandar no son medidas de variabilidad distintas, debido a que la ultima no
puede determinarse a menos que se conozca la primera. A menudo se preere la desviacion estandar en
relacion con la varianza, porque se expresa en las mismas unidades fsicas de las observaciones.
Otra medida util de la variabilidad tiene base en el valor absoluto de las diferencias entres el conjunto de
mediciones y la media o la mediana, dependiendo de cual de las dos se emplee como medida de tendencia
central.
Denicion 1.7. Sean x
1
, x
2
, x
3
, . . ., x
k
marcas de clases con frecuencias de clases f
1
, f
2
, f
3
, . . . f
k
,
respectivamente, en una distribucion de frecuencias. Entonces la desviacion media esta dada por
DM =
1
n
k

i=1
[x
i
x[f
i
(1.8)
Donde n = f
1
+ f
2
+ f
3
+ . . . + f
k
. En el caso, f
1
= f
2
= f
3
= . . . = f
k
= 1 entonces los datos se dicen no
agrupados. As, la formula para la desviacion media esta se convierte en
Universidad Popular del Cesar Humberto Barrios 15
DM =
1
n
n

i=1
[x
i
x[ (1.9)
Cuando se sustituye la media por la mediana en (1.8) y (1.9) se obtiene la desviacion mediana, la que se
notara por DMd.
La desviacion media es una medida de la variacion de un conjunto de mediciones, especialmente en el contexto
de la evidencia emprica, debido a que en muchas ocasiones el interes se centra en las desviaciones y no en los
signos de estas. Sin embargo, desde un punto de vista teorico, el empleo de desviacion media como medida
de dispersion esta en desventaja dado que, matematicamente, es difcil de obtener. De cualquiera manera,
la desviacion media es menos sensible a los efectos inducidos por las observaciones extremas del conjunto
de datos que la varianza o la desviacion estandar. Sin importar la presencia de pocos valores extremos,
la desviacion media puede proporcionar una medida de dispersion mucho mas real que la obtenida por la
desviacion estandar.
Cuando la mediana se utiliza como medida de tendencia central con el proposito de amortiguar los efectos
de la existencia de algunos valores extremos en el conjunto de mediciones, debe preferirse a la desviacion
mediana como una medida de dispersion por la misma razon, es decir, con la intencion amortiguar los efectos
de la existencia de valores extremos en el conjunto de mediciones.
A continuacion se ilustran los pasos que se deben seguir para los calculos de la varianza, desviacion estandar,
desviacion media y desviacion mediana, para los datos no agrupados del ejemplo 1 y para los datos agrupados
de la tabla 2.
Ejemplo 1.6. El tiempo de reparacion, medio en horas, de un instrumento electronico tiene un compor-
tamiento aleatorio. Los tiempos de reparacion de 16 de tales instrumentos, elegidos a traves de un mecanismo
aleatorio, son los siguientes:
5, 6, 3, 6, 11, 7, 9, 10, 2, 4, 10, 6, 2, 8, 1, 5
Calcular la varianza, desviacion estandar, desviacion media y desviacion mediana de este conjunto de datos.
Solucion
Para la varianza se tiene
Universidad Popular del Cesar Humberto Barrios 16
s
2
=
1
n 1
n

i=1
(x
i
x)
2
=
1
16 1
[(5 5.94)
2
+ (6 5.94)
2
+ (3 5.94)
2
+ (6 5.94)
2
+ (2 5.94)
2
+ (4 5.94)
2
+ (11 5.94)
2
+ (7 5.94)
2
+ (9 5.94)
2
+ (10 5.94)
2
+ (10 5.94)
2
+ (6 5.94)
2
+ (2 5.94)
2
+ (8 5.94)
2
+ (1 5.94)
2
+ (5 5.94)
2
] = 9.5333
La desviacion estandar es
s =

9.5333 = 3.0876
Para la desviacion media se tiene
DM =
1
n
n

i=1
[x
i
x[
=
1
16
[[5 5.94[ +[6 5.94[ +[3 5.94[ +[6 5.94[
+[2 5.94[ +[4 5.94[ +[11 5.94[ +[7 5.94[
+[9 5.94[ +[10 5.94[ +[10 5.94[ +[6 5.94[
+[2 5.94[ +[8 5.94[ +[1 5.94[ +[5 5.94[
= 2.445
Para la desviacion mediana se tiene
DMd =
1
n
n

i=1
[x
i
x[
=
1
16
[[5 6[ +[6 6[ +[3 6[ +[6 6[
+[2 6[ +[4 6[ +[11 6[ +[7 6[ +[9 6[
+[10 5.94[ +[10 6[ +[6 6[ +[2 6[
+[8 6[ +[1 6[ +[5 6[ = 2.4375
Universidad Popular del Cesar Humberto Barrios 17
Ejemplo 1.7. Con la distribucion de frecuencias de la tabla 2. Calcular la varianza, desviacion estandar,
desviacion media y desviacion mediana.
Solucion.
Utilicemos la tabla 4, para la varianza, desviacion estandar, desviacion media y desviacion mediana.
Tabla 4.
x
i
f
i
(x
i
x)
2
f
i
[x
i
x[f
i
[x
i
x[f
i
110.5 4 442 263.7600 267.6800
124.5 3 17392 155.8200 158.7600
138.5 5 8093 189.7000 194.6000
152.5 15 7197 359.1000 373.8000
166.5 16 8597 159.0400 174.7200
180.5 25 1581 101.5000 77.0000
194.5 15 0412 270.9000 256.2000
208.5 5 4892 160.3000 155.4000
222.5 9 5139 414.5400 405.7200
236.5 3 19094 180.1800 177.2400
total 100 83220 2254.8000 2241.1000
Por lo tanto la
varianza es: s
2
= 840.60
Desviacion estandar es: s = 28.99
Desviacion media es: D.M. = 22.55
Desviacion mediana es: D.Md. = 22.45
1.3.3. OTRAS MEDIDAS DESCRIPTIVAS
El principal uso de la distribucion acumulada es lo que com unmente se conoce como cuantiles. Con
respecto a una distribucion de frecuencias relativa acumulada, se dene un cuantil como el valor bajo el cual
se encuentra una determinada proporcion de los valores de la distribucion. Para identica la clase cuantil, la
cual sera la que contiene el elemento para el cual la proporcion 100q % de todas las observaciones es menor
y la otra proporcion 100(1 q) % es mayor en una distribucion de frecuencias.
Universidad Popular del Cesar Humberto Barrios 18
Denicion 1.8. Para calcular el cuantil q se utiliza la siguiente formula
x
q
= L
q
+
nq F
q1
f
q
c (1.10)
(a) Se identica la clase cuatil, la cual sera la que contiene el elemento para el cual la q % de todas las
observaciones es menor y la otra (100 q) % es mayor.
(b) L
q
= limite real inferior de la clase cuatil
(c) f
q
= frecuencia de la clase cuatil
(d) F
q1
= frecuencia acumulada anterior a la clase cuatil
(e) c = ancho real de la clase cuatil
(f) n = n umero de observaciones en la muestra o tama no de muestra.
Denicion 1.9. Una medida que compara la dispersion relativa de dos distribuciones de frecuencias es el
coeciente de variacion, que esta denido por:
cv =
s
x
100 % (1.11)
Los cuantiles com unmente mas utilizados son los percentiles, deciles y cuartiles. Los percentiles son los
puntos que dividen a la distribucion de frecuencias en 100 pares iguales, cada uno con una frecuencia relativa
q = 0.01; los deciles y cuartiles son los puntos que dividen a la distribucion de frecuencias en 10 y 4 partes
iguales, cada uno con frecuencia relativa q = 0.1 y q = 0.01, respectivamente. Notese que la mediana es el
cincuentavo percentil, el quinto decil y el segundo cuartil.
Denicion 1.10. La diferencia entre los percentiles 90 avo y 10 avo recibe el nombre de recorrido inter-
decil.
Denicion 1.11. La diferencia entre los percentiles 75avo y 25avo recibe el nombre de recorrido inter-
cuartil.
En este contexto el recorrido interdecil es una medida de la dispersion del 80 % de la distribucion de
frecuencia, en tanto que el recorrido intercuartil reeja la variacion del 50 % de la distribucion de frecuencia.
En ambos casos, al excluir los efectos de los valores extremos de la distribucion de frecuencia, se tiene la
capacidad de medir la variabilidad del conjunto de mediciones de la mitad de una distribucion de frecuencia.
Los recorridos interdecil e intercuartil, son dos medidas de dispersion que se emplean en disciplinas como
educacion, economa, nazas e ingeniera. El recorrido interdecil se emplea muchas veces en pruebas educa-
cionales para medir la variabilidad en el desempe no sin importar los valores por arriba o por debajo de un
Universidad Popular del Cesar Humberto Barrios 19
10 % de un valor predeterminado. El recorrido intercuartil se emplea en muchas ocasiones, en economa y
nazas, para medir la variabilidad de un conjunto de mediciones de una proporcion de su distribucion de
frecuencia.
El coeciente de variacion expresa la magnitud de la dispersion de un conjunto de mediciones con respecto
a la media, es una medida estandarizada de la variacion con respecto a la media, especialmente util para
comparar dos distribuciones de frecuencias cuando la escala de medicion diere de manera apreciable entre
estas. Es decir, como el coeciente de variaciones la razon de dos promedios, es independiente de las unidades
de medidas usadas, por ejemplo, da igual que se usen libras o gramos para medir el peso.
Ejemplo 1.8. . Para la distribucion de frecuencia de la Tabla 2. Calcular los recorrido interdecil, recorrido
intercuartil y el coeciente de variacion.
Solucion.
Las clases percentiles 10ava y 90ava son respectivamente (132-145) y (216-229), entonces para calcular a x
0.1
se tiene:
(a) Se identica la clase cuatil, la cual sera la que contiene el elemento para el cual la q % de todas las
observaciones es menor y la otra (100 q) % es mayor.
(b) L
q
= limite real inferior de la clase 10ava = 131.5
(c) f
q
= frecuencia de la clase 10ava = 5
(d) F
q1
= frecuencia acumulada anterior a la clase cuatil =7
(e) c = ancho real de la clase cuatil =14
(f) n = n umero de observaciones en la muestra o tama no de muestra =100.
Se utiliza la siguiente formula:
x
q
= L
q
+
nq F
q1
f
q
c = 131.5 +
0.1 100
5
14 = 139.9
De la misma manera se calcula x
0.9
,
x
q
= L
q
+
nq F
q1
f
q
c = 215.5 +
0.9 100
9
14 = 218.16
As, el recorrido interdecil es = 218.61-139.9 = 78.71.
De igual forma se realizan los calculos para el recorrido intercuartil.
Universidad Popular del Cesar Humberto Barrios 20
El coeciente de variacion es:
cv =
s
x
100 =
28.99
176.44
100 = 16.43
En la siguiente tabla se resumen las medidas numericas descriptivas para la distribucion de frecuencia de la
Tabla 2.
Medidas descriptivas
Media 176.44
Mediana 177.42
Moda 180.13
Varianza 840.60
Desviacion estandar 28.99
Desviacion media 22.55
Desviacion mediana 22.45
Recorrido 140.00
Recorrido intercuantil 34.89
Recorrido interdecil 78.71
Observese (tabla 5) que los valores de las medidas de tendencias central se encuentran muy cerca entre si,
tambien se puede armar lo mismo de las desviaciones estandar, media y mediana. Sin embargo, no es de
esperar que todas las distribuciones de frecuencia tengan este comportamiento.
Estas comparaciones aclaran lo que las medidas numericas y las distribuciones de frecuencia pueden hacer
para descubrir la naturaleza inherente de un conjunto de mediciones. En consecuencias, el usuario debe
tener cuidado tanto en la eleccion como en la interpretacion de estas medidas. A pesar que la media y la
desviacion estandar se han empleado de manera extensa como medidas de tendencia central y dispersion
respectivamente, aunque tiene propiedades matematicas muy interesantes existen problemas para los cuales
no puede ser las medidas mas deseables. Para conjuntos de mediciones fsicas como lecturas de instrumentos,
especicaciones de partes, pesos, etc., la media y la desviacion estandar o desviacion media, son medidas
anheladas. Para conjunto de mediciones anes con ingresos y otras informaciones de tipo economico y
nancieros, la mejor eleccion para la medida de tendencia central y dispersion son la media y la desviacion
de la mediana respectivamente.
En muchas investigaciones de tipo economico y social proporcionan informacion en tablas de frecuencia que
no solo contienen clases de diferentes amplitudes sino tambien clases abiertas como mayores que.
o
menor
quecon el proposito de tener mayor cobertura de los datos. Estas clases se presentan en los extremos de la
Universidad Popular del Cesar Humberto Barrios 21
distribucion de frecuencia y no se especica los lmites de las clases. Como resultado, no se encuentra denido
el punto medio de la clase abierta y en consecuencias no se puede calcular la media, varianza, desviacion
estandar y desviacion media, a menos que se conozca un valor particular de la clase o que sea conocido su
promedio aritmetico.
1.4. EJERCICIOS
1. Los siguientes datos son los tiempos, en minutos, correspondiente a una muestra aleatoria de 50 personas
que estuvieron cobrando un cheque, un n de mes en un banco de la cuidad
17 16 39 30 23 38 32 20 43 32
44 41 23 17 29 26 21 34 44 24
21 27 36 21 17 28 29 34 24 28
25 29 45 23 16 34 20 30 23 35
35 27 19 31 45 40 14 29 23 19
a) Construir una distribucion de frecuencias, de clases, relativa, acumulada y relativa acumulada.
b) Construir histograma, polgono y ojiva con los resultados obtenidos en a.
c) Con los datos agrupados calcula: la media, mediana, moda, desviacion estandar, desviacion media,
desviacion mediana, y los recorridos intercuantil e interdecil.
2. Con los siguiente tres conjuntos de datos:
1 2 3 4 5 6
1 1 1 6 6 6
13 2 3 4 5 20
Calcular la media y la varianza para cada conjunto de datos. Que se puede concluir?
3. Con los datos del ejercicio 1, sea x
i
el tiempo que gasta el i-esimo cliente en cobrar un cheque para
i = 1, 2, . . . , 50. Transformar los datos por medio de la relacion
z
i
= (x
i
28.2)/8.928
Universidad Popular del Cesar Humberto Barrios 22
Con los datos transformados
a) Construir una distribucion de frecuencias, de clases, relativa, acumulada y relativa acumulada.
b) Construir histograma, polgono y ojiva con los resultados obtenidos en a.
c) Con los datos agrupados calcula: la media, mediana, moda, desviacion estandar, desviacion media,
desviacion mediana, y los recorridos intercuantil e interdecil.
d) Ha ocurrido alg un cambio en la naturaleza de la distribucion de frecuencia cuando esta se compara
con los del ejercicio 1?
4. Los datos que tienen una distribucion acampanada tienen caractersticas bien denidas con respecto a
la variacion, que se puede expresar en el siguiente enunciado:
Regla emprica. Para una distribucion de mediciones que es aproximadamente acampanada (forma
normal), el intervalo
( , +) Contiene aproximadamente el 68 % de las mediciones
( 2, + 2) Contiene aproximadamente el 95 % de las mediciones
( 3, + 3) Contiene casi todas las mediciones
Donde y son la media poblacional y desviacion estandar poblacional respectivamente.
Calcular el intervalo ( xk, x+k) para k =1, 2, y 3, del ejercicio 1, cuenta el n umero de mediciones
que se ubican dentro de cada intervalo y compara estos resultados con el n umero que podra esperarse
de acuerdo a la regla emprica.
5. Los siguientes datos agrupados representan los pagos ($10.000.

) para 50 vehculos en un parqueadero


en el centro de Valledupar, durante un semana.
Clases Frecuencias
1.10-1.86 4
1.87-2.63 14
2.64-3.40 11
3.41-4.17 9
4.18-4.94 7
4.95-5.71 1
5.72-6.48 2
6.49-7.27 2
Universidad Popular del Cesar Humberto Barrios 23
a) Construir una distribucion de frecuencia acumulada y relativa acumulada.
b) Construir histograma, polgono y ojiva con los resultados obtenidos en a.
c) Calcular la media, mediana, moda, desviacion estandar, desviacion media, desviacion mediana, y
los recorridos intercuartil e interdecil.
La regla emprica se nala que se puede aproximar la desviacion estandar de un conjunto de mediciones
por una cuarta parte del rango. Calcule esta aproximacion para la desviacion estandar en los conjunto
de datos de la tabla 1 y del ejercicio 1.
6. Las siguiente tres propiedades son importante cuando se emplea el smbolo de la sumatoria.
a)
n

i=1
c = nc
b)
n

i=1
cx
i
= c
n

i=1
x
i
c)
n

i=1
(x
i
+y
i
) =
n

i=1
x
i
+
n

i=1
y
i
1. Demostrar las siguientes identidades algebraicas:
a)
n

i=1
(x
i
x) = 0
b) s
2
=
1
n1
_
k

i=1
x
2
i
f
i
n x
2
_
2. Demuestre que la funcion
h(y) =
n

i=1
(x
i
y)
2
Tiene un mnimo en x . Utilice sus conocimientos de Calculo Diferencial.
7. Sea k 1. Demuestre que para cualquier conjunto de n mediciones, la fraccion que queda incluida en
el intervalo ( xks, x+ks) es por lo menos (1
1
k
2
). Este resultado se conoce con el nombre de teorema
de Tchbyshe.
8. Supongase que tenemos las siguientes medias: x
1
= 37, x
2
= 41 y x
3
= 28, basadas en 50, 20 y 10
observaciones respectivamente. Si hay que escoger una sola media, Cual sera su eleccion? Por que?
Cuales son los totales de las muestras originales? Como se usara estos totales para hallar la media
de las 80 observaciones?
Universidad Popular del Cesar Humberto Barrios 24
9. Sea x
1
, x
2
, . . . , x
n
una muestra aleatoria de una poblacion. Demuestre que
max
1in
[x
i
x[ <
(n 1)s

n
a menos que todas las n observaciones sean iguales o exactamente n 1 de las x
i
son iguales.
10. Sean x
1
, x
2
, . . . , x
k
marcas de clases diferentes con frecuencias f
1
, f
2
, . . . , f
k
respectivamente. Si y
i
=
ax
i
+c, son las marcas de clases de una nueva variable aleatoria y
i
. Demuestre que:
a) y = a x +c
b) s
2
y
= a
2
s
2
.
Universidad Popular del Cesar Humberto Barrios 25
UNIVERSIDAD POPULAR DEL CESAR
FACULTAD DE CIENCIAS B

ASICAS Y EDUCACI

ON
DEPARTAMENTO DE MATEM

ATICAS Y ESTAD

ISTICA
Trabajo de estadstca descriptiva
Los siguientes datos corresponden a una muestra aleatoria simple de tama no n = 100 seleccionadas de
los N = 365 das de las ventas (en millones) de un supermercado de la ciudad, los datos se muestra en la
tabla siguiente:
78 113 94 101 87 88 75 87 110 92 100 116 102 105 89 104 111 93 114 95
107 117 109 117 100 104 127 112 120 117 108 121 126 127 124 106 127 120 121 118
108 124 128 135 131 114 128 122 129 119 126 131 129 138 139 121 129 128 129 126
129 136 130 140 140 124 130 141 130 135 137 143 132 141 143 133 137 143 138 140
139 144 146 153 146 135 142 151 142 147 142 146 149 175 155 135 167 151 147 152
1. Encuentre las clases para el conjunto de datos anteriores, si se sabe que la primera clase tiene como
limite inferir 75 y la longitud de cada clase es c = 10.
2. Hallar las frecuencias absolutas y acumuladas para cada clase.
3. Que interpretacion se le da a las frecuencias absolutas y acumuladas en cada clase.
4. Hallar los limites reales para cada clase y sus marcas de clases e interprete.
5. Que porcentajes de das al a no tienen ventas superiores a $140.000.000 (ciento cuarenta millones de
pesos).
6. Que porcentajes das tiene ventas superiores o iguales a $173.000.000 y superiores o iguales $108.000.000.
7. Construir el histograma de frecuencias, poligono de frecuencias y ojiva e indicar cual debe ser el perl
de la poblacion.
8. Calcular la media, mediana y moda e interprete su signicados en terminos poblacionales.
9. Calcular el rango, varianza, desviaci on estandar, desviacion media y desviacion mediana e interprete
su signicados.
10. Calcular todos los deciles y cuartiles de la distribucion de frecuencias.
11. Calcular el recorrido interdecil y el recorrido intercuartil e interprete.
Captulo 2
PROBABILIDAD
2.1. INTRODUCCI

ON
La teora de probabilidad comenzo en siglo XVII con dos grandes matematicos franceses, Blaise Pascal y
Pierre de Fermat, aunque algunos matem aticos anteriores, como Gerolamo Cardano en el siglo XVI, haban
hecho importantes contribuciones a su desarrollo, la probabilidad matematica comenzo como un intento de
responder a varias preguntas que surgan en los juegos de azar. Hoy, la teora de probabilidad esta estable-
cida como una rama de las matematicas que encuentra aplicaciones en cada una de las area de la actividad
humana desde la m usica a la fsica, y en experiencia diarias como es la prediccion del tiempo a la prediciendo
de los riesgos de nuevos tratamientos medicos.
El objetivo principal en este captulo es desarrollar el arte de describir la incertidumbre asociados a
fenomenos que necesitan de modelos matematicos distintos de los deterministicos. Por lo que se reere
a modelos del probabilsticos, as como la habilidad de razonar bajo estos modelos. El primer paso de
esta capulo es describir la estructura generica del concepto de probabilidad a traves de un conjunto de
axiomas, y sus propiedades basias. Para esto, se empezara con una revision corta de la teora de conjunto.
2.2. CONJUNTOS
Para lograr un desarrollo ordenado de las ideas de la teora de la probabilidad, se requiere conocer los
conceptos basicos de la teora de conjunto. Se utilizara letras may usculas, A, B, C, , para indicar los
conjuntos y letras min usculas para los elementos de un conjunto. Notaremos:
x A signica que x es un elemento que pertenece a A;
x / A signica que x no pertenece a A.
26
Universidad Popular del Cesar Humberto Barrios 27
denota el conjunto vaco.
x
1
, x
2
, , x
n
o x
i

n
i=1
denota un conjunto nito que consta de los elementos x
1
, x
2
, , x
n
; al
conjunto vaco tambien se puede ver como un conjunto nito.
card(A) es el n umero de elementos de un conjunto nito A; por ejemplo, card() = 0 y card(1, 2, 3) =
3.
Diremos que un conjunto es innito si este no es nito; x
1
, x
2
, o x
i

i=1
denota a un conjunto
contable o enumerable, que consiste en una sucesion de elementos x
1
, x
2
, . As, cualquier conjunto
nito, incluyendo al conjunto vaco , se pueden ver como contable o enumerable.
Al conjunto de los elementos x que pertenecen a A que satisfacen cierta propiedad P lo escribiremos
x A [ P(x); por ejemplo, n N [ 2 < n < 6 = 3, 4, 5.
A B signica que A es subconjunto de B. Es decir, si x A implica que x B.
El conjunto de partes o conjunto potencia de A, el cual notaremos T(A) o 2
A
, es el conjunto formado
por todos los subconjuntos de A.
Sea X un conjunto cualesquiera y A
i
X para todo i I, diremos que / = A
i

iI
es una familia
indexada por I de subconjuntos A
i
de X.
Denamos los siguientes conjuntos.
1. La union

/ =

iI
A
i
= x[x A
i
, para alg un i I.
2. La interseccion

/ =

iI
A
i
= x[x A
i
, para todo i I.
3. Sea A X denimos y notaremos al complemento de Acomo A
c
= x X [ x no pertenece a A.
Por ejemplo, si tenemos a la familia / = A
1
, A
2
entonces la union y la interseccion de A
1
y
A
2
son A
1
A
2
y A
1
A
2
respectivamente. De manera similar si / es una familia numerable, es
decir, si / = A
1
, A
2
, , en este caso la union y la interseccion estan dadas por:

_
i=1
A
i
= A
i
A
2

i=1
A
i
= A
1
A
2

Universidad Popular del Cesar Humberto Barrios 28
4. Leyes de DMorgan
_
iI
A
c
i
= (

iI
A
i
)
c

iI
A
c
i
= (
_
iI
A
i
)
c
Si I = el conjunto vaco, entonces
5.

iI
A
i
=
6.

iI
A
i
= X
Una funcion de X en Y la cual notaremos como f : X Y es una relacion de X en Y la cual satisface
las siguientes propiedades:
1. D(f) = X, es el dominio de f es igual a X.
2. Si f(x) = y y f(x) = z entonces y = z.
Al conjunto X se denomina dominio de f y al conjunto Y codominio de f.
Si A X y B Y , denimos
3. La imagen de A por el conjunto
f(A) = y Y [ f(x) = y; para alg un x A
4. La imagen inversa de B por el conjunto
f
1
(B) = x X [ f(x) B
Si / = A
i

iI
es una familia de subconjuntos de X y B = B
i

iI
una familia de subconjuntos
de Y , se tiene las siguientes propiedades:
5. f(

iI
A
i
) =

iI
f(A
i
)
6. f(

iI
A
i
) =

iI
f(A
i
)
7. f
1
(

iI
B
i
) =

iI
f
1
(B
i
)
8. f
1
(

iI
B
i
) =

iI
f
1
(B
i
)
9. f
1
(B
c
i
) = [f
1
(B
i
)]
c
10. f(f
1
(B
c
i
)) B
i
11. A
i
f
1
(f(A
i
))
Sea funcion f : X Y entonces denimos
Universidad Popular del Cesar Humberto Barrios 29
1. f es sobre o sobreyectiva si y s olo si f(X) = Y .
2. f es 1-1 o inyectiva si y solo si x ,= y implica que f(x) ,= f(y) o en forma equivalente si f(x) = f(y)
implica x = y.
2.3. PROPIEDADES B

ASICAS
La teora de la probabilidad fue establecida sobre una base axiomatica idonea por el matematico ruso
Kolmogorov en la decada de los a nos treinta. Por supuesto, los axiomas y teoremas de Kolmogorov son mas
rigurosos que la version excesivamente simple que presentaremos a continuacion, para ilustrar el enfoque
axiomatico comenzaremos con la siguiente denicion.
Denicion 2.1. Un experimento es el proceso por medio del cual se obtiene una observacion.
Por ejemplo, el lanzamiento de un dado, el n umero de carros que llegan a la universidad en una hora
determinada, se les puede considerar un experimento. En el contexto de las ciencias sociales, la mayor parte
de los procedimientos de recogida de datos se pueden considerar como experimentos aleatorios. Cuando se
efect ua un experimento se pueden tener uno o mas resultados posibles, los cuales se denominan eventos.
Denicion 2.2. Un espacio muestral asociado a un experimento es el conjunto de todo los resultados
posibles de un experimento.
Por ejemplo, para el lanzamiento del dado el espacio muestral puede ser
= 1, 2, 3, 4, 5, 6
o tambien
= pares, impares.
Para el n umero de carros que llegan a la universidad en una hora determinada, el espacio muestral es
= x[x un n umero entero mayor o igual a cero.
Donde x es el n umero de carros que llegan en una hora determinada.
La denicion de un espacio muestral en un problema concreto depende de cual sean los aspectos que
desean analizarse.
Denicion 2.3. Un evento es cualquier subconjunto A del espacio muestral .
Universidad Popular del Cesar Humberto Barrios 30
Para el espacio muestral asociado con el lanzamiento de un dado, se tiene que cualquier subconjunto de
= 1, 2, 3, 4, 5, 6
es un evento de . En lo sucesivo, cualquier evento de un espacio muestral se puede representar mediante
los diagramas de Veen.
Denicion 2.4. Sea un espacio muestral asociado a un experimento. Una probabilidad es una funcion P
de valor real que asigna a cada evento A de un n umero real de tal manera que sean validos los siguientes
axiomas:
P1. Para todo evento A de P(A) 0. Es decir, la probabilidad de cualquier evento A de es un n umero
real no negativo.
P2. P() = 1
P3. Si A
1
, A
2
, A
3
, . . . es una sucesion de eventos de mutuamente excluyentes, es decir, A
i
A
j
= para
todo i ,= j , entonces
P(

_
n=1
A
n
) =

n=1
P(A
n
).
La pareja (, P) se llama un espacio de probabilidad. Un espacio de probabilidad es una descripcion del
experimento que informa de cual es el conjunto de posibles resultados del experimento, de los sucesos cuya
realizacion interesa, los eventos A de , los cuales permiten cuanticar la incertidumbre de que produzcan
los sucesos que interesan.
Teorema 2.1. P() = 0.
Demostracion. Sea A
1
= y A
i
= para i = 2, 3, . . . , es claro que A
i
A
j
= para todo i ,= j.
Por el axioma (3) tenemos que
P(

_
n=1
A
n
) =

n=1
P(A
n
) (2.1)
como
=

_
n=1
A
n
(2.2)
De (2.1) y (2.2) se inere que
P() = P() +

n=2
P(A
n
)
Universidad Popular del Cesar Humberto Barrios 31
y puesto que P(A
i
) 0 para todo i = 1, 2, 3, . . .. Entonces P(A
i
) 0 para todo i = 2, 3, . . .. En consecuencia
P() = 0.
Teorema 2.2. Sean A y B eventos de si A B = . Entonces
P(A B) = P(A) +P(B).
Demostracion. Considerese A
1
= A, A
2
= B, A
i
= , aplicando el axioma 3 se deduce
P(

_
n=1
A
n
) =

n=1
= P(A
1
) +P(A
2
) +

n=3
P(A
n
)
puesto que P() = 0 se concluye
P(

_
n=1
A
n
) =

n=1
P(A
n
) = P(A
1
) +P(A
2
) (2.3)
pero
A B =

_
n=1
A
n
(2.4)
De (2.3) y (2.4) se obtiene
P(A B) = P(A) +P(B).
Teorema 2.3. Sea A evento de . Entonces
P(A
c
) = 1 P(A).
Demostracion. Como = A A
c
y A A
c
= , aplicando el axioma P2 y el teorema 2, se tiene
P() = P(A A
c
) = P(A) +P(A
c
) = 1
En consecuencia
P(A
c
) = 1 P(A).
Teorema 2.4. Sean A y B eventos de , tales que A B. Entonces
P(A) P(B).
Universidad Popular del Cesar Humberto Barrios 32
Demostracion. Notese que el evento B se puede escribir como
B = A (A
c
B)
donde los eventos A y (A
c
B) son mutuamente excluyentes. En consecuencia, por teorema 2 se tiene
P(B) = P(A) +P(A
c
B)
como
P(A
c
B) 0
se sigue
P(A) P(B).
Teorema 2.5. Sean A y B eventos de . Entonces
P(A B) = P(A) +P(B) P(A B)
Demostracion. Es facil comprobar que
Figura 2.1: A B
A B = A (A
c
B) (2.5)
y A (A
c
B) =
Universidad Popular del Cesar Humberto Barrios 33
tambien
B = (A B) (A
c
B) (2.6)
y A B) (A
c
B) =
de (2.5) y teorema 2, se inere
P(A B) = P(A) +P(A
c
B) (2.7)
por (2.6) y teorema 2, se obtiene
P(B) = P(A B) +P(A
c
B) (2.8)
De (2.7) y (2.8) se establece
P(A B) = P(A) +P(B) P(A B).
Teorema 2.6. Sean A
1
, A
2
, A
3
, . . . una sucesion de eventos de tales que A
1
A
2
A
3
. . .. Entonces
P(

_
n=1
A
n
) = lm
n
P(A
n
).
Demostracion. Sea
B
1
= A
1
B
2
= A
2
A
c
1
B
3
= A
3
A
c
2
.
.
.
B
n
= A
n
A
c
n1
.
.
.
siendo n 1 y B
i
B
j
= para todo i ,= j. Es claro que

_
n=1
A
n
=

_
n=1
B
n
aplicando el axioma P2, se tiene que
Universidad Popular del Cesar Humberto Barrios 34
P(

_
n=1
A
n
) = P(

_
n=1
B
n
)
=

n=1
P(B
n
) = lm
n
n

n=1
P(B
n
)
= lm
n
P(
n
_
n=1
B
n
) = lm
n
P(A
n
).
Teorema 2.7. Sean A
1
, A
2
, A
3
, . . . una sucesion de eventos de tales que A
1
A
2
A
3
. . .. Entonces
P(

n=1
A
n
) = lm
n
P(A
n
).
Demostracion. Es claro que la sucesion A
c
1
, A
c
2
, A
c
3
, . . . es creciente, por lo tanto
P(

n=1
A
n
) = P(

_
n=1
A
c
n
)
c
ley DeMorgan
= 1 P(

_
n=1
A
c
n
) por teorema 3
= 1 lm
n
P(A
c
n
) teorema 6
= lm
n
(1 P(A
c
n
)) teorema 3
= lm
n
P(A
n
).
Observese que la denicion de probabilidad solamente expresa cuales son las propiedades que tiene una
funcion de probabilidad, pero no expresa como asignar las probabilidades especcas de los eventos.
2.4. Diferentes maneras de asignar probabilidades
En un experimento aleatorio no es posible determinar con absoluta precision cual sera el resultado. Sin
embargo, unos resultados suelen ser mas verosmiles que otros. Intuitivamente, la probabilidad indica el grado
de conanza en que ocurra cada suceso. Existen diferentes interpretaciones del concepto de probabilidad que
pretenden dar sentido a esta idea. Algunas de ellas son las siguientes:
Universidad Popular del Cesar Humberto Barrios 35
2.4.1. Probabilidad clasica
Se dene la probabilidad como el cociente entre el n umero de casos favorables y el n umero total de casos,
siempre que todos ellos sean igualmente posibles. Por ejemplo, si se lanza un dado, la probabilidad de cada
cara es 1/6. Esta denicion no implica que se realice verdaderamente el experimento. La probabilidad se
dene independientemente de que el experimento se lleve a cabo o no, y depende unicamente de la geometra
o las propiedades fsicas del objeto en cuestion.
2.4.2. Probabilidad frecuentista
Supongamos que se lanza un dado N veces en las mismas condiciones y sale la cara c un n umero n de
veces. La denicion frecuentista de la probabilidad de obtener el resultado c es:
P(c) = lm
n
n
N
Al igual que en el caso anterior, esta denicion es una forma conceptual de entender lo que es un experimento
aleatorio (por ejemplo, lanzar un dado), y no signica que en la practica haya que repetirlo un n umero
ilimitado de veces para calcular la probabilidad. Esto se debe a dos razones: en la practica es imposible
repetir un mismo experimento en identicas condiciones; el dado se deteriorara cuantas mas veces se lance,
la velocidad del aire cambiara, etc. Ademas, si se pudiera repetir el fenomeno en identicas condiciones el
resultado sera el mismo en todos los lanzamientos, por lo que el concepto de probabilidad perdera su sentido.
2.4.3. Probabilidad subjetiva
La probabilidad no se concibe como una propiedad del experimento sino como un grado de creencia
personal que el individuo tiene acerca del resultado del mismo. Este enfoque se basa en tres principios:
a. Consistencia (propiedad transitiva). Si el resultado R
1
es mas probable que R
2
, y este es mas probable
que R
3
, entonces R
1
es mas probable que R
3
.
b. Principio de racionalidad o coherencia. Supongamos que un sujeto esta dispuesto a apostar una cantidad X
por la ocurrencia de un suceso, y espera recibir un premio Y por dicha apuesta (X < Y ). La probabilidad
subjetiva es el cociente X/Y .
c. Intercambiabilidad. Sean R
1
, R
2
, . . . , R
n
una coleccion de sucesos. La probabilidad de que se den todos
ellos simultaneamente no depende del orden de los mismos, es decir:
P(R
1
, R
2
, . . . , R
n
) = P(R
i
, R
j
, . . . , R
k
) , donde i, j, . . . , k = 1, ..., n y ademas i ,= j ,= ,= k
Ejemplo 2.1. Considerese el experimento de lanzamiento de un dado.
a. Hallar el espacio muestral
Universidad Popular del Cesar Humberto Barrios 36
b. Asigne probabilidades a cada resultado posible
c. Hallar la probabilidad de obtener un n umero par.
Solucion.
a. El espacio muestral asociado al experimento, del lanzamiento de un dado, es
= 1, 2, 3, 4, 5, 6.
b. El axioma P2 dice que la suma de todas las probabilidades de los elementos de debe ser igual a uno. Por
lo tanto una forma de asignar probabilidades es suponer a priori que el dado es perfecto, y en consecuencia
cada una de las caras tiene la misma posibilidad de salir, en este caso,
P(i) =
1
6
; i=1, 2, 3, 4, 5, 6.
Esta forma de asignar probabilidad se denomina clasica.
c. El evento obtener un n umero par es el subconjunto
A = 2, 4, 6
P(A) =
n umero de casos favorables
n umero de caso posibles
=
3
6
=
1
2
.
Ejemplo 2.2. Un fabricante tiene cinco terminales de computador aparentemente identicos listos para ser
enviados a su destino. El no sabe que dos son defectuosos. Recibe un pedido especial de dos terminales y lo
surte seleccionado al azar dos de los cinco disponibles.
a. Encuentrese el espacio muestral para este experimento
b. Sea A el evento en que el pedido se surte con dos terminales no defectuosos. Liste los puntos muestrales
de A
c. Asigne probabilidades a cada resultado posible
d. Calcular la probabilidad del evento A.
Solucion.
Universidad Popular del Cesar Humberto Barrios 37
a. Sean d
1
, d
2
los dos terminales defectuoso y b
1
, b
2
, b
3
los terminales buenos. Los eventos simples pueden
representarse como sigue:
e
1
= d
1
, d
2
e
6
= d
2
, b
2

e
2
= d
1
, b
1
e
7
= d
2
, b
3

e
3
= d
1
, b
2
e
8
= b
1
, b
2

e
4
= d
1
, b
3
e
9
= b
2
, b
3

e
5
= d
2
, b
1
e
10
= b
3
, b
3
.
Por lo tanto el espacio muestral es:
= e
1
, e
2
, e
3
, e
4
, e
5
, e
6
, e
7
, e
8
, e
9
, e
10
.
b. El evento A = e
8
, e
9
, e
10

c. Como las terminales son identicos se puede asumir que tiene la misma posibilidad de ser seleccionado
cualquiera de los elementos del espacio muestral, luego
P(e
i
=
1
10
; i=1, 2, 3, 4, 5, 6, 7, 8, 9, 10.
d. Puesto que el evento A = e
8
, e
9
, e
10
= e
8
e
9
e
10
, aplicando el teorema 2, se obtiene
P(A) = P(e
8
) +P(e
9
) +P(e
10
) =
3
10
.
Ejemplo 2.3. Una empresa dedicada a la b usqueda de petroleo o gas natural encuentra en 10 % de sus
perforaciones. Si la compa na perfora dos pozos, los cuatro eventos simples posibles y tres de sus probabilidades
asociadas son:
RESULTADOS
EVENTOS 1 perforacion 2 perforacion Probabilidad
e
1

Exito

Exito 0.01
e
2

Exito Fracaso
e
3
Fracaso

Exito 0.09
e
4
Fracaso fracaso 0.81
a. Obtenga la probabilidad de que la compa na encuentre petroleo o gas en la primera perforacion y falle en
la segunda
Universidad Popular del Cesar Humberto Barrios 38
b. Obtenga la probabilidad de que la compa na encuentre petroleo o gas en al menos una de las dos perfora-
ciones.
Solucion.
El experimento consiste en la perforacion de pozos en busca de petroleo o gas. El espacio muestral es:
= e
1
, e
2
, e
3
, e
4

donde, por ejemplo, e


3
signica fracaso en la primera perforacion y exito en la segunda.
a. El evento de encontrar petroleo o gas en la primera perforacion y fracaso en la segunda perforacion es:
A = e
2
.
Por otro lado, se tiene por axioma P2, que
P() = P(e
1
) +P(e
2
) +P(e
3
) +P(e
4
) = 1
entonces
P(e
2
) = 1 (P(e
1
) +P(e
3
) +P(e
4
)) = 1 (0.01 + 0.09 + 0.81) = 0.09.
b. El evento de que encuentre petroleo o gas en al menos en una de las dos perforaciones es
B = e
1
, e
2
, e
3

por lo tanto
P(B) = P(e
1
) +P(e
2
) +P(e
3
) = 0.01 + 0.09 + 0.09 = 0.19
Otra forma de calcular la probabilidad de P(B) es:
P(B) = 1 P(e
4
) = 1 0.81 = 0.19.
Ejemplo 2.4. Una agencia comercial compra papelera a uno de los tres vendedores v
1
, v
2
y v
3
. Se ordena
el pedido en dos das consecutivos, un pedido por da, tal que (v
1
, v
2
) signica que el vendedor v
1
recibe el
pedido el primer da y el vendedor v
2
lo recibe el segundo da.
a. Determine los puntos muestrales de este experimento
Universidad Popular del Cesar Humberto Barrios 39
b. Supongase que se seleccionan los vendedores al azar cada da, asigne una probabilidad a cada punto
muestral
c. Sean A el evento de que el mismo vendedor recibe los dos pedidos y el evento B de que el vendedor v
2
consigue por lo menos un pedido. Calcular: P(A), P(B), P(A B) y P(A B).
Solucion.
a. El experimento consiste en la solicitud de papelera que hace una agencia comercial en dos das consecu-
tivos. Como (v
i
, v
j
) representa que el vendedor i recibio el primer pedido y j el segundo pedido. Entonces
el espacio muestral es:
= (v
1
, v
1
), (v
1
, v
2
), (v
1
, v
3
), (v
2
, v
1
), (v
2
, v
2
), (v
2
, v
3
), (v
3
, v
1
), (v
3
, v
2
), (v
3
, v
3
)
b. Como la seleccion se hace de manera aleatoria cada da, es natural suponer que todos los vendedores
tienen la misma posibilidad de ser seleccionados por lo tanto
P((v
i
, v
j
)) =
1
9
; i,j=1, 2, 3.
c. Los eventos
A = (v
1
, v
1
), (v
2
, v
2
), (v
3
, v
3
)
B = (v
1
, v
2
), (v
2
, v
1
), (v
2
, v
2
), (v
2
, v
3
), (v
3
, v
2
)
A B = (v
2
, v
2
)
se tiene
P(A) = P((v
1
, v
1
), (v
2
, v
2
), (v
3
, v
3
)) =
1
3
P(B) = P((v
1
, v
2
), (v
2
, v
1
), (v
2
, v
2
), (v
2
, v
3
), (v
3
, v
2
)) =
5
9
P(A B) = P((v
2
, v
2
)) =
1
9
.
Por lo tanto
P(A B) = P(A) +P(B) P(A B) =
1
3
+
5
9
1
9
=
7
7
.
Universidad Popular del Cesar Humberto Barrios 40
2.5. PROBABILIDAD CONDICIONAL
La probabilidad condicional nos permite ajustar un evento si se sabe que ha ocurrido un evento relacionado
con el primero.
Denicion 2.5. . Sea B un evento del espacio muestral tal que P(B) > 0. Entonces la probabilidad
condicional del evento A, dado que el evento B ocurrio, se dene como la razon
P(A[B) =
P(A B
P(B)
.
De la misma manera se dene
P(B[A) =
P(A B
P(A)
.
Tambien de la denicion de probabilidad condicional se obtiene lo que se conoce como teorema de multi-
plicacion
P(A B) = P(A[B)P(B) = P(B[A)P(A).
Ejemplo 2.5. Supongase que una ocina hay 100 maquinas calculadoras. Algunas de esas maquinas son
electricas (E), mientras otras son manuales (M). Ademas, algunas son nuevas (N), mientras otras son usadas
(U). La siguiente tabla da el n umero de maquinas de cada categora.
E M Total
N 40 30 70
U 20 10 30
Total 60 40 100
Una persona entra a la ocina, escoge una maquina al azar y descubre que es nueva. Cual es la probabilidad
de que sea electrica?
Solucion.
Se sabe que la persona escogio una maquina nueva de la 70 y se tienen 40, por lo tanto
P(E[N) =
4
7
.
Otra forma es calcular la probabilidad que se nueva y electrica,
P(E[N) = 0.40 y P(N) = 0.70.
Entonces
P(E[N) =
P(E N
P(N)
=
0.40
0.70
=
4
7
.
Universidad Popular del Cesar Humberto Barrios 41
Ejemplo 2.6. Considerese las familias que tienen dos hijos y supongase que varones y mujeres son igual-
mente probables. Si se escoge una familia al azar y en la familia hay un hijo varon cual es la probabilidad
de que el otro sea varon?
Solucion.
En este caso el espacio muestral es
= (v, v), (v, m), (m, v), (m, m).
Donde v es varon, m es mujer y el orden del par es el orden de los nacimientos. Cada uno de los puntos tiene
la probabilidad
1
4
. Sean los eventos A: uno de los hijos es varon y B: ambos son varones, entonces
A = (v, v), (v, m), (m, v)
y
A = (v, v)
como B A entonces B = A B. Por lo tanto
P(A[B) =
P(A B)
P(B)
=
1
3
.
Denicion 2.6. Se dice que los eventos B
1
, B
2
, B
3
, B
4
, . . . B
n
representa una particion del espacio muestral
si:
1. B
i
B
j
= para todo i ,= j.
2.
n

i=1
B
i
=
3. P(B
i
) 0 para todo i = 1, 2, 3, . . . , n.
Teorema 2.8 (Teorema de la Probabilidad Total). Sea B
1
, B
2
, B
3
, . . . , B
n
una particion del espacio muestral
y A un evento de . Entonces
P(A) =
n

i=1
P(A[B
i
)P(B
i
).
Demostracion. Es facil observar que A es la union disjunta de elementos de , como se muestra en la siguiente
graca.
Universidad Popular del Cesar Humberto Barrios 42
Figura 2.2: A B
Esto es:
A = (A B
1
) (A B
2
) (A B
3
) . . . (A B
n
)
donde
(A B
1
) (A B
2
= ; para todo i ,= j
entonces
P(A) =
n

i=1
P(A B
i
) (2.9)
pero tenemos que para i = 1, 2, . . . , n
P(A B
i
) = P(A[B
i
)P(B
i
) (2.10)
sustituyendo (2.10) en (2.9), se obtiene
P(A) =
n

i=1
P(A[B
i
)P(B
i
).
Ejemplo 2.7. Cierto artculo se hace en una de tres fabricas, digamos 1,2 y 3. Se sabe que la primera
produce el doble de artculos que la segunda. Tambien se sabe que la segunda y la tercera producen el mismo
n umero de artculo(durante un periodo de produccion especco). Se conoce tambien que el 2 % de los artculos
producidos por cada una de las dos primeras son defectuosos; mientras que 4 % de los manufacturados por
la tercera son defectuosos. Todos los artculos se colocan en una la y se escoge uno al azar. Cual es la
probabilidad de que este artculo sea defectuoso?
Universidad Popular del Cesar Humberto Barrios 43
Solucion.
Denamos los siguientes eventos:
A = el artculo es defectuoso
B
1
= el artculo proviene de la fabrica 1
B
2
= el artculo proviene de la fabrica 2
B
3
= el artculo proviene de la fabrica 3.
Entonces para i = 1, 2, 3
(A B
1
) = el articulo es defectuoso y proviene de la fabrica i
Luego
A = (A B
1
) (A B
2
) (A B
3
)
por otra parte se tiene que
P(A[B
1
) = 0.02
P(A[B
2
) = 0.02
P(A[B
3
) = 0.04
P(B
1
) = 0.5
P(B
2
) = 0.25
P(B
3
) = 0.25.
Reemplazando los valores anteriores en
P(A) = P(A[B
1
)P(B
1
) +P(A[B
2
)P(B
2
) +P(A[B
3
)(B
3
)
se obtiene
P(A) = (0.02)(0.5) + (0.02)(0.25) + (0.04)(0.25) = 0.025.
Por lo tanto la probabilidad que un artculo sea defectuoso es 0.025.
Universidad Popular del Cesar Humberto Barrios 44
Teorema 2.9 (Teorema de Bayes). Sea B
1
, B
2
, B
3
, . . . , B
n
una particion del espacio muestral . Para
cualquier evento A de , done P(A) > 0 y cualquier j, 1 j n. Entonces
P(B
j
[A) =
P(A[B
j
)P(B
j
)
n

i=1
P(A[B
i
)P(B
i
)
.
Demostracion. Por la denicion de probabilidad condicional se tiene
P(B
j
[A) =
P(A B
j
)
P(A)
(2.11)
Por otra parte se tiene que
P(B
j
A) = P(A [ B
j
)P(B
j
) (2.12)
por teorema de la probabilidad total
P(A) =
n

i=1
P(A [ B
i
)P(B
i
) (2.13)
reemplazando (2.12) y (2.13) en (2.11) se obtiene
P(B
j
[A) =
P(A [ B
j
)P(B
j
)
n

i=1
P(A[B
i
)P(B
i
)
.
Ejemplo 2.8. Supongase que varias cajas son de dos tipos B
1
y B
2
. El tipo B
1
contiene 70 % de caramelos
dulces y 30 % de caramelos acidos, mientras que el tipo B
2
dicho porcentaje esta invertido. Supongase ademas
que el 60 % de todas las cajas son del tipo B
1
, mientras que el resto son del tipo B
2
. Si se escoge un caramelo
dulce al azar de una caja desconocida. Decidir de que tipo proviene.
Solucion.
Se tienen dos tipos de cajas B
1
y B
2
con probabilidades de seleccion
P(B
1
) = 0.60
y
P(B
2
) = 0.40.
Sea los eventos
Universidad Popular del Cesar Humberto Barrios 45
D = conjunto de caramelos dulces
A = conjunto de caramelos acidos
por otra parte se tiene que
P(D[B
1
) = 0.70
P(D[B
2
) = 0.30
P(A[B
1
) = 0.30
P(A[B
2
) = 0.70.
As
P(B
1
[D) =
P(D[B
1
)P(B
1
)
P(D[B
1
)P(B
1
) +P(D[B
2
)P(B
2
)
=
(0.7)(0.6)
(0.7)(0.6) + (0.3)(0.4)
=
7
9
y
P(B
2
[D) =
P(D[B
2
)P(B
2
)
P(D[B
1
)P(B
1
) +P(D[B
2
)P(B
2
)
=
(0.3)(0.4)
(0.7)(0.6) + (0.3)(0.4)
=
2
9
Por lo tanto se decide a favor de los caramelos que provienen de las cajas B
1
.
2.6. EVENTOS INDEPENDIENTES
Denicion 2.7. Los eventos A
1
, A
2
, A
3
, . . . , A
n
de se dicen independientes si para todo conjunto de ndices
i
1
, i
2
, i
3
, . . . , i
k
entre 1 y n se tiene que
P(A
i1
A
i2
A
i3
. . . A
i
k
) = P(A
i1
)P(A
i2
)P(A
i3
) . . . P(A
i
k
).
En particular, los eventos A y B son eventos independientes en , si
P(A B) = P(A)P(B).
Es facil vericar que los eventos y son independientes.
Ejemplo 2.9. Un lote de diez objetos contiene cuatro defectuosas y seis en buen estado. Se extraen dos
objetos sucesivamente y sin reemplazo. Sea
Universidad Popular del Cesar Humberto Barrios 46
D
1
= el primer objeto es defectuoso
D
2
= el segundo objeto es defectuoso
a. Son independientes estos eventos?
b. Que sucede si los objetos se extraen con reemplazo?
Solucion.
Si D
1
, el primer objeto es defectuoso, entonces
P(D
1
) =
2
5
y la probabilidad del evento D
2
el segundo objeto es defectuoso, es
P(D
2
) = P(D
2
[D
1
)P(D
1
) +P(D
2
[D
c
1
)P(D
c
1
) =
1
3
2
5
+
4
9
3
5
=
2
5
.
Por otra parte, la probabilidad de D
2
dado que ocurrio D
1
es:
P(D
2
[D
1
) =
3
9
de lo cual se tiene que
P(D
2
[D
1
) ,= P(D
2
)
En el segundo caso se tiene
P(D
1
) = P(D
2
) =
2
5
y
P(D
1
D
2
) = P(D
1
)P(D
2
) =
4
25
.
Por lo tanto, si la seleccion se realiza con reemplazo los eventos son independientes.
2.7. EJERCICIOS
1. Supongase que se lanzan tres monedas perfectas y se observa el resultado de las caras que quedan hacia
arriba.
Universidad Popular del Cesar Humberto Barrios 47
a. Establezca los puntos muestrales de este experimento.
b. Asigne una probabilidad razonable a cada punto.
c. Sea A el evento de observar exactamente una cara y B el evento de observar al menos una cara.
Obtenga los puntos muestrales de los eventos A y B.
d. De la respuesta de (c), calcular P(A), P(B), P(A B), P(A B) y P(A
c
B).
2. Cuatro administradores de empresa solicitan dos puestos en una compa na. Uno y solamente uno de
los aspirantes es miembro de una etnica de la Sierra Nevada de Santa Marta. Los puestos se otorgan
seleccionado aleatoriamente dos de los aspirantes.
a. Establezca los puntos muestrales de este experimento.
b. Asigne las probabilidades a los resultados del espacio muestral.
c. Encuentre la probabilidad de que el aspirante de la etnica de la Sierra Nevada de Santa Marta se
seleccionado para un puesto.
3. Un equipo de comunicacion contiene seis sistemas electronicos complejos. Se seleccionan aleatoriamente
dos de los seis para someterlos a pruebas rigurosas y clasicarlos como defectuosos y no defectuosos.
a. Si dos de los seis sistemas son realmente defectuosos, encuentre la probabilidad que al menos uno de
los dos sistemas probados sean defectuosos. Encuentre la probabilidad que los dos sean defectuosos.
b. Encuentre la probabilidad indicada en (a) para el caso en que cuatro de los seis sistemas sean
realmente defectuosos.
4. Un supermercado vende solamente dos tipos de lamparas electricas y la experiencia muestra que tienen
igual demanda. Cuatro clientes entran uno tras otro para comprar una lampara. El vendedor se interesa
por la preferencia de sus clientes.
a. Establezca los puntos muestrales de este experimento.
b. Asigne las probabilidades a los resultados del espacio muestral.
c. Sea A el evento de que los cuatro clientes preeren el mismo tipo de lampara. Calcular P(A).
5. Dos equipos de f utbol, I Y II, tienen la misma capacidad y juegan uno contra el otro una serie de
cuatro juegos. Se registra el resultado de cada juego.
a. Establezca los puntos del espacio muestral de este experimento.
b. Asigne las probabilidades a los resultados del espacio muestral.
c. Sea A el evento de que el equipo I gana exactamente tres veces. Calcular P(A).
Universidad Popular del Cesar Humberto Barrios 48
6. Los enfermos no hospitalizados que acuden a una clnica pueden elegir una de tres secciones para ser
atendidos. Suponga que los medicos son asignados aleatoriamente a tales secciones y que por esto los
pacientes no presentan preferencia alguna con respecto a una seccion. Tres pacientes acuden a la clnica
y se observan la seccion que eligen.
a. Establezca los puntos del espacio muestral de este experimento.
b. Asigne las probabilidades a los resultados del espacio muestral.
c. Sea A el evento de que cada seccion recibe un paciente. Establezca los puntos muestrales de A.
Calcular P(A).
7. Se tienen 3 libros: uno de aritmetica (A), uno de biologa (B) y otro de calculo(C). De cuantas maneras
se pueden ordenar en un estante?
8. Se tienen 7 libros y solo 3 espacios en una biblioteca, suponiendo que no existan razones para preferir
alguno. De cuantas maneras se pueden colocar 3 libros elegidos; entre los siete dados?
9. Cuantas permutaciones pueden formarse con las letras de la palabra BONDAD?
10. Cuantos grupos de 5 alumnos pueden formarse con los treinta alumnos de una clase. (Un grupo es
distinto de otro si se diferencia de otro por lo menos en un alumno).
11. Una aerolnea tiene seis vuelos diarios Barranquilla a Medelln y siete vuelos de Medelln a Cali. Si los
vuelos se hacen en das separados. Cuantos arreglos diferentes de vuelos puede ofrecer la aerolnea de
Barranquilla a Cali?
12. Una operacion de montaje en una f abrica manufacturera requiere tres pasos que pueden realizarse en
cualquier orden. De cuantas maneras se puede hacer el montaje?
13. Cierta marca de automovil tiene cinco modelos diferentes, con cuatro tipo de motores, con dos tipos
de transmision, y en ocho colores.
a. Cuantos automoviles tendra que adquirir un distribuidor si quiere incluir un carro por combinacion
modelo-motor-trasmision?
b. Cuantos automoviles tendra que tener en existencia un centro de distribucion si almacenara los
carros de todos los colores disponibles para cada combinacion en (a.)?
14. Un investigador quiere determinar el efecto de tres variables, presion, temperatura y el tipo de catal-
izador, en el proceso de renacion. Si el investigador tiene la intencion de utilizar tres temperaturas,
tres presiones y dos tipos de catalizador. Cuantos experimentos habra que hacer si quiere incluir
todas las posibles combinaciones de temperaturas, de presiones y tipos de catalizador?
Universidad Popular del Cesar Humberto Barrios 49
15. Cinco empresas F1, F2, F3, F4 y F5, hacen propuestas con respecto a tres contratos separados, C1, C2
y C3. Una empresa solo puede obtener a lo mas un contrato. Los contratos son bastante diferentes, de
tal manera que la asignacion de C1 a F1 se debe diferenciar de la asignacion de C2 a F2.
a. Cuantos puntos muestrales tiene este experimento que trata de la asignacion de los contratos a las
empresas?
b. Encuentre la probabilidad de que se conceda un contrato a la empresa F3, bajo el supuesto de que
los puntos muestrales son equiprobable.
16. Dado los siguientes eventos A y B, tales que P(A) = 0.5, P(B) = 0.3, y P(A B) = 0.1, encontrar lo
siguiente:
a. P(A[B)
b. P(B[A)
c. P(A[A B)
d. P(A[A B)
e. P(A B[A B)
17. Un armador de ventiladores electricos usa motores de dos proveedores. La compa na A le suministra
el 70 % y la compa na B el otro 30 % de los motores. Supongase que sabe que el 5 % de los motores
que suministra la compa na A son defectuosos que el 3 % de los que suministra B tambien lo son. Se
selecciona un ventilador ya armado.
a. Cual es la probabilidad que tenga un motor defectuoso?
b. Si tiene un motor defectuoso cual es la probabilidad que ese motor haya sido suministrado por la
compa na A?
c. Si tiene un motor defectuoso cual es la probabilidad que ese motor haya sido suministrado por la
compa na B?
18. Los empleados de un supermercado se encuentra clasicado en tres categoras: administradores, super-
visores y vendedores. La siguiente tabla indica el n umero de empleados en cada division clasicados
por sexo:
Mujeres (M) Hombres (H) Total
Administradores (A) 20 30 50
Supervisores (S) 50 20 70
Vendedores (V) 100 80 180
Total 170 130 300
Universidad Popular del Cesar Humberto Barrios 50
a. Si elige aleatoriamente un empleado:
i. Cual es la probabilidad que sea mujer?
ii. Cual es la probabilidad que sea un vendedor?
iii. Cual es la probabilidad que sea mujer y trabaje en la seccion de administracion?
iv. Cual es la probabilidad que sea mujer si trabaja en la division de supervision?
b. Son los eventos V y H estadsticamente independientes?
c. Son los eventos A y M estadsticamente independientes?
d. Determine las siguientes probabilidades:
i. P(A M)
ii. P(A M
c
)
iii. P(S M)
iv. P(M[A)
19. Sean A y B dos eventos cualesquiera de un espacio muestral . Si A y B son mutuamente excluyentes,
muestrese que no pueden ser independientes. Ded uzcase que dos eventos independientes son, tambien,
mutuamente.
20. Se lanza una moneda diez veces y en todos los lanzamientos el resultado es cara.
a. Cual es la probabilidad de este evento?
b. Cual es la probabilidad de que en el decimoprimero lanzamiento el resultado sea cara?
21. Una agencia de automoviles recibe un embarque de 20 automoviles nuevos. Entre estos, dos tienen
defectos. La agencia decide seleccionar, aleatoriamente, dos automoviles entre los 20 y aceptar el
embarque si ninguno de los dos vehculos seleccionados tienen defectos. Cual es la probabilidad de
aceptar el embarque?
22. Se lanza una moneda con una probabilidad de
2
3
que el resultado sea cara. Si aparece una cara, se extrae
una pelota, aleatoriamente, de una urna que contiene dos pelotas rojas y tres verdes. Si el resultado es
sello se extrae una pelota, de otra urna, que contiene dos rojas y dos verdes. Cual es la probabilidad
de extraer una pelota roja?
23. De entre 20 tanques de combustible fabricados para el trasbordador espacial, tres se encuentran defec-
tuosos. Si se seleccionan aleatoriamente cuatro tanques:
a. Cual es la probabilidad que ninguno de los tanques se encuentre defectuoso?
b. Cual es la probabilidad de que uno de los tanques tenga defectos?
Universidad Popular del Cesar Humberto Barrios 51
24. La probabilidad de que cierto componente electrico funcione es de 0.9. un aparato contiene dos de estos
componentes. El aparato funciona mientras lo haga, por lo menos, uno de los componentes.
a. Sin importar cual de los dos componente funcione o no. Cuales son los posibles resultados y sus
respectivas probabilidades?. Suponga independencia en la operacion entre los componentes.
b. Cual es la probabilidad que el aparato funcione?
25. Con base en varios estudios una compa na ha clasicado, de acuerdo con la posibilidad de descubrir
petroleo, las formaciones geologicas en tres tipos. La compa na pretende perforar un pozo en deter-
minado sitio, al que le asigna las probabilidades 0.35, 0.40 y 0.25 para los tres tipos de formaciones
respectivas. De acuerdo con la experiencia, se sabe que el petroleo se encuentra en un 40 % de forma-
ciones de tipo I, en un 20 % de formaciones de tipo II y en un 30 % de formaciones de tipo III. Si la
compa na no descubre petroleo en ese lugar, determnese la probabilidad de que exista una formacion
de tipo II.
26. Se debe examinar un grupo grande de personas respecto a dos sntomas comunes de cierta enfermedad.
Se considera que el 20 % de las personas presentan solamente el sntoma A, el 30 % tienen solamente el
sntoma B, 10 % tienen ambos sntomas, y el resto no tiene sntoma alguno. Para una persona escogida
aleatoriamente de este grupo, encuentre las probabilidades de los eventos siguientes:
a. Que la persona no presente sntoma alguno
b. Que la persona presentela menos un sntoma
c. Que la persona presente ambos sntoma, dado que presenta el sntoma B.
27. Una planta ensambladora recibe circuitos proveniente de tres fabricas distintas B1, B2 y B3. El 50 %
del total se compran a B1 mientras que a B2 y B3 se les compra un 25 % a cada una. El porcentaje de
circuitos defectuosos para B1, B2 y B3 es 5, 10 y 12 % respectivamente. Si los circuitos se almacenan
en la planta sin importar quien fue el proveedor:
a. Determinar la probabilidad de que una unidad armada en la planta contenga un circuito defectuoso
b. Si un circuito no es defectuoso. Cual es la probabilidad de que haya sido vendido por el proveedor
B2.
28. Supongase que hay nueve lugares disponibles en un estacionamiento, uno junto al otro. Un acomodador
tiene que estacionar nueve carros. Tres son carros deportivos, tres son carros grandes nacionales, y
tres son carros compactos importados. Cual es la probabilidad de que los tres carros deportivos se
encuentren juntos, suponiendo que el acomodador estaciona los carros de manera aleatoria?
29. Se clasican ocho marcas de llantas de 1 a 8 (de la mejor a la peor) seg un el kilometraje que aguanten.
Si un comprador escoge cuatro llantas aleatoriamente, encuentre la probabilidad de que la mejor llanta
Universidad Popular del Cesar Humberto Barrios 52
entre las seleccionadas por el comprador se encuentre realmente en el tercer lugar entre las ocho llantas
originales.
30. Una maquinaria para producir un nuevo tubo electronico experimental genera tubos defectuosos de vez
en cuando, de una manera aleatoria. El ingeniero supervisor de una maquina en particular, ha notado
que los tubos defectuosos parecen agruparse (y, por tanto, aparecen de manera no aleatoria) y esto
sugiere el mal funcionamiento de alguna de la maquina. Una prueba para detectar la no aleatoriedad
de un evento, se basa en el n umero de corridas de artculos defectuosos y buenos (una corrida es una
sucesion no interrumpida de artculos defectuosos o buenos). Mientras mas peque na sea el n umero
de corridas, mas grande es la evidencia que indica la no aleatoriedad. De 12 tubos producidos por la
maquina, los 10 primeros eran buenos y los dos ultimos defectuosos (BBBBBBBBBBDD). Suponga la
aleatoriedad.
a. Cual es la probabilidad de observar la secuencia antes mencionada (resultante de dos corridas)
dado que los 10 tubos de 12 son buenos?
b. Cual es la probabilidad de observar dos corridas?
c. Cual es la probabilidad de que el n umero de corridas R sea R=3?
31. Suponga que la probabilidad de exposicion a la gripe durante una epidemia es 0.6. La experiencia
ha mostrado que una vacuna tiene 80 % de efectividad en proteger a una persona sobre la gripe, si
esta expuesta a la epidemia. Una persona tiene una probabilidad de 0.90 de ser afectada por la gripe al
ser expuesta. Dos personas, una vacunada y la otra no, realizan una tarea altamente especializada en
un negocio. Suponga que no se ubican en la misma localizacion, que no entra en contacto con la misma
persona, y no se expone la una a la otra. Cual es la probabilidad de que al menos una sea afectada
por la gripe?
32. Si A y B son eventos tales que A B. Demuestrese que P(A) P(B).
33. Sean A, B y C eventos mutuamente excluyentes. Entonces
P(A B C) = P(A) +P(B) +P(C)
34. Sean A y B eventos cualesquiera. Entonces
P(A B) P(A) +P(B) 1
35. Sean A, B y C eventos cualesquiera. Entonces
P(A B C) = P(A) +P(B) +P(C) P(A B) P(A C) P(B C) +P(A B C)
Universidad Popular del Cesar Humberto Barrios 53
36. Sea (, P) un espacio de probabilidad. Dada la funcion P
H
: () ', denida por
P
H
(A) =
P(A H)
P(H)
donde A y H son subconjuntos de .
Demuestrese que
a. P
H
es un funcion de probabilidad
b. P
H
() = 0
c. P
H
(A B) = P
H
(A) +P
H
(B), si A B =
d. P
H
(A
c
) = 1 P(A)
e. P
H
(A B) = P
H
(A) +P
H
(B) P
H
(A B), para A y B eventos cualesquiera.
37. Sean A
1
, A
2
, . . . , A
n
eventos denidos en el espacio muestral y A
i
A
j
= , i ,= j. Demostrar que
P(
n
_
i=1
A
i
) =
n

i=1
P(A
i
)
38. Sea A evento tal que A . Demuestrese que P(A) 1.
39. Sea A
1
, A
2
, . . . , A
n
una particion del espacio muestral y B un evento de . Entonces
P(B) =
n

i=1
P(A
i
B)
40. Sean A
1
, A
2
, . . . , A
n
eventos del espacio muestral . Entonces
P(
n
_
i=1
A
i
)
n

i=1
P(A
i
)
41. Sean A
1
, A
2
, . . . , A
n
eventos del espacio muestral . Entonces
P(
n
_
i=1
A
i
) =
n

i=1
P(A
i
)
n

i<j
P(A
i
A
j
)
+
n

i<j<k
P(A
i
A
j
A
k
) . . . + (1)
n+1
P(A
1
A
2
. . . A
n
42. Sean A y B eventos cualesquiera del espacio muestral , tales que P(A) = 0.2, P(B) = 0.3 y P(AB) =
0.4. Calcular:
a. P(A B)
b. P(A
c
B)
c. P(A
c
B
c
)
Universidad Popular del Cesar Humberto Barrios 54
d. P(A
c
B
c
)
43. Sean A y B eventos independientes del espacio muestral tales que P(A) = 0.5. Calcular:
a. P(A B)
b. P(A
c
B)
c. P(A
c
B
c
)
d. P(A
c
B
c
)
44. Sean A y B eventos cualesquiera del espacio muestral . Demuestrese:
a. Si A B = = P(A[B) = 0
b. Si A B = P(A[B) = 1
45. Sea el espacio muestral = s[s = 1, 2, 3, . . . asociado a un experimento, se dene P(s) = c(s)
5
.
Determnese el valor de c para que P sea una funcion de probabilidad.
46. Se lanzan dos dados hasta que la suma de los dos puntos sea 7 u 8. si sale 7, gana el jugador A, y si
sale 8 gana el jugador B. Cual es la probabilidad que gane B?
47. En el control preventivo de una poblacion donde la proporcion de enfermos es, se usa el examen
radiologico para detectar posibles enfermos. Se sabe que la probabilidad de que, aplicando el examen a
un enfermo, la muestra como tal, es 0.90; y que la probabilidad de que el examen aplicado a una persona
sana la se nale como enfermo es 00.01. calcular la probabilidad de que una persona dada este realmente
enferma, si el examen radiologico lo mostro como tal. Considerese el experimento de elegir una persona
de la poblacion de manera aleatoria.
48. Supongase que tenemos tres escritorios identicos, A, B y C, cada uno con dos cajones. En A, cada
cajon contiene una moneda de oro; en B, un cajon contiene una moneda de oro y el otro una de plata,
y en C, cada cajon contiene una de plata. Se elige un escritorio al azar, se abre uno de los cajones y
encontramos una moneda de oro. Cual es la probabilidad de que el escritorio elegido sea el B?
49. Sean A y B dos eventos independientes tales que con probabilidad
1
6
ocurren simultaneamente, y
con probabilidad
1
3
ninguno ocurre. Halle P(A) y P(B). Estan determinadas en forma unica estas
probabilidades?
50. Sean A y B dos eventos independientes tales que con probabilidad
1
6
ocurren simultaneamente, y con
probabilidad
1
3
ocurre A y B no ocurre. Halle P(A) y P(B). Estan determinadas en forma unica estas
probabilidades?
51. Cual es el menor valor de n para el cual la probabilidad de obtener al menos un 6 en una serie de n
lanzamientos de un dado es mayor que
3
4
?
Universidad Popular del Cesar Humberto Barrios 55
52. Los A
1
, A
1
, . . . son independientes y P(A
i
) = p, i = 1, 2, . . . . Hallar el menor n para el cual P(
n

i=1
A
i
)
p
0
, donde p
0
es un n umero jo.
53. Sean A y B dos eventos cualesquiera. Cual de las siguientes armaciones es falsa?
a. P(A[B) +P(A
c
[B
c
) = 1
b. P(A[B) +P(A[B
c
) = 1
c. P(A[B) +P(A
c
[B) = 1
54. Sean A y B dos eventos cualesquiera tales que P(A[B) = P(B[A), P(A B) = 1 y P(A [ B) > 0.
Demostrar que P(A) > 1/2.
55. Sean A
1
, A
2
, . . . , A
n
eventos independientes en el espacio muestral si 0 < P(A
j
) < 1 para todo j.
Demostrar que tiene por lo 2
n
puntos.
56. Demuestre que si P(A[C) P(B[C) y P(A[C
c
) P(B[C
c
), entonces P(A) P(B).
Sean A y B dos eventos cualesquiera del espacio muestral . Diremos que el evento A atrae al evento
B si P(B[A) > P(B) y rechaza a B si P(B[A) < P(B).
57. Probar que A atrae a B si y solo si B atrae a A. Luego diremos que A y B son mutuamente atractivos
si A atrae B.
58. Probar que A no atrae ni rechaza a B si y solo si A y son B independientes.
59. Probar que A y B son mutuamente atractivos si y solo si P(B[A) > P(B[A
c
).
60. Probar que A atrae a B, entonces A rechaza a B
c
.
61. Probar que si A atrae B y C, y A rechaza a B C, entonces A atrae B C. Hallar un ejemplo en el
cual A atrae a B y C y rechace a B C?
62. Probar que si B
1
, B
2
, . . . , B
n
es una coleccion mutuamente disjunta y si A atrae alg un B
i
, entonces A
rechaza alg un B
j
.
63. Muestre que para A y B eventos en un espacio de probabilidad:
a. P((A B
c
) (B A
c
)) = P(A) +P(B) 2P(A B)
b. P(A B) P(A) P(A B) P(A) +P(B)
c. Si P(A) = y P(B) = entonces P(A B) 1 .

You might also like