You are on page 1of 220

Curso intermedio de

PROBABILIDAD

Luis Rincon
Departamento de Matematicas
Facultad de Ciencias UNAM
Circuito Exterior de CU
04510 Mexico DF
Febrero 2006

El presente texto corresponde a la version electronica de febrero de 2006.


Este material se encuentra en permanente actualizaci
on y correccion.
La u
ltima version disponible puede obtenerse en
http://www.matematicas.unam.mx/lars

Prefacio
El presente texto est
a dirigido a estudiantes de mitad de carrera de las licenciaturas
de matem
aticas, actuara y areas afines. Contiene el material b
asico para un curso
intermedio de probabilidad y tiene como origen las notas de clase del curso semestral
de Probabilidad II impartido por el autor en la Facultad de Ciencias de la UNAM
a lo largo de varios semestres.
El texto contiene una gran cantidad de ejercicios la mayora de los cuales son de tipo
mec
anico, algunos de ellos son muy sencillos y en otros se pide reproducir lo realizado
antes, de modo que el termino ejercicios me parece justo y adecuado. La intencion
es la de crear confianza y soltura por parte del alumno en el manejo de los conceptos
y notaci
on involucrados. El n
umero de ejercicios excede lo que normalmente puede
realizarse en un semestre y el objetivo que siempre tuve en mente estos a
nos fue
el tener un n
umero suficiente de ellos para presentar algunos en clase, dejar otros
para trabajo en casa y asignar algunos otros para preguntas de examen, usando
material ligeramente distinto cada semestre para evitar repeticiones. Los ejercicios
se encuentran regularmente al final de cada secci
on y se han numerado de manera
consecutiva a lo largo del curso.
Al final del texto aparece una lista de referencias que me permito sugerir al lector
consultar para profundizar y a veces precisar en algunos temas. Algunos de estos
textos no han sido referenciados explcitamente pero aparecen en la lista por que en
alg
un momento he obtenido inspiraci
on de ellos.
Agradezco sinceramente a todas aquellas personas, alumnos y profesores, quienes
a traves de sus comentarios y sugerencias han contribuido al mejoramiento de este texto. Cualquier correcci
on o comentario acerca de este trabajo ser
a muy bien
recibido en el correo electr
onico que aparece abajo.
Luis Rinc
on
Febrero 2006
Ciudad Universitaria UNAM
lars@fciencias.unam.mx

Contenido
1. Espacios de probabilidad
1.1. Espacios de probabilidad .
1.2. -
algebras . . . . . . . . .
1.3. Medidas de probabilidad .
1.4. Independencia de eventos
1.5. Lema de Borel-Cantelli . .
1.6. Ejercicios . . . . . . . . .

.
.
.
.
.
.

.
.
.
.
.
.

2. Variables aleatorias
2.1. Variables aleatorias . . . . . .
2.2. Funci
on de distribuci
on . . .
2.3. Tipos de variables aleatorias .
2.4. Integral de Riemann-Stieltjes
2.5. Caractersticas numericas . .
2.6. Distribuciones discretas . . .
2.7. Distribuciones continuas . . .
2.8. Distribuci
on normal . . . . .
2.9. Ejercicios . . . . . . . . . . .

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

4
4
5
16
25
26
27

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

39
39
46
49
52
54
58
63
66
68

3. Vectores aleatorios
3.1. Vectores aleatorios . . . . . . . . . . . . . . . . .
3.2. Distribuci
on conjunta . . . . . . . . . . . . . . .
3.3. Densidad conjunta . . . . . . . . . . . . . . . . .
3.4. Distribuci
on marginal . . . . . . . . . . . . . . .
3.5. Distribuci
on condicional . . . . . . . . . . . . . .
3.6. Independencia de variables aleatorias . . . . . . .
3.7. Esperanza de una funci
on de un vector aleatorio
3.8. Covarianza . . . . . . . . . . . . . . . . . . . . .
3.9. Coeficiente de correlaci
on . . . . . . . . . . . . .
3.10. Esperanza y varianza de un vector aleatorio . . .
3.11. Distribuciones multivariadas discretas . . . . . .
3.12. Distribuciones multivariadas continuas . . . . . .
3.13. Ejercicios . . . . . . . . . . . . . . . . . . . . . .

.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.

87
87
88
92
94
95
96
97
99
100
103
104
106
106

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

4. Esperanza condicional
122
4.1. Esperanza condicional . . . . . . . . . . . . . . . . . . . . . . . . . . 122
4.2. Varianza condicional . . . . . . . . . . . . . . . . . . . . . . . . . . . 124

4.3. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 125


5. Transformaciones
127
5.1. Transformaci
on de una variable aleatoria . . . . . . . . . . . . . . . . 127
5.2. Transformaci
on de un vector aleatorio . . . . . . . . . . . . . . . . . 129
5.3. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 138
6. Distribuciones muestrales y
6.1. Distribuciones muestrales
6.2. Estadsticas de orden . . .
6.3. Ejercicios . . . . . . . . .

estadsticas
. . . . . . . .
. . . . . . . .
. . . . . . . .

de
. .
. .
. .

orden
144
. . . . . . . . . . . . . . 145
. . . . . . . . . . . . . . 152
. . . . . . . . . . . . . . 158

7. Convergencia
7.1. Convergencia puntual . . . . . . . . . . . . . . . .
7.2. Convergencia casi segura . . . . . . . . . . . . . . .
7.3. Convergencia en probabilidad . . . . . . . . . . . .
7.4. Convergencia en media . . . . . . . . . . . . . . . .
7.5. Convergencia en media cuadr
atica . . . . . . . . .
7.6. Convergencia en distribuci
on . . . . . . . . . . . .
7.7. Relaciones generales entre los tipos de convergencia
7.8. Dos resultados importantes de convergencia . . . .
7.9. Ejercicios . . . . . . . . . . . . . . . . . . . . . . .

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

164
164
165
166
167
167
168
169
173
174

8. Funciones generadoras
8.1. Funci
on generadora de probabilidad
8.2. Funci
on generadora de momentos . .
8.3. Funci
on caracterstica . . . . . . . .
8.4. Ejercicios . . . . . . . . . . . . . . .

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

177
177
180
182
186

9. Teoremas lmite
9.1. Desigualdad de Markov . .
9.2. Desigualdad de Chebyshev .
9.3. Ley de los grandes n
umeros
9.4. Teorema central del lmite .
9.5. Ejercicios . . . . . . . . . .

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

194
194
195
196
199
201

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

A. Distribuciones de probabilidad

204

B. Formulario
B.1. El alfabeto griego . . . . . . . . . . . . . .
B.2. Imagen inversa . . . . . . . . . . . . . . .
B.3. Funci
on indicadora . . . . . . . . . . . . .
B.4. Resumen de algunos conceptos y f
ormulas
B.5. Tabla de la distribuci
on normal est
andar .

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

210
210
210
211
211
215

Captulo 1

Espacios de probabilidad
La teora de la probabilidad es la parte de las matem
aticas que se encarga del estudio
de los fen
omenos o experimentos aleatorios. Se entiende por experimento aleatorio
todo aquel experimento tal que cuando se le repite bajo las mismas condiciones
iniciales, el resultado que se obtiene no siempre es el mismo. A menudo y por muy
diversas razones es necesario aceptar que no es posible predecir el resultado de un
experimento particular y en consecuencia se considera aleatorio. Bajo estas circunstancias, la teora de la probabilidad tiene el objetivo de modelar matem
aticamente
cualquier experimento aleatorio de interes.

1.1.

Espacios de probabilidad

El modelo matem
atico creado durante el primer tercio del siglo XX para estudiar
los experimentos aleatorios es el as llamado espacio de probabilidad. Este modelo
consiste de una terna ordenada, denotada usualmente por (, F, P ), en donde es
un conjunto arbitrario, F es una -
algebra de subconjuntos de , y P es una medida
de probabilidad definida sobre F. Explicamos a continuaci
on brevemente cada uno
de estos elementos.
Espacio muestral. El conjunto es llamado espacio muestral o espacio muestra y
tiene como objetivo agrupar a todos los posibles resultados del experimento aleatorio en cuesti
on. No es imprescindible darle esta interpretaci
on al conjunto y
matem
aticamente se le considera entonces un conjunto arbitrario.
-
algebras. Una clase o colecci
on no vaca F de subconjuntos de es una -
algebra si
es cerrada bajo las operaciones de tomar complementos y uniones numerables. A los
elementos de una -
algebra se les llama eventos o conjuntos medibles. En particular,
un evento es simple si consta de a lo m
as un elemento de y es compuesto cuando
consta de dos o m
as elementos de .
Medidas de probabilidad. Una funci
on P definida sobre una -
algebra F y con valores
en el intervalo [0, 1] es una medida de probabilidad si P () = 1 y es -aditiva, es

decir,
P(

An ) =

n=1

P (An )

n=1

umero P (A) representa una forma


cuando A1 , A2 , . . . F son ajenos dos a dos. El n
de medir la posibilidad de observar la ocurrencia del evento A al efectuar una vez el
experimento aleatorio. Tenemos entonces formalmente la siguiente definici
on.

Definici
on 1 Un espacio de probabilidad es una terna (, F, P ) en donde es un
conjunto arbitrario, F es una -
algebra de subconjuntos de , y P es una medida
de probabilidad definida sobre F.

En este primer captulo se estudian con m


as detalle los conceptos de -
algebra y
medida de probabilidad.

1.2.

-
algebras

En esta secci
on se estudia el concepto de -
algebra y se define la mnima -
algebra
generada por una colecci
on arbitraria. Recordemos nuevamente la definici
on de esta
estructura.

Definici
on 2 (-
algebra) Una colecci
on F de subconjuntos de es una -
algebra si cumple las siguientes condiciones.
1. F.
2. Si A F entonces Ac F.
3. Si A1 , A2 , . . . F entonces

n=1

An F.

A la pareja (, F) se le llama espacio medible y a los elementos de F se les llama


eventos o conjuntos medibles.

En palabras, una -
algebra es una colecci
on de subconjuntos de que es no vaca
y cerrada bajo las operaciones de tomar complemento y efectuar uniones infinitas
numerables. En probabilidad elemental el conjunto denota el espacio muestral o
conjunto de posibles resultados de un experimento aleatorio, y los elementos de F
5

representan eventosde interes en el experimento aleatorio. Una -


algebra es entonces una estructura que nos permite agrupar ciertos subconjuntos de de interes,
aquellos a los cuales se desea calcular su probabilidad, y esta estructura constituye el dominio de definici
on de una medida de probabilidad. A menudo no pueden
definirse medidas de probabilidad sobre colecciones de subconjuntos m
as grandes o

naturales como podra ser 2 , la teora de la medida garantiza que por lo menos
el concepto de medida de probabilidad, con los axiomas mencionados antes, puede
obtenerse sobre -
algebras, y por ello es que las estudiamos. En general existen varias -
algebras que pueden asociarse a un conjunto cualquiera no vaco como se
muestra a continuaci
on.

Ejemplo. Sea un conjunto cualquiera no vaco. Las siguientes colecciones son


-
algebras de subconjuntos de .
1. F1 = {, }.
2. F2 = {, A, Ac , }, en donde A .
3. F3 = 2 , conjunto potencia.

Es f
acil ver que las tres condiciones de la definici
on de -
algebra se cumplen para
cada caso en el ejemplo anterior. La -
algebra del inciso (1) es la -
algebra m
as
peque
na que podemos asociar a un conjunto cualquiera , y la -
algebra del inciso
(3) es la m
as grande. En la siguiente puede observarse gr
aficamente una -
algebra
como una colecci
on de subconjuntos de .

E
D

Una -
algebra es una coleccion F = {A, B, C, D, E, . . .} de subconjuntos
de que es no vaca y cerrada bajo complementos y uniones numerables.

Ejemplo. Sean A y B subconjuntos de tales que A B. La coleccion


F = {, A, B, Ac , B c , B A, (B A)c , }
6

es una -
algebra de subconjuntos de que contiene explcitamente a los conjuntos
A y B. Esto puede verificarse directamente con la ayuda de un diagrama de Venn.

En la secci
on de ejercicios se pueden encontrar algunos otros ejemplos de -
algebras.
El uso de la letra F para denotar una -
algebra proviene del nombre en ingles
field que significa campo. A menudo se usa tambien el termino -campo en
lugar de -
algebra. Observe con cuidado el uso y significado de los smbolos de
contenci
on y pertenencia: A y A F. Demostraremos a continuaci
on algunas
otras propiedades que satisface cualquier -
algebra.

Proposici
on 1 Sea F una -
algebra de subconjuntos de . Entonces
1. F.
2. Si A1 , A2 , . . . F entonces

n=1

An F.

3. Si A, B F entonces A B F.
4. Si A, B F entonces AB F.

Demostraci
on. (1) Como F y F es una colecci
on cerrada bajo complementos
c = F. (2) Si A , A , . . . F entonces Ac , Ac , . . . F. Por lo tanto
entonces

1
2
1
2
S
c
n=1 An F. Tomando complementos y usando las leyes de De Morgan se obtiene
el resultado. Las proposiciones (3) y (4) se siguen de lo demostrado antes y de las
definiciones A B = A B c y AB = (A B) (B A).

La proposici
on anterior establece entonces que las -
algebras son estructuras tambien cerradas bajo las operaciones de diferencia e intersecciones numerables. En la
secci
on de ejercicios pueden encontrarse algunas otras definiciones de -
algebra equivalentes a la que hemos enunciado y que involucran las operaciones de la proposicion
anterior. Una operaci
on de particular importancia es aquella en la que se intersectan
dos -
algebras produciendo una nueva -
algebra. Este es el contenido del siguiente
resultado.

Proposici
on 2 La intersecci
on de dos -
algebras es una -
algebra.

Demostraci
on. Sean F1 y F2 dos -
algebras de subconjuntos de . Entonces F1 F2
7

es aquella colecci
on de subconjuntos de cuyos elementos pertenecen tanto a F1
como a F2 . Demostraremos que F1 F2 es una -
algebra. (1) Como F1 y F2 son algebras entonces F1 y F2 . Por lo tanto F1 F2 . (2) Sea A un elemento
en F1 F2 . Entonces A F1 y A F2 . Por lo tanto Ac F1 y Ac F2 , es decir,
Ac F1 F2 . (3) Sea A1 , A2 , . . . una sucesi
on de
elementos en FS
1 F2 . Entonces
S
A1 , A2S
, . . . F1 y A1 , A2 , . . . F2 . Por lo tanto n=1 An F1 y
n=1 An F2 , es
decir,
A

F
.

1
2
n=1 n
Hemos entonces comprobado que si F1 y F2 son dos -
algebras de un mismo conjunto
algebra de subconjuntos de , naturalmente
entonces F1 F2 es nuevamente una -
m
as peque
na que F1 y F2 en el sentido F1 F2 F1 , F2 . La siguiente pregunta
consiste en verificar si la uni
on de dos -
algebras produce nuevamente una -
algebra.
En este caso la respuesta es negativa. En general no es cierto que la uni
on de dos
-
algebras produce una nueva -
algebra. Veanse por ejemplo los Ejercicios 14 y 15
a este respecto. Por otro lado se puede extender la validez de la proposici
on recien
demostrada a intersecciones m
as generales como indica el siguiente resultado.
Proposici
on 3 La intersecci
on finita, infinita numerable o bien arbitraria de a
lgebras es nuevamente una -
algebra.
Demostraci
on. Sea T un conjunto arbitrario. Suponga
T que para cada t en T se tiene
una -
algebra Ft de subconjuntos de . Sea F = tT Ft . Siguiendo los mismos
pasos que en la demostraci
on anterior es f
acil probar que F es una -
algebra. Observe que como T es un conjunto arbitrario, la -
algebra F es efectivamente una
intersecci
on arbitraria de -
algebras.

El resultado anterior garantiza que la siguiente definici
on tiene sentido.

Definici
on 3 (-
algebra generada) Sea C una colecci
on no vaca de subconjuntos de . La -
algebra generada por C, denotada por (C), es la colecci
on
\
(C) = {F : F es -
algebra y C F}.

Es decir, la colecci
on (C) es la intersecci
on de todas aquellas -
algebras que contienen a C. Por la proposici
on anterior sabemos que (C) es una -
algebra. A (C)
tambien se le llama mnima -
algebra generada por C y el adjetivo mnima es
claro a partir del hecho de que es la -
algebra m
as peque
na que contiene a la colecci
on C. Es decir, si F es una -
algebra que contiene a C entonces forzosamente
(C) F. Observe que C (C) pues a la colecci
on C se le han a
nadido posiblemente algunos otros subconjuntos para convertirla en la -
algebra (C).
8

Ejemplo. Sean A, B con AB = . Defina la coleccion C = {A, B}. En general

esta colecci
on no es una -
algebra pero podemos a
nadirle algunos subconjuntos de
para encontrar la -
algebra generada por C. Esto es
(C) = {, A, B, (A B)c , A B, Ac , B c , }.

No es difcil verificar que esta es la mnima -


algebra que contiene a la colecci
on C.
Los siguientes dos resultados son proposiciones sencillas y naturales acerca de algebras generadas. Las demostraciones son cortas pero requieren algunos momentos
de pensamiento en una primera lectura.

Proposici
on 4 Sean C1 y C2 dos colecciones de subconjuntos de tales que C1
C2 . Entonces (C1 ) (C2 ).

Demostraci
on. Claramente C1 C2 (C2 ). Entonces (C2 ) es una -
algebra que
contiene a la colecci
on C1 . Por lo tanto (C1 ) (C2 ).


Proposici
on 5 Si F es una -
algebra entonces (F) = F.

Demostraci
on. Sabemos que F (F). Como F es una -
algebra que contiene a F
entonces (F) F. Esto demuestra la igualdad.


Otras estructuras de subconjuntos


En esta secci
on se presentan los conceptos de algebra y semi-
algebra, y su relacion
con -
algebras. No estudiaremos estas estructuras con detalle pero las mencionamos
porque desempe
nan un papel importante en la construcci
on y extensi
on de medidas
de probabilidad.

Definici
on 4 (
algebra) Una colecci
on F de subconjuntos de es una a
lgebra si
cumple las siguientes condiciones.
1. F.
2. Si A F entonces Ac F.
3. Si A1 , . . . , An F entonces

n
[

k=1

Ak F.

La diferencia entre una algebra y una -


algebra estriba en que para la primera se
pide que sea una colecci
on cerrada bajo uniones finitas mientras que la segunda es
una colecci
on cerrada bajo uniones infinitas numerables. Claramente toda -
algebra
es una algebra.

Definici
on 5 (semi
algebra) Una colecci
on F de subconjuntos de es una semi
algebra si cumple las siguientes condiciones.
1. F.
2. Si A, B F entonces A B F.
3. Si A, A1 F son tales que A1 A entonces existen A2 , . . . , An F tales
que
n
[
A=
Ak .
k=1

en donde A1 , A2 , . . . , An son ajenos dos a dos.

Los conceptos de -
algebra, algebra y semi
algebra est
an relacionados como se muestra en la siguiente figura. En la secci
on de ejercicios se pide demostrar las implicaciones y no implicaciones que se obtienen de este diagrama.

10

-
algebras

algebras
semialgebras

Relaci
on general entre -
algebras, algebras y semialgebras.

En la siguiente secci
on se estudia un ejemplo importante de una -
algebra de subconjuntos de los n
umeros reales: la -
algebra de Borel.

Conjuntos de Borel
Considere la colecci
on de todos los intervalos abiertos (a, b) de R en donde a b. A
la mnima -
algebra generada por esta colecci
on se le llama -
algebra de Borel de
R y se le denota por B(R).

B(R) = {(a, b) R : a b}.

Definici
on 6 (-
algebra de Borel)

A los elementos de B(R) se les llama conjuntos de Borel , Borelianos o conjuntos


Borel medibles. De esta forma se puede asociar la -
algebra B(R) al conjunto de
n
umeros reales y obtener as el espacio medible (R, B(R)). Se muestran a continuaci
on algunos elementos explcitos de la -
algebra B(R).
Proposici
on 6 Para cualesquiera n
umeros reales a b, los subconjuntos
[a, b], (a, ), (, b), [a, b), (a, b], {a}
son todos elementos de B(R).
Demostraci
on. Primeramente observe que los intervalos cerrados [a, b] son conjuntos
Borelianos pues podemos escribirlos en terminos de una intersecci
on numerable de
intervalos abiertos de la siguiente forma

11

[a, b] =

1
1
, b + ).
n
n

(a

n=1

Observe que cada elemento de la intersecci


on anterior es un conjunto Boreliano.
Siendo B(R) una -
algebra, la intersecci
on infinita es un elemento de B(R). De esta
forma se concluye que cada intervalo cerrado [a, b] es un elemento de B(R). Asi
mismo tenemos que

(a, ) =
y

(a, a + n) B(R),

n=1

(b n, b) B(R).

(, b) =

n=1

Por lo tanto

[a, ) =
y

(a

n=1

(, b] =

1
, ) B(R),
n

(, b +

n=1

1
) B(R).
n

De forma an
aloga se puede hacer ver que los intervalos semiabiertos de la forma
[a, b) y (a, b] son conjuntos Borelianos. Los conjuntos que constan de un solo n
umero
tambien son conjuntos Borelianos pues
{a} =

(a

n=1

1
1
, a + ).
n
n


Complementos, intersecciones y uniones numerables de estos conjuntos son todos


ellos Borelianos. Observe que la -
algebra B(R) es muy amplia y es natural preguntarse acerca de la existencia de alg
un subconjunto de R que no sea un conjunto
Boreliano. La respuesta es afirmativa aunque no la demostraremos. Efectivamente,
existe un subconjunto de R que no pertenece a B(R).
Adem
as de la definici
on enunciada, existen otras formas equivalentes de generar a
los conjuntos Borelianos. Este es el contenido del siguiente resultado.
Proposici
on 7 Las siguientes -
algebras son todas identicas a B(R).
a) {[a, b] : a b}.
b) {(a, b] : a b}.
12

c) {[a, b) : a b}.
d) {(a, ) : a R}.
e) {(, b) : b R}.
Demostraci
on. Se prueba u
nicamente el primer inciso. El resto de ellos se demuestra
usando el mismo procedimiento. Para demostrar que B(R) = {[a, b] : a b} se
verifican ambas contenciones. Claramente [a, b] B(R), por lo tanto {[a, b] : a
b} B(R). Entonces
{[a, b] : a b} B(R).
Ahora se demuestra
la contenci
on contraria. Sabemos que (a, b) {[a, b] : a b}
S
1
1
pues (a, b) =
[a
+
,
b

].
n=1
n
n Entonces
{(a, b) : a b} {[a, b] : a b}.

Por lo tanto B(R) = {[a, b] : a b}.

De manera equivalente se puede definir a B(R) como la mnima -


algebra generada
por una colecci
on m
as grande, aquella de todos los subconjuntos abiertos de R.
En ambos casos la -
algebra generada es B(R). Es interesante mencionar que B(R)
no contiene a todos los subconjuntos de R, es decir, puede demostrarse que existe
un subconjunto de R que no pertenece a la colecci
on B(R). Es posible considerar
tambien la -
algebra de conjuntos de Borel restringidos a una porci
on de los n
umeros
reales como se indica a continuaci
on.
Definici
on 7 Sea A B(R). La -
algebra de Borel de A, denotada por B(A) o
A B(R), se define como sigue
B(A) = {A B : B B(R)}.
No es difcil comprobar que B(A) es efectivamente una -
algebra de subconjuntos
de A. Observe que el nuevo conjunto total es A y no R. El concepto de -
algebra
de Borel de R puede extenderse a dimensiones mayores de la siguiente forma. Por
ejemplo, considere la colecci
on C de todas los rect
angulos abiertos de R2 , es decir,
C = {(a, b) (c, d) : a b, c d}.
Se definen los conjuntos de Borel de R2 como los elementos de la mnima -
algebra
generada por la colecci
on C, es decir, B(R2 ) = (C). De manera equivalente se puede
definir B(R2 ) = (B(R)B(R)). En forma an
aloga se define B(Rn ) usando productos
cartesianos de intervalos, o equivalentemente
B(Rn ) = (B(R) B(R)).

13

Sucesiones de eventos
En esta secci
on se estudia el concepto de convergencia de una sucesi
on infinita de
eventos. Para enunciar tal concepto necesitaremos antes la definiciones de lmite
superior y lmite inferior que se establecen a continuaci
on.

Definici
on 8 (Lmite superior e inferior) Para una sucesi
on de eventos {An :
n N} se define el lmite superior y el lmite inferior como sigue
1. lm sup An =
n

2. lm inf An =
n

Ak .

n=1 k=n
\

Ak .

n=1 k=n

Tanto el lmite superior como el lmite inferior son operaciones bien definidas, es
decir, el resultado siempre existe y es u
nico. En cada caso el conjunto resultante es
siempre un evento, es decir, un conjunto medible. Es sencillo comprobar que
lm inf An lm sup An .
n

Tampoco es difcil verificar que un elemento pertenece al evento lm sup An si y solo


n

si pertenece a una infinidad1 de elementos de la sucesi


on. Por otro lado un elemento
pertenece al evento lm inf An si y solo si pertenece a todos los elementos de la
n
sucesi
on excepto un n
umero finito de ellos. Con estos antecedentes podemos ahora
establecer la definici
on de convergencia de una sucesi
on infinita de eventos.

Definici
on 9 (Convergencia de eventos) Sea {An : n N} una sucesi
on de
eventos. Si existe un evento A tal que
lm inf An = lm sup An = A
n

entonces se dice que la sucesi


on converge al evento A y se escribe
lm An = A.

En textos de habla inglesa a menudo se escribe lm sup An = (An i.o.), en donde i.o. significa
n

infinitely often.

14

Para calcular el posible lmite de una sucesi


on de eventos debemos entonces calcular
el lmite superior y el lmite inferior y cuando el resultado de ambas operaciones
coincida en el mismo evento entonces a tal resultado com
un se le llama el lmite de
la sucesi
on. Por supuesto que no todas las sucesiones de eventos convergen. Mostramos a continuaci
on que en particular toda sucesi
on mon
otona es convergente. M
as
adelante presentaremos algunos ejemplos concretos de sucesiones de eventos y en la
secci
on de ejercicios se encuentran algunos otros.

Proposici
on 8 Sea {An : n N} una sucesi
on mon
otona de eventos.
1. Si A1 A2 entonces lm An =
n

2. Si A1 A2 entonces lm An =
n

An .

An .

n=1

n=1

Demostraci
on. (1) Como la sucesi
on es creciente,

Ak =

k=n

lm sup An =
n

Por otro lado,

Ak =

n=1 k=n

Ak . Por lo tanto

k=1

Ak =

n=1 k=1

Ak .

k=1

Ak = An . Entonces

k=n

lm inf An =
n

Ak =

n=1 k=n

An .

n=1

(2) La demostraci
on es completamente an
aloga al inciso anterior. En este caso como
la sucesi
on es decreciente se tiene que

Ak =

k=n

Ak

k=1

Ak = An .

k=n

Ejemplo. Para cada numero natural n defina An = [1/n, 0] si n es impar y


An = [0, 1/n] si n es par. Entonces lm An = {0} pues
n

lm sup An =
n

lm inf An =
n

Ak =

n=1 k=n
\

Ak =

n=1 k=n

15

[1/n, 1/n] = {0}.

n=1

{0} = {0}.

n=1


El siguiente resultado establece que a partir de una sucesi
on de eventos puede construirse otra sucesi
on cuyos elementos son ajenos dos a dos y cuya uni
on es la uni
on de
la sucesi
on original. Este procedimiento de separaci
on ser
a de utilidad m
as adelante.
Proposici
on 9 Sea {An : n N} una sucesi
on de eventos. Sea B1 = A1 y para
n 2 defina
n1
[
Ak .
Bn = An
k=1

Entonces {Bn : n N} es una sucesi


on de eventos con las siguientes propiedades.
1. Bn An .
2. Bn Bm = si n 6= m.
3.

n=1

Bn =

An .

n=1

Demostraci
on. El inciso (1) es evidente a partir de la definici
on de Bn . Para demostrar (2) suponga n < m, entonces
Bn Bm = (An
= (An
= .

n1
[

k=1
n1
\
k=1

Ak ) (Am
Ack ) (Am

m1
[

k=1
m1
\

Ak )

Ack )

k=1

Ahora se demuestra (3) considerando cada contenci


on por separado. Como cada Bn
est
a contenido en An entonces el lado izquierdo de (3) es efectivamente
un subconS
junto del lado derecho. Por el contrario, sea x un elemento en
A
n=1 n . Entonces
existe un ndice n tal que x An . Sea n0 S
el primer ndice tal que x An0 y x
/ An
n0 1
para
1

1.
Entonces
x

A
=
B
.
Por
lo
tanto
x
pertenece
0
n
n
n
0
0
n=1
S
a

n=1 Bn .

1.3.

Medidas de probabilidad

En esta secci
on y en lo que resta del presente captulo se estudian algunas propiedades de las medidas de probabilidad. Empezaremos por recordar nuevamente la
definici
on de este concepto.

16

Definici
on 10 (Medida de probabilidad) Sea (, F) un espacio medible. Una
medida de probabilidad es una funci
on P : F [0, 1] que satisface
1. P () = 1.
2. P (A) 0, para cualquier A F.
3. Si A1 , A2 , . . . F son ajenos dos a dos, esto es, An Am = para n 6= m,

[
X
entonces P (
An ) =
P (An ).
n=1

n=1

Andrey Nikolaevich Kolmogorov (Rusia 19031987).


Fuente: Archivo MacTutor, Universidad de St. Andrews.

Entonces toda funci


on P definida sobre una -
algebra F, con valores en el intervalo
[0, 1] y que cumple los tres postulados anteriores se le llama medida de probabilidad.
Estos axiomas fueron establecidos por Kolmogorov en 1933. En particular, la tercera
propiedad se conoce con el nombre de -aditividad. Se presentan a continuaci
on tres
ejemplos de medidas de probabilidad.

Ejemplo. Considere un experimento aleatorio con espacio muestral un conjunto


finito . Asocie al conjunto la -
algebra el conjunto potencia 2 . Para cualquier
A defina
#A
P (A) =
.
#
Entonces P es una medida de probabilidad y es llamada probabilidad cl
asica. De
acuerdo a esta definici
on, para calcular la probabilidad de un evento es necesario
entonces conocer su cardinalidad. De esta forma de calcular probabilidades surgen
muchos y muy variados problemas de conteo, algunos de los cuales pueden ser muy
complicados de resolver.

Ejemplo. Considere un experimento aleatorio con espacio muestral el conjunto de


n
umeros naturales N. Asocie al conjunto N la -
algebra el conjunto potencia 2N .
Para cualquier A N defina
X 1
P (A) =
.
2n
nA

17

No es difcil verificar que P es efectivamente una medida de probabilidad.

Ejemplo. Considere el espacio medible (R, B(R)). Sea f : R R una funcion no


negativa e integrable cuya integral sobre el intervalo (, ) es uno. Para cualquier
A en B(R) defina
Z
P (A) =

f (x) dx.

Las propiedades de la integral permiten demostrar que P es una medida de probabilidad.

En la siguiente secci
on estudiaremos algunas propiedades generales que cumple toda
medida de probabilidad. Y a lo largo del texto estudiaremos varios modelos particulares para calcular probabilidades.

Propiedades elementales
A partir de los postulados enunciados en la secci
on anterior es posible demostrar una
larga serie de propiedades que cumplen todas las medidas de probabilidad. En esta
secci
on se estudian algunas propiedades elementales y m
as adelante se demuestran
otras propiedades m
as avanzadas.

Proposici
on 10 Sea P una medida de probabilidad. Entonces
1. P (Ac ) = 1 P (A).
2. P () = 0.
3. Si A B entonces P (B A) = P (B) P (A).
4. Si A B entonces P (A) P (B).
5. 0 P (A) 1.
6. P (A B) = P (A) + P (B) P (A B).

Demostraci
on. Para la propiedad (1) expresamos a como la uni
on disjunta A Ac .
Aplicamos P y obtenemos la igualdad requerida. Tomando el caso particular A
igual a en la propiedad (1) obtenemos la propiedad (2). Para demostrar (3) escribimos B = A (B A). Aplicando P obtenemos P (B) P (A) = P (B A).
Como la probabilidad de cualquier evento es un n
umero no negativo de la anterior igualdad obtenemos tambien la propiedad (4). La primera desigualdad de la
propiedad (5) es el segundo axioma y la segunda desigualdad es consecuencia de
18

la propiedad (1) y el primer axioma. Finalmente para demostrar (6) descomponemos el evento A B como la siguiente uni
on de tres eventos disjuntos dos a dos,
A B = (A B) (A B) (B A) = (A A B) (A B) (B A B). Por
lo tanto P (A B) = P (A) P (A B) + P (A B) + P (B) P (A B).

Se estudian a continuaci
on algunas otras propiedades de las medidas de probabilidad.

Proposici
on 11 (Desigualdades de Boole) Sea {An : n N} una sucesi
on de
eventos. Entonces
1. P (

An )

An ) 1

n=1

2. P (

n=1

P (An ).

n=1

P (Acn ).

n=1

Demostraci
on. Para la primera desigualdad tome B1 = A1 y para n 2 defina
Bn = An

n1
[

Ak .

k=1

Entonces {BS
es una sucesi
on de eventos disjuntos dos a dos tales que
n : n N} S

Bn An y n=1 An = n=1 Bn . Esto es consecuencia de la Proposici


on 9 de la
p
agina 16. Por lo tanto
P(

An ) = P (

n=1

Bn )

n=1

n=1

P (Bn )
P (An ).

n=1

La segunda desigualdad se sigue de la primera tomando complementos.

Proposici
on 12 Sea {An : n N} una sucesi
on de eventos.
T
1. Si P (An ) = 1 para toda n entonces P (
n=1 An ) = 1.
S
2. Si P (An ) = 1 para alguna n entonces P (
n=1 An ) = 1.
T
3. Si P (An ) = 0 para alguna n entonces P ( n=1 An ) = 0.
19

S
4. Si P (An ) = 0 para toda n entonces P (
n=1 An ) = 0.

Demostraci
on. (1) Por las leyes de De Morgan y la desigualdad de Boole,
P(

n=1

An ) = 1 P (

Acn )

n=1

P (Acn )

n=1

= 1.

[
S
(2) Como An
A
,
1
=
P
(A
)

P
(
An ).
n
n=1 n
(3) Como

n=1 An

An , P (

n=1

n=1

An ) P (An ) = 0.

(4) Por la desigualdad de Boole, P (

n=1

An )

P (An ) = 0.

n=1

Las propiedades (1) y (4) de la proposici


on anterior pueden interpretarse de la
siguiente forma. Intersectar dos eventos produce en general un evento m
as peque
no
o por lo menos no mayor a los intersectandos. Sin embargo la propiedad (1) establece
que la intersecci
on, a
un infinita, de eventos con probabilidad uno produce un evento
con probabilidad todava uno. An
alogamente, unir dos eventos produce en general
un evento mayor, pero por la propiedad (4), la uni
on, a
un infinita, de eventos con
probabilidad cero tiene probabilidad que se mantiene en cero.

Continuidad
En esta secci
on se demuestra que las medidas de probabilidad son funciones continuas. Primero se prueba este resultado para dos tipos de sucesiones particulares,
aquellas que son mon
otonas crecientes o decrecientes, y despues se prueba en general.
Empezaremos con el caso de sucesiones crecientes.

Proposici
on 13 Sea {An : n N} una sucesi
on no decreciente de eventos, esto
es, A1 A2 . Entonces
P(

An ) = lm P (An ).
n

n=1

Demostraci
on. Como An An+1 tenemos que P (An ) P (An+1 ). Por lo tanto la
sucesi
on numerica {P (An ) : n N} es no decreciente y acotada superiormente por
20

uno. Entonces el lmite de esta sucesi


on existe y el lado derecho de la igualdad tiene
sentido. Defina los eventos
B1 = A1 ,
Bn = An An1 para n 2.
on de eventos disjuntos dos a dos, y por la
La sucesi
on {Bn : n N} es una colecci
Proposici
on 9 de la p
agina 16 es tal que

An =

n=1

Bn .

n=1

Por lo tanto
P(

An ) = P (

n=1

Bn )

n=1

P (Bn )

n=1

= P (B1 ) +
= P (A1 ) +
= P (A1 ) +

n=2

n=2

X
n=2

P (Bn )
P (An An1 )
P (An ) P (An1 )

= P (A1 ) + lm

m
X

n=2

P (An ) P (An1 )

= P (A1 ) + lm P (Am ) P (A1 )


m

lm P (Am ).


Las medidas de probabilidad tambien son continuas respecto de sucesiones no crecientes de eventos. Esta afirmaci
on es el contenido del siguiente resultado que se
demuestra a partir de la proposici
on anterior.

Proposici
on 14 Sea {An : n N} una sucesi
on no creciente de eventos, esto es,
A1 A2 . Entonces
P(

An ) = lm P (An ).
n

n=1

21

Demostraci
on. Observe que si An An+1 entonces Acn Acn+1 . Por la proposicion
anterior,

[
P(
Acn ) = lm P (Acn ).
n=1

Aplicando las leyes de De Morgan,


1 P(

n=1

An ) = lm (1 P (An )),
n

de donde se sigue inmediatamente el resultado.

Ejemplo. (El problema del mono) Un mono escribe caracteres al azar en una
m
aquina de escribir. Cu
al es la probabilidad de que eventualmente el mono obtenga
exactamente, y sin ning
un error, las obras completas de Shakespeare?

Mono escribiendo al azar

Demostramos a continuaci
on que la probabilidad de este raro evento es uno. Imagine
entonces que un mono escribe caracteres al azar en una m
aquina de escribir, y que
lo hace de manera continua generando una sucesi
on lineal de caracteres. Sea m el
total de caracteres disponibles y sea N el total de caracteres de los que constan
las obras completas de Shakespeare. Segmentamos el arreglo lineal de caracteres
generados por el mono en bloques disjuntos de N caracteres, uno despues de otro,
y observamos si alg
un bloque contiene las obras de Shakespeare. Por ejemplo,
Xku
aT s} hwW pzq Ot
|
{z
|
{z
}
N

Para cada n
umero natural k defina el evento Ak correspondiente a que el k-esimo
bloque contiene exactamente y sin error alguno las obras completas de Shakespeare.
Observe que los eventos Ak son independientes pues los bloques no se sobreponen,
adem
as P (Ak ) = (1/m)N = p. Defina Bk = Ac1 Ack , que indica el evento de
que el mono no obtenga exito en los primeros k bloques. Observe que Bk+1 Bk ,
es decir la sucesi
on es decreciente, por lo tanto
lm Bk =

k=1

22

Bk ,

en donde el evento
k=1 Bk se interpreta como aquel en el que el mono nunca tiene
exito. Entonces
P(

k=1

Bk ) = lm P (Bk ) = lm (1 p)k = 0.
k

Por lo tanto la probabilidad de que eventualmente el mono obtenga exito es uno.


Ahora se enuncia un resultado m
as fuerte. La siguiente proposici
on establece que las
medidas de probabilidad son funciones continuas. Esta propiedad es muy u
til pues
permite el c
alculo de probabilidades en procedimientos lmite, y se encuentra siempre
presente de manera implcita en toda la teora que se desarrolla m
as adelante.

Proposici
on 15 (Continuidad de la probabilidad) Sea {An : n N} una
sucesi
on de eventos convergente al evento A. Entonces
lm P (An ) = P (A).

Demostraci
on. La prueba se basa en las siguientes dos desigualdades
a) lm sup P (An ) P (lm sup An ).
n

b) P (lm inf An ) lm inf P (An ).


n

Como la sucesi
on de eventos {An : n N} es convergente al evento A entonces
lm sup An = lm inf An = A.
n

Se sigue entonces de las desigualdades (a) y (b) que


lm sup P (An ) P (lm sup An )
n

= P (A)
= P (lm inf An )
n

lm inf P (An ).
n

De donde se concluye el resultado. Nos concentraremos


ahora en demostrar las
S
desigualdades enunciadas. (a) Como An
A
entonces
k
k=n
P (An ) P (

k=n

23

Ak ),

S
en donde {
on de eventos decreciente. Tomando el
k=n Ak : n N} es una sucesi
lmite superior se obtiene
lm sup P (An ) lm sup P (
n

lm P (

= P ( lm

= P(

Ak )

k=n

Ak )

k=n

Ak )

k=n
[

Ak )

n=1 k=n

= P (lm sup An ).
n

(b) Como

k=n Ak

An entonces
P(

k=n

Ak ) P (An ),

T
en donde {
on creciente de eventos. Tomando el lmite
k=n Ak : n N} es una sucesi
inferior se obtiene
lm inf P (An ) lm inf P (
n

= P ( lm

= P(

Ak )

k=n

lm P (

k=n

Ak )
Ak )

k=n
\

Ak )

n=1 k=n

= P (lm inf An ).
n

Ejemplo. Se lanza un dado equilibrado una infinidad de veces. Sea el evento A =


{2, 4, 6} y sea An el evento correspondiente a obtener el evento A en cada uno de los
primeros n lanzamientos del dado. Entonces claramente An An+1 para cualquier
n en N. Por lo tanto

\
lm An =
An .
n

n=1

Entonces

P(

An ) = P ( lm An )
n

n=1

24

lm P (An )

1
lm ( )n
2
= 0.
=

T
El evento
n=1 An se interpreta como aquel resultado en el que siempre se obtiene
un n
umero par en una sucesi
on infinita de lanzamientos. Hemos demostrado que la
probabilidad de tal evento es cero. Observe que el argumento presentado funciona
de la misma forma cuando el evento A es cualquier subconjunto propio de . Por
ejemplo, si A = {1, 2, 3, 4, 5} la probabilidad de nunca obtener 6 es cero.

1.4.

Independencia de eventos

En esta secci
on se define el importante concepto de independencia de eventos. Este
es un concepto central en la teora de la probabilidad y uno de sus rasgos distintivos.
De manera natural la independencia aparecer
a con frecuencia a lo largo del texto a
partir de ahora, y nos ayudar
a a simplificar el c
alculo de probabilidades. La definicion
matem
atica es la siguiente.

Definici
on 11 (Independencia) Dos eventos A y B son independientes y se
escribe A B cuando
P (A B) = P (A)P (B).

Aceptar la hip
otesis de que dos eventos son independientes es una cuesti
on de apreciaci
on por parte del observador. Puede interpretarse en el sentido de que la ocurrencia de uno de los eventos no proporciona informaci
on que modifique la probabilidad
de ocurrencia del segundo evento. Contrario a alguna primera concepci
on intuitiva
err
onea, el hecho de que dos eventos sean independientes no implica que ellos sean
ajenos. La proposici
on contraria tampoco es v
alida, dos eventos ajenos no necesariamente son independientes. La definici
on de independencia puede extenderse a
colecciones finitas e incluso infinitas de eventos del siguiente modo.

25

Definici
on 12 (Independencia) Los eventos A1 , . . . , An son independientes si
se cumplen todas y cada una de las siguientes condiciones
P (Ai Aj ) = P (Ai )P (Aj ), i, j distintos.

P (Ai Aj Ak ) = P (Ai )P (Aj )P (Ak ), i, j, k distintos.


..
.

(1.1)
(1.2)

P (A1 A2 An ) = P (A1 )P (A2 ) P (An ).


M
as generalmente, una colecci
on infinita de eventos es independiente si cualquier
subcolecci
on finita lo es.

Observe que seg


un la definici
on anterior, se necesitan verificar o suponer varias
condiciones para que n eventos sean independientes entre s. De hecho el n
umero
n
total de igualdades a demostrar es 2 n 1. La independencia dos a dos (1.1)
no implica en general la independencia tres a tres (1.2), ni viceversa. Tambien se
tiene la noci
on de independencia entre dos colecciones de eventos. La definici
on es
la siguiente.
Definici
on 13 Dos sub--
algebras F1 y F2 son independientes si para cada A en
F1 y cada B en F2 se cumple P (A B) = P (A)P (B).

1.5.

Lema de Borel-Cantelli

Concluimos este captulo con el enunciado y demostraci


on del famoso lema de BorelCantelli. El objetivo es demostrar este resultado y con ello poner en pr
actica algunas
propiedades de las medidas de probabilidad, aunque tambien lo usaremos para demostrar la ley fuerte de los grandes n
umeros en la u
ltima parte del curso.

Proposici
on 16 (Lema de Borel-Cantelli) Sea {An : n N} una sucesi
on de
eventos y defina A = lm sup An .
n

1. Si

n=1

P (An ) < entonces P (A) = 0.

2. Si A1 , A2 , . . . son independientes y

n=1

26

P (An ) = entonces P (A) = 1.

Demostraci
on. (1) Para cada n en N,
P (A) P (

k=n

Ak )

P (Ak ).

k=n

P
Como
n=1 P (An ) < , el lado derecho tiende a cero cuando n tiende a infinito.
Esto implica que P (A) = 0. (2) S
Es suficiente demostrar que para todo n
umero

natural n se cumple la igualdad P ( k=n Ak ) = 1, pues la intersecci


on numerable de
eventos con probabilidad uno tiene probabilidad uno. Para cada m > n,
1 P(

k=n

Ak ) 1 P (

m
[

Ak )

k=n

= P(

m
\

k=n
m
Y

Ack )

[1 P (Ak )]

k=n

exp(

m
X

P (Ak )).

k=n

Para obtener la u
ltima expresi
onPse usa la desigualdad 1 x ex , v
alida para
cualquier n
umero real x. Como
P
(A
)
=
,
el
lado
derecho
tiende
a cero
n
n=1
S

cuando m tiende a infinito. Por lo tanto P ( k=n Ak ) = 1 para cualquier valor de n


y entonces P (A) = 1.


Ejemplo.[El problema del mono, nuevamente] El problema de encontrar la probabilidad de que un mono que escribe caracteres al azar eventualmente escriba las
obras completas de Shakespeare puede resolverse tambien usando el lema de BorelCantelli. Considere nuevamente la divisi
on por bloques de longitud N ,
x ,...,x ,x
, . . . , x2N , . . .
| 1 {z N} | N +1 {z
}

El evento Ak se define nuevamente como aquel en el que el mono tiene exito en el


k-esimo bloque. Entonces claramente P
la sucesi
on A1 , AP
on
2 , . . . constituye una sucesi

N
de eventos independientes tales que k=1 P (Ak ) = k=1 (1/m) = . Entonces
por la segunda parte del lema de Borel-Cantelli, P (lm supk Ak ) = 1. Ahora solo
hay que recordar que el evento lm supn An corresponde a aquel en el que una
infinidad de eventos Ak ocurren. Es decir, con probabilidad uno, el mono tiene, no
una, sino una infinidad de exitos!

1.6.

Ejercicios
-
algebras

1. Defina con precisi


on y de manera completa los siguientes conceptos: -
algebra,
espacio medible, evento, evento simple y evento compuesto.
27

2. (Definici
on alternativa de -
algebra) Demuestre que F es una -
algebra de
subconjuntos de si y solo si
a) F.

b) A F Ac F.
c) A1 , A2 , . . . F

n=1

An F.

3. (Definici
on alternativa de -
algebra) Demuestre que F es una -
algebra de
subconjuntos de si y solo si
a) F.

b) A, B F A B F.

\
c) A1 , A2 , . . . F
An F.
n=1

4. Sean A1 , A2 , . . . , An eventos de un espacio muestral . Demuestre que el conjunto de elementos de que pertenecen a exactamente k de estos eventos es
un evento, 1 k n.
5. Sea F una -
algebra de subconjuntos de . Demuestre que la colecci
on
F c = {F c : F F}
es una -
algebra. Compruebe adem
as que F c = F.
6. Sea (, F, P ) un espacio de probabilidad. Defina la colecci
on
G = {F F : P (F ) = 0 o P (F ) = 1}.
Demuestre que G es una sub -
algebra de F, es decir, G es una -
algebra y
G F.
7. Sea = {a, b, c, d} y sean A = {a, b} y B = {b, c}. Defina la colecci
on C =
{A, B}. Claramente C no es una -
algebra. Encuentre (C).
8. Sea F una -
algebra de subconjuntos de y sea A un elemento de F. Demuestre que la colecci
on {A F : F F} es una -
algebra de subconjuntos
on.
de A. Se usan los smbolos FA o A F para denotar a esta colecci
9. Sea un conjunto no numerable. Demuestre que la siguiente colecci
on es una
-
algebra,
F = {A : A o Ac es finito o numerable}.
10. Sean 1 y 2 dos conjuntos arbitrarios y sea X : 1 2 una funci
on en
donde (2 , F2 ) es un espacio medible. Demuestre que la siguiente coleccion es
una -
algebra de subconjuntos de 1 ,
X 1 F2 = {X 1 F : F F2 }.

28

11. Sean F1 y F2 dos -


algebras de subconjuntos de . Demuestre que F1 F2 es
una -
algebra de subconjuntos de .
12. Es la diferencia de dos -
algebras una -
algebra?
on de -
13. Sea {Fn : n N} una sucesi
T algebras de subconjuntos de un mismo
espacio muestral . Demuestre que
algebra.
n=1 Fn es una -

algebras de subconjuntos de . Demuestre que F1 F2 no


14. Sean F1 y F2 dos -
necesariamente es una -
algebra. Sugerencia: Considere el espacio = {1, 2, 3}
y F1 = {, {1}, {2, 3}, } y F2 = {, {1, 2}, {3}, }.
15. Sean F1 y F2 dos -
algebras de subconjuntos de tales que F1 F2 . Demuestre que F1 F2 es una -
algebra.

16. Sea T un conjunto arbitrario. Suponga que para cada


T t en T se tiene una
-
algebra Ft de subconjuntos de . Demuestre que tT Ft es una -
algebra.

17. Sea F una -


algebra. Demuestre que (F) = F.

18. Es el producto cartesiano de dos -


algebras una -
algebra?
19. Sea C una colecci
on de subconjuntos de . Demuestre que ((C)) = (C).
20. Sean C1 y C2 dos colecciones de subconjuntos de tales que C1 C2 . Demuestre
que (C1 ) (C2 ).
21. Sean A, B arbitrarios. Demuestre que la cardinalidad de {A, B} es a lo
sumo 16.
22. Sean A, B arbitrarios. Encuentre explcitamente todos los elementos de
{A, B}. Por el ejercicio anterior, el total de elementos en {A, B} en el caso
m
as general es 16.
23. Sea {A1 , . . . , An } una partici
on finita de . Demuestre que la cardinalidad de
n
{A1 , . . . , An } es 2 .
24. Sea {A, B, C} una partici
on de . Encuentre explcitamente los ocho elementos
de {A, B, C}.
25. Sea C una colecci
on de subconjuntos de . Diga falso o verdadero justificando
en cada caso: C (C) 2 .
26. Demuestre que 2 es una -
algebra de subconjuntos de y que no existe una
-
algebra de subconjuntos de que sea m
as grande.
27. Demuestre que toda -
algebra de un espacio muestral finito contiene un n
umero par de elementos.
28. Sea un conjunto, F una -
algebra de subconjuntos de y A un evento. De
cada una de las dos expresiones siguientes determine la que es notacionalmente
correcta. Explique su respuesta.
a) F o F.
29

b) A o A .
c) F o F.

d) A F o A F.

-
algebras,
algebras y semi
algebras
29. (Definici
on alternativa de a
lgebra) Demuestre que F es una algebra de subconjuntos de si y solo si cumple las siguientes condiciones
a) F.

b) A, B F A B F.

30. Demuestre que


F es -
algebra F es algebra F es semi
algebra.
31. (
algebra =
6
-
algebra) Sea = (0, 1] y defina la colecci
on F de subconjuntos
de la forma
n
[
(ai , bi ]
i=1

en donde (ai , bi ] (0, 1] con (ai , bi ](aj , bj ] = para i 6= j y n N. Demuestre


que F es una algebra pero no una -
algebra.

32. Mediante un contraejemplo demuestre que no toda semialgebra es una algebra.

Conjuntos de Borel
33. Defina con precisi
on a la -
algebra de Borel de R y de Rn .
34. Demuestre que los conjuntos (a, b] y [a, b) con a b son Borel medibles.
35. Demuestre que N, Z y Q son elementos de B(R).
36. Demuestre que el conjunto de n
umeros irracionales es un conjunto de Borel de
R.
37. Demuestre que B(R) = {[a, b] : a b}.
38. Demuestre que B(R) = {(a, b] : a b}.
39. Demuestre que B(R) = {[a, b) : a b}.
40. Demuestre que B(R) = {(a, ) : a R}.
41. Demuestre que B(R) = {[a, ) : a R}.
42. Demuestre que B(R) = {(, b) : b R}.
43. Demuestre que B(R) = {(, b] : b R}.

30

44. Sea A B(R). Demuestre que B(A) es efectivamente una -


algebra de subconjuntos de A.
45. Diga falso o verdadero. Justifique su respuesta.
1
a) { ( n+1
, n1 ] : n N } = B(0, 1].

b) { (0, n1 ] : n N } = B(0, 1].

1
c) { ( n+1
, n1 ] : n N } = { (0, n1 ] : n N }.

46. Demuestre que B(R2 ) = {[a, b] [c, d] : a b, c d}.


47. Demuestre que el producto cartesiano de dos -
algebras no es necesariamente
-
algebra. Esto es, suponga que (1 , F1 ) y (2 , F2 ) son dos espacios medibles.
Mediante un ejemplo muestre que F1 F2 no necesariamente es una -
algebra
de subconjuntos del espacio producto 1 2 . Sin embargo se define la algebra producto de la forma siguiente, F1 F2 = (F1 F2 ).

Sucesiones de eventos
48. Sea {An : n N} una sucesi
on de eventos. Demuestre que
a) lm sup An es un evento.
n

b) lm inf An es un evento.
n

c) lm inf An lm sup An .
n

49. Demuestre que


a) lm sup An = { : An para una infinidad de valores de n}.
n

b) lm inf An = { : An para toda n excepto un n


umero finito de ellas}.
n

50. Suponga An Bn para cada n en N. Demuestre que


a) lm sup An lm sup Bn .
n

b) lm inf An lm inf Bn .
n

c) lm sup An lm inf Bn .
n

51. Demuestre que si A1 A2 entonces lm An =


n

52. Demuestre que si A1 A2 entonces lm An =


n

An .

An .

n=1

n=1

53. Sea {An : n N} una sucesi


on de eventos. Demuestre que
a) ( lm inf An )c = lm sup Acn .
n

b) ( lm sup An )c = lm inf Acn .


n

31

c) P ( lm inf An ) = 1 P ( lm sup Acn ).


n

d) P ( lm sup An ) = 1 P ( lm inf Acn ).


n

54. Sea {An : n N} una sucesi


on de eventos. Demuestre que
a) lm An = A lm Acn = Ac .
n

b) lm An = A lm 1An = 1A .
n

55. Sea {an : n N} una sucesi


on de n
umeros no negativos convergente al n
umero
a 0. Sea An = [0, an ]. Calcule lm inf An y lm sup An .
n

56. Calcule el lmite superior e inferior para cada una de las siguientes sucesiones
de eventos. Determine en cada caso si la sucesi
on es convergente.
a) An = (1/n, 2 + (1)n ).
b) An = {(x, y) : x2 + y 2 (1 + 1/n)n }.

c) An = {(x, y) : x2 + y 2 2 + sen(n/2)}.

57. Demuestre que las siguientes sucesiones de eventos no son convergentes.


a) An = si n es impar y An = si n es par.
b) An = (0, 1 + (1/2)n ).

58. Suponga que lm An = A y lm Bn = B. Calcule el lmite superior e inferior


n
n
de Cn y determine si la sucesi
on es convergente, en donde

An si n es impar,
Cn =
Bn si n es par.
59. Calcule el lmite superior e inferior para cada una de las siguientes sucesiones
de eventos. Determine en cada caso si la sucesi
on es convergente.

A
si n es impar,
a) Sea A un evento. Defina An =
c
A
si n es par.

A si n es impar,
b) Sean A y B dos eventos. Defina An =
B si n es par.
60. Suponga que lm An = A. Demuestre que para cualquier evento B,
n

a) lm (An B) = A B.
n

b) lm (An B) = A B.
n

c) lm (An B) = A B.
n

d) lm (An B) = AB.
n

61. Suponga que lm An = A y lm Bn = B. Demuestre que


n

a) lm lm (An Bm ) = A B.
n m

32

b) lm lm (An Bm ) = A B.
n m

c) lm lm (An Bm ) = A B.
n m

d) lm lm (An Bm ) = AB.
n m

62. Suponga que lm An = A y lm Bn = B. Diga falso o verdadero. Demuestre


n
n
en cada caso.
a) lm (An Bn ) = A B.
n

b) lm (An Bn ) = A B.
n

c) lm (An Bn ) = A B.
n

d) lm (An Bn ) = AB.
n

Medidas de probabilidad
63. Escriba de manera completa la definici
on de espacio de probabilidad, definiendo claramente cada uno de sus componentes.
64. Determine completamente un espacio de probabilidad (, F, P ) para el experimento aleatorio de
a) lanzar una moneda equilibrada.
b) lanzar un dado equilibrado.
c) escoger al azar un n
umero real dentro del intervalo unitario [0, 1].
d) extraer dos bolas de una urna en donde hay dos bolas blancas y dos
negras.
e) lanzar una moneda honesta hasta obtener las dos caras.
65. Defina con precisi
on el concepto de medida de probabilidad.
66. Sea {xn : n N} una sucesi
on de n
umeros reales.
P Sea {an : n N} otra
sucesi
on de n
umeros reales no negativos tal que
n=1 an = 1. Demuestre que
la funci
on P : B(R) [0, 1] definida de la siguiente forma es una medida de
probabilidad.

X
P (A) =
an 1(xn A) (n).
n=1

67. Sean P y Q medidas de probabilidad definidas sobre una misma -


algebra.
Demuestre que P + (1 )Q es una medida de probabilidad para cada en
[0, 1].
68. Sea P una medida de probabilidad. Determine si las siguientes funciones tambien son medidas de probabilidad: a) 1 P . b) (1 + P )/2. c) P 2 .
69. Considere el espacio medible (N, 2N ). Demuestre en cada caso que P es una
medida de probabilidad. Para cada A 2N defina
33

a) P (A) =

2/3n .

nA

b) P (A) =

1/2n .

nA

70. Sea = {1, 2, . . . , n} y considere el espacio medible (, 2 ). Investigue en


cada caso si P es una medida de probabilidad. Para cada A 2 defina
a) P (A) =

kA

b) P (A) =

2k
.
n(n + 1)

(1 1/k).

kA

71. Considere el espacio medible ((0, 1), B(0, 1)). Demuestre en cada caso que P
es una medida de probabilidad. Para cada A B(0, 1) defina
Z
a) P (A) =
2x dx.
A
Z
3
b) P (A) =
x dx.
A 2
72. Probabilidad condicional. Sea (, F, P ) un espacio de probabilidad y sea B un
evento con probabilidad estrictamente positiva. Demuestre que la probabilidad
condicional definida para cada A en F como sigue
P (A|B) =

P (A B)
,
P (B)

es una medida de probabilidad. En consecuencia toda propiedad v


alida para
P ( ) es tambien v
alida para P ( |B).
73. Sea P una medida de probabilidad y sean P1 ( ) = P ( |B) y P2 ( ) =
P1 ( |C). Demuestre que P2 (A) = P (A|B C).
74. Sea P una medida de probabilidad. Demuestre que la colecci
on {A F :
P (A) = 0 o P (A) = 1} es una -
algebra.

Propiedades elementales
75. Demuestre que
a) P (Ac ) = 1 P (A).
b) 0 P (A) 1.

76. Demuestre que P () = 0


a) usando P () = 1.
b) sin usar P () = 1.
77. Demuestre que

34

a) P (A B) = P (A) P (A B).

b) P (A B) P (A)P (B) = P (Ac )P (B) P (Ac B).

78. Demuestre que si A B entonces


a) P (A) P (B).

b) P (B A) = P (B) P (A).

79. Demuestre que


a) m
ax{P (A), P (B)} P (A B).
b) P (A B) mn{P (A), P (B)}.

80. Demuestre que P (A B) = P (A) + P (B) P (A B).


81. Demuestre que
P (A B C) = P (A) + P (B) + P (C)

P (A B) P (A C) P (B C)
+P (A B C).

82. Demuestre que


P(

n
[

Ai ) =

i=1

n
X
i=1

P (Ai )

i<j<k

X
i<j

P (Ai Aj )

P (Ai Aj Ak )

+ (1)n+1 P (A1 An )
83. Demuestre que
P(

n
\

Ai ) =

i=1

n
X
i=1

P (Ai )

i<j<k

X
i<j

P (Ai Aj )

P (Ai Aj Ak )

(1)n P (A1 An )
84. Demuestre que P (

n
\

k=1

Ak ) 1

n
X

P (Ack ).

k=1

85. Demuestre que


0 P (A B) P (A) P (A B) P (A) + P (B) 2.
86. Diga falso o verdadero. Demuestre en cada caso.
a) P (B A) = P (B) P (A).
35

b) P (A B) = P (A B) + P (B A).
c) P (A) > 0 = P (A B) > 0.

d) P (A) > 0 = P (A B) > 0.


e) P (A) < 1 = P (A B) < 1.
f ) P (A) < 1 = P (A B) < 1.

g) P (A) = 0 = P (A B) = 0.

h) P (A) = 0 = P (A B) = 0.

i) P (A B) = 0 = P (A) = 0.

j ) P (A B) = 0 = P (A) = 0.

k ) P (A) = 1 = P (A B) = 1.
l) P (A) = 1 = P (A B) = 1.

m) P (A B) = 1 = P (A) = 1.
n) P (A B) = 1 = P (A) = 1.

87. Diga falso o verdadero. Demuestre en cada caso.


a) P (A B) P (A)P (B).
b) P (A|B) < P (A).

c) P (A|B) > P (A) = P (B|A) > P (B).


88. Teorema de probabilidad total. Sea (, F, P ) un espacio de probabilidad y sea
on de tal que para cada n 1 el conjunto An es un
{A1 , A2 , . . .} una partici
evento con P (An ) > 0. Demuestre que para cualquier evento B,
P (B) =

P (B|An )P (An ).

n=1

89. Se lanza una moneda tantas veces como indica un dado previamente lanzado.
Calcule la probabilidad de que
a) se obtengan ambas caras de la moneda igual n
umero de veces.
b) se obtenga una misma cara siempre.
90. Teorema de Bayes. Sea (, F, P ) un espacio de probabilidad y sea {A1 , A2 , . . .}
una partici
on de tal que para cada n 1, el conjunto An es un elemento de
F y P (An ) > 0. Demuestre que para cualquier evento B tal que P (B) > 0 y
cualquier m 1 fijo,
P (Am |B) =

P (B|Am )P (Am )
.

X
P (B|An )P (An )

n=1

91. Regla del producto. Demuestre que


P (A1 An ) = P (A1 )P (A2 |A1 )P (A3 |A1 A2 ) P (An |A1 An1 ).
36

92. Desigualdad de Bonferroni. Demuestre que


P(

n
[

i=1

Ai )

n
X
i=1

P (Ai )

X
i<j

P (Ai Aj ).

93. Desigualdad de Kounias. Demuestre que


P(

n
[

i=1

n
n
X
X
Ai ) mn{
P (Ai )
P (Ai Aj )}.
j

i=1

i=1

i6=j

Continuidad
94. Se lanza una moneda honesta una infinidad de veces. Demuestre que la probabilidad de que eventualmente cada una de las dos caras aparezca es uno.
Sugerencia: proceda como en el ejemplo 1.3.

Independencia de eventos
95. Demuestre que A y B son independientes si y solo si
a) A y B c lo son.
b) Ac y B lo son.
c) Ac y B c lo son.
96. Demuestre que A1 , . . . , An son independientes si y solo si Ac1 , . . . , Acn lo son.
97. Sean A1 , A2 , A3 eventos. Mediante un contraejemplo demuestre que
a) independencia dos a dos no implica independencia tres a tres.
b) independencia tres a tres no implica independencia dos a dos.
98. Demuestre que un evento A es independiente consigo mismo si y solo si P (A) =
0 o P (A) = 1.
99. Sea A un evento tal que P (A) = 0 o P (A) = 1. Demuestre que A es independiente de cualquier otro evento B.
100. Mediante un contraejemplo demuestre que
a) A, B independientes =
6
A, B ajenos.

b) A, B ajenos =
6
A, B independientes.

101. Diga falso o verdadero. Demuestre o proporcione un contraejemplo.


a) A A.

b) A B B A.

c) A B, B C A C.
37

102. Sean A1 , . . . , An independientes. Demuestre que


P(

n
[

k=1

Ak ) = 1

n
Y

[1 P (Ak )].

k=1

103. Sea A1 , A2 , . . . una sucesi


on infinita de eventos. Defina
Bn =

Ak

k=n

Cn =

Ak .

k=n

Demuestre que si Bn y Cn son independientes para cada n entonces lm sup An


n

y lm inf An tambien son independientes. En particular, cuando lm An = A


n

entonces P (A) = 0 o P (A) = 1.


104. Sean A y B independientes. Demuestre que {A} y {B} son independientes.

Lema de Borel-Cantelli
105. Enuncie con precisi
on el lema de Borel-Cantelli.

38

Captulo 2

Variables aleatorias
En este captulo se estudian los conceptos de variable aleatoria, funci
on de distribuci
on, funci
on de densidad y esperanza. Se estudian tambien algunas distribuciones
de probabilidad de variables aleatorias discretas y continuas particulares. A partir
de ahora y en el resto del curso consideraremos como elemento base un espacio de
probabilidad (, F, P ).

2.1.

Variables aleatorias

El concepto de variable aleatoria es fundamental en la teora de la probabilidad.


Una vez que enunciemos su definici
on, el termino aparecer
a con mucha frecuencia a
lo largo del curso.

Definici
on 14 (Variable aleatoria) Una variable aleatoria es una funci
on X :
R tal que para cualquier conjunto Boreliano B, se cumple que el conjunto
X 1 B es un elemento de F.

Gr
aficamente una variable aleatoria puede representarse de la siguiente forma.

39

X()

Una variable aleatoria es una funci


on.

Esto es, una variable aleatoria (v.a.) es una funci


on de en R tal que la imagen
inversa de cualquier conjunto Boreliano es un elemento de la -
algebra del espacio
de probabilidad. Esta condici
on se conoce como medibilidad en teora de la medida
y se dice entonces que dicha funci
on es medible respecto de las -
algebras F y B(R).
En un apendice al final del texto aparece una secci
on que contiene una discusi
on
breve del concepto de imagen inversa de una funci
on, que para el caso de variables
aleatorias puede representarse como indica la siguiente figura.

X 1

X 1 B

La imagen inversa de un conjunto de Borel.

Se justifica a continuaci
on las razones tecnicas por las cuales se le pide a una funci
on X : R que cumpla la condici
on de medibilidad. Recordemos que P es
una medida de probabilidad definida sobre el espacio medible (, F). Si X es una
variable aleatoria entonces podemos trasladar la medida de probabilidad P al espacio medible (R, B(R)) del siguiente modo. Si B es un conjunto Boreliano definimos
PX (B) = P (X 1 B), lo cual es consistente pues el conjunto X 1 B es un elemento
de F, dominio de definici
on de P . La funci
on PX : B(R) [0, 1] resulta ser una medida de probabilidad y se le llama por tanto la medida de probabilidad inducida
por la variable aleatoria X. De este modo se construye el espacio de probabilidad
(R, B(R), PX ).
Si B es un conjunto Boreliano, se usan los smbolos X 1 B y (X B) para denotar
el conjunto { : X() B}. Por ejemplo el conjunto { : X() [0, )}
puede ser denotado por X 1 [0, ) o (X [0, )), o simplemente por (X 0),
incluyendo los parentesis. Veamos otro ejemplo. Si (a, b) es un intervalo de la recta
40

real, se puede usar el smbolo X 1 (a, b) o (X (a, b)) o bien (a < X < b) para
denotar el conjunto { : X() (a, b)}. Para hacer la escritura m
as corta,
a menudo se omite el argumento de una v.a. X y se omite tambien el termino
variable aleatoria para X asumiendo, en la mayora de las veces, que lo es.
Para comprobar que una funci
on X : R es realmente una variable aleatoria,
la definici
on requiere verificar la condici
on X 1 B F para cualquier conjunto Boreliano B. En muy pocos casos tal condici
on puede comprobarse de manera tan
general. La siguiente proposici
on establece que no es necesario demostrar la condici
on de medibilidad para cualquier conjunto Boreliano B, sino que es suficiente
tomar intervalos de la forma (, x] para cada x en R. Este resultado, como uno puede imaginar, es de suma utilidad para demostrar que una funci
on dada es variable
aleatoria. Lo usaremos con frecuencia en el resto del captulo.

Proposici
on 17 Una funci
on X : R es una variable aleatoria si y solo si el
1
conjunto X (, x] es un elemento de F para cada x en R.

Demostraci
on.
() Si X es variable aleatoria entonces claramente se cumple que para cualquier
n
umero real x el conjunto X 1 (, x] es un elemento de F.
()Ahora suponga que para cada real x, el conjunto X 1 (, x] es un elemento
de F. Sean B y C las colecciones
y

B = {B B(R) : X 1 B F},
C = {(, x] : x R}.

Entonces claramente C B B(R). La primera contenci


on es por hip
otesis y la
segunda es por definici
on de la colecci
on B. Suponga por un momento que B es una
-
algebra de subconjuntos de R. Entonces B es una -
algebra que contiene a C. Por
lo tanto (C) = B(R) B. Esto implica que B = B(R) y entonces X es variable
aleatoria. Resta entonces hacer ver que B es efectivamente una -
algebra.
(i) Primeramente tenemos que R B pues R B(R) y X 1 R = F.
(ii) Sea B B. Entonces B B(R) y X 1 B F. Por lo tanto B c B(R) y
X 1 B c = (X 1 B)c F. Es decir, B c B.
(iii) Sea B1 , B2 , . . . una sucesi
on en B. Es decir, para cada n
umero natural n, Bn

[
[
[
Bn B(R) y
X 1 Bn = X 1
Bn
B(R) y X 1 Bn F. Entonces
F. Es decir,

n=1

n=1

n=1

n=1

Bn B.


41

Adem
as de la condici
on anterior para demostrar que una funci
on es variable aleatoria existen otras condiciones igualmente equivalentes y u
tiles. Por ejemplo X es
variable aleatoria si para cada x en R, X 1 (, x) F, o X 1 (x, ) F, o
X 1 [x, ) F. Cualquiera de estas condiciones es necesaria y suficiente para que
X sea variable aleatoria. Tambien la condici
on X 1 (a, b) F para cualquier intervalo (a, b) de R es equivalente para que X sea variable aleatoria. La demostracion
de todas estas aseveraciones es completamente an
aloga al caso demostrado arriba y
se pide desarrollar los detalles en la secci
on de ejercicios.
Considere los espacios medibles (, F) y (R, B(R)). Si X es una funci
on de en R
entonces se denota por (X) a la mnima -
algebra de subconjuntos de respecto
de la cual X es variable aleatoria. Es decir,
(X) = {X 1 B : B B(R)}.
Es sencillo probar que tal colecci
on de im
agenes inversas es efectivamente una algebra. Claramente X es variable aleatoria si y solo si (X) F.
A continuaci
on se demuestra que algunas operaciones b
asicas entre variables aleatorias producen nuevas variables aleatorias. Suponga que (, F, P ) es un espacio de
probabilidad dado. Todas las variables aleatorias que se consideran a continuacion
est
an definidas sobre este espacio de probabilidad.
Proposici
on 18 La funci
on constante X = c es una v.a.
Demostraci
on. Sea B un elemento cualquiera de B(R). Para la funci
on constante
/ B. En ambos casos el
X = c se tiene que X 1 B = si c B, y X 1 B = si c

conjunto X 1 B es un elemento de F, por lo tanto X = c es v.a.

Proposici
on 19 Si X es v.a. y c es una constante entonces cX es v.a.
Demostraci
on. Comprobaremos que para cada n
umero real x, el conjunto (cX)1 (, x]
es un elemento de F. Tenemos tres casos. Si c > 0 entonces el conjunto (cX x) =
(X x/c) es un elemento de F pues X es v.a. Si c < 0 entonces nuevamente el
conjunto (cX x) = (X x/c) es un elemento de F pues X es v.a. Finalmente si
c = 0 entonces es claro que cX = 0 es v.a. por la proposici
on anterior.


Proposici
on 20 Si X y Y son v.a.s entonces X + Y es v.a.
Demostraci
on. Probaremos que para cada n
umero real x, el conjunto (X+Y )1 (x, ) =
(X + Y > x) es un elemento de F. Para ello usaremos la igualdad
[
(X + Y > x) =
(X > r) (Y > x r).
(2.1)
rQ

42

Es claro que de esta igualdad se concluye que el conjunto (X + Y > x) es un


elemento de F pues tanto X como Y son variables aleatorias y la operaci
on de
uni
on involucrada es numerable. Resta entonces demostrar (2.1).
() Sea en tal que X() + Y () > x. Entonces X() > x Y (). Como
los n
umeros racionales son un conjunto denso en R, tenemos que existe un
n
umero racional r tal que X() > r > x Y (). Por lo tanto X() > r y
Y () > x r. De aqui se desprende que es un elemento del lado derecho.
S
() Sea ahora un elemento de rQ (X > r) (Y > x r). Entonces existe un
n
umero racional r0 tal que X() > r0 y Y () > x r0 . Sumando obtenemos
X() + Y () > x y por lo tanto es un elemento del lado izquierdo.


Proposici
on 21 Si X y Y son v.a.s entonces XY es v.a.
Demostraci
on. Suponga primero el caso particular X = Y . Entonces necesitamos
probar que para todo n
umero real x, el conjunto (X 2 x) es un elemento de F.

Pero esto es cierto pues (X 2 x) = si x < 0 y (X 2 x) = ( x X x) si


x 0. En ambos casos, (X 2 )1 (, x] es un elemento de F. Para el caso general
X 6= Y usamos la f
ormula de interpolaci
on
XY = [(X + Y )2 (X Y )2 ]/4.
Por lo demostrado antes, XY es efectivamente una v.a.

Como consecuencia de la proposici


on anterior se cumple que si multiplicamos X
por si misma n veces entonces X n es variable aleatoria. Por lo tanto toda funcion
polinomial de una variable aleatoria es tambien variable aleatoria.
Proposici
on 22 Sean X y Y v.a.s con Y 6= 0. Entonces X/Y es v.a.
Demostraci
on. Primeramente demostramos que 1/Y es v.a. Para cualquier n
umero
real y > 0 tenemos que
(

1
1
1
y) = ( y, Y > 0) ( y, Y < 0)
Y
Y
Y
1
1
= (Y , Y > 0) (Y , Y < 0)
y
y
1
= (Y ) (Y < 0),
y

43

que es un elemento de F puesto que Y es v.a. Por otro lado, si y < 0 tenemos que
(

1
1
1
y) = ( y, Y > 0) ( y, Y < 0)
Y
Y
Y
1
1
= (Y , Y > 0) (Y , Y < 0)
y
y
1
= (Y , Y < 0)
y
1
= ( Y < 0).
y

Nuevamente vemos que este conjunto es un elemento de F puesto que Y es v.a.


Finalmente cuando y = 0 obtenemos una vez mas un elemento de F pues
(

1
1
1
0) = ( 0, Y > 0) ( 0, Y < 0)
Y
Y
Y
= (Y < 0)
= (Y < 0).

Esto demuestra que 1/Y es v.a. Como el producto de v.a.s es nuevamente una v.a.
concluimos entonces que X/Y es v.a.


Proposici
on 23 Si X y Y son variables aleatorias entonces m
ax{X, Y } y mn{X, Y }
tambien lo son.
Demostraci
on. Para cualquier n
umero real x,
(m
ax{X, Y } x) = (X x, Y x) = (X x) (Y x).
An
alogamente
(mn{X, Y } x) = (X x, Y x) = (X x) (Y x).
En ambos casos los conjuntos del lado derecho son elementos de F.

Como consecuencia de la proposici


on anterior se obtiene que tanto X + = max{0, X}
como X = min{0, X} son variables aleatorias.
Proposici
on 24 Si X es v.a. entonces |X| es v.a.
Demostraci
on. Si x 0 entonces |X|1 (, x] = { : x X() x} F, y si
x < 0 entonces |X|1 (, x] = F, de modo que |X| es v.a. Alternativamente
se puede escribir |X| = X + + X y por lo expuesto anteriormente |X| es v.a.

Se muestra a continuaci
on que el recproco de la proposici
on anterior es falso. Esto
es, si X : R es una funci
on tal que |X| es v.a. entonces no necesariamente X es
44

v.a. Considere por ejemplo el espacio muestral = {1, 0, 1} junto con la -


algebra
F = {, {0}, {1, 1}, }. Sea X : R la funci
on identidad X() = . Entonces
|X| es v.a. pues para cualquier conjunto Boreliano B,

si 0, 1 B,

{1,
1}
si 0
/ B y 1 B,
|X|1 B =
{0}
si 0 B y 1
/ B,

si 0, 1
/ B.

Es decir, |X|1 B es un elemento de F. Sin embargo X no es v.a. pues X 1 {1} =


{1} no es un elemento de F.
Proposici
on 25 Sea {Xn : n N} una sucesi
on de v.a.s. Entonces sup{Xn } e
n

nf {Xn }, cuando existen, son v.a.s


n

Demostraci
on. Este resultado se sigue directamente de las siguientes igualdades.
Para cualquier n
umero real x,

(sup Xn x) =
n

(Xn x) F,

n=1

(nf Xn x) =

(Xn x) F.

n=1

Proposici
on 26 Sea {Xn : n N} una sucesi
on de v.a.s. Entonces lm sup Xn y
n

lm inf Xn , cuando existen, son v.a.s


n

Demostraci
on. Esto es consecuencia de la proposici
on anterior pues
1. lm sup Xn = nf (sup Xn ) es v.a.,
n

nk

2. lm inf Xn = sup(nf Xn ) es v.a.


n

nk

on de v.a.s tales que lm Xn ()


Proposici
on 27 Sea {Xn : n N} es una sucesi
n
existe para cada . Entonces lm Xn es v.a.
n

Demostraci
on. Si lm sup Xn y lm inf Xn coinciden entonces lm Xn existe y es el
n

valor lmite com


un. Por lo anterior, lm Xn es v.a.
n

45

2.2.

Funci
on de distribuci
on

Toda variable aleatoria tiene asociada una funci


on llamada funci
on de distribuci
on.
En esta secci
on se define este importante concepto y se demuestran algunas de sus
propiedades.

Definici
on 15 (Funci
on de distribuci
on) La funci
on de distribuci
on de una
variable aleatoria X es la funci
on F (x) : R [0, 1] definida como sigue
F (x) = P (X x).

Cuando sea necesario especificar la variable aleatoria en cuesti


on se escribe FX (x),
pero en general se omite el subndice X cuando no haya posibilidad de confusi
on.
El argumento de la funci
on es la letra min
uscula x que puede tomar cualquier valor
real. Por razones obvias a esta funci
on se le conoce tambien con el nombre de funci
on
de acumulaci
on de probabilidad o funci
on de probabilidad acumulada. Observe que la
funci
on de distribuci
on de una variable aleatoria est
a definida sobre la totalidad del
conjunto de n
umeros reales y siendo una probabilidad, toma valores en el intervalo
[0, 1]. La funci
on de distribuci
on es importante pues, como se ilustrar
a m
as adelante,
contiene ella toda la informaci
on de la variable aleatoria y la correspondiente medida
de probabilidad. A continuaci
on se estudian algunas propiedades de esta funci
on.

Proposici
on 28 Sea F (x) la funci
on de distribuci
on de una variable aleatoria.
Entonces
1.
2.

lm F (x) = 1.

x+

lm F (x) = 0.

3. Si x1 x2 entonces F (x1 ) F (x2 ).


4. F (x) es continua por la derecha, es decir, F (x+) = F (x).1

Demostraci
on. (1) Sea {xn : n N} una sucesi
on cualquiera de n
umeros reales
creciente a infinito y sean los eventos An = (X xn ). Entonces {An : n N} es
una sucesi
on de eventos creciente cuyo lmite es . Por la propiedad de continuidad
lm F (xn ) = lm P (An ) = P () = 1.

Dado que R es un espacio metrico, lo anterior implica que F (x) converge a uno
46

cuando x tiende a infinito. (2) Sea {xn : n N} una sucesi


on cualquiera de n
umeros
reales decreciente a menos infinito y sean los eventos An = (X xn ). Entonces
{An : n N} es una sucesi
on de eventos decreciente al conjunto vaco. Por la
propiedad de continuidad
lm F (xn ) = lm P (An ) = P () = 0.

Por lo tanto, F (x) converge a cero cuando x tiende a menos infinito. (3) Para
x1 x2 ,
F (x1 ) F (x1 ) + P (x1 < X x2 )

= P [(X x1 ) (x1 < X x2 )]


= P (X x2 )
= F (x2 ).

(4) Sea {xn : n N} una sucesi


on cualquiera de n
umeros reales no negativos y
decreciente a cero. Entonces
F (x + xn ) = F (x) + P (x < X x + xn ),
en donde An = (x < X x + xn ) es una sucesi
on de eventos decreciente al conjunto
vaco. Por lo tanto lm F (x + xn ) = F (x). Es decir F (x+) = F (x).

n

El recproco de la proposici
on anterior es v
alido y justifica la importancia de la
funci
on de distribuci
on. Se enuncia a continuaci
on este interesante resultado cuya
demostraci
on omitiremos y puede encontrarse por ejemplo en [9].

Proposici
on 29 Sea F (x) : R [0, 1] una funci
on que satisface las cuatro propiedades de la proposici
on anterior. Entonces existe un espacio de probabilidad y
una variable aleatoria cuya funci
on de distribuci
on es F (x).

Como consecuencia tenemos la siguiente definici


on general, no haciendo referencia
a variables aleatorias ni a espacios de probabilidad particulares.

Definici
on 16 (Funci
on de distribuci
on) Una funci
on F (x) : R [0, 1] es
llamada funci
on de distribuci
on si cumple las cuatro propiedades anteriores.

Se establecen a continuacion algunas otras propiedades que establecen la forma de


calcular probabilidades usando la funci
on de distribuci
on.
47

Proposici
on 30 Para cualquier n
umero x y para cualesquiera n
umeros reales a
b,
1. P (X < x) = F (x).2
2. P (X = x) = F (x) F (x).
3. P (X (a, b]) = F (b) F (a).
4. P (X [a, b]) = F (b) F (a).
5. P (X (a, b)) = F (b) F (a).
6. P (X [a, b)) = F (b) F (a).
Demostraci
on. (1) Sea {xn : n N} una sucesi
on cualquiera de n
umeros reales no
negativos y decreciente a cero. Sea An el evento (X axn ). Entonces {An : n N}
es una sucesi
on de eventos decreciente al evento (X < a). Por la propiedad de
continuidad
P (X < a) =
=

lm P (An )

lm F (a xn )

= F (a).
Para (2) simplemente se escribe
P (X = x) = P (X x) P (X < x)
= F (x) F (x).

Las igualdades (3),(4),(5) y (6) se siguen directamente de (1) y (2).

Observe que como F (x) es una funci


on no decreciente y continua por la derecha, la
probabilidad P (X = x) = F (x) F (x) representa el tama
no del salto o discontinuidad de la funci
on de distribuci
on en el punto x como se muestra en la siguiente
figura.
2

La expresi
on F (x) significa el lmite por la izquierda de la funci
on F en el punto x.

48

F (x)
1
b

bc

P (X = x) = F (x) F (x)

x
La probabilidad P (X = x) es el tama
no
del salto de la funci
on F en el punto x.

En consecuencia, cuando F (x) es una funci


on continua y para a < b,
F (b) F (a) = P (X (a, b])
= P (X [a, b])

= P (X (a, b))

= P (X [a, b)).
Es decir, incluir o excluir los extremos de un intervalo no afecta el c
alculo de la probabilidad de dicho intervalo. Por lo tanto para cualquier n
umero x, P (X = x) = 0.
Finalizamos esta secci
on con un resultado interesante cuya prueba es sorprendentemente simple.
Proposici
on 31 Toda funci
on de distribuci
on tiene a lo sumo un n
umero numerable de discontinuidades.
Demostraci
on. Sea D el conjunto de puntos de discontinuidad de una funci
on de
distribuci
on F (x). Para cada n
umero natural n defina los subconjuntos
1
1
< F (x) F (x) }.
n+1
n
S
Cada conjunto Dn tiene a lo sumo n elementos. Como D =
n=1 Dn se concluye
que D es numerable.

Dn = {x D :

2.3.

Tipos de variables aleatorias

Las variables aleatorias se clasifican en varios tipos dependiendo del conjunto de


valores que estas toman. Al menos existen dos tipos: discretas y continuas. La definici
on es la siguiente.
49

Definici
on 17 (Variable aleatoria discreta) La variable aleatoria X se llama
discreta si su correspondiente funci
on de distribuci
on F (x) es una funci
on constante por pedazos. Sean x1 , x2 , . . . los puntos de discontinuidad de F (x). En cada uno
de estos puntos el tama
no de la discontinuidad es P (X = xi ) = F (xi ) F (xi ) >
0. A la funci
on f (x) que indica estos incrementos se le llama funci
on de probabilidad de X y se define como sigue

P (X = x) si x = x1 , x2 , . . .
f (x) =
(2.2)
0
otro caso.

En este caso discreto la funci


on f (x) siempre existe y se le llama tambien funci
on de
masa de probabilidad o simplemente funci
on de probabilidad de la variable aleatoria
(x). Observe
X. Cuando sea necesario especificarlo se escribe fX (x) en lugar de fP
que f (x) es una funci
on no negativa que suma uno en el sentido que i f (xi ) = 1.
Recprocamente toda funcion de la forma (2.2) que cumpla estas dos propiedades se
le llama funci
on de densidad, sin que haya necesariamente una variable aleatoria de
por medio. Es posible reconstruir la funci
on de distribuci
on a partir de la funcion
de densidad mediante la relaci
on
X
F (x) =
f (xi ).
xi x

Definici
on 18 (Variable aleatoria continua) La variable aleatoria X se llama continua si su correspondientes funci
on de distribuci
on F (x) es una funci
on
continua. Cuando existe una funci
on integrable f 0 tal que para cualquier valor
de x,
Z
x

F (x) =

f (u) du,

(2.3)

entonces se dice que X es absolutamente continua. En tal caso a la funci


on f (x)
se le llama funci
on de densidad de X.

No todas las variables aleatorias continuas tienen funci


on de densidad, y a
un cuando
esta exista puede no ser u
nica pues basta modificarla en un punto para que sea ligeramente distinta y a pesar de ello seguir cumpliendo (2.3). Es claro que la funci
on de
densidad de una variable aleatoria absolutamente continua es no negativa y su integral sobre toda la recta real es uno. Recprocamente toda funci
on f (x) no negativa
que integre uno en R se llama funci
on de densidad. Si X es absolutamente continua con funci
on de distribuci
on F (x) y funci
on de densidad continua f (x) entonces
el teorema fundamental del c
alculo establece que, a partir de (2.3), F (x) = f (x).
50

Adem
as la probabilidad de que X tome un valor en el intervalo (a, b) es el area bajo
la funci
on de densidad sobre dicho intervalo como se muestra en la Figura ??. La
probabilidad es la misma si se incluyen o excluyen los extremos del intervalo.

f (x)

P (X (a, b)) =

f (x) dx

La probabilidad como un area.

Una variable aleatoria que no es discreta ni continua se llama variable aleatoria


mixta, y un ejemplo de este tipo de variables se presenta a continuaci
on.

Ejemplo. (Una variable aleatoria que no es discreta ni continua.) Sea X una variable aleatoria con funci
on de distribuci
on

1 ex
F (x) =
0

si x > 0,
si x 0.

cuya gr
afica es
F (x)
1

x
Funci
on de distribuci
on de X.

Como F (x) es continua entonces X es una variable aleatoria continua. Sea Y =


X M con M > 0 constante. Observe que Y est
a acotada superiormente por la
constante M . La funci
on de distribuci
on de Y es

con gr
afica

1
F (y) =
1 ex

0
51

si y M,
si 0 < y < M,
si x 0.

F (y)
b

bc

y
M
Funci
on de distribuci
on de Y .

Esta funci
on no es constante por pedazos pues es creciente en el intervalo (0, M ) y
tampoco es continua pues tiene una discontinuidad en y = M . Por lo tanto Y es
una variable aleatoria que no es discreta ni continua.

2.4.

Integral de Riemann-Stieltjes

En esta secci
on se define la integral de Riemann-Stieltjes. Esta integral es de la
forma
Z b
h(x) dF (x)
a

y constituye una generalizaci


on de la integral de Riemann. Las funciones h(x) y
F (x) deben cumplir ciertas propiedades para que la integral tenga sentido y este bien
definida. Al integrando h(x) se le pide inicialmente que sea una funci
on acotada en el
intervalo [a, b], aunque despues se relajar
a esta condici
on. A la funci
on integradora
F (x) se le pide que sea continua por la derecha, mon
otona no decreciente y tal
que F () F () < M para alg
un n
umero M > 0. Observe que F (x) debe
cumplir propiedades casi identicas a las de una funci
on de distribuci
on y de hecho
la notaci
on es la misma. Esto no es coincidencia pues usaremos las funciones de
distribuci
on como funciones integradoras.
Presentamos a continuaci
on la definici
on de la integral de Riemann- Stieltjes bajo las
condiciones arriba se
naladas. En [9] puede encontrarse una exposici
on m
as completa
y rigurosa de esta integral. Nuestro objetivo en esta secci
on es simplemente presentar
la definici
on y mencionar algunas propiedades. Sea {a = x0 < x1 < < xn = b}
una partici
on finita del intervalo [a, b] y defina
i ) = sup {h(x) : xi1 x xi },
h(x

h(xi ) = nf {h(x) : xi1 x xi }.

Se define la suma superior e inferior de Riemann-Stieltjes como sigue


Sn =

n
X
i=1

Sn =

n
X
i=1

i )[F (xi ) F (xi1 )],


h(x
h(xi )[F (xi ) F (xi1 )].
52

Ahora se hace n tender a infinito de tal forma que la longitud m


ax{|xi xi1 | : 1
i n} tienda a cero. Si sucede que
< lm S n = lm Sn < ,
n

entonces el valor com


un se denota por
Z b
h(x) dF (x),
a

y se le llama la integral de Riemann-Stieltjes de la funci


on h(x) respecto de la funcion
F (x) sobre el intervalo [a, b]. Cuando la funci
on h(x) no es acotada se define

si h(x) < N,
N
h(x) si |h(x)| N,
hN (x) =

N
si h(x) > N.
y entonces

h(x) dF (x) = lm

N a

hN (x) dF (x),

cuando este lmite existe. Se puede extender la definici


on de esta integral de la
siguiente forma
Z
Z b
h(x) dF (x) = lm
h(x) dF (x),

a,b a

cuando el lmite del lado derecho exista.

La integral de Riemann-Stieltjes tiene muchas propiedades semejantes a la integral


de Riemann. Enunciaremos a continuaci
on algunas de ellas. Primeramente es lineal
tanto en el integrando como en el integrador, es decir, si es constante entonces
Z b
Z b
Z b
(h1 (x) + h2 (x)) dF (x) =
h1 (x) dF (x) +
h2 (x) dF (x),
a
a
a
Z b
Z b
Z b
h(x) d(F1 (x) + F2 (x)) =
h(x) dF1 (x) +
h(x) dF2 (x).
a

Cuando h(x) tiene primera derivada continua se cumple la f


ormula
Z b
Z b
h(x) dF (x) = h(b)F (b) h(a)F (a)
F (x)h (x) dx.
a

De particular importancia en la teora de la probabilidad son los siguientes dos casos


particulares. Cuando F (x) es diferenciable entonces
Z b
Z b
h(x) dF (x) =
h(x)F (x) dx.
a

De modo que integrar respecto de una funci


on de distribuci
on absolutamente continua se reduce a efectuar una integral de Riemann. El otro caso interesante ocurre
on tiene
cuando F (x) es constante excepto en los puntos x1 , x2 , . . . en donde la funci
53

saltos positivos de tama


no p(x1 ), p(x2 ), . . . respectivamente y h(x) es continua. En
este caso y suponiendo convergencia
Z b

X
h(x) dF (x) =
h(xi )p(xi ).
a

i=1

Por lo tanto integrar respecto de la funci


on de distribuci
on de una variable aleatoria
discreta se reduce a efectuar una suma. Finalmente enunciamos la propiedad que
ilustra el hecho de que la integral de Riemann es un caso particular de la integral
de Riemann-Stieltjes. Cuando F (x) = x se cumple
Z b
Z b
h(x) dF (x) =
h(x) dx.
a

2.5.

Caractersticas num
ericas

Se estudian a continuaci
on algunas caractersticas numericas asociadas a variables
aleatorias. Se definen los conceptos de esperanza, varianza y m
as generalmente
los momentos de una variable aleatoria. Para ello haremos uso de la integral de
Riemann-Stieltjes.

Esperanza
La esperanza de una variable aleatoria es un n
umero que representa el promedio
ponderado de los posible valores que toma la variable aleatoria y se calcula como se
indica a continuaci
on.

Definici
on 19 (Esperanza) Sea X con funci
on de distribuci
on F (x) y sea g :
R R una funci
on Borel medible. La esperanza de g(X) denotada por E[g(X)]
se define como el n
umero
Z
g(x) dF (x)
E[g(X)] =

cuando esta integral sea absolutamente convergente.

En particular, cuando g(x) = x y suponiendo que la integral existe, se tiene que


Z
E(X) =
x dF (x).

A la esperanza se le conoce tambien con el nombre de: media, valor esperado, valor
promedio o valor medio, y en general se usa la letra griega (mu) para denotarla.
54

Cuando X es discreta con funci


on de densidad f (x) su esperanza, si existe, se calcula
como sigue
X
xf (x).
E(X) =
x

Cuando X es absolutamente continua con funci


on de densidad f (x) entonces su
esperanza, si existe, es
Z
E(X) =
xf (x) dx.

La integral o suma arriba mencionados pueden no existir y en ese caso se dice que la
variable aleatoria no tiene esperanza finita. El Ejercicio 163 en la p
agina 75 contiene
algunos ejemplos que ilustran esta situaci
on.

Ejemplo. Sea X discreta con valores en el conjunto {1, 2, . . .} y con funcion de


densidad f (x) = P (X = x) = 1/2x . Entonces
E(X) =

xf (x) =

x=1

X
x
= 2.
2x
x=1

Ejemplo. Sea X continua con funcion de densidad f (x) = 2x para 0 < x < 1.
Entonces
E(X) =
M
as generalmente,
n

E(X ) =

xf (x) dx =

x f (x) dx =

1
0

x 2x dx =

xn 2x dx =

2
.
3
2
.
n+2

Establecemos a continuacion algunas propiedades de la esperanza.

Proposici
on 32 Sean X y Y con esperanza finita y sea c una constante. Entonces
1. E(c) = c.
2. E(cX) = cE(X).
3. Si X 0 entonces E(X) 0.
4. Si X Y entonces E(X) E(Y ).
5. E(X + Y ) = E(X) + E(Y ).

Las demostraciones de las primeras cuatro propiedades son sencillas pues se siguen
directamente de la definicion. La u
ltima propiedad es f
acilmente demostrable en el
55

caso discreto y ello se ha dejado como ejercicio. Esta propiedad en el caso general
ser
a demostrada m
as adelante.

Varianza
La varianza de una variable aleatoria es una medida del grado de dispersi
on de los
diferentes valores tomados por la variable aleatoria. Su definici
on es la siguiente.

Definici
on 20 (Varianza) La varianza de X, denotada por Var(X), se define
como el n
umero no negativo


Var(X) = E (X E(X))2
cuando esta esperanza existe.

Cuando X es discreta con funci


on de densidad f (x) y esperanza finita , la varianza
de X, cuando existe, se calcula como sigue
X
(x )2 f (x).
Var(X) =
x

Cuando X es absolutamente continua con funci


on de densidad f (x) y esperanza
finita entonces la varianza de X, cuando existe, es
Z
Var(X) =
(x )2 f (x) dx.

La varianza se denota regularmente por el smbolo 2 (sigma cuadrada). A la raz


cuadrada positiva de Var(X) se le llama desviaci
on est
andar y se le denota naturalmente por . Nuevamente hay casos en los que la varianza no es finita y en esa
situaciones se dice que la variable aleatoria no tiene varianza. Observe que para calcular Var(X) se necesita conocer primero E(X). Enunciamos a continuaci
on algunas
propiedades de la varianza.

56

Proposici
on 33 Sean X y Y con varianza finita y sea c una constante. Entonces
1. Var(X) 0.
2. Var(c) = 0.
3. Var(cX) = c2 Var(X).
4. Var(X + c) = Var(X).
5. Var(X) = E(X 2 ) E 2 (X).

La demostraci
on de estas propiedades es sencilla pues todas ellas se siguen directamente de la definici
on y de la propiedad lineal de la esperanza. Otras propiedades
de la varianza aparecen m
as adelante.

Momentos
Los momentos de una variable aleatoria son n
umeros que representan alguna caracterstica de la distribuci
on de probabilidad asociada. Bajo ciertas condiciones el
conjunto de momentos determinan de manera u
nica a la distribuci
on de probabilidad.

Definici
on 21 (Momentos) Sea X una variable aleatoria con esperanza y sea
n un n
umero natural. Cuando existe, el n
umero
1. E(X n ) es el n-esimo momento de X.
2. E|X|n es el n-esimo momento absoluto de X.
3. E[(X )n ] es el n-esimo momento central de X.
4. E|X |n es el n-esimo momento central absoluto de X.
5. E[X(X 1) (X n + 1)] es el n-esimo momento factorial de X.

Observe que el primer momento de X es E(X) y el segundo momento central es


Var(X). En algunos textos al n-esimo momento de X se le denota por n , mientras
que el n-esimo momento central es n .
Bajo ciertas condiciones los momentos de una variable aleatoria determinan la dis-

57

tribuci
on de probabilidad de la misma. Por ejemplo, si X es tal que E(X), E(X 2 ), . . .
son todos finitos y si se cumple que la serie
n
X
t

n=0

n!

E(X n )

es absolutamente convergente para alg


un t > 0, entonces la sucesi
on de momentos
determina de manera u
nica a la distribuci
on de X. Las condiciones enunciadas
para la determinaci
on de la distribuci
on de probabilidad son suficientes pero no
necesarias.

2.6.

Distribuciones discretas

En esta secci
on se estudian algunas distribuciones discretas de probabilidad de uso
com
un. En el apendice A al final del libro aparecen algunas otras distribuciones de
probabilidad.

Distribuci
on uniforme discreta
La variable aleatoria X tiene una distribuci
on uniforme sobre el conjunto {x1 , . . . , xn }
si la probabilidad de que X tome cualquiera de estos valores es 1/n. Esta distribucion
surge en espacios de probabilidad equiprobables, esto es, en situaciones en donde se
tienen n resultados diferentes y todos ellos tienen la misma probabilidad de ocurrir.
Los juegos de lotera justos son un ejemplo donde puede aplicarse esta distribucion.
on de probabilidad es
Se escribe X unif{x1 , . . . , xn } y su funci

si x = x1 , . . . , xn ,

n
f (x) =

0
otro caso.
Gr
aficamente

f (x)
1
5

x
Funci
on de probabilidad unif{1, 2, 3, 4, 5}.

58

Es f
acil ver que
n

E(X) =

1X
xi ,
n
i=1

y Var(X) =

n
1X
(xi E(X))2 .
n
i=1

Distribuci
on Bernoulli
Un ensayo Bernoulli es un experimento aleatorio con u
nicamente dos posibles resultados, llamados genericamente exito y fracaso, y con probabilidades respectivas p y
1 p. Se define la variable aleatoria X como aquella funci
on que lleva el resultado
exito al n
umero 1 y el resultado fracaso al n
umero 0. Entonces se dice que X tiene
una distribuci
on Bernoulli con par
ametro p (0, 1). Se escribe X Ber(p) y la
correspondiente funci
on de probabilidad es

si x = 0,
1p
f (x) =
p
si x = 1,

0
otro caso,
cuya gr
afica es

f (x)
b

0.7
0.3

x
0

Funci
on de probabilidad Ber(p) con p =0.7.

Es sencillo verificar que E(X) = p y Var(X) = p(1 p).

Distribuci
on binomial
Suponga que se realizan n ensayos independientes Bernoulli en donde la probabilidad
de exito en cada uno de ellos es p (0, 1). Si denotamos por E el resultado exito y
por F el resultado fracaso entonces el espacio muestral consiste de todas las posibles
sucesiones de longitud n de caracteres E y F. Usando el principio multiplicativo, es
f
acil ver que el conjunto tiene 2n elementos. Si ahora se define la variable aleatoria
59

X como el n
umero de exitos en cada una de estas sucesiones entonces X toma los
valores 0, 1, . . . , n y se dice que X tiene una distribuci
on binomial con par
ametros
n y p. Se escribe X bin(n, p) y su funci
on de probabilidad es


n

si x = 0, 1, . . . , n.
px (1 p)nx

x
f (x) =

0
otro caso.

En las siguientes gr
aficas se muestra el comportamiento de esta funci
on.
f (x)
0.3

f (x)
0.3

b
b

0.2
b

0.1
b

0.2

n = 10
p = 0.3
b

0.1
b

b
b

1 2 3 4 5 6 7 8 9 10

n = 10
p = 0.5

b
b

1 2 3 4 5 6 7 8 9 10

Funci
on de probabilidad bin(n, p).

Se puede demostrar que E(X) = np y Var(X) = np(1 p).

Distribuci
on geom
etrica
Suponga que se tiene una sucesi
on infinita de ensayos independientes Bernoulli en
donde la probabilidad de exito en cada uno de ellos es p (0, 1). Se define X como
el n
umero de fracasos antes de obtener el primer exito. Se dice entonces que X tiene
una distribuci
on geometrica con par
ametro p. Se escribe X geo(p) y su funcion
de probabilidad es

f (x) =

p(1 p)x

cuya gr
afica es del siguiente estilo

60

si x = 0, 1, . . .
otro caso,

f (x)
0.4

0.3
b

0.2

0.1

9 10

Funci
on de probabilidad geo(p) con p =0.4.

Para esta distribuci


on se puede demostrar que E(X) = (1 p)/p y Var(X) =
(1 p)/p2 . En algunos textos se define tambien la distribuci
on geometrica como el
n
umero de ensayos (no el de fracasos) antes del primer exito. La distribuci
on cambia
ligeramente.

Distribuci
on Poisson
La variable aleatoria discreta X tiene una distribuci
on Poisson con par
ametro > 0
y se escribe X Poisson() si su funci
on de probabilidad es

e
x!
f (x) =

si x = 0, 1, . . .
otro caso.

La gr
afica de esta funci
on es de la siguiente forma.
f (x)
0.3

0.2

b
b

0.1

b
b

Funci
on de probabilidad Poisson() con = 2.

Puede demostrarse que E(X) = y Var(X) = .

61

Distribuci
on binomial negativa
Suponga una sucesi
on infinita de ensayos independientes Bernoulli en donde la probabilidad de exito en cada ensayo es p (0, 1). Sea X el n
umero de fracasos antes
de obtener el r-esimo exito. Se dice entonces que X tiene una distribuci
on binomial negativa con par
ametros r y p. Se escribe X bin neg(r, p) y su funci
on de
probabilidad es


r+x1

pr (1 p)x
si x = 0, 1 . . .

x
f (x) =

0
otro caso.

Para r = 3 y p =0.2, esta funci


on tiene la siguiente forma.
f (x)
0.06
b

b b b b b

0.04

0.02

10

15

20

b b
b b
b b
b b b
b

25

30

Funci
on de probabilidad bin neg(r, p) con r = 3 y p =0.2.

Es claro que esta distribuci


on es una generalizaci
on de la distribuci
on geometrica,
la cual se obtiene cuando r = 1. Se puede demostrar que E(X) = r(1 p)/p y
Var(X) = r(1 p)/p2 .

Distribuci
on hipergeom
etrica
Suponga que se tiene un conjunto de N objetos de los cuales K son de una primera
clase y N K son de una segunda clase. Suponga que de este conjunto se toma una
muestra de tama
no n sin reemplazo y en donde el orden de los objetos seleccionados
no importa. Se define X como el n
umero de objetos de la primera clase contenidos en
la muestra seleccionada. Entonces X puede tomar los valores 0, 1, 2, . . . , n, suponiendo n K. Decimos que X tiene una distribuci
on hipergeometrica con par
ametros

62

N , K y n. Se escribe X hipergeo(N, K, n) y su funci


on de probabilidad es
0
10
1

K A N K A

x
nx

0
1
si x = 0, 1, . . . , n

N

A
f (x) =

0
otro caso.

Gr
aficamente

f (x)
0.4

b
b

0.3
0.2
0.1

N = 20
K=7
n=5

b
b
b

Funci
on de probabilidad hipergeo(N, K, n).

Es posible comprobar que


K
,
N
K N K N n
Var(X) = n
.
N N N 1
E(X) = n

2.7.

Distribuciones continuas

Ahora se estudian algunas distribuciones de probabilidad de variables aleatorias


continuas. Algunas otras distribuciones continuas ser
an estudiadas en el Captulo 5
en donde se obtienen algunas otras distribuciones de tipo continuo que surgen en la
estadstica.

Distribuci
on uniforme continua
La variable aleatoria X tiene distribuci
on uniforme en el intervalo (a, b) y se escribe
X unif(a, b), cuando su funci
on de densidad es

f (x) =

1
ba

si x (a, b),

otro caso.
63

Gr
aficamente
f (x)
1
ba

bc

bc

Funci
on de densidad unif(a, b).

En este caso es inmediato verificar que E(X) = (a + b)/2 y Var(X) = (b a)2 /12.

Distribuci
on exponencial
La variable continua X tiene una distribuci
on exponencial con par
ametro > 0 y
se escribe X exp() cuando tiene funci
on de densidad
f (x) =

ex
0

si x > 0,
si x 0,

cuya gr
afica es

f (x)

x
Funci
on de densidad exponencial().

Para esta distribuci


on es muy sencillo verificar que E(X) = 1/ y Var(X) = 1/2 .

Distribuci
on gama
La variable aleatoria continua X tiene distribuci
on gama con par
ametros n > 0 y
> 0 si su funci
on de densidad es
64


(x)n1 x

(n)
f (x) =

si x > 0,
si x 0.

La gr
afica de esta funci
on se muestra a continuaci
on.
f (x)
1
2

x
1

Funci
on de densidad gama(n, ) con n = 5 y = 3.

En tal caso se escribe X gama(n, ). El termino (n) es la funci


on gama definida
como sigue
Z

(n) =

tn1 et dt

para valores de n tal que la integral es convergente. Esta funci


on satisface las siguientes propiedades
a) (n + 1) = n(n).
b) (n + 1) = n! para n entero positivo.
c) (2) = (1) = 1.

d) (1/2) = .

Observe que cuando n = 1 la distribuci


on gama(n, ) se reduce a la distribuci
on
exponencial. Resolviendo un par de integrales se puede demostrar que E(X) = n/
y Var(X) = n/2 .

Distribuci
on beta
La variable continua X tiene distribuci
on beta con par
ametros a > 0 y b > 0, y se
escribe X beta(a, b) cuando su funci
on de densidad es

xa1 (1 x)b1 si 0 < x < 1,

B(a, b)
f (x) =

0
otro caso.
65

En la siguiente gr
afica se ilustra la forma de esta funci
on para varios valores de los
par
ametros.

f (x)
3

a=2
b=6

a=6
b=2

a=4
b=4
a=1
b=1

x
1
Funci
on de densidad beta(a, b).

El termino B(a, b) se conoce como la funci


on beta y se define como sigue
Z 1
B(a, b) =
xa1 (1 x)b1 dx,
0

para a > 0 y b > 0. Esta funci


on satisface las siguientes propiedades.
a) B(a, b) = B(b, a).
b) B(a, b) =

(a)(b)
.
(a + b)

En este caso
E(X) =
Var(X) =

2.8.

a
,
a+b
ab
.
(a + b + 1)(a + b)2

Distribuci
on normal

Esta es posiblemente la distribuci


on de probabilidad de mayor importancia. Se dice
que la variable aleatoria continua X tiene una distribuci
on normal o Gausiana si su
funci
on de densidad es
1
2
2
f (x) =
e(x) /2 ,
2 2
2
en donde R y > 0 son dos par
ametros. En este caso se escribe X N(, 2 ).
afica de la funci
on de
No es difcil demostrar que E(X) = y Var(X) = 2 . La gr
densidad normal aparece en la siguiente figura.
66

f (x)

Funci
on de densidad N(, 2 ).

En particular se dice que X tiene una distribuci


on normal est
andar si = 0 y
2 = 1. En este caso particular la funci
on de densidad se reduce a la expresi
on m
as
sencilla
1
2
f (x) =
ex /2 .
2
Es posible transformar una variable aleatoria normal no est
andar en una est
andar
mediante la siguiente operaci
on llamada estandarizaci
on.
Proposici
on 34 Si X N(, 2 ) entonces Z =

X
N(0, 1).

Demostraci
on. Para cualquier x R,
FZ (x) = P (

X
x) = P (X + x) = FX ( + x).

1
2
Por lo tanto fZ (x) = fX ( + x) =
ex /2 .
2

Es tambien f
acil demostrar que el recproco del resultado anterior es v
alido. Com
unmente se usa la letra Z para denotar una variable aleatoria con distribuci
on normal
est
andar. En particular la funci
on (x) denota la funci
on de distribuci
on de una
variable aleatoria normal est
andar, es decir, (x) = P (Z x). Gr
aficamente

(x)

Area
cubierta por la funci
on de distribuci
on (x).

67

Distribuci
on log normal
Si X tiene distribuci
on N(, 2 ) entonces Y = eX tiene una distribuci
on log normal(, 2 )
y su funci
on de densidad es



(ln y )2
1

exp
si y > 0,

2 2
y 2 2
f (y) =

0
si y 0.
La gr
afica de esta funci
on es

f (y)

0.025

y
5

10

15

20

25

Funci
on de densidad log normal(, 2 ) con = 3 y 2 = 2.

Se puede demostrar que


E(Y ) = exp( + 2 /2),
Var(Y ) = exp(2 + 2 2 ) exp(2 + 2 ).
Otras distribuciones continuas de interes se encuentran en el captulo sobre distribuciones muestrales.

2.9.

Ejercicios
Variables aleatorias

106. Demuestre nuevamente que toda funci


on constante X() = c es una variable
aleatoria.
107. Demuestre que la funci
on identidad X() = no es variable aleatoria cuando
= {1, 2, 3} y F = {, {1}, {2, 3}, }.
108. Sea = {1, , 0, 1} y F = {, {0}, {1, 1}, }. Considere la funci
on identidad
X() = . Demuestre que X 2 es variable aleatoria pero X no lo es.

68

109. Demuestre que X es variable aleatoria si y solo si X 1 (, x) F para cada


n
umero real x.
110. Demuestre que X es variable aleatoria si y solo si X 1 [x, ) F para cada
n
umero real x.
111. Demuestre que X es variable aleatoria si y solo si X 1 (x, ) F para cada
n
umero real x.
112. Demuestre que X es variable aleatoria si y solo si X 1 (a, b) F para cada
intervalo (a, b) de R.
113. Demuestre que si X es v.a. entonces |X| tambien lo es. Por el contrario, mediante un contraejemplo demuestre que si |X| es v.a. entonces no necesariamente X lo es.
114. Sea (, F) un espacio medible tal que F = {, , A, Ac } con A . Demuestre
que toda funci
on medible X : R es constante en A y en Ac . Por lo tanto
toda funci
on medible respecto de esta -
algebra toma a los sumo dos valores
distintos.
115. Sea c una constante y X una v.a. Demuestre directamente que las siguientes
funciones tambien son variables aleatorias: cX, X + c, X c, X c.
116. Demuestre directamente que la suma y diferencia de dos variables aleatorias
es variable aleatoria.
117. Sea X una variable aleatoria. Demuestre que la parte entera de X, denotada
por X, es una variable aleatoria discreta, es decir, toma un n
umero numerable de valores.
118. Demuestre que el conjunto de v.a.s definidas sobre un espacio de probabilidad
es un espacio vectorial con las operaciones usuales de suma y producto por
escalares.
119. Demuestre directamente que el producto y cociente (cuando exista) de dos
variables aleatorias es variable aleatoria.
120. Sean X y Y variables aleatorias. Demuestre directamente que tanto X Y
como X Y son variables aleatorias.
121. Sea {Xn : n N} una sucesi
on de v.a.s. Demuestre que, si existen, tanto
sup{Xn } como nf {Xn } son variables aleatorias.
n

122. Demuestre que si X es variable aleatoria entonces tambien lo son X n y 2X 3


5X.
123. Demuestre que X es variable aleatoria si y solo si tanto X + = m
ax{0, X}

como X = mn{0, X} lo son.


124. Sea A . Demuestre que la funci
on indicadora3 1A : R es variable
aleatoria si y solo si el conjunto A es medible.
3

Vease el final del texto para la definici


on y algunas propiedades de la funci
on indicadora.

69

125. Sean A, B . Diga falso o verdadero. Demuestre en cada caso.


a) A, B medibles = 1A + 1B es v.a.
b) 1A + 1B es v.a. = A, B son medibles.
126. Sean A, B subconjuntos disjuntos de y sean a, b dos n
umeros reales distintos.
Demuestre que
a1A + b1B es v.a. A, B son medibles.
Una de estas implicaciones resulta falsa cuando se omite la condici
on de que
los n
umeros a y b son distintos. Cu
al de ellas es?
127. Sean A1 , . . . , An subconjuntos disjuntos de y a1 , . . . , an constantes distintas.
Demuestre que
n
X
i=1

ai 1Ai es v.a. Ai es medible para i = 1, . . . , n.

128. Sean A y B dos eventos, y sean 1A y 1B las correspondientes funciones indicadoras. Directamente de la definici
on demuestre que las funciones 1A + 1B y
1A 1B son variables aleatorias.
129. Sean X y Y dos variables aleatorias. Demuestre que los conjuntos (X = Y ),
(X Y ), (X > Y ) y (X 6= Y ) son eventos. Sugerencia: Proceda como en la
f
ormula (2.1) de la p
agina 42.
130. Sea X una variable aleatoria y g : (R, B(R)) (R, B(R)) una funci
on Borel
medible. Demuestre que g(X) = g X : R es tambien una variable
aleatoria.
Sugerencia: Demuestre que la colecci
on B = {B B(R) : g1 B B(R)}
coincide con B(R) usando los siguientes dos resultados: (1) Dada una funci
on
continua de R en R, la imagen inversa de un conjunto abierto es nuevamente
un conjunto abierto. (2) Todo conjunto abierto de R distinto del vaco puede
expresarse como una uni
on numerable de intervalos abiertos.
131. Sea X una v.a. Demuestre que
a) Y = eX es v.a.
b) Y = sen X es v.a.
c) Y = cos X es v.a.
132. Sea X : R una funci
on. Proporcione un ejemplo en el que X 2 sea variable
aleatoria pero X no lo sea.
133. Sea X : R una funci
on. Proporcione un ejemplo en el que X 2 sea variable
aleatoria pero |X| no lo sea.
134. Sean X1 , . . . , Xn v.a.s. Demuestre que
n

X
= 1
a) X
Xi
n

es v.a.

i=1

70

b)

S2

1 X
2
=
(Xi X)
n1

es v.a.

i=1

135. Sea X una variable aleatoria y sean a < b dos constantes. Demuestre que las
siguientes funciones son variables aleatorias.

X si X < a,
a) Y =
a si X a.

a si X < a,
X si a X b,
b) Y =

b si X > b, .

X si |X| a,
c) Y =
0 si |X| > a.
136. Sea (, F, P ) un espacio de probabilidad y sea X : R una variable
aleatoria. Demuestre que la colecci
on {X 1 B : B B(R)} es una sub algebra de F.
137. Sean (1 , F1 ) y (2 , F2 ) dos espacios medibles y sea X : (1 , F1 ) (2 , F2 )
una funci
on medible. Suponga que P : F1 [0, 1] es una medida de probabilidad. Demuestre que
P X 1 : F2 [0, 1]
es tambien una medida de probabilidad. A la medida P X 1 se le llama
medida de probabilidad inducida por X.

Funci
on de distribuci
on
138. Demuestre que las siguientes funciones son de distribuci
on.
a) F (x) = 1 ex para x > 0.

b) F (x) = 1 (1 + x)ex para x > 0.

si x < 1,
0
c) F (x) =
(x + 1)/2 si x [1, 1],

1
si x > 1.

139. Investigue si las siguientes funciones son de distribuci


on.
a) F (x) = x para x R.
2

b) F (x) = 1 ex para x > 0.

c) F (x) = e1/x para x > 0.


ex
d) F (x) =
para x R.
1 + ex
ex
e) F (x) = x
para x R.
e + ex
140. Sean F (x) y G(x) dos funciones de distribuci
on. Determine si las siguientes
funciones son de distribuci
on.
a) aF (x) + (1 a)G(x) con 0 a 1.
71

b) F (x) + G(x).
c) F (x)G(x).
141. Sea X con funci
on de distribuci
on
(
F (x) =

si x < 2,

4
1 2
x

si x 2.

Grafique y demuestre que F (x) es una funci


on de distribuci
on. Calcule adem
as
P (X 4), P (X > 1), P (4 < X < 6) y P (X = 2).
142. Sea X con funci
on de distribuci
on

0.2

0.5
F (x) =

0.9

si
si
si
si
si

x < 0,
0 x < 1,
1 x < 3,
3 x < 4,
x 4.

Grafique y demuestre que F (x) es una funci


on de distribuci
on. Calcule adem
as
P (X 1), P (X = 1), P (0 < X < 3), P (X = 4) y P (X 3).

143. Sea X con funci


on de distribuci
on F(x). Demuestre nuevamente que
a) lm F (x) = 1.
x

b)

lm F (x) = 0.

c) si x1 x2 entonces F (x1 ) F (x2 ).

d) F (x+) = F (x).

144. Sea X con funci


on de distribuci
on F(x). Demuestre que
a) P (X < x) = F (x).
b) P (X = x) = F (x) F (x).
c) P (X > x) = 1 F (x).

145. Sea X con funci


on de distribuci
on F(x). Demuestre que para x y,
a) P (x < X y) = F (y) F (x).

b) P (x < X < y) = F (y) F (x).

c) P (x X y) = F (y) F (x).

d) P (x X < y) = F (y) F (x).


146. En la escuela rusa de probabilidad se define la funci
on de distribuci
on de una
variable aleatoria X como F (x) = P (X < x). Observe el signo < en lugar
de usado en nuestra definici
on. Demuestre que en este caso la funci
on de
distribuci
on es continua por la izquierda.
147. Sea F (x) una funci
on de distribuci
on continua. Demuestre que para para cualquier entero n 1, las siguientes funciones tambien son de distribuci
on.
72

a) G(x) = [F (x)]n .
b) G(x) = 1 [1 F (x)]n .
148. Sea X con funci
on de distribuci
on F (x). Diga falso o verdadero. Demuestre
en cada caso.
a) F (x) = P (X < x) + P (X = x).
b) 1 F (x) = P (X x).

c) 1 P (X < x) P (X > x) = P (X = x).

149. Encuentre FY (y) en terminos de FX (x) cuando


a) Y = aX + b con a, b constantes.
b) Y = eX .
c) Y = eX .
d) Y = X 2 .
ax{0, X}.
e) Y = X + = m
f ) Y = X = mn{0, X}.

g) Y = |X|.

h) Y = X.

i) Y = sen X.

150. Sea X con funci


on de distribuci
on FX (x) y sean a < b dos constantes. Calcule
la funci
on de distribuci
on de Y en terminos de la funci
on de distribuci
on de
X y muestre gr
aficamente el comportamiento de FY (y) en los puntos a y b.

X si X < a,
a) Y =
a si X a.

a si X < a,
b) Y =
X si a X b,

b si X > b.

X si |X| a,
c) Y =
0 si |X| > a.
151. Sean F (x) y G(x) dos funciones de distribuci
on continuas y estrictamente
crecientes. Demuestre que
a) si F (x) G(x) entonces F 1 (y) G1 (y).

b) si X tiene funci
on de distribuci
on F (x) entonces Y = G1 (F (X)) tiene
funci
on de distribuci
on G(x).
c) si F (x) G(x) entonces existen variables aleatorias X y Y cuyas funciones de distribuci
on son F (x) y G(x) respectivamente, y son tales que
X Y . Sugerencia: Use el inciso anterior.

73

Tipos de variables aleatorias


152. Encuentre la constante c que hace a f (x) una funci
on de densidad.
c
para x = 1, 2, . . .
x(x + 1)
b) f (x) = cex para x = 1, 2, . . .
c
c) f (x) =
para x = 1, 2, . . .
x!
d) f (x) = cx2 para 0 < x < 1.
a) f (x) =

e) f (x) = cxe2x
f ) f (x) =

cx2

para x > 0.

para x > 1.

cex

para x R.
(1 + ex )2
h) f (x) = cx(1 x) para 0 < x < 1.
c
para 0 < x < 1.
i) f (x) =
1 x2
c
j ) f (x) =
para x R.
1 + x2
g) f (x) =

153. Demuestre que las siguientes funciones son de densidad. Encuentre la correspondiente funci
on de distribuci
on y demuestre que satisface las propiedades
de toda funci
on de distribuci
on. Grafique ambas funciones.
a) f (x) = 2x para x [0, 1].
3
b) f (x) = x2 para x [1, 1].
2
1
c) f (x) = 1 x para x [0, 2].
2
2
d) f (x) = 2 x para x [0, m] con m > 0.
m
1
e) f (x) =
para x [0, 1/2].
(1 x)2
1
f ) f (x) = e|x| para x R.
2
154. Demuestre que las siguientes funciones son de distribuci
on. Encuentre la correspondiente funci
on de densidad y compruebe que efectivamente es una funci
on de densidad. Grafique ambas funciones.

0 si x < 0,
a) F (x) =
1 si x 0.

0 si x 0,
b) F (x) =
x si 0 < x < 1,

1 si x 1.
ex
c) F (x) =
.
1 + ex
Z x
1
d) F (x) =
e|u| du.
2
74

155. Sea f (x) una funci


on de densidad y sea c una constante. Demuestre que f (x+c)
es tambien una funcion de densidad.
156. Diga falso o verdadero. Demuestre en cada caso.
a) Toda funci
on de densidad es acotada.
b) Toda funci
on de distribuci
on es acotada.
157. Sea X absolutamente continua y sea Y = aX + b con a y b dos constantes.
Demuestre que si a 6= 0 entonces
fY (y) =

1
fX ((y b)/a).
|a|

Integral de Riemann-Stieltjes
158. Sea F (x) una funci
on de distribuci
on absolutamente continua. Demuestre que
para cualesquiera n
umeros naturales n y m
Z
m
F n (x) dF m (x) =
.
n+m

Esperanza
159. Calcule la esperanza de X cuya funci
on de densidad es
a) f (x) = 1/5 para x = 2, 1, 0, 1, 2.
b) f (x) = e1 /x! para x = 0, 1, 2, . . .
c) f (x) = |x| para 1 < x < 1.

d) f (x) = 12 e|x| para x R.

160. Calcule la esperanza de la variable aleatoria X cuya funci


on de distribuci
on es

0
si x < 1,
F (x) =
1 x
1 2e
si x 1.
161. Sean X y Y con esperanza finita y sea c una constante. Demuestre que
a) E(c) = c.
b) E(cX) = cE(X).
c) E(X + c) = E(X) + c.
d) Si X 0 entonces E(X) 0.

e) Si X Y entonces E(X) E(Y ).


f ) |E(X)| E|X|.

162. Sean X y Y discretas ambas con esperanza finita. Demuestre que E(X + Y ) =
E(X) + E(Y ).
163. Demuestre que no existe la esperanza de X cuando su funci
on de densidad es
75

1
para x = 1, 2, . . .
x(x + 1)
3
b) f (x) = 2 2 para x Z \ {0}.
x
c) f (x) = 1/x2 para x > 1.
1
d) f (x) =
para x R.
(1 + x2 )
a) f (x) =

164. La paradoja de San Petersburgo. Un juego consiste en lanzar una moneda


equilibrada repetidas veces hasta que una de las caras en particular aparece
por primera vez. Si n es el n
umero de lanzamientos realizados entonces un
n
al debe ser el pago inicial justo
jugador recibe 2 unidades monetarias. Cu
para ingresar a este juego?
165. Sea {A1 , A2 , . . .} una colecci
on de eventos que forman una partici
on de tal
que P (Ai ) > 0 para i 1. Sea X una variable aleatoria discreta con esperanza
finita. Para cualquier evento A con probabilidad positiva defina
X
E(X|A) =
xP (X = x|A).
x

Demuestre que
E(X) =

E(X|Ai )P (Ai ).

i=1

166. Demuestre que


a) E(X Y ) E(X) E(Y ) E(X).
b) E(X Y ) E(X) E(Y ) E(X).

167. Sea X > 0 con esperanza finita. Demuestre que E(X)E(1/X) 1.


168. Sea X 0 discreta con valores x1 , . . . , xk . Demuestre que
E(X n+1 )
= m
ax xi ,
n E(X n )
1ik
p
b) lm n E(X n ) = m
ax xi .

a) lm

1ik

169. Sea X discreta con valores 0, 1, . . . y con esperanza finita. Demuestre que
E(X) =

n=1

P (X n).

170. Sea X 0 con esperanza finita y suponga que se cumple la desigualdad P (X


k) pk para k = 0, 1, . . . y alg
un p (0, 1). Demuestre que E(X) 1/(1 p).
171. Sea X 0 con esperanza finita y para cada n
umero natural n defina el evento
An = (n 1 X < n). Demuestre que

(n 1)1An X <

n=1

76

n=1

n1An .

En consecuencia demuestre las desigualdades

n=1

P (X n) E(X) < 1 +

n=1

P (X n).

172. Sea X con funci


on de distribuci
on F (x) y con esperanza finita. Demuestre que
Z 0
Z
[1 F (x)]dx
F (x)dx.
E(X) =
0

Gr
aficamente estas integrales pueden interpretarse como indica la siguiente
figura.
F (x)
1
+

173. Sea X con funci


on de distribuci
on continua F (x) y con esperanza finita .
Demuestre que
Z
Z
F (x)dx =
[1 F (x)]dx.

174. Sea X con funci


on de distribuci
on F (x) y con esperanza finita. Demuestre que
a) lm x[1 F (x)] = 0.
x

b)

lm xF (x) = 0.

175. Demuestre que la condici


on E(X) = 0 no implica que X sea simetrica alrededor de cero. Considere el ejemplo P (X = 1) = 1/2, P (X = 0) = 1/8,
P (X = 1) = 1/4 y P (X = 2) = 1/8. Puede construir un ejemplo de una
distribuci
on continua con esperanza cero pero que no sea simetrica?

Varianza
176. Calcule la varianza de X cuya funci
on de densidad es
a) f (x) = 1/5 para x = 2, 1, 0, 1, 2.
b) f (x) = e1 /x! para x = 0, 1, 2, . . .
c) f (x) = |x| para 1 < x < 1.

d) f (x) = 12 e|x| para x R.

177. Sean X y Y con varianza finita y sea c una constante. Demuestre las siguientes
propiedades de la varianza.
77

a) Var(X) 0.
b) Var(c) = 0.

c) Var(cX) = c2 Var(X).
d) Var(X + c) = Var(X).
e) Var(X) = E(X 2 ) E 2 (X).
178. Sea X con valores en [a, b]. Demuestre que
a) a E(X) b.

b) 0 Var(X) (b a)2 /4.

179. Sea X con varianza finita. Demuestre que la funci


on g(u) = E[(X u)2 ] se
minimiza cuando u = E(X). En consecuencia para cualquier valor de u se
cumple que Var(X) E[(X u)2 ].
180. Sea X con varianza finita y sea c una constante. Demuestre que
E(X c)2 = Var(X) + [E(X) c]2 .
181. Sea X con media y varianza 2 . Demuestre que E|X | . Sugerencia:
Var(|X |) 0.
182. Diga falso o verdadero. Demuestre en cada caso.
a) Si X Y entonces Var(X) Var(Y ).
b) Var(X) E(X 2 ).

Momentos
183. Calcule el n-esimo momento de X cuya funci
on de densidad es
a) f (x) = 1/5 para x = 2, 1, 0, 1, 2.
b) f (x) = e1 /x! para x = 0, 1, 2, . . .
c) f (x) = |x| para 1 < x < 1.

d) f (x) = 12 e|x| para x R.

184. Sea X tal que E|X|n < para alg


un natural n. Demuestre que para cualquier
valor natural de m menor a n se cumple
E|X|m E|X|n .
Esta desigualdad establece que los momentos absolutos anteriores a n existen
cuando el n-esimo existe.
185. Sea A un evento y sea 1A la funci
on indicadora de A. Demuestre que
a) E(1A ) = E(1nA ) = P (A).
b) Var(1A ) = P (A)(1 P (A)) 1/4.
78

186. Sea X 0 con n-esimo momento finito. Demuestre que


Z
E(X n ) = n
xn1 [1 F (x)] dx.
0

187. Sea X discreta con valores 0, 1, . . . y con segundo momento finito. Demuestre
que

X
E(X 2 ) =
(2n 1)P (X n).
n=1

188. Desigualdad de Cauchy-Schwarz. Sean X y Y con segundo momento finito.


Demuestre que
E 2 (XY ) E(X 2 )E(Y 2 ).

Sugerencia: Para cualquier valor real de t, la esperanza de (tX + Y )2 es no


negativa. Desarrolle el cuadrado y encuentre una ecuaci
on cuadr
atica en t.
Que puede decir de su discriminante?

189. Use la desigualdad de Cauchy-Schwarz para demostrar que el espacio L2 (, F, P )


consistente de todas las variables aleatorias X tales que E|X|2 < , es un
espacio vectorial.
190. Demuestre que si X es una variable aleatoria acotada casi seguramente, es
decir, existe k > 0 tal que P (|X| k) = 1, entonces todos los momentos de
X existen.
191. Sea X una variable aleatoria con funci
on de densidad dada por
n

si x > 1,
n+1
x
f (x) =

0
otro caso.

Demuestre que esta funci


on es de densidad para cualquier valor natural del
par
ametro n. Demuestre adem
as que tal variable aleatoria tiene momentos
finitos de orden 1, 2, . . . , n1 pero el n-esimo momento y superiores no existen.

Distribuci
on uniforme discreta
192. Sea X con distribuci
on unif{1, . . . , n}. Demuestre que
a) E(X) = (n + 1)/2.
b) E(X 2 ) = (n + 1)(2n + 1)/6.
c) Var(X) = (n2 1)/12.
193. Se escogen al azar y de manera independiente dos n
umeros a y b dentro del
conjunto {1, . . . , n}. Demuestre que la probabilidad de que el cociente a/b sea
menor o igual a uno es (n + 1)/2n.

79

Distribuci
on Bernoulli
194. Compruebe que la funci
on de densidad de la distribuci
on Ber(p) efectivamente
lo es. Obtenga adem
as la correspondiente funci
on de distribuci
on. Grafique
ambas funciones.
195. Sea X con distribucion Ber(p). Demuestre que
a) E(X) = p.
b) E(X n ) = p para n 1.
c) Var(X) = p(1 p).

Distribuci
on binomial
196. Use el teorema del binomio para comprobar que la funci
on de densidad de la
distribuci
on bin(n, p) efectivamente lo es.
197. Sea X con distribucion bin(n, p). Demuestre que
a) E(X) = np.
b) E(X 2 ) = np(1 p + np).
c) Var(X) = np(1 p).

d) E(X np)3 = np(1 p)(1 2p).

e) E(X np)4 = 3n2 p2 (1 p)2 + np(1 p)(1 6(1 p)p).

198. Sea X con distribuci


on bin(n, p). Demuestre que Y = n X tiene distribucion
bin(n, 1 p).
199. Sea X con distribucion bin(n, p). Demuestre que
nx
p

P (X = x).
1p x+1
b) P (X = x 1)P (X = x + 1) P 2 (X = x).

a) P (X = x + 1) =

200. Se lanza una moneda equilibrada 6 veces. Calcule la probabilidad de que cada
cara caiga exactamente 3 veces.
201. Se lanza una moneda equilibrada 2n veces. Calcule la probabilidad de que
ambas caras caigan el mismo n
umero de veces.

Distribuci
on geom
etrica
202. Compruebe que la funci
on de densidad de la distribuci
on geo(p) efectivamente
lo es.
203. Sea X con distribucion geo(p). Demuestre que
a) E(X) = (1 p)/p.

b) Var(X) = (1 p)/p2 .
80

204. Sea X con distribucion geo(p). Demuestre que P (X n) = (1 p)2 . Ahora


use este resultado y la f
ormula del ejercicio 169 en la p
agina 76 para demostrar
que E(X) = (1 p)/p.
205. Perdida de memoria de la distribuci
on geometrica. Sea X con distribuci
on
geo(p). Demuestre que
P (X x + y | X x) = P (X y).
206. Sea X una variable aleatoria discreta con valores en {0, 1, . . .} y tal que cumple
la igualdad
P (X x + y | X x) = P (X y).
Demuestre que existe un n
umero p (0, 1) tal que X tiene distribuci
on geo(p).

Distribuci
on Poisson
207. Compruebe que la funci
on de densidad de la distribuci
on Poisson() efectivamente lo es.
208. Sea X con distribuci
on Poisson(). Demuestre que
a) E(X) = .
b) E(X 2 ) = ( + 1).
c) Var(X) = .
d) E(X 3 ) = E(X + 1)2 .
209. Sean X y Y independientes ambas con distribuci
on Poisson con par
ametros 1
y 2 respectivamente. Demuestre que X+Y tiene distribuci
on Poisson(1 +2 ).
210. Sea X con distribucion Poisson(). Demuestre que

P (X = x).
x+1
b) P (X = x 1)P (X = x + 1) P 2 (X = x).

a) P (X = x + 1) =

211. Sea X con distribucion Poisson(). Demuestre que


1
a) P (X {1, 3, 5, . . .}) = (1 e2 ).
2
1
b) P (X {0, 2, 4, . . .}) = (1 + e2 ).
2
212. Convergencia de la distribuci
on binomial a la distribuci
on Poisson. Para cada
entero positivo n, sea Xn con distribuci
on bin(n, /n) con > 0. Demuestre
que para k = 0, 1, . . .
k
lm P (Xn = k) = e
n
k!

81

Distribuci
on binomial negativa
213. Compruebe que la funci
on de densidad de la distribuci
on bin neg(r, p) efectivamente lo es.
214. Sea X con distribucion bin neg(r, p). Demuestre que
a) E(X) = r(1 p)/p.

b) Var(X) = r(1 p)/p2 .

Distribuci
on hipergeom
etrica
215. Compruebe que la funci
on de densidad de la distribuci
on hipergeo(N, K, n)
efectivamente lo es.
216. Sea X con distribuci
on hipergeo(N, K, n). Demuestre que cuando N, K y N
K tienden a infinito de tal forma que K/N p y (N K)/N (1 p)
entonces


n
P (X = x)
px (1 p)nx .
x

Distribuci
on uniforme continua
217. Compruebe que la funci
on de densidad de la distribuci
on unif(a, b) efectivamente lo es. Calcule adem
as la correspondiente funci
on de distribuci
on. Grafique ambas funciones.
218. Sea X con distribucion unif(a, b). Demuestre que
a) E(X) = (a + b)/2.
bn+1 an+1
b) E(X n ) =
.
(n + 1)(b a)
c) Var(X) = (b a)2 /12.
219. Sea X con distribuci
on unif(0, 1). Demuestre que E(X n ) = 1/(n + 1).
220. Sea X con distribucion unif(1, 1). Demuestre que
1

si n es par,

n+1
n
E(X ) =

0
si n es impar.

221. Sea X con distribuci


on unif(0, 1). Obtenga la distribuci
on de
a) Y = 10X 5.

b) Y = 4X(1 X).

222. Sea X con distribuci


on unif(0, 1) y sea 0 < p < 1. Demuestre que la variable
aleatoria Y = ln X/ ln(1 p) tiene distribuci
on geo(p). La expresi
on x
denota la parte entera de x.
82

Distribuci
on exponencial
223. Compruebe que la funci
on de densidad de la distribuci
on exp() efectivamente
lo es.
224. Sea X con distribuci
on exp(). Demuestre que
a) F (x) = 1 ex para x > 0.

b) F (x + y) F (y) = F (x)[1 F (y)] para x, y > 0.

225. Sea X con distribuci


on exp(). Demuestre que E(X) = 1/ y Var(X) = 1/2 .
226. Perdida de memoria de la distribuci
on exponencial. Sea X con distribucion
exp(). Demuestre que
P (X x + y | X x) = P (X y).
La distribuci
on exponencial es la u
nica distribuci
on continua que satisface esta
propiedad.
227. Sea X una variable aleatoria con funci
on de distribuci
on F (x) continua, estrictamente creciente y tal que 0 < F (x) < 1. Demuestre que la variable aleatoria
Y = ln F (X) tiene distribuci
on exponencial con par
ametro = 1.
228. Sea a > 0. Demuestre que si X se distribuye exp() entonces aX se distribute
exp(/a).
229. Se dice que X tiene distribuci
on exponencial bilateral (o doble) con par
ametro
> 0 si su funci
on de densidad es, para x en R,
1
f (x) = e|x| .
2
Demuestre que E(X) = 0 y Var(X) = 2/2 .

Distribuci
on gama
230. Compruebe que la funci
on de densidad de la distribuci
on gama(n, ) efectivamente lo es. Verifique adem
as que esta distribuci
on se reduce a la distribucion
exp() cuando n = 1.
231. Sea a > 0. Demuestre que si X se distribuye gama(n, ) entonces aX se
distribute gama(n, /a).
232. Sea X con distribuci
on gama(n, ). Demuestre que la funci
on de distribucion
de X es, para x > 0,
n1
X
(x)j
F (x) = 1
ex
.
j!
j=0

233. Sea X con distribucion gama(n, ). Demuestre que


a) E(X) = n/.
83

b) E(X m ) =

(m + n)
para m = 1, 2, . . .
m (n)

c) Var(X) = n/2 .
234. Demuestre las siguientes propiedades de la funci
on gama.
a) (n + 1) = n(n).
b) (n + 1) = n! para n entero.
c) (2) = (1) = 1.

d) (1/2) = .
1 3 5 (2n 1)
e) (n + 1/2) =
para n entero.
2n

Distribuci
on beta
235. Compruebe que la funci
on de densidad de la distribuci
on beta(a, b) efectivamente lo es. Verifique adem
as que esta distribuci
on se reduce a la distribuci
on
unif(0, 1) cuando a = b = 1.
236. Sea X con distribucion beta(a, b). Demuestre que
a
.
a+b
B(a + n, b)
b) E(X n ) =
.
B(a, b)
ab
.
c) Var(X) =
(a + b + 1)(a + b)2

a) E(X) =

237. Sea X con distribucion beta(a, b). Demuestre que




E(X)(1 E(X))
a) a = E(X)
1 .
Var(X)


E(X)(1 E(X))
b) b = (1 E(X))
1 .
Var(X)
E(X)(1 E(X))
c) a + b =
1.
Var(X)
238. Demuestre las siguientes propiedades de la funci
on beta.
a) B(a, b) = B(b, a).
b) B(a, b) = (a)(b)/(a + b).
c) B(a, 1) = 1/a.
d) B(1, b) = 1/b.
a
B(a, b + 1).
b
a
f ) B(a + 1, b) =
B(a, b).
a+b
b
g) B(a, b + 1) =
B(a, b).
a+b
e) B(a + 1, b) =

84

h) B(1/2, 1/2) = .
239. Sea X con distribuci
on beta(1/2, 1/2). En este caso se dice que X tiene una
distribuci
on arcoseno.
a) Calcule y grafique f (x).
b) Demuestre directamente que f (x) es una funci
on de densidad.
c) Demuestre directamente que E(X) = 1/2 y Var(X) = 1/8.
240. Sea X con distribuci
on beta(a, b). Demuestre que para a > 0 y b = 1,

0 si x 0,
F (x) =
xa si 0 < x < 1,

1 si x 1.
241. Sea X con distribuci
on beta(a, b). Demuestre que para a = 1 y b > 0,

si x 0,
0
F (x) =
1 (1 x)b si 0 < x < 1,

1
si x 1.

242. Demuestre que X tiene distribuci


on beta(a, b) si y solo si 1 X tiene distribuci
on beta(b, a).

Distribuci
on normal
243. Demuestre que la funci
on de densidad de la distribuci
on N(, 2 )
a) es efectivamente una funci
on de densidad.
b) es simetrica respecto de x = .
c) alcanza su m
aximo en x = .
d) tiene puntos de inflexi
on en x = .
244. Sea X con distribuci
on N(, 2 ). Demuestre que E(X) = y Var(X) = 2 .
245. Sea X con distribucion N(, 2 ). Demuestre que

0
n
E|X | =
1 3 5 (n 1) n

si n es impar,
si n es par.

246. Demuestre que X tiene distribuci


on N(, 2 ) si y solo si Z = (X )/ tiene
distribuci
on N(0, 1).
247. Sea X con distribucion normal est
andar. Demuestre que

si n es impar,
0
n!
E(X n ) =
si n es par.
n/2
2 (n/2)!
85

248. Sea X con distribuci


on N(, 2 ). Demuestre que Y = aX + b, con a 6= 0, tiene
una distribuci
on normal. Encuentre los par
ametros correspondientes.
249. Sea X con distribuci
on N(, 2 ). Demuestre que la variable aleatoria X tambien tiene una distribuci
on normal. Encuentre los par
ametros correspondientes.
250. Sean X y Y independientes ambas con distribuci
on normal est
andar. Demuestre que W = aX + bY + c tiene distribuci
on normal cuando ab 6= 0. Encuentre
E(W ) y Var(W ).
251. Sea X con distribucion normal est
andar. Demuestre que X 2 tiene una distri2
buci
on
(1). Recprocamente, ser
a cierto que si Y tiene distribuci
on 2 (1)
entonces Y tiene distribuci
on N(0, 1)?
252. Sea X con distribuci
on normal est
andar. Encuentre la funci
on de densidad de
la variable aleatoria |X|.
253. El cociente de Mills. Sea (x) la funci
on de densidad de la distribuci
on normal
est
andar y sea (x) la correspondiente funci
on de distribuci
on. Demuestre que
a) (x) + x(x) = 0.
1
1
1 (x)
1
1
3
b)
3 <
< 3+ 5
x x
(x)
x x
x

para x > 0.

Distribuci
on log normal
254. Demuestre que la funci
on de densidad de una distribuci
on log normal(, 2 )
efectivamente lo es.
255. Sea X con distribucion log normal(, 2 ). Demuestre que
a) E(X) = exp( + 2 /2).
b) Var(X) = exp(2 + 2 2 ) exp(2 + 2 ).
c) E(ln X) = .

d) Var(ln X) = 2 .

86

Captulo 3

Vectores aleatorios
En este captulo se extiende el concepto de variable aleatoria con valores reales
as algunos conceptos
a variables aleatorias con valores en Rn . Se estudian adem
importantes relacionados. Recuerde que en este captulo y a lo largo del texto se
tiene siempre como elemento base un espacio de probabilidad (, F, P ).

3.1.

Vectores aleatorios

Definici
on 22 (Vector aleatorio) Un vector aleatorio es una funci
on X :
Rn tal que para cualquier conjunto B en B(Rn ), se cumple que X 1 B es un elemento de F.

Todo vector aleatorio se puede representar en la forma X = (X1 , . . . , Xn ) en donde


cada coordenada es una funci
on de en R.

(X1 , . . . , Xn )

(X1 (), . . . , Xn ())


Rn

Un vector aleatorio es una funci


on.

87

Se demuestra a continuaci
on que la condici
on que aparece en la definici
on anterior
es equivalente a solicitar que cada coordenada del vector sea una variable aleatoria.

Proposici
on 35 Una funci
on X = (X1 , . . . , Xn ) : Rn es un vector aleatorio
si y solo si cada coordenada es una variable aleatoria.

Demostraci
on. Sea (X1 , . . . , Xn ) un vector aleatorio. Entonces la imagen inversa
de cualquier conjunto de Borel de Rn es un elemento de la -
algebra del espacio de
probabilidad. En particular, la imagen inversa del conjunto B pertenece
a F para cualquier Boreliano B de R. Pero esta imagen inversa es simplemente
X11 B. Esto demuestra que X1 es variable aleatoria. De manera an
aloga se procede
con las otras coordenadas del vector. Suponga ahora que cada coordenada de una
funci
on (X1 , . . . , Xn ) : Rn es una variable aleatoria. Considere la coleccion
B = {B B(Rn ) : (X1 , . . . , Xn )1 B F}. Como cada coordenada es una variable
aleatoria, los conjuntos de Borel de Rn de la forma B1 Bn , en donde cada Bi
es un Boreliano de R, es un elemento de la colecci
on B. Entonces
B(R) B(R) B B(Rn ).
Es f
acil demostrar que la colecci
on B es una -
algebra. Asi que
(B(R) B(R)) B B(Rn ).
Pero ambos extremos de esta ecuaci
on coinciden. De modo que B = B(Rn ) y por lo
tanto la funci
on (X1 , . . . , Xn ) es un vector aleatorio.

En consecuencia es correcto definir un vector aleatorio simplemente como un vector
de variables aleatorias. Para simplificar la escritura donde sea posible se usan u
nicamente vectores aleatorios bidimensionales, esto es, de la forma (X, Y ). En la mayora
de los casos las definiciones y resultados son f
acilmente extendidos a dimensiones
mayores.
Se dice que el vector (X, Y ) es discreto si cada coordenada es una variable aleatoria
discreta y es continuo en caso de que cada coordenada lo sea.

3.2.

Distribuci
on conjunta

A menudo es necesario considerar probabilidades de eventos que involucran a dos o


mas variables aleatorias a un mismo tiempo. El concepto fundamental en este caso
es el de funci
on de distribuci
on conjunta que se define a continuaci
on.

88

Definici
on 23 (Funci
on de distribuci
on conjunta) La funci
on de distribuci
on de un vector (X, Y ), denotada por F (x, y) : R2 [0, 1], se define como
sigue
F (x, y) = P (X x, Y y).

El n
umero F (x, y) es entonces la probabilidad de que el vector aleatorio tome alg
un
valor en la regi
on (, x] (, y], la cual se muestra a continuaci
on.

(x, y)

El n
umero F (x, y) = P (X x, Y y) es
la probabilidad asociada a la region sombreada.

En palabras, la funci
on F (x, y) es la probabilidad de que X sea menor o igual a x y
al mismo tiempo Y sea menor o igual a y. Esto es simplemente la probabilidad del
evento (X x) (Y y). A la funci
on F (x, y) se le conoce tambien como funci
on
de distribuci
on bivariada de X y Y . Cuando sea necesario especificarlo se escribe
FX,Y (x, y) en lugar de F (x, y), y es evidente la forma de extender la definicion
para el caso de un vector aleatorio de m
as de dos coordenadas. Las funciones de
distribuci
on conjunta satisfacen propiedades semejantes al caso unidimensional. Se
estudian a continuaci
on algunas de ellas.
Proposici
on 36 La distribuci
on conjunta F (x, y) satisface las siguientes propiedades.
1.
2.

lm F (x, y) = 1. (ambas variables)

x,y

lm

x,y

F (x, y) = 0. (alguna de las variables)

3. F (x, y) es no decreciente en cada variable.


4. F (x, y) es continua por la derecha en cada variable.
89

5. Si a1 < b1 y a2 < b2 entonces


F (b1 , b2 ) F (a1 , b2 ) F (b1 , a2 ) + F (a1 , a2 ) 0.
La demostraci
on de las propiedades (1)-(4) es completamente an
aloga al caso unidimensional y por tanto la omitiremos. Respecto a la propiedad (5) observe que la
expresi
on
F (b1 , b2 ) F (a1 , b2 ) F (b1 , a2 ) + F (a1 , a2 )

corresponde a la probabilidad del evento (a1 < X b1 , a2 < Y b2 ). De modo


que (5) se traduce simplemente en solicitar que la probabilidad de que (X, Y ) tome
valores en el rect
angulo (a1 , b1 ] (a2 , b2 ] sea no negativa. Este rect
angulo se muestra
en la siguiente figura.

b2

a2

a1

b1

La probabilidad asociada al rectangulo (a1 , b1 ] (a2 , b2 ] es


P (a1 < X b1 , a2 < Y b2 ) = F (b1 , b2 ) F (a1 , b2 ) F (b1 , a2 ) + F (a1 , a2 ).

A diferencia del caso unidimensional, las propiedades (1) a (4) no son suficientes
para asegurar que una funci
on F (x, y) asigna probabilidad no negativa a cualquier
rect
angulo. Por ejemplo el Ejercicio 258 en la p
agina 107 muestra una situacion
en donde esa condici
on falla. Por tanto en el caso de dimensi
on dos y superior, es
necesario asegurarse de que tal propiedad se cumple.

Definici
on 24 (Funci
on de distribuci
on conjunta) Una funci
on cualquiera
F (x, y) : R2 [0, 1], no necesariamente definida en terminos de un vector aleatorio, es una funci
on de distribuci
on conjunta si cumple con las cinco propiedades
enunciadas en la proposici
on anterior.

on de
Para tres dimensiones se dice que F (x1 , x2 , x3 ) : R3 [0, 1] es una funci
distribuci
on si cumple las primeras cuatro propiedades anteriores y la quinta se
90

reemplaza por la siguiente condici


on. Para cualesquiera n
umeros reales a1 < b1 ,
a2 < b2 y a3 < b3 ,
F (b1 , b2 , b3 ) F (a1 , b2 , b3 ) F (b1 , a2 , b3 ) F (b1 , b2 , a3 )
+F (a1 , a2 , b3 ) + F (a1 , b2 , a3 ) + F (b1 , a2 , a3 )
F (a1 , a2 , a3 ) 0.
Se puede demostrar que el lado izquierdo de esta desigualdad corresponde a la
probabilidad del evento (a1 < X1 b1 , a2 < X2 b2 , a3 < X3 b3 ) y entonces el
requisito es que naturalmente este n
umero sea no negativo.
z
b3

a3

a2
a1

b2

b1
x
Regi
on (a1 , b1 ] (a2 , b2 ] (a3 , b3 ].

M
as generalmente, una funci
on F (x1 , . . . , xn ) : Rn [0, 1] es una funci
on de distribuci
on si cumple las primeras cuatro propiedades anteriores y adicionalmente para
cualesquiera n
umeros reales a1 < b1 , a2 < b2 , . . ., an < bn ,
X
(1)#a F (x1 , . . . , xn ) 0,
xi {ai ,bi }

en donde #a es el n
umero de veces que alguna de las variables xi toma el valor ai en
la evaluaci
on de la funci
on F . Nuevamente la suma corresponde a la probabilidad
on requiere simplemente
del evento (a1 < X1 b1 , . . . , an < Xn bn ), y la condici
que este n
umero sea no negativo. Finalmente enunciamos un resultado que establece
la importancia de la funci
on de distribuci
on y cuya demostraci
on es an
aloga al caso
unidimensional.

Proposici
on 37 Sea F (x1 , . . . , xn ) : Rn [0, 1] una funci
on de distribuci
on.
Entonces existe un espacio de probabilidad y un vector aleatorio cuya funci
on de
distribuci
on es F (x1 , . . . , xn ).

91

3.3.

Densidad conjunta

Como en el caso unidimensional, algunos vectores tienen asociada otra funci


on llamada de probabilidad y la cual se define a continuaci
on.

Definici
on 25 (Funci
on de probabilidad conjunta) La funci
on de probabilidad de un vector discreto (X, Y ) es la funci
on f (x, y) : R2 [0, ) dada por
f (x, y) = P (X = x, Y = y).

Es evidente que la funci


on de probabilidad de un vector discreto es una funci
on no
negativa y tal que
XX
f (x, y) = 1.
x

Recprocamente, toda funci


on no negativa f (x, y) : R2 [0, ) que sea estrictamente positiva u
nicamente en un subconjunto discreto de R2 y que sume uno, se
llama funci
on de probabilidad conjunta. La definici
on de la funci
on de probabilidad
para el caso discreto multidimensional es evidente.

Ejemplo. La funcion f (x, y) = 1/9 para x, y = 1, 2, 3, es una funcion de probabilidad pues es no negativa y suma uno. La gr
afica se muestra a continuaci
on.
f (x, y)
1/9

b
b

x
Funci
on de probabilidad f (x, y) = 1/9 para x, y = 1, 2, 3.

Ejemplo. La funcion definida por f (x, y) = (1/2)x+y para x, y N e identicamente


92

cero fuera de este conjunto discreto, es una funci


on de probabilidad bivariada pues
es no negativa y suma uno. En efecto

f (x, y) =

x,y=1

x,y=1

1
2x+y

X
1 2
=(
) = 1.
2x
x=1

Para el caso de vectores continuos se tiene la siguiente definici


on.

Definici
on 26 (Funci
on de densidad conjunta) Sea (X, Y ) un vector continuo con funci
on de distribuci
on F (x, y). Se dice que (X, Y ) es absolutamente
continuo si existe una funci
on no negativa e integrable f (x, y) : R2 R tal que
para todo (x, y) en R2 se cumple la igualdad
Z x Z y
F (x, y) =
f (u, v) dv du.

A la funci
on f (x, y) se le denota por fX,Y (x, y) y se le llama funci
on de densidad
conjunta de X y Y .

Es claro que la funci


on de densidad conjunta f (x, y) de un vector absolutamente
continuo es no negativa y cumple la condici
on
Z Z
f (x, y) dx dy = 1.

Recprocamente, toda funci


on no negativa f : R2 [0, ) que integre uno se llama
funci
on de densidad conjunta. En particular, cuando f (x, y) es continua,
f (x, y) =

2
F (x, y).
yx

Ejemplo. La funcion f (x, y) = 1/4 para x, y [0, 2], es una funcion de densidad
pues es no negativa e integra uno. La gr
afica se muestra a continuaci
on.

93

f (x, y)

1/4

b
b
b

x
Funci
on de densidad f (x, y) = 1/4 para x, y [0, 2].

3.4.

Distribuci
on marginal

Dada la funci
on de distribuci
on conjunta F (x, y) de un vector aleatorio, es posible
obtener la funci
on de distribuci
on de cada variable aleatoria por separado mediante
el siguiente procedimiento.

Definici
on 27 (Funci
on de distribuci
on marginal) Sea (X, Y ) un vector con
funci
on de distribuci
on F (x, y). A la funci
on
F (x) = lm F (x, y)
y

se le conoce como la funci


on de distribuci
on marginal de X. An
alogamente se
define la funci
on de distribuci
on marginal de Y como
F (y) = lm F (x, y).
x

No es difcil verificar que las funciones de distribuci


on marginales son efectivamente
funciones de distribuci
on univariadas. En el caso de que se tenga una funci
on de
densidad conjunta, se pueden obtener las funciones de densidad individuales como
indica la siguiente definici
on.

94

Definici
on 28 (Funci
on de densidad marginal) Sea (X, Y ) un vector absolutamente continuo con funci
on de densidad f (x, y). A la funci
on
Z
f (x, y) dy
f (x) =

se le conoce como la funci


on de densidad marginal de X. An
alogamente se define
la funci
on de densidad marginal de Y como
Z
f (y) =
f (x, y) dx.

Si (X, Y ) es un vector discreto la integral se reemplaza por una suma.

Tampoco es difcil comprobar que las funciones de densidad marginales son efectivamente funciones de densidad univariadas. Las dos definiciones anteriores pueden
extenderse de manera evidente cuando se tenga un vector aleatorio de cualquier
dimensi
on finita.

3.5.

Distribuci
on condicional

La siguiente definici
on es una extensi
on del concepto elemental de probabilidad
condicional de eventos.

Definici
on 29 (Funci
on de densidad condicional) Sea (X, Y ) un vector con
funci
on de densidad fX,Y (x, y) y sea y tal que fY (y) 6= 0. A la funci
on
x 7 fX|Y (x|y) =

fX,Y (x, y)
fY (y)

se le conoce como la funci


on de densidad condicional de X dado que Y toma el
valor y.

No es difcil comprobar que la funci


on x 7 fX|Y (x|y) es efectivamente una funcion
de densidad, tanto en el caso discreto como en el continuo. Observe que el valor y
permanece fijo y la funci
on es vista como una funci
on de la variable real x. Se pueden
definir tambien funciones de distribuci
on condicionales de la siguiente forma.

95

Definici
on 30 (Funci
on de distribuci
on condicional) Sea (X, Y ) un vector
aleatorio absolutamente continuo con funci
on de densidad fX,Y (x, y) y sea y tal
que fY (y) 6= 0. A la funci
on
Z x
x 7 FX|Y (x|y) =
fX|Y (u|y) du

se le conoce como la funci


on de distribuci
on condicional de X dado que Y toma
el valor y. Cuando el vector aleatorio (X, Y ) es discreto la integral se substituye
por la suma correspondiente.

Nuevamente resulta que la funci


on x 7 FX|Y (x|y) es efectivamente una funci
on de
distribuci
on. En el caso absolutamente continuo tenemos la relaci
on
fX|Y (x|y) =

3.6.

F
(x|y).
x X|Y

Independencia de variables aleatorias

Podemos ahora definir el importante concepto de independencia de variables aleatorias. Para ello usaremos la siempre existente funci
on de distribuci
on.

Definici
on 31 (Independencia) Se dice que X y Y son independientes si para
cada (x, y) en R2 se cumple la igualdad
FX,Y (x, y) = FX (x)FY (y).

Esta es una extensi


on de la definici
on de independencia de dos eventos A y B,
P (A B) = P (A)P (B). Cuando la funci
on de densidad conjunta fX,Y (x, y) existe
entonces la condici
on anterior es equivalente a la expresi
on
fX,Y (x, y) = fX (x)fY (y).
El concepto de independencia puede ser extendido claramente al caso de varias variables aleatorias de la forma siguiente. Se dice que X1 , X2 , . . . , Xn son independientes
si para cualquier (x1 , x2 , . . . , xn ) en Rn se cumple
FX1 ,X2 ,...,Xn (x1 , x2 , . . . , xn ) = FX1 (x1 )FX2 (x2 ) FXn (xn ).
M
as a
un, una sucesi
on infinita de variables aleatorias es independiente si cualquier
subconjunto finito de ella lo es.
96

Ejemplo. Sea (X, Y ) un vector aleatorio con funcion de densidad f (x, y) = 4xy
para 0 x, y 1. La gr
afica de esta funci
on aparece en la siguiente figura.
f (x, y)
4

1
x
Funci
on de densidad f (x, y) = 4xy para 0 x, y 1.

La funci
on de densidad marginal de X se calcula como sigue. Para 0 x 1,
Z
Z 1
fX (x) =
f (x, y)dy =
4xydy = 2x.

Por lo tanto fX (x) = 2x para 0 x 1. An


alogamente fY (y) = 2y para 0 y
1. En consecuencia X y Y son independientes pues para cada par (x, y) se cumple

fX,Y (x, y) = fX (x)fY (y).

3.7.

Esperanza de una funci


on
de un vector aleatorio

A menudo es necesario calcular la esperanza de una funci


on de un vector aleatorio.
Para ello se tiene la siguiente definici
on enunciada para el caso de dos dimensiones
pero f
acilmente extendible a dimensiones superiores.

Definici
on 32 (Esperanza) Sea (X, Y ) un vector aleatorio y sea : R2 R
una funci
on Borel medible. Entonces se define
Z
E[(X, Y )] =
(x, y)dFX,Y (x, y).
(3.1)
R2

97

Cuando el vector es discreto, la f


ormula (3.1) se reduce a
X
E[(X, Y )] =
(x, y)P (X = x, Y = y),
x,y

en donde la suma se efect


ua sobre todos los posibles valores (x, y) de vector. En el
caso absolutamente continuo, la expresi
on (3.1) se escribe
Z
E[(X, Y )] =
(x, y)fX,Y (x, y)dxdy.
R2

Proposici
on 38 E(X + Y ) = E(X) + E(Y ).
Demostraci
on. Sean (x, y) = x + y, 1 (x, y) = x y 2 (x, y) = y. Entonces
E(X + Y ) = E((X, Y ))
Z
=
(x + y)dFX,Y (x, y)
2
ZR
Z
=
xdFX,Y (x, y) +
xdFX,Y (x, y)
R2

R2

= E(1 (X, Y )) + E(2 (X, Y ))


= E(X) + E(Y ).

Proposici
on 39 Sean X y Y independientes y sean g y h dos funciones Borel
medibles tales que g(X) y h(Y ) tienen esperanza finita. Entonces
E[g(X)h(Y )] = E[g(X)]E[h(Y )].
En particular cuando X y Y son independientes, E(XY ) = E(X)E(Y ).

Demostraci
on.
E[g(X)h(Y )] =
=

ZR

R2

g(x)h(y)dFX,Y (x, y)
g(x)h(y)dFX (x)dFY (y)

= E[g(X)]E[h(Y )].


98

Es ineteresante observar que el recproco de la afirmaci


on anterior es falso. Por
ejemplo considere el vector aleatorio discreto (X, Y ) con funci
on de probabilidad
x\y
1
0
1

1
1/5
0
1/5

0
0
1/5
0

1
1/5
0
1/5

Entonces es sencillo verificar que E(XY ) = E(X)E(Y ) = 0, sin embargo X y Y


no son independientes pues P (X = 0, Y = 0) = 1/5 mientras que P (X = 0)P (Y =
0) = 1/25. Otros ejemplos pueden encontrarse en el Ejercicio 320.

3.8.

Covarianza

En esta secci
on se define y estudia la covarianza entre dos variables aleatorias. Una
interpretaci
on de este n
umero, ligeramente modificado, ser
a dada en la siguiente
secci
on.

Definici
on 33 (Covarianza) La covarianza de X y Y , denotada por Cov(X, Y ),
es el n
umero
Cov(X, Y ) = E [(X E(X))(Y E(Y ))] .

Para que la definici


on anterior tenga sentido es necesario suponer que las esperanzas
E(X), E(Y ) y E(XY ) son finitas. Se revisan a continuaci
on algunas propiedades
de la covarianza.

99

Proposici
on 40 La covarianza satisface las siguientes propiedades.
1. Cov(X, Y ) = E(XY ) E(X)E(Y ).
2. Cov(X, Y ) = Cov(Y, X).
3. Cov(X, X) = Var(X).
4. Cov(a, Y ) = 0,

a constante.

5. Cov(aX, Y ) = aCov(X, Y ),

a constante.

6. Cov(X1 + X2 , Y ) = Cov(X1 , Y ) + Cov(X2 , Y ).


7. X,Y independientes = Cov(X, Y ) = 0.
8. Cov(X, Y ) = 0 =
6
X,Y independientes.

Demostraci
on. Para probar (1) se usa la propiedad lineal de la esperanza,
Cov(X, Y ) = E [(X E(X))(Y E(Y ))]

= E [XY Y E(X) XE(Y ) + E(X)E(Y )]


= E(XY ) E(X)E(Y ).

Las propiedades (2), (3) y (4) se siguen directamente de la definici


on, lo mismo
que (5) y (6) al hacer uso de las propiedades de linealidad de la esperanza. La
proposici
on (7) se obtiene f
acilmente de (1) pues E(XY ) = E(X)E(Y ) cuando X y
Y son independientes. Finalmente damos un ejemplo para (8). Sea (X, Y ) un vector
aleatorio discreto con funci
on de densidad

1/8 si (x, y) {(1, 1), (1, 1), (1, 1), (1, 1)},
1/2 si (x, y) = (0, 0),
fX,Y (x, y) =

0
otro caso.
Entonces X y Y tienen

1/4
fX (x) =
1/2

identicas densidades marginales,

si x {1, 1},
1/4 si y {1, 1},
si x = 0,
fY (y) =
1/2 si y = 0,

otro caso.
0
otro caso.

Puede entonces comprobarse que Cov(X, Y ) = E(XY ) E(X)E(Y ) = 0. Sin embargo X y Y no son independientes pues en particular P (X = 0, Y = 0) = 1/2,
mientras que P (X = 0)P (Y = 0) = 1/4.


3.9.

Coeficiente de correlaci
on

El coeficiente de correlaci
on de dos variables aleatorias es un n
umero que mide el
grado de dependencia lineal que existe entre ellas. Su definici
on es la siguiente.
100

Definici
on 34 (Coeficiente de correlaci
on) El coeficiente de correlaci
on de
las variables aleatorias X y Y , denotado por (X, Y ), es el n
umero
(X, Y ) = p

Cov(X, Y )
Var(X) Var(Y )

Naturalmente en esta definici


on se necesita suponer que las varianzas son estrictamente positivas y finitas. La interpretaci
on dada al coeficiente de correlaci
on se
justifica a partir de los siguientes resultados.

Proposici
on 41 La coeficiente de correlaci
on satisface las siguientes propiedades.
1. Si X y Y son independientes entonces (X, Y ) = 0.
El recproco es falso excepto en el caso normal.
2. 1 (X, Y ) 1.
3. |(X, Y )| = 1 si y solo si existen constantes a y b tales que, con probabilidad
uno, Y = aX + b con a > 0 si (X, Y ) = 1 y a < 0 si (X, Y ) = 1.

Demostraci
on. (1) Si X y Y son independientes entonces Cov(X, Y ) = 0 y por lo
tanto (X, Y ) = 0. (2) Suponga primero que X y Y son tales que E(X) = E(Y ) = 0,
y Var(X) = Var(Y ) = 1. Para cualquier valor de ,
0 Var(X + Y )


= E (X + Y )2 E 2 [X + Y ]
= 1 + 2E(XY ) + 2 .

El caso = 1 produce el resultado E(XY ) 1 mientras que para = 1 se


obtiene E(XY ) 1. Es decir, 1 E(XY ) 1. Ahora se aplica este resultado a
las variables aleatorias
X X
Y Y
y
,
X
Y
que evidentemente son centradas y con varianza unitaria. Entonces



X X
Y Y
1 E
1.
X
Y
Esto es precisamente lo enunciado en (2) pues el termino de enmedio es (X, Y ).
Ahora se demuestra (3). Si X y Y son tales que Y = aX + b con a 6= 0 y b constantes
entonces
Cov(X, aX + b)
a
(X, Y ) = p
=
.
|a|
Var(X)Var(aX + b)
101

Por lo tanto (X, Y ) = 1 cuando a > 0 y (X, Y ) = 1 cuando a < 0. Inversamente,


suponga que X y Y son tales que |(X, Y )| = 1. Defina
U=

X X
X

V =

Y Y
.
Y

Entonces claramente E(U ) = E(V ) = 0 y Var(U ) = Var(V ) = 1. Por lo tanto


(U, V ) = E(U V ). Es f
acil ver tambien que |(U, V )| = |(X, Y )| = 1. Si (U, V ) = 1
entonces
Var(U V ) = E[(U V )2 ] E 2 (U V )
= E[(U V )2 ]

= 2[1 E(U V )]
= 0.

Esto significa que con probabilidad uno, la v.a. U V es constante. Esto es, para
alguna constante c, con probabilidad uno, U V = c. Pero esta constante c debe
ser cero pues E(U V ) = 0. Por lo tanto,
Y Y
X X
=
,
X
Y
Y
(X X ). Esto establece una relaci
on lineal directa
de donde se obtiene Y = Y + X
entre X y Y . En cambio, si (U, V ) = 1 entonces

Var(U + V ) = E[(U + V )2 ] E 2 (U + V )
= E[(U + V )2 ]

= 2[1 + E(U V )]
= 0.
Esto significa nuevamente que con probabilidad uno, la v.a. U + V es constante.
Esto es, para alguna constante c, con probabilidad uno, U + V = c. Nuevamente la
constante c es cero pues E(U + V ) = 0. Por lo tanto,
X X
Y Y
=
,
Y
Y
Y
(X X ). Esto establece una relaci
on lineal,
X
ahora inversa, entre X y Y . Uniendo los u
ltimos dos resultados se obtiene que
cuando |(X, Y )| = 1, con probabilidad uno,




Y
Y
Y = (X, Y )
X + Y (X, Y )X
.
X
X
|
{z
}
|
{z
}
de donde se obtiene Y = Y

Cuando (X, Y ) = 0 se dice que X y Y son no correlacionadas y cuando |(X, Y )| =


1 se dice que X y Y est
an perfectamente correlacionadas positiva o negativamente
102

de acuerdo al signo de (X, Y ). En general la condici


on (X, Y ) = 0 no es suficiente
para concluir que X y Y son independientes, en el ejercicio 353 se muestra una
situaci
on concreta de este resultado. Sin embargo en el caso en el que (X, Y ) tiene
distribuci
on normal la conclusi
on es v
alida.
Proposici
on 42 Si (X, Y ) es un vector con distribuci
on normal bivariada tal que
(X, Y ) = 0 entonces X y Y son independientes.
Demostraci
on. La funci
on de densidad normal bivariada esta dada por la siguiente
expresi
on
f (x, y) =

1
p

1 2
"



 
 #
1
x X
y Y
y Y 2
x X 2
exp{
2
+
}
2(1 2 )
X
X
Y
Y
2X Y

2 = Var(X), = E(Y ), 2 = Var(Y ), y (1, 1).


en donde X = E(X), X
Y
Y
Se pueden calcular directamente las funciones de densidad marginales y comprobar
que

f (x) =
y

f (y) =

1
2
q
exp{(x X )2 /2X
}
2
2X

1
q
exp{(y Y )2 /2Y2 },
2
2Y

2 ) y Y tiene distribuci
es decir, X tiene distribucion N (X , X
on N (Y , Y2 ). Despues
de hacer algunos c
alculos sencillos se puede demostrar que (X, Y ) = y comprobar
finalmente que cuando = 0 se verifica la igualdad fX,Y (x, y) = fX (x)fY (y).


En resumen tenemos la siguiente tabla.


Propiedades del coeficiente de correlaci
on
1.
2.
3.
4.

3.10.

X,Y indep = (X, Y ) = 0


(X, Y ) = 0 =
6
X,Y indep (excepto caso normal)
(X, Y ) [1, 1]
|(X, Y )| = 1 Y = aX + b

Esperanza y varianza
de un vector aleatorio

La esperanza de un vector aleatorio X = (X1 , . . . , Xn ) se define como el vector


numerico (E(X1 ), . . . , E(Xn )), cuando cada coordenada existe. La varianza de X se
103



define como la matriz cuadrada E (X E(X))t (X E(X)) , en donde t significa
transpuesta del vector. Observe que (X E(X))t es un vector columna de dimension
n 1, mientras que (X E(X)) es un vector rengl
on de dimensi
on 1 n. De modo
que el producto de estos dos vectores en el orden indicado resulta en una matriz
cuadrada de dimensi
on n n cuya entrada (i, j) es
E[(Xi E(Xi ))(Xj E(Xj ))] = Cov(Xi , Xj ).
Es decir,

Var(X) =

Var(X1 )
Cov(X1 , X2 )
Var(X2 )
Cov(X2 , X1 )
..
..
.
.
Cov(Xn , X1 ) Cov(Xn , X2 )

Cov(X1 , Xn )
Cov(X2 , Xn )
..
..
.
.

Var(Xn )

nn

Esta matriz se llama matriz de varianzas y covarianzas. Es una matriz simetrica


pues Cov(Xi , Xj ) = Cov(Xj , Xi ). Adem
as es positiva definida, esto significa que
para cualquier vector = (1 , . . . , n ) de Rn se cumple la desigualdad
hVar(X), i 0,
en donde h, i denota el producto interior usual de Rn . En efecto, por la bilinealidad
de la covarianza,
hVar(X), i =
=

n
X

i,j=1
n
X

Cov(Xi , Xj )i j
Cov(i Xi , j Xj )

i,j=1
n
n
X
X
= Cov(
i Xi ,
j Xj )
i=1

j=1

n
X
= Var(
i Xi ) 0.
i=1

3.11.

Distribuciones multivariadas discretas

En esta secci
on se estudian algunas distribuciones discretas de vectores aleatorios.

Distribuci
on multinomial
Suponga que se tiene un experimento aleatorio con k posibles resultados distintos.
Las probabilidades para cada uno de estos resultados son respectivamente p1 , . . . , pk .
Entonces p1 + +pk = 1. Ahora suponga que se tienen n ensayos sucesivos independientes del experimento anterior y defina las variables aleatorias discretas X1 , . . . , Xk
104

como aquellas que registran el n


umero de veces que se obtienen cada uno de los k
posibles resultados en los n ensayos. Entonces se dice que el vector X = (X1 , . . . , Xk )
tienen una distribuci
on multinomial y su funci
on de densidad conjunta es

f (x1 , . . . , xk ) =



n

px1 1 pxk k

x1 xk

si x1 , . . . , xk = 0, 1, . . . , n
con x1 + + xk = n,
otro caso.

Los par
ametros de esta distribuci
on son entonces el n
umero de ensayos n, el n
umero
de resultados distintos k en cada ensayo y las probabilidades p1 , . . . , pk . El factor que
aparece en parentesis en la funci
on de densidad conjunta se conoce como coeficiente
multinomial y se define como sigue


n!
n
=
.
x1 xk
x1 ! xk !
Se dice entonces que X tiene distribuci
on multinomial(n, k, p1 , . . . , pk ). Observe que
cuando u
nicamente hay dos posibles resultados en cada ensayo, es decir k = 2, la
distribuci
on multinomial se reduce a la distribuci
on binomial. No es difcil probar
que E(X) = (np1 , . . . , npk ) y que

npi (1 pi ) si i = j,
[Var(X)]ij =
npi pj
si i 6= j.

Distribuci
on hipergeom
etrica multivariada
Suponga que se tienen N objetos de los cuales N1 son de un primer tipo, N2 son de un
segundo tipo y asi sucesivamente con Nk objetos de tipo k. Entonces N1 + +Nk =
N . Suponga que de la totalidad de objetos se obtiene una muestra sin reemplazo de
umero
tama
no n, y defina la variables X1 , . . . , Xk como aquellas que representan el n
de objetos seleccionados de cada tipo. Se dice entonces que X1 , . . . , Xk tienen una
distribuci
on hipergeometrica multivariada y su funci
on de densidad conjunta es

 

N1
Nk

x1
xk


f (x1 , . . . , xk ) =
N
n
en donde cada xi toma valores en el conjunto {0, 1, . . . , n} pero sujeto a xi Ni y
adem
as debe cumplirse que x1 + +xk = n. Se dice entonces que (X1 , . . . , Xk ) tiene
distribuci
on hipergeometrica multivariada (N, N1 , . . . , Nk , n). Observe que cuando
u
nicamente hay dos tipos de objetos (es decir k = 2) la distribuci
on hipergeometrica
multivariada se reduce a la distribuci
on hipergeometrica univariada. Vease la secci
on de ejercicios para la esperanza y varianza de la distribuci
on hipergeometrica
multivariada.
105

3.12.

Distribuciones multivariadas continuas

Ahora estudiamos algunas distribuciones continuas de vectores aleatorios.

Distribuci
on normal bivariada
Se dice que las variables aleatorias continuas X y Y tienen una distribuci
on normal
bivariada si su funci
on de densidad conjunta es
f (x, y) =

1
p

1 2
"


 
 #

y Y
y Y 2
1
x X
x X 2
+
exp{
2
}
2(1 2 )
X
X
Y
Y
2X Y

para cualesquiera valores reales de x y y, y en donde 1 < < 1, X > 0, Y > 0,


2 , , 2 , ).
y X , Y dos constantes reales sin restricci
on. Se escribe X N(X , X
Y
Y
2
Puede demostrarse que X tiene una distribuci
on marginal N(X , X ) y Y tiene
distribuci
on marginal N(Y , Y2 ). El par
ametro es el coeficiente de correlacion
entre X y Y . En el ejercicio 371 en la p
agina 121 se presenta un ejemplo en el cual
las densidades marginales de un vector bivariado son normales pero la distribuci
on
conjunta no lo es. Cuando X = Y = 0 y X = Y = 1 la distribuci
on se llama
normal bivariada est
andar y su gr
afica se muestra a continuaci
on.

f (x, y)

Funci
on de densidad normal bivariada estandar.

3.13.

Ejercicios

Distribuci
on conjunta
256. Grafique y demuestre que las siguientes funciones son de distribuci
on.
1
1
a) F (x, y) = (1 ex )( + tan1 y) para x 0.
2
106

b) F (x, y) = 1 ex ey + exy para x, y 0.


257. Investigue si las siguientes funciones son de distribuci
on.
a) F (x, y) = 1 exy para x, y 0.

b) F (x, y) = 1 exy para x, y 0.

258. Demuestre que la siguiente funci


on no es de distribuci
on.

0 si x + y < 0,
F (x, y) =
1 si x + y 0.
Este es un ejemplo de una funci
on que tiene el comportamiento lmite adecuado
en infinito, es continua por la derecha y no decreciente en cada variable, pero
no es funci
on de distribuci
on pues asigna valores negativos a algunas regiones
del plano. Por ejemplo calcule la probabilidad del cuadrado (1, 1](1, 1]. De
manera an
aloga demuestre que la siguiente funci
on tampoco es de distribuci
on.

0 si x + y + z < 0,
F (x, y, z) =
1 si x + y + z 0.
Extienda este resultado al caso n-dimensional.
259. Demuestre que la siguiente funci
on no es de distribuci
on.

mn{1, m
ax{x, y}} si x, y > 0,
F (x, y) =
0
otro caso.
260. Sean F (x) y G(x) dos funciones de distribuci
on. Demuestre o proporcione un
contraejemplo para las siguientes afirmaciones.
a) F (x)G(x) es una funci
on de distribuci
on univariada.
b) F (x)G(y) es una funci
on de distribuci
on bivariada.
261. Diga falso o verdadero. Justifique en cada caso.
a) P (X > x, Y > y) = 1 P (X x, Y y).
b) P (X x, Y y) P (X x).

c) P (X x) = P (X x, Y x) + P (X x, Y > x).

d) P (X + Y x) P (X x).
e) P (XY < 0) P (X < 0).

262. Sean X y Y variables aleatorias con funci


on de distribuci
on conjunta F (x, y).
Demuestre que para cualesquiera n
umeros reales a < b y c < d,
P (a < X b, c < Y d) = F (b, d) + F (a, c) F (a, d) F (b, c).
263. Sean X1 , X2 y X3 variables aleatorias con funci
on de distribuci
on conjunta
F (x1 , x2 , x3 ). Demuestre que para cualesquiera n
umeros reales a1 < b1 , a2 < b2
y a3 < b3 , la probabilidad
P (a1 < X1 b1 , a2 < X2 b2 , a3 < X3 b3 )
107

es igual a
F (b1 , b2 , b3 ) F (a1 , b2 , b3 ) F (b1 , a2 , b3 ) F (b1 , b2 , a3 )

+F (a1 , a2 , b3 ) + F (a1 , b2 , a3 ) + F (b1 , a2 , a3 )


F (a1 , a2 , a3 ).

264. Sea (X, Y ) un vector con funci


on de distribuci
on conjunta FX,Y (x, y). Demuestre que para todo (x, y) en R2 ,
p
FX (x) + FY (y) 1 FX,Y (x, y) FX (x)FY (y).

265. Considere el espacio = [0, 1] [0, 1] junto con (B[0, 1] B[0, 1]) y P la
medida de probabilidad uniforme sobre . Sea X : R2 el vector aleatorio
dado por X(1 , 2 ) = (1 2 , 1 2 ). Demuestre que X es efectivamente
un vector aleatorio y encuentre su funci
on de distribuci
on.
266. Sea X con funci
on de distribuci
on F (x). Demuestre que F (x) es continua en
x = x0 si y solo si P (X = x0 ) = 0.

Densidad conjunta
267. Grafique y demuestre que las siguientes funciones son de densidad.
1
para 0 < x < a, 0 < y < b.
ab
b) f (x, y) = 4xy para 0 x, y 1.

a) f (x, y) =

c) f (x, y) = 6x2 y para 0 x, y 1.

d) f (x, y) = 94 x2 y 2 para 1 x, y 1.
e) f (x, y) = exy para x, y > 0.
f ) f (x, y) = ex para 0 < y < x.
268. Calcule la constante c que hace a f una funci
on de densidad.
a) f (x) = cx para 0 x 1.

b) f (x, y) = cx para 0 < y < x < 1.


c) f (x, y) = c(x + y) para 0 x, y 1.

d) f (x, y) = c(x2 + 12 xy) para 0 < x < 1, 0 < y < 2.


e) f (x, y, z) = c(x + y + z) para 0 x, y, z 1.

f ) f (x1 , . . . , xn ) = c(x1 + + xn ) para 0 x1 , . . . , xn 1.

269. Encuentre la funci


on de densidad del vector (X, Y ) cuya funci
on de distribuci
on es
1
1
a) F (x, y) = (1 ex )( + tan1 y) para x 0.
2
b) F (x, y) = 1 ex ey + exy para x, y 0.

108

270. Encuentre la funci


on de distribuci
on del vector (X, Y ) cuya funci
on de densidad es
1
para 0 < x < a, 0 < y < b.
ab
b) f (x, y) = exy para x, y > 0.

a) f (x, y) =

c) f (x, y) = ey para 0 < x < y.


d) f (x, y) = 2exy para 0 < x < y.
271. Sean f (x) y g(x) dos funciones de densidad. Demuestre o proporcione un
contraejemplo para las siguientes afirmaciones.
a) f (x)g(x) es una funci
on de densidad univariada.
b) f (x)g(y) es una funci
on de densidad bivariada.
272. Sean X y Y independientes ambas con distribuci
on exp(). Encuentre la funci
on de densidad y de distribuci
on de
a) W = m
ax{X, Y }.
b) W = mn{X, Y }.

Distribuci
on marginal
273. Suponiendo el caso absolutamente continuo, demuestre que la funci
on de densidad marginal,
Z
x 7 fX (x) =
fX,Y (x, y)dy

es efectivamente una funci


on de densidad.
274. Demuestre que la funci
on de distribuci
on marginal
x 7 FX (x) = lm FX,Y (x, y)
y

es efectivamente una funci


on de distribuci
on.
275. Encuentre las funciones de distribuci
on marginales del vector (X, Y ) cuya
funci
on de distribuci
on conjunta es
a) F (x, y) = (1 ex )(1 ey ) para x, y > 0.
2

b) F (x, y) = (1 ex )(1 ey ) para x, y > 0.

276. Encuentre las funciones de densidad marginales del vector (X, Y ) cuya funcion
de densidad conjunta es
1
para 0 < x < a, 0 < y < b.
ab
b) f (x, y) = 4xy para 0 < x, y < 1.

a) f (x, y) =

c) f (x, y) = 24x(1 x y) para x, y > 0 y x + y < 1.

d) f (x, y) = (x + 2y)/4 para 0 < x < 2 y 0 < y < 1.


109

e) f (x, y) = 2(4x + y)/5 para 0 < x, y < 1.


f ) f (x, y) = 1/x para 0 < y < x < 1.
277. Sea 0 < a < 1 y defina la funci
on f (x, y) = ax (1 a)y para x, y N.
Demuestre que f (x, y) es una funci
on de densidad y calcule las funciones de
densidad marginales.

Distribuci
on condicional
278. Demuestre que la funci
on de distribuci
on condicional
Z x
x 7 FX|Y (x|y) =
fX|Y (u|y) du

es efectivamente una funci


on de distribuci
on.
279. Demuestre que la funci
on de densidad condicional
x 7 fX|Y (x|y) =

fX,Y (x, y)
fY (y)

es efectivamente una funci


on de densidad.
280. Sea (X, Y ) un vector aleatorio absolutamente continuo. Demuestre la f
ormula
fX|Y (x|y) =

F
(x|y).
x X|Y

281. Perdida de memoria en la distribuci


on exponencial. Sea X con distribucion
exp() y sea t > 0 fijo. Demuestre que la distribuci
on condicional de X t
dado que X t sigue siendo exp().
282. Calcule fX|Y (x|y) y FX|Y (x|y)para las siguientes funciones de densidad conjunta.
1
para 0 < x < a, 0 < y < b.
ab
b) f (x, y) = 4xy para 0 < x, y < 1.

a) f (x, y) =

c) f (x, y) = 24x(1 x y) para x, y > 0 y x + y < 1.

d) f (x, y) = (x + 2y)/4 para 0 < x < 2 y 0 < y < 1.


e) f (x, y) = 2(4x + y)/5 para 0 < x, y < 1.
f ) f (x, y) = 1/x para 0 < y < x < 1.

283. Calcule FX|Y (x|y) y fX|Y (x|y) para las siguientes funciones de distribucion
conjunta.
1
1
a) F (x, y) = (1 ex )( + tan1 y) para x 0.
2
b) F (x, y) = 1 ex ey + exy para x, y 0.

110

284. Se hacen tres lanzamientos de una moneda equilibrada cuyos resultados llamaremos cara y cruz. Sea X la v.a. que denota el n
umero de caras que se
obtienen en los dos primeros lanzamientos y sea Y la v.a. que denota el n
umero de cruces en los dos u
ltimos lanzamientos. Calcule fX,Y (x, y), fX (x), fY (y)
y fY |X (y|x) para x = 0, 1, 2.
285. Sea (X, Y ) un vector con funci
on de densidad
fX,Y (x, y) =

x+y
8

para 0 x, y 2.

Compruebe que f (x, y) es una funci


on de densidad. Calcule fX (x), fY (y),
fX|Y (x|y), fY |X (y|x), FX,Y (x, y), FX (x), FY (y), FX|Y (x|y), FY |X (y|x), P (Y >
X) y P (X > 1 | Y < 1).
286. Sea (X, Y ) un vector con funci
on de densidad
fX,Y (x, y) = 8xy para 0 < x < y < 1.
Compruebe que f (x, y) es una funci
on de densidad. Calcule fX (x), fY (y),
fX|Y (x|y), fY |X (y|x), FX,Y (x, y), FX (x), FY (y), FX|Y (x|y), FY |X (y|x), P (X +
Y < 1) y P (Y < 1/2 | X < 1/2).
287. Sea (X, Y ) un vector con funci
on de densidad
fX,Y (x, y) = 4x(1 y) para 0 < x, y < 1.
Compruebe que f (x, y) es efectivamente una funci
on de densidad. Calcule fX (x), fY (y), fX|Y (x|y), fY |X (y|x), FX,Y (x, y), FX (x), FY (y), FX|Y (x|y),
FY |X (y|x), P (X > 1/2) y P (1/4 < Y < 3/4 | X < 1/2).

Independencia de variables aleatorias


288. Demuestre la variable aleatoria constante X = c es independiente de cualquier
otra variable aleatoria.
289. Suponga que X es independiente de cualquier otra variable aleatoria. Demuestre que X es constante.
290. Demuestre que los eventos A y B son independientes si y solo si las variables
aleatorias 1A y 1B lo son.
291. Demuestre que si tres variables aleatorias son independientes entonces cualesquiera dos de ellas lo son.
292. Determine si las siguientes son funciones de densidad de variables aleatorias
independientes.
1
para 0 < x < a, 0 < y < b.
ab
b) f (x, y) = 2x para 0 < x, y < 1.

a) f (x, y) =

c) f (x, y) = 2exy para 0 < x < y.


111

d) f (x, y) = exy para x, y > 0.


3
e) f (x, y) = (x2 + y 2 ) para x, y [1, 1].
8
293. Determine si las siguientes son funciones de distribuci
on de variables aleatorias
independientes.
a) F (x, y) = (1 ex )(1 ey ) para x, y > 0.
2

b) F (x, y) = (1 ex )(1 ey ) para x, y > 0.

294. Demuestre que X y Y son independientes si y solo si para cualesquiera n


umeros
reales x y y,
P (X > x, Y > y) = P (X > x)P (Y > y).
295. Demuestre que X y Y son independientes si y solo si para cualesquiera n
umeros
reales a < b y c < d,
P (a < X b, c < Y d) = P (a < X b) P (c < Y d).
296. Demuestre que si X y Y son independientes entonces X 2 y Y 2 tambien lo son.
297. Sean X1 , . . . , Xn variables aleatorias independientes cada una con distribucion
Ber(p). Calcule P (X1 + + Xn = k) para k = 0, 1, . . . , n.
298. Sean X y Y independientes ambas con distribuci
on unif{1, . . . , n}. Encuentre
la distribuci
on de (U, V ) = (X + Y, X Y ). Determine si U y V son independientes.
299. Sean X 0 y Y 0 independientes con valores enteros naturales y con
esperanza finita. Demuestre que
E(mn{X, Y }) =

n=1

P (X n)P (Y n).

300. Sean X y Y independientes ambas con distribuci


on unif{1, 1}. Sea Z = XY .
Demuestre que X, Y y Z son independientes dos a dos pero no lo son en su
conjunto.
301. Sean X y Y independientes con distribuci
on Poisson(1 ) y Poisson(2 ) respectivamente. Demuestre que la distribuci
on condicional de X dado que X+Y = n
es bin(n, 1 /(1 + 2 )).
302. Sean X y Y independientes con distribuci
on unif{0, 1, . . . , n} y unif{0, 1, . . . , m}
respectivamente. Encuentre la funci
on de densidad de X + Y .
on geo(p). Demuestre que X1 +
303. Sean X1 , . . . , Xn independientes con distribuci
+ Xn tiene distribuci
on bin neg(n, p).
304. Sean X y Y independientes. Encuentre la funci
on de distribuci
on de W en
terminos de FX (x) y FY (y) cuando
a) W = m
ax{X, Y }.
112

b) W = mn{X, Y }.
305. Sean X y Y independientes ambas con distribuci
on exp() y sea a una constante. Calcule P (X Y aX) y P (X Y aX).
306. Usando la siguiente tabla, construya la funci
on de densidad f (x, y) de un
vector discreto (X, Y ) con la condici
on de que X y Y sean independientes.
x\y
0
1

307. Sea (X, Y ) un vector discreto con distribuci


on de probabilidad uniforme en el
conjunto {1, . . . , n} {1, . . . , m}, con n y m enteros positivos. Demuestre que
X y Y son independientes.
308. Sea (X, Y ) un vector aleatorio con funci
on de densidad
fX,Y (x, y) = c(1 x) para 0 < x < y < 1.
a) Encuentre el valor de c que hace a fX,Y (x, y) una funci
on de densidad y
grafique esta funci
on.
b) Calcule P (X + Y > 1) y P (X 1/2).

c) Encuentre las funciones de densidad marginales fX (x) y fY (y).

d) Determine si X y Y son independientes.


309. Sea (X, Y ) un vector aleatorio con funci
on de densidad
 x+y
1
f (x, y) = c
para x = 0, 1, 2 y y = 1, 2.
2
Encuentre el valor de la constante c y determine si X y Y son independientes.
Calcule adem
as las probabilidades P (X = 1), P (X = 2 | Y = 2) y P (XY = 2).
310. Sea (X, Y ) un vector aleatorio con funci
on de densidad
fX,Y (x, y) = 2 para 0 < x < y < 1.
a) Grafique y demuestre que fX,Y (x, y) es una funci
on de densidad.
b) Encuentre las funciones de densidad marginales fX (x) y fY (y).
c) Determine si X y Y son independientes.
d) Calcule P (Y > X) y P (Y > X 2 ).
311. Sea (X, Y ) un vector aleatorio con funci
on de densidad
fX,Y (x, y) = c|x + y| para

1 < x, y < 1.

a) Encuentre el valor de la constante c que hace a fX,Y (x, y) una funci


on de
densidad y grafique esta funci
on.
b) Calcule P (X > 0), P (XY > 0) y P (0 < X + Y < 1).
113

c) Encuentre las funciones de densidad marginales fX (x) y fY (y).


d) Determine si X y Y son independientes.
312. Sean X y Y independientes con distribuci
on exponencial con par
ametros 1 y
2 respectivamente. Demuestre que
P (Y > X) =

1
.
1 + 2

313. Sean X y Y independientes con distribuci


on bin(n, p) y bin(m, p) respectivamente. Demuestre que X + Y tiene distribuci
on bin(n + m, p)
a) haciendo el c
alculo directamente.
b) razonando probabilsticamente en terminos de ensayos Bernoulli.
314. Sean X y Y independientes con distribuci
on Poisson con par
ametros 1 y 2
respectivamente. Demuestre que X + Y tiene distribuci
on Poisson(1 + 2 ).
315. Sea (X, Y, Z) un vector aleatorio con funci
on de densidad
fX,Y,Z (x, y, z) = 8xyz para 0 x, y, z 1.
a) Compruebe que f (x, y, z) es una funci
on de densidad.
b) Calcule P (X < Y < Z) y P (X + Y + Z < 1).
c) Encuentre fX,Y (x, y), fX,Z (x, z) y fY,Z (y, z).
d) Determine si X, Y y Z son independientes.
316. Sea (X, Y, Z) un vector aleatorio con funci
on de densidad
fX,Y,Z (x, y, z) = 24x para 0 < x < y < z < 1.
a) Compruebe que f (x, y, z) es una funci
on de densidad.
b) Calcule P (X + Y < 1) y P (Z X > 1/2).

c) Encuentre fX,Y (x, y), fX,Z (x, z) y fY,Z (y, z).

d) Determine si X, Y y Z son independientes.


317. Sea X1 , X2 , . . . una sucesi
on de v.a.s independientes cada una con distribucion
unif(0, 1). Demuestre que para cualquier > 0,
lm P (m
ax{X1 , . . . , Xn } 1

) = e .
n

318. Sean X y Y independientes con distribuci


on Poisson(1 ) y Poisson(2 ) respectivamente. Demuestre que
E(X | X + Y = n) = n

114

1
.
1 + 2

Esperanza de una funci


on de un vector aleatorio
319. Demuestre que si X y Y son independientes entonces
E(XY ) = E(X)E(Y ).
320. Demuestre que la condici
on E(XY ) = E(X)E(Y ) no implica necesariamente
que X y Y son independientes. Para ello considere cualquiera de los siguientes
ejemplos.

1/8 si (x, y) = (1, 1), (1, 1), (1, 1), (1, 1),
a) f (x, y) =
1/2 si (x, y) = (0, 0),

0
otro caso.
b) f (x, y) = 3(x2 + y 2 )/8 para x, y [1, 1].

c) X con distribuci
on uniforme en {1, 0, 1} y Y = 1(X6=0) .

321. Demuestre que si X1 , X2 , . . . , Xn son independientes e integrables entonces


E(X1 X2 Xn ) = E(X1 )E(X2 ) E(Xn ).
322. Sean X y Y independentes. Diga falso o verdadero justificando en cada caso.
a) Var(X + Y ) = Var(X) + Var(Y ).
b) Var(X Y ) = Var(X) Var(Y ).
c) Var(XY ) = Var(X)Var(Y ).

323. Sean X y Y independientes. Demuestre que


Var(XY ) = Var(X)Var(Y ) + E 2 (X)Var(Y ) + E 2 (Y )Var(X).
324. Sean X1 , . . . , Xn independientes con la misma distribuci
on y sea Sn = X1 +
+ Xn . Suponiendo que las esperanzas indicadas existen, demuestre que
E(X1 /Sn ) = 1/n. Concluya que para m n, E(Sm /Sn ) = m/n.
325. Sea X1 , . . . , Xn variables aleatorias independientes con identica distribuci
on y
con esperanza finita. Demuestre que
E(X1 | X1 + + Xn = k) =
326. Sea (X, Y ) un vector aleatorio discreto
siguiente tabla
x\y
-1
1
.1
2
.06
3
.1

k
.
n

con funci
on de densidad dada por la
0
.05
.2
.05

1
.1
.04
.3

a) Grafique f (x, y) y compruebe que efectivamente se trata de una funcion


de densidad conjunta.
115

b) Calcule y grafique las densidades marginales fX (x) y fY (y). Verifique que


ambas son funciones de densidad.
c) Demuestre que X y Y no son independientes.
d) Calcule E(XY ) y fX+Y (u).
327. Sea (X, Y ) un vector discreto con funci
on de
tabla
x\y
2
4
1
2/18 3/18
2
3/18 5/18
3
1/18 1/18

densidad dada por la siguiente


6
1/18
1/18
1/18

a) Grafique f (x, y) y compruebe que efectivamente es una funci


on de densidad conjunta.
b) Calcule y grafique las densidades marginales fX (x) y fY (y). Verifique que
ambas son efectivamente funciones de densidad.
c) Demuestre que X y Y no son independientes.
d) Calcule E(XY ) y fX+Y (u).
328. Sea (X, Y ) un vector aleatorio con funci
on de densidad dada por

8xy si 0 < y < x < 1,
f (x, y) =
0
otro caso.
a) Grafique f (x, y) y compruebe que efectivamente es una funci
on de densidad conjunta.
b) Encuentre y grafique las densidades marginales fX (x) y fY (y). Verifique
que ambas son efectivamente funciones de densidad.
c) Demuestre que X y Y no son independientes.
d) Calcule E(XY ) y fX+Y (u).

Esperanza y varianza de un vector


329. Calcule la esperanza y varianza del vector aleatorio (X, Y ) cuya funci
on de
densidad conjunta es
1
para 0 < x < a, 0 < y < b.
ab
b) f (x, y) = 4xy para x, y [0, 1].

a) f (x, y) =

Covarianza
330. Defina Cov(X, Y ) y mencione tres de sus propiedades.
331. Diga falso o verdadero. Demuestre en cada caso.
a) Cov(X, Y ) = 0, Cov(Y, Z) = 0 = Cov(X, Z) = 0.
116

b) Cov(X, Y ) > 0, Cov(Y, Z) > 0 = Cov(X, Z) > 0.


c) Cov(X, Y ) = a, Cov(Y, Z) = a = Cov(X, Z) = a.
332. Diga falso o verdadero. Demuestre en cada caso.
a) Cov(X, Y ) 0.

b) Cov(aX, bY ) = ab Cov(X, Y ) con a, b constantes.


c) Cov(X, aY + b) = a Cov(X, Y ) + b con a, b constantes.

333. Sea a un n
umero real cualquiera. Encuentre X y Y tales que
a) Cov(X, Y ) = a.
b) Cov(X, Y ) = a.
c) Cov(X, Y ) = 0.

334. Demuestre que


a) Cov(X, Y ) = E(XY ) E(X)E(Y ).
b) Cov(X, Y ) = Cov(Y, X).
c) Cov(X, X) = Var(X).
d) Cov(X, X) = Var(X).

e) Cov(aX + b, Y ) = aCov(X, Y ).
f ) Cov(X1 + X2 , Y ) = Cov(X1 , Y ) + Cov(X2 , Y ).

335. Demuestre que si X y Y son independientes entonces Cov(X, Y ) = 0.


336. Demuestre que la condici
on Cov(X, Y ) = 0 no es suficiente para concluir que
X y Y son independientes.
337. Demuestre que Var(X Y ) = Var(X) + Var(Y ) 2 Cov(X, Y ).
338. Demuestre que
a) Var(X1 + + Xn ) =

n
X

Var(Xk ) + 2

k=1

Cov(Xj , Xk ).

j<k

n
m
n X
m
X
X
X
b) Cov(
Xi ,
Yj ) =
Cov(Xi , Yj ).
i=1

j=1

i=1 j=1

339. Sea X1 , . . . , Xn independientes y con varianza finita. Demuestre que


Var(X1 + + Xn ) =

n
X

Var(Xk ).

k=1

= (X1 +
340. Sean X1 , . . . , Xn independientes y con identica distribuci
on. Defina X
X)
= 0.
+ Xn )/n. Demuestre que para k = 1, . . . , n se cumple Cov(Xk X,
341. Calcule la covarianza de X y Y cuya distribuci
on conjunta es uniforme en el
conjunto {1, . . . , n} {1, . . . , n}.
117

342. Calcule la covarianza de X y Y cuya funci


on de densidad conjunta est
a dada
por la siguiente tabla.
x\y
-1
1

-1
1/12
3/12

0
2/12
2/12

1
3/12
1/12

343. Calcule la covarianza de X y Y cuya funci


on de densidad conjunta est
a dada
por la siguiente tabla, c es una constante.
x\y
-1
1

-1
2c
3c

0
c
c

1
2c
3c

344. Calcule la covarianza de X y Y cuya funci


on
por la siguiente tabla.
x\y
1
2
2
.2 .05
4
.05 .1
6
.05 .1

de densidad conjunta est


a dada
3
.15
.15
.15

345. Calcule la covarianza de X y Y cuya funci


on de densidad conjunta est
a dada
por la siguiente tabla, c es una constante.
x\y
-1
0
1

-1
0
c
0.1

0
c
0.4
c

1
0.1
c
0

346. Calcule la covarianza de X y Y cuya funci


on de densidad conjunta es
1
para 0 < x < a, 0 < y < b.
ab
b) f (x, y) = 3x2 y para 1 < x < 1, 0 < y < 1.

a) f (x, y) =

c) f (x, y) = 12 ex para |y| < x.

d) f (x, y) = exy para x, y > 0.


2 , , 2 , ).
347. Sea (X, Y ) un vector con distribuci
on normal bivariada N(X , X
Y
Y
Demuestre que Cov(X, Y ) = X Y .

Coeficiente de correlaci
on
348. Escriba la definici
on y una interpretaci
on del coeficiente de correlaci
on. Mencione adem
as tres de sus propiedades.
349. Diga falso o verdadero. Demuestre en cada caso.
a) (X, Y ) = 0, (Y, Z) = 0 = (X, Z) = 0.
118

b) (X, Y ) > 0, (Y, Z) > 0 = (X, Z) > 0.


c) (X, Y ) < 0, (Y, Z) < 0 = (X, Z) < 0.
d) (X, Y ) = 1, (Y, Z) = 1 = (X, Z) = 1.
e) (X, Y ) = 1, (Y, Z) = 1 = (X, Z) = 1.
f ) (X, Y )(Y, Z) = 1 = (X, Z) = 1.

g) (X, Y ) = a, (Y, Z) = a = (X, Z) = a.


350. Diga falso verdadero. Demuestre en cada caso.
a) (X, Y ) = (Y, X).
b) (aX, Y ) = a (X, Y ), a constante.
c) (X + a, Y ) = (X, Y ), a constante.
d) (aX + b, Y ) = a (X, Y ) + b; a, b constantes.
e) (X1 + X2 , Y ) = (X1 , Y ) + (X2 , Y ).
351. Sea a un n
umero en [1, 1]. Encuentre X y Y tales que (X, Y ) = a.
352. Demuestre que si X y Y son independientes entonces (X, Y ) = 0.
353. Sean X y Y independientes con distribuci
on Ber(p) con p = 1/2. Demuestre
que el coeficiente de correlaci
on entre X + Y y |X Y | es cero y sin embargo
estas variables aleatorias no son independientes.
354. Demuestre que
a) 1 (X, Y ) 1
b) (X, X) = 1.

c) (X, X) = 1.

d) (X, aX + b) = 1 si a > 0.
e) (X, aX + b) = 1 si a < 0.
f ) (X, aX + b) = 0 si a = 0.

355. Demuestre que (aX + b, cY + d) = signo(ac) (X, Y ) en donde ac 6= 0 y



1 si x > 0,
signo(x) =
0 si x < 0.
356. Calcule el coeficiente de correlaci
on de X y Y cuya funci
on de densidad conjunta est
a dada por la siguiente tabla.
x\y
0
1

1
1/8
1/2

119

2
1/4
1/8

357. Calcule el coeficiente de correlaci


on de X y Y cuya funci
on de densidad conjunta est
a dada por la siguiente tabla.
x\y
2
4
6

1
1/9
1/9
1/9

2
1/9
1/9
1/9

3
1/9
1/9
1/9

358. Calcule el coeficiente de correlaci


on de X y Y con distribuci
on conjunta uniforme en el conjunto
a) {1, . . . , n} {1, . . . , n}.
b) [1, 1] [1, 1].

359. Sea X con distribuci


on bin(n, p) y sea Y = nX. Demuestre que Cov(X, Y ) =
np(1 p) y por lo tanto (X, Y ) = 1.
360. Calcule el coeficiente de correlaci
on de X y Y cuya funci
on de densidad conjunta es
a) f (x, y) =
b) f (x, y) =
c) f (x, y) =

1
2 sin(x + y) para x, y
1 x
para |y| < x.
2e
xy
e
para x, y > 0.

[0, /2].

361. Sean X y Y independientes e identicamente distribudas. Demuestre que (X +


Y, X Y ) = 0.
2 , , 2 , ).
362. Sea (X, Y ) un vector con distribuci
on normal bivariada N(X , X
Y
Y
Demuestre que (X, Y ) = .

Distribuci
on multinomial
363. Demuestre que la funci
on de densidad de la distribuci
on multinomial efectivamente lo es.
364. Sea X = (X1 , . . . , Xk ) con distribuci
on multinomial(n, k, p1 , . . . , pk ). Demuestre que Xi tiene distribuci
on marginal bin(n, pi ), para i = 1, . . . , k.
365. Sea X = (X1 , . . . , Xk ) con distribuci
on multinomial(n, k, p1 , . . . , pk ). Demuestre que E(X) = (np1 , . . . , npk ) y que

npi (1 pi ) si i = j,
[Var(X)]ij =
npi pj
si i 6= j.

Distribuci
on hipergeom
etrica multivariada
366. Demuestre que la funci
on de densidad de la distribuci
on hipergeometrica multivariada efectivamente lo es.

120

367. Sea X = (X1 , . . . , Xk ) con distribuci


on hipergeometrica multivariada con
on hiperpar
ametros (N, N1 , . . . , Nk , n). Demuestre que Xi tiene distribuci
geometrica univariada con par
ametros (N, Ni , n), para i = 1, . . . , k.
368. Sea X = (X1 , . . . , Xk ) con distribuci
on hipergeometrica multivariada con
N1
Nk
par
ametros (N, N1 , . . . , Nk , n). Demuestre que E(X) = (n , . . . , n
) y que
N
N

N N Ni N n

n i

si i = j,
N
N
N 1
[Var(X)]ij =
N N nN

n i j
si i 6= j.
N N N 1

Distribuci
on normal multivariada

369. Demuestre que la funci


on de densidad de la distribuci
on normal bivariada
efectivamente lo es.
2 , , 2 , ).
370. Sea (X, Y ) un vector con distribuci
on normal bivariada N(X , X
Y
Y
2
Demuestre que X tiene distribuci
on marginal N(X , Y ) y Y tiene distribucion
marginal N(Y , Y2 ). Vease el siguiente ejercicio para verificar que el recproco
de este resultado es falso.

371. Sea f (x, y) la funci


on de densidad normal bivariada est
andar con = 0. Defina

2f (x, y) si xy < 0,
g(x, y) =
0
si xy 0.
Demuestre que g(x, y) es una funci
on de densidad bivariada que no es normal
pero cuyas densidades marginales son normales.
2 , , 2 , ).
372. Sea (X, Y ) un vector con distribuci
on normal bivariada (X , X
Y
Y
Demuestre que E(X) = (X , Y ) y


2
X
X Y
Var(X, Y ) =
.
X Y
Y2
2 , , 2 , ).
373. Sea (X, Y ) un vector con distribuci
on normal bivariada N(X , X
Y
Y
Demuestre que la distribuci
on condicional de X dado que Y = y es normal
Y
con media Y + X
(x X ) y varianza Y2 (1 2 ), y que la distribucion
condicional de Y dado que X = x es normal con media X + X
(y Y ) y
Y
2 (1 2 )
varianza X

121

Captulo 4

Esperanza condicional
4.1.

Esperanza condicional

En esta secci
on se define el importante concepto de esperanza condicional de una
variable aleatoria respecto de una -
algebra y se estudian algunas de sus propiedades
elementales.

Definici
on 35 (Esperanza condicional) Sea X una variable aleatoria con esperanza finita y sea G una sub--
algebra de F. La esperanza condicional de X dado
G es una variable aleatoria denotada por E(X|G) que cumple las siguientes tres
propiedades:
1. Es G-medible.
2. Tiene esperanza finita.
3. Para cualquier evento G en G,
E[ E( X | G ) 1G ] = E[ X 1G ].

(4.1)

Es importante enfatizar que la esperanza condicional, a pesar de su nombre, no es


un n
umero (aunque puede serlo) sino una variable aleatoria. Puede demostrarse que
esta variable aleatoria existe y es u
nica casi seguramente, esto significa que si existe
otra variable aleatoria con las tres propiedades de la definici
on anterior entonces con
probabilidad uno coincide con E(X|G). Estudiamos a continuaci
on algunas de sus
propiedades elementales.
Proposici
on 43 La esperanza condicional cumple las siguiente propiedades.

122

a) E(E(X|G)) = E(X).
b) Si X es G-medible entonces E(X|G) = X. En particular, si c es una constante
E(c|G) = c.
c) E(aX + Y |G) = aE(X|G) + E(Y |G).
Demostraci
on. La primera propiedad se obtiene tomando el caso particular G =
en la igualdad (4.1), y establece que las variables aleatorias X y E(X|G) tienen la
misma esperanza. Para la segunda propiedad observe que si X es G-medible entonces X mismo cumple con las tres propiedades de la definici
on de E(X|G), por la
unicidad se obtiene la igualdad casi segura. La tercera propiedad es consecuencia de
la linealidad de la esperanza, de (4.1) y de la unicidad.

Cuando la -
algebra G es la mnima respecto de la cual una funci
on Y : R es
variable aleatoria, es decir G = (Y ), entonces la esperanza condicional se escribe
simplemente como E(X|Y ) en lugar de E(X|(Y )). Si es tal que Y () = y
entonces la variable aleatoria E(X|Y ) evaluada en es
Z
xdFX|Y (x|y).
E(X|Y )() = E(X|Y = y) =

Los siguientes casos particulares relacionan a la esperanza condicional con los conceptos elementales de esperanza y probabilidad condicional.
Proposici
on 44 Para cualquier variable aleatoria X con esperanza finita, y eventos
A y B,
a) E(X| {, } ) = E(X).
b) E(1A | {, } ) = P (A).
c) E(1A | {, B, B c , } ) = P (A|B)1B + P (A|B c )1B c .
Demostraci
on. La primera igualdad se sigue del hecho que E(X|G) es medible respecto de G y de que cualquier funci
on medible respecto de G = {, } es constante.
La tercera condici
on en la definici
on de esperanza condicional implica que esta constante debe ser E(X). La segunda igualdad es evidentemente un caso particular de
la primera. Para demostrar la tercera igualdad observe que toda funci
on medible
respecto de G = {, B, B c , } es constante tanto en B como en B c . Adem
as,
E[ E( 1A | G ) 1B ] = E[ 1A 1B ] = P (A B).
Como la variable aleatoria E( 1A | G) es constante en B, el lado izquierdo es igual
a E( 1A | G)() P (B) para cualquier en B. De donde se obtiene E( 1A | G)() =
P (A|B) para en B. El an
alisis es an
alogo al considerar el evento B c y de esto se
obtiene la f
ormula de la tercera propiedad.


123

Una introducci
on a la esperanza condicional ligeramente m
as completa a la presentada en esta secci
on, aunque tambien sencilla y breve, puede encontrarse en [18]. Un
tratamiento m
as completo y riguroso puede consultarse por ejemplo en [12] o [23].

4.2.

Varianza condicional

Usando la esperanza condicional se puede obtener la varianza condicional respecto


de una -
algebra.

Definici
on 36 (Varianza condicional) Sea X con segundo momento finito y
sea G una sub--
algebra de F. La varianza condicional de X dado G se define
como la variable aleatoria dada por
Var(X|G) = E[ (X E(X|G))2 | G ].

Nuevamente cuando la sub--


algebra G es (Y ) para alguna variable aleatoria Y
entonces Var(X|G) se escribe Var(X|Y ) y puede tomarse como definici
on la igualdad
Var(X|Y ) = E[ (X E(X|Y ))2 | Y ].
Se demuestran a continuaci
on dos propiedades sencillas de esta variable aleatoria.
Otras propiedades de la varianza condicional se encuentran en la secci
on de ejercicios.
Proposici
on 45 La varianza condicional cumple las siguientes propiedades.
a) Var(X|G) = E(X 2 |G) E 2 (X|G).
b) Var(X) = E[Var(X|G)] + Var[E(X|G)].
Demostraci
on. La primera f
ormula se obtiene a partir de la definici
on al desarrollar
el cuadrado y utilizar las propiedades de linealidad de la esperanza condicional. Para
la segunda propiedad, tomando esperanza en a) se obtiene
E[Var(X|G)] = E(X 2 ) E[E 2 (X|G)].

(4.2)

Por otro lado


Var[E(X|G)] = E[E 2 (X|G)] E 2 [E(X|G)]
= E[E 2 (X|G)] E 2 (X).

Sumando (4.2) y (4.3) se obtiene b).

(4.3)


124

4.3.

Ejercicios
Esperanza condicional

374. Enuncie la definici


on de esperanza condicional de una variable respecto de una
sub--
algebra.
375. Sea X una variable aleatoria con esperanza finita y sea G = {, }. Demuestre
que E(X|G) = E(X).
376. Demuestre que si X es G-medible entonces E(X|G) = X.
377. Demuestre que si c es una constante entonces para cualquier sub--
algebra G,
E(c|G) = c.
378. Sea A un evento y sea G = {, }. Demuestre que E(1A |G) = P (A).
379. Sean A y B dos eventos. Demuestre que
E(1A |1B ) = P (A|B)1B + P (A|B c )1B c .
380. Sea (X, Y ) un vector con funci
on de densidad dada por fX,Y (x, y) = 3y
para 0 < x < y < 1. Compruebe que f (x, y) es efectivamente una funci
on de
densidad y calcule
a) P (X + Y < 1/2).
b) fX (x) y fY (y).
c) E(Y ) y E(Y |X = x).
381. Sea (X, Y ) un vector con distribuci
on uniforme en el conjunto {1, . . . , 6}
{1, . . . , 6}. Calcule
a) P (X = Y ).
b) P (X + Y 6).
c) fX (x) y fY (y).

d) E(X|X + Y = 6).
382. Sea (X, Y ) un vector con funci
on de densidad dada por la siguiente tabla
x\y
1
2
3

-1
.3
.05
.1

0
.05
.2
.1

Calcule
a) P (X = 2), P (X + Y = 1) y P (Y X).
b) fX (x) y fY (y).

c) fY |X (y|x) para x = 1, 2, 3.

d) E(Y |X = x) para x = 1, 2, 3.
125

1
.05
.05
.1

Varianza condicional
383. Demuestre que Var(X|Y ) = E(X 2 |Y ) E 2 (X|Y ).
384. Demuestre que Var(X) = E[Var(X|Y )] + Var[E(X|Y )].
385. Demuestre que
a) Var(X|{, }) = Var(X).
b) Var(1A |{, }) = P (A)(1 P (A)).

126

Captulo 5

Transformaciones
Si X es una variable aleatoria con distribuci
on conocida y es una funci
on tal
que Y = (X) es otra variable aleatoria cu
al es la distribuci
on de Y ? En este
captulo se da respuesta a esta pregunta tanto en el caso unidimensional como en el
caso de vectores aleatorios. En particular, se encuentran f
ormulas explcitas para la
funci
on de densidad de la suma, resta, producto y cociente de dos variables aleatorias
absolutamente continuas.

5.1.

Transformaci
on de una variable aleatoria

Suponga que X es una variable aleatoria y es una funci


on tal que Y = (X) es
otra variable aleatoria. En esta secci
on se estudia un resultado que provee de una
f
ormula para la funci
on de densidad de Y en terminos de la funci
on de densidad de
X. Gr
aficamente

X()

(X())

R
Y = (X)

127

Teorema 1 (Teorema de cambio de variable) Sea X una variable aleatoria


continua con valores dentro de un intervalo (a, b) R y con funci
on de densidad
on continua, estrictamente creciente o decrefX (x). Sea : (a, b) R una funci
ciente y con inversa diferenciable. Entonces la variable aleatoria Y = (X) toma
valores dentro del intervalo (a, b) y tiene funci
on de densidad

d 1
fX (1 (y)) | dy
(y)| para y (a, b),
fY (y) =
0
otro caso.

Demostraci
on. Suponga primero el caso estrictamente creciente. Entonces para
y (a, b),
FY (y) = P (Y y)

= P ((X) y)

= P (X 1 (y))
= FX (1 (y)).

d 1
(y). Para estrictamente decrecienDerivando se obtiene fY (y) = fX (1 (y)) dy
te

FY (y) = P (Y y)

= P ((X) y)

= P (X 1 (y))

= 1 FX (1 (y)).
h
i
d 1
(y) . En cualquiera caso se obtiene el resulEntonces fY (y) = fX (1 (y)) dy
tado del teorema.


Ejemplo. [Distribucion log normal] Sea X con distribucion N(, 2 ) y sea la


funci
on estrictamente creciente (x) = ex con inversa diferenciable 1 (y) = ln y.
Entonces la variable aleatoria Y = eX toma valores en el intervalo (0, ) y su
distribuci
on se conoce con el nombre de distribuci
on log normal(, 2 ) . Por el
teorema anterior su funci
on de densidad es



1
(ln y )2

exp
si y > 0,

2 2
y 2 2
fY (y) =

0
si y 0.

128

5.2.

Transformaci
on de un vector aleatorio

Suponga ahora que (X, Y ) es un vector con funci


on de densidad conocida y es una
funci
on tal que (U, V ) = (X, Y ) es otro vector aleatorio. El problema es encontrar
la funci
on de densidad del nuevo vector (U, V ). Gr
aficamente

(X, Y )
R2

R2

(U, V ) = (X, Y )

Teorema 2 (Teorema de cambio de variable) Sea (X, Y ) un vector continuo


con valores en I R2 y con funci
on de densidad fX,Y (x, y). Sea (x, y) : I
R2 una funci
on continua con inversa 1 (u, v) diferenciable. Entonces el vector
(U, V ) = (X, Y ) toma valores en (I) y tiene funci
on de densidad

fX,Y (1 (u, v)) |J(u, v)| para (u, v) (I),
fU,V (u, v) =
(5.1)
0
otro caso,
en donde


1 1
J(u, v) = u 11 v 11
u 2
v 2

Demostraci
on.[Intuitiva] Sea
(U, V ) = (X, Y ) = (1 (X, Y ), 2 (X, Y ))
con inversa
1
(X, Y ) = 1 (U, V ) = (1
1 (U, V ), 2 (U, V )).

Sea A el cuadrado de area infinitesinal de esquinas con coordenadas (x, y), (x +


dx, y), (x, y + dy) y (x + dx, y + dy). Bajo la transformaci
on las coordenadas de
las esquinas del cuadrado A se transforman en las siguientes coordenadas

(x, y) 7 (1 (x, y), 2 (x, y)).


(x + dx, y) 7 (1 (x + dx, y), 2 (x + dx, y))
.
= (1 (x, y) + x 1 (x, y)dx, 2 (x, y) + x 2 (x, y)dx.

129

(x, y + dy) 7 (1 (x, y + dy), 2 (x, y + dy))


.
= (1 (x, y) + y 1 (x, y)dy, 2 (x, y) + y 2 (x, y)dy.
(x + dx, y + dy) 7 (1 (x + dx, y + dy), 2 (x + dx, y + dy))
.
= (1 (x, y) + x 1 (x, y)dx + y 1 (x, y)dy,
2 (x, y) + x 2 (x, y)dx + y 2 (x, y)dy).
Gr
aficamente la transformaci
on de estos puntos se muestra a continuaci
on.

(1 + y 1 , 2 + y 2 )
y + dy

A
y

(1 , 2 )
x

b(1

(A)

+ x 1 + y 1 ,
2 + x 2 + y 2 )

(1 + x 1 , 2 + x 2 )

x + dx

Entonces P ((X, Y ) A) = P ((U, V ) (A)). Por lo tanto

fX,Y (x, y) dxdy = fU,V (u, v) Area


de (A).
En donde

Area
de (A) = |x 1 y 2 x 2 y 1 | dxdy


x 1 y 1
dxdy


=
x 2 y 2
= |J(x, y)| dxdy.

Adem
as |J(x, y)| =

1
. Por lo tanto
|J(u, v)|

fX,Y (x, y) dxdy = fU,V (u, v)

dxdy
.
|J(u, v)|

De esta ecuaci
on se obtiene
1
fU,V (u, v) = fX,Y (1
1 (u, v), 2 (u, v))|J(u, v)|.


Como ejemplo de aplicaci
on de la proposici
on anterior, en las secciones siguientes
utilizaremos la f
ormula (5.1) para encontrar expresiones para la funci
on de densidad
130

de la suma, diferencia, producto y cociente de dos variables aleatorias. Las f


ormulas
generales sobre transformaciones encontradas en estas dos primeras secciones se
resumen en la siguiente tabla.
Transformaci
on de variables aleatorias
1. Y = (X)

2. (U, V ) = (X, Y )

fY (y) = fX (1 (y)) |
=

d 1
(y)|
dy

fU,V (u, v) = fX,Y (1 (u, v)) |J(u, v)|


1 1
en donde J(u, v) = u 11 v 11
u 2
v 2

Distribuci
on de la suma
El siguiente resultado proporciona una f
ormula para la funci
on de densidad de la
suma de dos variables aleatorias absolutamente continuas.

Proposici
on 46 Sea (X, Y ) un vector continuo con funci
on de densidad conjunta
fX,Y (x, y). Entonces X + Y tiene funci
on de densidad
Z
fX,Y (u v, v) dv.
(5.2)
fX+Y (u) =

Demostraci
on. Sea : R2 R2 la transformaci
on (x, y) = (x + y, y) con inversa
1
(u, v) = (u v, v). El Jacobiano de la transformaci
on inversa es



u 1 v 1 1 1
1
1
=

J(u, v) =
0 1 = 1.
u 1
v 1
2
2

Por la f
ormula (5.1), fX+Y,Y (u, v) = fX,Y (u v, v). Integrando respecto de v se
obtiene (5.2).

Observe que haciendo el cambio de variable z(v) = u v en (5.2) se obtiene la
expresi
on equivalente
Z
fX+Y (u) =
fX,Y (z, u z) dz.
(5.3)

131

En particular, cuando X y Y son independientes la f


ormula (5.2) se reduce a
Z
fX+Y (u) =
fX (u v)fY (v) dv.
(5.4)

Se puede demostrar la proposici


on anterior mediante el procedimiento usual de encontrar primero la funci
on de distribuci
on de X +Y y despues derivar para encontrar
la funci
on de densidad. Por definici
on,
FX+Y (u) = P (X + Y u)
Z Z
=
=

fX,Y (x, y) dy dx

{ (x,y) | x+yu }
Z ux

fX,Y (x, y) dy dx.

La regi
on de integraci
on es la siguiente:

y
u

x
x+y u
Derivando respecto de u se obtiene
fX+Y (u) =

fX,Y (x, u x) dx,

que corresponde a la expresi


on (5.3) equivalente a (5.2).

132

Convoluci
on

Definici
on 37 La convoluci
on de dos funciones de densidad continuas f1 y f2 , es
una funci
on de densidad denotada por f1 f2 y definida como sigue
Z
(f1 f2 )(x) =
f1 (x y)f2 (y) dy.

M
as generalmente la convoluci
on de dos funciones de distribuci
on F1 y F2 es la
funci
on de distribuci
on
Z
F1 (x y)dF2 (y).
(F1 F2 )(x) =

En consecuencia, si X y Y son dos variables aleatorias continuas independientes


con correspondientes funciones de densidad f1 (x) y f2 (x) entonces la funci
on de
densidad de X + Y es la convoluci
on (f1 f2 )(x). En el caso cuando X y Y son
discretas independientes con valores enteros, entonces es sencillo verificar que la
funci
on de probabilidad de X + Y es, en completa analoga con (5.4),
X
fX (u k)fY (k).
fX+Y (u) =
k

Distribuci
on de la diferencia
Se encontrar
a ahora una f
ormula para la funci
on de densidad de la diferencia de dos
variables aleatorias.

Proposici
on 47 Sea (X, Y ) un vector absolutamente continuo con funci
on de
on de densidad
densidad fX,Y (x, y). Entonces X Y tiene funci
Z
fXY (u) =
fX,Y (u + v, v) dv.
(5.5)

Demostraci
on. Procedemos como en la secci
on anterior. Sea : R2 R2 la transformaci
on (x, y) = (x y, y) con inversa 1 (u, v) = (u + v, v). El Jacobiano de la

133

transformaci
on inversa es

1 1
J(u, v) = u 11 v 11
u 2
v 2


1 1
=
0 1



= 1.

Por la f
ormula (5.1), fXY,Y (u, v) = fX,Y (u + v, v). Integrando respecto de v se
obtiene (5.5).

Con el cambio de variable z(v) = u + v en (5.5) se obtiene la expresi
on equivalente
Z
fX,Y (z, z u) dz.
(5.6)
fXY (u) =

Cuando X y Y son independientes la f


ormula (5.5) se reduce a
Z
fXY (u) =
fX (u + v)fY (v) dv.

En el caso discreto cuando X y Y son independientes con valores enteros entonces


X Y tambien toma valores enteros y tiene funci
on de probabilidad
X
fX (u + k)fY (k).
fXY (u) =
k

Nuevamente se puede demostrar la proposici


on anterior mediante el procedimiento usual de encontrar primero la funci
on de distribuci
on y despues derivar para
encontrar la funci
on de densidad. Por definici
on
FXY (u) = P (X Y u)
Z Z
=
fX,Y (x, y) dy dx
{ (x,y) | xyu }
Z Z
=
fX,Y (x, y) dy dx.

xu

La regi
on de integraci
on es la siguiente:

xy u
u

134

Derivando respecto de u se obtiene (5.6) equivalente a (5.5). A partir de la f


ormula
para la suma de dos variables aleatorias se puede construir una tercera demostracion
de (5.5). Por la f
ormula para la suma,
Z
fXY (u) = fX+(Y ) (u) =
fX,Y (u v, v) dv.

Haciendo el cambio de variable = v se obtiene


Z
fXY (u) =
fX,Y (u + , ) d

Z
=
fX,Y (u + , ) d.

Distribuci
on del producto
Ahora se encontrar
a una f
ormula para la funci
on de densidad del producto de dos
variables aleatorias absolutamente continuas.

Proposici
on 48 Sea (X, Y ) un vector continuo con funci
on de densidad conjunta
on de densidad
fX,Y (x, y). Entonces XY tiene funci

Z
1
fXY (u) =
fX,Y (u/v, v) dv.
(5.7)
v

Demostraci
on. Se usa nuevamente la f
ormula (5.1). Sea : R2 R2 la transformaci
on (x, y) = (xy, y) cuya inversa es, para v 6= 0, 1 (u, v) = (u/v, v). El Jacobiano
de la transformaci
on inversa es



u 1 v 1 1/v u/v 2 1
1
1
=
= .
J(u, v) =
0
1 v
u 1
v 1
2
2

Por la f
ormula (5.1), para v 6= 0, fXY,Y (u, v) = fX,Y (u/v, v) |1/v|. Integrando respecto de v se obtiene (5.7).

Haciendo x(v) = u/v en (5.7) se obtiene la expresi
on equivalente
Z
1
fXY (u) =
fX,Y (x, u/x) | | dx.
x

Cuando X y Y son independientes la f


ormula (5.7) se reduce a
Z
1
fXY (u) =
fX (u/v)fY (v) | | dv.
v

135

(5.8)

Usaremos el procedimiento usual de encontrar primero la funci


on de distribuci
on de
XY y despues derivar para encontrar la funci
on de densidad. Por definici
on
FXY (u) = P (XY u)
Z Z
=
=

fX,Y (x, y) dy dx

{ (x,y) : xyu }

fX,Y (x, y) dydx +

u/x

Z u/x

fX,Y (x, y) dydx.

La regi
on de integraci
on para u > 0 es la siguiente:
y

x
xy u

Derivando respecto de u,
Z 0
Z
fX,Y (x, u/x)(1/x) dydx +
fX,Y (x, u/x)(1/x) dydx.
fXY (u) =
0
Z

fX,Y (x, u/x)|1/x| dx,


=

que corresponde a (5.8) equivalente a (5.7).

Distribuci
on del cociente
Finalmente se encontrar
a una f
ormula para el cociente de dos variables aleatorias
absolutamente continuas.

Proposici
on 49 Sea (X, Y ) un vector continuo con funci
on de densidad conjunta
fX,Y (x, y) y tal que Y 6= 0. Entonces X/Y tiene funci
on de densidad
Z
fX/Y (u) =
fX,Y (uv, v) |v| dv.
(5.9)

136

Demostraci
on. Procederemos como en las secciones anteriores. Sea : R2 R2 la
transformaci
on (x, y) = (x/y, y) para y 6= 0, y con inversa 1 (u, v) = (uv, v). El
Jacobiano de la transformaci
on inversa es



u 1 v 1 v u
1
1




J(u, v) =
= 0 1 = v.
u 1
v 1
2
2
Por la f
ormula (5.1), fX/Y,Y (u, v) = fX,Y (uv, v) |v|, de donde se obtiene (5.9).
Haciendo x(v) = uv en (5.9) se obtiene la expresi
on equivalente
Z
fX/Y (u) =
fX,Y (x, x/u) |x/u2 | dx.

(5.10)

Observe nuevamente que cuando X y Y son independientes el integrando en la


f
ormula (5.9) se escribe como el producto de las densidades marginales.
Ahora usaremos el procedimiento usual de encontrar primero la funci
on de distribuci
on y despues derivar para encontrar la funci
on de densidad.
FX/Y (u) = P (X/Y u)
Z Z
=
=

fX,Y (x, y) dx dy

{ (x,y) : x/yu }
0 Z

fX,Y (x, y) dx dy +

uy

Z uy

fX,Y (x, y) dx dy.

La regi
on de integraci
on para u > 0 es la siguiente:
y

x
x/y u

Derivando respecto de u,
Z

fX,Y (uy, y)y dy +


fX/Y (u) =

Z
=
fX,Y (uy, y)|y| dy.

137

fX,Y (uy, y)y dy

A partir de la f
ormula para el producto de dos variables aleatorias se puede construir
una tercera demostraci
on de (5.9) de la forma siguiente.

Z
1
fX/Y (u) = fX(1/Y ) (u) =
fX,1/Y (u/v, v) dv.
v

Haciendo el cambio de variable x = 1/v se obtiene


Z
fX/Y (u) =
fX,1/Y (ux, 1/x)|x| dx

Z
=
fX,Y (ux, x)|x| dx.

Las f
ormulas encontradas se resumen en la siguiente tabla.
F
ormulas para la suma, diferencia, producto y cociente
de dos variables aleatorias absolutamente continuas
Z

1. fX+Y (u) =

2. fXY (u) =

fX,Y (u v, v) dv
fX,Y (u + v, v) dv


1
3. fXY (u) =
fX,Y (u/v, v) dv
v

4. fX/Y (u) =

5.3.

fX,Y (uv, v) |v| dv

Ejercicios
Transformaci
on de una v.a.

386. Sea X con distribuci


on unif(0, 1) y sea > 0. Demuestre que la variable
aleatoria Y = (ln X)/ tiene distribuci
on exp().
387. Sea X con distribuci
on exp(). Encuentre la funci
on de densidad y de distribuci
on de Y = 1 exp(X).
388. Encuentre la distribuci
on de Y = 1/X cuando X tiene distribuci
on
a) unif(0, 1).
b) exp().
389. Encuentre la distribuci
on de Y = X n para cada n en N cuando X tiene
distribuci
on
138

a) unif(0, 1).
b) exp().
390. Sea X con distribuci
on unif(1, 1). Encuentre la funci
on de densidad de X 2 .
391. Sea X absolutamente continua con funci
on de distribuci
on F (x). Demuestre
que Y = F (X) tiene distribuci
on unif[0, 1].
392. Encuentre la funci
on de densidad de Y = 1/X cuando X tiene funci
on de
densidad

si 0 < x 1,
1/2
fX (x) =
1/(2x2 ) si x > 1,

0
otro caso.
393. Sea X con distribuci
on unif(a, b). Encuentre la distribuci
on de la variable
aleatoria Y = X/(b X).

Transformaci
on de una vector aleatorio
394. Sean X y Y independientes ambas con distribuci
on unif(0, 1). Encuentre la
funci
on de densidad del vector
a) (X, X + Y ).
b) (X + Y, X Y ).
395. Sean X y Y independientes ambas con distribuci
on unif(1, 1). Encuentre la
funci
on de densidad de
a) (X + Y, X Y ).
b) |Y X|.

c) (X Y, Y X).

396. Sea (X, Y ) un vector con distribuci


on uniforme en el crculo unitario {(x, y) :
on de densidad del vector
x2 + y 2 1}. Encuentre la funci
p
(R, ) = ( X 2 + Y 2 , arctan(Y /X)).

Distribuci
on de la suma
397. Sea (X, Y ) un vector absolutamente continuo con funci
on de densidad fX,Y (x, y).
Demuestre que X + Y tiene funci
on de densidad
Z
fX+Y (u) =
fX,Y (u v, v) dv.

398. Encuentre la funci


on de densidad de la suma de dos variables aleatorias cuya
funci
on de densidad conjunta es
a) f (x, y) =

1
para 0 < x < a, 0 < y < b.
ab
139

b) f (x, y) = exy para x, y > 0.


c) f (x, y) = ey para 0 < x < y.
d) fX,Y (x, y) = 8xy para 0 < x < y < 1.
e) fX,Y (x, y) = 4x(1 y) para 0 < x, y < 1.
399. Encuentre la funci
on de densidad de la suma de dos variables aleatorias independientes cada una de ellas con distribuci
on
a) unif(0, 1).
b) exp().
400. Encuentre la funci
on de densidad de la suma de dos variables aleatorias independientes cada una de ellas con funci
on de densidad
a) f (x) = 2x para 0 < x < 1.
b) f (x) = 6x(1 x) para 0 < x < 1.

c) f (x) = (1 + x)/2 para 1 < x < 1.

401. Sea (X, Y, Z) un vector absolutamente continuo con funci


on de densidad fX,Y,Z (x, y, z).
Demuestre que X + Y + Z tiene funci
on de densidad
Z Z
fX,Y,Z (u y z, y, z) dydz.
fX+Y +Z (u) =

on de
402. Sea (X1 , . . . , Xn ) un vector aleatorio absolutamente continuo con funci
densidad fX1 ,...,Xn (x1 , . . . , xn ). Demuestre que Y = X1 + +Xn tiene funcion
de densidad
Z
Z
fY (u) =

fX1 ,...,Xn (u v2 vn , v2 , . . . , vn ) dv2 dvn .

403. Encuentre la funci


on de densidad de la suma de dos variables aleatorias con
distribuci
on conjunta uniforme en el cuadrado (1, 1) (1, 1).
404. Encuentre la funci
on de densidad de la suma de tres variables aleatorias con
distribuci
on conjunta uniforme en el cubo (1, 1) (1, 1) (1, 1).
405. Encuentre la funci
on de densidad de la suma de n variables aleatorias con
distribuci
on conjunta uniforme en el hipercubo
(1, 1) (1, 1) .
{z
}
|
n

406. Demuestre que la suma de dos variables aleatorias independientes cada una de
ellas con distribuci
on normal tiene nuevamente distribuci
on normal con media
la suma de las medias y varianza la suma de las varianzas.
407. Sean X1 , . . . , Xn independientes en donde Xi tiene distribuci
on N(i , i2 ) para
i = 1, . . . , n. Sean c1 , . . . , cn constantes dadas no todas cero. Demuestre que
n
X
i=1

n
n
X
X
ci Xi N(
ci i ,
c2i i2 ).
i=1

140

i=1

408. Sean X1 , . . . , Xn independientes y con identica distribuci


on N(, 2 ). Demueson N(, 2 /n).
tre que el promedio (X1 + + Xn )/n tiene distribuci
409. Demuestre que la suma de dos variables aleatorias independientes cada una
de ellas con distribuci
on exp() tiene distribuci
on gama(2, ).
410. Demuestre que la suma de dos variables aleatorias independientes con distribuci
on gama(n, ) y gama(m, ), tiene distribuci
on gama(n + m, ).

Distribuci
on de la resta
411. Sea (X, Y ) un vector absolutamente continuo con funci
on de densidad fX,Y (x, y).
Demuestre que X Y tiene funci
on de densidad
Z
fXY (u) =
fX,Y (u + v, v) dv.

412. Encuentre la funci


on de densidad de X Y para (X, Y ) un vector con funcion
de densidad conjunta
1
para 0 < x < a, 0 < y < b.
ab
b) f (x, y) = exy para x, y > 0.

a) f (x, y) =

c) f (x, y) = ey para 0 < x < y.


d) fX,Y (x, y) = 8xy para 0 < x < y < 1.
e) fX,Y (x, y) = 4x(1 y) para 0 < x, y < 1.
413. Encuentre la funci
on de densidad de X Y cuando X y Y son independientes
y ambas con distribuci
on
a) unif(0, 1).
b) exp().
414. Encuentre la funci
on de densidad de X Y cuando X y Y son independientes
y ambas con funci
on de densidad
a) f (x) = 2x para 0 < x < 1.
b) f (x) = 6x(1 x) para 0 < x < 1.

c) f (x) = (1 + x)/2 para 1 < x < 1.

415. Demuestre que la diferencia entre dos variables aleatorias independientes ambas con distribuci
on uniforme en el intervalo (a 1/2, a + 1/2) tiene funci
on
de densidad

1 |u| si 1 < u < 1,
f (u) =
0
otro caso.
416. Demuestre que la diferencia de dos variables aleatorias independientes cada
una de ellas con distribuci
on normal tiene nuevamente distribuci
on normal
con media la diferencia de las medias y varianza la suma de las varianzas.
141

Distribuci
on del producto
417. Sea (X, Y ) un vector absolutamente continuo con funci
on de densidad fX,Y (x, y).
Demuestre que XY tiene funci
on de densidad

Z
1
fXY (u) =
fX,Y (u/v, v) dv.
v

418. Encuentre la funci


on de densidad del producto de dos variables aleatorias
independientes ambas con distribuci
on
a) unif(0, 1).
b) exp().
c) N(0, 1).
419. Encuentre la funci
on de densidad de de producto de dos variables aleatorias
cuya funci
on de densidad conjunta es
1
para 0 < x < a, 0 < y < b.
ab
b) f (x, y) = exy para x, y > 0.

a) f (x, y) =

c) f (x, y) = ey para 0 < x < y.


d) fX,Y (x, y) = 8xy para 0 < x < y < 1.
e) fX,Y (x, y) = 4x(1 y) para 0 < x, y < 1.
420. Encuentre la funci
on de densidad del producto de dos variables aleatorias
independientes cada una de ellas con funci
on de densidad
a) f (x) = 2x para 0 < x < 1.
b) f (x) = 6x(1 x) para 0 < x < 1.

c) f (x) = (1 + x)/2 para 1 < x < 1.

Distribuci
on del cociente
421. Sea (X, Y ) un vector absolutamente continuo con funci
on de densidad fX,Y (x, y)
tal que Y 6= 0. Demuestre que X/Y tiene funci
on de densidad
Z
fX/Y (u) =
fX,Y (uv, v) |v| dv

422. Encuentre la funci


on de densidad de X/Y para (X, Y ) un vector con funcion
de densidad
1
para 0 < x < a, 0 < y < b.
ab
b) f (x, y) = exy para x, y > 0.

a) f (x, y) =

c) f (x, y) = ey para 0 < x < y.


d) f (x, y) = 8xy para 0 < x < y < 1.
142

e) f (x, y) = 4x(1 y) para 0 < x, y < 1.


f ) f (x, y) = 2exy para 0 < x < y.

423. Encuentre la funci


on de densidad de X/Y cuando X y Y son independientes
y ambas con distribuci
on
a) exp().
b) unif(0, 1).
424. Encuentre la funci
on de densidad de X/Y cuando X y Y son independientes
y ambas con densidad
a) f (x) = 2x para 0 < x < 1.
b) f (x) = 6x(1 x) para 0 < x < 1.

c) f (x) = (1 + x)/2 para 1 < x < 1.

425. Sean X y Y independientes con distribuci


on exp(). Encuentre la funci
on de
densidad de
a) X/(X + Y ).
b) Y /(X + Y ).
426. Sean X y Y independientes ambas con distribuci
on normal est
andar. Demuestre que la variable aleatoria X/Y tiene distribuci
on Cauchy.

143

Captulo 6

Distribuciones muestrales y
estadsticas de orden
Se estudian ahora algunas distribuciones de probabilidad que surgen en la estadstica
y otras areas de aplicaci
on de la probabilidad.
Primeramente se define una muestra aleatoria como una colecci
on de variables aleatorias X1 , . . . , Xn que cumplen la condici
on de ser independientes y de tener cada
una de ellas la misma distribuci
on de probabilidad. Al n
umero n se le llama tama
no
de la muestra aleatoria. A menudo se escribe m.a. para abreviar el termino muestra
aleatoria y se usan las siglas v.a.i.i.d. para denotar el termino variables aleatorias
independientes e identicamente distribuidas. Por lo tanto una m.a. es una coleccion
de v.a.i.i.d. Se define tambien una estadstica como una variable aleatoria de la forma g(X1 , . . . , Xn ) en donde X1 , . . . , Xn es una muestra aleatoria y g es una funcion
de Rn en R que es Borel medible. Por ejemplo la media muestral es una estadstica
y definida como sigue
denotada por X
n

X
= 1
Xi .
X
n
i=1

es una combinaci
Observe que X
on lineal de los elementos de la m.a. y por lo tanto
es una v.a. Otro ejemplo importante de estadstica es la varianza muestral, denotada
por S 2 y definida como sigue
n

1 X
2.
S =
(Xi X)
n1
2

i=1

Observe que en el denominador aparece el termino n 1. La media y la varianza


muestrales tienen la caracterstica de ser estimadores insesgados para la media y
la varianza respectivamente de una distribuci
on cualquiera. En particular, cuando
la muestra aleatoria proviene de una distribuci
on normal resulta que la media y la
varianza muestrales son variables aleatorias independientes. Utilizaremos este interesante e inesperado resultado m
as adelante y cuya demostraci
on puede encontrarse
en [14].
144

Proposici
on 50 Sea X1 , . . . , Xn una m.a. de la distribuci
on N(, 2 ). Entonces las
2
y S son independientes.
estadsticas X
Este resultado no es v
alido para cualquier distribuci
on de probabilidad, por ejemplo
no es difcil verificar esta afirmaci
on para una muestra aleatoria de la distribucion
Bernoulli. En la siguiente secci
on se estudian algunas distribuciones de probabilidad
estrechamente relacionadas con la media y la varianza muestral.

6.1.

Distribuciones muestrales

Se estudian a continuaci
on algunas distribuciones de probabilidad que surgen en la
estadstica al considerar funciones de una muestra aleatoria.

Distribuci
on ji-cuadrada
La variable aleatoria continua X tiene una distribuci
on ji-cuadrada con n > 0 grados
de libertad si su funci
on de densidad es

 n/2
1
1

xn/21 ex/2 si x > 0,


(n/2)
2
f (x) =

0
si x 0.
La gr
afica de esta funci
on es

f (x)
n=1
n=2
n=3
n=4

1
2

x
1

Funci
on de densidad 2 (n).

En este caso se escribe X 2 (n) y puede demostrar que E(X) = n y Var(X) = 2n.
Observe que la distribuci
on 2 (n) con n = 2 se reduce a la distribuci
on exp() con
145

= 1/2. La distribuci
on ji-cuadrada puede encontrarse como indican los siguientes
resultados.

Proposici
on 51 Si X N(0, 1) entonces X 2 2 (1).

Demostraci
on. Para x > 0,

1
1
fX 2 (x) = fX ( x) + fX ( x)
2 x
2 x

1
= fX ( x)
x
1 x/2 1

= e
x
2
 1/2
1
1
=
x1/21 ex/2 .
(1/2) 2
Esta expresi
on corresponde a la funci
on de densidad de la distribuci
on 2 (1).

La suma de dos o mas variables aleatorias independientes con distribuci


on ji-cuadrada
es nuevamente una variable aleatoria ji-cuadrada y sus grados de libertad son la suma de los grados de libertad de cada uno de los sumandos. Este es el contenido de
la siguiente proposici
on.

Proposici
on 52 Sean X1 , . . . , Xm independientes tales que Xi tiene distribuci
on
2
(ni ) para i = 1, . . . , m. Entonces
m
X
i=1

Xi 2 (n1 + + nm ).

Demostraci
on. Es suficiente demostrar el resultado para el caso de dos variables
aleatorias. Sean X y Y independientes con distribuci
on ji-cuadrada con grados de
libertad n y m respectivamente. Este ligero cambio en la notaci
on evitar
a el uso de
subndices. Por la f
ormula (5.2), para u > 0,
Z u
fX+Y (u) =
fX (u v)fY (v) dv
0

1
(n/2)

 n/2
1
(u v)n/21 e(uv)/2
2
146

 m/2
1
v m/21 ev/2 dv
2
 (n+m)/2
1
1
eu/2
(n/2)(m/2) 2
Z u
(u v)n/21 v m/21 dv.
1
(m/2)

Haciendo el cambio de variable w(v) = v/u en la integral se obtiene


 (n+m)/2
1
1
fX+Y (u) =
eu/2 u(n+m)/21
(n/2)(m/2) 2
Z 1
(1 w)n/21 wm/21 dw.
0

La integral resultante es B(n/2, m/2). Entonces


 (n+m)/2
B(n/2, m/2)
1
fX+Y (u) =
eu/2 u(n+m)/21
(n/2)(m/2) 2
 (n+m)/2
1
1
=
eu/2 u(n+m)/21 .
((n + m)/2) 2
Esta u
ltima expresi
on es la funci
on de densidad de la distribuci
on 2 (n + m).

El resultado anterior puede demostrarse de una manera m


as simple y elegante usando la funci
on generadora de momentos o la funci
on caracterstica, presentadas en el
siguiente captulo.
Proposici
on 53 Sean X1 , . . . , Xn independientes con distribuci
on N(, 2 ). Entonces
n
X
(Xi )2
2 (n).
2
i=1

Demostraci
on. Esto es una consecuencia sencilla de las dos proposiciones anteriores.
Como cada Xi tiene distribuci
on N(, 2 ) para i = 1, . . . , n, entonces (Xi )/
tiene distribuci
on N(0, 1). Por lo tanto
(Xi )2
2 (1).
2
En consecuencia

n
X
(Xi )2
i=1

2 (n).


Se enuncia el siguiente resultado cuya demostraci


on se pide realizar en el Ejercicio 539 de la p
agina 190, una vez que se cuente con la poderosa herramienta de las
funciones generadoras de momentos.
147

Proposici
on 54 Sean X y Y independientes tales que X tiene distribuci
on 2 (n)
y X + Y tiene distribuci
on 2 (m). Suponga m > n. Entonces Y tiene distribuci
on
2
(m n).

Con ayuda de esta proposici


on se demuestra ahora el siguiente resultado de particular importancia en estadstica.

Proposici
on 55 Sean X1 , . . . , Xn independientes con distribuci
on N(, 2 ). Entonces
n1 2
S 2 (n 1).
2

Demostraci
on.
n
n
X
X
+ (X
)]2
(Xi )2 =
[(Xi X)
i=1

i=1
n
X
i=1

2 + n(X
)2 .
(Xi X)

Diviendo entre 2
n
X
(Xi )2
i=1

n1 2
S +
2


2
X

.
/ n

El termino del lado izquierdo tiene distribuci


on 2 (n) mientras que el segundo su2
mando del lado derecho tiene distribuci
on (1). Por la Proposici
on 54 y recordando
y S 2 son independientes, se concluye que el primer sumando del lado derecho
que X
tiene distribuci
on 2 (n 1).


Distribuci
on t
La variable aleatoria continua X tiene una distribuci
on t de Student con n > 0
grados de libertad si su funci
on de densidad est
a dada por
((n + 1)/2)
f (x) =
(1 + x2 /n)(n+1)/2
n (n/2)
cuya gr
afica es
148

para < x < ,

f (x)

n = 100
n=3
n=1

0.1
x
4 3 2 1

Funci
on de densidad t(n).

En este caso se escribe X t(n). Esta distribuci


on apareci
o por primera vez en
1908 en un trabajo publicado por William Gosset bajo el el seud
onimo de Student.
Se puede demostrar que E(X) = 0 y Var(X) = n/(n 2) para n > 2. La primera
igualdad establece entonces que la distribuci
on t(n) se encuentra siempre centrada
en cero para cualquier valor del par
ametro n. Se muestran a continuaci
on algunas
formas en las que surge esta distribuci
on.

Proposici
on 56 Sean X N(0, 1) y Y 2 (n) independientes. Entonces
X
p
t(n).
Y /n

Demostraci
on. Por independencia, la funci
on de densidad conjunta de X y Y es,
para y > 0,
1
1
2
fX,Y (x, y) = ex /2
(n/2)
2

 n/2
1
y n/21 ey/2 .
2

Se aplica la f
ormula (5.1) para la transformaci
on
p
(x, y) = (x, x/ y/n)
con inversa

1 (s, t) = (s, ns2 /t2 ).


El Jacobiano de la transformaci
on

x/s x/t
J(s, t) =
y/s y/t

inversa es


1
0
=
2sn/t2 2ns2 /t3
149



= 2ns2 /t3 .

Por lo tanto
fS,T (s, t) = fX (s)fY (ns2 /t2 ) 2ns2 /t3
 n/2 n/21 n2
1 s2 /2
1
n
s
1
2
2

=
e

ens /2t 2ns2 /t3 .


n2
(n/2)
2
t
2
Integrando respecto de s,
1
nn/2
fT (t) =
2 2n/21 (n/2)tn+1

s e

1
+ n
2 2t2

ds.

2
Ahora efectuamos
 el cambio de variable r(s) = s
1
n
dr = 2s 2 + 2t2 ds, y entonces

fT (t) =

2
n s

1
2

n
2t2

1
nn/2


2 2n/21 (n/2)tn+1 2 1 + n2 (n+1)/2
2
2t
((n + 1)/2)
1

,
2
n (n/2) (1 + t /n)(n+1)/2

, de donde obtenemos

r (n1)/2 er dr

correspondiente a la funci
on de densidad de la distribuci
on t(n).

El siguiente resultado es de particular importancia en estadstica para efectuar estimaciones del par
ametro de una poblaci
on normal cuando la varianza 2 es desconocida.

Proposici
on 57 Sea X1 , . . . , Xn una m.a. de una distribuci
on N(, 2 ). Entonces

X
t(n 1).
S/ n

Demostraci
on. Use la Proposici
on 56 aplicada a las variables aleatorias independientes

X

N (0, 1)
/ n
n1 2
y
S 2 (n 1).
2


150

Distribuci
on F
La variable aleatoria continua X tiene una distribuci
on F de Snedecor con par
ametros n > 0 y m > 0 si su funci
on de densidad es

n (n+m)/2
((n + m)/2)  n n/2 n/21 

x
1
+
x
si x > 0,

(n/2) (m/2) m
m
f (x) =

0
si x 0.
Se escribe X F(n, m). En la siguiente figura se muestra el comportamiento de
esta funci
on de densidad.

f (x)
3/4

n=4
m = 100
n=1
m=5

x
1

Funci
on de densidad F (n, m).

Puede demostrarse que


E(X) =
Var(X) =

m
para m > 2,
m2
2m2 (m + n 2)
para m > 4.
n(m 2)2 (m 4)

Los siguientes resultados indican la forma de obtener la distribuci


on F .

Proposici
on 58 Sean X 2 (n) y Y 2 (m) independientes. Entonces
X/n
F(n, m).
Y /m

151

Este resultado se obtiene directamente de la aplicaci


on de la f
ormula (5.9) para la
funci
on de densidad del cociente de dos variables aleatorias.

Proposici
on 59 Si X t(m) entonces X 2 F(1, m).

Para demostrar este resultado aplique la f


ormula

1
1
fX 2 (x) = fX ( x) + fX ( x) .
2 x
2 x

6.2.

Estadsticas de orden

Dada una muestra aleatoria X1 , . . . , Xn , podemos evaluar cada una de estas variables en un punto muestral cualquiera y obtener una colecci
on de n
umeros reales
X1 (), . . . , Xn (). Estos n
umeros pueden ser ordenados de menor a mayor incluyendo repeticiones. Si X(i) () denota el i-esimo n
umero ordenado, tenemos entonces la
colecci
on no decreciente de n
umeros reales
X(1) () X(n) ().
Ahora hacemos variar el argumento y lo que se obtiene son las as llamadas
estadsticas de orden. Este proceso de ordenamiento resulta ser de importancia en
algunas aplicaciones. Tenemos entonces la siguiente definici
on.

Definici
on 38 (Estadsticas de orden) Sea X1 , . . . , Xn una muestra aleatoria.
A las variables aleatorias ordenadas
X(1) = mn{X1 , . . . , Xn }
..
.
X(n) = m
ax{X1 , . . . , Xn }
se les conoce con el nombre de estadsticas de orden. A X(1) se le llama primera
estadstica de orden, a X(2) se le llama segunda estadstica de orden, etc. A X(i)
se le llama i-esima estadstica de orden, i = 1, . . . , n.

Nuestro objetivo en esta secci


on es encontrar algunas f
ormulas relacionadas con
las distribuciones de probabilidad de las estadsticas de orden cuando se conoce la
distribuci
on de cada variable de la muestra aleatoria.
152

Distribuciones individuales
Comenzamos encontrando la distribuci
on de la primera y de la u
ltima estadstica
de orden de manera individual.

Proposici
on 60 Sea X1 , . . . , Xn una m.a. de una distribuci
on continua con funci
on de densidad f (x) y funci
on de distribuci
on F (x). Entonces
1. fX(1) (x) = nf (x) [1 F (x)]n1 .
2. fX(n) (x) = nf (x) [F (x)]n1 .

Demostraci
on. Para verificar (1) se calcula primero la funci
on de distribuci
on
FX(1) (x) = P (X(1) x)

= P (mn{X1 , . . . , Xn } x)

= 1 P (mn{X1 , . . . , Xn } > x)
= 1 P (X1 > x, . . . , Xn > x)
= 1 [P (X1 > x)]n
= 1 [1 F (x)]n .

Entonces fX(1) (x) = nf (x) [1 F (x)]n1 . Para demostrar (2) se procede de manera
an
aloga,
FX(n) (x) = P (X(n) x)

= P (m
ax{X1 , . . . , Xn } x)

= P (X1 x, . . . , Xn x)
= [P (X1 x)]n
= [F (x)]n .
Por lo tanto fX(n) (x) = nf (x) [F (x)]n1 .

Ahora se presenta el resultado general de la funci


on de densidad de la i-esima estadstica de orden.

Proposici
on 61 Sea X1 , . . . , Xn una m.a. de una distribuci
on continua con funci
on de densidad f (x) y funci
on de distribuci
on F (x). Entonces


n
fX(i) (x) =
i f (x)[F (x)]i1 [1 F (x)]ni .
i

153

Demostraci
on. Sea Yi la variable aleatoria dada por

1 si Xi x,
Yi = 1(,x] (Xi ) =
0 si Xi > x,
en donde Xi es el i-esimo elemento de la muestra aleatoria. Las variables Y1 , . . . , Yn
son independientes y cada una de ellas puede considerarse un ensayo Bernoulli con
probabilidad de exito, es decir tomar el valor 1, igual a P (Xi x) = F (x). Entonces
la suma Y1 + + Yn corresponde al n
umero de v.a.s Xi que cumplen la condici
on
Xi x y por lo tanto esta suma tiene distribuci
on bin(n, p) con p = F (x). Entonces
FX(i) (x) = P (X(i) x)

= P (Y1 + + Yn i)

n 
X
n
=
[F (x)]j [1 F (x)]nj .
j
j=i

Derivando y despues simplificando,



n 
X
n
fX(i) (x) =
f (x)[F (x)]j1 [1 F (x)]nj1 [j nF (x)]
j
j=i

n 
X
n
=
f (x)[F (x)]j1 [1 F (x)]nj1 [j(1 F (x)) (n j)F (x)]
j
j=i


n
=
i f (x)[F (x)]i1 [1 F (x)]ni .
i

Observe que la f
ormula recien demostrada se reduce a las que aparecen en la Proposici
on 60 cuando i = 1 e i = n. Ahora se presenta una demostraci
on corta e intuitiva
del mismo resultado. Sea h > 0 arbitrario y considere los siguientes tres intervalos
ajenos (, x], (x, x + h] y (x + h, ).

i1

ni

1
x

x+h

La probabilidad de que i 1 variables de la muestra tomen un valor en el intervalo


(, x], una de ellas en (x, x + h] y el resto n i en (x + h, ) es, de acuerdo a la
distribuci
on multinomial,
n!
[F (x)]i1 [F (x + h) F (x)][1 F (x + h)]ni .
(i 1)! 1! (n i)!
154

Haciendo h tender a cero se obtiene




n
fX(i) (x) =
i f (x)[F (x)]i1 [1 F (x)]ni .
i
A la variable aleatoria R definida como la diferencia X(n) X(1) se le conoce como
el rango de la muestra. El siguiente resultado provee de una f
ormula para la funcion
de densidad de esta variable.

Proposici
on 62 Sea X1 , . . . , Xn una m.a. de una distribuci
on continua con funci
on de densidad f (x) y funci
on de distribuci
on F (x). Entonces para r > 0,
Z
f (v)f (r + v)[F (r + v) F (v)]n2 dv.
fR (r) = n(n 1)

Demostraci
on. Para x < y,
FX(1) ,X(n) (x, y) = P (X(1) x, X(n) y)

= P (X(n) y) P (X(n) y, X(1) > x)

= [F (y)]n P (x < X1 y, . . . , x < Xn y)

= [F (y)]n [F (y) F (x)]n .

Por lo tanto, fX(1) ,X(n) (x, y) = n(n 1)f (x)f (y)[F (y) F (x)]n2 para n 2. Ahora
se usa la f
ormula
Z
fY X (u) =
fX,Y (v, u + v) dv

equivalente a (5.5) para la diferencia de dos variables aleatorias. Entonces para r > 0,
Z
fX(n) X(1) (r) = n(n 1)
f (v)f (r + v)[F (r + v) F (v)]n2 dv.

Distribuciones conjuntas
Ahora se presentan dos resultados acerca de la distribuci
on conjunta de las estadsticas de orden. El primer resultado trata acerca de la distribuci
on conjunta de todas
ellas y despues se considera la distribuci
on de cualesquiera dos.

155

Proposici
on 63 Sea X1 , . . . , Xn una m.a. de una distribuci
on continua con funci
on de densidad f (x). Para x1 < < xn ,
fX(1) ,...,X(n) (x1 , . . . , xn ) = n!f (x1 ) f (xn ).

Demostraci
on. Se considera la funci
on de distribuci
on conjunta de todas las estadsticas de orden y despues se deriva n veces para encontrar la funci
on de densidad. Para
x1 < x2 < < xn ,
FX(1) ,...,X(n) (x1 , . . . , xn ) = P (X(1) x1 , X(2) x2 , . . . , X(n) xn ).
Como (X(2) x2 ) = (x1 < X(2) x2 ) (X(2) x1 ) se obtiene la expresi
on
FX(1) ,...,X(n) (x1 , . . . , xn ) = P (X(1) x1 , x1 < X(2) x2 , . . . , X(n) xn )
+ P X(1) x1 , X(2) x1 , . . . , X(n) xn ).

Observe que el segundo sumando no depende de x2 asi es que al tomar la derivada


respecto de esta variable, este termino desaparece. De manera an
aloga procedemos
con los eventos (X(3) x3 ) hasta (X(n) xn ). Al final se obtiene
fX(1) ,...,X(n) (x1 , . . . , xn )
=

n
P (X(1) x1 , x1 < X(2) x2 , . . . , xn1 < X(n) xn ).
x1 xn

Como ahora los intervalos involucrados son disjuntos, la distribuci


on multinomial
asegura que
P (X(1) x1 , x1 < X(2) x2 , . . . , xn1 < X(n) xn )

= n! P (X1 x1 , x1 < X2 x2 , . . . , xn1 < Xn xn )


= n! F (x1 )[F (x2 ) F (x1 )] [F (xn ) F (xn1 )],

en donde la u
ltima igualdad se sigue de la independencia e identica distribucion
de las variables de la muestra. Ahora solo resta derivar para encontrar el resultado
buscado, siendo m
as sencillo encontrar las derivadas en el orden inverso.

La siguiente es una prueba corta pero no formal del mismo resultado. Sea x1 < x2 <
< xn y h > 0 suficientemente peque
no tal que los intervalos (x1 , x1 + h], (x2 , x2 +
h], . . . , (xn , xn + h] son ajenos.

x1

x2

156

xn

La probabilidad de que las variables aleatorias tomen valores cada una de ellas en
uno y solo uno de estos intervalos es, de acuerdo a la distribuci
on multinomial,
n!
[F (x1 + h) F (x1 )] [F (xn + h) F (xn )].
1! 1!
Haciendo h tender a cero se obtiene
fX(1) ,...,X(n) (x1 , . . . , xn ) = n!f (x1 ) f (xn ).
Ahora nos interesa encontrar una f
ormula para la densidad conjunta de cualesquiera
dos estadsticas de orden.

Proposici
on 64 Sea X1 , . . . , Xn una m.a. de una distribuci
on continua con funci
on de distribuci
on F (x) y funci
on de densidad f (x). Sea i < j. Para x < y,


n
fX(i) ,X(j) (x, y) =
i(j i) f (x)f (y)
i, j i, n j
[F (x)]i1 [F (y) F (x)]ji1 [1 F (y)]nj .

Demostraci
on intuitiva. Para x < y considere los intervalos ajenos (, x], (x, x+h],
(x + h, y], (y, y + h] y (y + h, ) para h > 0 suficientemente peque
na.

i1

1
x

j i+1

1
y

x+h

nj

y+h

La probabilidad de que i 1 variables de la muestra tomen un valor en (, x],


una de ellas en (x, x + h], j i + 1 variables en (x + h, y], otra en (y, y + h] y el
resto n j variables tomen un valor en (y + h, ) es, de acuerdo a la distribucion
multinomial,
n!
[F (x)]i1 [F (x + h) F (x)]
(i 1)! 1! (j i 1)! 1! (n j)!

[F (y) F (x + h)]ji1 [F (y + h) F (y)][1 F (y + h)]nj .

Haciendo h tender a cero se obtiene la f


ormula anunciada.


157

6.3.

Ejercicios

427. Sea X1 , . . . , Xn una muestra aleatoria de una distribuci


on con media y va2
2
2

rianza . Demuestre que E(X) = y E(S ) = . Estos resultados son de


y S 2 son estimadores insesgados
importancia en estadstica y muestran que X
2
de los par
ametros y respectivamente.
on con media y varianza 2 .
428. Sea X1 , . . . , Xn una m.a. de una distribuci
Demuestre que
= 2 /n.
a) Var(X)
429. Sea X1 , . . . , Xn una m.a. de una distribuci
on Ber(p). Demuestre que las es2

tadsticas X y S no son independientes.

Distribuci
on 2
430. Demuestre que la funci
on de densidad de la distribuci
on 2 (n) efectivamente
lo es.
431. Demuestre que la distribuci
on 2 (n) con n = 2 se reduce a la distribucion
exp() con = 1/2.
432. Demuestre que la distribuci
on gama(n/2, ) con = 1/2 se reduce a la distri2
buci
on (n).
433. Sea X con distribuci
on 2 (n). Demuestre que
a) E(X) = n.
(m + n/2)
para m = 1, 2, . . .
(n/2)
c) Var(X) = 2n.

b) E(X m ) = 2m

434. Demuestre que si X N(0, 1) entonces X 2 2 (1).


435. Sean X1 , . . . , Xn independientes con distribuci
on N(, 2 ). Demuestre que
)2
(X
2 (1).
2 /n
436. Demuestre que si X1 , . . . , Xm son independientes tales que Xi 2 (ni ) para
i = 1, . . . , m entonces
m
X
i=1

Xi 2 (n1 + + nm ).

on N(0, 1). Demuestre que


437. Sean X1 , . . . , Xn independientes con distribuci
n
X
i=1

Xi2 2 (n).
158

438. Sean X1 , . . . , Xn independientes tales que cada Xi tiene distribuci


on N(i , i2 )
para i = 1, . . . , n. Demuestre que
n
X
(Xi i )2
i=1

i2

2 (n).

439. Sean X1 , . . . , Xn independientes con distribuci


on N(, 2 ). Demuestre que
(n 1) 2
S 2 (n 1).
2
440. Sean X y Y independientes ambas con distribuci
on normal est
andar. Sean
R = X 2 + Y 2 y = tan1 (Y /X). Demuestre que
a) R2 tiene distribuci
on 2 (n) con n = 2 grados de libertad.
b) tan tiene distribuci
on Cauchy.
c) R y son independientes.

Distribuci
on t
441. Demuestre que la funci
on de densidad de una distribuci
on t(n) efectivamente
lo es.
442. Sea X con distribuci
on t(n). Demuestre que
a) E(X) = 0.
b) Var(X) =

n
n2

para n > 2.

443. Demuestre que la distribuci


on t(n + 1) tiene momentos finitos de orden menor
o igual a n pero ning
un otro momento de orden superior.
444. Sean X N(0, 1) y Y 2 (n) independientes. Demuestre que
X
p
t(n).
Y /n

445. Sea X1 , . . . , Xn una m.a. de una poblaci


on N(, 2 ). Demuestre que

X
t(n 1).
S/ n

Distribuci
on F
446. Demuestre que la funci
on de densidad de la distribuci
on F(n, m) efectivamente
lo es.
447. Sea X con distribuci
on F(n, m). Demuestre que
a) E(X) =

m
m2

para m > 2.
159

b) Var(X) =

2m2 (m + n 2)
n(m 2)2 (m 4)

para m > 4 .

448. Sea X con distribuci


on F(n, m). Demuestre que Y = 1/X tiene distribucion
F(m, n). Observe el cambio en el orden de los par
ametros. Este resultado es
u
til para obtener valores de F que no aparecen en tablas.
449. Sea X con distribuci
on F(n, m). Demuestre que cuando m tiende a infinito la
funci
on de densidad de nX converge puntualmente a la funci
on de densidad
2
de la distribuci
on (n).
450. Sean X 2 (n) y Y 2 (m) independientes. Demuestre que
X/n
F(n, m).
Y /m
451. Demuestre que si X t(n) entonces X 2 F(1, n).

Estadsticas de orden: distribuciones individuales


452. Sea X1 , . . . , Xn una m.a. de una distribuci
on continua F (x) con funci
on de
densidad f (x). Demuestre nuevamente que
a) fX(1) (x) = nf (x) [1 F (x)]n1 .
b) fX(n) (x) = nf (x) [F (x)]n1 .

453. Demuestre que las funciones fX(1) (x) y fX(n) (x) del ejercicio anterior son efectivamente funciones de densidad.
454. Sea X1 , . . . , Xn una m.a. de una distribuci
on continua F (x) con funci
on de
densidad f (x). Demuestre nuevamente que


n
i f (x)[F (x)]i1 [1 F (x)]ni
fX(i) (x) =
i
y compruebe que esta es efectivamente una funci
on de densidad.
455. Compruebe que la f
ormula de la Proposici
on 61 se reduce a la f
ormulas (1) y
(2) de la Proposici
on 60 cuando i = 1 e i = n respectivamente.
on unif(0, 1). Demuestre que la i456. Sea X1 , . . . , Xn una m.a. de una distribuci
esima estadstica de orden tiene distribuci
on beta(i, n + 1 i). Encuentre por
lo tanto su esperanza y varianza.
457. Sea X1 , . . . , Xn una m.a. de una distribuci
on exp(). Encuentre la funci
on de
densidad de la i-esima estadstica de orden.
458. Sean X(1) , X(2) las estadsticas de orden de una m.a. de tama
no dos de una

distribuci
on N(, 2 ). Demuestre que E[X(1) ] = / .
no dos de una
459. Sean X(1) , X(2) las estadsticas de orden de una m.a. de tama
distribuci
on N(, 2 ). Calcule E[X(2) ].
160

460. Sea X1 , . . . , Xn una m.a. de una distribuci


on F (x). Sea x un n
umero real
cualquiera y para i = 1, . . . , n defina
Yi = 1(,x] (Xi ).
Demuestre que Y1 , . . . , Yn son independientes cada una de ellas con distribuci
on Ber(n, p) con p = F (x). Este hecho fue utilizado en el procedimiento
para encontrar la funci
on de densidad de la i-esima estadstica de orden en la
Proposici
on 61.
461. Sean X1 y X2 absolutamente continuas e independientes y defina Y = m
ax{X1 , X2 }.
Demuestre que
a) FY (y) = FX1 (y)FX2 (y).
b) fY (y) = FX1 (y)fX2 (y) + fX1 (y)FX2 (y).
c) fY (y) = 2FX (y)fX (y) cuando X1 y X2 tienen la misma distribuci
on.
462. Use el ejercicio anterior para encontrar la funci
on de densidad de Y = m
ax{X1 , X2 }
cuando X1 y X2 son independientes cada una con distribuci
on
a) unif(0, 1).
b) exp().
463. Sean X1 y X2 absolutamente continuas e independientes. Defina Y = mn{X1 , X2 }.
Demuestre que
a) FY (y) = 1 [1 FX1 (y)][1 FX2 (y)].

b) fY (y) = [1 FX1 (y)]fX2 (y) + fX1 (y)[1 FX2 (y)].

c) fY (y) = 2[1 FX (y)]f (y) cuando X1 y X2 tienen la misma distribucion.

464. Use el ejercicio anterior para encontrar la funci


on de densidad del mnimo de
dos variables aleatorias independientes cada una con distribuci
on uniforme en
el intervalo (0, 1).
465. Demuestre que el mnimo de n variables aleatorias independientes con distribuci
on exponencial es nuevamente exponencial con par
ametro la suma de los
par
ametros.
466. Sea X1 , . . . , Xn una m.a. de una distribuci
on continua F (x) con funci
on de
densidad f (x). Sea R = X(n) X(1) el rango de la muestra. Demuestre que
para r > 0 y n 2,
Z
fR (r) = n(n 1)
f (y)f (y r)[F (y) F (y r)]n2 dy.

467. Se escogen n puntos al azar del intervalo unitario (0, 1). Demuestre que la
funci
on de densidad de la distancia m
axima R entre cualesquiera dos puntos
es

n(n 1)r n2 (1 r) si 0 < r < 1,
fR (r) =
0
otro caso.
161

Estadsticas de orden: distribuciones conjuntas


468. Sea X1 , . . . , Xn una m.a. de una distribuci
on continua con funci
on de densidad
f (x). Demuestre nuevamente que para x1 < x2 < < xn ,
fX(1) ,...,X(n) (x1 , . . . , xn ) = n!f (x1 ) f (xn )
y compruebe que esta es efectivamente una funci
on de densidad.
on de den469. A partir de la f
ormula para fX(1) ,...,X(n) (x1 , . . . , xn ) calcule la funci
sidad marginal de X(1) encontrando nuevamente que
fX(1) (x) = nf (x)[1 F (x)]n1 .
470. A partir de la f
ormula para fX(1) ,...,X(n) (x1 , . . . , xn ) calcule la funci
on de densidad marginal de X(n) encontrando nuevamente que
fX(n) (x) = nf (x)[F (x)]n1 .
471. A partir de la f
ormula para fX(1) ,...,X(n) (x1 , . . . , xn ) calcule la funci
on de densidad marginal de X(i) para i = 1, . . . , n encontrando nuevamente que


n
fX(i) (x) =
i f (x)[F (x)]i1 [1 F (x)]ni .
i
472. Sea X1 , . . . , Xn una m.a. de una distribuci
on continua con funci
on de distribuci
on F (x) y funci
on de densidad f (x). Sea i < j. Demuestre nuevamente
que para x < y,


n
fX(i) ,X(j) (x, y) =
i(j i) f (x)f (y)
i, j i, n j
[F (x)]i1 [F (y) F (x)]ji1 [1 F (y)]nj

y compruebe que esta es una funci


on de densidad bivariada.
473. A partir de la f
ormula para fX(i) ,X(j) (x, y) calcule la funci
on de densidad marginal de X(i) encontrando nuevamente que


n
fX(i) (x) =
i f (x)[F (x)]i1 [1 F (x)]ni .
i
474. Sea X1 , . . . , Xn una m.a. de una distribuci
on unif(0, 1). Encuentre la funcion
de densidad de
a) X(1) y X(2) conjuntamente.
b) R = X(n) X(1) .
475. Sea X1 , . . . , Xn una m.a. de una distribuci
on unif(0, 1). Encuentre la funcion
de densidad de la mediana muestral
a) para n impar.
162

b) para n par.
476. Sea X1 , . . . , Xn una m.a. de una distribuci
on unif(0, 1). Encuentre la funcion
de densidad del vector (X(1) , . . . , X(n) ).
477. Sea X1 , . . . , Xn una m.a. de una distribuci
on unif(0, 1). Calcule el coeficiente
de correlaci
on entre X(i) y X(j) .
on continua F (x) con funci
on de
478. Sea X1 , . . . , Xn una m.a. de una distribuci
densidad f (x). Demuestre directamente que para x < y,
fX(1) ,X(n) (x, y) = n(n 1)f (x)f (y)[F (y) F (x)]n2 .
479. Utilice el ejercicio anterior para obtener la densidad conjunta de X(1) y X(n)
para una m.a. de tama
no n de una distribuci
on
a) unif(0, 1).
b) exp().
no n de una
480. Calcule la covarianza entre X(1) y X(n) para una m.a. de tama
distribuci
on
a) unif(0, 1).
b) exp().

163

Captulo 7

Convergencia
En este captulo se presenta una introducci
on al tema de convergencia de variables
aleatorias. Se estudian distintas formas en que una sucesi
on de variables aleatorias
puede converger.

7.1.

Convergencia puntual

Sea X1 , X2 , . . . una sucesi


on infinita de variables aleatorias. Al evaluar cada una de
estas variables en un elemento de se obtiene la sucesi
on numerica X1 (), X2 (), . . ..
Suponga que esta sucesi
on converge a un cierto n
umero real denotado por X().
Si lo anterior se cumple para todos y cada uno de los elementos de entonces se
dice que la sucesi
on de variables aleatorias converge puntualmente y su lmite es la
funci
on X : R definida naturalmente por
X() = lm Xn ().
n

Se ha demostrado antes que en esta situaci


on la funci
on lmite X es efectivamente
una variable aleatoria. Formalmente se tiene entonces la siguiente defininici
on.

Definici
on 39 (Convergencia puntual) La sucesi
on X1 , X2 , . . . converge puntualmente a X si para cada en ,
X() = lm Xn ().
n

Ejemplo. Considere el espacio medible ([0, 1], B[0, 1]) y defina la sucesion de va-

riables aleatorias Xn () = n . Entonces para [0, 1), Xn () 0. Mientras que


para = 1, Xn () = 1. De esta manera la sucesi
on converge puntualmente a la
164

variable aleatoria
X() =

0 si [0, 1),
1 si = 1.

En algunas situaciones la convergencia puntual resulta ser muy fuerte pues se pide
la convergencia de la sucesi
on evaluada en todos y cada uno de los elementos de
. Se puede ser menos estricto y pedir por ejemplo que la convergencia se efect
ue
en todo el espacio excepto en un subconjunto de probabilidad cero. Este tipo de
convergencia menos restrictiva se llama convergencia casi segura, y se estudia en las
siguientes secciones junto con otros tipos de convergencia.

7.2.

Convergencia casi segura

Definici
on 40 (Convergencia casi segura) La sucesi
on X1 , X2 , . . . converge
casi seguramente a X si
P { : lm Xn () = X()} = 1.
n

Por lo tanto, en la convergencia casi segura se permite que para algunos valores
de la sucesi
on numerica X1 (), X2 (), . . . pueda no converger, sin embargo el
subconjunto de en donde esto suceda debe tener probabilidad cero. Para indicar
c.s.
la convergencia casi segura se escribe Xn X o bien lm Xn = X c.s. A menudo
n
se utiliza el termino convergencia casi dondequiera o bien convergencia casi siempre
para denotar este tipo de convergencia. Observe que omitiendo el argumento , la
condici
on para la convergencia casi segura se escribe en la forma m
as corta
P ( lm Xn = X) = 1,
n

o simplemente P (Xn X) = 1. Se asume que el conjunto (Xn X) es medible de


tal forma que aplicar la probabilidad tiene sentido.

Ejemplo. Considere el espacio de probabilidad ([0, 1], B[0, 1], P ) con P la medida
uniforme, es decir, P (a, b) = b a. Defina la sucesi
on de variables aleatorias

1 si 0 1/n,
Xn () =
0 otro caso.

Cuyas gr
aficas son:

165

Xn ()
b

bc

1/n

La variable aleatoria Xn .

Observe que Xn tiene distribuci


on Bernoulli con par
ametro p = 1/n. La sucesion
Xn converge casi seguramente a la variable aleatoria constante cero. Para demostrar
esto se necesita verificar que P (Xn 0) = 1. Pero esta igualdad es evidente a partir
del hecho de que
{ : lm Xn () = 0} = (0, 1]
n

cuya probabilidad es uno. El punto = 0 es el u


nico punto muestral para el cual
c.s.

Xn () no converge a cero. Esto demuestra que Xn 0.

7.3.

Convergencia en probabilidad

Definici
on 41 (Convergencia en probabilidad) La sucesi
on X1 , X2 , . . . converge en probabilidad a X si para cada > 0
lm P { : |Xn () X()| > } = 0.

Para denotar la convergencia en probabilidad se escribe Xn X, y omitiendo el


argumento la condici
on se escribe
lm P (|Xn X| > ) = 0.

M
as adelante se demostrara que la convergencia en probabilidad es un tipo de convergencia a
un m
as relajada que la convergencia casi segura.

166

7.4.

Convergencia en media

Definici
on 42 (Convergencia en media) La sucesi
on X1 , X2 , . . . converge en
media a X si
lm E|Xn X| = 0.
n

Observe que para este tipo de convergencia tanto los elementos de la sucesi
on como
el lmite mismo deben ser variables aleatorias con esperanza finita. A este tipo de
m
convergencia tambien se le llama convergencia en L1 y se le denota por Xn X
L1

o Xn X.

7.5.

Convergencia en media cuadr


atica

Definici
on 43 (Convergencia en media cuadr
atica) La sucesi
on X1 , X2 , . . .
converge en media cuadr
atica a X si
lm E|Xn X|2 = 0.

En la convergencia en media cuadr


atica se asume que tanto los elementos de la
sucesi
on como el lmite mismo son variables aleatorias con segundo momento finito.
A este tipo de convergencia tambien se le llama convergencia en L2 y se le denota
m.c.

L2

por Xn X o Xn X.

167

7.6.

Convergencia en distribuci
on

Definici
on 44 (Convergencia en distribuci
on) La sucesi
on X1 , X2 , . . . converge en distribuci
on a X si
lm FXn (x) = FX (x)

para todo punto x en donde FX (x) es continua.

En este caso se escribe Xn X. A este tipo de convergencia se le conoce tambien


con el nombre de convergencia debil y ello se debe a que esta forma de convergencia
es la menos restrictiva de todas las mencionadas anteriormente.

Ejemplo. Considere la sucesion X1 , X2 , . . . en donde Xn tiene distribucion N(0, 2 /n).


d

Demostraremos que Xn 0. Como

entonces

FXn (x) = p

1
2 2 /n

eu

2 /2( 2 /n)

du,

0
1/2
lm FXn (x) =
n

si x < 0,
si x = 0,
si x > 0.

Por otro lado, la variable aleatoria constante X = 0 tiene funci


on de distribuci
on

0 si x < 0,
FX (x) =
1 si x 0.
d

Tenemos entonces que Xn 0 pues lm FXn (x) = FX (x) para todo punto x
n

donde FX (x) es continua, esto es, para todo x en el conjunto R \ {0}. Observe que
no hay convergencia de las funciones FXn (x) en el punto de discontinuidad x = 0.
A manera de resumen se presenta en la siguiente tabla las definiciones de los distintos
tipos de convergencia mencionados. En la siguiente secci
on se estudian las relaciones
entre estos tipos de convergencia.

168

Convergencia

Definici
on

Puntual

Xn () X() para cada en

Casi segura

P (Xn X) = 1

En media

E|Xn X| 0

En media cuadr
atica

E|Xn X|2 0

En probabilidad

P (|Xn X| > ) 0

En distribuci
on

FXn (x) FX (x) en puntos de continuidad x de FX

7.7.

Relaciones generales entre


los tipos de convergencia

En esta secci
on se establecen algunas relaciones entre los distintos tipos de convergencia de variables aleatorias vistos en la secci
on anterior. En la siguiente figura se
ilustran de manera gr
afica estas relaciones.

Conv.

Conv.
en m. c.

casi
segura

Conv. en m.
Conv. en probabilidad
Conv. en distribuci
on
Relaci
on entre los tipos de convergencia.

En este diagrama la contenci


on se interpreta como implicaci
on, por ejemplo, la
convergencia casi segura implica la convergencia en probabilidad y esta a su vez

implica la convergencia en distribuci


on. Estos
y otros resultados se demuestran a
continuaci
on.

169

Proposici
on 65 Convergencia c.s. = convergencia en prob.

c.s.

Demostraci
on. Suponga Xn X. Sea > 0 y defina los eventos
An =

k=n

(|Xk X| > ).

Esta sucesi
on es decreciente y su lmite es entonces la intersecci
on de todos los
eventos. Como (|Xn X| > ) An entonces P (|Xn X| > ) P (An ). Por lo
tanto
lm P (|Xn X| > )

lm P (An )

= P ( lm An )
n

= P(

An )

n=1

= P (|Xn X| > para cada n 1 )


= P ( lm Xn 6= X)
n

= 0.


El recproco de la proposici
on anterior es falso, es decir, la convergencia en probabilidad no implica necesariamente la convergencia casi siempre. Para ilustrar esta
afirmaci
on se proporciona a continuaci
on un contraejemplo.

Ejemplo. [Convergencia en prob. =


6
Convergencia c.s.] Considere el espacio ((0, 1), B(0, 1), P )
con P la medida de probabilidad uniforme. Defina los eventos
A1 = (0, 1/2), A2 = (1/2, 1),
A3 = (0, 1/3), A4 = (1/3, 2/3), A5 = (2/3, 1),
A6 = (0, 1/4), A7 = (1/4, 2/4), A8 = (2/4, 3/4), A9 = (3/4, 1),

Sea Xn = 1An . Las gr


aficas de las primeras funciones se muestran a continuaci
on.

X1
1

c
b

X2
c
b

X3
c
b

bc

bc

X4

bc

1
170

bc

X5
bc

bc

bc

Entonces Xn 0 pues para cualquier > 0,


lm P (|Xn 0| > ) = lm P (An ) = 0.

Sin embargo la sucesi


on no converge casi seguramente pues
{w : lm Xn (w) existe } = .
n

Ejemplo. [Convergencia en m. =
6
Convergencia c.s.] Considere la sucesi
on de vam

riables Xn como en el ejemplo anterior. Entonces Xn 0 pues E|Xn 0| = 1/n


0. Sin embargo esta sucesion no converge c.s. pues P (lm Xn = 0) = P () = 0.

Ejemplo. [Convergencia c.s. =


6
convergencia en m.] Considere el espacio ((0, 1), B(0, 1), P )
con P la medida de probabilidad uniforme. Defina la suceci
on Xn = n1(0,1/n) . Entonces Xn converge a 0 c.s. pues P (lm Xn = 0) = P () = 1. Sin embargo no hay
convergencia en media pues E|Xn 0| = 1.

Proposici
on 66 Convergencia en m.c. = convergencia en media.

Demostraci
on. La desigualdad de Jensen establece que para u convexa
u(E(X)) E(u(X)).
Tomando u(x) = x2 se obtiene E 2 |Xn X| E|Xn X|2 , de donde se sigue el
resultado. Alternativamente la u
ltima desigualdad es consecuencia de la desigualdad
de Cauchy-Schwarz.


Proposici
on 67 Convergencia en media = convergencia en prob.

Demostraci
on. Para cada > 0 defina el evento An = (|Xn X| > ). Entonces
E|Xn X| = E(|Xn X| 1An ) + E(|Xn X| 1Acn )
E(|Xn X| 1An )

P (|Xn X| > ).
171

Por hip
otesis el lado izquierdo tiende a cero cuando n tiende a infinito. Por lo tanto

P (|Xn X| > ) 0.

Proposici
on 68 Convergencia en prob. = convergencia en dist.

Demostraci
on. Sea x un punto de continuidad de FX (x). Para cualquier > 0
FXn (x) = P (Xn x)

= P (Xn x, |Xn X| ) + P (Xn x, |Xn X| > )

P (X x + ) + P (|Xn X| > ).

El segundo sumando del lado derecho tiende a cero cuando n tiende a infinito pues
p
por hip
otesis Xn X. Entonces para cualquier > 0,
lm sup FXn (x) FX (x + ).
n

Por la continuidad lateral,


lm sup FXn (x) FX (x).
n

Ahora se demuestra la desigualdad inversa. Para cualquier > 0


FX (x ) = P (X x )

= P (X x , |Xn X| ) + P (X x , |Xn X| > )

P (Xn x) + P (|Xn X| > ).

Nuevamente el segundo sumando tiende a cero cuando n tiende a infinito. Entonces


FX (x ) lm inf FXn (x).
n

Por la continuidad en x,
FX (x) lm inf FXn (x).
n

En resumen
FX (x) lm inf FXn (x) lm sup FXn (x) FX (x).
n


El converso de la proposici
on anterior es falso, es decir, la convergencia en distribuci
on no siempre implica la convergencia en probabilidad.

172

Ejemplo. [Convergencia en dist. =


6
convergencia en prob.] Sea X con distribuci
on
normal est
andar y sea

Xn =

X
si n es par,
X si n es impar.

on normal est
andar y por lo
Entonces claramente cada Xn tambien tiene distribuci
d
tanto para cualquier n
umero real x, FXn (x) FX (x), es decir, Xn X. Sin
embargo la sucesi
on no converge en probabilidad a X pues para valores impares de
n y para valores peque
nos de > 0,
P (|Xn X| > ) = P (2|X| > ) > 1/2.
Lo anterior demuestra que lm P (|Xn X| > ) 6= 0.
n

7.8.

Dos resultados importantes de convergencia

Sea X1 , X2 , . . . una sucesi


on de variables aleatorias con esperanza finita. Suponga que Xn converge puntualmente a X. Es natural preguntarse si la sucesi
on de
n
umeros E(Xn ) converge a E(X). Tal convergencia numerica equivaldra a poder
intercambiar las operaciones de lmite y esperanza, es decir,
lm E(Xn ) = E( lm Xn ) = E(X).

En esta secci
on se enuncian sin demostraci
on dos resultados que establecen condiciones bajo las cuales es v
alido este intercambio.

Teorema 3 (Teorema de convergencia mon


otona) Si Xn converge puntualmente a X y es tal que 0 X1 X2 entonces
lm E(Xn ) = E(X).

Por lo tanto la condici


on de que la sucesi
on de variables aleatorias sea no genativa
y mon
otona no decreciente es suficiente para poder afirmar que E(Xn ) converge a
E(X). El segundo resultado que se enuncia a continuaci
on establece otro tipo de
condici
on suficiente para obtener la misma conclusi
on.

173

Teorema 4 (Teorema de convergencia dominada) Si Xn converge puntualmente a X y existe Y con esperanza finita tal que |Xn | Y para toda n, entonces
lm E(Xn ) = E(X).

Es decir, es suficiente que exista una variable aleatoria con esperanza finita que sea
cota superior de la sucesi
on para poder afirmar que E(Xn ) converge a E(X). Estos
dos resultados son de suma utilidad y su demostraci
on aparece en textos avanzados
de probabilidad [12], [17], [23]. Se utilizan en la u
ltima parte de este curso para
formalizar algunas demostraciones.

7.9.

Ejercicios
Convergencia casi segura
c.s.

481. Sean a y b constantes. Demuestre que si Xn X entonces


c.s.

a) aXn aX.
c.s.

b) Xn + b X + b.
c.s.

c.s.

482. Suponga que Xn X y Yn Y . Demuestre que


c.s.

a) Xn + Yn X + Y.
c.s.

b) Xn Yn XY.
c.s.

c) Xn /Yn X/Y si Y, Yn 6= 0.

483. Considere el espacio de probabilidad ([0, 1], B[0, 1], P ) con P la medida de
probabilidad uniforme. Demuestre que
c.s.

n1[0,1/n) 0.

Convergencia en probabilidad
p

484. Sean a y b constantes. Demuestre que si Xn X entonces


p

a) aXn aX.
p

b) Xn + b X + b.
p

485. Suponga que Xn x y Yn y, en donde x y y son dos n


umeros reales
fijos. Demuestre que
p

a) Xn + Yn x + y.
p

b) Xn Yn xy.
174

c) Xn /Yn x/y si Yn , y 6= 0.

d) Si g es continua en x entonces g(Xn ) g(x).


p

486. Demuestre que si Xn X y Yn Y entonces


p

Xn + Yn X + Y.
487. Sean X1 , X2 , . . . variables aleatorias independientes cada una con distribucion
unif(a, b). Demuestre que cuando n tiende a infinito
p

a) mn{X1 , . . . , Xn } a.
p

b) m
ax{X1 , . . . , Xn } b.

Convergencia en media
m

488. Sean a y b constantes. Demuestre que si Xn X entonces


m

a) aXn aX.
m

b) Xn + b X + b.
m

489. Suponga que Xn X y Yn Y . Demuestre que


m

a) Xn + Yn X + Y .
Proporcione un contraejemplo para las siguientes afirmaciones
m

b) Xn Yn XY .
m

c) Xn /Yn X/Y si Y, Yn 6= 0.

490. Use la desigualdad de Cauchy-Schwarz para demostrar que si Xn X entonces


lm E(Xn ) = E(X).
n

Convergencia en media cuadr


atica
m.c.

491. Sean a y b constantes. Demuestre que si Xn X entonces


m.c.

a) aXn aX.
m.c.

b) Xn + b X + b.

m.c.

492. Use la desigualdad de Cauchy-Schwarz para demostrar que si Xn X y


m.c.
Yn Y entonces
m.c.
Xn + Yn X + Y.

175

Convergencia en distribuci
on
493. Considere el espacio de probabilidad ([0, 1], B[0, 1], P ) en donde P es la medida
de probabilidad uniforme. Sea Xn = 1[0,1/2+1/n) y X = 1[0,1/2] . Demuestre que
d

Xn X.
494. Sea Xn con distribuci
on unif[a 1/n, a + 1/n] en donde a es una constante.
d

Demuestre que Xn a.

495. Sea Xn con distribucion uniforme en el conjunto {0, 1, . . . , n}. Demuestre que
1
d
Xn unif[0, 1].
n
p

496. Sea c una constante. Demuestre que Xn c si y solo si Xn c.

Relaciones generales entre los tipos de convergencia


497. Enuncie con precisi
on la definici
on de convergencia de variables aleatorias: casi
segura, en media, en media cuadr
atica, en probabilidad y en distribuci
on.
498. Establezca las relaciones existentes entre los siguientes tipos de convergencia
de variables aleatorias: convergencia en distribuci
on, en probabilidad, convergencia casi segura, convergencia en media y convergencia en media cuadr
atica.
499. Demuestre que la convergencia casi siempre implica la convergencia en probabilidad.
500. Demuestre que la convergencia en media cuadr
atica implica la convergencia
en media.
501. Demuestre que la convergencia en media cuadr
atica implica la convergencia
en probabilidad.
502. Demuestre que la convergencia en probabilidad implica la convergencia en
distribuci
on.
503. Sea A1 , A2 , . . . una sucesi
on de eventos tal que lm An = A. En que sentido
n
la sucesi
on de variables aleatorias 1An converge a 1A ?
d

504. Demuestre que si Xn X y Yn Y entonces no necesariamente


d

a) cXn cX, c constante.


d

b) Xn + Yn X + Y .
505. Sea Xn con distribuci
on N(n , n2 ) y X con distribuci
on N(, 2 ). Suponga
2
2
2
2
n y n , con n , > 0. En que sentido Xn X?
d

506. Suponga Xn X en donde Xn y X son variables aleatorias absolutamente


continuas. Bajo que condiciones fXn (x) fX (x)?
176

Captulo 8

Funciones generadoras
En este captulo se estudia la funci
on generadora de probabilidad, la funci
on generadora de momentos y la funci
on caracterstica. Estas funciones son transformaciones
de las distribuciones de probabilidad y constituyen una herramienta muy u
til en la
teora moderna de la probabilidad.

8.1.

Funci
on generadora de probabilidad

Definici
on 45 (Funci
on generadora de probabilidad) La funci
on generadora de probabilidad de X es la funci
on
G(t) = E(tX )
definida para valores reales de t tal que la esperanza existe.

Cuando sea necesario especificarlo se escribe GX (t) en lugar de G(t) y se usan


las letras f.g.p. en lugar de funci
on generadora de probabilidad. Esta funci
on se
utiliza principalmente en el caso de variables aleatorias positivas con valores enteros.
Por comodidad supondremos que estas toman valores en el conjunto {0, 1, . . .} que
corresponde al caso de las variables aleatorias discretas estudiadas en este curso.
Entonces

X
G(t) =
tk P (X = k).
k=0

Por lo tanto la f.g.p. es una serie de potencias en t con coeficientes dados por la
distribuci
on de probabilidad (por ende el nombre) y cuyo radio de convergencia es
por lo menos uno. La existencia de la f.g.p. no est
a garantizada para toda distribuci
on de probabilidad. Sin embargo cuando existe, determina de manera u
nica a la
177

distribuci
on en el siguiente sentido. Si X y Y tienen la misma distribuci
on de probabilidad entonces claramente GX (t) = GY (t) para valores de t donde esta esperanza
exista. Inversamente, sean X y Y tales que GX (t) y GX (t) existen y coinciden en
alg
un intervalo no trivial alrededor del cero. Entonces X y Y tienen la misma distri
buci
on de probabilidad. Esta
y otras propiedades generales de la f.g.p. se estudian
a continuaci
on y m
as adelante se ilustran estos resultados con un ejemplo.

Proposici
on 69
1. Sean X y Y variables aleatorias con valores en {0, 1, . . .} tales que GX (t) y
GY (t) existen y coinciden en alg
un intervalo no trivial alrededor de t = 0.
Entonces X y Y tienen la misma distribuci
on de probabilidad.
2. Si GX (t) existe entonces


dn
GX (t)
= E[X(X 1) (X n + 1)].
n
dt
t=1

3. Si X y Y son independientes y cuyas f.g.p. existen entonces


GX+Y (t) = GX (t)GY (t).

Demostraci
on. (1) Sean an = P (X = n) y bn = P (Y = n) para n 0. La condicion
GX (t) y GX (t) se escribe

X
X
n
t an =
tn bn .
n=0

n=0

Para que estas dos series de potencias en t coincidan en alg


un intervalo no trivial
alrededor del cero, sus coeficientes deben forzosamente coincidir. Es decir an = bn
para n 0. (2) Como las series de potencia se pueden derivar termino a termino
conserv
andose el mismo radio de convergencia se tiene que
G (t) =

d X k
t P (X = k)
dt
k=0

X
d k
=
t P (X = k)
dt
k=0

ktk1 P (X = k).

k=1

Al evaluar en t = 1 se obtiene

G (1) =

kP (X = k) = E(X).

k=1

178

De manera an
aloga se demuestra para las derivadas superiores. (3) Cuando X y Y
son independientes,
GX+Y (t) = E(tX+Y )
= E(tX tY )
= E(tX )E(tY )
= GX (t)GY (t).

Debido a la segunda propiedad, a la f.g.p. tambien se le conoce como funci
on generadora de momentos factoriales.

Ejemplo. Sea X con distribucion Poisson(). Entonces la f.g.p. de X es G(t) =


e(1t) . En efecto,
G(t) =

tn e

n=0

= e

X
(t)n

n!

n=0
t

= e

(1t)

= e

n
n!

Observe que en este caso la f.g.p. se encuentra definida para cualquier valor de t.
Calculamos a continuaci
on la esperanza y varianza de la distribuci
on Poisson() con
ayuda de la f.g.p. Al derivar una vez se obtiene G (t) = e(1t) y al evaluar en
t = 1, E(X) = G (1) = . Derivando por segunda vez, G (t) = 2 e(1t) , y en t = 1
se obtiene E(X(X 1)) = G (1) = 2 . Por lo tanto Var(X) = E(X 2 ) E 2 (X) =
2 + 2 = . Ahora se muestra el uso de la f.g.p. para determinar la distribuci
on
de una variable aleatoria. Suponga que X y Y son independientes con distribuci
on
Poisson(1 ) y Poisson(2 ) respectivamente. Entonces
MX+Y (t) = MX (t)MY (t)
= e1 (1t) e2 (1t)
= e(1 +2 )(1t) .
Esta expresi
on corresponde a la f.g.p. de la distribuci
on Poisson con par
ametro
1 + 2 . Se concluye entonces que X + Y se distribuye Poisson(1 + 2 ).

Las funciones generadoras de probabilidad para algunas otras distribuciones discretas se encuentran en la secci
on de ejercicios y tambien en el primer apendice al final
del libro.

179

8.2.

Funci
on generadora de momentos

La funci
on generadora de momentos es otra funci
on que se puede asociar a algunas
distribuciones de probabilidad aunque su existencia no est
a garantizada en todos los
casos. Cuando existe, determina de manera u
nica a la distribuci
on de probabilidad
asociada y tiene propiedades semejantes a las de la f.g.p. estudiada en la secci
on anterior. La funci
on generadora de momentos se utiliza tanto para variables aleatorias
discretas como continuas.

Definici
on 46 (Funci
on generadora de momentos) La funci
on generadora
de momentos de X es la funci
on
M (t) = E(etX )
definida para valores reales de t para los cuales esta esperanza existe.

Nuevamente, cuando sea necesario especificarlo se escribe MX (t) en lugar de M (t)


y se usan las letras f.g.m. en lugar de funci
on generadora de momentos. La parte
importante de esta funci
on es su existencia en una vecindad no trivial alrededor
del cero. Observe que la f.g.m. y la f.g.p. est
an relacionadas, cuando existen, por la
t
igualdad M (t) = G(e ). Se demuestran a continuaci
on algunas propiedades b
asicas
de la f.g.m. y despues se muestra su utilidad mediante un ejemplo.

Proposici
on 70
1. Sea X tal que su f.g.m. M (t) existe. Entonces todos los momentos X existen
y


dn

M
(t)
= E(X n ).

dtn
t=0

2. Sean X y Y son independientes y cuyas f.g.m. existen. Entonces


MX+Y (t) = MX (t)MY (t).

3. Las variables X y Y tienen la misma distribuci


on si y solo si MX (t) = MY (t)
para cada t (, ) con > 0 .

Demostraci
on. (1) El teorema de convergencia dominada permite obtener la derivada

180

a traves de la esperanza de modo que


d
M (t) =
dt

d
E(etX )
dt
d
= E( etX )
dt
= E(XetX ).

Al evaluar en t = 0 se obtiene el primer momento. An


alogamente se prueba para
derivadas superiores. (2) Cuando X y Y son independientes se tiene que
MX+Y (t) = E(et(X+Y ) )
= E(etX etY )

= E(etX )E(etY )
= MX (t)MY (t)
(3) Si X y Y tienen la misma distribuci
on entonces claramente MX (t) y MY (t)
coinciden cuando estas funciones existan. Recprocamente, si X es tal que su funci
on generadora de momentos existe entonces todos sus momentos existen y estos
determinan de manera u
nica a la distribuci
on de probabilidad.

Es interesante observar que la condici
on MX+Y (t) = MX (t)MY (t) no es suficiente
para concluir que X y Y son independientes. En el Ejercicio 543 se pide dar los
detalles de tal afirmaci
on.

Ejemplo. Sea X con distribucion gama(n, ). Entonces para t < ,


Z

(x)n1
ex dx
(n)
0
Z
[( t)x]n1
n
n
= ( t)
( t)e(t)x dx
(n)
0
= n ( t)n .

M (t) =

etx

Calculamos ahora la esperanza y varianza de X con ayuda de la f.g.m. Derivando una


vez, M (t) = n n( t)n1 , al evaluar en t = 0 se obtiene E(X) = n/. Derivando
nuevamente, M (t) = n n(n + 1)( t)n2 , por lo tanto E(X 2 ) = M (0) =
n(n + 1)/2 . Entonces Var(X) = n(n + 1)/2 n2 /2 = n/2 . Suponga ahora
que X y Y son independientes cada una con distribuci
on gama(n, ) y gama(m, )
respectivamente. Entonces la f.g.m. de X + Y es
MX+Y (t) = MX (t)MY (t)
= n ( t)n m ( t)m
= n+m ( t)nm .

Esta
es nuevamente la expresi
on de la f.g.m. de la distribuci
on gama, ahora con
par
ametros n+m y . Se concluye entonces X +Y tiene distribuci
on gama(n+m, ).

181

Como hemos mencionado antes, no todas las distribuciones de probabilidad permiten calcular la funci
on generadora de momentos dentro de un intervalo no trivial
alrededor del cero, ni todos los c
alculos son tan sencillos como en el ejemplo mostrado. Por ejemplo la f.g.m. de la distribuci
on Cauchy est
andar no existe para valores
de t distintos de cero como se pide demostrar en el Ejercicio 544. Finalizamos esta
secci
on con el enunciado sin demostraci
on de un resultado acerca de convergencia
de funciones generadoras.

Proposici
on 71 Sea X1 , X2 , . . . una sucesi
on de variables aleatorias cuyas funciones generadoras de momentos existen todas ellas en alg
un intervalo no trivial
d
alrededor del cero. Entonces Xn X si y solo si MXn (t) MX (t).

En la secci
on de ejercicios se pueden encontrar las funciones generadoras de momentos de algunas otras distribuciones de probabilidad tanto discretas como continuas,
asi como en el primer apendice al final del libro.

8.3.

Funci
on caracterstica

En esta u
ltima secci
on se estudia la funci
on caracterstica y se enuncian algunas de

sus propiedades. Esta


es una funci
on definida para cada distribuci
on de probabilidad
y a diferencia de las funciones generadoras de probabilidad y de momentos estudiadas
antes, siempre existe. Su definici
on es la siguiente.

Definici
on 47 (Funci
on caracterstica) La funci
on caracterstica de X es la
funci
on

(t) = E eitX
definida para cualquier n
umero real t. El n
umero i es la unidad de los n
umeros
imaginarios.

Observe que la funci


on caracterstica es una funci
on de los n
umeros reales en los
n
umeros complejos y puede escribirse de la forma siguiente
(t) = E(cos tX) + iE(sen tX).
Nuevamente se escribe X (t) cuando sea necesario especificar que se trata de la
funci
on caracterstica de X. Se escribe simplemente f.c. en lugar de funci
on caracterstica. Observe que la f.c., la f.g.m. y la f.g.p. est
an relacionadas, cuando existen,
182

por las igualdades (t) = M (it) = G(eit ). La existencia de la f.c. se sigue del siguiente an
alisis

Z


itx

|(t)| =
e dF (x)
Z

|eitx | dF (x)
Z

dF (x)
=

= 1.

De modo que (t) es un n


umero complejo de norma menor o igual a uno para
cualquier valor de t. Veamos algunas otras propiedades de esta importante funcion.
Demostraremos que los momentos de una variable aleatoria X pueden ser generados
con la f.c. a traves de la f
ormula (n) (0) = in E(X n ), y como en el caso de las
funciones generadoras anteriores, cuando X y Y son independientes se cumple que
X+Y (t) = X (t)Y (t).

Proposici
on 72
1. Si X tiene n-esimo momento finito entonces


dn
(t)
= in E(X n ).
n
dt
t=0

2. Si X y Y son independientes entonces

X+Y (t) = X (t)Y (t).

Demostraci
on. Por el teorema de convergencia dominada,
d
(t) =
dt

d
E(eitX )
dt
d
= E( eitX )
dt
= E(iXeitX ).

Evaluando en t = 0 se obtiene el resultado cuando n = 1. An


alogamente se calculan
las derivadas superiores. Por otro lado,
X+Y (t) = E(eit(X+Y ) )
= E(eitX eitY )

= E(eitX )E(eitY )
= X (t)Y (t).
183


El recproco de la u
ltima propiedad es falso. En el ejercicio 568 se pide probar que
la condici
on X+Y (t) = X (t)Y (t) no es suficiente para concluir que las variables
aleatorias X y Y son independientes. Otra de las propiedades fundamentales de la
funci
on caracterstica es su capacidad de determinar de manera u
nica a las distintas
distribuciones de probabilidad. A este respecto se tienen los siguientes resultados.

Proposici
on 73 (F
ormula de inversi
on de L`
evy) Sea X con funci
on de distribuci
on F (x) y funci
on caracterstica (t). Si x < y son puntos de continuidad
de F entonces
Z T itx
1
e
eity
F (y) F (x) = lm
(t) dt.
T 2 T
it

Con ayuda de este teorema de inversi


on probaremos que las funciones de distribucion
determinan de manera u
nica a las distribuciones de probabilidad.

Proposici
on 74 (Teorema de unicidad) Si X y Y son tales que X (t) =
Y (t) para cualquier valor de t, entonces X y Y tienen la misma distribuci
on.

Demostraci
on. Por el teorema de inversi
on de L`evy, la igualdad X (t) = Y (t) implica que para cualesquiera dos puntos de continuidad x < y para ambas distribuciones
se tiene que
FX (y) FX (x) = FY (y) FY (x).
Al hacer x tender a , se obtiene que FX (y) = FY (y), para todos los valores y
puntos de continuidad de ambas funciones de distribuci
on. Como las funciones de
distribuci
on tienen a lo sumo un n
umero numerable de discontinuidades, FX = FY .

En el caso absolutamente continuo se tiene la siguiente f
ormula.

184

Proposici
on 75 (F
ormula de inversi
on en el caso abs. continuo) Sea X
absolutamente continua con funci
on de densidad f (x) y funci
on caracterstica
(t). Entonces
Z
1
eitx (t) dt.
f (x) =
2

Demostraci
on. Para x < y dos puntos de continuidad de F , por el teorema de
inversi
on de L`evy,
Z T itx
1
e
eity
F (y) F (x) = lm
(t) dt
T 2 T
it
Z itx
1
e
eity
(t) dt
=
2
it

Z Z y
1
=
eitx dx (t) dt.
2 x

Z y Z
1
itx
=
e
(t) dt dx.
2
x
Por lo tanto el integrando debe ser la funci
on de densidad de X.

Observe que se puede utilizar la f


ormula de inversi
on anterior u
nicamente cuando se
conoce que la funci
on caracterstica proviene de una variable aleatoria absolutamente
continua. Ahora se demuestra un resultado que ser
a de utilidad en la u
ltima parte del
curso. Establece que la convergencia en distribuci
on es equivalente a la convergencia
puntual de las correspondientes funciones caractersticas.

Proposici
on 76 (Teorema de Continuidad) Sean

X, X1 , X2 , . . .

variables

aleatorias. Entonces Xn X si y solo si Xn (t) X (t).

Demostraci
on. Suponga primero que Xn X. Entonces por el teorema de convergencia dominada,
lm Xn (t) =

lm E(cos tXn ) + iE(sen tXn )

= E(cos tX) + iE(sen tX)


= X (t).
Suponga ahora que Xn (t) X (t). Entonces para dos puntos de continuidad x < y

185

comunes a cada FXn y FX , el teorema de inversi


on de L`evy establece que
Z T itx
1
e
eity
(t) dt.
FX (y) FX (x) = lm
T 2 T
it
Z T itx
i
1
e
eity h
= lm
lm Xn (t) dt.
n
T 2 T
it
Z T itx
1
e
eity
= lm lm
[Xn (t)] dt.
n T 2 T
it
= lm FXn (y) FXn (x).
n

Haciendo x tender a se obtiene FX (y) = lm FXn (y).


n

Finalmente se muestra con dos ejemplos la forma de encontrar la funci


on caracterstica dada una distribuci
on de probabilidad.

Ejemplo. Sea X con distribucion bin(n, p). Entonces


n
X


n
(t) =
e
px (1 p)nx
x
x=0

n 
X
n
=
(peit )x (1 p)nx
x
itx

x=0

= (1 p + peit )n .

Ejemplo. Sea X con distribucion N(, 2 ). Entonces


Z

1
2
2
eitx
e(x) /2 dx
2
2
Z

1
2
2
2
2

=
e(x 2x(it )+ )/2 dx
2
2

Z
2
1
2 2
2
( +(it2 )2 )/22

= e
e[x(it )] /2 dx
2

| 2
{z
}

(t) =

N (it2 ,2 )

itt2 2 /2

= e

8.4.

Ejercicios
Funci
on generadora de probabilidad

507. Sea X con varianza finita y con f.g.p. G(t). Demuestre que
186

a) E(X) = G (1).
b) E(X 2 ) = G (1) + G (1).
c) Var(X) = G (1) + G (1) [G (1)]2 .
508. Sea X con f.g.p. GX (t) y sean a y b dos constantes. Demuestre que GaX+b (t) =
tb GX (ta ).
509. Sea X con distribuci
on Ber(p). Demuestre que
a) G(t) = 1 p + pt.

b) E(X) = p usando G(t).


c) Var(X) = p(1 p) usando G(t).

510. Sea X con distribucion bin(n, p). Demuestre que


a) G(t) = (1 p + pt)n .

b) E(X) = np usando G(t).


c) Var(X) = np(1 p) usando G(t).

on Ber(p). Use la f.g.p.


511. Sean X1 , . . . , Xn independientes cada una con distribuci
para demostrar que X1 + + Xn tiene distribuci
on bin(n, p).
512. Sean X y Y independientes con distribuci
on bin(n, p) y bin(m, p) respectivamente. Use la f.g.p. para demostrar que X +Y tiene distribuci
on bin(n+m, p).
513. Sea X con distribuci
on bin(N, p) en donde N es una v.a. con distribucion
bin(m, r). Use la f.g.p. para demostrar que X tiene distribuci
on bin(m, rp).
514. Sea X con distribucion geo(p). Demuestre que
a) G(t) = p/[1 t(1 p)].

b) E(X) = (1 p)/p usando G(t).

c) Var(X) = (1 p)/p2 usando G(t).

515. Sea X con distribucion Poisson(). Demuestre que


a) G(t) = e(1t) .
b) E(X) = usando G(t).
c) Var(X) = usando G(t).
516. Sean X y Y independientes con distribuci
on Poisson con par
ametros 1 y 2
respectivamente. Use la f.g.p. para demostrar nuevamente que X + Y tiene
distribuci
on Poisson(1 + 2 ).
517. Sea X con distribuci
on bin neg(r, p). Demuestre que
a) G(t) = [p/(1 t(1 p))]r .

b) E(X) = r(1 p)/p usando G(t).

c) Var(X) = r(1 p)/p2 usando G(t).


187

518. Sean X1 , . . . , Xn independientes tales que Xk tiene f.g.p. Gk (t) para k =


1, . . . , n. Demuestre que
GX1 ++Xn (t) =

n
Y

Gk (t).

k=1

519. Investigue si la condici


on GX+Y (t) = GX (t)GY (t) es suficiente para concluir
que X y Y son independientes.
520. Sea X1 , X2 , . . . una sucesi
on de v.a.i.i.d. con f.g.p. GX (t). Sea N otra v.a.
con valores en N, independiente de la sucesi
on y con f.g.p. GN (t). Sea Y =
X1 + + XN . Demuestre que
a) GY (t) = GN (GX (t)).
b) E(Y ) = E(N )E(X) usando GY (t).
c) Var(Y ) = E 2 (X)Var(N ) + E(N )Var(X) usando GY (t).

Funci
on generadora de momentos
521. Sea X con varianza finita y con f.g.m. M (t). Demuestre que
a) E(X) = M (0).
b) E(X 2 ) = M (0).
c) Var(X) = M (0) (M (0))2 .
522. Sean X y Y independientes e identicamente distribuidas con f.g.m. M (t).
Demuestre que MXY (t) = M (t)M (t).
523. Sea X con f.g.m. MX (t) y sean a y b dos constantes. Demuestre que MaX+b (t) =
etb MX (at).
524. Sea X con f.g.m. MX (t). Diga falso o verdadero. Demuestre en cada caso.
a) MX (t) 0.

b) M2X (t) = MX (2t).

525. Sea X con distribucion Ber(p). Demuestre que


a) M (t) = 1 p + pet .

b) E(X) = p usando M (t).


c) E(X n ) = p usando M (t).

d) Var(X) = p(1 p) usando M (t).


526. Sea X con distribuci
on bin(n, p). Demuestre que
a) M (t) = (1 p + pet )n .

b) E(X) = np usando M (t).


c) Var(X) = np(1 p) usando M (t).
188

527. Sean X1 , . . . , Xn independientes cada una con distribuci


on Ber(p). Use la f.g.m.
on bin(n, p).
para demostrar que X1 + + Xn tiene distribuci
528. Sean X y Y independientes con distribuci
on bin(n, p) y bin(m, p) respectivamente. Use la f.g.m. para demostrar que X +Y tiene distribuci
on bin(n+m, p).
529. Sea X con distribuci
on geo(p). Demuestre que
a) M (t) = p/[1 (1 p)et ].

b) E(X) = (1 p)/p usando M (t).

c) Var(X) = (1 p)/p2 usando M (t).

530. Sea X con distribuci


on Poisson(). Demuestre que
a) M (t) = exp[(et 1)].

b) M (t) = M (t) + et M (t).


c) E(X) = usando M (t).

d) Var(X) = usando M (t).


e) E[(X )3 ] = usando M (t).
531. Sea X con distribucion unif(a, b). Demuestre que
ebt eat
.
(b a)t
b) E(X) = (a + b)/2 usando M (t).

a) M (t) =

c) Var(X) = (b a)2 /12 usando M (t).


532. Sea X con distribuci
on exp(). Demuestre que
a) M (t) = /( t) para t < .
b) E(X) = 1/ usando M (t).

c) Var(X) = 1/2 usando M (t).


533. Sea X con distribuci
on N(, 2 ). Demuestre que
a) M (t) = exp(t + 12 2 t2 ).
b) E(X) = usando M (t).
c) Var(X) = 2 usando M (t).
534. Sean X y Y variables aleatorias independientes con distribuci
on N(1 , 12 )
y N(2 , 22 ) respectivamente. Use la f.g.m. para demostrar que X + Y tiene
distribuci
on N(1 + 2 , 12 + 22 ).
535. Sea X con distribucion gama(n, ). Demuestre que
a) M (t) = [/( t)]n para t < .
b) E(X) = n/ usando M (t).

c) Var(X) = n/2 usando M (t).

189

536. Sean X y Y independientes ambas con distribuci


on exp(). Use la f.g.m. para
demostrar que X + Y tiene distribuci
on gama(2, ).
537. Sean X y Y independientes con distribuci
on gama(n, ) y gama(m, ) respectivamente. Use la f.g.m. para demostrar que X + Y tiene distribucion
gama(n + m, ).
538. Sea X con distribucion 2 (n). Demuestre que
a) M (t) = [1/(1 2t)]n/2 para t < 1/2.
b) E(X) = n usando M (t).

c) Var(X) = 2n usando M (t).


539. Use la f.g.m. para demostrar que si X y Y son independientes tales que X
tiene distribuci
on 2 (n) y X +Y tiene distribuci
on 2 (m) con m > n, entonces
2
Y tiene distribuci
on (m n). Este es el contenido de la proposici
on 54 en
la p
agina 148.
540. Sean X y Y independientes con distribuci
on 2 (n) y 2 (m) respectivamente.
Use la f.g.m. para demostrar que X + Y tiene distribuci
on 2 (n + m).
541. Sea X con distribucion N(, 2 ). Use la f.g.m. para demostrar que
a) X tiene distribuci
on N(, 2 ).

b) aX + b tiene distribuci
on N(a + b, a2 2 ) con a 6= 0.
c) X 2 tiene distribuci
on 2 (1).

542. Sean X1 , . . . , Xn independientes tales que Xk tiene f.g.m. Mk (t) para k =


1, . . . , n. Demuestre que
MX1 ++Xn (t) =

n
Y

Mk (t).

k=1

543. Demuestre que la condici


on MX+Y (t) = MX (t)MY (t) no implica que X y Y
son independientes. Considere la distribuci
on conjunta
f (x, y) =

1
[1 + xy(x2 y 2 )] para
4

1 < x, y < 1.

544. Sea X con distribucion Cauchy est


andar. Demuestre que

1 si t = 0,
MX (t) =
si t 6= 0.
545. Demuestre que la f.g.m de la siguiente funci
on de densidad, en donde n es un
n
umero natural, no existe.
( n
si x > 1,
f (x) =
xn+1
0
otro caso.

190

Funci
on caracterstica
546. Defina con precisi
on la funci
on caracterstica y mencione tres de sus propiedades.
547. Encuentre la f.c. de una v.a. con funci
on de densidad
a) f (x) =

1
para x = 1, 2, . . .
x!(e 1)

b) f (x) = 12 e|x| .

548. Demuestre que |(t)| 1.


549. Demuestre que aX+b (t) = eitb X (at), con a, b constantes.
550. Demuestre que si x 7 F (x) es simetrica entonces t 7 (t) es real.
551. Demuestre que si t 7 (t) es real entonces x 7 F (x) es simetrica.
552. Demuestre que la funci
on caracterstica es una funci
on uniformemente continua.
553. Demuestre que la f.c. satisface (t) = (t), en donde z denota el complejo
conjugado de z.
554. Sean X y Y independientes y con identica distribuci
on. Demuestre que XY (t) =
|X (t)|2 .
555. Sea X con distribuci
on Ber(p). Demuestre que
a) (t) = (1 p + peit ).

b) E(X) = p usando (t).


c) Var(X) = p(1 p) usando (t).

d) E(X n ) = p usando (t), n 1 entero.


556. Sea X con distribuci
on bin(n, p). Demuestre que
a) (t) = (1 p + peit )n .

b) E(X) = np usando (t).


c) Var(X) = np(1 p) usando (t).

557. Sea X con distribuci


on Poisson(). Demuestre que
it

a) (t) = e(1e ) .
b) E(X) = usando (t).
c) Var(X) = usando (t).
558. Sea X con distribucion geo(p). Demuestre que
a) (t) = p/(1 qeit ).

b) E(X) = (1 p)/p usando (t).


191

c) Var(X) = (1 p)/p2 usando (t).


559. Sea X tiene distribuci
on bin neg(r, p). Demuestre que
a) (t) = [p/(1 (1 p)eit )]r .

b) E(X) = r(1 p)/p usando (t).

c) Var(X) = r(1 p)/p2 usando (t).

560. Sea X con distribucion unif(a, a). Demuestre que (t) = (sen at)/at.
561. Sea X con distribuci
on unif(a, b). Demuestre que
a) (t) = [eibt eiat ]/[it(b a)].

b) E(X) = (a + b)/2 usando (t).


c) Var(X) = (b a)2 /12 usando (t).

562. Sea X con distribucion N(, 2 ). Demuestre que


a) (t) = exp(it 2 t2 /2).
b) E(X) = usando (t).

c) Var(X) = 2 usando (t).


563. Sea X con distribucion exp(). Demuestre que
a) (t) = /( it).

b) E(X) = 1/ usando (t).


c) Var(X) = 1/2 usando (t).

564. Sea X con distribuci


on gama(n, ). Demuestre que
a) (t) = [/( it)]n .

b) E(X) = n/ usando (t).


c) Var(X) = n/2 usando (t).

565. Sean X y Y independientes ambas con distribuci


on exp(). Use la f.c. para
demostrar que X + Y tiene distribuci
on gama(2, ).
566. Sean X y Y independientes con distribuci
on gama(n, ) y gama(m, ) respectivamente. Use la f.c. para demostrar que X + Y tiene distribuci
on gama(n +
m, ).
567. Demuestre que si X y Y son independientes entonces X+Y (t) = X (t)Y (t).
568. Demuestre que la condici
on X+Y (t) = X (t)Y (t) no implica que X y Y son
independientes. Considere por ejemplo la siguiente distribuci
on conjunta.
f (x, y) =

1
[1 + xy(x2 y 2 )] para
4

192

1 < x, y < 1.

569. Sea X con funci


on de distribuci
on
F (x) =

ex
.
1 + ex

Demuestre que F (x) es efectivamente una funci


on de distribuci
on y calcule
(t). Con ayuda de esta encuentre E(X) y Var(X).
570. Sean X y Y independientes. Demuestre que
Z
Z
Y (tx)dFX (x) =
XY (t) =

X (ty)dFY (y).

571. Mediante el c
alculo de residuos se puede demostrar que la distribuci
on Cauchy
est
andar tiene funci
on caracterstica
Z
1
(t) =
dx = e|t| .
eitx
(1 + x2 )

Suponiendo este resultado, encuentre el error en el siguiente argumento para


encontrar la f.g.m. de la distribuci
on Cauchy: Como (t) = e|t| y M (t) =
|it|
(it) entonces M (t) = e
= e|t| .
572. Sean X1 , . . . , Xn v.a.i.i.d. con distribuci
on Cauchy est
andar, es decir, la funcion
caracterstica de cada una de estas variables es
(t) = e|t| .
Use este resultado para demostrar que la v.a. Sn = (X1 + + Xn )/n tiene
distribuci
on Cauchy est
andar para cualquier valor de n.

193

Captulo 9

Teoremas lmite
En este u
ltimo captulo se estudian dos de los teoremas m
as importantes en probabilidad: la ley de los grandes n
umeros y el teorema central del lmite. Antes de ello
se revisan dos desigualdades de interes general.

9.1.

Desigualdad de Markov

Proposici
on 77 (Desigualdad de Markov) Sea X 0 con esperanza finita.
Para cualquier > 0,
E(X)
P (X > )
.

Demostraci
on.
E(X) = E( X 1(X>) + X 1(X) )
E( X 1(X>) )
E( 1(X>) )

= P (X > ).


En palabras, este resultado establece que la probabilidad de que X exceda un valor
positivo est
a acotada superiormente por la media entre . Existen otras versiones
equivalentes de esta desigualdad. Por ejemplo, la desigualdad de Markov aplicada
a la variable aleatoria no negativa |X| establece que P (|X| > ) E|X|/, y para
|X|n con n cualquier n
umero natural, P (|X| > ) E|X|n /n .
194

9.2.

Desigualdad de Chebyshev

La desigualdad de Chebyshev es un resultado de bastante utilidad en algunas situaciones, en particular se usar


a en la siguiente secci
on para demostrar la ley debil de
los grandes n
umeros.

Proposici
on 78 (Desigualdad de Chebyshev) Sea X con media y varianza
2 < . Para cualquier > 0,
P (|X | > )

2
.
2

(9.1)

Demostraci
on.


2 = E (X )2


= E (X )2 1(|X|>) + (X )2 1(|X|)


E (X )2 1(|X|>)


E 2 1(|X|>)
= 2 P (|X | > ).


En palabras, la desigualdad dice que la probabilidad de que X difiera de su media
en mas de est
a acotada superiormente por la varianza entre 2 . A este resultado se
le conoce tambien con el nombre de desigualdad de Chebyshev-Bienayme. Existen
otras versiones de esta desigualdad equivalentes a la demostrada, por ejemplo,
a) P (|X | > ) 1/2 .
b) P (|X | ) 1 1/2 .
c) P (|X | ) 1 2 /2 .

Proposici
on 79 (Desigualdad de Chebyshev extendida) Sea X una variable aleatoria y sea g 0 una funci
on no decreciente tal que g(X) es una variable
aleatoria con esperanza finita. Para cualquier > 0,
P (X > )

195

E[g(X)]
.
g()

(9.2)

Demostraci
on.
E[g(X)] = E[ g(X) 1(X>) + g(X) 1(X) ]
E[ g(X) 1(X>) ]

E[ g() 1(X>) ]
= g()P (X > ).

Pafnuty Lvovich Chebyshev

Andrei Andreyevich Markov

(Rusia, 18211894)

(Rusia, 18561922)
Profesor y alumno.

Fuente: Archivo MacTutor, Universidad de St. Andrews.

A partir de la desigualdad de Chebyshev extendida y con una funci


on g adecuada se
pueden obtener tanto la desigualdad de Chebyshev como la desigualdad de Markov.
En resumen se tiene la siguiente tabla.
Desigualdades de Markov y de Chebyshev
1. Markov: Para > 0
a) X 0 = P (X > ) E(X)/
b) P (|X| > ) E|X|/
c) P (|X| > ) E|X|n /n
2. Chebyshev: Para > 0
a) P (|X | > ) Var(X)/2
b) P (X > ) E[g(X)]/g() con g 0 no decreciente

9.3.

Ley de los grandes n


umeros

En esta secci
on se estudia uno de los teoremas m
as importantes de la teora cl
asica
de la probabilidad. Este interesante resultado se conoce como la ley de los grandes
196

n
umeros y establece que, bajo ciertas condiciones, el promedio de variables aleatorias converge a una constante cuando el n
umero de sumandos crece a infinito. M
as
precisamente el resultado es el siguiente.

Teorema 5 (Ley d
ebil de los grandes n
umeros) Sean X1 , X2 , . . . independientes tales que E(Xi ) = . Para cualquier > 0,
n

lm P (|

1X
Xi | ) = 0.
n
i=1

Demostraci
on. (Suponiendo segundo momento finito.) Sea Sn = (X1 + + Xn )/n.
Entonces E(Sn ) = y Var(Sn ) 2 /n asumiendo Var(Xi ) 2 < . La desigualdad de Chebyshev aplicada a Sn establece que para cualquier > 0 se cumple
P (|Sn | ) 2 /n2 . Basta ahora tomar el lmite cuando n tiende a infinito
para obtener el resultado requerido.

La ley debil de los grandes n
umeros establece entonces que la variable aleatoria
Sn = (X1 + + Xn )/n converge en probabilidad a la media com
un . Observe que
para la demostraci
on de este resultado no hemos supuesto identica distribuci
on para
las variables aleatorias involucradas, u
nicamente que tengan la misma media, que
sean independientes y aunque las varianzas pueden ser diferentes, se ha necesitado
que sean uniformemente acotadas. Damos a continuaci
on un ejemplo sencillo de
aplicaci
on de este resultado y m
as adelante demostraremos una versi
on m
as fuerte
de la ley de los grandes n
umeros.

Ejemplo. [Definicion de probabilidad frecuentista] Considere un experimento aleatorio cualquiera y sea A un evento. Se repite sucesivamente el experimento y se
observa en cada ensayo la ocurrencia o no ocurrencia del evento A. Sea Xk la variable que toma el valor uno si en el k-esimo ensayo se observa A y cero en caso
contrario. Entonces X1 , X2 , . . . son variables aleatorias independientes con distribuci
on Ber(p) en donde p es la probabilidad desconocida del evento A. Por lo tanto
E(Xk ) = p y Var(Xk ) = p(1 p). La ley debil de los grandes n
umeros asegura que
la fracci
on de ensayos en los que se observa el evento A converge, en probabilidad, a
la constante desconocida p cuando el n
umero de ensayos crece a infinito. Esta es la
definici
on frecuentista de la probabilidad y hemos entonces corroborado su validez
con ayuda de la ley de los grandes n
umeros.

La siguiente versi
on de la ley de los grandes n
umeros asegura que bajo ciertas condiciones la convergencia de (X1 + + Xn )/n a la media es m
as fuerte, es casi
segura.

197

Teorema 6 (Ley fuerte de los grandes n


umeros) Sean X1 , X2 , . . . independientes e identicamente distribuidas tales que E(Xi ) = . Entonces
n

1X
P ( lm
Xi = ) = 1.
n n
i=1

Demostraci
on. (Suponiendo cuarto momento finito.) Dada la identica distribucion
de los elemento de la sucesi
on, cualquier elemento de esta se denota simplemente
por X. Suponga que E|X |2 = 2 y observe que E(X ) = 0. Entonces por
independencia,
n
X
E|
(Xi )|4 = nE|X |4 + 3n(n 1) 4 .
i=1

Por la desigualdad de Chebyshev (9.2) aplicada a la variable |


funci
on g(x) = x4 se obtiene, para > 0,
P
n
X
E| ni=1 (Xi )|4
P (|
(Xi )| > n)
(n)4

Pn

i=1 (Xi

)| y la

i=1

nE|X |4 + 3n(n 1) 4
.
(n)4
P
P
Sea el evento An = (| n1 ni=1 Xi | > ). Entonces
n=1 P (An ) < . Por el lema
de Borel-Cantelli la probabilidad de que ocurra una infinidad de eventos An es cero,
es decir, con probabilidad uno, s
olo un n
umero finito de estos eventos ocurre. Por
lo tanto con probabilidad uno, existe un n
umero natural n a partir del cual ning
un
evento An se verifica. Es decir,
=

P ( lm |
n

1X
Xi | ) = 1.
n
i=1

Como esta afirmaci


on vale para cualquier > 0, se cumple que
n

1X
P ( lm
Xi = ) = 1.
n n
i=1

Ejemplo. [El problema del mono, nuevamente] Se usa la ley fuerte de los grandes
n
umeros para dar otra soluci
on al problema del mono. Considere entonces un mono
que escribe caracteres al azar. Nos interesa encontrar la probabilidad de que el mono
eventualmente escriba las obras completas de Shakespeare, las cuales se asume tienen
una longitud total de N caracteres. Nuevamente se consideran bloques de longitud
N de la siguiente forma
x ,...,x ,x
, . . . , x2N , . . .
| 1 {z N} | N +1 {z
}
198

Sea Ak el evento correspondiente a que en el k-esimo bloque el mono ha tenido exito,


y sea Xk la variable aleatoria indicadora del evento Ak , es decir,

1 si Ak ocurre,
Xk =
0 si Ak no ocurre.
Se tiene entonces una sucesi
on de variables aleatorias X1 , X2 , . . . independientes e
identicamente distribuidas Bernoulli(p) con p = P (Ak ) = (1/m)N , suponiendo que
el total de caracteres disponibles es m. En particular la media de cada una de estas
varaibles es E(Xk ) = p. Considere ahora la suma X1 + X2 + + Xn . Si para alg
un
valor de n esta suma es positiva significa que alguno de los sumandos es distinto
de cero y por lo tanto que el mono ha tenido exito. Pero esto es justamente lo que
garantiza la ley fuerte de los grandes n
umeros pues
n

1X
Xk = p ) = 1.
n n

P ( lm

k=1

Es decir, con probabilidad uno la suma de esta ecuaci


on es positiva. Esto implica
que debe existir un valor de k tal que Xk = 1, y esto a su vez significa que en el
k-esimo bloque el mono ha tenido exito! M
as a
un, para que el promedio que aparece en esta ecuaci
on sea positivo necesariamente la suma debe ser infinita, y por lo
tanto, deben existir una infinidad de valores de k tal que Xk = 1. Esto quiere decir
que con probabilidad uno el mono escribir
a tantas veces como uno desee las obras
completas de Shakespeare!

9.4.

Teorema central del lmite

Concluimos el curso con el celebre y famoso teorema central del lmite. Este resultado
es de amplio uso en estadstica y otras ramas de aplicaci
on de la probabilidad.

Teorema 7 (Teorema central del lmite) Sean X1 , X2 . . . independientes e


identicamente distribuidas tales que E(Xi ) = y Var(Xi ) = 2 < . Para cualquier x en R,


(X1 + + Xn ) n

lm P
x = P (Z x),
n
n
en donde Z tiene distribuci
on normal est
andar.

Este resultado establece entonces que la variable aleatoria


(X1 + + Xn ) n

n
199

converge en distribuci
on a una variable aleatoria normal est
andar sin importar la
distribuci
on original de las variables de la sucesi
on. Observe que la suma X1 + +Xn
tiene media n y varianza n 2 , de modo que la expresi
on de arriba es una especie de
estandarizaci
on de esta variable. Equivalentemente este resultado puede enunciarse
del siguiente modo
1
+ Xn ) d
n (X1 +
N(0, 1).
/ n
A fin de dar una demostraci
on simple de este teorema supondremos adicionalmente
que los elementos de la sucesi
on tienen momentos finitos de cualquier orden. Esta
demostraci
on hace uso de la funci
on caracterstica.
Demostraci
on.(Suponiendo todos los momentos finitos.) Observe que
(X1 + + Xn ) n
[(X1 )/ + + (Xn )/]

=
n
n
en donde cada sumando del numerador en el lado derecho es una variable con media
cero y varianza uno. Asi pues, sin perdida de generalidad supondremos que cada Xi
tiene media cero y varianza uno y consideraremos la suma
Zn =

X1 + + Xn

.
n

Se desea probar que Zn N(0, 1). Para ello es suficiente demostrar que
2 /2

lm Zn (t) = et

Tenemos que por independencia e identica distribuci


on,
h
i


n
Zn (t) = E eit(X1 ++Xn )/ n = X t/ n
.
Por lo tanto,

ln Zn (t) = n ln X (t/ n)


itE(X) i2 t2 E(X 2 ) i3 t3 E(X 3 )
= n ln 1 +
+
+
+ .
n
2!n
3!n3/2
1
1
Usando la f
ormula ln(1 + x) = x x2 + x3 y factorizando potencias de it se
2
3
obtiene

ln Zn (t) = E(X 2 ) E 2 (X) i2 t2 /2


E(X 3 ) E(X)E(X 2 ) E 3 (X) i3 t3

+
+
+
3! n
2 n
3 n
n
El primer sumando es t2 /2 y todos los terminos a partir del segundo sumando se
anulan cuando n tiende a infinito. Por lo tanto,
lm ln Zn (t) = t2 /2.

200

Como la funci
on logaritmo es una funci
on continua tenemos que


ln lm Zn (t) = t2 /2.
n

De donde se obtiene

2 /2

lm Zn (t) = et

.


9.5.

Ejercicios
Desigualdad de Markov

573. Enuncie y demuestre la desigualdad de Markov.


574. Demuestre la desigualdad de Markov siguiendo los siguientes pasos. Suponga
X 0 y para > 0 defina

si X > ,
X =
0 si X .
Compruebe que X X. Ahora tome esperanza de ambos lados y calcule
E(X ).
575. Demuestre directamente las siguientes versiones de la desigualdad de Markov.
Para cualquier > 0,
E|X|
.

E|X|n
b) P (|X| > )
, con n cualquier n
umero natural.
n

a) P (|X| > )

576. Use la desigualdad de Markov para demostrar que si X es una variable aleatoria
no negativa con esperanza cero entonces X = 0 casi seguramente.
577. Demuestre que la convergencia en media implica la convergencia en probabilidad usando la desigualdad de Markov aplicada a la variable aleatoria no
negativa |Xn X|.

Desigualdad de Chebyshev
578. Enuncie y demuestre la desigualdad de Chebyshev.
579. Use la desigualdad de Chebyshev (9.2) para demostrar directamente que la
convergencia en media cuadr
atica implica la convergencia en probabilidad.
580. Demuestre la desigualdad de Chebyshev (9.1) usando la desigualdad de Markov
aplicada a la variable aleatoria no negativa |X |.
201

581. Use la desigualdad de Chebyshev para demostrar que si X es una variable


aleatoria tal que E(X) = a y Var(X) = 0 entonces X es constante casi seguramente, es decir, P (X = a) = 1.
582. Sea X con media y varianza 2 . Use la desigualdad de Chebyshev para
estimar la probabilidad de que X tome valores entre y + para
> 0 constante.
583. Enuncie y demuestre la versi
on de Chebyshev extendida.
584. A partir de la desigualdad de Chebyshev extendida (9.2) demuestre la desigualdad de Chebyshev (9.1) y la desigualdad de Markov.
585. Demuestre que P (|X| > )

E|X|
para > 0,

a) usando la desigualdad de Chebyshev extendida.


b) de manera directa.
586. Demuestre que P (|X| > )

E|X|n
para > 0 y n N,
n

a) usando la desigualdad de Chebyshev extendida.


b) de manera directa.
587. Demuestre que P (X > )

E(etX )
para > 0 y t > 0,
et

a) usando la desigualdad de Chebyshev extendida.


b) de manera directa.
588. Sea X con funci
on de densidad

1/18 si x = 1, 1,
f (x) =
16/18 si x = 0,

0
otro caso.

Demuestre que P (|X | > 3) y la estimaci


on dada por la desigualdad de
Chebyshev para esta probabilidad coinciden. Este ejercicio demuestra que en
general la cota superior dada por la desigualdad de Chebyshev es optima, es
decir, no puede establecerse una cota superior m
as peque
na.

589. Considere la siguiente versi


on de la desigualdad de Chebyshev
P (|X | ) 1 1/2 .
Encuentre el mnimo valor de > 0 de tal modo que la probabilidad de que
una variable aleatoria tome valores entre y + sea al menos 0.90.

202

Ley de los grandes n


umeros
590. Enuncie la ley debil de los grandes n
umeros y use la desigualdad de Chebyshev
para demostrarla.
591. Use la ley debil de los grandes n
umeros para demostrar que si Xn tiene distribuci
on bin(n, p) entonces cuando n ,
1
p
Xn p.
n
592. Enuncie la ley fuerte de los grandes n
umeros.
593. Ley de los grandes n
umeros en media cuadr
atica. Demuestre que si X1 , X2 , . . .
es una sucesi
on de v.a.s independientes con media y varianza 2 entonces
n

1X
m.c.
Xi .
n
i=1

Observe que no se pide la hip


otesis de identica distribuci
on para las variables
aleatorias y que este resultado no es consecuencia de la ley fuerte.
594. Sean X1 , . . . , Xn independientes con distribuci
on N(, 2 ). Para cualquier vaon N(, 2 /n). Conlor de n el promedio (X1 + + Xn )/n tiene distribuci
tradice esto la ley de los grandes n
umeros?
595. En el ejercicio 572 se pide usar la f.c. para demostrar que si X1 , . . . , Xn son
v.a.i.i.d. con distribuci
on Cauchy est
andar entonces el promedio Sn = (X1 +
+ Xn )/n tiene distribuci
on Cauchy est
andar independientemente del valor
de n. Contradice esto la ley de los grandes n
umeros?

Teorema central del lmite


596. Enuncie con precisi
on el teorema central del lmite.
597. Use el teorema central del lmite para estimar la probabilidad de obtener mas
de 520 aguilas en 1000 lanzamientos de una moneda honesta.
598. Sea {Xn : n = 1, 2, . . .} una sucesi
on de v.a.i.i.d. con distribuci
on Poisson()
con = 1. Use el teorema central del lmite para demostrar que
n
1 X nk
1
lm
= .
n en
k!
2
k=0

599. La probabilidad de ocurrencia de un evento en un ensayo es de 0.3. Cu


al es
la probabilidad de que la frecuencia relativa de este evento en 100 ensayos se
encuentre entre 0.2 y 0.5?

203

Ap
endice A

Distribuciones de probabilidad
Se presenta a continuaci
on una lista con algunas distribuciones de probabilidad de
uso com
un. La funci
on generadora de probabilidad es G(t), la generadora de la
momentos es M (t) y la funci
on caracterstica es (t).

DISTRIBUCIONES UNIVARIADAS DISCRETAS


Distribuci
on uniforme
X unif{x1 , . . . , xn } con n N.
f (x) = 1/nPpara x = x1 , . . . , xn .
E(X) = n1 nj=1 xj .
P
Var(X) = n1 nj=1 (xj )2 .
P
M (t) = n1 nj=1 exj t .

Distribuci
on Bernoulli
X Ber(p) con p (0, 1).
f (x) = px (1 p)1x para x = 0, 1.
E(X) = p.
Var(X) = p(1 p).
G(t) = 1 p + pt.
M (t) = (1 p) + pet .

204

Distribuci
on binomial
X bin(n,
 p) con n {1, 2, . . .} y p (0, 1).
n
f (x) =
px (1 p)nx para x = 0, 1, . . . , n.
x
E(X) = np.
Var(X) = np(1 p).
G(t) = (1 p + pt)n .
M (t) = [(1 p) + pet ]n .

Distribuci
on geom
etrica
X geo(p), con p (0, 1) y q = 1 p
f (x) = p(1 p)x para x = 0, 1, . . .
E(X) = q/p.
Var(X) = q/p2 .
G(t) = p/[1 t(1 p)].
M (t) = p/[1 (1 p)et ].

Distribuci
on Poisson
X Poisson() con > 0.
x
f (x) = e
para x = 0, 1, . . .
x!
E(X) = .
Var(X) = .
G(t) = e(1t) .
M (t) = exp[(et 1)].

Distribuci
on binomial negativa
X binneg(r, p) con
 p (0, 1) y r {1, 2, . . .}.
r+x1
f (x) =
pr (1 p)x para x = 0, 1, . . .
x
E(X) = r(1 p)/p.
Var(X) = r(1 p)/p2 .
G(t) = [p/(1 t(1 p))]r .
M (t) = [p/(1 qet )]r .

205

Distribuci
on hipergeom
etrica
X hipergeo(N,

  K, n) con
 N,
 K, n {1, 2, . . .} y n K N .
K
N K
N
f (x) =
/
para x = 0, 1, . . . , n.
x
nx
n
E(X) = nK/N .
N K N n
Var(X) = n K
N N N 1 .

DISTRIBUCIONES UNIVARIADAS CONTINUAS


Distribuci
on uniforme continua
X unif(a, b) con a < b.
f (x) = 1/(b a) para x (a, b).
F (x) = (x a)/(b a) para x (a, b).
E(X) = (a + b)/2.
Var(X) = (b a)2 /12.
M (t) = (ebt eat )/(bt at).

Distribuci
on exponencial
X exp() con > 0.
f (x) = ex para x > 0.
F (x) = 1 ex para x > 0.
E(X) = 1/.
Var(X) = 1/2 .
M (t) = /( t) para t < .

Distribuci
on gama
X gama(n, ) con n > 0 y > 0.
(x)n1 x
f (x) =
e
para x > 0.
(n)
P
n1
F (x) = 1 ex j=0
(x)j /j! para x > 0 y n entero.
E(X) = n/.
Var(X) = n/2 .

206

M (t) = [/( t)]n para t < .

Distribuci
on beta
X beta(a, b) con a > 0, b > 0.
f (x) = xa1 (1 x)b1 /B(a, b) para x (0, 1).
E(X) = a/(a + b).
Var(X) = ab/[(a + b + 1)(a + b)2 ].

Distribuci
on normal
X N(, 2 ) con R y 2 > 0.
1
2
2
f (x) =
e(x) /2 .
2
2
E(X) = .
Var(X) = 2 .
M (t) = exp(t + 2 t2 /2).
(t) = exp(it 2 t2 /2).
Cuando = 0 y 2 = 1 se obtiene la distribuci
on normal est
andar.

Distribuci
on ji-cuadrada
X 2 (n) con n > 0.
 n/2
1
1
f (x) =
xn/21 ex/2 para x > 0.
(n/2) 2
E(X) = n.
Var(X) = 2n.
M (t) = (1 2t)n/2 para t < 1/2.

Distribuci
on t
X t(n) con n > 0.
(n + 1/2)
x2
f (x) =
(1 + )n1/2 .
n (n/2)
n
E(X) = 0.
Var(X) = n/(n 2) para n > 2.
M (t) no existe para t 6= 0.
207

(t) = exp(|t|).

Distribuci
on log normal
X log normal(, 2 ) con R y 2 > 0.
1
f (x) =
exp[(ln x )2 /2 2 ] para x > 0.
2
x 2
E(X) = exp( + 2 /2).
E(X n ) = exp(n + n2 2 /2).
Var(X) = exp(2 + 2 2 ) exp(2 + 2 ).

Distribuci
on Pareto
X Pareto(a, b) con a, b > 0.
aba
f (x) =
para x > 0.
(a + x)a+1
F (x) = 1 [b/(b + x)]a para x > 0.
E(X) = b/(a 1) para a > 1.
Var(X) = ab2 /[(a 1)2 (a 2)] para a > 2.

Distribuci
on Weibull
X Weibull(r, ) con r, > 0.
r
f (x) = e(x) rr xr1 para x > 0.
r
F (x) = 1 e(x) para x > 0.
E(X) = (1 + 1/r)/.
Var(X) = [(1 + 2/r) 2 (1 + 1/r)]/2 .

Distribuci
on Cauchy
X Cauchy(a, b) con a > 0 y b > 0.
1
f (x) =
.
b[1 + ((x a)/b)2 ]
La esperanza y varianza no existen.
Cuando a = 0 y b = 1 se obtiene la distribuci
on Cauchy est
andar. En este caso,
1
f (x) =
.
(1 + x2 )
208

F (x) = 1/2 + (arctan x)/.

209

Ap
endice B

Formulario
B.1.

El alfabeto griego

A
B

E ,
Z
H
,

B.2.

alpha
beta
gamma
delta
epsilon
zeta
eta
theta

I
K

M
N

Oo

iota
kappa
lambda
mu
nu
xi
omikron
pi

P ,
,
T

,
X

rho
sigma
tau
upsilon
phi
chi
psi
omega

Imagen inversa

Sean A y B dos conjuntos. Considere una funci


on X : A B. La imagen inversa
de B B es un subconjunto de A denotada por X 1 B y definido como sigue
X 1 B = {a A : X(a) B}.
Observe que X es una funci
on puntual, es decir, lleva puntos de A en puntos de B,
mientras que X 1 es una funci
on conjuntista, es decir, lleva subconjuntos de B en
subconjuntos de A. No es difcil verificar que la imagen inversa cumple las siguientes
propiedades.
1. X 1 B = A.
2. X 1 (B c ) = (X 1 B)c .
3. Si B1 B2 entonces X 1 B1 X 1 B2 .
210

4. X 1 (B2 B1 ) = X 1 B2 X 1 B1 .
5. X

Bk ) =

n
\

Bk ) =

k=1

6. X 1 (

X 1 Bk .

k=1

k=1

n
\

X 1 Bk .

k=1

7. X(X 1 B) B [ igualdad si y solo si X es sobre ].


8. X 1 (XA) A [ igualdad si y solo si X es inyectiva ].
Si se tienen dos funciones X : A B y Y : B C entonces para cualquier C en C,
se cumple (X Y )1 C = X 1 (Y 1 C).

B.3.

Funci
on indicadora

La funci
on indicadora de un conjunto A es la funci
on 1A : {0, 1} dada por
1A () =

1 si A,
0 si
/ A.

De este modo la funci


on 1A toma el valor uno dentro del conjunto A y cero fuera de
el. Es sencillo verificar que esta funci
on resulta ser una variable aleatoria cuando el
conjunto A es un evento. La funci
on indicadora cumple las siguientes propiedades.
a) 1AB = m
ax{1A , 1B } = 1A + 1B 1A 1B .
b) 1AB = mn{1A , 1B } = 1A 1B .
c) 1Ac = 1 1A .
d) 1AB = 1A 1A 1B .
e) 1AB = |1A 1B | = 1A + 1B 2 1A 1B = (1A 1B )2 .
f) A B 1A 1B .

B.4.

Resumen de algunos conceptos y f


ormulas

1. -
algebra: es una colecci
on de subconjuntos de distinta del vaco ( F),
y cerrada bajo las operaciones de tomar complementos
(A F Ac F) y
S
tomar uniones numerables (A1 , A2 , . . . F n=1 An F).

2. Axiomas de la probabilidad: a) P ()
P (A) 0, para A F.
S = 1. b)P

c) A1 , A2 , . . . F ajenos dos a dos P (


A
)
=
n=1 n
n=1 P (An ).
211

3. Esperanza E(X) =

x dF (x)

a) E(c) = c
b) E(cX) = cE(X)
c) E(X + Y ) = E(X) + E(Y )
d) X 0 = E(X) 0.

e) X Y = E(X) E(Y ).

4. Varianza Var(X) = E(X )2 .

Es un n
umero no negativo que indica el grado de dispersi
on de los valores de
la variable aleatoria. Cumple
a) Var(cX) = c2 Var(X).
b) Var(X + c) = Var(X).
c) Var(X) = E(X 2 ) E 2 (X).

d) Var(X + Y ) 6= Var(X) + Var(Y ) (excepto caso independencia).


5. Covarianza Cov(X, Y ) = E [(X E(X))(Y E(Y ))].
a) Cov(X, Y ) = E(XY ) E(X)E(Y ).
b) Cov(X, Y ) = Cov(Y, X).
c) Cov(X, X) = Var(X).
d) Cov(a, Y ) = 0, a constante.
e) Cov(aX, Y ) = aCov(X, Y ), a constante.
f ) Cov(X1 + X2 , Y ) = Cov(X1 , Y ) + Cov(X2 , Y ).
g) X, Y indep = Cov(X, Y ) = 0.
h) Cov(X, Y ) = 0 =
6
X, Y indep (excepto caso normal).
6. Coeficiente de correlaci
on (X, Y ) = p

Cov(X, Y )
.
Var(X) Var(Y )

Es un n
umero en [1, 1] que representa una medida del grado de dependencia
lineal entre dos variables aleatorias. Cuando Y = aX + b con a 6= 0 y b
constantes se cumple |(X, Y )| = 1 y viceversa. Si X y Y son independientes
entonces (X, Y ) = 0, el recproco es falso excepto en el caso normal.

7. Transformaciones
Si X es una variable aleatoria y es una funci
on estrictamente mon
otona y
con inversa diferenciable entonces la variable aleatoria Y = (X) tiene funcion
de densidad
d
fY (y) = fX (1 (y)) | 1 (y)|.
dy
En el caso bidimensional, si (U, V ) = (X, Y ) con continua y con inversa
diferenciable entonces
fU,V (u, v) = fX,Y (1 (u, v)) |J(u, v)|,
212



1

1
1
1




v
en donde J(u, v) = u
1 . En particular se cumplen las siguientes


1
2
2


u
v
f
ormulas
Z
a) fX+Y (u) =
fX,Y (u v, v) dv

Z
b) fXY (u) =
fX,Y (u + v, v) dv


Z
1
c) fXY (u) =
fX,Y (u/v, v) dv
v
Z

d) fX/Y (u) =
fX,Y (uv, v) |v| dv

8. Funci
on generadora de probabilidad G(t) = E(tX ).
Se utiliza principalmente para distribuciones discretas. Cuando existe determina de manera u
nica a la distribuci
on de probabilidad. Genera los momentos
factoriales a traves de la f
ormula
G(n) (1) = E[X(X 1) (X n + 1)],
cuando estos momentos existen. Cumple adem
as
a) X, Y indep GX+Y (t) = GX (t)GY (t).
9. Funci
on generadora de momentos M (t) = E(etX ).
Esta funci
on no existe para todas las distribuciones de probabilidad. Cuando
existe en alg
un intervalo no trivial alrededor de t = 0 determina de manera
u
nica a la distribuci
on de probabilidad. Genera los momentos a traves de la
(n)
f
ormula M (0) = E(X n ). Adem
as cumple
a) X, Y indep MX+Y (t) = MX (t)MY (t), el recproco es falso.
d

b) Xn X si y solo si MXn (t) MX (t) para cada t en (, ), > 0.


10. Funci
on caracterstica (t) = E(eitX ).
Es una funci
on que siempre existe y determina de manera u
nica a la distribuci
on de probabilidad. Genera los momentos a traves de la f
ormula (n) (0) =
n
n
i E(X ) cuando estos momentos existen. Adem
as cumple
a) X, Y indep X+Y (t) = X (t)Y (t), el recproco es falso.
d

b) Xn X si y solo si Xn (t) X (t) para cada t en R.


Z T
1
1 eith itx
c) F (x + h) F (x) = lm
e
(t) dt (L`evy).
T 2 T
it
Z T
1
d) f (x) = lm
eitx (t) dt.
T 2 T
n

11. Ley de los grandes n


umeros

1X
Xi
n
i=1

213

12. Teorema central del lmite

(X1 + + Xn ) n d

N(0, 1)
n

214

B.5.

Tabla de la distribuci
on normal est
andar

x
1
(x) =
2

2 /2

et

dt

0.00

0.01

0.02

0.03

0.04

0.05

0.06

0.07

0.08

0.09

0.0
0.1
0.2
0.3
0.4

0.5000
0.5398
0.5793
0.6179
0.6554

0.5040
0.5438
0.5832
0.6217
0.6591

0.5080
0.5478
0.5871
0.6255
0.6628

0.5120
0.5517
0.5910
0.6293
0.6664

0.5160
0.5557
0.5948
0.6331
0.6700

0.5199
0.5596
0.5987
0.6368
0.6736

0.5239
0.5636
0.6026
0.6406
0.6772

0.5279
0.5675
0.6064
0.6443
0.6808

0.5319
0.5714
0.6103
0.6480
0.6844

0.5359
0.5753
0.6141
0.6517
0.6879

0.5
0.6
0.7
0.8
0.9

0.6915
0.7257
0.7580
0.7881
0.8159

0.6950
0.7291
0.7611
0.7910
0.8186

0.6985
0.7324
0.7642
0.7939
0.8212

0.7019
0.7357
0.7673
0.7967
0.8238

0.7054
0.7389
0.7704
0.7995
0.8264

0.7088
0.7422
0.7734
0.8023
0.8289

0.7123
0.7454
0.7764
0.8051
0.8315

0.7157
0.7486
0.7794
0.8078
0.8340

0.7190
0.7517
0.7823
0.8106
0.8365

0.7224
0.7549
0.7852
0.8133
0.8399

1.0
1.1
1.2
1.3
1.4

0.8413
0.8643
0.8849
0.9032
0.9192

0.8438
0.8665
0.8869
0.9049
0.9207

0.8461
0.8686
0.8888
0.9066
0.9222

0.8485
0.8708
0.8907
0.9082
0.9236

0.8508
0.8729
0.8925
0.9099
0.9251

0.8531
0.8749
0.8944
0.9115
0.9265

0.8554
0.8770
0.8962
0.9131
0.9279

0.8577
0.8790
0.8980
0.9147
0.9292

0.8599
0.8810
0.8997
0.9162
0.9306

0.8621
0.8830
0.9015
0.9177
0.9319

1.5
1.6
1.7
1.8
1.9

0.9332
0.9452
0.9554
0.9641
0.9713

0.9345
0.9463
0.9564
0.9649
0.9719

0.9357
0.9474
0.9573
0.9656
0.9726

0.9370
0.9484
0.9582
0.9664
0.9732

0.9382
0.9495
0.9591
0.9671
0.9738

0.9394
0.9505
0.9599
0.9678
0.9744

0.9406
0.9515
0.9608
0.9686
0.9750

0.9418
0.9525
0.9616
0.9693
0.9756

0.9429
0.9535
0.9625
0.9699
0.9761

0.9441
0.9545
0.9633
0.9706
0.9767

2.0
2.1
2.2
2.3
2.4

0.9772
0.9821
0.9861
0.9893
0.9918

0.9778
0.9826
0.9864
0.9896
0.9920

0.9783
0.9830
0.9868
0.9898
0.9922

0.9788
0.9834
0.9871
0.9901
0.9925

0.9793
0.9838
0.9875
0.9904
0.9927

0.9798
0.9842
0.9878
0.9906
0.9929

0.9803
0.9846
0.9881
0.9909
0.9931

0.9808
0.9850
0.9884
0.9911
0.9932

0.9812
0.9854
0.9887
0.9913
0.9934

0.9817
0.9857
0.9890
0.9916
0.9936

2.5
2.6
2.7
2.8
2.9

0.9938
0.9953
0.9965
0.9974
0.9981

0.9940
0.9955
0.9966
0.9975
0.9982

0.9941
0.9956
0.9967
0.9976
0.9982

0.9943
0.9957
0.9968
0.9977
0.9983

0.9945
0.9959
0.9969
0.9977
0.9984

0.9946
0.9960
0.9970
0.9978
0.9984

0.9948
0.9961
0.9971
0.9979
0.9985

0.9949
0.9962
0.9972
0.9979
0.9985

0.9951
0.9963
0.9973
0.9980
0.9986

0.9952
0.9964
0.9974
0.9981
0.9986

3.0
3.1
3.2
3.3
3.4

0.9987
0.9990
0.9993
0.9995
0.9997

0.9987
0.9991
0.9993
0.9995
0.9997

0.9987
0.9991
0.9994
0.9995
0.9997

0.9988
0.9991
0.9994
0.9996
0.9997

0.9988
0.9992
0.9994
0.9996
0.9997

0.9989
0.9992
0.9994
0.9996
0.9997

0.9989
0.9992
0.9994
0.9996
0.9997

0.9989
0.9992
0.9995
0.9996
0.9997

0.9990
0.9993
0.9995
0.9996
0.9997

0.9990
0.9993
0.9995
0.9997
0.9998

215

Bibliografa
[1] Blake I.F. (1979) An introduction to applied probability. Wiley.
[2] Cohn D.L. (1980) Measure theory. Birkh
auser.
[3] Feller W. (1978) Introducci
on a la teora de las probabilidades y sus aplicaciones.
Vol. I y II. Limusa.
[4] Grimmett G.R., Stirzaker D.R. (1982) Probability and random processes. Clarendon Press.
[5] Grimmett G.R., Stirzaker D.R. (1986) Probability: an introduction. Oxford University Press.
[6] Grimmett G.R. , Stirzaker D.R. (2001) One thousand exercises in probability.
Oxford University Press.
[7] Gut A. (2005) Probability: a graduate course. Springer.
[8] Halmos P.R. (1960) Measure theory. Van Nostrand.
[9] Harris B. (1966) Theory of probability. AddisonWesley.
[10] Hoel P., Port S., Stone C. (1971) Probability theory. Houghton Mifflin Co.
[11] Jacod D., Protter P. (2000) Probability essentials. SpringerVerlag.
[12] Karr A.F. (1993) Probability. SpringerVerlag.
[13] Laha R. G., Rohatgi V. K. (1979) Probability theory. John Wiley & Sons.
[14] Miller I., Miller M. (1999) John E. Freunds mathematical statistics - 6th ed.
PrenticeHall.
[15] Mood A.M., Graybill F.A., Boes D.C. (1974) Introduction to the theory of statistics. McGraw Hill.
[16] Parzen E. (1960) Modern probability theory and its applications. Wiley.
[17] Resnick S.I. (1999) A probability path. Birkh
auser.
[18] Rinc
on L. (2004) Que es la esperanza condicional? Miscel
anea Matem
atica.
No. 37, Agosto 2004, SMM.

216

[19] Romano J.P. , Siegel A.F. (1986) Counterexamples in probability and statistics.
Chapman & Hall.
[20] Rosenthal J.S. (2000) A first look at rigorous probability theory. World Scientific.
[21] Ross S. (1976) A first course in probability. Prentice Hall.
[22] Villa Morales J. (2005) Introducci
on a la medida e integraci
on. Textos Universitarios, Ciencias B
asicas. Universidad Aut
onoma de Aguascalientes.
[23] Williams D. (1991) Probability with martingales. Cambridge University Press.
[24] Williams D. (2001) Weighing the odds: a course in probability and statistics.
Cambridge University Press.

217

Indice
-
algebra, 5
generada, 8
mnima generada, 8
-
algebra, 4
de Borel, 11

Algebra,
10

Bernoulli, 59, 204


beta, 65, 207
binomial, 59, 205
binomial negativa, 62, 205
Cauchy, 208
exponencial, 64, 206
exponencial doble, 83
F de Snedecor, 151
gama, 64, 206
geometrica, 60, 205
hipergeometrica, 62, 206
hipergeometrica multivariada, 105
ji-cuadrada, 145, 207
log normal, 68, 128, 208
multinomial, 104
normal, 66, 207
normal bivariada, 106
Pareto, 208
Poisson, 61, 205
t de Student, 148, 207
uniforme continua, 63, 206
uniforme discreta, 58, 204
Weibull, 208

Borel-Cantelli, 26
Coeficiente de correlaci
on, 101
Conjunto
Borel medible, 11
Boreliano, 11
de Borel, 11
medible, 5
Continuidad de la prob, 20, 21, 23
Convergencia
casi dondequiera, 165
casi segura, 165
casi siempre, 165
debil, 168
de eventos, 14
en distribuci
on, 168
en media, 167
en media cuadr
atica, 167
en probabilidad, 166
puntual, 164
puntual de v.a.s, 164
Convoluci
on, 133
Covarianza, 99
Desigualdad
de Bonferroni, 37
de Boole, 19
de Cauchy-Schwarz, 79
de Chebyshev, 195
de Kounias, 37
de Markov, 194
Distribuci
on
arcoseno, 85

Espacio
de probabilidad, 4, 5
medible, 5
muestral, 4
Esperanza
condicional, 122
de un vector, 103
de una funci
on de un vector, 97
de una v.a., 54
Estadsticas de orden, 152
Estadstica, 144
Evento, 4
Funci
on
indicadora, 211
Funci
on caracterstica, 182
218

f
ormula de inversi
on, 184, 185
teorema de continuidad, 185
teorema de unicidad, 184
Funci
on de densidad
condicional, 95
marginal, 95
Funci
on de distribuci
on, 46
condicional, 96
conjunta, 89
marginal, 94
Funci
on de probabilidad
conjunta, 92
Funci
on generadora
de momentos, 180
de probabilidad, 177

esperado, 54
medio, 54
promedio, 54
Variable aleatoria, 39
continua, 50
discreta, 50
mixta, 51
Varianza
condicional, 124
de un vector, 103
de una v.a., 56
muestral, 144
Vector aleatorio, 87
continuo, 88
discreto, 88

Imagen inversa, 210


Independencia
de -
algebras, 26
de eventos, 25
de v.a.s, 96
Integral de Riemann-Stieltjes, 52
Lmite
inferior, 14
superior, 14
Ley de los grandes n
umeros, 196
debil, 197
fuerte, 198
Matriz de covarianzas, 104
Media, 54
muestral, 144
Medida de probabilidad, 4, 17
Momentos, 57
absolutos, 57
centrales, 57
centrales absolutos, 57
Muestra aleatoria, 144
Semi
algebra, 10
Teorema
de cambio de variable, 128, 129
de convergencia dominada, 174
de convergencia mon
otona, 173
del lmite central, 199
Valor
219