You are on page 1of 198

UNIVERSIDAD DE LAS AMERICAS PUEBLA

Departamento de Ingeniera Industrial y Mecnica










Estadstica Descriptiva e Inferencial









D Dr ra a. . A Ad de el li it ta a P Po os sa ad da a B Bo ol li iv va ar r

2



Introduccin. ..................................................................................................................... 6
C Ca ap p t tu ul lo o I I
Estadstica Descriptiva

1.1 Descripcin de Conceptos Estadsticos. ............................................................... 7
1.2 Distribucin de Frecuencias .................................................................................. 7
1.3 Distribucin de Frecuencia Relativa ................................................................... 10
1.4 Distribucin de Frecuencia Acumulada. ............................................................. 10
1.5 Grficas de las Distribuciones de Frecuencia ..................................................... 11
1.5.1 Histograma ....................................................................................................... 11
1.5.2 Poligonos de Frecuencia .................................................................................. 12
1.5.3 Las Ojivas ........................................................................................................ 12
1.5.4 Diagrama de Tallo y Hojas .............................................................................. 13
1.5.5 Distribucin de Frecuencia para Datos Nominales y Jerarquizados. ............... 15

1.6 Medidas de Tendencia Central ............................................................................ 16
1.6.1 Media ............................................................................................................... 16
1.6.2 Media Ponderada ............................................................................................. 18
1.6.3 Mediana ............................................................................................................ 19
1.6.4 Moda ................................................................................................................ 21
1.6.5 Media Geomtrica. ........................................................................................... 22
1.6.6 Promedio Armnico. ...................................................................................... 23
1.6.7 Medidas derivadas de la Mediana. ................................................................. 23

1.7 Medidas de dispersin ......................................................................................... 25
1.7.1 Rango o amplitud de Variacin. ...................................................................... 26
1.7.2 Varianza ........................................................................................................... 27
1.7.3 Desviacin Estndar ........................................................................................ 28

1.8 Coeficiente de variacin ..................................................................................... 28
1.9 Medidas de asimetra. .......................................................................................... 29
1.10 Curtosis: Una medida de agudeza. ................................................................... 29
C Ca ap pi it tu ul lo o I II I
Probabilidad. Conceptos bsicos y teoremas.

2.1 Elementos de la Teora de Conjuntos. ................................................................. 31
3
2.1.1 Definiciones. .................................................................................................... 31
2.1.2 Algebra de Conjuntos. ..................................................................................... 33
2.1.3 Propiedades de un Conjunto. .......................................................................... 35

2.2 Experimento Aleatorio. Espacio Muestral. Eventos. ........................................ 36
2.3 Definiciones de Probabilidad y Teoremas. ...................................................... 39
2.3.1 Definicin Clsica de Probabilidad o de Laplace. ......................................... 39
2.3.2 Definicin de Probabilidad en base a la frecuencia relativa. ......................... 40

2.4 Tcnicas de Conteo. ............................................................................................ 53
2.5 Probabilidad Condicional e Independencia. ..................................................... 72
2.5.1 Probabilidad Condicional............................................................................... 72
2.5.2 Regla de la multiplicacin. ............................................................................ 77
2.5.3 Regla de la Probabilidad Total ....................................................................... 77

C Ca ap pi it tu ul lo o I II II I
Variables Aleatorias, Funciones de Distribucin.

3.1 Variable Aleatoria ............................................................................................... 81
3.1.1 Espectro de una Variable Aleatoria. .............................................................. 81
3.1.2 Distribucin de una Variable Aleatoria. ........................................................ 81
3.1.3 Clasificacin de las Variables Aleatorias. ...................................................... 81
3.1.4 Valor Esperado o Esperanza Matemtica ...................................................... 83
3.1.5 Varianza de una Variable Aleatoria. .............................................................. 83

3.2 Distribuciones con Nombre Propio ..................................................................... 90
3.2.1 Distribuciones con Nombre Propio para Una Variable Aleatoria Discreta. ... 91
3.2.2 Distribuciones Especiales de Probabilidad para una Variable Aleatoria
Continua. ................................................................................................................. 101

C Ca ap pi it tu ul lo o I IV V
Distribuciones Muestrales.

4.1 Distribucin Muestral Del Promedio Aritmtico. ............................................ 112
4.2 Distribucin Muestral de la Diferencia de dos Medias .................................... 113
4.3 Distribucin Muestral de la Proporcin ........................................................... 114
4.4 Distribucin de la Diferencia de dos Proporciones ......................................... 115
C Ca ap pi it tu ul lo o V V
Teora Estadstica de la Estimacin.

4
5.1 Estimadores puntuales. Clasificacin................................................................ 116
5.2 Estimacin de Intervalos de Confianza para los Parmetros de una Poblacin.
..................................................................................................................................... 117
5.2.1 Estimacin de Intervalos de Confianza para la Media. ................................ 118
5.2.2 Intervalos de Confianza para Diferencias de Medias. .................................. 122
5.2.3 Intervalo de Confianza para la Proporcin................................................... 124
5.2.4 Intervalo de Confianza para la Diferencia de Proporciones. .......................... 125
5.2.5 Intervalo de Confianza para la Varianza. ....................................................... 126
5.2.6 Intervalo de Confianza para el Cociente de Varianza. ................................. 127

C Ca ap pi it tu ul lo o V VI I
Hiptesis Estadsticas y Pruebas de Hiptesis.

6.1 Hiptesis Estadstica ......................................................................................... 128
6.2 Prueba de Hiptesis. ......................................................................................... 128
6.2.1 Componentes de las Pruebas de Hiptesis. .................................................. 128
6.2.2 Errores de la Prueba de Hiptesis. ............................................................... 129
6.2.3 Estadsticos de Prueba y Reglas sobre Decisiones. ...................................... 130
6.2.4 Pruebas Estadsticas a una y dos Colas. ....................................................... 130
6.2.5 Pruebas Estadsticas Comunes. .................................................................... 130
6.2.5.1 Prueba de Hiptesis acerca de la Media Poblacional. ............................. 130
6.2.5.2 Prueba de Hiptesis para la Diferencia de Medias.................................. 133
6.2.5.3 Prueba de Hiptesis para la Proporcin. ................................................. 134
6.2.5.4 Prueba de Hiptesis para la diferencia de Proporciones. ........................ 134
6.2.5.5 Prueba de Hiptesis para la Varianza ..................................................... 134
6.2.5.6 Prueba de Hiptesis para la Relacin de Varianza ................................. 134

C Ca ap pi it tu ul lo o V VI II I
Pruebas de bondad y ajuste

7.1. La prueba
X
2
de una muestra ........................................................................ 140
7.2 Pruebas de una muestra Kolmogorov-Smirnov .............................................. 145
C Ca ap pi it tu ul lo o V VI II II I
Muestreo

8.1 Muestreo aleatorio irrestricto o simple. ........................................................... 148
8.2 Muestreo Aleatorio Estratificado ...................................................................... 151
8.3 Muestreo aleatorio por conglomerados ............................................................ 156
8.4 Ejemplos de muestreo aleatorio irrestricto o simple....................................... 160
5
8.5 Ejemplos de muestreo aleatorio estratificado.................................................. 164
8.6 Ejemplos de muestreo por conglomerados ...................................................... 168
C Ca ap pi it tu ul lo o I IX X
Regresion Lineal y Correlacin


C Ca ap p t tu ul lo o I I
Estadstica Descriptiva
C Ca ap pi it tu ul lo o I II I
Probabilidad. Conceptos bsicos y teoremas.
C Ca ap pi it tu ul lo o I II II I
Variables Aleatorias, Funciones de Distribucin.
C Ca ap pi it tu ul lo o I IV V
Distribuciones Muestrales.
C Ca ap pi it tu ul lo o V V
Teora Estadstica de la Estimacin.
C Ca ap pi it tu ul lo o V VI I
Hiptesis Estadsticas y Pruebas de Hiptesis.
C Ca ap pi it tu ul lo o V VI II I
Pruebas de bondad y ajuste
C Ca ap pi it tu ul lo o V VI II II I
Muestreo
C Ca ap pi it tu ul lo o I IX X
Regresion Lineal y Correlacin
A An ne ex xo os s. .
Anexo 1. Distribucin de frecuencias ...
Anexo 2. Medidas de tendencia central ...
Anexo 3. Medidas derivadas de la mediana
Anexo 4. Medidas de dispersin
Anexo 5. Propiedades de la media y varianza
Anexo 6. Experimento 1
Anexo 7. Elementos de la teora de conjuntos .
Anexo 8. Tcnicas de conteo ...
Anexo 9. Distribuciones discretas y continuas ..
Anexo 10. Distribucin que se derivan de la distribucin normal ...
Anexo 11. Formulario intervalos de confianza
6
Anexo 12. Experimento 2 ....
Anexo 13. Experimento 3 ....
Anexo 14. Experimento 4 ....
Anexo 15. Formulario prueba de hiptesis ..
Anexo 16. Tablas Estadsticas






INTRODUCCION.




Estas notas se han preparado tomando como base publicaciones de diversos autores. Su
objetivo es proveer una base en tcnicas estadsticas que sea aplicable a diferentes actividades
y permitir resolver problemas y ejemplos de la vida diaria para demostrar que la Estadstica no
es una concatenacin de frmulas abstractas que tienen muy escasa relacin con la aplicacin
prctica.

















7



C Ca ap p t tu ul lo o I I
Estadstica Descriptiva

La Estadstica Descriptiva consiste en organizar, resumir y simplificar informacin que
frecuentemente es bastante compleja.

El conjunto de observaciones que se toman de alguna fuente de observaciones con objeto de
obtener informacin respecto a ella se le llama MUESTRA, mientras que la fuente de estas
observaciones recibe el nombre de POBLACION.

1.1 Descripcin de Conceptos Estadsticos.

Existen dos clases de datos los cuales provienen de las siguientes variables.

VARIABLE CONTINUA.
Aquella que puede tomar cualquier valor dentro de un Intervalo. Los datos que se obtienen con
respecto a esta variable se llaman DATOS CONTINUOS.

Ejemplo. Altura, Peso, Velocidad, Rigidez.

VARIABLE DISCRETA.
Aquella que solo puede tomar valores enteros. Los datos que se obtienen con respecto a esta
variable se llaman DATOS DISCRETOS.

Ejemplo: Nmero de Grietas en el Recipiente de Vidrio, Nmero de Cajas de Cartn Rgido
que cumple con las especificaciones, etc.

MUESTRA ALEATORIA.
Cuando seleccionamos una muestra de una poblacin en la que todos los elementos son
independientes y tienen igual oportunidad de ser seleccionados, se tiene una muestra aleatoria.

1.2 Distribucin de Frecuencias

Es el agrupamiento de la Informacin en diferentes clases.

El objetivo principal es resumir la informacin que se tiene sin perder la esencia de esta
informacin. La informacin bsica o inicial recibe el nombre de datos originales.

Los datos originales se representan por Xi.

Procedimiento

Para construir una Distribucin de Frecuencia se siguien los siguientes pasos:
8

1.- Determinar el rango o recorrido de la variable.
Rango = R = X mx - X min (Diferencia entre el mayor y el menor de los datos)

2.- Determinar el nmero de clases, categorias o intervalos en que se va a agrupar la
informacin. Este nmero se representa por m.
El nmero de clases puede ser arbitrario o determinado mediante la regla de Sturges, para
la cual:
m 1+ 3.3 log n

Donde n representa el nmero de observaciones que se tienen.

3.- Determinacin de la amplitud de clase, representada por C e igual a:


4.- Determinacin de los lmites de clase.
Cada clase es un intervalo y los nmeros en sus extremos reciben el nombre de LIMITES
DE CLASE.




El lmite inferior es cerrado y el lmite superior es abierto con excepcin del lmite
superior de la ltima clase que es cerrado.

Hay intervalos de clase que no poseen lmite superior o inferior. Estos reciben el nombre
de INTERVALO DE CLASE ABIERTO.

Existen otros lmites de gran importancia llamados LIMITES REALES DE CLASE. El
lmite real inferior de una clase se obtiene sumando al lmite inferior de la clase el lmite
superior de la clase anterior y esto dividido entre dos.

Para hallar el lmite real superior de una clase se suma al lmite superior de la clase el
lmite inferior de la clase siguiente y el resultado dividido entre dos.

5.- Realizar un conteo para determinar el nmero de observaciones que se encuentran en cada
clase.
A las observaciones que hay en cada clase se le llama frecuencia absolutas y se representa
por n
J
.

Ejemplo:

9
En una fbrica productora de corrugados, se controla la resistencia de estos. En los ltimos
meses se han presentado quejas en la caja con tapas cruzadas y encintadas, razn por la cual se
ha tomado una muestra de 126 cajas para analizarla. Los datos son los siguientes:


15.30 15.20 15.65 15.45 16.15 15.25 15.55 16.15 15.35
15.50 15.30 15.20 15.50 15.60 15.60 15.60 16.16 16.10
14.90 15.55 16.00 15.95 14.80 15.50 15.75 14.81 15.25
15.25 15.50 15.65 16.10 15.85 15.55 15.50 14.93 15.10
15.10 15.20 15.30 15.10 15.85 16.25 15.35 15.10 15.35
16.22 14.50 15.35 16.00 15.10 14.90 14.81 15.50 15.40
16.30 15.95 15.70 14.95 15.60 15.45 15.35 15.50 15.40
14.50 14.95 15.30 15.85 15.80 15.60 15.75 15.45 14.60
15.30 15.00 15.50 15.90 15.10 15.30 14.81 15.50 15.10
15.50 15.50 16.30 15.60 15.60 15.30 15.60 15.00 16.00
16.15 15.65 16.10 15.95 15.55 15.60 15.60 15.20 15.95
16.60 15.25 15.10 15.00 16.25 15.30 15.90 14.50 15.60
15.95 14.75 15.20 15.58 14.65 14.90 15.00 14.50 15.65
15.40 15.90 15.45 16.00 16.20 14.70 15.60 15.90 14.50



1.- X min = 14.50
X mx = 16.30
2.- R = 16.30 - 14.50 = 1.80
3.- m = 9 (es dado)
4.- c = 180 = 0.2
9
J vara de 1 a 9

Y
j1
'
Y
j
'
Conteo n
J
Frecuencia h
J
Frecuencia N
J
+

Absoluta relativa
______________________________________________________________________
14.50- 14.70 IIII II 7 0.056 7
14.70 -14.90 IIII I 6 6/126 13
14.90 -15.10 IIII IIII 10 10/126 23
15.10 - 15.30 IIII IIII IIII II 17 0.13 40
15.30 - 15.50 IIII IIII IIII IIII 20 0.16 60
15.50 - 15.70 IIII IIII III IIII IIII IIII III 33 0.26 93
15.70 - 15.90 IIII II 7 0.056 100
15.90 - 16.10 IIII IIII III 13 0.10 113
16.10 - 16.30 IIII IIII III 13 0.10 126
______________________________________________________________________
Total 126 1


10





N
J
| H
J
Y
J

Frecuencia Frecuencia Relativa
Absoluta Acumulada Marca de Clase
Acumulada
___________________________________________________
126 0.056 14.60
119 0.103 14.80
113 0.183 15.00
103 0.32 15.20
86 0.48 15.40
66 0.74 15.60
33 0.79 15.80
26 0.90 16.00
13 1 16.20


n
3
= 10 Indica que hay 10 cajas con una resistencia entre 14.9 y
15.10 kgms.
n
7
= 7 Indica que hay 7 cajas con una resistencia entre 15.70
y 15.90 kgms.

1.3 Distribucin de Frecuencia Relativa

La frecuencia relativa de una clase es la frecuencia absoluta de la clase dividida por el total de
frecuencias de todas las clases.

Indican el porcentaje de datos que hay en la clase J.

Ejemplo:

h
5
= 0.16 indica que el 16% de las cajas tienen una resistencia entre 15.30 y 15.50 kgms.

La suma de las frecuencias relativas de todas las clases es 1 100%.

1.4 Distribucin de Frecuencia Acumulada.

Una distribucin de frecuencias acumulada est diseada para mostrar el nmero o porcentaje
de elementos que son menores que cierto valor especifico o iguales a ste.

Las distribuciones de frecuencias absolutas o relativas se pueden convertir fcilmente a
distribuciones acumuladas mediante sumas sucesivas de frecuencias absolutas o relativas segn
sea el caso, es decir la frecuencia total de todos los valores menores que el lmite superior de
11
clase de un intervalo de clase dado se conoce como FRECUENCIA ACUMULADA hasta ese
intervalo de clase inclusive.

Sea N
J
la frecuencia absoluta para la clase J.

Sea H
J
la frecuencia relativa acumulada para la clase J

=
=
J
k
J J h H
1



1.5 Grficas de las Distribuciones de Frecuencia

Las propiedades de las distribuciones de frecuencia relacionadas con su forma se hacen ms
evidentes mediante grficas, y en esta seccin introduciremos algunas de las formas ms
comunes de representar grficamente las distribuciones de frecuencias, las distribuciones
porcentuales y las distribuciones acumuladas.
1.5.1 Histograma

Es la forma ms comn de presentar una distribucin de frecuencia.

El Histograma de una distribucin de frecuencia se construye con las frecuencias absolutas o
relativas de clase representadas mediante la altura de los rectngulos y los lmites de clase
representados en la base de los rectngulos.

n
J

12
1.5.2 Poligonos de Frecuencia

Se constituye con los puntos medios de los intervalos de clase llamados Marcas de Clase y
representados por:




y las frecuencias absolutas o relativas.

Para no perder informacin, el poligono de frecuencias se hace partir de la base tomando en
cuenta una marca de clase anterior a la marca de clase de la primera clase y otra despus de la
ltima clase.

En nuestro ejemplo el poligono de frecuencias es:

n
J



Al observar la grfica de una distribucin de frecuencia a menudo resaltan
caractersticas que no eran evidentes en los datos mismos. Aparte de que tal grfica ofrece una
excelente imagen de los datos en conjunto, puede subrayar tambin irregularidades y rasgos
poco comunes. Por ejemplo, las observaciones muy alejadas que de alguna manera no
coinciden con la imagen en conjunto, es decir, con el patrn global de los datos, pueden tener
su origen en errores de medicin, fallas en el equipo o causas similares. Asi mismo, el hecho
de que un Histograma o polgono de frecuencia exhiba dos o ms modas (mximos) puede
indicar un cambio en el proceso o que los datos provienen de varias fuentes.
1.5.3 Las Ojivas

13
Las ojivas son grficas que representan las frecuencias absolutas acumuladas las relativas
acumuladas. Anotando en el eje X los lmites establecidos en el Histograma. Se identifican las
frecuencias acumuladas y los lmites de clase. Los puntos as determinados se unen mediante
segmentos rectilneos, como lo muestra la figura siguiente, la cual representa la distribucin
acumulada, "menor que" de los datos de resistencia en kilogramos de las cajas de nuestro
ejemplo.


Nj


1.5.4 Diagrama de Tallo y Hojas

Hasta ahora hemos dirigido nuestra atencin al agrupamiento de datos para conjuntos
relativamente grandes, con objeto de ponerlos en una forma manejable. Concientes de la
prdida de informacin que sto entraa, en aos recientes, se han propuesto tcnicas similares
para la exploracin preliminar de pequeos conjuntos de datos cuyos resultados son excelentes
imgenes globales sin ninguna prdida de informacin.

A manera de ejemplo, considera las siguientes lecturas de humedad redondeadas al entero ms
cercano:

29 44 12 53 21 34 39 25 48 23
17 24 27 32 34 15 42 21 28 37


Podramos agrupar estos datos en la siguiente distribucin:


Lecturas de Frecuencia
humedad Conteo absoluta
14
____________________________________________
10-19 III 3
20-29 IIII III 8
30-39 IIII 5
40-49 III 3
49-59 I 1

donde las marcas en el patrn global de los datos se parecen a las de un histograma (o diagrama
de barras) situado lateralmente.

Si deseamos evitar la prdida de informacin inherente a la tabla anterior, podramos
reemplazar las marcas con el ltimo dgito de las lecturas correspondientes, obteniendo as


10-19 2 7 5
20-29 9 1 5 3 4 7 1 8
30-39 4 9 2 4 7
40-49 4 8 2
50-59 3

Esto puede escribirse tambin as:

1* 2 7 5
2* 9 1 5 3 4 7 1 8
3* 4 9 2 4 7
4* 4 8 2
5* 3

donde * es un sustituto de 0, 1, 2, 3, 4, 5, 6, 7, 8 9, o simplemente como:

1 2 7 5
2 9 1 5 3 4 7 1 8
3 4 9 2 4 7
4 4 8 2
5 3

En cualquiera de estas formas finales, la tabla se denomina diagrama de tallos y hojas (o
simplemente diagrama tallo-hoja); cada rengln es un tallo y cada dgito sobre un tallo a la
derecha de la lnea vertical es una hoja. A la izquierda de la lnea vertical estn las etiquetas
de los tallos, que en nuestro ejemplo son 1*, 2*, . . . , y 5*, 1, 2, . . . y 5.

En esencia, un diagrama de tallos y hojas representan la misma imagen del correspondiente
diagrama con las etiquetas, aunque retiene la informacin original. Por ejemplo, si un diagrama
de tallos y hojas tiene el tallo.

1. 2* 3 5 2 0 8

15
los datos correpondientes son 1.23, 1.25, 1.22, 1.20 y 1.28, y si un diagrama de tallos y hojas
tiene el tallo.

0.3** 17 03 55 89

con hojas de dos dgitos, los datos correspondientes son 0.317, 0.303, 0.355 y 0.389.
1.5.5 Distribucin de Frecuencia para Datos Nominales y Jerarquizados.

Quiz las distribuciones de frecuencias ms fciles sean las que se utilizan para datos nominales
y jerarquizados. (Los datos nominales se obtienen cuando se definen las categoras y se cuenta
el nmero de observaciones que queda en cada una.

Los datos jerarquizados constan de valores relativos asignados para denotar orden (primero,
segundo, tercero, cuarto y as sucesivamente). Esta simplicidad radica en el hecho de que las
clases se ponen de manifiesto con ms facilidad, de modo que los clculos son mnimos. Por
ejemplo, considere los datos nominales de la siguiente tabla que representan las ventas de
gaseosas, ordenadas en una tabla de frecuencia. Las categorias son los diversos sabores de las
gaseosas. Dicha informacin se presentar mediante una grfica de lneas o barras en vez de un
histograma, lo que significa que las categorias no se tocan, o son nominales.

Ventas de Gaseosas en un Da.

Sabor Ventas Reales Ventas Relativas
__________________________________________________________
Cola 600 60%
Limn 200 20%
Naranja 100 10%
Uva 50 5%
Fresa 40 4%
Otros 10 1%
_____________ - _________
1000 100%

Grficas de Barras.

Otros Mtodos de Presentacin de Datos.
16

En la siguiente figura se indican algunas de las mltiples formas de presentar datos
grficamente.
.


1.6 Medidas de Tendencia Central

Estas medidas se emplean para indicar un valor que tiende a ser el ms representativo de un
conjunto de nmeros. Las tres medidas de mayor importancia son:
La media, la mediana y la moda.
1.6.1 Media

Para Datos de Muestra

Se representa como X

La media de datos de muestra sin agrupar, se calcula al sumar los valores del conjunto de
observaciones que se tengan y dividir el resultado de esta suma entre el nmero de
observaciones.

17
En notacin se dice que la media de un conjunto de n nmeros x
1
, x
2
. . . x
n
se representa por
x

, y se define como:


n
X
n
i
i x
=
=
1


La media de datos de muestra agrupados, se calcula como:


n
X
m
j
j j n Y

=
=
1


Y
J
= marca de clase
n
J
= frecuencia absoluta
m = nmero total de clases
n = nmero total de observaciones en la muestra

Para Datos Poblacionales

Se representa como

En notacin se dice que la media de un conjunto de N nmeros x
1
, x
2
. . . x
N
se representa por
, y se define como:


N
N
i
i x
=
=
1


La media de datos poblacionales agrupados, se calcula como:


N
m
j
j j n Y

=
=
1


Y
J
= marca de clase
n
J
= frecuencia absoluta
m = nmero total de clases
N = nmero total de observaciones en la poblacin


18

Propiedades de la Media

Esta medida de Tendencia Central posee varias propiedades:

a.- La media siempre se puede calcular para un conjunto de nmeros.
b.- La media es nica, es decir, existe una y slo una media para un conjunto dado de
nmeros.
c.- Si sumamos una constante a cada valor del conjunto, la media aumentar por la misma
cantidad. Si en lugar de sumar, se multiplica o divide sucede lo mismo, es decir, la media
resultar multiplicada o dividida por dicha constante.
d.- Si cambia algn valor del conjunto de nmero, entonces tambin la media cambia.
e.- La suma de desviaciones de los nmeros de un conjunto a partir de la media es cero, esto
es:

f.- La media de una constante es igual a la constante.

Nota: La media tiene la desventaja de dejarse afectar por los valores extremos.

Ejemplo:

Para el ejemplo de las cajas el clculo de la media es el siguiente:



1.6.2 Media Ponderada

19
La frmula para determinar la media vista anteriormente se emplea cuando cada observacin es
de igual IMPORTANCIA. Cuando esto no sucede, esto es, cuando hay ponderaciones la
frmula apropiada es:


Ejemplo:

Si tenemos dos muestras de tamao n
1
y n
2
con promedios aritmticos x
1
y x
2
. Se puede
obtener un promedio de las dos muestras, llamado promedio total en la forma siguiente

1.6.3 Mediana

Es una medida de posicin. Es un valor que divide la serie de datos en dos partes exactamente
iguales.

Por encima de la mediana est el 50% de la informacin y por debajo de la mediana el otro
50%.

La mediana se representa por Me

Si los datos no estan agrupados, la regla para obtener la mediana es:

a.- Ordene los datos de menor a mayor o de mayor a menor.
b.- Contar para conocer si existe un nmero par o impar de datos.
c.- Si se tiene un nmero impar de datos la mediana es el valor del dato que esta en el centro
de los datos ordenados.

Ejemplo:

Si los datos son 8, 10, 12, 15, 17
Me = 12

Si se tiene un nmero par de datos, la mediana es el promedio de los valores centrales de los
datos ordenados.
Ejemplo:
Si los datos son 8, 10, 12, 17, 20, 25

20

Si los datos estan agrupados, se hace uso para el clculo de la mediana de la columna de las
frecuencias absolutas acumuladas, determinando la frecuencia menor que contiene a n/2 sin
igualarlo. Esta frecuencia la representamos por Np y a su clase la llamaremos clase p.

N
p-1
ser la frecuencia absoluta acumulada de la clase anterior a la clase p
.
(Representa la mayor
de las frecuencias absolutas acumuladas que son superadas o igualadas por n/2).








Ejemplo

En el caso de la resistencia de las cajas, la variable resistencia en kgms es continua y el clculo
de la mediana es el siguiente:

Y'
J-1
- Y'
J
n
J
N
J

___________________________________________________
14.50 14.70 7 7
14.70 14.90 6 13
14.90 15.10 10 23
15.10 15.30 17 40
15.30 15.50 20 60 clase p-1
15.50 15.70 33 93 clase p
15.70 15.90 7 100
21
15.90 16.10 13 113
16.10 16.30 13 126


N
p
= 93
N
p-1
= 60


C= amplitud de la clase = 0.2
Y'
p-1
= 15.50

1.6.4 Moda

La moda es el valor que mayor nmero de veces se presenta en un conjunto de nmeros.
Existen algunos casos en los cuales no existe la moda y otros en los cuales existe ms de una
moda. Una distribucin que cuenta con una moda se le conoce como unimodal.

La moda se representa por Md.

Para datos sin agrupar, la moda es aquella observacin que aparece un mayor nmero de veces.

Para los datos agrupados, la moda se determina tomando en cuenta el tipo de variable.

a.- Para variable discreta

Se determina aquella clase donde existe un mayor nmero de observaciones, denotando a
esta clase por clase p.
La moda ser igual a la marca de clase de la clase p.

Md = Y
p

b.- Para variable continua

Se observa la mayor frecuencia absoluta, la clase que posee esta frecuencia se llama clase
p (clase modal)
22

Donde:


1
= n
p
- n
p-1


2
= n
p
- n
p+1

Y'
p-1
= es el limite inferior de la clase p
C = amplitud de clase

Si existen 2 o ms frecuencias mximas iguales, la moda no tiene aplicacin.

Ejemplo:

Para la resistencia en kgs. de las cajas se tiene:

Y'
J-1
Y'
J
n
J

___________________________________
14.5 - 14.7 7
14.7 - 14.9 6
14.9 - 15.1 10
15.1 - 15.3 17
15.3 - 15.5 20
15.5 - 15.7 33 clase p
15.7 - 15.9 7
15.9 - 16.1 13
16.1 - 16.3 13


Y'
p-1
= 15.50
1
= 33 - 20 = 13
n
p
= 33
2
= 33 - 7 = 26
n
p-1
= 20
n
p+1
= 7
c = 0.2

Md = 15.567 kg.

1.6.5 Media Geomtrica.

Se representa por G o M
g
y se define como la raz n-sima del producto de las diferentes
observaciones.

Para datos sin agrupar:
23


M
G
= x
1
- x
2
- x
3
-...x
n
n
log M
G
=
1
n
log x
i
i = 1
n

M
G
= Anti log
1
n
logx
i
i = 1
n




(

(


Para datos agrupados:


M
G
= Y
1
n
1
Y
2
n
2
...Y
m
nm
n
M
G
= Antil og
1
n
n
J
l ogY
J
J=1
m




(

(

Se utiliza para proporciones, tazas y proyecciones de poblacin.
Restriccin: Y
j
debe ser positiva (mayor que 0).

Como toma los logaritmos disminuye las diferencias entre los valores grandes o extremos.
1.6.6 Promedio Armnico.

Se representa por H o M
H
. Se define como el inverso de la media aritmtica de los inversos de
los datos.

Datos sin agrupar:
M
H
=
n
1
x
i
i=1
n



Datos agrupados:
M
H
=
n
n
J
Y
J
j=1
m



Se utiliza cuando se pide un promedio que es el Inverso de las unidades en que se tiene la
informacin. Le da ms peso a los valores pequeos que a los grandes.
1.6.7 Medidas derivadas de la Mediana.

Fractiles

24
Los fractiles dividen la informacin en un nmero cualquiera de partes. Se denotan por F
r
s
,
que se lee como r-simo fractil de orden S.

Donde:
S = nmero de partes en que se divide la poblacin.
r = la parte que se desea hallar.

Datos sin agrupar:
Se ordenan los datos de menor a mayor. El fractil F
r
s
ser igual al dato que ocupa la posicin
r n
s

Si
r n
s
da un valor intermedio, se toma el promedio de los valores que lo encierran.

Datos agrupados:
Sea N
p
= la menor de las frecuencias acumuladas que contiene sin igualar a
r n
s


luego N
p-1
= la mayor de las frecuencias absolutas acumuladas que son superadas o igualadas
por
r n
s
.

Variable Discreta:

Si
r n
s
> N
p-1


F
r
s
= y
p

Si
r n
s

=
N
p-1


F
r
s
=
1
2
(y
p
+ y
p-1
)

Variable Continua:

Si
r n
s
> N
p-1

F
r
s
= y
p-1
+ C
r n
s
N
p1
N
p
N
p1


25
Si
r n
s
=
N
p-1

F
r
s
= y
p-1

Los fractiles se dividen en:

Cuantiles

Los cuantiles se representan por Qr, y dividen la serie de datos en 4 partes.
r vara de 1 . . . 3
S = 4

Q
2
= Me

Deciles

Los deciles se representan por Dr, y dividen la serie de datos en 10 partes.
r vara de 1, . . . . 9.
S = 10

D
5
= Me = Q
2


Percentiles

Los percentiles se representan por Pr, y dividen la serie de datos en 100 partes exactamente
iguales.
r = 1 . . . 99
S = 100

P
50
= D
5
= Me = Q
2

1.7 Medidas de dispersin

Este tipo de medidas tambin reciben el nombre de medidas de variacin.

Las medidas de dispersin o variacin se emplean para saber si los valores estn relativamente
cercanos unos de otros o si se encuentran dispersos. En otras palabras, se quiere determinar una
cantidad que describa la medida en la cual un conjunto de datos se aleja de su media.

Se establecen indicadores cuantitativos de la dispersin de los datos. Tales indicadores se
conocen como medidas de dispersin.

Para ilustrar la necesidad del uso de medidas de dispersin, considrese el siguiente ejemplo:

En dos cursos de computacin para nios, con doce alumnos cada uno, se obtuvieron las
siguientes calificaciones.
26

Grupo A: 5,5,6,7,7,7,7,7,7,8,8,8
Grupo B: 3,3,3,5,5,6,8,9,10,10,10,10

Calculemos la media aritmtica y la mediana en cada grupo.

Para el grupo A, tenemos que:
x = 6.833
Me= 7


Para el grupo B, tenemos que:
x = 6.833
Me= 7

Para los dos grupos las medidas de tendencia central son iguales. Si alguien desconociera las
calificaciones individuales de estos dos grupos y solamente supiera que ambos grupos tienen el
mismo nmero de alumnos y la misma media aritmtica y mediana, podra pensar que las
calificaciones del grupo A y del grupo B son muy semejantes y, quizs, iguales. Sin embargo,
mediante un ligero anlisis se puede verificar que el comportamiento de los datos de esos
grupos es distinto, como puede visualizarse teniendo en cuenta las siguientes consideraciones.

Si se supone que la calificacin mnima para aprobar es 7, se observa lo siguiente:

a) En el grupo A solamente reprob el 25% (5, 5, 6).
b) En el grupo B reprob el 50% (3, 3, 3, 5, 5, 6).
c) En el grupo A ningn alumno obtuvo una calificacin superior a 8.
d) En el grupo B un 42% obtuvo una calificacin superior a 8.
e) En el grupo A ningn alumno.
f) En el grupo B el 25% obtuvo una nota menor que cinco.

Resulta claro, entonces, que conocer la media aritmtica, o la mediana o ambas de una
coleccin de datos es muy til; pero que estas medidas de tendencia central no bastan para tener
una idea ms exacta de la relacin de los datos. Logramos esta idea, cuando adems de su
tendencia central, medimos la dispersin.

Las medidas de dispersin ms comunes para un conjunto de datos son el rango, la varianza y
la desviacin estndar.

Todas las medidas de variacin, exceptuando la de amplitud o rango de variacin, toman a la
media como punto de referencia.
1.7.1 Rango o amplitud de Variacin.

Es la diferencia entre el mayor valor y el menor de todos ellos

Rango = X
mx
- X
min

27
Es una medida limitada puesto que considera a los valores extremos de un conjunto y no
proporciona mayor informacin respecto a los dems valores del mismo.
1.7.2 Varianza

Mide la representatividad de la media.
Se apoya en la siguiente propiedad de la media:

Siendo a cualquier valor diferente de x.

La varianza se define como el promedio aritmtico de la suma de los desvios al cuadrado con
respecto a la media.


Para datos sin agrupar, la varianza poblacional se representa por
2
, y se calcula como:

o
2
1
2
1
2
2
) (

(
(
(
(

= =

= =
N
i
N
i
N
i
N
i
x x


Para datos agrupados, la varianza poblacional
2
se calcula como:

o
2
1
2
1
2
2
) (

(
(
(
(

= =


= =
N
j
N
j
m
j
j
m
j
j n
y
n
y


Para datos sin agrupar, la varianza muestral se representa por
s
2

, y se calcula como:

|
|
|
|
|
.
|

\
|

(
(
(
(

=

= =
x
x x
x
s
n
i
n
n
n
i
n
i
n
i
2
1
2
1
2
2
1 1
) (


Para datos agrupados, la varianza muestral

se calcula como:

28
|
|
|
|
|
.
|

\
|

(
(
(
(

=


= =
x
n
y
n
x y
s
n
j
n
n
n
j
m
j
j
m
j
j
2
1
2
1
2
2
1 1
) (




Propiedades de la Varianza:

1. V(k) = 0 k es constante
2. V(k x) = K
2
V(x) k es constante, X es variable
3. V(k + x ) = V(x) k es constante, X es variable
4.

Covarianza. Mide la relacin entre dos variables o qu tanto influye una variable en otra (si
X,Y son independientes, Cov = o).



Cov =
1
n
x
i
x
|
\
|
.
y
i
y
|
\
|
.
i=1
n

1.7.3 Desviacin Estndar

La desviacin estndar es la raz cuadrada positiva de la varianza. Para obtener la desviacin
estndar se debe calcular la varianza y hallar su raz cuadrada positiva.

Se representa por o o s dependiendo si es poblacional o muestral.

Es una de las medidas ms importantes dentro de la estadstica. Las unidades de esta medida
son las mismas que las de la media.

1.8 Coeficiente de variacin

Se representa por CV. Se usa para comparar la variabilidad de dos o ms poblaciones.

CV=
S
x
-100

Se interpreta como el % de variacin de una muestra. Si se comparan dos o ms medias, ser
mas representativa aquella que tenga CV menor.




29
1.9 Medidas de asimetra.

Dos distribuciones tambin pueden diferir entre s en asimetra o agudeza. Las medidas de
asimetra son importantes ya que muchas decisiones o consideraciones estadsticas se basan a
menudo en el supuesto de poblaciones normalmente distribuidas. Estas medidas son tiles para
evitar que por error hagamos este supuesto.

Existen varias medidas de asimetra, siendo la medida pearsoniana de asimetra la que ofrece
sencillez de concepto y de clculo.

Esta medida se basa en la relacin entre la media, la mediana y la moda. Sabemos que para una
distribucin unimodal simtrica las 3 medidas ( X , Me, Md) tienen igual valor.

Para una distribucin asimtrica, la media se aleja de la moda hacia la asimetra con la mediana
entre ellas. En consecuencia, la diferencia entre la mediana y la moda podra usarse para medir
la asimetra.

Coeficiente pearsoniano de asimetra:

| = Asimetra = Media - Moda
s

Este coeficiente supone una dificultad, que surge porque el valor modal de muchas
distribuciones no existe. En estos casos, es posible calcular el coeficiente de asimetra como:


| =
3

(x Me)
s


Si | = 0 Simtrica

| < 0 Asimtrica a la izquierda

| > 0 Asimtrica a la derecha.

Para saber cuntas unidades de la simtrica est corrida a la derecha o a la izquierda, se calcula
el grado de asimetra:

g = |

1.10 Curtosis: Una medida de agudeza.

Por medio del coeficiente de curtosis, clasificamos los diferentes grados de agudeza en tres
categoras.
30
Mesocrtica
Leptocrtica o
apuntada
Platicrtica


El coeficiente de curtosis se representa por Ku y se calcula como:

Para Datos sin agrupar:

s
x
x
n
i
i
n
Ku
4
1
4
) (
1

=
=

Para Datos Agrupados:

s
n
x
x
m
j
j
j
n
Ku
4
1
4
) (
1

=
=
Donde
xj
representa la marca de clase de la clase j

K
u
= 3 Mesocrtica
K
u
> 3 Leptocrtica
K
u
< 3 Platicrtica

La base de comparacin es la mesocrtica. Para saber cuntas unidades est por encima o por
debajo de la mesocrtica, se calcula el grado de curtosis:


g
2
= K
u
3

31
C Ca ap pi it tu ul lo o I II I
Probabilidad. Conceptos Bsicos y Teoremas

El profesionista, llmese ingeniero, mdico, qumico, fsico, economista, etc. se tiene que
enfrentar al problema de construir modelos que reflejen con mayor precisin el funcionamiento
de un sistema real, para transformarlo o planear su operacin. Una parte de este problema
consiste en medir el azar al cual estn sujetas algunas de las variables que explican el sistema y
lo resuelve a travs del estudio de la Teora de Probabilidad. Por ejemplo, si no conoce los
parmetros de la distribucin de estas variables, los estima, considerando muestras aleatorias de
la(s) poblacin(es). Sin embargo, cabe el cuestionamiento de la bondad de dicha estimacin
Qu tan probable es, que el error en la estimacin no exceda de una magnitud tolerable? Con
qu nivel de confianza podemos aseverar que el valor del parmetro de una poblacin est
ubicado en un intervalo para estimarlo?

Al pretender inferir respecto de los parmetros poblacionales, mediante la informacin obtenida
en la muestra, estamos siempre pisando el terreno de lo probable y no el terreno de la
certidumbre.

Lo anterior hace necesario el estudio de la Teora de Probabilidad la cual nos permitir conocer
con mayor profundidad y amplitud variables que en muchos contextos sern de inters para
nosostros.

2.1 Elementos de la Teora de Conjuntos.

Antes de adentrarnos en el campo de la probabilidad, trataremos en forma breve algunos
aspectos de la tera de conjuntos, dado que esta rama de la matemtica constituye una
herramienta til en el estudio de las probabilidades.
2.1.1 Definiciones.

Conjunto

Es un agrupamiento o coleccin de objetos; estos objetos pueden ser cosas tangibles (conjunto
de personas, de edificios, etc) u objetos abstractos de la ms variada ndole (conjunto de
propiedades, de resultados, de reglas, etc). Cada uno de los objetos que integran un conjunto se
denomina un elemento de dicho conjunto.

Ntese que la idea de conjunto no hace referencia a una ordenacin especfica en los elementos,
sino slo a su presencia.

Para designar conjuntos utilizaremos maysculas y para designar sus elementos utilizaremos
letras minsculas; para indicar que a es un elemento del conjunto A escribiremos:

a e A (Lase: a pertenece a A).

En forma semejante para indicar que a no es elemento de A escribiremos:

32
a e A (Lase: a no pertenece a A).

Conjunto Vacio.

Un conjunto que carece de elementos es llamado conjunto vacio. El conjunto vacio se
representa como o [ ].

Ejemplo: conjunto de puntos, de coordenadas reales, en los que se intersectan dos rectas
paralelas.

Conjunto Universal.

Con frecuencia todos los conjuntos que intervienen en una discusin estn formados por
elementos "del mismo tipo", esto es, son todos ellos conjuntos de nmeros reales, conjuntos de
puntos o letras, etc. En este caso, todos se pueden considerar como subconjuntos de un
"superconjunto" formado por la totalidad de los elementos en cuestin; por ejemplo, el conjunto
de todos los nmeros reales o de todos los puntos del espacio o de todas las letras del alfabeto,
etc. Este conjunto se denomina el conjunto universal y se representa por la letra U.

Subconjunto.

Se dice que un conjunto A es subconjunto de un conjunto B, denotado como AcB si todos y
cada uno de los elementos que pertenecen a A, pertenecen tambin a B.

Para representar que A no es subconjunto de B, se emplea la notacin A.B.

Ejemplo:

Si
A = [x/x es una letra en la palabra estadstico]
B = [x/x es una letra en la palabra estadio]
C = [x/x es una letra en la palabra estudiosa]
D = [x/x es una vocal]


De acuerdo con la definicin, todo conjunto es subconjunto de si mismo.

Todos los conjuntos que se definen en un determinado anlisis son subconjuntos del conjunto
universo de dicho anlisis.

El conjunto vacio es subconjunto de cualquier conjunto A, pues de no ser as significaria que
algn elemento del conjunto vacio no pertenece a A y tal situacin no puede darse ya que el
conjunto vacio no tiene elementos.

33
Conjuntos Iguales.

Dos conjuntos A y B son iguales si y solo si AcB y BcA, es decir, si tienen los mismos
elementos.
2.1.2 Algebra de Conjuntos.

Dado un conjunto universo U, los conjuntos A, B, C definidos en dicho universo pueden
relacionarse a travs de operaciones realizadas entre ellos provocando como consecuencia otros
conjuntos. A saber.

Unin de Conjuntos.

La unin de los conjuntos A y B es el conjunto de elementos que pertenecen a A o a B (o a
ambos). La notacin utilizada para representar la unin de A y B es: A U B, lease "A unin B".

Interseccin de Conjuntos.

Se define la interseccin de dos conjuntos A y B como un tercer conjunto C, formado por
aquellos elementos que pertenecen simultneamente a A y a B. Para indicarlo se escribe:

C= AB o C= AB

Dos conjuntos A y B se llaman ajenos, disjuntos o excluyentes si no tienen elementos en
comn.

Diferencia de Conjuntos.

La diferencia de dos conjuntos A y B es el conjunto de elementos que pertenecen a A pero que
no pertenecen a B. La notacin utilizada para representar la diferencia entre A y B es: A-B,
lease "A menos B".

En especial, la diferencia de los conjuntos U y A es denominada "el complemento del conjunto
A el cual se representa como A', A o A
c


A' = U - A

Los tipos de Conjuntos mencionados y las relaciones que guardan entre ellos pueden
representarse mediante los denominados diagramas de Venn Euler. En ellos, se utiliza
generalmente un rectngulo para simbolizar el conjunto universal y circulos para los conjuntos
definidos en dicho universo; los elementos de los conjuntos en cada uno de los casos, an
cuando no se denoten, se representan por las reas involucradas.



34


De la definicin y grficas anteriores se deduce que:

A U A
c
= U
A A
c
=
U
c
=

c
= U
(A
c
)
c
= A



35
Ejemplo:

Sea U= (0, 1, 2, 3, 4...., 8, 9)
A= (0, 1, 2, 3, 4, 5)
B= (4, 6, 8)
C= (1, 3, 5, 7)

a) Obtener:

i) A U B ii) A U C iii) C U C

Solucin:

i) A U B= (0, 1, 2, 3, 4, 5, 6, 8)
ii) A U C= (0, 1, 2, 3, 4, 5, 7)
iii) C U C= (1, 3, 5, 7)

b) Obtener:

i) A B ii) B C iii) A A

c) Obtener:

i) A-B ii) B-C iii) B-B

d) Obtener:

i) C
c
ii) (B C)
c
iii) (A U B)
c
iv) (C A)
c


2.1.3 Propiedades de un Conjunto.

Para mltiples propsitos, las siguientes propiedades de los conjuntos definidas sobre las
operaciones unin e interseccin tendrn importantes aplicaciones.

a- La unin entre conjuntos es una operacin conmutativa y asociativa.

A B = B A
(A B) C = A (B C)

b- La interseccin de conjuntos es una operacin conmutativa y asociativa.

A B = B A
(A B) C = A (B C) = A B C

c- La interseccin es distributiva respecto a la unin.

36
A (B C) = (A B) (A C)
d- La unin es distributiva respecto a la interseccin.

A (B C) = (A B) (A C)

e- El complemento del complemento de un conjunto es el conjunto original.

(A
c
)
c
= A

f- El complemento de una unin es la interseccin de los complementos de los trminos de la
unin.
(A B)
c
= A
c
B
c


g- El complemento de una interseccin es la unin de los complementos de los trminos de la
interseccin.

(A B)
c
= A
c
B
c

2.2 Experimento Aleatorio. Espacio Muestral. Eventos.

Experimento.

Un experimento es un proceso de observacin en el que puede obtenerse como mnimo un
resultado. Los experimentos pueden ser:

a) Determinsticos Si las condiciones bajo las cuales se efectuan determinan el resultado,
pudiendo establecerse a priori, en muchas ocasiones.

Ejemplo 1:

Al hacer actuar sobre un cuerpo de 1kg de masa una fuerza de 1Nw, obtendremos
siempre una aceleracin de 1m/seg
2


Ejemplo 2:

Se provoca una combustin en la que intervienen dos tomos de hidrgeno y uno de
oxigeno. Resultado: una molcula de agua.

b) No determinstico o aletorio. Cuando no podemos predecir el resultado atendiendo a
las condiciones bajo las que se realiza el experimento. A lo ms, podemos establecer el
conjunto de resultados posibles.

Ejemplo 1:

Determinar el nmero de pasajeros que trasportar dentro de quince das de Sistema de
Transporte Colectivo de la ciudad.
37

Ejemplo 2:

Determinar la vida til, en horas del motor del automvil que acabamos de comprar.

Obviamente, la teora de la probabilidad se desenvuelve en el terreno de los experimentos
aleatorios, de la incertidumbre, en donde no nos es posible asegurar respecto del resultado de
una observacin; es decir, en el campo de "lo que probablemente ocurra" y no en el de "lo que
seguramente ocurra".

Espacio Muestral.

Se conoce como espacio muestral de un experimento aleatorio al conjunto cuyos elementos son
los posibles resultados diferentes a que puede dar lugar la experiencia en cuestin.
Cada uno de los elementos del espacio muestral se denominan puntos del espacio muestral.

Ejemplo 1:

El lanzamiento de una moneda constituye un experimento aleatorio con dos resultados
diferentes: cara o sello. El espacio muestral es el conjunto [cara, sello].

Ejemplo 2:

El lanzamiento de un par de dados constituye una experiencia aleatoria; si slo nos interesa el
puntuaje total tendremos 11 resultados diferentes y nuestro espacio muestral ser (2, 3, 4,....,
12) pero si nos interesa tambin el puntaje de cada dado, nuestro espacio muestral ser: [(1, 1);
(1, 2); (2, 1); .......(6, 6)] que incluye las treinta y seis combinaciones diferentes que podemos
obtener.

Ejemplo 3:

Sea el experimento de visitar maana un lugar determinado a cierta hora y observar si llueve o
no. Puesto que hoy no es posible conocer lo que suceder maana, estamos ante una
experiencia aleatoria con dos posibles resultados; el espacio muestral es el conjunto [si, no].

Observaciones

No existe acuerdo entre los probabilistas respecto a si la Teora de la Probabilidad debe ser
aplicada a experiencias aleatorias del tipo del ejemplo 3 (el experimento no puede repetirse);
algunos sostienen que slo deben ser consideradas aquellas experiencias aleatorias que sean
indefinidamente repetibles y cuyos resultados varen de repeticin a repeticin, como son los
ejemplos 1 y 2.
Quienes sostienen este punto de vista se denominan a si mismos frecuentistas, por
contraposicin a los subjetivistas quienes aceptan experencias aleatorias no repetibles.



38

Evento.

Es todo resultado posible de un experimento aleatorio, como puede ser el que caiga guila en el
ejemplo del tiro de la moneda o que la resistencia de una varilla probada sea superior a 4000
kg/cm
2
.

Los eventos pueden ser:

a) Simples o elementales, si contienen solo un punto del espacio muestral.

b) Compuestos, si contienen dos ms puntos del espacio muestral.

Se dice que un evento A ocurre, si al efectuar el experimento, el punto del espacio muestral
resultante es elemento de A.

Un evento nulo o imposible es aquel que nunca ocurre y es igual al conjunto vacio.

Un evento seguro es aquel que siempre ocurre y es igual a S.

El espacio de eventos de un experimento aleatorio es el conjunto de todos los eventos
elementales del experimento; tambin se le llama universo y se representa por S.

Ejemplo:

Supngase el experimento de tirar dos dados cuyas caras estn numeradas con enteros del 1 al 6

1. Defina el espacio de eventos

2. ( ) | | ( ) | | 1 = y - x y x, = B y y = x y x, = A Si Obtener A B

3. Si A= x, y ( ) x =y | | y C= x, y ( ) x+y >10 | | Obtener A C

4. Calcular el nmero de eventos elementales en A, C, A C y A U C

Solucin:

1. Defina el espacio de eventos.
El espacio de eventos est formado por 36 parejas (x,y) donde x representa el resultado del
primer dado y y el resultado del segundo dado.
____________________________________________________________________
(1,1) (1,2) (1,3) (1,4) (1,5) (1,6)
(2,1) (2,2) (2,3) (2,4) (2,5) (2,6)
(3,1) (3,2) (3,3) (3,4) (3,5) (3,6)
(4,1) (4,2) (4,3) (4,4) (4,5) (4,6)
(5,1) (5,2) (5,3) (5,4) (5,5) (5,6)
(6,1) (6,2) (6,3) (6,4) (6,5) (6,6)
39
____________________________________________________________________
Existen 36 eventos elementales.

2. ( ) | | ( ) | | 1 = y - x y x, = B y y = x y x, = A Si Obtener A B

A= [(1,1), (2,2), (3,3), (4,4), (5,5), (6,6)]
B= [(1,2), (2,1), (2,3), (3,2), (3,4), (4,3), (4,5), (5,4), (5,6), (6,5)]

A U B =[ (x,y) x=y x-y = 1|

A U B= [(1,1), (1,2), (2,1), (2,2), (2,3) (3,2), (3,3), (3,4), (4,3),
(4,4), (4,5), (5,4), (5,5), (5,6), (6,5), (6,6)]

3. Si A= x, y ( ) x =y | | y C= x, y ( ) x+y >10 | | Obtener A C


C= [(6,4), (5,5), (4,6), 6,5), (5,6), (6,6)]

A C= [(x,y) x=y y x+y > 10]

A C= [(5,5), (6,6)]

4. Calcular el nmero de eventos elementales en A, C, A C y A U C

Sea
n(A) = nmero de eventos elementales en A
n(C) = nmero de eventos elementales en C
n(A C) = nmero de eventos elementales en A C
n(A U C) = nmero de eventos elementales en A U C

Entonces:

n(A)=6 n(C) =6 n(A C) =2

n(A U C) =n(A) + n(C) - n(A C) = 6+6-2 = 10

2.3 Definiciones de Probabilidad y Teoremas.
2.3.1 Definicin Clsica de Probabilidad o de Laplace.

Esta definicin es para las situaciones que tienen resultados igualmente probables. El espacio
muestral de estos experimentos est formado por un nmero finito de eventos elementales.

Algunos experimentos que tienen caractersticas de tener resultados igualmente probables son
los juegos de azar tales como tiro de dados, cartas, tiro de monedas, etc. Cuando los resultados
40
son de esta forma, la probabilidad de cada resultado es simplemente una funcin del nmero de
resultados posibles


P(A) = P (cada resultado) =
posibles resultados de Nmero
1


Si se tiene una baraja de 52 cartas, la probabilidad de sacar cualquier carta es P(A) = 1/52

La definicin clsica puede emplearse a eventos que comprendan dos o ms resultados. Si un
espacio muestral S consta de n eventos elementales "igualmente probables" y A es un evento
formado por m de estos eventos elementales se tiene que:

P(A) =
n
m

posibles resultados de total Nmero
A de favorables resultados de Nmero


La funcin de probabilidad definida por Laplace satisface las siguientes propiedades.

Sea S el espacio muestral formado por n eventos elementales igualmente probables, entonces:

1- Si A es un evento en S: P(A) > 0

2- Para el espacio muestral S se tiene: P(S) = 1
n
n
=

3- Si A y B son eventos excluyentes: P (A U B) = P (A) + P(B).

Ejemplo:

La probabilidad de sacar una reina de una baraja.

P(A) = P(reina) =
13
1
52
4
cartas 52
reinas 4
= =

2.3.2 Definicin de Probabilidad en base a la frecuencia relativa.

El enfoque frecuencial es similar al enfoque clsico con la nica diferencia de que aqu se
efectan ms pruebas para obtener una mayor cantidad de datos y con ello obtener la frecuencia
relativa de ocurrencia de un evento.
La probabilidad que se basa en la frecuencia relativa viene dada por:

P(A) =
nes observacio de total Nmero
A ocurre que veces de Nmero


41
Cuando se emplea el enfoque frecuencial, es importante tomar en consideracin lo siguiente:

a- La probabilidad obtenida de esta manera es nicamente una estimacin del valor real.

b- Cuanto mayor sea el tamao de la muestra, tanto mejor ser la estimacin de la
probabilidad.

Por otra parte, esta definicin de probabilidad frecuencial satisface las propiedades de la
definicin clsica, esto es:

1- La frecuencia relativa de un evento cualquiera es un nmero positivo.

2- La frecuancia del evento seguro es la unidad.

3- Si A y B son eventos excluyentes. Entonces la frecuencia relativa del evento E = A U B
es la suma de las frecuencias relativas de cada uno de los eventos.

Definicin Axiomtica de Probabilidad (Kolmogorov).

Una definicin axiomtica fu propuesta por Kolmogorov relacionando la teora de
probabilidad con la teora de conjuntos.

Axiomas de Probabilidad.

Sea P la funcin de probabilidad

P(A) la probabilidad del evento A

Axioma 1 Si A es un evento de S entonces la probabilidad del evento A es:
0 < P(A) < 1 P(A) e [0, 1]

Axioma 2 Si el espacio muestral S se obtuvo de un experimento aleatorio, entonces:
P(S) = 1

Axioma 3 Si A y B son eventos excluyentes entonces:
P(A U B) = P(A) + P(B)

Si el conjunto de eventos excluyentes es n (n>2):

A
1
A
2
. . . A
n
=

entonces,

P(A
1
U A
2
U . . . U A
n
) = P(A
1
) + P(A
2
) + . . . + P(A
n
)

Teoremas

42
Tomando en consideracin los axiomas y la funcin de probabilidad, se pueden considerar los
siguientes teoremas.

Teorema 1 Probabilidad de un evento
P(A
c
) = 1 - P(A)

Teorema 2 Probabilidad de un evento imposible
P() = 0

Teorema 3 Probabilidad de la unin de dos eventos
P(A U B) = P(A) + P(B) - P(A B)

Teorema 4 Probabilidad del diferencia de A relativa a B
P(A B
c
) = P(A) - P(A B)

Teorema 5 Si A B, entonces P(A) < P(B)


Ejemplo 1:

Sea el experimento de lanzar un dado y contar el nmero de puntos que aparecen en la cara
superior. Determine su espacio muestral.

Solucin:
S = {1, 2, 3, 4, 5, 6}

Ejemplo 2:

Sea el experimento de lanzar una moneda al aire en una sola ocasin. Hallar su espacio
muestral.

Solucin:
S = {A, S}

Ejemplo 3:

En una fbrica se construyen piezas mecnicas en una lnea de produccin y se cuenta el
nmero de piezas con defectos producidos en un perodo de 30 das. Hallar su espacio muestral.

Solucin:
S = {0, 1, 2,. . ., N}

N= Nmero mximo de piezas que pueden ser producidas en 30 das.

Ejemplo 4:

43
Sea el experimento de observar el funcionamiento de tres aparatos electrnicos durante una
semana. Nos interesa saber el nmero de aparatos diferentes que se descompongan una o ms
veces durante la semana. Hallar el espacio muestral.

Solucin:
S = {0, 1, 2, 3}
Explicacin:

Recuerde que un espacio muestral es el conjunto de todos los resultados posibles de un
experimento, por lo tanto:
Resultado probable No. 1 Se descomponen cero aparatos.
Resultado probable No. 2 Se descompone un aparato.
Resultado probable No. 3 Se descomponen dos aparatos.
Resultado probable No. 4 Se descomponen tres aparatos.

Ejemplo 5:

Se fabrica un foco especial para cierto tipo de proyectores. Antes de salir a la venta se analiza
su vida en horas. Determinar su espacio muestral.

Solucin:
S = {0, 1, 2,, N}

N = Nmero mximo de horas de duracin del foco.

Ejemplo 6:

Si se desea obtener el rey de diamantes de una baraja. Qu espacio muestral debemos
considerar?

Solucin:
S = {52 cartas}

Ejemplo 7:

Si se tiene el experimento de lanzar un dardo en una diana. Nos interesa saber a que distancia se
localiza de su centro, si su radio es de 12 cm.

Solucin:
S = [0 cm, 12 cm]

Ejemplo 8:

Se puede lanzar una moneda en 10 ocasiones y anotar en cuantas ocasiones cay Sol. Hallar el
espacio muestral correspondientes.

Solucin:
44
S = {0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10}

Ejemplo 9:

Si consideramos como un experimento el nacimiento de un pequeo, siendo los resultados nio
o nia. Escribir el espacio muestral correspondiente.

Solucin:
S = {nio, nia}

Ejemplo 10:

Si se saca una canica de un cajn en donde hay 500, la probabilidad de obtener una cualquiera
cul es.

Solucin:

Nmero de resultados posibles: 500
Nmero de resultados favorables: 1
P (una canica cualquiera) =
500
1


Ejemplo 11:

Al tirar un dado al azar. Cul es la probabilidad de que aparezca un 2 en la cara superior?

Solucin:

Nmero de resultados posibles: 6
Nmero de resultados favorables: 1
P =
6
1


Ejemplo 12:

Al tirar un dado al azar. Cul es la probabilidad de que al caer se obtenga un nmero par?

Solucin:

Nmero de resultados posibles. 6
Nmero de resultados favorables. 3
P (nmero par) =
2
1
6
3
=

Ejemplo 13:

45
Nueve cartones se marcan del 1 al 9 respectivamente. Si estos cartones se mezclan y se extrae
uno de ellos. Cul es la probabilidad de que el nmero anotado en ese pedazo sea par?

Solucin:

Nmero total de resultados favorables: 9
Nmero de resultados de A: 4
P =
9
4


Ejemplo 14:

Supngase que se tiene una urna con 10 pelotas de las cuales son 8 rojas y 2 verdes.

a) Cul es la probabilidad de elegir una pelota verde en el primer intento?

P (verde) =
5
1
8 2
2
=
+


b) Cul es la probabilidad de elegir una pelota roja en el primer intento?

P (roja) =
5
4
10
8
8 2
8
= =
+


Ejemplo 15:

Se tira una moneda en tres ocasiones cul es la probabilidad de obtener dos soles?

Solucin:

Los ocho resultados favorables son:

SSS, SSA, SAS, ASS, SAA, ASA, AAS, AAA

Nmero total de resultados favorables: 8
Nmero de resultados favorables de A: 3

Donde A, es el evento de obtener dos soles
P(A) =
8
3


Ejemplo 16:

De una urna que contiene 6 bolas negras, 4 blancas y 5 azules, se extrae una al azar. Hallar la
probabilidad de que sea: (A) Negra, (B) Blanca, (C) Azul, (D) No negra, (E) Negra o blanca.

46
Solucin

Evento A. Extraccin de una bola negra
Evento B. Extraccin de una bola blanca
Evento C. Extraccin de una bola azul

(A) P(A) =
5
2
15
6
5 4 6
6
= =
+ +


(B) P(B) =
15
4


(C) P(C) =
3
1
15
5
=

(D) P(A
C
) = 1 P(A) =
5
3
5
2
1 =
P(A
C
) No Ocurrencia

(E) Eventos mutuamente excluyentes
P(AB) = P(A) + P(B) =
3
2
15
10
15
4
5
2
= = +

Ejemplo 17:

Si se lanza un dado en una sola ocasin, hallar la probabilidad de que:

a) En el dado aparece 4 o 6.
b) En el dado aparece cualquier nmero par.

Solucin:
a) Los eventos A y B se definen como:
A: En el dado aparece 4
B: En el dado aparece 6
Se busca la probabilidad del evento
AB: En el dado aparece 4 o 6
A y B son mutuamente excluyentes debido a que no pueden obtenerse un 4 y un 6 al mismo
tiempo.
P(AB) = P(A) + P(B) =
3
1
6
2
6
1
6
1
= = +

b) Ahora definiremos los eventos de la siguiente forma
A: En el dado aparece 2
B: En el dado aparece 4
C: En el dado aparece 6
Se busca la probabilidad del evento
47
P(ABC): En el dado aparece 2 4 6
Los eventos A, B y C son mutuamente excluyentes: ninguno de estos puede ocurrir al
mismo al mismo tiempo.
P(ABC) = P(A) + P(B) + P(C) =
2
1
6
3
6
1
6
1
6
1
= = + +
Ejemplo 18:

Consideremos el lanzamiento de una moneda en 10 ocasiones. Si hay 8 guilas y 2 soles. Cul
es la probabilidad en cada caso?

Solucin:

a) Nmero de veces que ocurre A: 8
Nmero total de observaciones: 10

P(A) = 8 . 0
10
8
= o bien 80%

b) Nmero de veces que ocurre A: 2
Nmero total de observaciones: 10

P(A) = 2 . 0
10
2
= o bien 20%

Ejemplo 19:

Si en una ciudad de 16000 habitantes se registraron en un verano 40 casos de poliomielitis.
Cul es la probabilidad de que una persona determinada pudo contraer la enfermedad?

Solucin:

Nmero total de observaciones: 16000
Nmero de veces que ourre A: 40

P(A) = 0025 . 0
16000
40
=

Ejemplo 20:

En un cruce de automviles en Reforma, muestra que de cada 1000 vehculos que circulan, 600
de ellos dan vuelta a la derecha. Cul es la probabilidad de que un automvil de vuelta a la
derecha en ese cruce?

Solucin:

Nmero total de observaciones: 1000
48
Nmero de veces que ocurre A: 600

P(A) = 60 . 0
10
6
1000
600
= = o bien 60%

Ejemplo 21:

Los informes de un laboratorio indican que cuando a 25 conejos se les administraron dosis
iguales de un frmaco, las lenguas de 20 de ellos adquirieron un color verde claro. Cul es la
probabilidad de que esto ocurra nuevamente en condiciones idnticas?

Solucin:

Nmero total de observaciones: 25
Nmero de veces que ocurre A: 20

P(A) = 80 . 0
25
20
= o bien 80%

Entonces es posible utilizar este porcentaje como una estimacin de la probabilidad real de que
este evento ocurra en condiciones similares.

Ejemplo 22:

De 120 estudiantes, 60 estudian francs, 50 espaol y 20 estudian francs y espaol. Si se
escoge un estudiante al azar hallar la probabilidad de que el estudiante:
a) Estudie francs o espaol
b) No estudie francs ni espaol.

Solucin:

Evento A: Estudiantes de francs
Evento B: Estudiantes de espaol
Evento AB: Estudiantes de francs y espaol

a) P(A) =
120
60
P(B) =
120
50
P(AB) =
120
20


P(AB) = P(A) + P(B) - P(AB) =
4
3
12
9
120
90
120
20
120
50
120
60
= = = +

b) P(A
C
B
C
) = P(A B)
C
= 1 P(A B) =
4
1
4
3
1 =

Ejemplo 23:

49
Entre los 200 profesores del departamento de matemticas hay 150 titulados, 60 del total
dedican parte de su tiempo a trabajos de Algebra Lineal y 40 de los 150 titulados dedican parte
de su tiempo a trabajos de Algebra Lineal. Si se toma al azar uno de estos profesores. Cul es
la probabilidad de que no sea titulado y no trabaje en Algebra Lineal?

Solucin:

200 - Profesores.
150 - Titulados.
60 - Se dedican a Algebra Lineal.
40 - Se dedican a Algebra Lineal y son Titulados.
A Titulados
B Que trabajan en Algebra Lineal

Primero hallamos la probabilidad de que sea titulado y que trabaje en lgebra lineal y
posteriormente por complemento determinamos la probabilidad de que no sea titulado y que no
trabaje en lgebra lineal.

Evento A: Profesor titulado
Evento B: Profesor dedicado al lgebra lineal.
Evento AB: Profesor titulado y dedicado a lgebra lineal

Por lo tanto:
P(AB) = P(A) + P(B) - P(AB)= 85 . 0
20
17
200
170
200
40
200
60
200
150
= = = +
P(A
C
) = 1- P(A)
P(AB)
C
= 1 - P(AB) = 1 0.85 = 0.15

En consecuencia la probabilidad de que no sea titulado y no trabaje en lgebra lineal es de 0.15

Ejemplo 24:

Arturo recibe una herencia de $10,000.00 y piensa emplear el dinero en una de las siguientes
posibilidades: (1) Educacin, (2) Ropa, (3) Viaje. Las probabilidades de estas opciones son
respectivamente 0.5, 0.3 y 0.1
a) Cul es la probabilidad de que haga una de estas cosas?
b) Cul es la probabilidad de que olvide estas tres posibilidades y gaste el dinero en otra cosa?

Solucin:

Evento A
1
Educacin
Evento A
2
Ropa
Evento A
3
Viaje

a) P(A
1
A
2
A
3
) = P(A
1
) + P(A
2
) + P(A
3
) = 0.5 + 0.3 + 0.1 = 0.9

b) Si P(A
4
) = P(A
1
A
2
A
3
)
50

Entonces:

P(A
4
C
) = 1 P(A
4
) = 1 0.9 = 0.1

Ejemplo 25:

Tres atletas de natacin A, B, y C intervienen en una competencia. Los atletas A y B tienen la
misma probabilidad de ganar y el doble de C. Hallar la probabilidad de que gane B o C.

Solucin:

P(A) + P(B) + P(C) = 1
Sea P(C) = P
Por otro lado P(A) = P(B) = 2P(C)
En consecuencia:
2P + 2P + P = 1 5P = 1 P =
5
1

Por lo tanto:
P(C) = P =
5
1

P(B) = 2P =
5
2

Finalmente P(BC) = P(B) + P(C) =
5
3
5
2
5
1
= +

Ejemplo 26:
Dado un experimento en el que
4
1
) ( = B A P ,
8
7
) ( = B A P y
8
5
) ( =
C
A P
Determinar
a) P(A) b) P(B) c) P(AB
C
)

Solucin:

a) P(S) = P(AA
C
)
1 = P(A) + P(A
C
)
P(A) = 1 P(A
C
) =
8
3
8
5
1 =

b) P(AB) = P(A) + P(B) - P(AB)
P(B) = P(AB) P(A) + P(AB) =
4
3
8
6
4
1
8
3
8
7
= = +

c) P(AB
C
) = P(A) P(AB) =
8
1
8
2 3
4
1
8
3
=

=
51

Ejemplo 27:

Sean los eventos
3
2
) (
2
1
) (
2
1
) ( = = = B A P y B P A P
Hallar

a) P(A
C
)
b) P(B
C
)
c) P(AB)
d) P(A
C
B
C
)
e) P(A
C
B
C
)
f) P(A B) = P(AB
C
)
g) P(B A) = P(A
C
B)
h) P[(A-B) (B-A)]
i) P(A
C
B)

Solucin:

a) P(A
C
) = 1 P(A) = 5 . 0
2
1
2
1
1 = = 50%

b) P(B
C
) = 1 P(B) = 5 . 0
2
1
2
1
1 = = 50%
c) P(AB) = P(A) + P(B) P(AB) = 33 . 0
3
1
3
2
1
3
2
2
1
2
1
= = = + 33.3%

d) Empleamos Leyes de Morgan
P(A
C
B
C
) = P(AB)
C
= 1 P(AB) = 33 . 0
3
1
3
2
1 = = 33.3%

e) Empleamos Leyes de Morgan
P(A
C
B
C
) = P(AB)
C
= 1 P(AB) = 66 . 0
3
2
3
1
1 = = 66.6%

f) P(A-B) = P(AB
C
) = P(B
C
A)
Teorema 4
P(B
C
A) = P(A) - P(AB)=
6
1
3
1
2
1
=

g) P(B A) = P(BA
C
) = P(A
C
B)
Teorema 4
P(A
C
B) = P(B) - P(AB) =
6
1
3
1
2
1
=

52
h) P[ (A-B) (B-A) ] = P[ (AB
C
) (BA
C
)] = P(AB
C
) + P(BA
C
)
=
3
1
6
2
6
1
6
1
= = +

i) P(A
C
B) = P(AB
C
)
C
= 1 P(AB
C
) =
6
5
6
1
1 =

Ejemplo 28:
Sean los eventos A y B con P(A) =
2
1
, P(B
C
) =
8
5
y P(AB) =
4
3
. Hallar:
a) P(AB)
b) P(A
C
B
C
)
c) P(A
C
B
C
)

Solucin:

a) P(AB) = P(A) + P(B) P(AB)
P(AB) = P(A) + P(B) P(AB)
P(B) = 1 P(B
C
) = 1 -
8
3
8
5
=
sustituyendo

P(AB) =
8
1
8
6 3 4
4
3
8
3
2
1
=
+
= +

b) Ley de Morgan (AB)
C
= A
C
B
C


en consecuencia

P(A
C
B
C
) = P(AB)
C
= 1 P(AB) =
4
1
4
3
1 =

c) Ley de Morgan (AB)
C
= A
C
B
C


en consecuencia

P(A
C
B
C
) = P(AB)
C
= 1 - P(AB) =
8
7
8
1
1 =

Ejemplo 29:
Es posible tener una asignacin de probabilidad tal que P(A) =
2
1
, P(AB) =
3
1
y P(B) =
4
1
?

53
Solucin

P(AB) = P(A) + P(B) P(AB) =
12
5
3
1
4
1
2
1
= +

Despejando P(A) de P(AB) y sustituyendo los valores correspondientes se tiene P(A) =
2
1


P(AB) = P(A) + P(B) - P(AB) =
3
1
12
5
4
1
2
1
= +
Despejando P(B) de P(AB) y sustituyendo los valores correspondientes se tiene P(B) =
4
1
.
Entonces si es posible tener una asignacin de probabilidad con los valores dados.

2.4 Tcnicas de Conteo.

Se mencion anteriormente que un espacio muestral es el conjunto de todos los posibles
resultados del experimento. Ahora trataremos el problema de obtener el nmero total de
resultados posibles por medio de las diferentes tcnicas de conteo, las cuales son:

a) Listar los resultados (empleado en Estadstica Descriptiva)

b) Diagrama de rbol (tiene inconvenientes cuando se tiene un nmero considerables de
resultados).

c) Frmulas Matemticas
- Ley fundamental de la multiplicacin
- Permutaciones
- Combinaciones
- Particiones.

Diagramas de rbol

El siguiente ejemplo ilustra en forma clara y precisa, la utilidad de los diagramas de rbol.

Ejemplo 1:

Un estudiante presenta un examen de preguntas de verdadero-falso. Dar el diagrama de rbol
para las tres primeras preguntas y escribir su espacio muestral

Solucin

Como el estudiante tiene dos opciones posibles para cada pregunta V F, el rbol
presenta dos ramas en cada pregunta.
54


El espacio muestral es

S = {VVV, VVF, VFV, VFF, FVV, FVF, FFV, FFF}

El espacio muestral para dos preguntas sera

S = {VV, VF, FV, FF}

El espacio muestral para una pregunta es

S = {V, F}

55
Ejemplo 2:

Sea el caso de lanzar dos dados. Determinar el nmero total de casos que pueden presentarse.
Dar el espacio muestral correspondiente.

Solucin



El espacio muestral de este experimento es


S = {(11), (12), (13), (14), (15), (16)
(21), (22), (23), (24), (25), (26)
(31), (32), (33), (34), (35), (36)
(41), (42), (43), (44), (45), (46)
(51), (52), (53), (54), (55), (56)
(61), (62), (63), (64), (65), (66)}

Otro mtodo para obtener el espacio muestral anterior es aplicando el concepto de Producto
Cartesiano.
1
2
3
4
5
6
1
2
3
4
5
6
1
2
3
4
5
6
1
2
3
4
5
6
1
2
3
4
5
6
1
2
3
4
5
6
1
2
3
4
5
6
56
El espacio muestral de un dado es:
S = {1, 2, 3, 4, 5, 6}

Ejemplo 3:

Obtener todos los resultados posibles para los dos primeros partidoS de la quiniela de futbol
mexicano. Escribir su espacio muestral.

Solucin:

El espacio muestral para los dos partidos es
S = {LL, LE, LV, EL, EE, EV, VL, VE, VV}

El espacio muestral para un partido es
S = {L, E, V}

Ley Fundamental de la Multiplicacin

Si un evento A
1
puede realizarse de n
1
maneras diferentes y si continuando el procedimiento,
un segundo evento A
2
puede realizarse de n
2
maneras diferentes, y si despus de efectuados los
dos eventos anteriores, un tercer evento A
3
puede realizarse de n
3
maneras diferentes, y as
sucesivamente, entonces el nmero de maneras en que los eventos pueden realizarse en el orden
indicado es el producto de n
1
n
2
n
3
.....

En trminos generales, de haber r decisiones secuenciales, cada una con n opciones, el nmero
total de resultados posibles es:

r
n n ... n n n =

Ejemplo 1:

Se lanza una moneda cuatro veces. Hallar el nmero total de resultados posibles.

Solucin:
n = 2 2
4
= 16 Resultados posibles
L
E
V
L
E
V
L
E
V
L
E
V
L LOCAL
E EMPATE
V - VISITANTE
57
r = 4
Ejemplo 2:

Un estudiante presenta un examen de 20 preguntas de verdadero falso. Cuantas maneras
existen para resolver el examen.

Solucin:

Para una preguenta tiene 2 opciones 2
1
= 2
Para 2 preguntas tiene 2 opciones 2
2
= 4
Para 3 preguntas tiene 2 opciones 2
3
= 8

Para 20 preguntas tiene 2 opciones 2
20

n = 2 Nmero de opciones
r = 20 Decisiones secuenciales
2
20
= 1, 048, 576

Ejemplo 3:

Sea el caso de lanzar un dado dos veces.

Solucin:
n = 6 6
2
= 36 Resultados posibles.
r = 2

Ejemplo 4:

Obtener todos los resultados posibles para los tres primeros partidos de la quiniela del futbol
mexicano.

Solucin:
n = 3 3
3
= (3) (3) (3) = 27
r = 3

Ejemplo 5:

La carta del restaurante OAXACA ofrece a escoger Sopa (X) o Consom (Y) para iniciar; Mole
(A), Carne (B) y Mariscos (C) como plato principal y Flan(I), Pastel (II) o Fruta (III) a elegir
como postre.

La comida completa consta de tres platos elegidos de cada una de las tres clases. Cul es el
espacio muestral? Construir un diagrama de rbol para representar el espacio muestral de todas
las comidas completas posibles.

Solucin:

n
1
= 2 n
2
= 3 n
3
= 3 n
1
n
2
n
3
= (2) (3) (3) = 18 maneras
58


















Ejemplo 6:

Un estudiante de un programa especial que slo puede tomar clases a las 8, 9, 10 desea
formar su horario con la distribucin de materias para el semestre que inicia.
Determine el nmero de distintas distribuciones que puede disear si a las 8 am puede
elegir entre psicologa, Sociologa y Literatura; a las 9 am puede elegir ya sea el Espaol
o Francs y a las 10 am puede seleccionar entre Administracin, Derecho Mercantil y
Contabilidad.
(3) (2) (3) = 18

Tiene para escoger 18 alternativas

Ejemplo 7:

Cuantos nmeros de pares de tres cifras se pueden formar utilizando los dgitos 5, 6, 7, 8,
9
a) Sin que se use el mismo dgito en las decenas y las centenas



b) El ltimo dgito no tiene que ser par
(5) (4) (5) = 100

Ejemplo 8:

Se dispone de 3 banderas: una blanca una negra y una verde. Si cada pareja de banderas
de distinto color constituye una seal.
Cuntas seales se pueden hacer si el orden de colocacin de las banderas es
importante?
X
Y
A

B

C
A

B

C
I
II
III
I
II
III

I
II
III
I
II
III
I
II
III

I
II
III
40
2
*
4
*
5
=
par es y unidades decenas centenas
59

Nmero de seales= (3) (2)=6
Ejemplo 9:

En una fonda se sirve comida corrida con las siguientes opciones: tres tipos de sopas
diferentes, cuatro guisados distintos, dos bebidas a escoger, y los tradicionales dos tipos
de postres: flan o helado.

De cuantas maneras puede un comensal elegir una comida que consista en una sopa, un
guisado, una bebida y un postre?

(3) (4) (2) (2) = 48

Permutaciones

Cuando el orden en el que se disponen los trminos es importante, el nmero total de resultados
posibles recibe el nombre de permutacin.

En general una permutacin de r elementos ordenados entre los n elementos dados, viene dada
por las siguientes frmulas, dependiendo de el tipo de prueba.

i Prueba con sustitucin n . n . n . . . n = n
r




Ejemplo 1:

Encuentre el nmero de palabras de tres letras utilizando seis letras dadas sin repeticin.
n = 6
r = 3 Nmero de palabras

Ejemplo 2:

Tres cartas se escogen sucesivamente de un naipe de 52 cartas. Encuentre el nmero de
formas en que esto puede hacerse.

a) Con reposicin
(52) (52) (52) = 140608

b) Sin reposicin
(52) (51) (50) = 132600

Ejemplo 3:

120
! 3
! 6
= =
60
Una operacin de ensamblaje en una fbrica requiere tres etapas que pueden ejecutarse en
cualquier orden.
En cuantas formas se puede realizar el ensamblaje?
(3) (2) (1) = 6

El orden importa y es sin repeticin

Ejemplo 4:

Una mujer de negocios de Filadelfia prepara un itinerario para visitar 6 ciudades
importantes. La distancia y su costo dependen de la ruta.

a) Cuntos itinerarios diferentes son posibles?




b) Si la mujer de negocios elige al azar uno de los posibles itinerarios y Denver y
San Francisco son dos de las ciudades que piensa visitar. Cul es la
probabilidad de que visite Denver antes que San Francisco?

D 5 x 4! +

D 4 x 4! +
D 3 x 4! +
D 2 x 4! +
D 1 x 4!
________
4! (15)


P (Denver antes que San Francisco) =


Ejemplo 5:

Si se tienen 5 candidatos (n = 5) a tres cargos (r = 3) de una empresa los cuales son: (P)
Presidente, (G) Gerente y (T) Tesorero De cuantas maneras se pueden ocupar estos tres
cargos?

CARGOS P G T
MANERA DE OCUPARLOS (5) * (4) * (3) = 60 Nmero total de maneras para
ocupar los tres cargos

n = 5
n
P
r
=
5
P
3
=
! 2
) ! 2 )( 3 )( 4 )( 5 (
! 2
! 5
)! 3 5 (
! 5
= =


r = 3 = (5) (4) (3) = 60
6
! 0
! 3
3 3
= = P
6
6
=
=
r
n
720 ! 6
! 0
! 6
6 6
= = = P
5 . 0
720
360
=
61

El cargo de Presidente lo podra ocupar cualquiera de las cinco personas, esto es, hay cinco
maneras de ocupar el cargo de Presidente. Cuando esto sucede, hay cautro maneras de ocupar el
siguiente cargo y por consiguiente habr tres maneras de ocupar el tercer cargo.

Ejemplo 6:

En un concurso de Escritores se suelen escoger primero 15 semifinalistas y lueo se eligen 5
finalistas. De cuntas formas se pueden ocupar los 5 primeros lugares entre los 15
semifinalistas?

Solucin:
n = 15 El 1 lugar lo pueden ocupar 15
r = 5 El 2 lugar lo pueden ocupar 14
El 3 lugar lo pueden ocupar 13
El 4 lugar lo pueden ocupar 12
El 5 lugar lo pueden ocupar 11

15
P
5
= 360360 11 * 12 * 13 * 14 * 15
! 10
! 15
)! 5 15 (
! 15
= = =



Utilizando el principio de multiplicacin
n
1
= 15 n
2
= 14 n
3
= 13 n
4
= 12 n
5
= 11
en consecuencia,
n
1
n
2
n
3
n
4
n
5
= (15) (14) (13) (12) (11) = 360360

Ejemplo 7:

Si hay un men que consta de cinco platillos de verduras. Cuntas permutaciones de dos de los
son posibles?

Solucin:

5
P
2
= 20 ) 4 )( 5 (
! 3
! 5
)! 2 5 (
! 5
= = =



Observaciones importantes:

i. En este ejemplo no se detalla el orden.
ii. En permutaciones se tendran dos platillos equivalentes, esto es, escoger papas y
zanahorias sera equivalente a escoger zanahorias y papas.
iii. Como veremos posteriormente en combinaciones no importa el orden, es decir escoger
zanahorias y papas es lo mismo que escoger papas y zanahorias. Por lo tanto, para este
caso el nmero de combinaciones ser la mitad del nmero de permutaciones.

Ejemplo 8:

62
Determinar el nmero de permutaciones de las letras a, b y c tomadas en dos.
Solucin:
n = 3
r = 2
3
P
2
= 6 ) 1 )( 2 )( 3 (
! 1
! 3
)! 2 3 (
! 3
= = =



Estas permutaciones son ab, ba, ac, ca, bc, cb.

Observacin:
Cuando veamos este ejemplo en el tema de combinaciones, obtendremos que las
combinaciones posibles de las letras a, b y c son ab, ac, bc lo cual indica que ab es la misma
combinacin que ba, pero no la misma permutacin.

Ejemplo 9:

Supongamos que tenemos 4 equipos de bsquet-bol en un campeonato. En cuntas formas
pueden quedar ubicados del primero al cuato lugar?

Solucin:
n = r = 4
4
P
4
= 4! = (4) (3) (2) (1) = 24

Ejemplo 10:

De A a B hay 8 caminos y de B a C hay 6 caminos. De cuntas maneras se puede ir de A a C
pasando por B?

Solucin:

Primero, de A a B:
n = 8
r = 1
8
P
1
= 8
! 7
! 8
)! 1 8 (
! 8
= =



Ahora de B a C:
n =6
r = 1
6
P
1
= 6
! 5
! 6
)! 1 6 (
! 6
= =


en consecuencia,
(
8
P
1
) (
6
P
1
) = (8) (6) = 48

Aplicando el principio de la multiplicacin:
n
1
= 8
n
2
= 6 n
1
n
2
= (8) (6) = 48



63

Ejemplo 11:

En un tren hay un asiento para 4 personas. En cierta estacin se suben 8 personas. De cuntas
formas posibles pueden las 8 personas estar sentadas en el asiento?

Solucin:

La primera parte del asiento puede ocuparse por cualquiera de las 8 personas.
La segunda parte por 7.
La tercera parte por 6.
La cuarta parte por 5.
n = 8
r = 4
8
P
4
= 1680 ) 5 )( 6 )( 7 )( 8 (
! 4
! 8
)! 4 8 (
! 8
= = =



Ejemplo 12:

Se quieren sentar 5 hombres y 4 mujeres en una fila de modo que las mujeres ocupen los sitios
pares. De cuntas formas pueden sentarse?

Solucin:

1 2 3 4 5 6 7 8 9
5 4 3 2 1 = 5! Hombres
5
P
5
4 3 2 1 = 4! Mujeres
4
P
4

Por lo tanto
(
5
P
5
) (
4
P
4
) = 5! 4! = (120) (24) = 2880

Ejemplo 13:

De cuantas formas pueden colocarse 7 libros en un librero?

Solucin:

n = r = 7
7
P
7
= 7! = 7*6*5*4*3*2*1 = 5040

Si tres libros determinados deben estar juntos?

Los tres libros se pueden considerar como un solo libro. Entonces se tienen 1+4 = 5 libros, que
pueden ordenarse en
5
P
5
= 5! fomas. En todos estos casos los tres libros estn juntos pero a su
vez estos se pueden ordenar en
3
P
3
= 3! formas. Entonces el nmero de ordenaciones pedido
ser:
5! 3! = (120) (6) = 720

Si dos libros determinados deben ocupar los extremos?

64
Solucin
Los cinco libros restantes se pueden ordenar en 5! formas diferentes y los libros que estn en
los extremos se pueden ordenar entre ellos en 2! formas. El nmero total de resultados posibles
es:

2! 5! = (2) (120) = 240

Ejemplo 14:

Cuntos nmeros de cuatro cifras pueden escribirse del conjunto P={0, 1, 2, 3, 4, 5, 6, 7, 8, 9}
si:
a) Los nmeros pueden repetirse.
b) Si los nmeros no pueden repetirse.
c) Si el ltimo nmero ha de ser cero y los nmeros no pueden repetirse.

Solucin:

a) Pueden elegirse 9 elementos para la cifra de los millares (El cero no tiene valor en esta
posicin).
Pueden elegirse 10 elementos para la cifra de las centenas.
Pueden elegirse 10 elementos para la cifra de las decenas
Pueden elegirse 10 elementos para la cifra de las unidades.
En consecuencia, el nmero total de nmeros de 4 cifras es:
n
1
n
2
n
3
n
4
= (9) (10) (10) (10) = 9000

b) Por orden.
Pueden elegirse 9 elementos para la primera cifra. (Nuevamente el cero en esta posicin
no tiene valor).
Pueden elgirse 9 elementos en la segunda cifra. (No interviene la cifra que se ocup en
el lugar correspondiente de la primera cifra, pero si podra estar ocupada por el cero).
Pueden elegirse 8 elementos para la tercera cifra. (No puede ser ninguna de las que se
ocupan en los dos primeros lugares).
Pueden elegirse 7 elementos para la cuarta cifra. (No puede ser ninguna de las que
ocupan en los tres primeros lugares).

Entonces
n
1
n
2
n
3
n
4
= (9) (9) (8) (7) = 4536

Otro mtodo ms corto.

Pueden elgirse 9 elementos para la primera cifra (el cero no). Los otros tres restantes
pueden elegirse fcilmente utilizando permutaciones, se tienen 9 elementos y faltan 3
lugares.

n = 9
r = 3
9
P
3
= ) 7 )( 8 )( 9 (
! 6
! 9
)! 3 9 (
! 9
= =


65
Entonces:
(9) (9) (8) (7) = 4536
c) Pueden elegirse 9 elmentos para la primera cifra (el cero no).
Pueden elgirse 8 elementos para la segunda cifra.
Pueden elgirse 7 elementos para la tercera cifra.

Entonces:
n
1
n
2
n
3
= (9) (8) (7) = 504 son los nmero que pueden formarse.

Otro mtodo ms corto.

Pueden elegirse 9 elementos para la primera cifra (el cero no). Nos quedan 8 elementos
y 2 lugares, por lo tanto:

8
P
2
= ) 7 )( 8 (
! 6
! 8
)! 2 8 (
! 8
= =


Finalmente,
(9) (8) (7) = 504 nmeros que pueden formarse

Ejemplo 15:

Se ordenan en una fila 5 bolas verdes, 3 bolas blancas y 2 anaranjadas. Si las bolas de igual
color no se distinguen entre s De cuantas formas posibles pueden ordenarse?
n
1
= 5 n
2
= 3 n
3
= 2
n = 10 elementos P = 2520
) 1 )( 2 )( 1 )( 2 )( 3 (
) 6 )( 7 )( 8 )( 9 )( 10 (
! 2 ! 3 ! 5
! 10
= =

Ejemplo 16:

Una caja contiene 10 pelotas. Hallar el nmero de pruebas ordenadas.
a) De tamao tres con sustitucin.
b) De tamao tres sin sustitucin.
c) De tamao cuatro con sustitucin.
d) De tamao cinco sin sustitucin.

Solucin:

a) Por principio fundamental de multiplicacin:
n
1
n
2
n
3
= (10) (10) (10) = 10
3
= 1000

b)
10
P
3
= 720 ) 8 )( 9 )( 10 (
! 7
! 10
)! 3 10 (
! 10
= = =



c) n
1
n
2
n
3
n
4
= (10) (10) (10) (10) = 10
4
= 10000

d)
10
P
5
= 30240 ) 6 )( 7 )( 8 )( 9 )( 10 (
! 5
! 10
)! 5 10 (
! 10
= = =


66


Ejemplo 17:

Determinar del conjunto {a, b, c} las permutaciones tomadas de dos en dos.
a) Sin sutitucin
b) Con sustitucin

Solucin:

a) n = 3
r = 2
3
P
2
= 6 ) 1 )( 2 )( 3 (
! 1
! 3
)! 2 3 (
! 3
= = =


ab, ac, bc, ba, ca, cb

b) n = 3 Nmero de opciones
r = 2 Decisiones secuenciales
3
2
= 9
ab, ac, bc, ba, ca, cb, aa, bb, cc

Permutaciones con repeticiones

Ocasionalmente tendremos elementos idnticos. Para este tipo de problemas, el nmero de
permutaciones que se pueden distinguir en el caso de n elementos de los cuales hay n
1

elementos idnticos de un tipo, n
2
de otro tipo, etc, es:


! n ... ! n ! n
n!
n ... , n n P n
r 2 1
r 2 1
=

donde n = n
1
+ n
2
+ ... + n
r


Ejemplo 1:

Cuntas ordenaciones diferentes de 8 letras se pueden hacer utilizando las letras?
O O X X X X N
Solucin:

4 X 1 - N
3 O
8
P
4 3 1
= 280
) 1 )( 2 )( 3 (
) 5 )( 6 )( 7 )( 8 (
! 1 ! 3 ! 4
! 8
= =

Ejemplo 2:

En cuntas formas pueden tres banderas rojas, dos azules y una amarilla elevarse en un asta
para que den diferentes seales?
67

Solucin:
n
1
= 3 n
2
= 2 n
3
= 1
n = 6 elementos P = 60
) 1 )( 2 )( 3 (
) 4 )( 5 )( 6 (
! 1 ! 2 ! 3
! 6
= =
Observar que las bandras de igual color no se distinguen entre s.

Combinaciones

Si solo nos interesa el nmero de maneras como se pueden tomar r elementos de un total de n
elementos y no interesa el orden de los mismos, se trata entonces de una combinacin.

Una combinacin de n elementos es una seleccin de r de los n elementos sin atender a la
ordenacin de los mismos. El nmero de combinaciones viene dada por las siguientes
frmulas, dependiendo del tipo de prueba.


Ejemplo 1:

Seleccionar dos platillos de verduras de un men en el que hay cinco opciones.

Solucin:

5
C
2
= 10
2
20
2
) 4 )( 5 (
! 3 ! 2
! 5
= = =

Ejemplo 2:

Determinar el nmero de combinaciones de las letras a, b y c tomadas de dos en dos.

Solucin:

3
C
2
= 3
! 1 ! 2
! 3
=
Estas son: ab, ac, bc

Ejemplo 3:

Un inversionista informa a su representante que desea extender sus inversiones a cuatro
compaas distintas. Est interesado nicamente en acciones de minas y de petrleo y su
representante le recomienda inversiones en seis de minas y cinco de petrleo. En cuantas
formas puede el inversionista hacer sus compras si decide adquirir dos de cada una.
68

Solucin:
Sea M el conjunto de acciones de minas n = 6
Sea P el conjunto de acciones de petrleo n = 5
(M, M) puede seleccionarse en
6
C
2
formas.
(P, P) puede seleccionarse en
5
C
2
formas.
Por lo tanto el nmero de formas es:
(
6
C
2
) (
5
C
2
) = 150 ) 10 )( 15 (
! 2 ! 3
! 5
! 2 ! 4
! 6
= = |
.
|

\
|
|
.
|

\
|


Ejemplo 4:

Un equipo de basquet-bol consta de 12 jugadores. Para iniciar un partido se necesitan 5
jugadores. Si no importan las posiciones en las que se acostumbra ubicar a cada jugador.
Cuntos equipos de basquet-bol de 5 jugadores se podran formar?

Solucin:
n = 12
r = 5
12
C
5
= 792
120
95040
) 1 )( 2 )( 3 )( 4 )( 5 (
) 8 )( 9 )( 10 )( 11 )( 12 (
! 5 ! 7
! 12
)! 5 12 ( ! 5
! 12
= = = =



Ejemplo 5:

Doce estudiantes que participan en un Congreso de Medicina han de dividirse en tres grupos
que contienen seis, cuatro y dos estudiantes, respectivamente. En cuntas formas puede
realizarse esto?

Solucin:

El grupo de seis puede elegirse en
12
C
6
formas.
El grupo de cuatro puede elegirse del de seis restante en
6
C
4
formas.
Los dos restantes forman el tercer grupo.
Por lo tanto el nmero de formas es:

(
12
C
6
) (
6
C
4
) (1) =
1 * 2 * 1 * 2 * 3 * 4
7 * 8 * 9 * 10 * 11 * 12
! 2 ! 4 ! 6
! 12
! 2 ! 4
! 6
! 6 ! 6
! 12
= = |
.
|

\
|
|
.
|

\
|
= 13860

Ejemplo 6:

Un estudiante tiene que resolver 10 preguntas de 13 en un examen de Derecho.

a) Cuntas maneras de escoger tiene?
b) Cuntas si las dos primeras son obligatorias?
c) Cuntas si una de las dos primeras es obligatoria?

Solucin:
69
a)
13
C
10
=
13
C
3
= 286
6
1716
) 1 )( 2 )( 3 (
) 11 )( 12 )( 13 (
= =

b)
11
C
8
= 165
6
990
) 1 )( 2 )( 3 (
) 9 )( 10 )( 11 (
! 3 ! 8
! 11
= = =

c) 2
11
C
9
= 110
2
220
) 1 )( 2 (
) 10 )( 11 (
2
! 2 ! 9
! 11
2 = = =

Ejemplo 7:

En un senado hay 20 demcratas y 10 republicanos. Se va a elegir a una junta de 5 senadores.

a) De cuntas maneras puede hacerse?
b) De cuntas maneras si tiene que haber tres demcratas y dos republicanos?
c) De cuntas maneras si todos han de ser del mismo partido?

Solucin:

a)
30
C
5
= = = = =
120
17100120
1 * 2 * 3 * 4 * 5
26 * 27 * 28 * 29 * 30
! 5 ! 25
! 30
)! 5 30 ( ! 5
! 30
142,506 maneras

b)
20
C
3

10
C
2
= 51300
12
615600
1 * 2
9 * 10
*
1 * 2 * 3
18 * 19 * 20
= =
c)
20
C
5
+
10
C
5
= = +
1 * 2 * 3 * 4 * 5
6 * 7 * 8 * 9 * 10
1 * 2 * 3 * 4 * 5
16 * 17 * 18 * 19 * 20
15,756 maneras

Ejemplo 8:

Una urna contiene 80 canicas azules y 20 canicas verdes. Si 8 canicas son seleccionadas al azar,
sin sustitucin cul es la probabilidad de que 5 de ellas sean azules?

Solucin:

El nmero total de posibles resultados est formado por
100
C
8
que es el nmero de formas de
seleccionar 8 canicas de 100. Por otra parte, existen
80
C
5
formas de seleccionar 5 canicas azules
de las 80 que son y para cada forma de seleccionar las 5 bolas azules existen
20
C
3
formas de
seleccionar 3 canicas verdes de las 20 que hay, entonces existen (
80
C
5
)

(
20
C
3
) formas para
obtener 5 canicas azules cuando se seleccionan 8 canicas sin sustitucin.

Por lo tanto,
P (de que 5 sean azules) =
( )( )
( )
100
8
20
3
80
5


70
Ejemplos De Aplicacin De Las Tcnicas De Conteo En Probabilidad

Ejemplo 1:

En un cajon metlico hay 10 resistencias diferentes que se necesitan utilizar en orden para
acabar un circuito electrnico. Cul es la probabilidad de que en extreacciones aleatorias sin
sustitucin, se obtengan en el orden que se necesitan?

Solucin:

n = r = 10
n
P
n
= n! = 10! = 3,628,800

El nmero total de posibles resultados es 3,628,800. En consecuencia la probabilidad deseada
es:

3628800
1
P =

Ejemplo 2:

Supongamos que una urna contiene 6 tornillos iguales de cuarda derecha y 4 tornillos iguales de
cuarda izquierda. Si se necesitan primero los 6 de cuarda derecha y luego los 4 de cuerda
izquierda cul es la probabilidad de que extrayendo aleatoriamente se obtengan los tornillos en
el orden deseado?

Solucin:
n
1

= 6
n
2
= 4 P = 210
1 * 2 * 3 * 4
7 * 8 * 9 * 10
! 4 ! 6
! 10
= =
n = 10

El nmero total de posibles resultados es 210. En consecuencia la probabilidad deseada es:

210
1
P =

Ejemplo 3:

En un centro comercial de televisores se recibieron 12 aparatos nuevos, 8 del modelo A y 4 del
modelo B. Si se venden cuatro aparatos,

a) Cul es la probabilidad de que los cuatro televisores vendidos sean 2 del modelo A y 2 del
modelo B?
b) Cul es la probabilidad de que los cuatro sean del mismo modelo?

Solucin:

a) El nmero total de maneras de elegir 4 televisores entre los 12 es:
71
( ) 495
1 * 2 * 3 * 4
9 * 10 * 11 * 12
12
4
= =

El nmero de maneras de elegir 2 televisores de 8 es ( )
8
2
, y el nmero de maneras de
elegir dos televisores entre cuatro es ( )
4
2


En consecuencia la probabilidad deseada es:

( )( )
( ) 165
56
495
168
495
) 6 )( 28 (
495
2
12
*
2
56
P
12
4
4
2
8
2
= = = = =

b) El nmero de formas de elegir 4 televisores entre 8 es ( ) 70
24
1680
8
4
= = y el nmero de
maneras de elegir 4 televisores entre 4 es ( ) 1
4
4
= .
Consecuentemente, la probabilidad de que todos los cuatro televisores vendidos sean del
mismo modelo es:

495
71
495
1 70
P =
+
=

Ejemplo 4:

Un vendedor de automviles tiene 10 autos nuevos; tres del modelo X, tres del modelo Y y
cuatro del modelo Z. Cul es la probabilidad de vender dos autos del mismo modelo si las
ventas de modelos diferentes se hacen al azar?

Solucin:
El nmero total de maneras de elegir 2 autos entre los 10 es ( ) 45
2
90
10
2
= =
En consecuencia la probabilidad deseada es:


( ) ( ) ( )
( ) 15
4
45
12
45
6 3 3
P
10
2
4
2
3
2
3
2
= =
+ +
=
+ +
=

Ejemplo 5:

De 10 concursantes en un evento femenino, tres seoritas tienen ojos azules. Si se eligen 2
seoritas al azar. Cul es la probabilidad de que (i) Las dos tengan ojos azules, (ii) Ninguna
tenga ojos azules, (iii) Una por lo menos tenga ojos azules?

Solucin:
El nmero total de maneras de elegir 2 seoritas al azar entre las 10 es ( ) 45
2
90
10
2
= =

72
i) P (Las 2 tengan ojos azules) =
( )
( ) 15
1
45
3
10
2
3
2
= =

ii) P (Ninguna tenga ojos azules) =
( )
( ) 45
21
45
2
42
10
2
7
2
= =

iii) P (Una por lo menos tenga ojos azules) =
( )( ) ( )( )
( )
10
2
3
2
7
0
3
1
7
1
+


( ) 10
1
10
10
1
= = ( ) 15
2
30
1 2
5 6
6
2
= =

=

entonces (10)(15)=150

La probabilidad deseada para este caso es:


56
15
560
150
P = =

2.5 Probabilidad Condicional e Independencia.
2.5.1 Probabilidad Condicional.

Sea E un experimento y A y B dos eventos que pertenecen a ese experimento. La probabilidad
del evento A dado un evento B que se representa por P(A/B) est dada por:

P(A/B) = 0 P(B)
P(B)
B) P(A
>



y se define como la probabilidad de la interseccin de los dos eventos sobre la probabilidad del
evento condicionante.

Si A y B son independientes se tiene P(B/A) = P(B)
y P(A/B) = P(A)

Si A y B son mutuamente excluyentes P(B/A) = 0
y P(A/B) = 0

Ejemplo 1:

Sea el experimento de lanzar una moneda y sean los eventos:

A: Sol en el quinto lanzamiento.
73
B: Sol en el sexto lanzamiento.

Cul es la probabilidad de que se tenga sol en el quinto y sexto lanzamiento?

Solucin:

Puesto que A y B son eventos independientes
P (A B) = P(A) P(B) =
4
1
2
1
*
2
1
=

Ejemplo 2:

Juan llega tarde a su casa para cenar el 25% de las veces. La cena se retrasa el 10% de las veces.
Si los dos eventos no estn relacionados. Qu probabilidad hay de que ambos ocurran?

Solucin:

P (Ambos se retrasen) = P (Juan se retrase) P (La cena se retrase)
= (0.25) (0.10) = 0.025 = 2.5%

Ejemplo 3:

Sea el experimento de lanzar un dado y sean los eventos:

A: El nmero es menor que 5
B: El nmero es par
C: El nmero es impar
D: El nmero es par menor que 5

Determinar

i) P (A/B) ii) P(B/A) iii) P(D/A)

Solucin:

Podemos escribir los eventos como:
S = {1, 2, 3, 4, 5, 6}
A = {1, 2, 3, 4}
B = {2, 4, 6}
C = {1, 3, 5}
D = {2, 4}

Determinamos la probabilidad de cada evento.
P (A) =
3
2
6
4
= P (B) =
2
1
6
3
= P (C) =
2
1
6
3
=

74
P (D) =
3
1
6
2
=

Note que:

AB = {1, 2, 3, 4} {2, 4, 6} = {2, 4} = D

Consecuentemente,
P (AB) =
3
1
6
2
=

i) P(A/B) = % 6 . 66
3
2
2
1
3
1
P(B)
B) P(A
= = =



ii) P(B/A) = % 50
2
1
6
3
3
2
3
1
P(A)
A) P(B
= = = =



iii) P(D/A) = % 50
2
1
6
3
3
2
3
1
P(A)
A) P(D
= = = =



Ejemplo 4:

En un cajn hay 3 bolas blancas y 2 bolas negras. Sean los eventos:

A: La primera bola extraida es negra
B: La segunda bola extraida es negra

En extracciones sin reemplazamiento. Cul es la probabilidad de que ambas bolas extradas
sean negras?

Solucin:

5
2
2 3
2
P(A) =
+
= Probabilidad de que la primera bola extraida sea negra.

4
1
1 3
1
A) | P(B =
+
= Probabilidad de que la 2da. Bola extrada sea negra dado
que la primera extraccin fue bola negra.

La probabilidad de que ambas bolas extradas sean negras es:
75

10
1
20
2
4
1
*
5
2
A) | P(A)P(B B) P(A = = = =

Ejemplo 5:

Una bolsa contiene 10 transitores, 3 de los cuales estn defectuosos. Se extraen dos transistores
al azar,

a) Hallar la probabilidad del evento tal que ninguno de los 2 transitores est defectuosos.
b) Se extraen 3 transitores sin reemplazo. Encontrar la probabilidad del evento talque los
tres primeros transitores no estn defectuosos?
c) Hallar la probabilidad del evento tal que los dos primeros transitores extrados no estn
defectuosos y el tercero si lo est.

Solucin:

a) Sean los eventos:
.
E: Los dos transitores son no defectuosos
A: El primer transitor elegido no est defectuoso
B: El segundo transitor no est defectuoso

Extracciones sin reemplazo
% 46 46 .
90
42
9
6
*
10
7
A) | P(A)P(B B) P(A P(E) = = = = = =

Extracciones con reemplazo
% 49 49 .
100
49
10
7
*
10
7
A) | P(A)P(B B) P(A P(E) = = = = = =

b) % 29 29 .
72
21
720
210
8
5
*
9
6
*
10
7
C) A | A)P(C | P(A)P(B C) B P(A P(E) = = = = = = =

c) % 5 . 17 175 .
72
21
720
126
8
3
*
9
6
*
10
7
C) A | A)P(D | P(A)P(B D) B P(A P(E) = = = = = = =

Ejemplo 6:

Sea el experimento de lanzar dos dados y sean los eventos:

A: El primer dado es un 5
B: El total es 7
C. El total es 10

Demostrar que:

76
a) P(B|A)= P(B) b) P(C|A) P(C) c) P(A|B) = P(A)

Demostracin:

Si observamos el espacio muestral S = {(11), (12), (13), (14), (15), (16)
(21), (22), (23), (24), (25), (26)
(31), (32), (33), (34), (35), (36)
(41), (42), (43), (44), (45), (46)
(51), (52), (53), (54), (55), (56)
(61), (62), (63), (64), (65), (66)}

Se tiene que los eventos A, B y C equivalen a:

A= {(51), (52), (53), (54), (55), (56)}
B= {(61), (52), (43), (34), (25), (16)}
C= {(64), (55), (46)}

En consecuencia,
6
1
36
6
P(A) = =
6
1
36
6
) ( = = B P
12
1
36
3
P(C) = =

a) AB = {(52)}

6
1
36
6
6
1
36
1
P(A)
B) P(A
A) | P(B = = =

=
Por lo tanto,
P(B|A) = P(B)

b) AC = {(55)}

6
1
36
6
6
1
36
1
P(A)
C) P(A
A) | P(C = = =

=
Por lo tanto,
P(C|A) P(C)

c)
6
1
36
6
6
1
36
1
P(B)
B) P(A
B) | P(A = = =

=
Por lo tanto,
P(A|B) = P(A)


77
2.5.2 Regla de la multiplicacin.

Sean A1, A2, ..., An n eventos tales que:


( )
( ) ( ) ) ... ( )...... ( P
n) 1,2,..., = (i 0
1 2 1 1 2 3 1 2 1
n
1 = i
i

=
|
.
|

\
|

>
n n i
i
A A A A P A A A P A A P A P A
A P


2.5.3 Regla de la Probabilidad Total

Sean A1, A2, ... An n eventos tales que:


( )
S A
A A
A P
i
j i
i
=
= =
>
n
1 = i
j i,
i
j i
n) 1,2,..., = (i 0


Sea B un evento cualquiera que pertenece a S

P B ( ) = P B A
i
( )
i=1
n
P A
i
( )

Teorema de Bayes

Sean A1 , ... An n eventos tales que


( )
S A
A A
A P
i
j i
i
=
= =
>
n
1 = i
j i,
i
j i
n) 1,2,..., = (i 0


Sea A un evento tal que A c S

P(A
i
A) =
P A
i
A
( )
P(A)
=
P A A
i
( )
P A
i
( )
P A A
i
( )
P A
i
( )
i=1
n



Ejemplo 1:

Para determinar si una persona tiene hepatitis se le hace un examen de sangre de cierto tipo. La
aceptacin de este procedimiento se basa en lo siguiente: entre personas con hepatitis, el 80%
de los exmenes de sangre descubren la enfermedad; pero el 20% fallan al hacerlo. Entre
personas sin hepatitis, el 5% diagnostican erradamente como casos de hepatitis y el 95% de los
exmenes dan el diagnstico correcto. Tomemos una persona cualquiera de un numeroso grupo
78
de los cuales un 1% tiene hepatitis. Cul es la probabilidad de que realmente tenga la
enfermedad?

Solucin:


H la persona tiene hepatitis
NH la persona no tiene hepatitis
EH Examen diagnostica hepatitis
ENH Examen diagnostica no hepatitis

139 . 0
057 . 0
008 . 0
) 05 . 0 )( 99 . 0 ( ) 8 . 0 )( 01 . 0 (
) 8 . 0 )( 01 . 0 (
) | ( ) ( ) | ( ) (
) | ( ) (
) | ( = =
+
=
+
=
NH EH P NH P H EH P H P
H EH P H P
EH H P

Ejemplo 2:

Tres mquinas de una fbrica de vidrio, producen piezas de adorno. La mquina A produce el
1% de piezas defectuosas, la mquina B produce el 2% de piezas defectuosas y la mquina C el
5% de piezas defectuosas.
Cada mquina produce la tercera parte de la produccin total. Un especialista examina una
pieza y determina que es defectuosa. Cul es la probabilidad de que dicha pieza halla salido de
la mquina A?

Solucin:
3
1
) ( = A P
3
1
) ( = B P
3
1
) ( = C P

100
1
01 . 0 % 1 ) | ( = = = A D P
100
2
02 . 0 % 2 ) | ( = = = B D P
99%
1%
H
NH
80% EH
20% ENH
95% ENH
5% EH
79
100
5
05 . 0 % 5 ) | ( = = = C D P

8
1
300
8
300
1
100
5
*
3
1
100
2
*
3
1
100
1
*
3
1
100
1
*
3
1
) | ( ) ( ) / ( ) ( ) | ( ) (
) | ( ) (
) | ( = =
+ +
=
+ +
=
C D P C P B D P B P A D P A P
A D P A P
D A P

= 0.0125 = 12.5%

Ejemplo 3:

En cierta escuela superior, 25% de los alumnos y 10% de las alumnas son estudiantes de
medicina. Las mujeres constituyen el 60% de los estudiantes. Si se selecciona al azar un
estudiante y resulta ser de medicina, determinar la probabilidad de que el estudiante sea una
alumna.

Solucin:



SEM Si estudian medicina
NEM No estudian medicina

Se puede resolver por dos mtodos.

Mtodo I


8
3
16 . 0
06 . 0
) (
) (
) | ( = =

=
SEM P
SEM E P
SEM M P

Mtodo II Teorema de Bayes
60%
40%
H
M
25% SEM
75% NEM
10% SEM
90% NEM
80

8
3
16 . 0
06 . 0
) 25 . 0 )( 40 . 0 ( ) 10 . 0 )( 60 . 0 (
) 10 . 0 )( 60 . 0 (
) | ( ) ( ) | ( ) (
) | ( ) (
) | ( = =
+
=
+
=
H SEM P H P M SEM P M P
M SEM P M P
SEM M P

81
C Ca ap p t tu ul lo o I II II I
Variables Aleatorias

En este captulo introduciremos el concepto de variables aleatorias y distribucin de una
variable aleatoria.

3.1 Variable Aleatoria

Con frecuencia nos interesa asociar valores numricos a cada punto del espacio muestral en
forma usualmente sugerida por algn problema especifico. As por ejemplo, en el caso de dos
dados, podemos estar interesados en el puntaje total lo cual nos llevara a asociar al punto (m,n)
el valor m+n. Estas cantidades numricas asociadas con los puntos de un espacio muestral
reciben el nombre de variables aleatorias.

NOTA: Si el espacio es de por s numrico, ya hay establecida una asociacin obvia de valores
numricos con los puntos del espacio muestral, pero puede haber otras.
3.1.1 Espectro de una Variable Aleatoria.

Llmese espectro de una variable aleatoria, al conjunto de valores que ella puede llegar a tomar
por ejemplo, en el lanzamiento de dos dados, el espacio muestral es S= [(1,1); (1,2); (2,1); . . .
(6,6)]

Si X es una variable aleatoria que representa el puntaje total de los dos lanzamientos, su
espectro ser: [2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12]
3.1.2 Distribucin de una Variable Aleatoria.

Llmese distribucin de una variable aleatoria a una asignacin de probabilidades sobre su
espectro.
3.1.3 Clasificacin de las Variables Aleatorias.

a- Variables Aleatorias Discretas.

Una variable aleatoria se dice que es discreta, si solo puede tomar valores enteros.

Ejemplo:

La variable aleatoria nmero de artculos defectuosos es discreta.

Definicin

Si X es una variable aleatoria discreta que toma diferentes valores como x
1
, x
2
, x
3
, . . . , x
n

existe una funcin llamada funcin masa de probabilidad f X
(x)
la cual se define como P (
X = x) e indica la probabilidad de que la variable X tome un valor x.
82

Esta funcin masa de probabilidad tiene las siguientes propiedades:

a- 0 < f X
(x)
< 1

b- max
f X
(xi)
= 1
x
i
=min

Definicin

Si X es una variable aleatoria discreta, existe la funcin de distribucin F X
(x)
definida como:

F X
(x)
= P (X < x)
Esta funcin de Distribucin tiene las siguientes propiedades:

a- F X
(x)
es una funcin no decreciente
b- 0 < F X
(x)
< 1

b- Variables Aleatorias Continuas.

Una variable aleatoria se dice que es continua si puede tomar cualquier valor dentro de un
intervalo.

Definicin

Se dice que una variable aleatorias X es continua si existe una funcin f X
(x)
llamada
funcin densidad que cumple las siguientes condiciones.

a f X
(x)
> 0

b

} f X
(x)
dx = 1

Esta funcin de densidad tiene las siguientes propiedades:

1- P (a < X < b) = P ( a < x < b) = P (a < X < b) =
a
b
}
f X
(x)
dx


2- P (X = a ) =
a
a
} f X
(x)
dx = 0

(La probabilidad en un punto de una variable aleatoria continua igual a cero)

83
3- La funcin de densidad no es una probabilidad pero sirve para calcular probabilidades
dentro de un intervalo.
Definicin

Si una variable aleatoria continua X tiene una funcin de densidad f X
(x)
, la funcin de
distribucin F X
(x)
se define como la probabilidad de que X < x

F X
(x)
= P (X < x ) =

x
}
f X
(x)
dx

Esta funcin de distribucin tiene las siguientes propiedades:

1-
x
Lim
F X
(x)
= 0

2-
x
Lim
F X
(x)
= 1

3- P(a < x < b) =
a
b
}
f X
(x)
dx

4- f X
(x)
=
( )
dx
X F d
x


3.1.4 Valor Esperado o Esperanza Matemtica

Variable Aleatoria Discreta

E (x) =
xi min
xi max
xi P(X = xi) =
xi min
xi max
xi f X
(xi)


Variable Aleatoria Continua

E (x) =

}
x f X
(x)
dx

Se interpeta como el valor promedio que toma la variable

3.1.5 Varianza de una Variable Aleatoria.

V (X ) = E (x
2
) - E (x)
2

Varianza para X variable Aleatoria Discreta

84
V (X) =
xi min
max
xi
2
f X
(x)
-[
xi min
xi max
xi f X
(x)
]
2


Varianza para X variable aleatoria continua

V (X) =

}
x
2
f X
(x)
dx - [

}
x f X
(x)
dx ]
2


Ejemplos de variables aleatorias sin nombre propio

Ejemplo 1:

Consideremos el experimento de lanzar una moneda. Determinar:

a) S ( Espacio Muestral)
b) Sea X variable aleatoria que representa el resultado de lanzar la moneda. Cul es el
espectro de la variable X?
c) Calcule la funcin masa de X
d) Calcule la funcin de distribucin de X

Solucin:

a) S = {A, S}
b) Espectro de X = ( 0, 1)
X [A] = 0 = x
1

X [S] = 1 = x
2

X = R
X
= {0, 1}
c) Por ltimo definimos f y F

X = x
i
0 1
f (x
i
)
F (x
i
)
2
/
2

Notar que:
2
1
) ( ) ( ) (
1 1
1
= = =

s
x f x f x F
x x
i
i

2
2
2
1
2
1
) ( ) ( ) ( ) (
2 1 2
2
= + = + = =

s
x f x f x f x F
x x
i
i


Lo anterior se deber considerar en cada uno de los siguientes ejemplos.

Ejemplo 2:

85
Sea el experimento de observar en un hospital el sexo del primer recin nacido en un da
determinado. Hallar el Espacio Muestral (S), Espectro de X, funcin masa de X (f), funcin de
distrubucin de X (F).

Solucin:
S = {M, H}
Espectro de X = {0, 1}

X = x
i
0 1
f (x
i
)
F (x
i
)
2
/
2

Ejemplo 3:

Sea el experimento de lanzar un dado. Hallar el Espacio Muestral (S), Espectro de X , funcin
masa de X (f), funcin de distrubucin de X (F).

Solucin:

S = { , , , , , }

Espectro de X = {1, 2, 3, 4, 5, 6}

Ahora obtenemos f y F.
X = x
i
1 2 3 4 5 6
f (x
i
)
1
/
6

1
/
6
1
/
6
1
/
6
1
/
6
1
/
6
F (x
i
)
1
/
6
2
/
6
3
/
6
4
/
6
5
/
6
6
/
6


Ejemplo 4:

Sea el experimento de lanzar dos dados y observar la suma de puntos que aparecen en las dos
caras superiores. Hallar el Espacio Muestral (S), Espectro de X , funcin masa de X (f), funcin
de distrubucin de X (F).

Solucin:

S = {(11), (12), (13), (14), (15), (16)
(21), (22), (23), (24), (25), (26)
(31), (32), (33), (34), (35), (36)
(41), (42), (43), (44), (45), (46)
(51), (52), (53), (54), (55), (56)
(61), (62), (63), (64), (65), (66)}

Espectro de X = {2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12}

1
/
36
si x = 2, 12
2
/
36
si x = 3, 11
86
f (x
i
) =
3
/
36
si x = 4, 10
4
/
36
si x = 5, 9
5
/
36
si x = 6, 8
6
/
36
si x = 7

Esto es:

X=x
i
2 3 4 5 6 7 8 9 10 11 12
f(x
i
)
1
/
36

2
/
36

3
/
36

4
/
36

5
/
36

6
/
36

5
/
36

4
/
36

3
/
36

2
/
36

1
/
36

F(x
i
)
1
/
36

3
/
36

6
/
36

10
/
36

15
/
36

21
/
36

26
/
36

30
/
36

33
/
36

35
/
36

36
/
36


Ejemplo 5:

Consideremos el nacimiento de un pequeo en donde los resultados nio o nia son igualmente
posibles y los nacimientos son independientes. Hallar S, X, f, F. De la variable aleatoria
nmero de nios que nacen en tres partos normales.

Solucin:

S = {MMM, MMH, MHM, HMM, MHH, HMH, HHM, HHH}

Espectro de X = {0, 1, 2, 3}

X = x
i
0 1 2 3
f(x
i
)
1
/
8

3
/
8

3
/
8

1
/
8

F(x
i
)
1
/
8

4
/
8

7
/
8

8
/
8


Ejemplo 6:

Sea F(x) la funcin de distribucin de una variable aleatoria continua definida de la siguiente
forma:
0 si x 0
F(x)
x
/
2
si 0 < x 2
80 si x > 2

Determinar la funcin de probabilidad f (x).

Solucin:
) ( ) ( x F
dx
d
x f =

0 si x 0
dx
d
x F
dx
d
= ) (
x
/
2
si 0 < x 2
80 si x > 2

0 si x 0
87
=
1
/
2
si 0 < x 2
0 si x > 2



Ejercicio 7:

Tomemos dos pelotas al azar de una urna que contiene cinco pelotas numeradas 1, 1, 2, 2, 3.
Sea X que representa la suma, Y el mayor de los dos nmero sacados. Hallar la distribucin F,
el promedio , la varianza
2
y la desviacin estndar de:
a) X
b) Y
c) X + Y

Solucin:

a) El espacio muetral correspondiente es

S = {(1,1), (1,2), (1,2), (2,1), (2,1), (2,2), (2,3), (3,2), (3,1), (1,3)}

(1, 1) = 1 + 1 = 2
(1, 2) = 1 + 2 = 3
(1, 2) = 1 + 2 = 3
(2, 1) = 2 + 1 = 3
(2, 1) = 2 + 1 = 3
(2, 2) = 2 + 2 = 4
(2, 3) = 2 + 3 = 5
(3, 2) = 3 + 2 = 5
(3, 1) = 3 + 1 = 4
(1, 3) = 1 + 3 = 4

Espectro de X (2,3,4,5)

Distribucin (F):
X = x
i
2 3 4 5
f (x
i
)
1
/
10
4
/
10
3
/
10
2
/
10

F (x
i
)
1
/
10
5
/
10
8
/
10
10
/
10

El valor esperado o promedio es:

=
= =
+ + +
= = =
n
i
i i
x f x X E
1
6 . 3
10
36
10
) 2 ( 5 ) 3 ( 4 ) 4 ( 3 ) 1 ( 2
) ( ) (

Variaza:
84 . 0 96 . 12 8 . 13 96 . 12
10
138
) 6 . 3 (
10
) 2 ( 25 ) 3 ( 16 ) 4 ( 9 ) 1 ( 4
)] ( [ ) (
2 2 2 2
= = =
+ + +
= =

X E x f x
i i
o

88
Desviacin estandar:
9 . 0 84 . 0 = = o

b) (a, b) ----- MAX (a, b)
(1, 1) = MAX (1, 1) = 1
(1, 2) = MAX (1, 2) = 2
(1, 2) = MAX (1, 2) = 2
(2, 1) = MAX (2, 1) = 2
(2, 1) = MAX (1, 1) = 2
(2, 2) = MAX (2, 2) = 2
(2, 3) = MAX (2, 3) = 3
(3, 2) = MAX (3, 2) = 3
(3, 1) = MAX (3, 1) = 3
(1, 3) = MAX (1, 3) = 3

Espectro de Y = (1,2,3)

Distribucin (F):
Y = y
i
1 2 3
f (y
i
)
1
/
10

5
/
10

4
/
10

F (y
i
)
1
/
10

6
/
10

10
/
10


Valor esperado o promedio:
3 . 2
10
23
10
) 4 ( 3 ) 5 ( 2 ) 1 ( 1
) ( ) ( = =
+ +
= = =
i i
y f y Y E

Varianza:
41 . 0 29 . 5 7 . 5 ) 3 . 2 (
10
) 4 ( 9 ) 5 ( 4 ) 1 ( 1
2 2
= =
+ +
= o

Desviacin estandar:
64 . 0 41 . 0 = = o

c) Z = X + Y
X: (a, b) ---- a + b Y: (a, b) ---- MAX (a, b)
(1, 1) = X (1, 1) + Y (1, 1) = 2 + 1 = 3

(1, 2) = X (1, 2) + Y (1, 2) = 3 + 2 = 5
(1, 2) = X (1, 2) + Y (1, 2) = 3 + 2 = 5
(2, 1) = X (2, 1) + Y (2, 1) = 3 + 2 = 5

(2, 1) = X (2, 1) + Y (2, 1) = 3 + 2 = 5

(2, 2) = X (2, 2) + Y (2, 2) = 4 + 2 = 6

(2, 3) = X (2, 3) + Y (2, 3) = 5 + 3 = 8

(3, 2) = X (3, 2) + Y (3, 2) = 5 + 3 = 8
(3, 1) = X (3, 1) + Y (3, 1) = 4 + 3 = 7
(1, 3) = X (1, 3) + Y (1, 3) = 4 + 3 = 7

89
Espectro de Z = (3, 5, 6, 7, 8)
Distribucin (F):
Z = z
i
3 5 6 7 8
f (z
i
)
1
/
10

4
/
10

1
/
10

2
/
10

2
/
10

F(z
i
)
1
/
10

5
/
10

6
/
10

8
/
10

10
/
10


Valor esperado o promedio:
9 . 5
10
59
10
) 2 ( 8 ) 2 ( 7 ) 1 ( 6 ) 4 ( 5 ) 1 ( 1
) ( ) ( = =
+ + + +
= = =
i i
z f z Z E

Varianza:
3 . 2 81 . 34 1 . 37 81 . 34
10
371
) 9 . 5 (
10
) 2 ( 64 ) 2 ( 49 ) 1 ( 36 ) 4 ( 25 ) 1 ( 9
2 2
= = =
+ + + +
= o

Desviacin Estandar:
5 . 1 3 . 2 = = o

Ejemplo 8:

Una mquina impresora se emplea por la maana para elaborar cierto libro y por la tarde realiza
otro tipo de trabajo. Representemos por X el nmero de ocasiones que falla en la maana y por
Y el nmero de ocasiones que falla en la tarde. La tabla de la distribucin de probabilidades
conjunta de X y Y es:

Y/X 0 1 2 f(y)
0
1
2
0.1
0.04
0.06
0.2
0.08
0.12
0.2
0.08
0.12
0.5
0.2
0.3
f(x) 0.2 0.4 0.4

Hallar E(X) y E(Y)

Solucin:

x
i
0 1 2 y
i
0 1 2
f(x
i
) 0.2 0.4 0.4 f(y
i
) 0.5 0.2 0.3


E(X) = x
i
f(x
i
) = E(Y) = y
i
f(y
i
) =
= 0(0.2) + 1(0.4) + 2(0.4) = 0(0.5) + 1(0.2) + 2(0.3)
= 0 + 0.4 + 0.8 = 0 + 0.2 + 0.6
= 1.2 = 0.8

Ejemplo 9:

Sea X una variable aleatoria continua con distribucin:
90

f(x)= k x si 0 x < 5
0 en cualquier otra parte
a) Hallar k
b) Hallar P (1 X 3), P(2 X 4) , P(X 3)
Solucin:
f(x)dx = 1

a) 1
2
25
0
2
25
5
5
0
2
5
0
5
0
= |
.
|

\
|
= |
.
|

\
|
=
(

= =
} }
k k
x
k xdx k kxdx
en consecuencia

25
2
= k

b) f(x) =
2
/
25
x si 1 x 3
0 en cualquier otra parte
25
8
) 4 (
25
2
2
1
2
9
25
2
2 25
2
25
2
25
2
3
1
2
3
1
3
1
= = |
.
|

\
|
=
(

= =
} }
x
xdx xdx
( )
25
12
2 8
25
2
2 25
2
25
2
25
2
4
2
2
4
2
4
2
= =
(

= =
} }
x
xdx xdx

25
9
2
9
25
2
2 25
2
25
2
25
2
3
0
2
3
0
3
0
= |
.
|

\
|
=
(

= =
} }
x
xdx xdx

Ejemplo 10:

Consideremos el experimento de lanzar una moneda. Hallar y
2

Solucin:

Consideremos la distribucin de probabilidades del ejemplo 1 de esta serie de problemas.

= |
.
|

\
|
+ |
.
|

\
|
= + = =
2
1
2
1
1
2
1
0 ) ( ) ( ) (
2 2 1 1
x f x x f x x f x
i i

Para determinar
2
podemos emplear una frmula similar a la que se emplea para variables
aleatorias continuas. Basta quitar el smbolo de integracin y cambiar x por x
i
.
4
1
8
1
8
1
2
1
2
1
1
2
1
2
1
0 ) ( ) ( ) ( ) ( ) ( ) (
2 2
2
2
2 1
2
1
2 2
= + = |
.
|

\
|
+ |
.
|

\
|
= + = =

x f x x f x x f x
i i
o

Se puede hacer lo mismo para los ejemplos 2, 3, 4 y 5.

3.2 Distribuciones con Nombre Propio

91
Existen distribuciones que aparecen con tanta frecuencia en las aplicaciones de la Teora de la
Probabilidad que han merecido recibir un "nombre propio" y para describirlas basta con dar su
nombre y su(s) parmetro(s).
3.2.1 Distribuciones con Nombre Propio para Una Variable Aleatoria Discreta.

Distribucin Bernoulli

La distribucin bernoulli es considerada la ms sencilla debido a que sirve para determinar la
probabilidad de obtener cierto resultado en una observacin.

Es aplicable cuando las condiciones del experimento son las siguientes:

a- Se efectua una nica prueba.
b- En la prueba hay 2 resultados posibles: Exito o Fracaso.
d- La probabilidad de xito es p y de fracaso es q. Adems, q = 1-p
e- La variable estudiada es: X= resultado al efectuar la prueba
f- Espectro de X = (0, 1), donde 1 corresponde al xito y 0 al fracaso.

Para obtener las probabilidades de una variable aleatoria discreta, que est distribuida en forma
bernoulli, se debe utilizar la frmula siguiente:

p
q
x f x
1
0
) (


media = E (X) = p

Varianza X
2
= V(X) = pq


Distribucin Binomial

La palabra binomial significa que los resultados de una variable aleatoria se pueden agrupar en
dos clases o categoras.

Algunos ejemplos que podemos clasificar como binomiales son: (a) Respuestas de un examen
verdadero-falso (b) productos manufacturados clasificados como defectuosos o no defectuosos,
etc.

Esta distribucin pude abarcar ejemplos donde intervienen variables continuas tales como (a) la
velocidad de un automvil dentro del lmite correcto de velocidad o por encima de dicho lmite
(b) si una persona tiene una estatura mayor de 1.80 o no, etc.

La distribucin binomial sirve para determinar la probabilidad de obtener cierto nmero de
resultados satisfactorios en un nmero dado de observaciones.
92

Es aplicable cuando las condiciones del experimento son las siguientes:

a- Se efectuan n pruebas repetidas, es decir, el experimento se repite n veces bajo las mismas
condiciones. n es constante.
b- Las n pruebas son independientes: el resultado en una prueba no afecta ni es afectado por
el resultado en las dems.
c- En cada prueba hay 2 resultados posibles: Exito o Fracaso.
d- La probabilidad de xito p y de fracaso q, se mantienen constantes para todas las
observaciones. Adems, q = 1-p
e- La variable estudiada es:
X= Nmero de xitos que pueden obtenerse en las n pruebas

Espectro de X = (0, 1, 2, 3, . . . , n)

Para obtener las probabilidades de una variable aleatoria discreta, que est distribuida
binomalmente, se requiere el uso de tablas o utilizar la frmula siguiente:

donde:
n= nmero de observaciones o de ensayos
x= nmero de xitos
p= probabilidad de xito en cada observacin
q= probabilidad de fracaso en cada observacin.

media = E (X) = np

Varianza X
2
= V(X) = npq

Distribucin Hipergeomtrica

Cuando se tiene una variable aleatoria discreta que toma solo dos posibles valores digamos
[xito, fracaso], y se realiza un muestreo sin reemplazo, entonces los resultados de cada
experimento no son independientes ni la probabilidad de xito permanece constante, como en la
distribucin binomial, por lo que esta ltima no es aplicable.
Sea la variable aleatoria nmero de xitos observados al repetir n veces el
experimento consistente en extraer, sin reemplazo, elementos de un lote que tine N objetos de
los cuales M son xitos y por tanto N-M son fracasos.


93
E (X) = n M
N


Distribucin Multinomial.

El experimento multinomial es una generalizacin del experimento binomial, y tiene las
siguientes caractersticas:

1. El experimento consiste en n pruebas idnticas.

2. El resultado de cada prueba cae en una de k clases o casillas.

3. La probabilidad de que el resultado de una sola prueba se localice en una casilla particular,
digamos casilla i, es p
i
(I=1, 2, , k) y permanece igual de prueba en prueba. Ntese que:

p
1
+p
2
+p
3
++p
k
=1

4. Las pruebas son independientes.

5. Las variables aleatorias son Y
1
, Y
2
,,Y
k
, en donde Yi(I=1, 2, , k) es igual al nmero de
pruebas en las cuales el resultado cae en la casilla i. Obsrvese que
Y
1
+ Y
2
+Y
3
++Y
k
=n

Se dice que las variables aleatorias Y
1
, Y
2
,,Y
k
tiene una distribucin multinomial con
parmetro n y p
1
, p
2
, ,p
k
si la funcin de probabilidad conjunta para Y
1
, Y
2
,,Y
k
est dada
por
p y
1
, y
2
,...,y
k
( )=
n!
y
1
!y
2
!...y
k
!
p
1
y
1
p
2
y
2
...p
k
y
k

En donde y
i
= n
i=1
k



E(Y
i
)=np
I
y V(Y
i
)=np
I
q
I



Distribucin de Poisson

Esta distribucin se utiliza para describir las probabilidades con respecto a un intervalo de
tiempo o espacio. Algunas variables que pueden ser representadas por la distribucin poisson
son:

a- Defectos por cm
2

b- Accidentes por da
94
c- Clientes por hora
d- Llamadas por minuto, etc.

Se debe observar que la unidad de medicin (por ejemplo, tiempo, rea, etc) es continua, pero
la variable aleatoria, el nmero de acontecimientos es discreta.
Para usar una distribucin de Poisson debemos considerar lo siguiente:

a- La probabilidad de un acontecimiento u ocurrencia es la misma a travs de todo el campo
de observacin.
b- La probabilidad de ms de un acontecimiento en cualquier punto nico es
aproximadamente cero.
c- El nmero de ocurrencia en cualquier intervalo es independiente del nmero de
acontecimientos en otros intervalos.

La distribucin de Poisson se puede determinar por medio de tablas o por la siguiente
frmula

E ( ) =

V ( ) =

donde
X = promedio de sucesos en un tiempo determinado
e = base de los logaritmos naturales = 2.71828
x = nmero de ocurrencias

Distribucin Geomtrica.

La distribucin geomtrica se relaciona con una secuencia de ensayos Bernoulli donde la
variable de inters se define como el nmero de ensayos requeridos para alcanzar el primer
xito.

=

caso otro 0
1,2... = x
) (
1
p q
x f
x
x


( )
2
2
1
1
2 2
1
1
1
1
p
q
p
p q x
p
p q x x E
x
x
x
x
=
|
|
.
|

\
|
=
= =

o


Distribucin de Pascal.

95
Es una extensin de la distribucin geomtrica. En este caso la variable aleatoria X representa
nmero de ensayos hasta el rsimo xito donde r es un entero.
f
x
x ( ) =
x 1
r 1
|
\

|
.
p
r
q
xr
x = r, r +1, ...
0 otro caso





E x ( )=
r
p
o
2
=
rq
p
2


Ejemplos de distribuciones para una Variable Aleatoria Discreta

Ejemplo 1:

Sea el experimento de lanzar una moneda. Aplicar la distribucin Bernoulli para describirlo.

Solucin:

La probabilidad de obtener soles, lo que se puede llamar un xito es = 0.5 y la de obtener
guilas, que se puede llamar un fracaso, es de = 0.5. Si consideramos al contrario no hay
problema puesto que ambos eventos son complementos.

= p = 0.5

2
= (0.5) (0.5) = 0.25
= 0.25 = 0.50

Ejemplo 2:

Supngase que el 80% de las familias de una ciudad son propietarios de sus hogares. Sea X la
variable aleatoria que toma el valor de 1 cuando la familia elegida al azar en la ciudad es
propietaria y 0 cuando no lo es. Hallar la media y la varianza de X.

Solucin:

p = 0.80 q = 1 p = 1 0.80 =0.20
= p = 0.80

2
= (0.8) (0.2) = 0.16

Ejemplo 3:

En un sanatorio se dice que cierta vacuna contra el resfriado es 70% eficaz, esto es, que de 100
personas que reciben la vacuna, 70 pasarn el invierno sin resfriado. Sea X la variable aleatoria
de Bernoulli en este ejemplo. Hallar la media y la varianza de X.

Solucin:
96

p = 0.70 q = 0.30
= p = 0.70

2
= (0.7) (0.3) = 0.21

Ejemplo 4:

Hallar B(2; 7, )

Solucin:

( )
x n x n
x
q p p n x B

= ) , ; (
x = nmero de xitos esperados = 2
n = nmero de pruebas repetidas = 7
p = probabilidad de xito =
q = 1- p probabilidad de fracaso = 1 =

Sustituyendo,
( )
128
21
32
1
4
1
1 * 2
6 * 7
2
1
2
1
2
1
, 7 ; 2
5 2
7
2
= |
.
|

\
|
|
.
|

\
|
= |
.
|

\
|
|
.
|

\
|
= |
.
|

\
|
B

Ejemplo 5:

Determinar la probabilidad de obtener exactamente dos soles en seis lanzamientos de una
moneda.

Solucin:

p = q =
n = 6
x = 2

64
15
64
1
*
2
30
2
1
2
1
1 * 2
5 * 6
) 2 (
4 2
= = |
.
|

\
|
|
.
|

\
|
= = X P

Ejemplo 6:

La probabilidad de que un estudiante conteste un examen es 0.4
Supongamos que el examen tiene que ser contestado por dos estudiantes cuyas decisiones de
contestar son independientes. Por medio de la frmula para la distribucin binomial, construir
la distribucin de probabilidad del nmero de personas que estarn dispuestas a contestar el
examen.

Solucin:

p = .4 q = 1 p = 1 -0.4 = 0.6
97
n = 2 Espectro de X = ( 0, 1, 2)

x f(x)
0 ( )
2 0 2 0 2
0
) 6 . 0 ( ) 6 . 0 ( ) 4 . 0 ( ) 0 ( = = =

X P = 0.36
1 ( ) ) 6 . 0 )( 4 . 0 ( 2 ) 6 . 0 ( ) 4 . 0 ( ) 1 (
1 2 1 2
1
= = =

X P = 0.48
2 ( )
2 2 2 2 2
2
) 4 . 0 ( ) 6 . 0 ( ) 4 . 0 ( ) 2 ( = = =

X P = 0.16
1.00

La probabilidad de que nadie conteste es 0.36
La probabilidad de que uno conteste es 0.48
La probabilidad de que dos contesten es 0.16

Ejemplo 7:

La probabilidad de que un egresado obtenga su grado de estudios en una escuela superior es
0.4. Determinar la probabilidad considerando a otros cinco egresados ms que acaban de
terminar su ciclo de estudios.
a) Ninguno obtenga el grado
b) Uno si obtenga el grado
c) Al menos uno obtenga el grado

Solucin:

a) P (ninguno se grade) =
5
C
0
(0.4)
0
(0.6)
5
= 0.08
b) P (1 se grade) =
5
C
1
(0.4)
1
(0.6)
4
= 0.26
c) P (al menos 1 se grade) = 1 P (ninguno) = 1 0.08 = 0.92

Ejemplo 8:

El equipo de futbol Atlas tiene
2
/
5
de probabilidad de ganar cuando juega. Si realiza cuatro
partidos, hallar la probabilidad de que el equipo Atlas
a) Gane 2 partidos
b) Gane por lo menos un partido
c) Gane ms de la mitad de los partidos

Solucin:

a) Gane 2 partidos
( )
625
216
1250
432
25
9
25
4
1 * 2
3 * 4
5
3
5
2
) 2 (
2 2
4
2
= = |
.
|

\
|
|
.
|

\
|
= |
.
|

\
|
|
.
|

\
|
= P

b) Gane por lo menos un partido

625
81
5
3
4
4
= |
.
|

\
|
= q = Probabilidad de que pierda todos los partidos.
La probabilidad pedida es 1 q
4
, esto es:
98

625
544
625
81
625
625
1
4
= = q

c) P (de 3 victorias) + P ( 4 victorias)
( ) ( )
625
112
625
16
625
96
625
16
24
24
5
3
125
8
1 * 2 * 3
2 * 3 * 4
5
2
5
3
5
2
5
2
, 4 ; 4
5
2
, 4 ; 3
4
4
4
3
4
3
= + = + = |
.
|

\
|
+ |
.
|

\
|
|
.
|

\
|
= |
.
|

\
|
+ |
.
|

\
|
B B

Ejemplo 9:

Sea X el nmero de soles obtenidos en seis lanzamientos de una moneda. Hallar la media y la
desviacin estndar de X.

Solucin
n = 6 p = 0.5 q = 0.5
= np = 6 (0.5) = 3

2
= npq = 6 (0.5) (0.5) = 1.5
= 5 . 1 = 1.22

Ejemplo 10:

Si la probabilidad de un remache defectuoso es 0.1 hallar, a) la media, b) la desviacin estndar
para la distribucin de remaches defectuosos de un total de 400.

Solucin:
a) = np = 400 (0.1) = 40 Se espera tener 40 remaches defectuosos
b)
2
= npq = 400 (0.1) (0.9) = 36
c) = 36 = 6

Ejemplo 11:

En la distribucin de Poisson p(x; ) hallar p (3;1)

Solucin:
0613 . 0
6
368 . 0
6 ! 3
1
) 1 ; 3 ( ) ; (
1 1 3
= = = = =

e e
p x p

Ejemplo 12:

Mediante un proceso mecnico se producen alfombras de fina calidad que presentan tan slo un
promedio de dos defectos por metro. Determinar la probabilidad de que en un metro cuadrado
tenga exactamente un defecto, suponiendo que el proceso puede ser aproximado mediante una
distribucin de Poisson.

Solucin:
= 2
99
e
-2
= 0.135 (Tablas)
270 . 0
1
) 2 ( 135 . 0
! 1
) 2 (
) 1 (
1 2
= = = =

e
x p

Ejemplo 13:

Supongamos que en el puerto de Acapulco arriban a razn de = 2 barcos/hora y que esta
proporcin esta aproximada mediante la distribucin de Poisson. Si se observa este proceso
durante un perodo de media hora (t= ) encuentre la probabilidad de que a) No arribe ningn
barco, b) Arriben 3 barcos.

Solucin

Primero deterinamos el valor de la media.

= t = 2(1/2) = 1
e
-1
= 0.368
a) 368 . 0
! 0
) 1 (
) 0 (
0 1
= = =

e
x P

b) 061 . 0
6
368 . 0
! 3
) 1 (
) 3 (
3 1
= = = =

e
x P

Ejemplo 14:

Obtener la probabilidad de encontrar 4 artculos defectuosos de una muestra de 300 tomada de
un enorme lote, en el que se dice que hay un 2% de artculos defectuosos.

Solucin:

Si empleamos la distribucin binomial se sigue el desarrollo de:

( )
296 4 300
4
) 98 . 0 ( ) 02 . 0 ( ) 4 ( = = x P

Podemos determinar p(x=4) mediante la distribucin de Poisson con = np. As:

= np = 300(0.02) = 6
135 . 0
! 4
6
) 4 (
6 4
= = =

e
x P

En resumen: cuando n sea grande y est cerca de 0 o 1.00 es adecuado utilizar esta
aproximacin, puesto que la exactitud obtenida de esta manera vara muy poco de la obtenida
por la distribucin binomial y adems evitamos realizar demasiadas operaciones.


100

Ejemplo 15:

Supngase que en un poblacin de 50,000 habitantes existe un promedio anual de 2 suicidas.
Para una poblacin de 100,000 hallar la probabilidad de que en un ao dado exista, a) 0 b) 1
c) 2 y d) 2 o ms suicidas.

Solucin:

n = 100,000
p =
2
/
50000
= 0.00004
= np = (100000)(0.00004) = 4

a) 0183 . 0
1
0183 . 0
! 0
4
) 0 (
4 0
= = = =

e
x p

b) 0732 . 0
1
) 0183 . 0 )( 4 (
! 1
4
) 1 (
4 1
= = = =

e
x p

c) 1464 . 0
2
) 0183 . 0 )( 16 (
! 2
4
) 2 (
4 2
= = = =

e
x p

d) 909 . 0 0915 . 0 1 ] 0732 . 0 0183 . 0 [ 1 )] 1 ( ) 0 ( [ 1 ) 2 ( = = + = + = > p p x p

Ejemplo 16:

En una zona de Veracruz, la probabilidad de que una tormenta fuerte ocurra en un da
cualquiera durante el invierno entre enero y febrero es igual a 0.1. Considerando que un da es
independiente de cualquier otro cul es la probabilidad de que la primera tormenta ocurra el 3
de febrero?

Solucin:

Consideremos que el mes de enero cuenta con 31 das. Por consiguiente si X es el nmero de
das empezando el 1 de enero al 3 de febrero se tiene que x=34.
En consecuencia:

f(x) = q
x-1
p = (0.9)
33
(0.1) = 0.003

33 das no sucede nada y en el 34 hay una tormenta.

Ejemplo 17:

En un entrenamiento de bsquetbol, un jugador se dispone a ejecutar unos tiros libres hasta
anotar una canasta. Supongamos que los tiros son independientes y que su probabilidad
101
constante de anotar cada canasta es de 0.8 y considerando que X = nmero de tiros que efecta
hasta anotar una canasta. Determinar:
a) Cul es la probabilidad de que necesite a lo ms 4 tiros para anotar una canasta?
b) Cul es la probabilidad de que necesite al menos 5 tiros para anotar?
c) En general cul es el nmero de tiros que debemos esperar para que anote?
d) Qu tan dispersos estn los valores alrededor de la media?

Solucin:

p = 0.80 q = 0.20

a) P [x 4] = F(x=4) = 0.8 [q
1-1
+q
2-1
+q
3-1
+q
4-1
] = 0.8 [1+q+q
2
+q
3
]
= 0.8 [1+ 0.2+ (0.2)
2
+ (0.2)
3
] = 0.8 (1.2+ 0.04+ 0.008)
= 0.8 (1.248) = 0.9984
P [x 4] = 99.84 %

b) P [x 5] = f (5) + f (6) + . + f (n)
= 1 F(x = 4) = 1 0.9984 = 0.0016
= 0.16 %

c) 25 . 1
8 . 0
1 1
) ( = = = =
p
X E

d) 31 . 0
64 . 0
2 . 0
) 8 . 0 (
2 . 0
2 2
2
= = =
p
q
o 56 . 0 31 . 0 = = o
3.2.2 Distribuciones Especiales de Probabilidad para una Variable Aleatoria
Continua.

Distribucin Exponencial

Esta distribucin trata probabilidades acerca de tiempo o distancia entre ocurrencias.

Si el nmero de sucesos que ocurren por unidad de tiempo tienen una distribucin de poisson,
el tiempo que hay entre dos sucesos consecutivos tiene una distribucin exponencial.

Si es muy pequea la probabilidad de que ocurra un evento en un intervalo corto y si la
ocurrencia de tal evento es, estadsticamente independiente respecto a la ocurrencia de otros
eventos, entonces el intervalo de tiempo entre ocurrencias de eventos de este tipo estar
distribuido en forma exponencial.
102

= promedio de sucesos en un tiempo determinado.
Distribucin Uniforme.

Cuando una variable aleatoria toma cualquier valor en un intervalo cerrado continuo entre dos
puntos, de tal manera que ningn valor sea ms probable que otro, entonces las probabilidades
asociadas con la variable aleatoria se pueden describir mediante la distribucin uniforme. En
una grfica, la distribucin uniforme se representa como un rectngulo limitado por los puntos a
y b, los cuales constituyen el intervalo de resultados posibles.

Si X es una variable aleatoria continua uniforme que toma todos los valores en un intervalo
cerrado [ a,b ], en donde a y b son finitos. La funcin de densidad de probabilidad de X est
dada por:


=
2
a b +



2
=
( )
12
a - b
2


Distribucin Normal

Las distribuciones normales ocupan un lugar muy importante tanto en la estadstica terica
como en la aplicada. Lo ms sobresaliente de una distribucin de este tipo es que las
distribuciones de medias muestrales y proporciones de grandes muestras tienden a distribuirse
normalmente, lo que tiene repercusiones importantes en el muestreo.
103

La grfica de una distribucin normal se asemeja mucho a una campana. Por ello es posible
aproximar a este tipo de distribuciones una distribucin de Gauss.

Una caracterstica muy importante es que una distribucin normal es posible especificarla de
manera amplia por medio de dos parmetros: la media y la desviacin estndar. Otro aspecto
interesante es que la probabilidad de que una variable aleatoria tenga un valor entre dos puntos
cualesquiera es igual al rea bajo la curva normal entre esos dos puntos.

Es posible deducir que si una curva normal se puede especificar completamente por su media y
su desviacin estndar, es que el rea bajo la curva entre cualquier punto y la media es una
funcin slo del nmero de desviaciones estndar que el punto dista de la media. Esta es la
clave para calcular probabilidades para la curva normal.

Ahora enlistaremos todas las propiedades importantes que posee la curva normal.

a) Una curva normal tiene forma de campana.
b) Esta curva es simtrica con respecto a la media de la distribucin.
c) Se entiende de - a
d) Cada distribucin normal est completamente especificada por su media y su desviacin
estndar; existe una distribucin normal diferente para cada combinacin de media y
desviacin estndar.
e) El rea total bajo la curva normal es 100% o 1.00
f) El rea bajo la curva entre dos puntos es la probabilidad de que una variable distribuida
normalmente tome un valor entre ellos.
g) La probabilidad de que una variable aleatoria distribuida normalmente sea exactamente
igual a cualquier valor dado es cero. En consecuencia, las probabilidades simpre sern
para un intervalo de valores.

La definicin formal es:

La variable aleatoria X, que asume todos los valores reales, tiene una distribucin normal si su
funcin de densidad de probabilidad es de la forma:

donde = media, = desviacin estndar, = 3.1415, e= 2.7182

Distribucin Normal Estndar

El problema de trabajar con un grupo ilimitado de distribuciones normales se puede evitar
totalmente, si es posible manejar valores relativos en lugar de valores reales. Esto equivale a
utilizar la media como punto de referencia y la desviacin de dicho punto de referenica. Esta
nueva escala recibe el nombre de escala z.
104

La distribucin especial que representa todas las variables aleatorias normales se conoce como
distribucin normal estndar. Es la distribucin de otra variable normal llamada variable z, y
definida como:

o
x
= z
donde:
z = nmero de desviaciones estndar a partir de la media
x = algn valor de inters
= media
= desviacin estndar

La distribucin normal estndar tiene media =0 y desviacin estndar =1


Relacin entre las Distribuciones Binomial y Normal

Si n es grande y ni la probabilidad de xito p o la probabilidad de fracaso q estan muy prximas
a cero, la distribucin binomial puede aproximarse a la normal con variable estandarizada dada
por


Ejemplos de distribuciones especiales de probabilidad para una variable aleatoria continua

Ejemplo1:

Si consideramos un punto al azar dentro de un intervalo [0,2] cul es la probabilidad de que el
punto elegido quede entre 1 y 1.5?

Solucin:

a = 0 b = 2 b a = 2 0 = 2
f(x) = si 0 x 2
f(x) = 0 en cualquier otra parte
4
1
2
1
2
1
) 1 5 . 1 (
2
1
2
1

2
1
) ( ) 5 . 1 1 (
5 . 1
1
5 . 1
1
5 . 1
1
= |
.
|

\
|
|
.
|

\
|
= = = = = s s
} }
x dx dx x f x P

Ejemplo 2:
105

Si consideramos que X tiene una distribucin uniforme en el intervalo [-1,1] determinar la
funcin de densidad de probabilidad f(x) y la probabilidad de las X 0 y de 0 X 0.3

Solucin:
a = -1 b = 1 b a = 1 (-1) = 2
f (x) = si -1 x 1
f (x) = 0 en cualquier otra parte.


2
1
) 1 (
2
1
2
1
2
1
) 0 (
1
0
1
0
= = = = >
}
x dx X P

15 . 0
2
3 . 0
2
1
2
1
) 3 . 0 0 (
3 . 0
0
3 . 0
0
= = = = s s
}
x dx x P

Ejemplo 3:

Se puede suponer que la dureza T de una muestra de acero es una variable aleatoria continua
distribuida uniformemente sobre el intervalo [50,70] de una escala A. Determinar la funcin de
densidad de probabilidad y la probabilidad en el intervalo [60,65]

Solucin:

a = 50 b = 70 b a = 70 50 = 20

f(x) =
1
/
20
si 50 x 70
f(x) = 0 en cualquier otra parte

25 . 0
20
5
20
60
20
65
20 20
1
) 65 60 (
65
60
65
60
= = = = = s s
}
x
dx x P

Ejemplo 4:

Se informa que en Moterrey en un da de invierno la temperatura ms alta diaria vara entre 0
C y 6C segn datos proporcionados por un centro de meteorologa.
a) Si el meterologo quiere minimizar el error en la prediccin qu temperatura deber
predecir?
b) Cul es la probabilidad de que en cualquier da de invierno la temperatura no exceda del
1C?

Solucin:
a = 0 b = 6 b a = 6 0 = 6
f (x) =
1
/
6
si 0 x 6
f (x) = 0 en cualquier otra parte

106
a) 3
2
0 6
2
=
+
=
+
=
b a


b)
6
1
) 1 (
6
1
6
1
6
1
) ( ) 6 0 (
1
0
1
0
1
0
= = = = = s s
} }
x dx dx x f x P

Ejemplo 5:

Sea X una variable aleatoria continua distribuida uniformemente en el intervalo [0, 2]. Hallar
a) La funcin de densidad de probabilidad f(x), b) La funcin de distribucin F(x), c) Media, d)
Varianza, e) La probabilidad de
(

>
2
3t
X P ,
(

s
2
3t
X P ,
(

=
2
3t
X P ,
(

s s
2
3t
t X P
Solucin:

a = 0 b = 2 b a = 2 0 = 2

a) f (x) =
1
/
2
si 0 x 2
f (x) = 0 en cualquier otra parte

b) 0 si x < 0
F (x) =
x
/
2
si 0 x < 2
1 si x 2

c) t
t
=
+
=
+
=
2
2 0
2
b a


d)
3 12
4
12
) 2 (
12
) (
2 2 2 2
2
t t t
o = = =

=
a b


e) % 25 25 . 0
4
1
4
3
1
4
3
1
2
2
3
1
2
3
1
2
3
1
2
3
= = = = = =
|
.
|

\
|
=
(

s =
(

>
t
t
t
t
t t t
F X P X P

% 75 75 . 0
4
3
4
3
2
3
2
3
= = = = |
.
|

\
|
=
(

s
t
t t t
F X P

% 9 . 15 159 . 0
2
1
2
3
2
3
= = = |
.
|

\
|
=
(

=
t
t t
f X P

% 25 25 . 0
4
1
2
1
4
3
2 4
3
) (
2
3
2
3
= = = = = |
.
|

\
|
=
(

s s
t
t
t
t t
t F F X P

107
Si variaramos los smbolos en las otras 3 formas posibles en este ltimo resultado se tendr
siempre 25%

Ejemplo 6:

Supongamos que el tiempo que tardan en recibir su orden despus de hacerla en el restaurante
Alameda promedia 10 minutos. Supongamos tambin que ese tiempo que espera en ser
atendido se distribuye exponencialmente.
a) Calcule la probabilidad de que su tiempo de espera sea mayor a 10 minutos.
b) Obtenga la probabilidad de que su tiempo de espera sea de 10 minutos o menos.
c) Encontrar la probabilidad de que su tiempo de espera sea de tres minutos o menos.

Solucin:

1
= min 1 . 0
10
1 1
por = = =



a) P (X > 10) = 0.1e
-0.1(10)
= 0.1e
-1
= 0.0368

b) P (X 10) = 1 e
-1
= 1 0.368 = 0.632

c) P (X 3) = 1 e
-0.3
= 1 0.741 = 0.259

Ejemplo 7:

Supongamos que un automvil falla un promedio de una vez cada dos aos. Encuentre la
probabilidad de que el automvil no falle durante el siguiente ao.

Solucin:
2
1
=

en consecuencia, 5 . 0
2
1
= =

P (X > 1) = 0.5e
-0.5(1)
= 0.5e
-0.5
= (0.5) (0.607) = 0.3035

Ejemplo 8:

Se ha observado que las fallas mecnicas que suceden en una refinera aparecen como un
proceso de Poisson aproximado con parmetro = hora (1 cada dos horas). Si se llega a la
refinera a las 9 horas del lunes y se representa a X como el tiempo que transcurre desde la
llegada hasta que ocurre la primera falla. Determinar:
a) La funcin de densidad de probabilidad f (x)
b) La probabilidad de que no pasen ms de 4 horas antes de que aparezca la primera falla.
c) La probabilidad de que transcurra al menos una hora antes de que ocurra la primera falla.
d) La probabilidad de que el tiempo para la siguiente falla, sea mayor que el promedio.

Solucin:
108
a)
x
e x f
2
1
2
1
) (

= si x > = 0

f (x) = 0 para cualquier otro valor.

b) P [X < 4] = P [0 X 4] = F(4) = 1 e
-1/2(4)
= 1 e
-2
= 0.8647 = 86.47%

c) P [X 1] = 1 P[X < 1] = 1 F(1) =1 (1 e
-1/2(1)
) = e
-1/2
= 0.6065 = 60.65%
d)
% 8 . 36 3680 . 1 1
1 1 ) 2 ( 1 ] 2 [ 1 ] 2 [
2
1
1 1
] [
1
) 2 (
2
1
= = + =
(

= = s = > =
(
(
(
(

> =
(

> = >

e
e F X P X P X P X P X P



Ejemplo 9:

Supongamos que X es una variable aleatoria con distribucin normal estndar. Determinar P (-
0.81 X 1.13)

Solucin:

P (-0.81 X 0) + P(0 X 1.13) = 0.2910 + 0.3708 =0.6618
Para obtener los valores anteriores se utilizaron tablas.

Ejemplo 10:

Supongamos que X es un avaiable aleatoria con distribucin normal estndar. Determinar P
(0.53 X 2.03)

Solucin:
P (0 X 2.03) - P (0 X 0.53) = .4788 - .2019 = 0.2769

Ejemplo 11:
Sea una variable aleatoria con distribucin normal estndar. Determinar
|
.
|

\
|
s
4
1
X P
Solucin:

P (|X| 0.25) = P(-.25 X .25) = 2 P(0 X .25) = 2 (0.0987) = 0.1974

Ejemplo 12:

En un examen final de Administracin Industrial la media fue 72 y la desviacin estndar fue
15. Determinar las referencias estandarizadas (esto es, graduaciones en unidades de desviacin
estndar) de los estudiantes que obtuvieron puntuaciones de a) 93 b) 60 c) 72

109
Solucin:
a) 4 . 1
15
72 93
=

=
o
x
Z

b) 8 . 0
15
72 60
=

= Z

c) 0
15
72 72
=

= Z

FUNCION DE DISTRIBUCIN ESTANDAR

La funcin de distribucin normal F (x) se puede estandarizar sustituyendo el valor de z.
Recuerde que esto se hizo para la funcin de densidad de probabilidad f(x). Cuando
necesitemos en los ejemplos la funcin de distribucin normal estndar la representaremos por
dv e Z
Z v
}

= u
2
2
1
2
1
) (
t
con = 0 = 1

Debido a que no es fcil calcular esta integral, los valores que utilizaremos los obtendremos de
las tablas.
Notar que
|
.
|

\
|
u = u =
o
x
z x F ) ( ) (
Emplearemos lo anterior en los siguientes ejemplos.

Ejemplo 13:

Sea X una variable aleatoria normal con media = 100 y varianza
2
= 36. Determinar:
a) P [X > 110]
b) P [X < 105]
c) P [90 < X < 110]

Solucin:
= 100
2
= 36 = 6
|
.
|

\
|
u =
o
x
x F ) (

a) = u = |
.
|

\
|
u = |
.
|

\
|
u = = s = > ) 66 . 1 ( 1
6
10
1
6
100 110
1 ) 110 ( 1 ] 110 [ 1 ] 110 [ F X P X P

Buscamos el valor anterior en tablas
= 1 - .9515 = 0.0485 = 4.85%

b) % 67 . 79 7967 . ) 8333 (.
6
5
6
100 105
) 105 ( ] 105 [ ] 105 [ = = u = |
.
|

\
|
u = |
.
|

\
|
u = = s = < F X P X P

110

c)
% 31 . 90 9031 . ) 666 . 1 (
6
10
6
10
6
10
6
100 90
6
100 110
) 90 ( ) 110 ( ] 90 [ ] 110 [ ] 110 90 [
= = = |
.
|

\
|
= |
.
|

\
|
u |
.
|

\
|
u =
= |
.
|

\
|
u |
.
|

\
|
u = = < < = < <
D D
F F X P X P X P


Observacin importante. En este inciso se consider la propiedad siguiente:

(z) (-z) = D(z)

Los valores se obtienen directamente de una tabla.

Ejemplo 14:

Despus de un curado de 28 das el cemento Cruz Azul comn tiene una resistencia promedio
de 4000 lb/plg
2
. Supongamos que esta resistencia a la comprensin est distribuida
normalmente con una desviacin estndar de 120 lb/plg
2
. Hallar las siguientes probabilidades
respecto a la resistencia a la comprensin de 28 das. a) Menor que 3900, b) Menor que 3850,
c) Mayor que 3850

Solucin:

= 4000 lb/plg
2
= 120 lb/plg
2


a) % 33 . 20 2033 . 0 ) 833 . (
120
100
120
4000 3900
) 3900 ( ] 3900 [ = = u = |
.
|

\
|
u = |
.
|

\
|
u = = < F X P

b) % 56 . 10 1056 . ) 25 . 1 (
120
150
120
4000 3850
) 3850 ( ] 3850 [ = = u = |
.
|

\
|
u = |
.
|

\
|
u = = < F X P

c) P[X>3850]= 1P[X 3850]= 1F(3850)= 1(-1.25)= 1-.1056= .8944 = 89.44%

Ejemplo 15:

Un fabricante de sobres de correo sabe por experiencia que el peso de los sobres est
distribuido normalmente con media igual a = 1.95 gr. y desviacin estndar igual a = 0.05
gr. Al rededorde cuantos sobres que pesan 2 gr o ms se pueden encontrar en un paquete de
200 sobres?

Solucin
% 87 . 15 1587 . 8413 . 1 ) 1 ( 1
05 .
05 .
1
05 . 0
95 . 1 2
1 ) 2 ( 1 ] 2 [ 1 ] 2 [ = = = u = |
.
|

\
|
u = |
.
|

\
|
u = = s = > F X P X P

La poblacin es de 200 sobres, por lo tanto, 32 sobres sobrepasan los 2 gr.

111
Ejemplo 16:

Una moneda se lanza 10 veces. Hallar la probabilidad de obtener 4 y 7 soles inclusive, usando
la aproximacin normal a la distribucin binomial.

Solucin:

X= nmero de soles que salen.
Deseamos hallar P(4 X 7). Si el dato es continuo tenemos que determinar:

P[3.5 X 7.5]

npq
np x x
Z

=

=
o



= np = 10(1/2) = 5

58 . 1 ) 5 . 0 )( 5 . 0 ( 10 = = = npq o

949 . 0
58 . 1
5 5 . 3
=

= Z

5822 . 1
58 . 1
5 5 . 7
=

= Z

P[3.5X7.5] = P[-0.949Z1.5822] = P[0Z1.58] + P[0Z0.949] = 0.7718 = 77.18%




















112







C Ca ap p t tu ul lo o I IV V
Distribucines Muestrales

La parte de la estadstica que proporciona las reglas para inferir ciertas caractersticas de una
poblacin a partir de muestras extradas de ellas, junto con indicaciones probabilsticas de la
veracidad de tales inferencias, se llama inferencia estadstica.

En la inferencia estadstica se estudian las relaciones existentes entre una poblacin, las
muestras obtenidas de ella, y las tcnicas para estimar parmetros, tales como la media,
varianza, proporcin, o bien para determinar si las diferencias entre dos muestras son debidas al
azar, etc.

Surgen en este momento varios conceptos importantes:

PARAMETRO Es una medida descriptiva numrica obtenida de la poblacin.
ESTADISTICO Es una medida descriptiva numrica obtenida de la muestra.
MUESTRA AL AZAR Es aquella cuyas n observaciones son variables aleatorias
independientes cada una de las cuales es una reproduccin de la
poblacin a la que pertenecen.

La nocin de que las observaciones de una muestra son variables aleatorias, nos conduce a la
conclusin de que cualquier cantidad calculada de observaciones muestrales debe ser una
variable aleatoria. Es decir, el estadstico es una variable aleatoria y por tanto, tiene una
distribucin de probabilidad propia llamada distribucin por muestreo.

4.1 Distribucin Muestral Del Promedio Aritmtico.

Supngase que se extrae una muestra al azar de tamao n con reposicin de una poblacin con
media y varianza
2
.

x = ( x
1
+ x
2
+ . . . + x
n
)
n
Ser una variable aleatoria ya que se obtiene de observaciones muestrales que son variables
aleatorias independientes e indenticamente distribuidas, entonces, es posible demostrar que se
cumplen las siguientes ecuaciones:

x

=

o
x
=
o
n

113
Observe que cuando n tiende a infinito
x
tiende a cero. Es decir, cuanto mayor es la muestra,
tanto menor es la fluctuacin de las medias de la muestra de una muestra a otra.

Si se toman muestras de una poblacin finita, sin reposicin, debe introducirse un factor de
correccin para calcular la desviacin estndar de la media.



Cuando la poblacin progenitora es normal, la distribucin de la media muestral es tambin
normal, por pequea que sea la muestra.
Si la distribucin de la poblacin no es normal, se aproxima la distribucin
normal estndar cuando n es grande (n > 30) basndose para ello en el teorema de lmite
central.

4.2 Distribucin Muestral de la Diferencia de dos Medias

En muchas ocasiones deseamos comparar las medias de dos variables aleatorias, por ejemplo,
mtodos de produccin, tiempos de ejecucin, etc. La comparacin puede hacerse sobre la base
de dos muestras al azar e independientes; una de tamao n
1
extraida de una poblacin con
media
1
y varianza
1
2
. Otra con tamao n
2
extraida de otra poblacin con media
2
y
varianza
2
2
(hay muestras dependientes cuya diferencia no puede ser analizada por este
mtodo).

Si
1
x y
2
x son las dos medias de las muestras, al ser variables aleatorias hacen que (
1
x -
2
x )
sea una variable aleatoria. Se puede demostrar que la distribucin muestral de la diferencia de
los promedios correspondientes a poblaciones infinitas con medias
1
y
2
y desviaciones
estndar
1
y
2
, es:



Esta distribucin tambin es aplicable a poblaciones finitas si el muestreo es con reemplazo.
Para el caso de poblaciones finitas en las cuales el muestreo se hace sin remplazo, los
parmetros de la distribucin muestral de la diferencia de los promedios aritmticos son:

114

Si n
1
y n
2
son suficientemente grandes, la diferencia (
1
x -
2
x ) estar normalmente distribuida
(teorema central del lmite).

Si las poblaciones son normales, (
1
x -
2
x ) es una variable aleatoria normal sin importar los
tamaos de n
1
y de n
2
.

4.3 Distribucin Muestral de la Proporcin

No siempre se trabaja con medias. Se puede extraer una muestra al azar de tamao n con
reposicin de una poblacin con el objeto de estudiar la proporcin de elementos que tienen
una caracterstica particular entre el total.

Sea

p = Proporcin de elementos que tienen cierta caracterstica en la
muestra.
x= Total de elementos que poseen la caracterstica en la muestra.
n= Tamao de la muestra.



p =
n
x

pero x ~ b (np, npq)
por tanto, p tendr una distribucin binomial con media y varianza dadas por:

Si el muestreo se hace sin reposicin, la distribucin por muestreo de p obedece la ley de
probabilidad hipergeomtrica. En este caso,


115
La aproximacin normal de las probabilidades binomiales funciona bien aun cuando n no sea
muy grande, en tanto que p no est demasiado cerca de cero o de uno. Una regla emprica til
es que la aproximacin normal de la distribucin binomial es apropiada cuando (

p + 2 pq/n)
est dentro del intervalo (0, 1).

Si la muestra es pequea pueden obtenerse aproximaciones normales satisfactorias
introduciendo un factor de correccin por continuidad dado por 1/2n (se emplea 1/2n en lugar
de 1/2 porque la propocin es nmero de xitos dividido entre n).

4.4 Distribucin de la Diferencia de dos Proporciones

Si se extraen dos muestras al azar independientes, la primera de tamao n
1
con

p
1
= x
1
/n
1
y la
segunda de tamao n
2
con

p
2
= x
2
/n
2
, entonces es posible demostrar que se cumplen las
siguientes ecuaciones:


Ignorando cualquier factor de correccin por poblacin finita. Adems, si n
1
y n
2
son
suficientemente grandes, la distribucin

p
1
-

p
2
es aproximadamente normal.





















116
C Ca ap p t tu ul lo o V V
Teora Estadstica de la Estimacin.

En la prctica profesional a menudo resulta necesario inferir informacin acerca de una
poblacin mediante el uso de muestras extradas de ella; una parte bsica de dicha inferencia
consiste en estimar los valores de los parmetros de la poblacin (media, variancia, etc.) a
partir de las estadsticas correspondientes de la muestra, como se explica a continuacin:

5.1 Estimadores puntuales. Clasificacin.

Si un estimador de un parmetro de la poblacin consiste en un solo valor de un estadstico se
le conoce como estimador puntual del parmetro.

Cuando la media de la distribucin muestral de un estadstico es igual al parmetro que se est
estimando de la poblacin, entonces el estadstico se conoce como estimador insesgado del
parmetro; si no sucede as, entonces se denomina estimador sesgado. Ambos estimadores son
puntuales, y sus valores correspondientes se llaman estimaciones insesgadas o sesgadas,
respectivamente.

Dicho de otra manera, si

u es un estadstico cuya distribucin muestral tiene media
u
y el
parmetro correspondiente de la poblacin, es u, se dice que

u es un estimador insesgado de u
si,

u
=u
Por otra parte, si el estadstico

u
n
de la muestra tiende a ser igual al parmetro u de la
poblacin a medida que se hace ms grande el tamao de la muestra, entonces el estadstico
recibe el nombre de estimador consistente del parmetro.

Empleando smbolos, si
Lim

u
n
= u
n =
Resulta que el estadstico

u
n
es un estimador consistente.

Por ejemplo, el promedio aritmtico es un estimador insesgado y consistente de la media, y la
variancia de la muestra es un estimador sesgado y consistente de la varianza de la poblacin.

Si las distribuciones muestrales de varios estadsticos tienen el mismo valor de la media, se dice
que el estadstico que cuenta con la menor varianza es un estimador eficiente de dicha media,
en tanto que los estadsticos restante se conocen como estimadores ineficientes del parmetro.

Por ejemplo, las distribuciones muestrales del promedio aritmtico y de la mediana cuentan con
medias que son, en ambos casos, iguales a la media de la poblacin. Sin embargo, la varianza
de la distribucin muestral del promedio aritmtico es menor que de la de la distribucin de la
mediana, por lo que el promedio aritmtico obtenido de una muestra aleatoria proporciona un
117
estimador eficiente de la media de la poblacin, en tanto que la mediana obtenida de la muestra
proporciona un estimador ineficiente de dicho parmetro.

5.2 Estimacin de Intervalos de Confianza para los Parmetros de una Poblacin.

La estimacin de un parmetro de una poblacin mediante un par de nmeros entre los cuales
se encuentra, con cierta probabilidad, el valor de dicho parmetro, se llama estimacin del
intervalo del mismo.

Sea

u un estadstico obtenido de una muestra de tamao n para estimar el valor del parmetro
, y sea

la desviacin estndar (conocida o no) de su distribucin. La probabilidad de 1-


que el valor de se localice en el intervalo de

u - z
c


u

a

u + z
c


u , donde z
c
es una
contante, se escribe en la forma:



Si se fija el valor de 1-, se puede obtener el valor de z
c
nececesario para que se satisfaga, la
ecuacin anterior, con lo cual queda definido el intervalo de confianza del parmetro , (

u - z
c


u
,


u + z
c



u

), correspondiente al nivel de confianza 1- .

La constante z
c
que fija el intervalo de confianza se conoce como valor crtico. Si la
distribucin de

u es normal, el valor de z
c
correspondiente a un valor de se obtiene de la tabla
de reas bajo la curva normal o de la tabla 5.1 siguiente.

Tabla 5.1 Valores de z
c
para Distintos Niveles de Confianza.
________________________________________________________
Niveles de confianza, en porcentaje z
c

________________________________________________________
99.73 3.00
99.00 2.58
98.00 2.33
96.00 2.05
95.45 2.00
95.00 1.96
90.00 1.64
80.00 1.28
68.27 1.00
50.00 0.674______

Ejemplo:

Sea el promedio aritmtico X una estadstica con distribucin normal. Las probabilidades o
niveles de confianza de que de la poblacin se encuentre localizada entre los lmites X +
x
,
X + 2
x
y X + 3
x
son 68.26, 95.44 y 99.73%, respectivamente, obtenindose dichos valores
de la tabla de reas bajo la curva normal. Lo anterior significa que el intervalo X + 3
x
| | 1

Z -

P
C C
= + s s
118
contendr a en el 99.73 por ciento de las muestras de tamao n, por lo que los intervalos de
confianza de 68.26, 95.44 y 99.73 por ciento para estimar a son ( X - o
x
, X + o
x
) ( X - 2
o
x
, X + 2 o
x
) y ( X - 3 o
x
, X + 3 o
x
), lo cual se aprecia en la figura 5.1 siguiente.




Figura 5.1

5.2.1 Estimacin de Intervalos de Confianza para la Media.

a- Para los siguientes casos: -Poblacin Normal
2
conocida

-Tamao de muestra > 30 (
2
conocido o desconocido)
Los lmites de confianza para la media de una poblacin estn dados por:

X + z
c
o
x

en donde z
c
depende del nivel de confianza deseado. Puede obtenerse en forma directa de la
tabla 5.1. Por ejemplo, los lmites de confianza de 95 y 99 por ciento para estimar la media, ,
de la poblacin son X + 1.96 o
x

y X + 2.58 o
x
, respectivamente. Al obtener estos lmites
hay que usar el valor calculado de X para la muestra correspondiente.

Si se desconoce se estima su valor mediante el estadstico s.

Entonces, los lmites de confianza para la media de la poblacin quedan dados por:


119

En caso de que el muestreo se haga a partir de una poblacin infinita o de que se efecte con
remplazo a partir de una poblacin finita, o por:

Si el muestreo es sin remplazo a partir de una poblacin finita de tamao N.

Ejemplo:

Las condiciones de los dimetros de una muestra aleatoria de 100 tubos de albail mostraron
una media de 32cm y una desviacin estndar de 2cm. Obtngase los lmites de confianza de:

a. 95 por ciento
b. 97 por ciento

para el dimetro medio de todos los tubos.

a. De la tabla 5.1, los lmites de confianza del 95 por ciento son:



Esto significa que con una probabilidad de 95 por ciento, el valor de se encuentra
entre 31.608 y 32.392cm.

b. Si Z = z
c
es tal que el rea bajo la curva normal a la derecha de z
c
es el 1.5 por ciento del
rea total, entonces el rea entre 0 y z
c
es 0.5 - 0.015 = 0.485, por lo que de la tabla de
reas bajo la curva normal se obtiene z
c
= 2.17. Por lo tanto, los lmites de confianza
del 97 por ciento son:


y el intervalo de confianza respectivo es (31.566 cm, 32.434 cm).

Ejemplo:

Una muestra aleatoria de 50 calificaciones de cierto examen de admisin tiene un promedio
aritmtico de 72 puntos, con desviacin estndar igual a 10. Si el examen se aplic a 1018
personas, obtener:

a. El intervalo de confianza del 95% para la media del total de calificaciones.
b. El tamao de muestra necesario para que el error en la estimacin de la media no
exceda de 2 puntos, considerando el mismo nivel de confianza.
c. El nivel de confianza para el cual la media de la poblacin sea 72 + 1 puntos.
120

Solucin:

a) Si se estima a de la poblacin con s de la muestra y se considera que la poblacin es
finita, los lmites de confianza son, puesto que X = 72, z
c
= 1.96, s = 10, N = 1018 y n=
50,

72 + 1.96 (1.4142) ( 0.9755)

72 + 2.704

y el intervalo de confianza respectivo es:

(69.296, 74.704)

b. Puesto que el error en la estimacin de la media es, para poblacin finita,



o sea, para un nivel de confianza de 95%,


Elevando al cuadrado la desigualdad, queda:


1017
n - 1018
*
n
384.16
<4
121
o sea,
87.85 < n

Por lo cual, se requieren al menos 88 elementos en la muestra para que el error en la estimacin
no exceda de 2 puntos, para:
1- = 0.95.

c. Los lmites de confianza son, en este caso:


72 + Z
c
(1.4142) (0.9755)

72 + 1.3795 Z
c


Puesto que se desea que el valor de la media sea 72 + 1 puntos, se verifica que:

1 = 1.3795 Z
c


Es decir,
Z
c
= 0.725

El rea bajo la curva normal estndar entre 0 y Z
c
= 0.725 es, por interpolacin lineal, igual a
0.2657. Por lo tanto, el nivel de confianza es igual al doble del rea anterior, es decir,
2(0.2657) = 0.5314 (53.14%), tal como se muestra en la figura siguiente:



b. Para el caso de: -Poblacin normal,
2
desconocido y n < 30

Los lmites de confianza para la media de una poblacin estn dados por:

en donde t
c
puede obtenerse de la tabla t de student para el nivel de confianza deseado y un
nmero de grados de libertad igual a n-1
122

Ejemplo:

Con el fin de probar un aditivo para gasolina, se corri un grupo de automviles
cuidadosamente fabricados sobre una pista en condiciones totalmente controladas. El nmero
promedio de kilmetros recorridos con 4 litros de gasolina de 10 automviles fue de 14; y la
desviacin estndar de estos igual a 1.732. Construya un intervalo de confianza para con una
confianza de 95%.

n = 10 X = 14 s = 1.732 1- = 0.95

dado que n < 30 y desconocemos la varianza poblacional, el intervalo de confianza ser:


t
c
se obtiene de la tabla t de student con = n- 1 = 9 1- = 0.95
t
c
= 2.262

El intervalo de confianza es (12.76, 15.24)
5.2.2 Intervalos de Confianza para Diferencias de Medias.

a. Para los siguientes casos:
-n
x
> 30 y n
y
> 30 (
x
y/o
y
conocidas o desconocidas).
o
-Poblacin con distribucin normal,
x
y
y
conocidas.

Los lmites de confianza para la diferencia de las medias cuando las poblaciones X y Y son
infinitas, o cuando el muestreo se realiza con remplazo de poblaciones finitas, se encuentran
dados por

en donde X, n
x
y Y, n
y
son los respectivos promedios aritmticos y tamaos de las dos muestras
extradas de las poblaciones, y
x
y
y
las desviaciones estndar de estas ltimas.

NOTA: Si
x
y/o
y
son desconocidas se pueden utilizar a s
x
y s
y
como sus estimadores.

En el caso de que las poblaciones X y Y sean finitas y el muestreo sin reemplazo, los lmites de
confianza son:
123

en donde N
X
y N
Y
son los tamaos de las poblaciones X y Y, respectivamente.

Las dos ecuaciones anteriores son vlidas nicamente si las muestras aleatorias seleccionadas
son indepedientes.

Ejemplo:

Se tienen en una bodega 3000 focos de marca X, y 5000 de marca Y. Se extrae una muestra
aleatoria de 150 focos de la marca X, y se obtiene una duracin promedio de 1400 horas, con
desviacin estndar igual a 120 horas. Otra muestra aleatoria de 200 focos de la marca Y tuvo
una duracin promedio de 1200 horas, con desviacin estndar igual a 80 horas. Obtener
intervalos de confianza de:

a. 95%
b. 99%

para la diferencia de los tiempos medios de duracin de los focos de ambas marcas.

a. Puesto que se trata de poblaciones finitas y X = 1400 h, s
X
= 120 h, N
X
= 3000, n
X
=
150, Y = 1200 h, s
Y
= 80 h, N
Y
= 5000 y n
Y
= 200, se obtiene, estimando a
x
y
y
con
s
X
y s
Y
, respectivamente.

o sea, (178.362, 221.638), puesto que de la tabla para un nivel de confianza de 95%, Z
c

= 1.96.

b. En este caso, al emplear la tabla se obtiene Z
c
=2 .58 para un nivel de confianza de
99%, por lo cual los lmites son:


200 + 2.58 (11.04)

200 + 28.483

y el intervalo de confianza es:
124

(171.517, 228.483)

b. Para el caso de Poblaciones Normales, muestras pequeas y varianzas desconocidas los
lmites de confianza para la diferencia de las medias se encuentra dado por:

x y
( )
t
c
n
x
1
( )
s
x
2
+ n
y
1
( )
s
y
2
( )
1
n
x
+
1
n
y
|
\

|
.
|
n
x
+ n
y
2


en donde t
c
puede obtenerse de la tabla t de student para el nivel de confianza deseado y un
nmero de grados de libertad igual a n
x
+ n
y
-2.

Ejemplo:

Fueron experimentadas 2 variedades de tomate con respecto a su productividad. El estudio se
efectu en invernaderos en igualdad de condiciones. Se tomaron muestras aleatorias de 10
plantas, obtenindose los siguientes resultados:

X
A
= 1.324 s
A
2
= 0.095 n
A
= 10
X
B
= 1.135 s
B
2
= 0.0987 n
B
= 10

Determine el intervalo de confianza del 99% para la verdadera diferencia entre los pesos
esperados en las dos variedades.

t
c
= 2.88 (obtenido para 1 - = 99% y 18 grados de libertad).


0.189 + 0.401
El intervalo de confianza es (-.0212, 0.59)
5.2.3 Intervalo de Confianza para la Proporcin.

El intervalo de confianza para la proporcin de una poblacin estn dados por:



125
siempre y cuando el muestreo se haga a partir de una poblacin infinita o de que se efecte con
remplazo a partir de una poblacin finita. Como p y q se desconocen, se utiliza
p y
q como sus
estimadores:

donde
n
x
p =

x= total de elementos de la muestra que poseen la caracterstica estudiada.
n= tamao de la muestra.

Si el muestreo es sin remplazo a partir de una poblacin finita de tamao N., el intervalo de
confianza es:



Ejemplo:

En una muestra de 1500 electores tomada al azar entre todos los de un distrito, se encontr que
1050 estn a favor de un solo candidato.

Hallar el intervalo de confianza del 95% para la verdadera proporcin de todos los votantes que
estn a favor del candidato.

El intervalo de confianza es:

donde 7 . 0
1500
1050
p = =

Z
c
= 1.96

el intervalo de confianza es (0.677, 0.723)
5.2.4 Intervalo de Confianza para la Diferencia de Proporciones.

Los lmites de confianza para la diferencia de propociones cuando las poblaciones X y Y son
infinitas, o cuando el muestreo se realiza con reemplazo de poblaciones finitas, se encuentra
dado por:
126

en donde p
x
, n
x
y p
y
, n
y
son la proporcin y tamao de las muestras extradas de las poblaciones
y p
x
y p
y
son las proporciones poblacionales. ( q
x
= 1 - p
x
y q
y
= 1 - p
y
)

NOTA: Dado que p
x
y p
y
se desconocen, se pueden estimar mediante
p
x
y
p
y

respectivamente.

En el caso de que las poblaciones X y Y sean finitas y el muestro sin remplazo, los lmites de
confianza son:

5.2.5 Intervalo de Confianza para la Varianza.

Si se toma una muestra aleatoria de tamao n de una poblacin en la que X est normalmente
distribuida con varianza
x
2
y s
x
2
es la varianza muestral, entonces,
( n -1) s
x
2
tiene una distribucin ji - cuadrada con

x
2

(n -1) grados de libertad. Esto permite calcular el intervalo de confianza para la varianza de la
poblacin.
As, si a y b son los valores de
X2

(n-1)
para los cuales (/2)% del rea bajo la curva cae en los
extremos de la distribucin entonces:



(n -1) S
x
2
s
x
2
s (n-1) S
x
2

b a




127
5.2.6 Intervalo de Confianza para el Cociente de Varianza.

Considrese dos variables aleatorias X y Y independientes y normalmente distribuidas,
supngase que se extraen de estas poblaciones dos muestras aleatorias de tomao n
x
y n
y

repectivamente. Si se designan con s
x
y s
y
a las varianzas muestrales, entonces:

s
x
2

y
2

_______ tiene una distribucin F de Fisher
s
y
2

x
2

con v
1
= n
x
- 1 y v
2 =
n
x
- 1 grados de libertad.
Esto permite calcular e intervalo de confianza para el cociente de varianzas.


y
2

____

x
2


As, si a y b son los valores de F
(n -1, n -1)
para los cuales el ( /2)% del rea bajo la curva cae en
los extremos de la distribucin.














128
C Ca ap p t tu ul lo o V VI I
Hiptesis Estadsticas y Pruebas de Hiptesis.

6.1 Hiptesis Estadstica

Es un supuesto acerca de la distribucin de una variable aleatoria. En la prctica generalmente
se especifica una Hiptesis con el valor o los valores de parmetros y se supone la distribucin
de la poblacin.

6.2 Prueba de Hiptesis.

Es el procedimiento mediante el cual verificamos la veracidad o falsedad de una hiptesis
estadstica.

6.2.1 Componentes de las Pruebas de Hiptesis.

La Prueba de Hiptesis se compone de los siguientes elementos:

-Formulacin de Hiptesis (Hiptesis Nula e Hiptesis Alternativa).
-Estadstico de Prueba.
-Regin de Rechazo.
-Regla de Decisin.

La decisin de aceptar o rechazar la Hiptesis nula se basa en informacin proporcionada por
una muestra de la poblacin en estudio. Esta informacin sirve para determinar un nmero que
funciona como variable de decisin y al que se llama Estadstico de Prueba.

El estadstico de prueba puede tomar uno de muchos valores. El conjunto de todos los posibles
valores que pude tomar este estadstico se divide en dos conjuntos que delimitan 2 regiones
denominadas regin de rechazo y regin de aceptacin. Al punto que separa las dos regiones se
le llama valor crtico. Si el valor del estadstico de prueba cae en la regin de rechazo, la regla
de decisin indica que la hiptesis nula se debe rechazar en favor de la hiptesis alternativa;
mientras que si el estadstico cae en la regin de aceptacin no rechazaremos Ho.

Hay tres tipos principales de pruebas, cada uno de los cuales es identificado por la forma en que
se formulan Ho y H1

1- Prueba de doble cola o dos lados.
Ho: =
o

H1:
o


2- Prueba de cola inferior o cola izquierda.
Ho:
o
Ho: =
o

H1: <
o
H1: <
o


129
3.- Pruebas de cola superior o cola derecha.

Ho:
o
Ho: =
o

H1: >
o
H1: >
o


Debe observarse una precaucin al designar Ho y H1, ya que, Ho y H1 son siempre mutuamente
exclusivas pero no es necesario que aparezcan colectivamente exhaustivas.
6.2.2 Errores de la Prueba de Hiptesis.

Al probar Hiptesis sobre la base de informacin obtenida de muestra conducir a dos tipos
posibles de errores debidos a fluctuaciones al azar en el muestreo.

Error tipo I: es el error que se comete al rechazar Ho cuando debi aceptarse por ser cierta.

La probabilidad de cometer este error se denomina por

Error tipo II: es el error que se comete al aceptar una Hiptesis nula que debi rechazarse por
ser falsa.

A la probabilidad de cometer este error la denotaremos por .

Las relaciones posibles entre la decisin que tomamos en una prueba estadstica y el estado real
de la hiptesis nula se puede resumir en la siguiente tabla.

Hiptesis nula
Decisin Cierta Falsa
___________________________________________________________
Rechazo Ho Error tipo I Decisin
correcta
___________________________________________________________
Aceptar Ho Decisin Error tipo II
Correcta


y estn estrechamente relacionados ya que, si n es fijo, y varan inversamente. Es decir
al alejarnos de un peligro aumenta el otro.



130

6.2.3 Estadsticos de Prueba y Reglas sobre Decisiones.

Como estadstico de prueba es necesario escoger una funcin de las n observaciones de
muestra. En general, el estadstico de prueba debe ser una funcin cuya distribucin por
muestreo sea conocida en el supuesto de que Ho es cierta y generalmente, resultar del
estimador del parmetro previsto en Ho.
6.2.4 Pruebas Estadsticas a una y dos Colas.

Si se plantea
H1:
o


hablaremos de una prueba estadstica a dos colas.

Si se plantea
H1: >
o

hablaremos de una prueba estadstica a una cola (cola derecha) ya que la regin de rechazo se
encontrar en el extremo derecho de la distribucin muestral del estadstico de prueba.

Si se plantea
H1: <
o


hablaremos de una prueba estadstica a una cola (cola izquierda) ya que la regin de rechazo se
encontrar en el extremo izquierdo de la distribucin muestral del estadstico de prueba.

6.2.5 Pruebas Estadsticas Comunes.
6.2.5.1 Prueba de Hiptesis acerca de la Media Poblacional.

a- Formulacin de Hiptesis
Ho: =
o
Ho: =
o
Ho: <
o

H1: =
o
H1: >
o
H1: >
o


Ho: =
o
Ho: >
o

H1: <
o
H1: <
o


I caso
-Poblacin normal
2
conocido

-n > 30 (
2
conocido o desconocido)

Se tiene:
131
b- Estadstico de Prueba.



c- Regin de Rechazo.

1)

2)


3)


Regiones sombreadas son zonas de rechazo.

d- Regla de Decisin

En 1)
Si Z
x
> Z
1-/2
Z
x
< Z
/2
rechace Ho y acepte H1 en caso contrario no rechace Ho.

En 2)
Si Z
x
> Z
1-
rechace Ho y acepte H1 en caso contrario no rechace Ho.

En 3)
Si Z
x
< Z

rechace Ho y acepte H1 en caso contrario no rechace Ho.

e- Decisin.
132

Con el valor de Z
x
determine si acepta Ho o la rechaza.

II caso
Poblacin Normal,
2
desconocido y n < 30 se tiene.

b- Estadstico de Prueba



c- Regin de rechazo.

1)

2)

3)


Regin sombreada es zona de rechazo.

d- Regla de Decisin.

En 1)
Si t
x
> t
1-/2
t
x
< t
/2
rechace Ho y acepte H1 en caso contrario no rechace Ho

En 2)
Si t
x
> t
1-
rechace Ho y acepte H1 en caso contrario acepte Ho.

133
En 3)
Si t
x
< t

rechace Ho y acepte H1 en caso contrario acepte Ho.

e- Decisin

Con el valor de t
x
determine si acepta Ho o lo rechaza.

NOTA: Las dems pruebas siguen el mismo procedimiento; por esta razn, slo se darn los
Estadsticos de Prueba y la distribucin que estos poseen.
6.2.5.2 Prueba de Hiptesis para la Diferencia de Medias.

1 caso
-n
1
> 30 n
2
> 30
x
2
y
y
2
conocidos o desconocidos.

-poblaciones normales
x
2
y
y
2
conocidos.

Estadstico de Prueba.



2 caso
Poblaciones normales, muestras pequeas y se desconocen varianzas poblacionales.


NOTA: Para probar la Hiptesis de igualdad de medias es indispensable saber primero si las
muestras provienen de poblaciones normales con igual varianza mediante una prueba
de Hiptesis.

Ho
x
2
=
y
2

Hi
x
2
=
y
2




134


6.2.5.3 Prueba de Hiptesis para la Proporcin.

Estadstico de Prueba

6.2.5.4 Prueba de Hiptesis para la diferencia de Proporciones.

Estadstico de Prueba

6.2.5.5 Prueba de Hiptesis para la Varianza

Estadstico de Prueba

6.2.5.6 Prueba de Hiptesis para la Relacin de Varianza



Ejemplo:

Para probar si una moneda es homognea se disea la regla de decisin siguiente:

1- Aceptar la Hiptesis de que la moneda es homogenea si al tirar esta 100 veces el nmero
de aguilas cae entre 40 y 60 inclusive.
2- Rechazar la Hiptesis en caso contrario.
Calcular la probabilidad de rechazar la Hiptesis cuando es cierta.

135
Ho: P = 0.5 (probabilidad de que resulte aguila)
H1: P = 0.5 (no es homognea)
= p (error tipo I)
= p (rechazar Ho siendo cierta)
= 1 - p (40 < X < 60)
x = nmero de aguilas en 100 lanzamientos tiene una distribucin binomial que se puede
aproximar a normal.

= np = 100 x 0.5 = 50


= 1 - 2p (0 < Z < 2)
= 1 - 2 (0.4772)
= 0.0456
4.56%

Ejemplo:

Disear una regla de decisin, con un nivel de significacin del 5% para decidir si una moneda
es homogenea en base a una muestra de 50 tiros de la moneda

Ho: p = 0.5 (probabilidad de que resulte guila)
H1: p = 0.5
n=50

x = nmero de aguilas en 50 lanzamientos
x ~ N (np, npq)
np = 50 x 0.5 = 25
npq = 50 x 0.5 x 0.5 = 12.5
npq = 3.536


Estadstico de Prueba

136

Zona de rechazo

Z < -1.96 Z > 1.96 se rechaza Ho

pero, Z = -1.96 implica

96 . 1

- x
=

x = -1.96 +
x = -1.96 (3.536) + 25 = 18.069

y, Z = 1.96 implica

96 . 1

- x
=

x = 1.96 (3.536) + 25 = 31.93

Regla de decisin

Si al lanzar 50 veces la moneda el nmero de aguilas cae entre 18.069 y 31.93 acepte Ho
rechace caso contrario.

Ejemplo:

Con relacin al ejemplo anterior, calcular las probabilidades de aceptar la Hiptesis de que la
moneda es Homognea cuando en realidad p = 0.6, 0.7, 0.8, 0.9

-Representar los resultados grficamente

a- en el ejemplo anterior
Ho p = 0.5
Hi p = 0.5

se fijo en 5%
esta representada grficamente por el rea total sombreda

137

Si en realidad p= 0.6 y x nmero de aguilas en 50 lanzamientos tiene distribucin normal.
= np = 50 x 0.6 = 30

2
= npq = 50 x 0.6 x 0.4 = 3.464
su representacin es:

= p (error tipo II cuando p = 0.6) =
p (18.069 < X < 31.96 para p = 0.6)

para p= 0.7


_________________________________________________________________
p 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9
______________________________________________________________________________________
0.0000 0.0022 0.1718 0.7110 0.9500 0.7110 0.1718 0.0022 0.0000
______________________________________________________________________________________

138



Curva caracterstica de operacin de la regla de decisin.

Proporciona la probabilidad de aceptar la hiptesis de que p= 0.5 cuando tiene otro valor. En p=
0.5 el valor de se interpreta como la probabilidad de aceptar Ho cuando es cierta y es el
complemento del nivel de significacin.

Una curva caracterstica indica el poder que tiene la regla de decisin de rechazar hiptesis
falsas. Mientras ms entrecha es la curva mayor es el poder.

Ejemplo:

Una empresa produce cables con resistencia media a la ruptura de 200 kg. y desviacin estndar
de 20 kg. Se piensa que con un nuevo proceso productivo la resistencia media a la ruptura se
puede incrementar.

a- Disear una regla de Decisin para aceptar el nuevo proceso productivo con un nivel de
significacin del 1% al probar 50 cables.

e- Bajo la regla de Decisin adoptada en el inciso anterior, calcular la probabilidad de
rechazar el nuevo proceso cuando en realidad est produciendo cables con resistencia
media a la ruptura de 210 kg.



a- Ho:
N
< 200
139
H1:
N
> 200 (proceso nuevo mayor que el anterior)



Acepte el nuevo proceso productivo si la resitencia media de 50 cables es mayor de 206.6 kg.

p(Z < -1.20) = 0.1151
















140





















Captulo VII
Pruebas de Bondad de Ajuste

7.1. LA PRUEBA
X
2
DE UNA MUESTRA

Esta prueba es de utilidad cuando se est interesado en el nmero de sujetos, objetos o
respuestas que se clasifican en diferenes categoras. La tcnica es del tipo de la bondad de
ajuste y puede usarse para probar la existencia de una diferencia significativa entre un nmero
observado de objetos y un nmero esperado basado en la hiptesis nula.

Mtodo

Si deseamos comparar un grupo de frecuencias observadas con un esperado, debemos
identificar las frecuencias. La hiptesis nula nos proporciona esas frecuencias esperadas. La
tcnica
X
2
prueba si las frecuencias observadas estn suficientemente prximas a las esperadas
que podran ocurrir conforme Ho.

La hiptesis de nulidad puede probarse mediante la frmula:

_
2
= Oi Ei ( )
2
Ei
( )


Oi= nmero observado de casos clasificados en la categora de i.
Ei= nmero esperado de casos en la categora de i conforme a Ho.

La sumatoria seala la necesidad de sumar en todas las K categoras.
141

Si hay poca diferencia entre Oi y Ei. Oi - Ei es pequea y

X
2
ser pequea. Sin embargo, si la
divergencia es grande el valor de
X
2
tambin ser grande. Para valores mayores de
X
2

aumentarn las probabilidades de que las frecuencias observadas no provengan de la poblacin
en la que se bas la hiptesis nula.

El tamao de gl (grados de libertad) refleja el nmero de observaciones suceptibles de variar
despus de que ciertas restricciones se han impuesto a los datos. Estas restricciones no son
arbitrarias sino inherentes a la organizacin de los datos.

Cuando gl = 1 esto es, cuando K=2, cada frecuencia esperada deber ser por lo menos de 5.
Cuando gl>1 esto es, cuando K>2 la prueba _2 para casos de una muestra no debe usarse si
ms del 20% de las frecuencias esperadas son menores que 5 o cuando cualquier frecuencia
esperada es menor a 1. (Cochran 1954).

Las frecuencias esperadas algunas veces pueden incrementarse combinando categoras
adyacentes. Esto es deseable solamente si pueden hacerse combinaciones que tengan sentido.

Nota: Si despus de combinar las categoras adyacentes se termina solamente con 2 categoras y
an se tiene una frecuencia esperada menor que 5, entonces es indicado hacer la prueba
binomial.

Ejemplo 1:

Ajuste una distribucin normal a travs de los datos siguientes y haga una prueba de hiptesis
para la bondad de ajuste. Calcule primero el valor p a partir de este valor saque su conclusin
para
o
=0.05 (agrupe adecuadamente las clases). Se trata de 80 mediciones de la emisin diaria
de xido de azufre de una planta industrial.

Frecuencia
4.95 - 8.95 3
8.95 - 12.95 10
12.95 - 16.95 14
16.95 - 20.95 25
20.95 - 24.95 17
24.95 - 28.95 9
28.95 - 32.95 2
Con Y =18.85 y S=5.55

Solucin:

Lmites reas de
reales Z las tablas Prob Ei

4.95 -2.50 0.0062

0.0313

2.50


142
8.95 -1.78 0.0375

0.1071

8.57
Obs=13 esp= 11.07
12.95 -1.06 0.1446

0.2223

17.78

16.95 -0.34 0.3669

0.2811

22.49

20.95 0.38 0.3520

0.2163

17.30

24.95 1.10 0.1357

0.1013

8.10

28.95 1.82 0.0344

0.0289

2.31
Obs=11 esp=10.41
32.95 2.54 0.0055

Ho: es normal
Ha: no es normal

_
2
=
(13 11.07)
2
11.07
+ ... +
(11 10.41)
2
10.41
=1.4589 ~1.46

_
2
512 = _
2
2


1.46
valor p

Para = 0.05, los elementos no tiene suficiente evidencia para poder rechazar Ho.

Ejemplo 2:

Cada uno de 132 individuos tira 6 veces a un blanco y se registra el nmero de veces que
aciertan. En las primeras dos columnas de la tabla 7.1, se muestra el total de individuos que
obtuvieron x aciertos con x = n, 1, 2,...

Es razonable suponer que el porcentaje de aciertos en el tiro al blanco es p = 0.50?

Numero de
aciertos x
Frecuencia
observada
Oi

P (Xi)
Frecuencia
esperada
ei

(o
i
e
i
)
2
e
i

0 3
16
0.0156 2
14.4

0.1778
1 13 0.0938 12.4
2 28 0.2344 30.9 0.2722
143
3 44 0.3124 41.2 0.1903
4 32 0.2344 30.9 0.0392
5 11
12
0.0938 12.4
14.5

0.4310
6 1 0.0156 2.1
Totales 132 1.0000 131.9 1.1155
Tabla 7.1

Si se acepta que la poblacin tiene distribucin binomial, el problema consiste en probar la
hiptesis:

Ho: la d.p. de la poblacin es P(X)= nCx (1-P) 6-x px X=0,1,...,6 contra la hiptesis alterna
Hi: la d.p. de la poblacin no es P(X)
en donde p = 0.05. En la columna 3 de la tabla 7.1 se muestran los valores tericos de P(Xi)
mismos que se leyeron en la tabla binomial. En la columna 4 aparecen las frecuencias esperadas
ei = nP(Xi) con n=132, y en la ltima columna los valores
(o
i
e
i
)
2
e
i

Como el ajuste descrito es tal que las frecuencias totales son iguales tanto para la distribucin
emprica como para la terica, deber tenerse


(o
i
e
i
) = 0
i


Se agruparon los intervalos con objeto de que
e
i
> 5
de manera tal que se tiene k=5, por lo
tanto debern considerarse = 5-1 = 4 g.l. y la regla de decisin puede enunciarse como sigue
con un 5% de nivel de significacin:

i) Si X
2
< 9.49 el ajuste es satisfactorio, sto es puede aceptarse que p=0.50
ii) En caso contrario se rechaza Ho.

en donde 9.49 es el percentil 95% de la distribucin ji cuadrada con 4 grados de libertad.

De la tabla 7.1 se obtiene X
2
=1.1155<9.49 y por tanto se acepta Ho.

Ejemplo 3:

El propietario de cinco cabaas de descanso desea construir otra. La demenada registrada en los
ltimos 100 das se muestra en la tabla 7.2, en donde xi es el nmero de cabaas solicitadas por
los clientes y oi su frecuencia correspondiente. Si se decide contruir la sexta cabaa Cul ser
la probabilidad de rentarla?

Demanda xi 0 1 2 3 4 5 6 7 8 9 10
Frecuencia oi 2 7 12 15 21 18 10 7 5 2 1
Tabla 7.2
144

Debe calcularse P(X6) y para ello debe conocerse la d.p. de la v.a. xi.

Una primera distribucin de tipo discreto a considerar es la de Poisson:

P(x = x
i
) =

x
i
x
i
!
e

x
i
= a,2,...
El parmetro

es x y como:


x =
1
100
x
i
o
i
=
427
100
= 4.27
i



Es razonable probar la hiptesis:

Ho: la d.p. de la poblacin es:


P(x = x
i
)
4.5
x
i
x
i
e
4.5

contra la hiptesis alterna:

Hi: la d.p. de la poblacin no es P(x = x
i
)

Para ello en la primera columna de la tabla 7.3 se muestra la demanda x
i
seguida de su
frecuencia observada oi. En la tercera columna se muestran los valores tericos de P(x
i
) mismos
que se leyeron en la tabla Poisson, enseguida aparecen las frecuencias esperadas ei=nP(x
i
) con
n=100, y en la ltima columna los valores
(o
i
e
i
)
2
e
i
.

Demanda
xi
Frecuencia
observada
oi

P(x
i
)
Frecuencia
esperada
ei
(o
i
e
i
)
2
e
i

0 2
9
0.0111 1.1
6.1

1.3787
1 7 0.0500 5.0
2 12 0.1125 11.3 0.0434
3 15 0.1687 16.9 0.2136
4 21 0.1898 19.0 0.2105
5 18 0.1708 17.1 0.0474
6 10 0.1281 12.8 0.6125
7 7 0.0824 8.2 0.1756
8 5 0.0463 4.6
145
9 2 8 0.0232 2.3 7.9 0.0013
10 1 0.0104 1.0
Totales 100 99.3 2.0828
Tabla 7.3

Como despus de la agrupacin formulada se tiene k=8 y el parmetro desconocido

fue
reemplazado por su estimacin, entonces se tienen 8-1-1=6 g.l. Consecuentemente se llega a la
siguiente regla de decisin con un nivel de significancia del 5%.

i) Si
x
2
s 12.59
el ajuste es satisfactorio, esto es, se acepta Ho.
ii) En caso contrario se rechaza Ho.

En donde 12.59 es el percentil 95% de la distribucin ji cuadrada con 6 grados de libertad.

De la tabla 7.3 se obtiene x
2
=2.6826<12.59 y por tanto se acepta Ho. Ahora, para calcular la
probabilidad de que se rente la sexta cabaa basta obtener:


P(x
i
> 5) = 1 P(x
i
) = 1 0.7029 = 0.2971
i=0
5



7.2 PRUEBAS DE UNA MUESTRA DE KOLMOGOROV-SMIRNOV

Es una prueba de bondad del ajuste, esto es, se interesa en el grado de acuerdo entre la
distribucin de un conjunto de valores de la muestra y alguna distribucin terica especfica.

La prueba lleva consigo la especificacin de la distribucin de frecuencia acumulativa que
ocurrira bajo la distribucin terica y su comparacin con la distribucin acumulativa
observada.

Sea F
T
(X) funcin de distribucin de frecuencias relativas acumuladas terica.
F
S
(X) funcin de distribucin de frecuencias relativas acumuladas asociadas a la muestra.

En un ajuste satisfactorio es de esperarse que las diferencias F
S
(X) - F
T
(X) sean razonablemente
pequeas en valor absoluto por lo que en la prueba de Kolmogorov-Smirnov se utiliza el
estadstico.

D= mximo
F
S
(X) - F
T
(X)


Ya que atiende la mayor desviacin D cuyas distribuciones estn tabuladas tanto para el caso de
muestras grandes o pequeas segn la tabla E.
La prueba resultante es a una sola cola ya que solamente los valores grandes de D causaran
dudas respecto a la Hiptesis nula.

146
Ho: F
S
(X) = F
T
(X)

De esta forma, la regla de decisin puede enunciarse como sigue:
Si
D < ko
se acepta Ho.
En caso contrario, se rechaza.
En donde K es el valor crtico de la distribucin del estadstico D para el nivel de significancia
o
ledo en la tabla.

En casi todos los casos la prueba de Kolmogorov-Smirnov para la bondad de un ajuste es ms
potente que la prueba ji cuadrada. Adems, no es necesario que en cada intervalo la frecuencia
esperada no sea menor que una cierta cota inferior (e
1
5) y en general es ms fcil de calcular
D que X2. Finalmente, aunque la prueba Kolmogorov-Smirnov requiere que la variable
aleatoria involucrada sea continua, se ha observado que la violacin de este requerimiento
conduce a errores muy pequeos.

Ejemplo:

Supongamos que un investigador est interesado en confirmar, por medios experimentales, la
observacin sociolgica de que los negros americanos parecen tener una jerarqua de
preferencias entre distintos matices de piel. Para probar cun sistemticas son las preferencias
de los negros por los tonos de piel se toma una fotografa de cada uno de diez sujetos negros. El
fotgrafo obtiene 5 copias de cada fotografa, cada copia ligeramente diferente de las otras en
cuanto a la oscuridad. La fotografa que presenta el color ms oscuro recibe el rango 1 y as
sucesivamente hasta la ms clara, que recibe el rango 5. Despus se le pide a cada sujeto que
escoja de entre las 5 impresiones su propia fotografa. Si el matiz de la piel no es importante
para los sujetos, las fotografas de cada rango a menudo sern escogidad igualmente,
exceptuando las diferencias aleatorias. Si el matiz de la piel es importante, entonces los sujetos
consistentemente mostrarn preferencia a uno de los rangos extremos.

Ho: No hay diferencia entre el nmero esperado de elecciones para cada uno de los cinco
rangos.
f
1
=f
2
=f
3
=f
4
=f
5


Ha: las frecuencias f
1
,=f
2
,=f
3
, . . f
5
no son todas iguales.

Prueba Estadstica: la prueba de una muestra de Kolmogorov-Smirnov se escoge porque el
investigador desea comprar una distribucin de puntajes observados con una distribucin
terica.

Nivel de significacin: Sea
o = 0.01



Rango de la foto escogida
(1 es el color de piel ms oscuro)
1 2 3 4 5
147
f= nmero de sujetos que escogen cada rango
0

0/10
1

1/10
0

0/10
5

5/10
4

4/10
FT(X)=Distribucin acumulativa
de eleccin conforme Ho.
1/5 2/5 3/5 4/5 5/5
FS(X)=Distribucin acumulativa
de elecciones observadas.
0/10 1/10 1/10 6/10 10/10
/FS(X) - FT(X)/ 2/10 3/10 5/10 2/10 0

D=5/10 = 0.5
para N=10
o = 0.01

0.5>0.490 Se rechaza Ho en favor de Ha.







C Ca ap p t tu ul lo o V VI II II I
Diseo de muestreo

Existen muchas situaciones en la vida real en las que se desea conocer alguna(s)
caracterstica(s) de cierta poblacin pero es costoso investigar a la poblacin completa para
obtener la informacin deseada. En vez de analizar a toda la poblacin se toma una pequea
porcin de ella, llamada muestra, la cual se analiza y las conclusiones obtenidas de la muestra
se infieren a la poblacin. Cuando hablamos de poblacin nos referimos no solo a seres
humanos, sino tambien a objetos y animales. Cuando se analiza a toda la poblacin se dice que
se aplica un censo, mientras que cuando solo se analiza una porcin de la poblacin se habla de
un muestreo. El objetivo de una encuesta por muestreo es hacer una inferencia acerca de la
poblacin con base en la informacin contenida en una muestra.

Hay dos factores que afectan la cantidad de informacin contenida en una muestra y, por lo
tanto, afectan la precisin de un procedimiento para hacer inferencias. El primero es el tamao
de la muestra seleccionada y el segundo es la cantidad de variacin en los datos. La variacin
puede ser controlada frecuentemente por el mtodo de seleccin de la muestra. El
procedimiento para seleccionar la muestra es llamado diseo de la encuesta por muestreo o
esquema de la encuesta por muestreo o procedimiento de muestreo. Para un tamao de muestra
fijo, n, se considerarn varios esquemas. Como las observaciones cuestan dinero, un diseo que
proporciona un estimador preciso del parmetro para un tamao de muestra fijo produce un
ahorro en el costo para el experimentador.

Existen diversos esquemas de muestreo, de los cuales vamos a presentar tres: muestreo
aleatorio simple, muestreo aleatorio estratificado y muestreo aleatorio por conglomerados.

Si recordamos, dijimos antes que el objetivo de una encuesta por muestreo es hacer una
inferencia acerca de la poblacin con base en la informacin contenida en una muestra. Una
148
forma de hacer inferencia es estimar algunos parmetros de la poblacin utilizando la
informacin de la muestra. Los parmetros que pueden ser estimados son: la media , el total
poblacional t , o la proporcin p. Tambin es importante poder determinar el tamao de
muestra n necesario para estimar algn parmetro con cierto nivel de error deseado.

8.1 Muestreo aleatorio irrestricto o simple.

Definicin.- Si una muestra de tamao n es seleccionada de una poblacin de tamao N, de tal
manera que cada muestra posible de tamao n tiene la misma posibilidad de ser seleccionada, el
procedimiento de muestreo se denomina muestreo aleatorio irrestricto o muestreo aleatorio
simple. A la muestra asi obtenida se le llama muestra aleatoria simple o muestra aleatoria
irrestricta.

Como seleccionar una muestra aleatoria simple?

Se ordenan los elementos de la poblacin y se les asignan nmeros del 1 al N (tamao de la
poblacin). Se toman n (tamao de la muestra) nmeros aleatorios, los cuales correspondern a
los indices de los elementos de la poblacin. Los nmeros aleatorios se pueden tomar de una
tabla de nmeros aleatorios.

Formulas a utilizar para la estimacin de los parmetros

Estimador de la Media Poblacional :


Varianza de

y :
( )
|
.
|

\
|

=
1
2
N
n N
n
y V
o


Varianza Estimada de

y :

( )
|
.
|

\
|
=
N
n N
n
s
y V
2



Error de Estimacin:


B = Z
c
o
2
n
N n
N1
|
\
|
.


Error de Estimacin Estimado:

149

|
.
|

\
|
=
N
n N
n
s
Z B
c
2



Tamao de Muestra Requerido para Estimar con un Lmite para el error de estimacin B:

n =
No
2
B
2
Z
c
2
N 1
( )
+o
2

Donde:
N = tamao de la poblacin.
o
2

= varianza poblacional (si se desconoce se estima mediante S
2
o Rango 4).

Tamao de Muestra Requerido para Estimar con un Lmite para el error de estimacin B

:


( )
2
2
2
2

S N
Z
B
NS
n
c
+
=



Estimador del Total Poblacional t :



t = Ny

Varianza de
t
:

V

t
( )
= N
2

o
2
n
|
\

|
.
|
N n
N1
|
\
|
.


Varianza Estimada de
t
:

( )
|
.
|

\
|
|
|
.
|

\
|
=
N
n N
n
S
N V
2
2

t

Error de Estimacin:

B = Z
c
N
2

o
2
n
|
\

|
.
|
N n
N1
|
\
|
.



Error de Estimacin Estimado:

150

|
.
|

\
|
|
|
.
|

\
|
=
N
n N
n
S
N Z B
c

2
2



Tamao de Muestra Requerido para Estimar
t
con un Lmite para el error de estimacin B:

n =
No
2
B
2
N1 ( )
Z
c
2
N
2
+ o
2


Tamao de Muestra Requerido para Estimar
t
con un Lmite para el error de estimacin B




2
2
2
2

S
Z
B
NS
n
c
+
=
N


Estimador de la Proporcin Poblacional P:



p = Nmero de elementos que tienen la caracterstica deseada
Nmero total de elementos seleccionados

Varianza de


p :


|
.
|

\
|

=
1
) (
N
n N
n
pq
p V

Varianza Estimada de


p :


|
.
|

\
|

=
N
n N
n
q p
p V
1

) (

Error de Estimacin:

|
.
|

\
|

=
1 N
n N
Z B
c

n
q p


Error de Estimacin Estimado:

|
.
|

\
|
=
N
n N
Z B
c

1 - n
q p



151
Tamao de Muestra Requerido para Estimar

p con un lmite para el error de estimacin B:

n =
Npq
B
2
Z
c
2

(N1) + p q


Tamao de Muestra Requerido para Estimar

p con un lmite para el error de estimacin B

:


q p N
Z
B
q p N
n
c
) (


2
2


+
=


8.2 Muestreo Aleatorio Estratificado

Definicin.- Una muestra aleatoria estratificada es la obtenida mediante la separacin de los
elementos de la poblacin en grupos que no presenten traslapes, llamados estratos, y la
seleccin posterior de una muestra aleatoria simple de cada estrato.

Caractersticas de los estratos

Los elementos de cada estrato deben ser semejantes entre si y diferentes de los elementos de
otros estratos.

Como seleccionar una muestra aleatoria estratificada?

Se clasifica la poblacin en estratos y se selecciona una muestra aleatoria simple de cada
estrato.

Formulas a utilizar para la estimacin de los parmetros

Notacin

L = Nmero de Estratos
N
i
= Nmero de unidades muestrales en el estrato i.
N = Nmero de unidades muestrales en la poblacin
Y
i
= Media muestral para la muestra irrestricta aleatoria seleccionada del estrato i.
n
i
= Tamao de la muestra estrato i.

i
= Media poblacional del estrato i
= Media poblacional.

Media Poblacional :

152
=
N
1

1
+ N
2

2
+ ... +N
L

L
N


Estimador de la Media Poblacional :

= Y
st
=
N
1
Y
1
+N
2
Y
2
+... + N
L
Y
l
N




= y
st
=
1
N
N
i
i =1
L
y
i


Varianza de

st
y :

( ) ( )
|
|
.
|

\
|

|
|
.
|

\
|
= |
.
|

\
|
=

1
1 1 1
2
2 2
i
i i
i
i
i i st
N
n N
n N
Y
N
Y
N
V Y V N = V N N
L
1 = i
2
i
L
1 = i
2
i
L
1 = i
i
o

Varianza Estimada de

st
y :

( ) ( )
|
|
.
|

\
|
|
|
.
|

\
|
= |
.
|

\
|
=

i
i i
i
i
i i st
N
n N
n
S
N
Y
N
Y
N
V Y V N = V N N
L
1 = i
2
i
L
1 = i
2
i
L
1 = i
i
2
2 2
1 1 1



Error de Estimacin:


|
|
.
|

\
|

|
|
.
|

\
|
=

1
1
2
2
i
i i
i
i
c
N
n N
n N
Z B N
L
1 = i
2
i
o



Error de Estimacin Estimado:


|
|
.
|

\
|
|
|
.
|

\
|
=

i
i i
i
i
c
N
n N
n
S
N
Z B N
L
1 = i
2
i
2
2
1



Tamao de Muestra Requerido para Estimar a con un Lmite para el error de estimacin B,
donde se asume que ni (nmero de observaciones en el estrato i) es una fraccin del tamao de
la muestra total n), es decir, ni= w
i
n i=1,..., L

=
=
+
=
L
i
i i
L
i
i
i i
N N
w
N
D
n
1
2 2
1
2 2
) 1 (
o
o
Donde: D =
B
2
Zc
2
(*)

153
Tamao de Muestra Requerido para Estimar a con un Lmite para el error de estimacin B

,
donde se asume que ni (nmero de observaciones en el estrato i) es una fraccin del tamao de
la muestra total n), es decir, ni= w
i
n i=1,..., L

=
=
+
=
L
i
i i
L
i
i
i i
S N N
w
S N
D
n
1
2 2
1
2 2
) (
Donde: D =
B
2
Zc
2
(*)


Total Poblacional t :

t = N

Estimador del Total Poblacional t :

t = N
st
y
= N
1 N
1
y +
2 N
2
y +... +
L N
L
y
N




t = i N
i
y
i=1
L



Varianza de t :
( )
|
|
.
|

\
|
|
|
.
|

\
|
|
|
.
|

\
|

= |
.
|

\
|
=

= i
i
i
i i
L
i
i
i
n N
n N
Y N V V
2
1
1

o
t N
L
1 = i
2
i


Varianza Estimada de t :

( )
|
|
.
|

\
|
|
|
.
|

\
|
|
|
.
|

\
|
= |
.
|

\
|
=

= i
i
i
i i
L
i
i
i
n
S
N
n N
Y N V V
2
1

N
L
1 = i
2
i
t

Error de Estimacin:





Error de Estimacin Estimado:


|
|
.
|

\
|
|
|
.
|

\
|
=

i
i
i
i i
c
n
S
N
n N
Z B
2

N
L
1 = i
2
i


|
|
.
|

\
|
|
|
.
|

\
|

=

i
i
i
i i
c
n N
n N
Z B
2
L
1 = i
2
i

1
N
o
154
Tamao de Muestra Requerido para Estimar a t con un Lmite para el error de estimacin B,
donde se asume que ni (nmero de observaciones en el estrato i) es una fraccin del tamao de
la muestra total n), es decir, ni= w
i
n i=1,..., L

=
+
=
L
i
i
c
i
i
Z
B
w
n
1
2
2
2
2
) 1 o
o
2
i
L
1 = i
2
i
(N
N


Tamao de Muestra Requerido para Estimar a t con un Lmite para el error de estimacin B

,
donde se asume que ni (nmero de observaciones en el estrato i) es una fraccin del tamao de
la muestra total n), es decir, ni= w
i
n i=1,..., L



=
+
=
L
i
i
c
i
i
S
Z
B
w
S
n
1
2 2
i
2
2
L
1 = i
2 2
i
) (N

N


Proporcin Poblacional
Pst
:


P N P i
L
i
i st
N

=
=
1
1


Estimador de la Proporcin Poblacional
Pst
:

Sea p
i
Proporcin muestral en el estrato i

i
p Proporcin poblacional en el estrato i

p
st
=
1
N
N
1
p
1
+ N
2
p
2
+... + N
L
p
L
( )=
1
N
N
i
p
i
i=1
L


Varianza de
st
p
:

V p
st
( )= V
1
N
N
i
p
i
i=1
L

|
\

|
.
|
=
1
N
2
N
i
2
V p
i
( )
i =1
L




|
|
.
|

\
|

|
|
.
|

\
|
=

=
1
1
1
2
2
i
i i
L
i
i
N
n N
N
N

n
q p
i
i i

155

Varianza Estimada de
st
p
:

( ) ( )

= =
= |
.
|

\
|
=
L
i
i i
L
i
i i st
p V N
N
p N
N
V p V
1
2
2
1



=
1
N
2
N
i
2
i=1
L

p
i
q
i
n
i
1
|
\

|
.
|

N
i
n
i
N
i
|
\

|
.
|


Error de Estimacin:


|
|
.
|

\
|
|
|
.
|

\
|

=

= i
i i
1
2
2
n
q p
1
1
i
i i
L
i
i c
N
n N
N
N
Z B

Error de Estimacin Estimado:


|
|
.
|

\
|

|
|
.
|

\
|
=

=
1 n
q p

1

i
i i
1
2
2
i
i i
L
i
i c
N
n N
N
N
Z B


Tamao de muestra que se requiere para estimar P con un lmite B para el error de estimacin:

=
=
+
=
L
i
i i
L
i
i
i i
i
q p
N N
w
q p
N
i
D
n
1
2
2
1
2
) 1 (
Donde D =
B
2
Z
c
2


Tamao de muestra que se requiere para estimar P con un lmite B

para el error de estimacin:


=
=
+
=
L
i
i i
L
i
i
i i
i
q p
N N
w
q p
N
i
D
n
1
2
2
1
2
) (

Donde
2
2

c
Z
B
D =

Si usamos tamaos de muestra proporcionales a los tamaos de los estratos, entonces w
i
=
N
i
N
.

Asignacin de la muestra

1. Asignacin aproximada que minimiza el costo de muestreo

156

|
|
|
|
.
|

\
|
=

=
k
L
k
k k
i i i
i
C N
C N
w
1
o
o


Donde C
i
representa el costo individual para obtener una observacin individual
del i-simo estrato.

Se sustituyen los w
i
de las ecuaciones anteriores por el valor de la ecuacin
anterior.

2. Asignacin de Neyman

En algunos problemas el costo por obtener informacin es el mismo para todos
los estratos obtenindose:


|
|
|
|
.
|

\
|
=

=
L
i
i i
i i
i
N
N
w
1
o
o

8.3 Muestreo aleatorio por conglomerados

Definicin.- Una muestra aleatoria por conglomerados es una muestra aleatoria en la cual cada
unidad de muestreo es una coleccin, o conglomerado, de elementos.

Caractersticas de los conglomerados

Los elementos de cada conglomerado deben ser diferentes entre si pero cada conglomerado
debe ser parecido.

Como seleccionar una muestra aleatoria por conglomerado?

Se clasifica la poblacin en conglomerados, se conforma un marco de conglomerados de la
poblacin y se selecciona una muestra aleatoria simple de los conglomerados. Despus se censa
cada conglomerado seleccionado.

Formulas a utilizar para la estimacin de los parmetros

Notacin

N = Nmero de conglomerados en la poblacin.
n = Nmero de conglomerados seleccionados en la muestra.
m
i
= Nmero de elementos en el conglomerado i. i=1,..., N

157
m =
1
n
m
i
i =1
n
Tamao promedio del conglomerado en la muestra.

M = m
i
i =1
N
Nmero de elementos en la poblacin.

M = M N Tamao promedio del conglomerado en la poblacin.

Y
i
= Total de todas las observaciones en el i-simo conglomerado.

Estimador de la Media Poblacional :

y =
i
y
i=1
n

i m
i =1
n


Varianza Estimada y :



V y ( )=
N n
NnM
2
|
\
|
.
i
y

i
y m
( )
2
i =1
n

n 1



Error de Estimacin Estimado:

( )
( )
1

1
2
2

|
|
.
|

\
|

= =

=
n
m y y
M Nn
n N
Z y V Z B
n
i
i i
c c


Nota:
- Si se desconoce M, se puede emplear a m como estimador de M .
- La varianza V(y ) es sesgada y ser un buen estimador si n es grande n > 20 .
- El sesgo desaparece cuando m
1
= m
2
= ... = m
N


Tamao de muestra aproximado requerido para estimar con un lmite B para el error de
estimacin:

n =
c
2
No
ND+
c
2
o

donde
c
2
o
es estimado por
c
2
s
y D =
2
B
2
M
Zc
2

158
c
2
S =
y
i
ym
i
( )
2
i=1
n

n 1


n = Nmero de Conglomerados a la Muestra.

Estimador del Total Poblacional t el cual depende de M.



t = M

Estimador
t = My = M
i
y
i=1
n

i m
i=1
n



Varianza Estimada My :
V

t ( )= V My ( )= M
2
V y ( )=
2
N
N n
Nn
|
\

|
.
|
i
y
i
y m ( )
2
i=1
n

n 1

Error de Estimacin Estimado:


( )
1

1
2

|
.
|

\
|
=

=
n
m y y
Nn
n N
Z B
n
i
i i
c
2
N

Estimador del Total Poblacional t , el cual no depende de M:

Frecuentemente el nmero de elementos en la poblacin no es conocido en problemas donde el
muestreo por conglomerados es apropiado. Entonces no podemos usar el estimador My pero
podemos formar otro estimador del total poblacional que no depende de M.

Sea

Y
t
= Promedio de los totales para los n conglomerados
muestreados.

Y
t
=
1
n
Y
i
i =1
n


Estimador

159

t
t =Ny =
N
n
i
y
i =1
n


Varianza Estimada de
t
t =Ny :


V Ny
t
( )=
2
N

V
t
y
( ) =
2
N
N n
Nn
|
\

|
.
|
i
y
t
y ( )
2
i=1
n

n1


Error de Estimacin:
Zc
2
N
Nn
Nn
|
\

|
.
|
i
y
t
y ( )
2
i=1
n

n 1


Tamao de Muestra Requerido para Estimar t , usando My como estimador:

n =
c
2
No
ND+
c
2
o

donde c
2
o es estimado por c
2
s y D =
2
B
Zc
2
N
2



c
2
s =
i
y

i
y m
( )
2

n1


Tamao de muestra aproximado requerido para estimar t , usando
t
Ny como estimador:

n =
t
2
No
ND+
t
2
o
donde t
2
o es estimado por t
2
s y D =
B
2
Zc
2
N
2

t
2
s =
i
y
t
y
( )
2

n1


Estimador de la Proporcin Poblacional p :

Sea a
i
= Nmero de elementos en el conglomerado i que poseen caracterstica de
inters.

Estimador

p =
i a
i =1
n

i m
i =1
n



Varianza Estimada
p :
160


V

p ( )=
N n
NnM
2
|
\
|
.
i
a

i

p m
( )
2
i=1
n

n 1


Lmite para el error de estimacin:

Zc V p ( ) = Zc
N n
NnM
2
|
\
|
.
a
i


p m
i
( )
2
i =1
n

n 1


Tamao de muestra aproximado para estimar proporciones:

n =
c
2
No
ND+
c
2
o

donde D =
2
B
2
M
Zc
2
y
c
2
o se estima por
c
2
s =
i
a

i

p m
( )
2
i =1
n

n 1


M se estima mediante m
8.4 Ejemplos de muestreo aleatorio irrestricto o simple

Cmo seleccionar una muestra irrestricta aleatoria

Ejemplo

Suponga que existen N=1000 registros de pacientes, de los cuales ser seleccionada una
muestra irrestricta aleatoria de n=20. Sabemos que una muestra irrestricta aleatoria ser
obtenida si cada muestra posible de n=20 registros tiene la misma probabilidad de ser
seleccionada. Los dgitos de la tabla de nmeros aleatorios, son generados para satisfacer las
condiciones del muestreo irrestricto aleatorio.

Determinar cules registros van a ser incluidos en una encuesta de tamao n=20

Solucin

Podemos considerar que las cuentas son los nmeros 001, 002, . . . , 999, 000. Esto es, tenemos
1000 nmeros de tres dgitos, donde 001 representa el primer registro y 000 el milsimo.

Recurra a la tabla de nmeros aleatorios y utilice la primera columna; si no tomamos en cuenta
los dos ltimos dgitos de cada nmero, el registro de pacientes que sern incluidos en la
muestra son:

104 779 289 510
223 995 635 023
241 963 094 010
161
421 895 103 521
375 854 071 070

Si los registros estn numerados, solamente seleccionamos los registros correspondientes, y
estos registros representan una muestra irrestricta aleatoria de n=20 de N=1000.
Si un nmero aleatorio ocurre dos veces, se omite la segunda ocurrencia y se selecciona otro
nmero como su reemplazo.

Estimacin de una media y un total poblacionales

Una muestra irrestricta aleatoria de n=9 registros del hospital es seleccionada para estimar la
cantidad promedio de deuda sobre N=484 cuentas abiertas. Los valores de la muestra para estos
nueve registros estn listados en la tabla siguiente. Estime a , la cantidad promedio de la
deuda, y establezca un lmite para el error de estimacin.

Cantidad de dinero adeudado
Y
1
33.50
Y
2
32.00
Y
3
52.00
Y
4
43.00
Y
5
40.00
Y
6
41.00
Y
7
45.00
Y
8
42.50
Y
9
39.00


Solucin


Y
i
= 368.00
i=1
9

Y
i
2
=15332.50
i=1
9



Nuestra estimacin de es:

Y =
Y
i
i=1
9

9
=
368.00
9
= 40.89

Para encontrar el lmite para el error de estimacin, debemos calcular suponiendo:

162

87 . 3
484
9 . 484
9
67 . 35
96 . 1

% 5
2
=
|
.
|

\
|
=
|
.
|

\
|
=
=
B
N
n N
n
s
Zc B
o


La estimacin de dinero adeudada por cuenta, , es Y =$40.89. Aunque no podemos estar
seguros de qu tan cerca est Y de , estamos razonablemente confiados (95% de confianza)
en que el error de estimacin es menor de $3.87.

Estimacin de una proporcin poblacional

Ejemplo

Una muestra irrestricta aleatoria de n=100 estudiantes del ltimo ao de un colegio fue
seleccionada para estimar:

1. La fraccin de N=300 estudiantes del ltimo ao que asistirn a una universidad.

2. la fraccin de estudiantes que han tenido trabajos de tiempo parcial durante su estancia en el
colegio.

Sean Y
i
y X
i
(i=1,2,...,100) las respuestas del i-simo estudiante seleccionado. Estableceremos
que Y
i
=0 si el i-simo estudiante no planea asistir a una institucin superior y Y
i
=1 si lo planea.
Asimismo, sea X
i
=0 si el i-simo estudiante no ha tenido alguna vez un trabajo de tiempo
parcial durante su estancia en el colegio, y X
i =1
si lo ha tenido.

Usando los datos siguientes, estime la P
1
proporcin de estudiantes del ltimo ao que planea
asistir a una universidad y P
2
, la proporcin de estudiantes del ltimo ao que ha tenido un
trabajo de tiempo parcial durante sus cursos en el colegio.

Estudiante Y X
1 1 0
2 0 1

100 1 1

Y
i
= 15
i=1
100
X
i
= 65
i =1
100


Las proporciones muestrales estn dadas por:
163


P
1
=
Y
i
i=1
n

n
=
15
100
= 0.15

P
2
=
X
i
i=1
n

n
=
65
100
= 0.65


Los lmites para los errores de estimacin de P
1
y P
2
son, respectivamente


B
1
= 1.96
(0.15)(0.85)
100
300 100
299
|
\

|
.
| = 0.057
B
2
=1.96
(0.65)(0.35)
100
300 100
299
|
\

|
.
|
= 0.076


Estimamos que 0.15 (15%) de los estudiantes del ltimo ao planea asistir a una universidad,
con un lmite para el error de estimacin igual a (5.7%).

Estimamos que 0.65 (65%) de los estudiantes del ltimo ao han tenido un trabajo de tiempo
parcial durante su estancia en el colegio, con un lmite para el error de estimacin igual a 0.076
(7.6%).

Seleccin del tamao de la muestra

Ejemplo

La cantidad promedio de dinero para las cuentas por cobrar de un hospital debe ser estimada.
Aunque no se cuenta con datos anteriores para estimar la varianza poblacional o
2
, se sabe que
la mayora de las cuentas caen dentro de una amplitud de variacin de $100. Existen N=1000
cuentas abiertas. Encuentre el tamao de muestra necesario para estimar a con un lmite para
el error de estimacin de B=$3.

Solucin

Necesitamos una estimacin de o
2
, la varianza poblacional. Ya que la amplitud de variacin es
aproximadamente igual a 4 desviaciones estndar (4o) , un cuarto de tal amplitud
proporcionar un valor aproximado de o. Por lo tanto,

164

o ~
rango
4
=
100
4
= 25
o
2
~ (25)
2
= 265
n =
No
2
B
2
Zc
2
(N1) + o
2
n =
1000(625)
(3)
2
(1.96)
2
(999) + 625
= 210.76


Esto es, necesitamos aproximadamente 211 observaciones para estimar a , la media de las
cuentas por cobrar, con un lmite para el error de estimacin de $3.

8.5 Ejemplos de muestreo aleatorio estratificado

Cmo seleccionar una muestra aleatoria estratificada

Una empresa publicitaria est interesada en determinar qu tanto debe enfatizar la publicidad
televisiva en un determinado municipio y decide realizar una encuesta por muestreo para
estimar el nmero promedio de horas por semana que se ve la televisin en los hogares del
municipio. ste comprende dos pueblos, pueblo A y pueblo B, y un rea rural.

El pueblo A circunda una fbrica, y la mayora de los hogares son de trabajadores fabriles con
nios en edad escolar. El pueblo B es un suburbio exclusivo y consta de habitantes ms viejos
con pocos nios en casa.

Existen 155 hogares en el pueblo A, 62 en el pueblo B y 93 en el rea rural. Analice los mritos
de usar muestreo aleatorio estratificado en esa situacin.

Solucin

La poblacin dividida en tres estratos es bastante natural, simplemente por conveniencia
administrativa para seleccionar la muestra y para ejecutar el trabajo de campo. Adems, los
elementos de cada estrato deben presentar tendencias similares de comportamiento entre ellos
mismos. Se espera relativamente poca variabilidad en el nmero de horas que se ve televisin
en los hogares de cada grupo, y ste es precisamente el caso en que la estratificacin produce
una reduccin en el lmite para el error de estimacin.

La empresa publicitaria puede desear producir estimaciones por separado del nmero promedio
de horas que se ve televisin en cada pueblo. El muestreo estratificado permite estas
estimaciones. Para la muestra aleatoria estratificada tenemos
N
1
=155, N
2
=62 , N
3
=93 y N=310.

Estimacin de una media y un total poblacionales
165

Suponga que se lleva a cabo la encuesta planeada en el ejemplo anterior. La empresa
publicitaria tiene tiempo y dinero suficiente para entrevistar n=40 hogares, y decide seleccionar
muestras aleatorias de tamao n
1
=20 del pueblo A, n
2
=8 del pueblo B y n
3
=12 del rea rural
(despus analizaremos la eleccin de los tamaos de muestra).

Se seleccionan las muestras irrestrictas aleatorias y se realizan las entrevistas. Los resultados,
con mediciones del tiempo que se ve la televisin en horas por semana, se muestra en las tablas
siguientes.

Estime el nmero promedio de horas por semana que se ve televisin en los hogares del
municipio.

Tiempo que se ve televisin en horas por semana


Estrato 1
(pueblo A)
Estrato 2
(pueblo B)
Estrato 3
(rea rural)
35 28 26 41 27 4 49 10 8 15 21 7
43 29 32 37 14 30 20 11 14 30 20 11
36 25 29 31 12 22 34 24
39 38 40 45
28 27 35 34

Clculos

Estrato 1 Estrato 2 Estrato 3
n
1
= 20 n
2
= 8 n
3
= 12
Y
1
= 33.900 Y
2
= 25.125 Y
3
=19.000
S
1
2
= 35.358 S
2
2
= 232.411 S
3
2
= 87.636
N
1 = 155
N
2
= 62 N
3
= 93

Y
ST
=
1
N
N
i
Y
i
i =1
3

Y
ST
=
1
310
((155)(33.900) + (62)(25.125) + (93)(19.000) = 27.7

el nmero promedio de horas por semana que los hogares del municipio ven televisin es de
27.7. Tambin,
V(Y
ST
) =
1
N
2
N
i
2
o
i
2
n
i i=1
3

N
i
n
i
N
i
1
|
\

|
.
|


V(Y
ST
) =

166
1
310 ( )
2
(155)
2
(35.358)(0.877)
20
+
(62)
2
(232.411)(0.885)
8
+
(93)
2
(87.636)(0.88)
12



(

(



= 1.994

La estimacin por intervalos de la media poblacional con una confianza del 95% est dada por:

Y
ST
Zc V(Y
ST
)

27.7 1.96 1.994 27.7 2.77

Estimacin de una proporcin poblacional

La empresa publicitaria quiso estimar la proporcin de hogares en el municipio donde se ve el
programa X. Estime la proporcin de hogares donde se ve el programa X y fije un lmite para el
error de estimacin. Los datos son los siguientes:

Estrato Tamao de
muestra
Nmero de hogares donde se ve el
programa X

P i
1 20 16 0.80
2 8 2 0.25
3 12 6 0.50

Solucin

El valor estimado de la proporcin de hogares donde se ve el programa X esta dado por:


P
ST
=
1
N
N
i

P
i
i=1
3




P
ST
=
1
310
(155)(0.80) +(62)(0.25) + (93)(0.50)
| |
= 0.60

La varainza se estima por:

V(

P
ST
) =
1
(310)
2
(155)
2
(0.8)(0.2)
20
155 20
154
|
\

|
.
|
+(62)
2
(0.25)(0.75)
8
62 8
61
|
\

|
.
|

+(93)
2
(0.5)(0.5)
12
93 12
92
|
\

|
.
|


V(

P
ST
) =
1
(310)
2
168.49 + 79.755 +158.64
| |
V(

P
ST
) = 0.0042

167

Entonces, el valor estimado de la proporcin de hogares en el municipio donde se ve el
programa X, con un lmite para el error de estimacin, est dado por:

0.60 1.96 0.0042
( )
0.60 0.1275

Seleccin del tamao de la muestra

Una investigadora quiso estimar el peso promedio de 90 ratas (50 machos y 40 hembras) que
han sido alimentados con cierta dieta. Las ratas fueron separadas por sexo, por lo que el uso de
muestreo aleatorio estratificado con dos estratos pareci apropiado.

Para aproximar la variabilidad dentro de cada estrato, la investigadora seleccion la rata ms
pequea y la ms grande en cada estrato y las pes. Ella encontr que la amplitud de variacin
fue de 10 gramos para los machos y de 8 para las hembras. Qu tan grande debi tomarse la
muestra para estimar el promedio poblacional con un lmite de 1 gramo para el error de
estimacin? Suponga que el costo de muestreo fue el mismo para ambos estratos.

Solucin

Dado que la desviacin estndar debe ser un cuarto de la amplitud de la variacin, suponiendo
que los pesos tienen una distribucin normal:


o
1
=10 4 = 2.5
o
2
= 8 4 = 2.0

n
i
= n
N
i
o
i
N
i
o
i
i=1
2

|
\



|
.
|
|
|


donde N
i
o
i
= (50)(2.5)
i=1
2
+ (40)(2.0) = 205


n
1
= n
N
1
o
1
N
i
o
i
i=1
2

|
\



|
.
|
|
|
= n
125
205
|
\

|
.
| = 0.61n
n
2
= n
80
205
|
\

|
.
| = 0.39n


Entonces w
1
= 0.61 w
2
= 0.39

Debemos encontrar el valor n:

168
n =
N
i
o
i
i=1
2

|
\

|
.
|
2
N
2
D+ N
i
o
i
2
i=1
2




n =
(205)
2
(90)
2
(1)
2
(1.96)
2
|
\


|
.
|
|
+ (50)(2.5)
2
+(40)(2.0)
2
| |
n =
42025
2108.5 + 472.50
= 16.28



n
1
= 0.61(16.28) = 10
n
2
= 0.39(16.28) = 6


8.6 Ejemplos de muestreo por conglomerados

Cmo seleccionar una muestra por conglomerados

Ejemplo

Un socilogo quiere estimar el ingreso promedio por persona en cierta ciudad pequea. No
existe una lista disponible de adultos residentes. Cmo se debe disear la encuesta por
muestreo?

Solucin

El muestreo por conglomerados parece ser la eleccin lgica porque no se encuentra disponible
una lista de elementos. La ciudad es dividida en bloques rectangulares, excepto las dos reas
industriales y los tres parques que contienen pocas casas. El socilogo decide que cada bloque
de la ciudad va a ser considerado como un conglomerado, las dos reas industriales van a ser
consideradas como otro, y, finalmente, los tres parques van a considerarse un conglomerado
ms. Los conglomerados son numerados sobre un mapa de la ciudad, con los nmeros del 1 al
415. El experimentador tiene tiempo y dinero para muestrear n=25 conglomerados y entrevistar
a cada hogar dentro de cada uno. Entonces, se seleccionan 25 nmeros aleatorios entre 1 y 415,
y los conglomerados con esos nmeros son marcados en el mapa. Despus se asignan los
entrevistadores a cada uno de los conglomerados seleccionados.

Estimacin de una media y un total poblacionales

Ejemplo

Se realizan entrevistas en cada uno de los 25 bloques muestreados en el ejemplo anterior. Los
datos sobre ingresos se presentan en la tabla siguiente. Use los datos para estimar el ingreso
promedio por persona en la ciudad y establezca un lmite para el error de estimacin.

169
Ingreso por persona

Conglo-merado
i
Nmero de
residentes
m
i

Ingreso total por
conglomerado
Y
i

Conglo-merado
i
Nmero de
residentes
mi
Ingreso total por
conglo-merado
Y
i

1 8 $ 96000 14 10 49000
2 12 121000 15 9 53000
3 4 42000 16 3 50000
4 5 65000 17 6 32000
5 6 52000 18 5 22000
6 6 40000 19 5 45000
7 7 75000 20 4 37000
8 5 65000 21 6 51000
9 8 45000 22 8 30000
10 3 50000 23 7 39000
11 2 85000 24 3 47000
12 6 43000 25 8 41000
13 5 64000
m
i
=151
i=1
25

Y
i
=1, 329, 000
i =1
25



El mejor estimador de la media poblacional es:


Y =
Y
i
i =1
25

m
i
i =1
25

=
1,329, 000
151
= 8,801


Para calcular V(Y ) necesitamos las siguientes cantidades:


Y
i
= 82, 039, 000, 000
i =1
25

Y
i
m
i
i =1
25
= 1, 047
Y
i
m
i
= 8, 403, 000
i =1
25



Por tanto,

170

(Y
i
Y m
i
)
2
= 82, 039, 000, 000 2(8, 801)(8, 403, 000) +(8, 801)
2
(1, 047)
i =1
25

= 15, 227, 502, 247




Ya que M es desconocido, la M debe ser estimada por m


m =
m
i
i =1
25

n
=
151
25
= 6.04
V(Y )
415 25
(415)(25)(6.04)
2



(

(
15, 227, 502, 247
24
|
\
|
.
= 653, 758


Entonces, la estimacin de con un lmite para el error de estimacin est dada por:


Y 1.96 V(Y )
8, 801 1, 585


La mejor estimacin del ingreso promedio por persona es $8801 y el error de estimacin debe
ser menor que $1585 con una probabilidad del 95%.
(este lmite para el error de estimacin es bastante grande; podra ser reducido mediante un
muestreo de ms conglomerados).

Seleccin del tamao de la muestra

Ejemplo

Suponga que los datos del problema anterior representan una muestra preliminar de ingresos en
la ciudad. Qu tan grande debe tomarse la muestra en una encuesta futura para estimar el
ingreso promedio por persona con un lmite de $500 para el error de estimacin?
Solucin

Para determinar el valor de n, debemos estimar o
c
2
, el mejor estimador disponible es S
c
2
cuyo
valor es:

S
c
2
=
(Y
i
Y m
i
)
2
i=1
n

n 1
=
15, 227, 502, 247
24
S
c
2
= 634, 479, 260


La cantidad M . Puede ser estimada por m = 6.04

171

D =
B
2
M
2
Zc
2
=
(500)
2
(6.04)
2
(1.96)
2
= 2, 374,115
n =
No
c
2
ND+o
c
2
=
415(634, 479, 260)
415(2, 374,115) + (634, 479, 260)
n = 162.56


Por lo tanto, se deben muestrear 163 conglomerados.


172
C Ca ap p t tu ul lo o I IX X
Regresin Lineal y Correlacin
ASOCI ACI N ENTRE VARI ABLES
Nuestro estudio se ha limitado hasta ahora a los datos univariables, es decir, se hace una
sola observacin de cada unidad elemental de la muestra, produciendo un valor de una
sola variable. Las estadsticas de muestra calculadas son usadas para hacer inferencias o
tomar decisiones acerca de los parmetros correspondientes de la poblacin univariable
progenitora.

En esta parte estudiaremos poblaciones bivariables y multivariables. Una poblacin
bivariable es aquella que contiene dos mediciones de cada elemento. Por ejemplo,
podemos observar la estatura y el peso de cada individuo de una poblacin adulta. Todas
las estaturas seran los valores de una variable X y los pesos los valores de otra variable
Y.

Cuando cada elemento de una poblacin puede dar tres o ms mediciones, cada una de
ellas de una caracterstica especfica, tenemos lo que se llama datos multivariables.

Ejemplo:
Longitud, dimetro y resistencia a la rotura de barras de acero producidas por
cierto proceso nos dan 3 variables con las cuales trabajar.

El principal problema al analizar datos multivariables es descubrir y medir la asociacin o
covariacin entre las variables, es decir, determinar como varan juntas las variables. As,
podemos observar que los hombres ms altos son generalmente ms pesados, y los ms
bajos son generalmente menos pesados. Esto, por supuesto, solo es cierto en promedio,
porque hay excepciones, tales como hombres bajos y pesados y hombres altos y ligeros.

Si puede establecerse una relacin media en una forma matemticamente funcional,
podremos estimar con mucha precisin, en promedio, el peso de un hombre sobre la base
de su estatura. A tal procedimiento se le ha llamado estimacin por asociacin.

Hay dos aspectos relacionados, pero distintos, del estudio de la asociacin entre variables.
El primero, Anlisis de regresin trata de establecer la naturaleza de la relacin entre
variables, es decir, estudiar la relacin funcional entre las variables y, por tanto,
proporcionar un mecanismo de prediccin o pronstico. El segundo, Anlisis de
correlacin tiene como objeto determinar el grado de relacin entre variables.

El anlisis de asociacin tambin puede distinguirse como simple o mltiple. El primero
se ocupa solo de dos variables; el segundo, de tres o ms variables. Adems, existe
tambin la diferenciacin entre anlisis de asociacin lineal y no lineal. Segn el tipo de
relacin que tienen las variables.




173
MODELO DE REGRESIN LINEAL MLTIPLE

En general un modelo poblacional de regresin lineal se escribe como:
Donde:
Y
i
= i-esima observacin de la variable dependiente.

X
ij
= i-esima observacin de la j-esima variable independiente j=1,,p.
|
j
= j-esimo coeficiente de regresin o j-esimo parmetro de regresin.
c
i
= es la diferencia de comportamiento de la variable y en la poblacin y con el
modelo utilizado.

Si no conocemos los parmetros como sucede en la mayora de los casos. Los valores de
los parmetros se encuentran mediante estimadores obtenidos de una muestra i. Dichos
estimadores se representan como |
J
= estimador de |
j
. Al usar los estimadores de los
parmetros, los valores obtenidos para Y en el modelo no son exactos, por tanto, existe
un error no observable el cual llamamos c
i
= error no observable en la estimacin de Y de
tal manera que el modelo de regresin lineal queda en trminos de valores estimados
como.




Y
i
=

|
0
+

|
1
x
1i
+

|
2
x
2i
+... +

|
p
x
pi
Y
i
=

Y
i
+c
i


Supuestos.
1. Las variables independientes X
j
tiene valores que son fijados por el investigador.
2. El trmino c
i
es una variable cuya distribucin de probabilidad se supone que es
normal con E(c
i
)= 0
3. La varianza de c
i
es o
2

4. Los errores son estadsticamente independientes COV( c
i
, c
j
) = 0


Empleando notacin matricial, se tiene:

Y
1
=

|
0
+

|
1
x
11
+

|
2
x
21
+... +

|
p
x
p1
+c
1
Y
2
=

|
0
+

|
1
x
12
+

|
2
x
22
+... +

|
p
x
p2
+c
2
.
.
.
Y
n
=

|
0
+

|
1
x
1n
+

|
2
x
2n
+...+

|
p
x
pn
+c
n


Y= f (x
1
, x
2
,...,x
p
)
Y
i
= |
0
+|
1
x
1i
+ |
2
x
2i
+ ... + |
p
x
pi
+ c
i
174
Sea
Y vector x matriz
Y =
Y
1
Y
2
.
.
.
Y
n









(

(
(
(
(
(
(
(
n*1
x =
1 x
11
x
21
... x
p1
1 x
12
x
22
... x
p2
1 x
13
x
23
... x
p3
.
.
.
1 x
1n
x
2n
... x
pn












(

(
(
(
(
(
(
(
(
(
(
n*(p+1)
| =

|
0

|
1
.
.
.

|
p










(

(
(
(
(
(
(
(
(
(p+1)*1
E =
c
1
c
2
.
.
.
c
n









(

(
(
(
(
(
(
(
n*1

reduciendo todo a: Y = x | + E

Dicha ecuacin matricial tiene las siguientes caractersticas:
-

E Y

Y
( )
= 0
E

Y
1
+ c
1
-

Y
1

Y
2
+ c
2
-

Y
2
.
.
.

Y
n
+ c
n
-

Y
n













(

(
(
(
(
(
(
(
(
(
(
= 0


E ( E ) = 0 vector de ceros

175
-
( )
| |
(
(
(
(
(
(
(
(
(
(

=
=
(
(
(
(
(
(
(
(

=
=
2
3 2 1
3
2
3 2 3 1 3
2
2
2 1 2
1 2 1
2
1
2 1
T
2
1
2
. . .
.
.
.
. . .
. . .
. . .
... E
.
.
.

n n n n
n
n
n
T
n
n
T
EE
E
I E E E
c c c c c c c
c c c c c c c
c c c c c
c c c c c
c c c
c
c
c
o

E E E
T
( )
=
o
2
0 0
0 o
2
0
.
.
. . o
2








(

(
(
(
(
(
(
= o
2
I

M M T TO OD DO O D DE E E ES ST TI IM MA AC CI I N N D DE E L LO OS S P PA AR R M ME ET TR RO OS S D DE E R RE EG GR RE ES SI I N N

MTODO DE MNIMOS CUADRADOS
Se busca minimizar la suma de los errores al cuadrado

Y
i


Y
i ( )
i =1
n

2
=

|
0
+

|
1
x
1i
+

|
2
x
2i
+ ...+

|
p
x
pi
+ c
i


|
0


|
1
x
1i


|
2
x
2i
...

|
p
x
pi ( )
i=1
n

2
= c
i
2
= E
T
i =1
n
E = SCE

176
E
T
E = c
1
c
2
... c
n
| |
c
1
c
2
.
.
.
c
n









(

(
(
(
(
(
(
(
= c
1
2
+c
2
2
+... + c
n
2
= c
i
2
i=1
n


Deseamos encontrar parmetros que minimicen E
T
E.


E
T
= Y

Y
( )
T
= Y x| ( )
T
= Y
T
|
T
x
T
E
T
E = Y
T
|
T
x
T
( )
Y x|
( )
E
T
E = Y
T
Y
1*n ( )
Y
T
n*p+1 ( )
x
p+1*1 ( )
| |
T
x
T
Y +|
T
x
T
x|
E
T
E = Y
T
Y Y
T
x|
( )
T
es un # y el transpuesto
de un# es el mismo #
|
T
x
T
Y +|
T
x
T
x|


E
T
E = Y
T
Y |
T
x
T
Y |
T
x
T
Y +|
T
x
T
x|
E
T
E = Y
T
Y 2|
T
x
T
Y +|
T
x
T
x
Sea A=x
T
x
oY
T
AY
cY
T
=2AY
por ser una cuadrtica
|


( ) Y x x
Y x x
x x Y x
x x
E E
x x Y x
E E
T
T
T T
T
T
T
T T
T
T
1
T
T
2
2
x =
2 2x
0 2 2
Mnimo 0 > 2
2 2

=
= +
=
+ =
|
|
|
| c
c
|
c|
c



177
Donde,
x
T
x =
n x
1i
x
2i
. . . x
pi

x
1i
x
1i
2
x
1i
x
2i
. . . x
1i
x
pi

x
2i
x
1i
x
2i
x
2i
2
. . x
2i
x
pi

.
.
.
x
pi
x
1i
x
pi
x
2i
x
pi
. . . x
pi
2

|
\











|
.
|
|
|
|
|
|
|
|
|
|
|

x
T
Y =
y
x
1i
y
i

x
2i
y
i

.
.
.
x
pi
y
i

|
\









|
.
|
|
|
|
|
|
|
|
|

Ejemplo.
Con el objeto de estimar la funcin de demanda para el arroz en base a una muestra
aleatoria de 10 familias, llegamos a los siguientes resultados.

Y
Consumo semanal lbs /
familia
X
1

Precio $ / libra
X
2

Ingreso Miles de $
5 2 3
8 3 4
8 5 6
9 4 5
9 6 7
13 2 6
6 3 4
9 4 5
4 5 4
3 6 3
Y = |
0
+ |
1
x
1
+ |
2
x
2

178
Al no conocer los valores de |, los estimamos


| =

|
0

|
1

|
2
|
\




|
.
|
|
|
|
= x
T
x
( )
1
x
T
Y
x =
1 2 3
1 3 4
1 5 6
1 4 5
1 6 7
1 2 6
1 3 4
1 4 5
1 5 4
1 6 3
|
\













|
.
|
|
|
|
|
|
|
|
|
|
|
|
|
Y =
5
8
8
9
9
13
6
9
4
3
|
\













|
.
|
|
|
|
|
|
|
|
|
|
|
|
|


x
T
x =
n x
1i
x
2i

x
1i
x
1i
2
x
1i
x
2i

x
2i
x
1i
x
2i
x
2i
2

|
\



|
.
|
|
|
=
10 40 47
40 180 192
47 192 237
|
\



|
.
|
|
|


x
T
Y =
y
x
1i
y
i

x
2i
y
i

|
\



|
.
|
|
|
=
74
282
375
|
\



|
.
|
|
|


x
T
x
( )
1
=
1, 894 - 0.149 - 0.255
-0.149 0.053 - 0.013
-0.255 - 0.013 0.065
|
\



|
.
|
|
|



| =
2.513
0.955
1.839
|
\



|
.
|
|
|

179


Y = 2.513 0.955x
1
+1.839x
2

I NTERPRETACI N

c- |
0
el consumo por familia es de 2.513 lb de arroz cuando el ingreso y el precio es
cero.
d- |
1
por cada peso que aumente el precio de la lb de arroz, el consumo disminuir en
0.955 lbs siendo constante el ingreso familiar.
1. |
2
por cada 1000 pesos que aumente el ingreso, el consumo por familia aumenta en
1.839 lbs permaneciendo el precio constante.

C C L LC CU UL LO O D DE E L LA A V VA AR RI IA AN NZ ZA A



o
2
= S
2
=
SCE
n (p +1)

Donde:
SCE = Y
T
Y

|
T
x
T
Y
Y
T
Y= Y
i
2


Ejemplo:
En el problema anterior, estimar la varianza de la regresin.

S
2
=

o
2
=
SCE
n (p +1)
SCE = Y
T
Y

|
T
x
T
Y = 626 2.513 - 0.955 1.839 | |
74
282
375
|
\



|
.
|
|
|
SCE = 626 606.277 =19.723
S
2
=

o
2
=
19.723
10 3
= 2.8175714




INFERENCIA RELATIVA A LOS VALORES DE

180
E

|
( )
= E (x
T
x)
1
x
T
Y
| |
= E (x
T
x)
1
x
T
x| + c
( )
| |
= E (x
T
x)
1
x
T
x
I
| + x
T
x
( )
1
x
T
c




(

(
(
= E I| ( ) + x
T
x
( )
1
x
T
E c ( )
= E | ( ) + 0
E

|
( )
= E | ( )= |


E

|
0
( )
E

|
1
( )
.
.
.










(

(
(
(
(
(
(
(
(
=
|
0
|
1
.
.
.








(

(
(
(
(
(
(



V

|
( )
= E

| E

|
( )
| |
2


Si calculamos

| |
( )

| |
( )
T
tendremos una matriz cuyos valores de la diagonal
principal son

|
j
|
j ( )
2
. Podemos entonces utilizar esta expresin para calcular el
valor de la varianza.
181

| = x
T
x
( )
1
x
T
x| + E ( )

| = x
T
x
( )
1
x
T
x| + x
T
x
( )
1
x
T
E

| = | + x
T
x
( )
1
x
T
E

| |
( )
= x
T
x
( )
1
x
T
E

| |
( )

| |
( )
T
= x
T
x
( )
1
x
T
E


(

x
T
x
( )
1
x
T
E


(

T
= x
T
x
( )
1
x
T
EE
T
x x
T
x
( )
1
V

|
( )
= E x
T
x
( )
1
x
T
EE
T
x x
T
x
( )
1


(

= x
T
x
( )
1
x
T
E EE
T
( )
x x
T
x
( )
1
= x
T
x
( )
1
x
T
o
2
Ix x
T
x
( )
1
= o
2
x
T
x
( )
1
x
T
Ix
x
T
x
x
T
x
( )
1
= o
2
x
T
x
( )
1



V |
j
( )
= o
2
x
T
x
( )
jj
1
Cov

|
i
,

|
1
( )
= o
2
x
T
x
( )
ij
1
o
|j
= o
2
x
T
x
( )
jj
1

x
T
x
( )
1
=
x
T
x
( )
00
1

x
T
x
( )
11
1

.
.
.
|
\









|
.
|
|
|
|
|
|
|
|
|


182
Usualmente el valor de o
2
ser desconocido y necesitaremos hacer uso de las
observaciones muestrales para estimar a o
2
.
s
2
=

o
2
=
SCE
n p +1 ( )
=
E
T
E
n p +1 ( )

donde
SCE = Y
T
Y |x
T
Y
Y
T
Y= Y
i
2


Como

|
j
estn en funcin de los c
i
, y los c
i
estn distribuidos normalmente

|
j
~ N |
j
, o
2
x
T
x
( )
jj
1
|
\

|
.
|
.

INFERENCIA CONCERNIENTE A LOS PARMETROS |
J

Caso I:
o
2
es conocida o
o
2
desconocida y n-(p+1)>30.
P z
c
s

|
j
|
j
o
2
x
T
x
( )
jj
1
s z
c
|
\



|
.
|
|
|
= 1 o
P z
c
o
2
x
T
x
( )
jj
1


|
j
s |
j
s z
c
o
2
x
T
x
( )
jj
1


|
j
|
\

|
.
| = 1 o
P

|
j
z
c
o
2
x
T
x
( )
jj
1
s |
j
s

|
j
+ z
c
o
2
x
T
x
( )
jj
1
|
\

|
.
| = 1 o

Nota: en el caso I si o
2
desconocida se estima mediante s
2
=
SCE
n p +1 ( )

Caso II:
o
2
se desconoce y n-(p+1)<30

183

|
j
~ N |
j
, o
2
(x
T
x)
jj
1
( )

|
j
|
j
o
2
x
T
x
( )
jj
1
~ N 0,1 ( )
c
i
~ N 0, o
2
( )
c
i
2
o
2
~ _
(1)
2
c
i
2
i =1
n

o
2
=
E
T
E
o
2
~ _
n p+1 ( )
2


p+1 variables de tipo |
j
dependen del error; lo que causa una reduccin en gl.



T =

|
j
|
j
E
T
E
o
2
n p + 1 ( )
=

|
j
|
j ( )
o
2
x
T
x
( )
jj
1
E
T
E
o
2
n p + 1 ( ) ( )
T =

|
j
|
j ( )
o n p + 1 ( )
E
T
Eo x
T
x
( )
jj
1
~ t
n p+1 ( )


184
P t
c
s T s t
c
( )= 1 o
P t
c
s

|
j
|
j ( )
n p +1 ( )
E
T
E x
T
x
( )
jj
1

s t
c
|
\



|
.
|
|
|
= 1 o
P
t
c
E
T
E x
T
x
( )
jj
1
n p + 1 ( )


|
j
s |
j
s
t
c
E
T
E x
T
x
( )
jj
1
n p + 1 ( )


|
j
|
\



|
.
|
|
|
= 1 o
P

|
j

t
c
E
T
E x
T
x
( )
jj
1
n p + 1 ( )
s|
j
s

|
j
+
t
c
E
T
E x
T
x
( )
jj
1
n p + 1 ( )
|
\



|
.
|
|
|
= 1 o


PRUEBA DE HIPTESIS PARA |
J


Sea |
i0
un valor cualquiera

H
0
: |
i
=
s
>
|
io
H
a
: |
i
=
>
<
|
io

Estadstico de Prueba

Si o
2
conocido o o
2
desconocido y n-(p+1)>30
z =

|
j
|
j
o
2
x
T
x
( )
jj
1
~ N(0,1)

Si o
2
desconocido y n-(p+1)<30
185
T =

|
j
|
j
( )
n p +1
( )
E
T
E x
T
x
( )
jj
1
~ t
n p+1
( )



INFERENCIAS RELACIONADAS CON FUNCIONES LINEALES
D DE E L LO OS S P PA AR R M ME ET TR RO OS S D DE EL L M MO OD DE EL LO O

Muchas veces se puede estar interesado en realizar inferencias acerca de funciones
lineales de los parmetros del modelo |
0
, |
1
, ..., |
p
. Suponga que se desea realizar
inferencia acerca de la funcin lineal C
0
|
0
+ C
1
|
1
++C
p
|
p
donde C
0
, C
1
,C
p
son
constantes, algunos de los cuales son diferentes de cero.

Sea C
T
| una funcin estimable a partir de C
T

| .
Requeremos conocer la distribucin de C
T

| .

E C
T
|
( )
= C
T
E

|
( )
= C
T
|
V C
T

|
( )
= E C
1xp+1
T
|
p+1x1
E C
T

|
( )
es un nmero
|
\


|
.
|
|
2
V C
T
|
( )
= E C
T
| C
T
|
( )
C
T
| C
T
|
( )
su transpuesto es el
mismo nmero
T






(

(
(
(
(

V C
T

|
( )
= E C
T

| |
( )
C
T

| |
( ) ( )
T


(

= E C
T

| |
( )

| |
( )
T
C


(





C
T
es un vector de constantes
186

= C
T
E

| |
( )

| |
( )
T
|
\
|
.
C
= C
T
o
2
x
T
x
( )
1
C
= o
2
C
T
x
T
x ( )
1
C
( )


pero

|
0
,

|
1
...

|
k
estn normalmente distribuidos y C
T
| es una funcin lineal de variables
aleatorias distribuidas normalmente. Por tanto, C
T
| est distribuido normalmente.

C
T

| ~ N C
T
|,o
2
C
T
x
T
x ( )
1
C
( )

Caso I:
Si o
2
es conocido o estimable (n-(p+1)>30)

z =
C
T
| C
T
|
o C
T
x
T
x
( )
1
C
~ N 0,1 ( )

Caso II:
Si o
2
es desconocido y n-(p+1)<30



z =
C
T

| C
T
|
o C
T
x
T
x
( )
1
C
~ N 0,1 ( )
c
i
~ N 0, o
2
( )
c
i
o
~ N 0,1 ( )
c
i
2

o
2
=
SCE
o
2
~ _
n p+1 ( )
2


T =
C
T

| C
T
|
o C
T
x
T
x
( )
1
C
SCE
o
2
n p + 1 ( )
=
C
T

| C
T
|
o C
T
x
T
x
( )
1
C
SCE
o n p +1
( )


187

T =
C
T

| C
T
|
C
T
x
T
x
( )
1
C
s
=
C
T
| C
T
|
s C
T
x
T
x
( )
1
C
~ t
n p+1 ( ) ( )
Donde s =

o =
SCE
n p +1 ( )



PRUEBA DE HIPTESIS PARA C
T
|



H
0
: C
T
|
s
=
>
r
0
H
a
: C
T
|
>
=
<
r
0


Siendo ro un valor a verificar de C
T
|.

Estadstico de prueba

Caso I:
Si o
2
conocida o estimable (n-(p+1) > 30).

z =
C
T
| C
T
|
o C
T
x
T
x
( )
1
C
~ N 0,1 ( )

Caso II:
Si o
2
desconocida y n-(p+1) < 30.

T =
C
T
| C
T
|
s C
T
x
T
x
( )
1
C
~ t
n p+1 ( )
( )

INTERVALO DE CONFIANZA PARA C
T
|

Caso I:
Si o
2
conocida o estimable
188
( )
( ) ( ) o o | | o |
o
=
|
.
|

\
|
+ s s
= s s

1

1
1 1
C x x C z C C C x x C z C P
z z z
T T
c
T T T T
c
T
c c

Caso II:
Si o
2
desconocida y n-(p+1) < 30.

P C
T

| t
c
s C
T
x
T
x
( )
1
C s C
T
| s C
T

| + t
c
s C
T
x
T
x
( )
1
C
|
\
|
.
= 1 o

Una aplicacin usual de las tcnicas de prueba de hiptesis e intervalo de confianza
presentados es la siguiente:

|
0
+|
1
x
10
+|
2
x
20
+. . . +|
p
x
p0


donde x
i0
denotan valores particulares de x
i
. Esto es un caso particular de:

C
0
|
0
+ C
1
|
1
+ . . . + C
p
|
p
con C
0
=1
C
1
= x
10
.
.
.
C
p
= x
p0


Pudiendo hacer inferencia acerca de:

|
0
+|
1
x
10
+|
2
x
20
+. . . +|
p
x
p0


Cuando,
x
1
= x
1, 0
x
2
= x
2,0
.
.
.



P PR RE ED DI IC CC CI I N N D DE E U UN N V VA AL LO OR R P PA AR RT TI IC CU UL LA AR R D DE E Y Y

Al desear predecir un valor particular de Y usando

Y como predictor se comete un error
de prediccin.
Error = Y-

Y
189
Y y

Y son v. a. distribuidas normalmente. El error es una funcin lineal de Y y

Y por
tanto, el error Y-

Y esta distribuido normalmente.

E error ( ) = E Y

Y
( )
= E Y ( ) E

Y
( )
= 0
V error ( ) = Y Y

Y
( )
= Y Y ( ) + V

Y
( )
2Cov Y,

Y
( )
Ya que predecimos un valor futuro de Y no empleado en

Y se sigue que Y y

Y son
independientes y su Cov(Y,

Y )=0


V error
( )
= V Y
( )
+ V

Y
( )
= o
2
+ o
2
C
T
x
T
x
( )
1
C
Y

Y ~ N 0, o
2
1+ C
T
x
T
x ( )
1
C
( ) ( )
z =
Y

Y
o 1 + C
T
x
T
x ( )
1
C
~ N 0,1
( )



INTERVALO DE CONFIANZA PARA Y

Caso I:
Si o
2
es conocida o n-(p+1)>30

P z
c
s z s z
c
( )=1 o

Y z
c
o 1 + C
T
x
T
x ( )
1
C


Caso II:
Si o
2
es desconocida y n-(p+1)<30


t =
Y

Y
o 1 + C
T
x
T
x
( )
1
C
SCE
o
2
n p +1 ( )
~ t
n p +1 ( )
t =
Y

Y
s 1 + C
T
x
T
x ( )
1
C
~ t
n p+1
( )

Y t s 1 + C
T
x
T
x ( )
1
C




190
CONSTRUCCIN DE MODELOS:
P PR RU UE EB BA A D DE E U UN NA A P PA AR RT TE E D DE EL L M MO OD DE EL LO O

Suponga que se tiene el Modelo:
Y =|
0
+|
1
x
1
+|
2
x
2
+ . . . +|
k
x
k
+c
y se desea saber si ciertas variables contribuyen con informacin para la prediccin de Y.
En otras palabras, si los trminos correspondientes a esas variables deben estar en el
modelo.

Si un conjunto de variables independientes x
I
no contribuyen con informacin alguna
para la prediccin de Y entonces sus parmetros | deben ser igual a cero. En
consecuencia, el probar si cierta variable debe incluirse en el modelo es equivalente a
probar la hiptesis de que ciertos parmetros | son cero.

Suponga que se tienen 2 modelos.

Modelo (1) reducido |
0
+|
1
x
1
+|
2
x
2
+ . . . +|
g
x
g

Modelo (2) completo |
0
+|
1
x
1
+|
2
x
2
+ . . . +|
g
x
g
+ . . . +|
k
x
k


La descripcin intuitiva de la prueba es la siguiente:
Se utiliza el mtodo de mnimos cuadrados para calcular SCE
1
del modelo 1.
Se calcula SCE
2
del modelo 2.
Se comparan las dos sumas de cuadrados de error SCE
1
y SCE
2
.

Si x
g+1
, x
k
no proporcionan informacin para predecir a Y.
H
o
: |
g+1
= |
g+2
=. . . =|
k
= 0

se utiliza el estadstico siguiente:
SCE
1
o
2
~ _
n(g+1)
2
SCE
2
o
2
~ _
n(k+1)
2
SCE
1
SCE
2
o
2
~ _
ng1(nk1)=k g
2
F =
SCE
1
SCE
2
k g
SCE
2
n (k +1)
=
Re duccin SCE
s
2
Modelo completo
~ F
kg, nk1


Mientras mayor sea la reduccin en la suma de cuadrados del error, ms evidencia se
tendr para rechazar Ho.
Es decir, se rechaza H
o
: |
g+1
= |
g+2
=. . . =|
k
= 0. Cuando F es grande, razn por la
cual se emplea una prueba de cola derecha.

191




o



MODELOS DE REGRESIN CURVILINEALES.

Habiendo introducido el anlisis de regresin lineal mltiple es posible una extensin
natural de este estudio sobre relaciones entre variables de tipo curvilneo o no lineal.
Algunos de los modelos que pueden seguir son:

Funciones Polinomiales.

Y
i
= |
0
+|
1
x
i
+|
2
x
i
2
+ ... + |
k
x
i
k
+ c
i


Aunque puede suponerse que la relacin entre dos variables puede asumir una funcin
lineal de cualquier grado, generalmente buscamos un grado lo ms bajo posible.

Una funcin polinomial muy empleada es la parbola

Y
i
= |
0
+|
1
x
1i
+|
2
x
1i
2


Para hallar los estimadores de mnimos cuadrados efectuamos la siguiente
transformacin.
x
i
2
= z
Y
i
= |
0
+|
1
x
1i
+|
2
z
i


idntico a la ecuacin de regresin lineal mltiple.

Funcin exponencial.

Una funcin no lineal muy til que se aplica en situaciones que son incompatibles con las
funciones polinomiales es la funcin exponencial. La ecuacin ser:
Y = ab
x
(1)
Tomando logaritmo a ambos lados
log Y=log a + x log b
c = log a z = log Y
d = log b
Y = c + dx (2)
Para transformar (2) en la forma original (1) se tiene:
a = antilog c
b = antilog d
Y = antilog z
192

Funcin potencia o transformacin doble log.
Y = a x
b

log y = log a + b log x
z = c + b w

Funcin recproca.
Y = a + b/x
z =1/x a, b, x >0
Y =a+bz

Funcin curvilineal mltiple.
Y= a x
b
y
e

log Y = log a + b log x + c log y
z 0 d + bw
1
+ c w
2


Curva recproca.
1/Y = a+bx
z= a+bx

Algunas formas de curvas de aproximacin que se emplean con frecuencia son:

Curva de primer grado:
bx a Y
t
+ =
Curva de segundo grado:
2
cx bx a Y
t
+ + =
Curva de tercer grado:
3 2
dx cx bx a Y
t
+ + + =
Curva exponencial:
x
t
ab Y =
Curva recproca:
bx a
Y
t
+ =
1

Exponencial modificada:
x
t
bc a Y + =
Curva Gompertz:
x
c
t
ab Y =
Curva logstica:
( )
x
t
bc a
Y
+
=
1



193



COEFICIENTE DE DETERMINACIN MLTIPLE

Habiendo obtenido la ecuacin de regresin de la muestra, debemos establecer si los
resultados de la muestra son estadsticamente significativos, antes de poder usar la
ecuacin de regresin como instrumento de prediccin.
Podemos descomponer la varianza muestral de Y as.

Y
i
Y
( )
i =1
n

2
desvosde Y con
respecto a la
media
=

Y
i
Y
( )
i=1
n

2
desviosexplicados
por el modelo de
regresin
+ Y
i


Y
i
( )
i =1
n

2
desviosno explicados
por el modelo
SCT = SCR + SCE


Podemos definir el coeficiente de determinacin como:

R
2
=
SCR
SCY
=1
SCE
SCY
Donde SCY = Y
i
2

nY
2


R
2
ser una medida del grado de ajuste del plano de regresin a los puntos reales.
Cuanto ms se acerca el valor de R
2
a 1 tanto menor es la dispersin de los puntos
alrededor del plano de regresin y tanto mejor es el ajuste.
Ej. R
2
=0.946 Significa que el 94.6 de las variaciones en Y son explicados por las x con
el modelo empleado.

COEFICIENTE DE CORRELACIN SIMPLE

Sirve para calcular la fuerza con que dos variables se encuentran linealmente
relacionadas. Este indicador no depende de las escalas en que cada una de las variables se
haya medido. Se conoce como una medida de la correlacin lineal entre 2 variables.

r
y x
1
=
SC
yx
1
SC
y
SC
x
1

Donde:
194
SC
yx
1
= Y
i
x
1i
nx
1
Y
i =1
n

SC
x
1
= x
1i
2
nx1
2
i=1
n

SC
y
= Y
i
2
i =1
n

nY
2
r
yx
1
= 0 indica ausencia de correlacin lineal entre Y y x.
r =1 o -1 Todos los puntos pertenecen a la lnea recta.
r = 0 y 1 muestra cierto grado de dependencia lineal.

COEFICIENTE DE CORRELACIN PARCIAL

Este concepto solo existe cuando hay 2 o ms variables independientes. El coeficiente de
correlacin parcial nos ayuda a contestar preguntas como: Se debe la correlacin entre x
1

y x
2
meramente al hecho de que ambos son afectados por x
3
o hay una ecuacin neta entre
x
1
y x
2


Los coeficientes de correlacin parcial estn estrechamente relacionados con los
coeficientes de correlacin simple.


r
yx
1
=
SC
yx
1
SC
y
SC
x
1
r
yx
2
=
SC
yx
2
SC
y
SC
x
2
.
.
.
r
x
1
x
2
=
SC
x
1
x
2
SC
x
1
SC
x
2


De las correlaciones simples podemos definir las correlaciones parciales.

( )( )
( )( )
2 2
yx
,
2 2
yx
,
2 1 ,
2 1 1
2 1 1 1
1 2
2 1 2
2 1 2 1
2 1
2 1
1 1
r -
1 1
r -
constante permanece x cuando y x y entre parcial n correlaci
x x yx
x x yx
x x
x x yx
x x yx
x yx
x yx
r r
r r
ry
r r
r r
r
r

=

=

Los cuadrados de los coeficientes de correlacin parcial se llaman coeficientes de
Determinacin parcial.
195

Ejemplo:
r
yx1 ,x2
2
= 0.86 significa que ms del 86% de las variaciones en Y no asociados con x
2
se
asocian con x
1

Ejemplo:

Los datos siguientes se refieren a las dosis de rayos csmicos medidas a varias altitudes:


A Al lt ti it tu ud d R Ra az z n n d de e D Do os si is s
(Pies) (mrem/ao)
X X Y Y
50 28
150 30
780 32
1200 36
4400 51
4800 58
5300 69

1. Ajuste a una curva exponencial
Y= ab
x


Iny = Ina + Xlnb c=Bo
z = c + Xu u=B1
u X c z + =

Z Z X X
3.3322045 1 50
3.4011974 1 450
3.4657359 1 780
3.5835189 1 1200
3.9318256 1 4400
4.060443 1 4800
4.2341065 1 5300

) ( ) (

1
Y X X X
T T
= |

(X
T
X)
1
=
0.32932941109 7.68731375x10
5
-7.687313759x10
-5
3.16909283x10
-8
|
\

|
.
|


|
|
.
|

\
|
=
4
10 534186139 . 1
34342626 . 3

x
| X x z
4
10 534186139 . 1 34342626 . 3

+ =

196
2. Con el resultado obtenido en la parte (a), estime en forma puntual y por intervalos la
dosis media a una altitud de 3000 pies.

(o = 0.05).

Forma Puntual:

866 . 44 ) (
803682 . 3 ) (
) 3000 ( 9x10 1.53418613 + 3.34342626 = ) z E(
3000 = X ) (
4 -
1 0
=
=
+ =
y E
z E
X z E | |



Por Intervalos:
( ) o | | = s s
=

1 ) (

) ( ) (

3000
1

1 1
C X X C tcs C z E C X X C tcs C P
C
T T T T T T


( ) ( )
( )
( ) 95 . 0 47.9102 ) y E( 42.2709 P
47.9102 y 42.2709 entre ecuentra se dosis razn la de media la 95% del confianza una Con
95 . 0 86329 . 3 ) ( 74410 . 3
153308 . 0 10 504916 . 3 571 . 2 803698 . 3
3000
1
3000 10 504916 . 3 571 . 2
10 53 . 1
34 . 3
3000
3
1
3
4
= s s
= s s

z E P
x
X X x
x
T


3. Estime la varianza de la regresin.


3 2
2 2
10 504916 . 3
5
01752458 . 0
5
38124742 . 97 398772 . 97
5

= =

= =
x S
y X yTy
S
T T
|
o


4. Pruebe la significancia individual de cada parmetro de la regresin.

(o = 0.05)
197
( ) ( )
( )
0 dosis de razn la para iva significat
es si altitud variable la tanto lo por Ho la rechaza se 95% del confianza una Con
557 . 14
10 16909283 . 3 01752458 . 0
5 0 10 534186139 . 1
) (
1

0 :
0 :
1
3
4
1
11
1 1
1
1
=
=

=
+
=
=
=

|
| |
|
|
x
x
t
X X E E
p n
t
Ha
Ho
T T

( ) ( )
( )
dosis. de razn
la a contribuye si 0 tanto lo por Ho la rechaza se 95% del confianza una Con
40 . 98
3293294109 . 0 01752458 . 0
5 0 34342626 . 3
) (
1

0 :
0 :
0
1
00
0 0
0
0
=
=

=
+
=
=
=

|
| |
|
|
t
X X E E
p n
t
Ha
Ho
T T


5. Calcule el Coeficiente de Determinacin.



R
2
= 1 SCE / SCy
SCE = 0.01752458
SCy = 1.05 R
2
= 1
0.01752
1.05
|
\

|
.
|
R
2
= 0.98 = 98.33%
Las variables X son explicadas o explican el modelo




198
6. Cambie la ecuacin obtenida en la parte (a) a la forma

Y= ae
cX
y emplea el
resultado para resolver de nuevo la parte (e).

7. Ajuste una curva Gompertz de la forma

Y= e
oX+|
y determine el coeficiente de
determinacin.