You are on page 1of 63

PROBABILIDADES

La probabilidad nos permite estudiar o analizar los fenmenos o procesos llamados aleatorios.
ESPACIO MUESTRAL Y EVENTOS
El conjunto S de todos los resultados posibles de un experimento aleatorio dado se llama
espacio muestral. Un evento A es un conjunto de resultados o, en otras palabras, un
subconjunto del espacio muestral S. Como un evento es un conjunto, podemos combinar
eventos para formar nuevos eventos usando las varias operaciones entre conjuntos:
(1)
(2)
(3)

es el evento que ocurre siempre y cuando ocurra o o (o ambos).


es el evento que ocurre siempre y cuando ocurran tanto como .
el complemento de , es el evento que ocurre siempre y cuando no ocurra .

Dos eventos y se llaman mutuamente excluyentes si son disyuntos, o sea,


. En
otras palabras, y son mutuamente excluyentes si y slo si no ocurren simultneamente.
Ejemplo 1.
Experimento: Lance un dado y observe el nmero que resulta. El espacio muestral es,
S={
Sea A el evento de que salga un nmero par, B de que salga un nmero impar y C de que
salga un nmero primo.
A={
B={
C={
Encuentre:

PROBABILIDAD CLSICA
Se da el nombre de probabilidad clsica cuando sta se toma objetivamente (en sentido
prctico) y se puede considerar de dos maneras: a priori y a posteriori.
Sea S un espacio muestral finito y A un evento del espacio muestral, entonces la probabilidad
de A se denota P(A) y se define:

( )

Estadstica Inferencial

Jorge Luis Bustos Galindo

Pgina 1

Ejemplo 2.
Se lanza un dado dos veces; halle la probabilidad de los eventos siguientes: A la suma de los
puntos es siete y B la suma de los puntos es menor o igual a cinco.
S={
A={
B={
P(A) =
P(B) =

PROPIEDADES ELEMENTALES DE LA PROBABILIDAD


Las reglas generales de probabilidad las podemos dividir en dos grupos. Un primer grupo
formado por las reglas que podramos llamar primarias o bsicas, llamadas axiomas. Estas
reglas no se aprecian directamente en la solucin de problemas, pero son las que dan un
soporte lgico a las que se utilizan directamente en la solucin de tales problemas y que se
llaman teoremas. Establecemos en primera instancia los axiomas.
Axioma 1. Si A es un evento del espacio muestral S, entonces P(A) representa un nmero
entre 0 y 1 incluidos. Esto es,
( )

Axioma 2. Si S es el espacio muestral asociado a un experimento aleatorio, entonces P(S) es


igual a 1, o sea,
( )

Axioma 3. Si A y B son eventos mutuamente excluyentes, entonces la probabilidad de A o B,


(
), es igual a la suma de las probabilidades individuales. Esto es,
(

( )

( ).

A partir de los tres axiomas anteriores se deducen los teoremas que constituyen reglas para
calcular probabilidades de situaciones ms o menos complejas.
Teorema 1. Si A es el evento vaco entonces su probabilidad es cero. Es decir,
( )

Teorema 2. Si A es un evento y A su complemento, entonces la probabilidad de A es igual a


uno menos la probabilidad de A. Esto es,
(

( ).

Ejemplo 3. Suponga que en una urna hay cuatro bolas blancas y seis rojas. De la urna se
extrae al azar una bola y sea A: la bola extrada es roja. Hallar la probabilidad de que la bola
extrada no sea roja.
(

Teorema 3. Si A y B son dos eventos del espacio muestral S, entonces


(

Estadstica Inferencial

( )

( )

Jorge Luis Bustos Galindo

).

Pgina 2

Ejemplo 4. En un curso de 10 hombres y 20 mujeres, la mitad de los hombres y la mitad de


las mujeres tienen ojos pardos. Encuentre la probabilidad de que una persona escogida al azar
sea hombre o tenga ojos pardos.
A={
B={
(

PROBABILIDAD CONDICIONAL
Sean A y B dos eventos, la probabilidad condicional de A dado B se denota y se define de la
manera siguiente:
(

)
( )

( )

Igualmente se tiene que


(

)
( )

( )

como la probabilidad de B dado A.


Ejemplo 5. La oficina de Accin Social lleva a cabo un censo de todas las personas que viven
en una pequea comunidad. Los encuestadores anotan en una relacin el nmero de visitas
que una persona hace al centro de salud y las condiciones sanitarias de la vivienda que habita.
Los resultados son los siguientes:
Tabla 1. Nmero de visitas que una persona hace al centro de salud y las condiciones
sanitarias de la vivienda que habita.
Condiciones sanitarias
Nmero de visitas

Total
Buenas

Malas

Dos o menos

700

100

800

Ms de dos

800

400

1200

Total

1 500

500

2 000

Con base en esta tabla, si preguntamos, cul es la probabilidad de que una persona escogida
al azar viva en malas condiciones sanitarias?
A={
P(A) =
Si la pregunta ahora es, cul es la probabilidad de que una persona escogida al azar viva en
malas condiciones sanitarias, dado que visita dos veces o menos el centro de salud?
B={
P(A/B) =

Estadstica Inferencial

Jorge Luis Bustos Galindo

Pgina 3

TEOREMA DE LA PROBABILIDAD TOTAL


Este teorema o regla de probabilidad total nos indica cmo calcular la probabilidad de un
evento A cuando conocemos las probabilidades condicionales [ ] en donde los
forman
una particin del espacio muestral S.
}
Supongamos que
es una particin de un espacio muestral S. Si A es un evento de S.
[ ] [ ]
[ ] [ ]
[ ] [ ]
[ ] [ ]
Entonces, [ ]
Ejemplo 6. En una fbrica de tornillos, las mquinas A, B y C fabrican 20, 30 y 50% de la
produccin total respectivamente. De lo que producen 2, 3 y 5% respectivamente son tornillos
defectuosos. Con la produccin total se hace un solo lote y se extrae un tornillo; halle la
probabilidad de que sea defectuoso.
Sean los eventos,
A: el tornillo escogido es defectuoso.
el tornillo proviene de la mquina A.
el tornillo proviene de la mquina B.
el tornillo proviene de la mquina C.
De lo anterior se tiene que,
[ ]
, [ ]
y [
.

. Adems,

Aplicando el teorema o regla de la probabilidad total,


[ ] (
)( ) (
)( ) (
)( )
Hay una probabilidad del 3.8% de que el artculo escogido sea defectuoso.

TEOREMA DE BAYES
El teorema o regla de Bayes es una tcnica que nos permite obtener la probabilidad
condicional de un evento cuando mediante el efecto tratamos de determinar la probabilidad de
la causa. Este resultado ha sido muy utilizado para estudiar fenmenos sociales; sin embargo,
por el empleo de probabilidades subjetivas a sido muy cuestionado su uso.
El teorema de Bayes trata de responder los interrogantes tales como: si el evento B ocurri,
cul es la probabilidad de que haya sido generado por el evento ?,Cual por ?, etc.
}
Sea
Entonces,

es una particin de un espacio muestral S con

] [

[ ] [ ]
[ ] [ ]

[ ]

y A un evento de S.

] [

Ejemplo 7. A partir del problema de la fbrica de tornillos (ejemplo 6), halle la probabilidad de
que el tornillo provenga de la mquina C, dado que es defectuoso.
En este caso debemos calcular la probabilidad [
[

] [

)(

[
[

]
(
(

)(
)(

] [
] [
)
)

]
]

)(

], por el teorema de Bayes nos da

] [

Hay una probabilidad del 66% de que el tornillo defectuoso provenga de la mquina C.

Estadstica Inferencial

Jorge Luis Bustos Galindo

Pgina 4

INDEPENDENCIA DE EVENTOS
Cuando la ocurrencia de un evento A no est influenciada ni influye sobre la ocurrencia de otro,
decimos que los eventos son independientes. Formalmente la independencia se define de la
manera siguiente:
Dados dos eventos A y B, se dicen independientes si cumplen que
( ) ( )

Ejemplo 8. Suponga que se lanza una moneda dos veces. Sean los eventos, A el primer
resultado es cara y B el segundo resultado es sello. Son mutuamente independientes los
eventos.
( )
( )
(

)=

( ) ( )

Estadstica Inferencial

Jorge Luis Bustos Galindo

Pgina 5

GUA DE CLASE N 1
1. Explique el significado de los siguientes trminos:
a. Experimento aleatorio
b. Espacio muestral
c. Evento o suceso
2. Se lanza una moneda cuatro veces. Encuentre todos los sucesos elementales del espacio
muestral.
3. Supongamos que lanzamos una moneda y un dado, y que el espacio muestral S consta de
doce elementos:
S = C1, C2, C3, C4, C5, C6, S1, S2, S3, S4, S5, S6}
a. Exprese explcitamente los siguientes eventos:
A = sale cara y un nmero par}
B = {sale un nmero primo}
C = {sale sello y un nmero impar}
b. Exprese explcitamente el evento: (i) ocurre A o B, (ii) ocurre B y C, (iii) solamente
ocurre en B, y (iv) no ocurre en A.
c. Cules parejas de eventos A, B Y C son mutuamente excluyentes?
4. Determine la probabilidad de cada evento:
a. Sale un nmero par en el lanzamiento de un dado no cargado.
b. Al sacar una sola carta de una baraja de 52 cartas sale una K.
c. Sale por lo menos un sello al lanzar tres monedas no cargadas.
d. Sale una bola blanca al sacar una sola bola de una bolsa con cuatro bolas blancas, tres
rojas y cinco azules.
5. En un curso de 20 hombres y 30 mujeres, un quinto de los hombres y un quinto de las
mujeres son becados. Encuentre la probabilidad de que una persona escogida al azar sea
mujer o la persona sea becada.
6. En la tabla que sigue se da el cargo y sexo de los empleados de una empresa.
Cargo
Operarios
Administrativos
Directivos
Total

Sexo
Hombres Mujeres
80
113
30
17
4
6
114
136

Total
193
47
10
250

Recursos humanos de la empresa desea otorgar un premio como estimulo especial y para
ello decide seleccionar al alzar uno de los trabajadores. Calcular la probabilidad de que la
persona sea administrativo dado que es mujer.
7. Se lanza un dado no cargado. Considere los eventos:
A = {2, 4, 6}
B = {1, 2}
C = {1, 2, 3, 4}
a. Encuentre P(AB), P(AUB).
b. Encuentre P(A/B) y P(B/A).
c. Encuentre P(A/C) y P(C/A).
d. Son A y B independientes?, B y C? y A y C?

Estadstica Inferencial

Jorge Luis Bustos Galindo

Pgina 6

8. Sean A y B eventos con P(A) = , P(B) = , y P(AUB) = .


a. Encuentre P(A/B) y P(B/A).
b. Son A y B independientes?
9. Supongamos que lanzamos tres monedas una vez. Y sea:
A = {todas las caras o todas sellos}
B = {por lo menos dos caras}
C = {cuando ms dos caras}
a. Encuentre P(AUB), P(AUC) y P(BUC).
b. Encuentre P(A/B) y P(C/A).
10. Sean A y B eventos independientes con P(A) = 0.3 y P(B) = 0.4. Encuentre:
a. P(AB) y P(AUB).
b. P(A/B) y P(B/A).
11. En la sala de pediatra de un hospital, el 60% de los pacientes son nias. De los nios el
35% son menores de 24 meses. El 20% de las nias tienen menos de 24 meses. Un
pediatra que ingresa a la sala selecciona un infante al azar.
a. Determine el valor de la probabilidad de que sea menor de 24 meses.
b. Si el infante resulta ser menor de 24 meses. Determine la probabilidad que sea una nia.
12. Un mdico cirujano se especializa en cirugas estticas. Entre sus pacientes, el 20% se
realizan correcciones faciales, un 35% implantes mamarios y el restante en otras cirugas
correctivas. Se sabe adems, que son de gnero masculino el 25% de los que se realizan
correcciones faciales, 15% implantes mamarios y 40% otras cirugas correctivas. Si se
selecciona un paciente al azar, determine:
a. Determine la probabilidad de que sea de gnero masculino
b. Si resulta que es de gnero masculino, determine la probabilidad que se haya realizado
una ciruga de implantes mamarios.

Estadstica Inferencial

Jorge Luis Bustos Galindo

Pgina 7

DISTRIBUCIN DE PROBABILIDAD
Los experimentos aleatorios originan resultados y los resultados nos permiten tomar
decisiones. Un mismo experimento aleatorio se puede llevar acabo para tomar distintas
decisiones. Sin embargo, a pesar de que el propsito sea distinto cuando se lleva a cabo un
experimento aleatorio, ste no cambia su comportamiento por el simple hecho de que los
propsitos cambien. Lo anterior nos est indicando que una cosa son los distintos resultados
de un experimento y otra los propsitos que perseguimos cuando lo realizamos. El medio por el
cual expresamos nuestro aspecto de inters al llevar a cabo un experimento aleatorio es el de
variable aleatoria.
Variable Aleatoria
Una variable aleatoria es aquella que asume valores de acuerdo con los resultados de un
experimento aleatorio. Las variables aleatorias generalmente son designadas por las letras X,
Y, Z.
En el siguiente ejemplo se ilustra cmo se asocia una variable aleatoria a un experimento.
Ejemplo 1. Se lanza una moneda tres veces. Sabemos que el espacio muestral
correspondiente a este experimento aleatorio est dado por:
S = {ccc, ccs, csc, scc, ssc, scs, css, sss}.
Si de los resultados del lanzamiento de la moneda nos interesa el nmero de caras que se
obtienen en cada lanzamiento, entonces definimos la variable X: nmero de caras en los tres
lanzamientos. Los valores posibles de esta variable son:
X = 0, que indica que no se obtienen caras, o sea, {sss}.
X = 1, que indica que se obtiene una cara, {css, scs,ssc}.
X = 2, que indica que se obtiene dos caras, {ccs, csc,scc}.
X = 3, que indica que se obtiene tres caras, {ccc}.
Por lo anterior se tiene que las probabilidades respectivas son,
P[X = 0] = 1/8, P[X = 1] = 3/8, P[X = 2] = 3/8, P[X = 3] = 1/8.
Estos resultados se pueden resumir en una tabla como la siguiente, llamada distribucin de
probabilidad.
X

P[X = x]

Observemos que la suma de las probabilidades,


P[X = 0] + P[X = 1] + P[X = 2] + P[X = 3] =
. En general, para cualquier
distribucin de probabilidad discreta debe darse que la suma de las probabilidades de todos los
valores que pueda asumir la variable aleatoria de un experimento debe ser igual a 1.
Ejemplo 2. Consideremos el lanzamiento de dos dados una vez. Sea X: suma de puntos de las
dos caras. Hallar la distribucin de probabilidad de esta variable aleatoria.
X
P[X = x]

Estadstica Inferencial

Jorge Luis Bustos Galindo

Pgina 8

Una vez que se haya definido la variable, hallar las siguientes probabilidades:
(a)
(b)

[
[

]
]

VALOR ESPERADO Y VARIANZA DE UNA VARIABLE ALEATORIA


La distribucin de probabilidad de una variable aleatoria proporciona un modelo para
distribucin terica de la variable. La distribucin de probabilidad de una poblacin es anloga
a la distribucin de frecuencia relativa de los datos (muestra). Luego, es de esperarse que cada
distribucin de probabilidad tenga asociada medidas similares a las medidas descriptivas que
se han sealado para los datos (muestra).
Valor esperado
El valor esperado o esperanza matemtica de una variable aleatoria X, desempea o
equivale al concepto de promedio de los datos.
Sea X una variable aleatoria discreta que asume los valores x 1, x2, x3, , xn con probabilidades
respectivas P[X = x1], P[X = x2], P[X = x3], ,P[X = xn] el valor esperado de X se denota y
define de la manera siguiente:
[ ]

Ejemplo 3. Consideremos la variable aleatoria X: nmero de puntos que muestra la cara


superior de un dado despus de un lanzamiento. Entonces la distribucin de probabilidad es,
X

P[X = x]

El valor esperado o esperanza matemtica,


[ ]

( )

( )

( )

( )

( )

( )

Cmo interpretar este resultado? Si dijramos que es el puntaje que usted debe esperar que
le d cuando lanza el dado muchas veces, con justa razn podra decir que eso es imposible,
puesto que podrn verse en el dado tres o cuatro puntos, pero jams 3.5 puntos. Estamos de
acuerdo con usted, pero le proponemos que no cuente los puntos de cada lanzamiento sino
que sume el puntaje de los dos lanzamientos y los promedie, puede hallar la lgica al valor de
3.5. Adems se convencer que lo dicho a cerca de 3.5 es cierto. A pesar de que esta
interpretacin que le hemos dado al valor de 3.5 es acertada, en la prctica el valor esperado
se interpreta de una manera un poco distinta, que en el ejemplo presente es: si lanzamos el
dado un nmero grande de veces y tomamos la media aritmtica de la suma de los distintos
puntajes que se van obteniendo entonces, la media tiende a 3.5. Igual interpretacin seria para
cualquier otra situacin.

Ejemplo 4. Supongamos que dos jugadores A y B, se enfrentan en un juego que consiste en el


lanzamiento de una moneda al aire. Si sale cara A gana $1; pero si sale sello A pierde $1.
La variable que representa la ganancia de A por cada jugada est dada por:

Estadstica Inferencial

Jorge Luis Bustos Galindo

Pgina 9

{
Si suponemos que la moneda est balanceada, la probabilidad de obtener cara (sello) es 0.5,
entonces la variable X tiene la siguiente distribucin:
X

-$1

$1

P[X = x]

0.5

0.5

As que el valor esperado de X (ganancia esperada del jugador) est dado por E[X] = (-1)(0.5)
+ (1)(0.5) = 0, lo que quiere decir que si estas personas juegan un gran nmero de veces, a la
larga no hay ganancias, es decir, no hay ganador ni perdedor.
Pero si ahora vamos a suponer que la moneda est diseada de tal forma que la posibilidad de
obtener cara es de 2/3 y la de obtener sello es de 1/3. En este caso la distribucin de X
sera:
X

-$1

$1

P[X = x]

Y la ganancia esperada (por jugada) para a sera E[X] = ( ) ( )


decir que si juegan unas 3000 veces, se espera que A gane $1000.

( )( )

, lo que quiere

Propiedades del valor esperado


(1)
(2)
(3)
(4)
(5)

E[c] = c, al ser c una constante (un nmero).


E[cX] = cE[X], al ser c una constante y X una variable aleatoria.
E[X + c] = E[X] + c, al ser c una constante y X una variable aleatoria.
E[X + Y] = E[X] + E[Y], al ser X y Y variables aleatorias.
E[aX + bY] = aE[X] + bE[Y], al ser a y b contantes; X y Y variables aleatorias.

Varianza y Desviacin estndar


As como las medidas de posicin tienen su generalizacin mediante el valor esperado, la
variabilidad de los datos (muestra) tambin tiene su generalizacin mediante la varianza de la
variable.
La varianza es una medida del grado de concentracin de los valores de la variable aleatoria
alrededor de su media
, mientras ms dispersos estn los valores respecto de la media,
mayor ser la varianza. La cual se denota y define de la manera siguiente:
Sea X una variable aleatoria que asume valores x1, x2, x3, , xn con probabilidades P[X = x1],
P[X = x2], P[X = x3], ,P[X = xn], la varianza de X se denota y define
[ ]

La raz cuadrada de la varianza se llama desviacin estndar y se denota

]
.

Ejemplo 5. Vamos calcular la varianza para la variable X que corresponde al nmero de puntos
de la cara superior del dado (Ejemplo 3).
[ ]

) ( )
(

Estadstica Inferencial

) ( )

) ( )

) ( )

) ( )

) ( )

Jorge Luis Bustos Galindo

Pgina 10

La desviacin estndares

Propiedades de la varianza
(1)
(2)
(3)
(4)
(5)

La varianza no pude ser negativa.


Si c es una constante, entonces V[c] = 0.
2
2
V[X] = E[X ] (E[X]) .
2
V[cX] = c V[X], al ser c una constante y X una variable aleatoria.
V[X + c] = V[X], al ser c una constante y X una variable aleatoria.

Ejemplo 6. Una variable aleatoria X tiene distribucin de probabilidad como se indica:


X

P[X = x]
Calcule:
(a) E[X 1]
2

(b) E[X ]
(c) E[3X]
2

(d) E[(X + 2) ]
(e) V[X]
(f) V[X+1]
(g) V[5X]

Estadstica Inferencial

Jorge Luis Bustos Galindo

Pgina 11

DISTRIBUCIONES DISCRETAS
Distribucin Binomial
La distribucin binomial est ligada a un tipo de experimento llamado ensayo de Bernoulli, en
honor a Jacques Bernoulli (1654-1705).
Un ensayo de Bernoulli es un experimento aleatorio que slo puede concluir de dos maneras
distintas mutuamente excluyentes e independientes. Uno de los resultados se llama xito y el
otro fracaso. Los ensayos de Bernoulli dan origen a una variable aleatoria y toma slo dos
valores, y cuyos valores de probabilidad (distribucin) estn dados por la siguiente frmula:
[

En donde p corresponde a la probabilidad de que se d o de que ocurra un xito y q = 1 p, la


probabilidad de que ocurra un fracaso.
De las definiciones de valor esperado y de varianza dadas anteriormente, se tiene que para
una variable con distribucin de Bernoulli, su valor esperado es
[ ]
Y su varianza es,

[ ]

Se tiene que la desviacin estndar est dada por,

Un proceso de Bernoulli es una sucesin de ensayos con las caractersticas siguientes:


(1) En cada ensayo, el xito tiene una probabilidad p y el fracaso una probabilidad q = 1
p de ocurrir.
(2) La probabilidad de xito y de fracaso permanece constante durante el proceso.
(3) Los ensayos son independientes, es decir, el resultado de cualquier ensayo particular
no es afectado por el resultado de cualquier otro ensayo.
Suponga que se lleva a cabo un proceso de Bernoulli y sea la variable X = nmero de xitos en
n ensayos de Bernoulli, tiene valores de probabilidad (distribucin), como se indica en la
siguiente frmula:
[

( )

Siendo p = probabilidad de xito; q = probabilidad de fracaso y


( )

Cuando una variable aleatoria tiene valores de probabilidad dados por la frmula anterior, se
dice que la variable tiene distribucin binomial.
Ejemplo 1. Suponga que el 10% de las partes que produce una mquina automtica sea
defectuoso. Si se toma al azar una muestra de 20 partes, defina la variable que le permita
determinar las probabilidades siguientes:
(a)
(b)
(c)
(d)
(e)

Que en la muestra haya dos partes defectuosas.


Que en la muestra haya mximo tres partes defectuosas.
Que en la muestra haya 18 partes defectuosas como mnimo.
Que en la muestra haya entre dos y cinco partes defectuosas.
Que en la muestra haya mnimo tres partes defectuosas.

Estadstica Inferencial

Jorge Luis Bustos Galindo

Pgina 12

El problema que nos enfrentamos es el de precisar que se va a tomar como xito. Para tal
propsito el xito siempre se tomar como aquel aspecto en el cual centramos nuestra
atencin partes defectuosas, por tanto, al definir la variable, X = nmero de partes
defectuosas, entonces p = 10% = 0.1 y q = 90% =0.9; con una muestra de n=20.
(a)

)(
(

) (
) (

)( )

) (

Hay una probabilidad del 28.5% de que en una muestra de 20 partes, 2 sean defectuosas.

Distribucin Hipergeomtrica
La distribucin binomial se basa en el supuesto de que la poblacin es infinita y de que la
probabilidad de xito permanece constante, lo cual se consigue en tales poblaciones o cuando
se toman muestras con repeticin (reemplazo) en poblaciones finitas. Cuando la poblacin es
finita y el muestreo se hace sin reemplazo, la probabilidad cambiar para cada nueva
observacin. En tales circunstancias, se tendr una distribucin de probabilidad que se llama
distribucin hipergeomtrica.
Para aplicar la distribucin hipergeomtrica, sta debe estar formada por dos grupos de
individuos u objetos. Un primer grupo constituido por aquellos individuos que poseen la
caracterstica objeto de estudio, y su nmero de elementos lo denotaremos como N1 y el otro
estar conformado por los que no poseen la caracterstica y el nmero de sus elementos lo
denotamos N2.
La variable con distribucin hipergeomtrica debe ser de la forma: X = nmero de xitos en los
n ensayos, los valores de probabilidad asociados a esta variable con distribucin
hipergeomtrica estn dados por
(
[

)(

{
Ejemplo 2. Suponga que una empresa produce 100 unidades de las cuales 90 son buenas y
10 son defectuosas. Se escogen 20 unidades sin reemplazo; halle la probabilidad de que
resulten cinco defectuosas.
X = Unidades defectuosas.
N1 = 10 y N2 =90.
[

)(
(

)
)

Hay una probabilidad del 2.15% de que en 100 unidades, cinco sean defectuosas.

Distribucin de Poisson
Otra familia de distribuciones de probabilidad, es la llamada distribucin de Poisson, llamada
as por Simeon Dennis Poisson (1781-1840).
Esta distribucin es aplicable a muchos procesos en los que ocurren determinados sucesos por
unidad de tiempo, espacio, volumen, rea, etc.

Estadstica Inferencial

Jorge Luis Bustos Galindo

Pgina 13

Una variable con distribucin de Poisson debe tener la estructura o responder los interrogantes
mediante el siguiente planteamiento:
X = nmero de veces que ocurre un suceso en la unidad de tiempo, espacio, volumen, rea,
etc. Los valores de probabilidad de una variable con distribucin de Poisson estn dados por,
[

En donde
promedio de ocurrencia del suceso en la unidad de tiempo, espacio, volumen,
etc.
y
Ejemplo 3. Suponga que el nmero de llamadas que llegan a un conmutador es de 0.5 por
minuto en promedio, halle la probabilidad de que:
(a)
(b)
(c)
(d)

En un minuto no lleguen llamadas.


En un minuto lleguen ms de tres llamadas.
En tres minutos lleguen ms de dos llamadas.
Cuntas llamadas se espera que lleguen en cinco minutos?

X = nmero de llamadas en un minuto.

(a)

Hay una probabilidad del 60.65% de que el conmutador no lleguen llamadas.

Estadstica Inferencial

Jorge Luis Bustos Galindo

Pgina 14

GUA DE CLASE N 2
1. Se lanza una moneda cuatro veces. Si de los resultados del lanzamiento de la moneda
nos interesa el nmero de sellos que se obtienen en cada lanzamiento, entonces
definimos la variable X: nmero de sellos en los cuatro lanzamientos. Hallar la
distribucin de probabilidad de esta variable aleatoria.
Calcule:
a. E[X]
b. V[X]
2. Una variable aleatoria X tiene distribucin de probabilidad como se indica:
X
0 1 2 3
[

Calcule:
a. E[X + 1]
2
b. E[X ]
c. E[2X]
d. V[X]
e. V[X 1]
f. V[8X]
3. Suponga que cierta poblacin, el 65% de los nacimientos registrados son nias. Si
tomamos tres registros, defina la variable que permita calcular las probabilidades que
a
continuacin se piden.
a. Que tres registros corresponda a nias.
b. Menos de dos sean nia.
4. Una caja tiene 15 bateras para radio, de las cuales cinco son defectuosas. De la caja se
escogen al azar seis bateras. Halle la probabilidad de que:
a. Cuatro sean defectuosas.
b. Ninguna sea defectuosa.
5. Se ha determinado que en una autopista se da en promedio 10 animales vagabundos
muertos por kilmetro. Halle la probabilidad de que en 100 metros,
a. Se encuentren dos o ms animales muertos.
b. Menos de tres animales muertos.
6. Si el 5% de los conductores de transmilenio en Bogot, son mujeres. Suponga que se
selecciona al azar 10 conductores para una encuesta acerca de las condiciones de trabajo.
Cul es la probabilidad:
a. Que dos conductores sean mujeres?
b. Menos de dos sean mujeres?
7. Una caja tiene 20 bombillos, de las cuales cinco son defectuosos. De la caja se escogen al
azar diez bombillos. Halle la probabilidad de que:
a. Tres sean defectuosos.
b. Ninguna sea defectuoso.
8. El promedio de personas que llegan a la ventanilla de un banco por minuto durante las
horas hbiles es una. Halle la probabilidad de que en un minuto:
a. No aparezcan clientes.
b. Haya tres o ms clientes.

Estadstica Inferencial

Jorge Luis Bustos Galindo

Pgina 15

9. Una institucin universitaria establece nuevos mtodos de aprendizaje y de evaluacin, con


el resultado donde el 85% de sus estudiantes aprueban todas las asignaturas. Supongamos
que se seleccionan 8 estudiantes de dicho plantel, cul es la probabilidad:
a. Exactamente tres aprueben todas las asignaturas?
b. Por lo menos dos aprueben todas las asignaturas?
10. El nmero de clientes que llegan a una corporacin de ahorro y vivienda los das sbados
es en promedio 40 por hora. Cul es la probabilidad de que lleguen por lo menos dos
clientes en media hora?
11. En la produccin de cierto artculo, se sabe que por cada 50 producidos en 30 su
terminado es excelente. Si se toma una muestra de 20 artculos, cul es la probabilidad
de que diez sean clasificados excelentes?

Estadstica Inferencial

Jorge Luis Bustos Galindo

Pgina 16

DISTRIBUCIN CONTINUA
DISTRIBUCIN NORMAL
Una de las distribuciones continas y tal vez la ms importante es la distribucin normal, la cual
ocupa un lugar destacado en la inferencia estadstica. Su grfica, que recibe el nombre de
curva normal, es la curva en forma de campana , la cual describe de forma aproximada muchos
fenmenos que suceden en la naturaleza, tales como la estaturas de los seres humanos, el
coeficiente intelectual de las personas, la industria y la investigacin. Adems, los errores en
las mediciones cientficas se aproximan hasta lmites extremadamente pequeos gracias a la
distribucin normal. A las anteriores consideraciones podemos agregar otra que nos muestra el
porqu de la importancia de la distribucin normal; se refiere al aspecto de inferencia
estadstica y particularmente a lo que tiene que ver con el anlisis de datos, puesto que las
distribuciones de muchas estadsticas muestrales tienden a la distribucin normal, conforme
crece el tamao de muestra.

Los valores de probabilidad de eventos definidos mediante una variable aleatoria continua se
mantiene mediante valores de integrales definidas de una funcin llamada funcin de densidad
continua (rea bajo la curva). Al ser la normal una variable de tipo continuo, debe tener una
funcin de densidad que nos permita obtener valores de probabilidad relacionados con esta
variable.
La funcin de densidad de la variable aleatoria X, con media
( )

y varianza

, es

Cuando nos referimos a una variable aleatoria con distribucin normal con media
(
).
, lo denotamos de la siguiente manera

y varianza

La dificultad que se encuentra al resolver las integrales de las funciones de densidad normal
hace necesaria una tabulacin de las reas de la curva normal para una referencia rpida. No
obstante sera una tarea de nunca acabar elaborar una tabla para cada valor posible de y de
. Afortunadamente, es posible transformar todas las observaciones de cualquier variable
aleatoria normal X en un nuevo conjunto de observaciones de una variable aleatoria normal Z,
con media cero y varianza 1. Esto puede realizarse por medio de la transformacin:
.
La distribucin de una variable aleatoria con media cero y varianza 1, se llama distribucin
normal estndar. Se denota Z ( ).
(
)
Z ( )

TRANSFORMACIN

Estadstica Inferencial

Jorge Luis Bustos Galindo

Pgina 17

Se ha reducido ahora el nmero requerido de tablas de las reas de la curva normal a slo
una, la distribucin normal estndar (Tabla I), Pgina 51.
A continuacin se ilustra grficamente como obtener los valores de probabilidad, segn las
siguientes situaciones.
(1) P[Z < z] = valor de probabilidad de tabla
Ejemplo 1. P[Z < 1.23] = 0.8907

(2) P[Z > z] = 1 P[Z z]


Ejemplo 2. P[Z > 0.42] = 1 P[Z 0.42]
= 1 0.6628
= 0.3372

(3) P[Z z] = 1 P[Z < z]


Ejemplo 3. P[Z 1.23] = 1 P[Z < 1.23]
= 1 0.8907
= 0.1093

(4) P[Z > z] = P[Z < z]


Ejemplo 4. P[Z > 2.3] = P[Z < 2.3]
= 0.9893

Estadstica Inferencial

Jorge Luis Bustos Galindo

Pgina 18

(5) P[Z z] = 1 ; cuando z 3.60.


Ejemplo 5. P[Z 4.0] = 1

(6) P[z1 Z z2] = P[Z z2] P[Z z1]


Ejemplo 6. P[1.3 Z 2.5] = P[Z 2.5] P[Z 1.3]
= 0.9938 0.9032
= 0.0906

Ejemplo 7. P[1.24 < Z < 2.3] =

En algunos casos lo que nos interesa es calcular el valor de zt (valor de z de tabla) que
satisfaga P[Z zt] = valor de probabilidad de tabla. En este caso el proceso es a la inversa.
Ejemplo 8. Encuentre el valor de zt, que tiene una probabilidad de 0.9732.
P[Z Zt] = 0.9732, teniendo en cuenta el valor de probabilidad, podemos ver (Tabla II) que el
valor de zt = 1.93.

Ejemplo 9. Encuentre el valor de zt, para P[Z zt] = 0.3707

Estadstica Inferencial

Jorge Luis Bustos Galindo

Pgina 19

Aplicaciones de la distribucin normal


Ejemplo 1. Suponga que

), encuentre la probabilidad de que asuma:

(a) Un valor menor que 66.


(b) Un valor entre 45 y 62.
(c) Un valor mayor que 71.
Solucin:
Como la variable

), por lo tanto

(a) Para dar solucin a la P[X 66], es necesario realizar la transformacin llamada
estandarizacin, con la cual se obtiene el valor de z.

Calculando la probabilidad tenemos,


P[X 66] = P[Z 1.6] = 0.9452.

Ejemplo 2. Una fbrica de alimentos empaca productos cuyos pesos estn normalmente
distribuidos con media de 450 gramos y desviacin estndar de 20 gramos. Encuentre la
probabilidad de que un paquete escogido al azar pese entre 425 y 486 gramos.
Solucin:
Para este problema tenemos que
calcular P[425 X 486].

gramos y

gramos, por lo tanto debemos

Estandarizando, tenemos:
,
P[425 X 486] = P[1.25 Z 1.8]
= P[Z 1.8] P[Z 1.25]
= P[Z 1.8] (1 - P[Z 1.25])
= 0.9641 (1 0.8944)
= 0.8585

Hay una probabilidad del 85.85% de que un paquete escogido al azar pese entre 425 y 486
gramos.

Estadstica Inferencial

Jorge Luis Bustos Galindo

Pgina 20

Ejemplo 3. En un examen la calificacin promedio fue 3.5 y la desviacin estndar 0.3. Las
calificaciones siguen una distribucin normal. Qu porcentaje de estudiantes tuvo notas por
debajo de 2.0?Qu porcentaje de estudiantes obtuvo notas por encima de 4.0?
Solucin:
Para este problema tenemos que
P[X > 4.0], estandarizamos tenemos

, por lo tanto debemos calcular P[X < 2.0] y

,
Para las preguntas tenemos,
P[X < 2.0] = P[Z < 5]
y
P[X > 4.0] = P[Z > 1.67]
= 1 P[Z 5]
= 1 P[Z 1.67]
=11
= 1 0.9525
=0
= 0.0475
hay una probabilidad del 0% de que los estudiantes obtengan una nota menor de 2.0 y del
4.75% de que obtengan una nota mayor a 4.0.

Estadstica Inferencial

Jorge Luis Bustos Galindo

Pgina 21

GUA DE CLASE N 3
1. Dada una distribucin normal, encuentre el rea bajo la curva que cae:
a. A la izquierda de z = 1.52
b. A la derecha de z = 0.9
c. Entre 1.8 y 2.7
d. A la izquierda de z = 1.93
2. Encuentre el valor z si el rea bajo la curva estndar:
a. A la derecha es 0.3510
b. Entre 0 y z, con z 0, es 0.4838
c. A la izquierda es 0.1234
d. Entre z y z, con z 0, es 0.95
3. Sea X N(100, 225). Halle las probabilidades siguientes:
a. P[X 92.5]
b. P[X 76 ]
c. P[77.5 X 100]
4. Para la variable definida en el problema 3, halle el valor x que satisface:
a. P[X x] = 0.75
b. P[X x] = 0.10
c. P[X x] = 0.05
d. P[ x X x] = 0.90
5. Suponga un test normal de puntuacin media de 75 y una desviacin estndar de 6, tres
estudiantes A, B y C fueron notificados de tener puntuaciones Z normales estndares de
1.8, 0.5 y 0.8 respectivamente. Halle las notas obtenidas por A, B y C.
6. Una fbrica de harina empaqueta en sacos de tela. El saco de harina se acepta como de
distribucin normal con media y desviacin estndar iguales a 25 y 0.5 respectivamente. Si
se toma al azar un saco, cul es la probabilidad de que:
a. Pese cuando ms 24.75?
b. Pese por lo menos 26.25?
7. Una mquina despachadora de refrescos est ajustada para servir en promedio 200
mililitros por vaso. Si la cantidad de refrescos es normalmente distribuidas con una
desviacin estndar igual a 15 mililitros.
a. Qu fraccin de los vasos contendr ms de 224 mililitros?
b. Cul es la probabilidad de que un vaso contenga entre 191 y 209 mililitros?
c. Cuntos vasos probablemente se derramarn si se utilizan vasos de 230 mililitros en
los siguientes 1000 refrescos?
d. Bajo qu valor se obtiene el 25% ms pequeo de los refrescos?
8. La vida til de cierta marca de batera para automvil se admite con distribucin normal con
media = 38 meses y desviacin estndar = 2 meses. Si la compaa no desea
reemplazar ms del 5% de las bateras vendidas, qu tiempo de garanta debe ofrecer?
9. Los estudiantes de cierta escuela secundaria tiene un coeficiente intelectual promedio de
106 y varianza 256. Al suponer la distribucin normal, halle la proporcin de estudiantes con
coeficiente intelectual.
a. Igual o menor que 98.
b. Igual o menor que 130.
c. Igual o mayor que 127.
d. Entre 94 y 118.

Estadstica Inferencial

Jorge Luis Bustos Galindo

Pgina 22

MUESTREO
En estadstica se conoce como muestreo a la tcnica para la seleccin de una muestra a partir
de una poblacin.
Al elegir una muestra se espera conseguir que sus propiedades sean extrapolables a
la poblacin. Este proceso permite ahorrar recursos, y a la vez obtener resultados parecidos a
los que se alcanzaran si se realizase un estudio de toda la poblacin.
Cabe mencionar que para que el muestreo sea vlido y se pueda realizar un estudio adecuado
(que consienta no solo hacer estimaciones de la poblacin sino estimar tambin los mrgenes
de error correspondientes a dichas estimaciones), debe cumplir ciertos requisitos. Nunca
podremos estar enteramente seguros de que el resultado sea una muestra representativa, pero
s podemos actuar de manera que esta condicin se alcance con una probabilidad alta.
En el muestreo, si el tamao de la muestra es ms pequeo que el tamao de la poblacin, se
puede extraer dos o ms muestras de la misma poblacin. Al conjunto de muestras que se
pueden obtener de la poblacin se denomina espacio muestral. La variable que asocia a cada
muestra su probabilidad de extraccin, sigue la llamada distribucin muestral.

Tcnicas de muestreo estadstico


Existen dos mtodos para seleccionar muestras de poblaciones: el muestreo no aleatorio o de
juicio y el muestreo aleatorio (que incorpora el azar como recurso en el proceso de seleccin).
Cuando este ltimo cumple con la condicin de que todos los elementos de la poblacin tienen
alguna oportunidad de ser escogidos en la muestra, si la probabilidad correspondiente a cada
sujeto de la poblacin es conocida de antemano, recibe el nombre de muestreo probabilstico.
Una muestra seleccionada por muestreo de juicio puede basarse en la experiencia de alguien
con la poblacin. Algunas veces una muestra de juicio se usa como gua o muestra tentativa
para decidir cmo tomar una muestra aleatoria ms adelante.

Muestreo probabilstico
Forman parte de este tipo de muestreo todos aquellos mtodos para los que puede calcular la
probabilidad de extraccin de cualquiera de las muestras posibles. Este conjunto de tcnicas
de muestreo es el ms aconsejable, aunque en ocasiones no es posible optar por l. En este
caso se habla de muestras probabilsticas, pues no es en rigor correcto hablar de muestras
representativas dado que, al no conocer las caractersticas de la poblacin, no es posible tener
certeza de que tal caracterstica se haya conseguido.
Sin reposicin de los elementos: Cada elemento extrado se descarta para la subsiguiente
extraccin. Por ejemplo, si se extrae una muestra de una "poblacin" de bombillas para estimar
la vida media de las bombillas que la integran, no ser posible medir ms que una vez la
bombilla seleccionada.
Con reposicin de los elementos: Las observaciones se realizan con remplazamiento de los
individuos, de forma que la poblacin es idntica en todas las extracciones. En poblaciones
muy grandes, la probabilidad de repetir una extraccin es tan pequea que el muestreo puede
considerarse con reposicin aunque, realmente, no lo sea.
Con reposicin mltiple: En poblaciones muy grandes, la probabilidad de repetir una
extraccin es tan pequea que el muestreo puede considerarse con reposicin.
Para realizar este tipo de muestreo, y en determinadas situaciones, es muy til la extraccin
de nmeros aleatorios mediante ordenadores, calculadoras o tablas construidas al efecto. Pero
no es exacto

Muestreo aleatorio simple (MAS)


Es aquel en que cada elemento de la poblacin tiene la misma probabilidad de ser
seleccionado para integrar la muestra. Cada uno de los elementos de la muestra, se
selecciona aleatoriamente uno por uno.
Existen dos formas de realizar el muestreo:

Estadstica Inferencial

Jorge Luis Bustos Galindo

Pgina 23

Muestreo con reemplazo: Es aquel en que un elemento puede ser seleccionado ms de una
vez en la muestra para ello se extrae un elemento de poblacin se observa y se devuelve a la
poblacin, por lo que esta forma se pueden hacer infinitas extracciones de la poblacin aun
siendo esta finita.
Muestreo sin reemplazo: No se devuelve los elementos extrados a la poblacin hasta que no
se hallan extrados todos los elementos que conforman la muestra.
Hay diversos procedimientos para extraer los individuos de una muestra aleatoria:
Una de ellas consiste en realizar un sorteo aleatorio con papeles o bolas enumeradas y sacar
uno a uno tantos como lo indique el tamao de la muestra. Otra forma, es utilizar la tabla de
nmeros aleatorios pero solamente para poblaciones finitas, la utilizacin de estas tablas
puede realizarse de diferentes modos.
Tambin se puede encontrar un intervalo constante ( ), para escoger a cada individuo de la
muestra seleccionada; por ejemplo, en una institucin educativa tienen 90 estudiantes en el
grado undcimo y se desea extraer una muestra de 30 estudiantes. En primer lugar se
numeran los estudiantes del 1 al 90, luego se calcula el intervalo constante entre cada individuo
, se sortea un nmero al azar del 1 al 3, supongamos que el 2, los siguientes
estudiantes se obtienen 3 hasta llegar los 30 estudiantes de la muestra, teniendo as los
estudiantes seleccionados son: 2, 5, 8, 11,, 89.

Muestreo sistemtico
Se utiliza cuando el universo o poblacin es de gran tamao, o ha de extenderse en el tiempo.
Primero hay que identificar las unidades y relacionarlas con el calendario (cuando proceda).
Luego hay que calcular una constante, que se denomina coeficiente de elevacin K= N/n;
donde N es el tamao del universo y n el tamao de la muestra. Determinar en qu fecha se
producir la primera extraccin, para ello hay que elegir al azar un nmero entre 1 y K; de ah
en adelante tomar uno de cada K a intervalos regulares. Ocasionalmente, es conveniente tener
en cuenta la periodicidad del fenmeno.
Esto quiere decir que si tenemos un determinado nmero de personas que es la poblacin (N)
y queremos escoger de esa poblacin un nmero ms pequeo el cual es la muestra (n),
dividimos el nmero de la poblacin por el nmero de la muestra que queremos tomar y el
resultado de esta operacin ser el intervalo, entonces escogemos un nmero al azar desde
uno hasta el nmero del intervalo, y a partir de este nmero escogemos los dems siguiendo el
orden.

Muestreo estratificado
Consiste en la divisin previa de la poblacin de estudio en grupos o clases que se suponen
homogneos con respecto a alguna caracterstica de las que se van a estudiar. A cada uno de
estos estratos se le asignara una cuota que determinara el nmero de miembros del mismo
que compondrn la muestra. Dentro de cada estrato se suele usar la tcnica de muestreo
sistemtico, una de las tcnicas de seleccin ms usadas en la prctica.
Segn la cantidad de elementos de la muestra que se han de elegir de cada uno de los
estratos, existen dos tcnicas de muestreo estratificado:
Asignacin proporcional: el tamao de la muestra dentro de cada estrato es proporcional al
tamao del estrato dentro de la poblacin.
Asignacin ptima: la muestra recoger ms individuos de aquellos estratos que tengan ms
variabilidad. Para ello es necesario un conocimiento previo de la poblacin.
Por ejemplo, para un estudio de opinin, puede resultar interesante estudiar por separado las
opiniones de hombres y mujeres pues se estima que, dentro de cada uno de estos grupos,
puede haber cierta homogeneidad. As, si la poblacin est compuesta de un 55% de mujeres

Estadstica Inferencial

Jorge Luis Bustos Galindo

Pgina 24

y un 45% de hombres, se tomara una muestra que contenga tambin esos mismos
porcentajes de hombres y mujeres.
Para una descripcin general del muestreo estratificado y los mtodos de inferencia asociados
con este procedimiento, suponemos que la poblacin est dividida en h subpoblaciones o
estratos de tamaos conocidos N1, N2,..., Nh tal que las unidades en cada estrato sean
homogneas respecto a la caracterstica en cuestin.

Muestreo por estadios mltiples


Esta tcnica es la nica opcin cuando no se dispone de lista completa de la poblacin de
referencia o bien cuando por medio de la tcnica de muestreo simple o estratificado se obtiene
una muestra con unidades distribuidas de tal forma que resultan de difcil acceso. En el
muestreo a estadios mltiples se subdivide la poblacin en varios niveles ordenados que se
extraen sucesivamente por medio de un procedimiento de embudo. El muestreo se desarrolla
en varias fases o extracciones sucesivas para cada nivel.
Por ejemplo, si tenemos que construir una muestra de profesores de primaria en un pas
determinado, stos pueden subdividirse en unidades primarias representadas por
circunscripciones didcticas y unidades secundarias que seran los propios profesores. En
primer lugar extraemos una muestra de las unidades primarias (para lo cual debemos tener la
lista completa de estas unidades) y en segundo lugar extraemos aleatoriamente una muestra
de unidades secundarias de cada una de las primarias seleccionadas en la primera extraccin.

Muestreo por conglomerados


Se utiliza cuando la poblacin se encuentra dividida, de manera natural, en grupos que se
supone que contienen toda la variabilidad de la poblacin, es decir, la representan fielmente
respecto a la caracterstica a elegir, pueden seleccionarse slo algunos de estos grupos
o conglomerados para la realizacin del estudio.
Dentro de los grupos seleccionados se ubicarn las unidades elementales, por ejemplo, las
personas a encuestar, y podra aplicrsele el instrumento de medicin a todas las unidades, es
decir, los miembros del grupo, o slo se le podra aplicar a algunos de ellos, seleccionados al
azar. Este mtodo tiene la ventaja de simplificar la recogida de informacin muestral.
Cuando, dentro de cada conglomerado seleccionado, se extraen algunos individuos para
integrar la muestra, el diseo se llama muestreo bietpico.
Las ideas de estratos y conglomerados son, en cierto sentido, opuestas. El primer mtodo
funciona mejor cuanto ms homognea es la poblacin respecto del estrato, aunque ms
diferentes son stos entre s. En el segundo, ocurre lo contrario. Los conglomerados deben
presentar toda la variabilidad, aunque deben ser muy parecidos entre s.

Homogeneidad de las poblaciones o sus subgrupos


Homogneo significa, en el contexto de la estratificacin, que no hay mucha variabilidad. Los
estratos funcionan mejor cuanto ms homogneos son cada uno de ellos respecto a la
caracterstica a medir. Por ejemplo, si se estudia la estatura de una poblacin, es bueno
distinguir entre los estratos mujeres y hombres porque se espera que, dentro de ellos, haya
menos variabilidad, es decir, sean menos heterogneos. Dicho de otro modo, no hay tantas
diferencias entre unas estaturas y otras dentro del estrato que en la poblacin total.
Por el contrario, la heterogeneidad hace intil la divisin en estratos. Si se dan las mismas
diferencias dentro del estrato que en toda la poblacin, no hay por qu usar este mtodo de
muestreo. En los casos en los que existan grupos que contengan toda la variabilidad de la
poblacin, lo que se construyen son conglomerados, que ahorran algo del trabajo que
supondra analizar toda la poblacin. En resumen, los estratos y los conglomerados funcionan
bajo principios opuestos: los primeros son mejores cuanto ms homogneo es el grupo
respecto a la caracterstica a estudiar y los conglomerados, si representan fielmente a la
poblacin, esto es, contienen toda su variabilidad, o sea, son heterogneos.

Estadstica Inferencial

Jorge Luis Bustos Galindo

Pgina 25

Muestreo no probabilstico
Es aqul para el que no puede calcularse la probabilidad de extraccin de una determinada
muestra. Se busca seleccionar a individuos que se juzga de antemano tienen un conocimiento
profundo del tema bajo estudio, por lo tanto, se considera que la informacin aportada por esas
personas es vital para la toma de decisiones.

Muestreo por cuotas


Es la tcnica ms difundida sobre todo en estudios de mercado y sondeos de opinin. En
primer lugar es necesario dividir la poblacin de referencia en varios estratos definidos por
algunas variables de distribucin conocida (como el gnero o la edad). Posteriormente se
calcula el peso proporcional de cada estrato, es decir, la parte proporcional de poblacin que
representan. Finalmente se multiplica cada peso por el tamao de n de la muestra para
determinar la cuota precisa en cada estrato. Se diferencia del muestreo estratificado en que
una vez determinada la cuota, el investigador es libre de elegir a los sujetos de la muestra
dentro de cada estrato.

Muestreo de bola de nieve


Indicado para estudios de poblaciones clandestinas, minoritarias o muy dispersas pero en
contacto entre s. Consiste en identificar sujetos que se incluirn en la muestra a partir de los
propios entrevistados. Partiendo de una pequea cantidad de individuos que cumplen los
requisitos necesarios estos sirven como localizadores de otros con caractersticas anlogas.

Muestreo subjetivo por decisin razonada


En este caso las unidades de la muestra se eligen en funcin de algunas de sus caractersticas
de manera racional y no casual. Una variante de esta tcnica es el muestreo compensado o
equilibrado, en el que se seleccionan las unidades de tal forma que la media de la muestra
para determinadas variables se acerque a la media de la poblacin. La cual funciona en base a
referencias o por recomendacin.

Estadstica Inferencial

Jorge Luis Bustos Galindo

Pgina 26

TAMAO DE MUESTRA
El tamao de la muestra que debemos escoger para hacer una estimacin del parmetro con
las caractersticas especificadas (nivel de confianza y error de estimacin) es un problema que
tarde o temprano tenemos que resolver. La determinacin el tamao de la muestra es de
importancia debido a que:
Si se toma una muestra ms grande de lo indicada para alcanzar los resultados
presupuestados, constituye un desperdicio de recursos (tiempo, dinero, etc.).
Al tomar una muestra demasiado pequea conduce a menudo a resultados poco confiables.
Cuando elegimos una muestra de tamao n slo revisamos una fraccin o parte de la
poblacin y con base en ella tomamos decisiones que afectan a toda la poblacin. Es
evidente que este procedimiento existe una posibilidad de que nos equivoquemos en
nuestras decisiones, pero esta posibilidad depende en gran medida del tamao de muestra
de la poblacin que se haya escogido y por tanto analizado.
El tamao que debe tener la muestra cuando se estima la media o proporcin depende del
nivel de confianza propuesto para el intervalo, as como el mximo error que estemos
dispuestos a admitir entre el valor estimado y el valor real del parmetro que corresponde al
error de estimacin.
1.

Tamao de muestra con varianza poblacional conocida.

1.1 Poblacin infinita o muestreo con repeticin


Supongamos que hemos fijado en d el error de estimacin (precisin) y el nivel de confianza de
) para la estimacin de la media
(
de una poblacin normal con varianza
desconocida, siendo as, tenemos la ecuacin,
)

De la ecuacin anterior, se tiene

Ejemplo 1. Un ingeniero trata de ajustar una mquina dispensadora de gaseosas de tal forma
que el promedio del lquido dispensado se encuentra dentro de cierto rango. Sabe que la
cantidad de lquido vertida por la mquina sigue una distribucin normal con una desviacin
estndar
decilitros. Tambin desea que el valor estimado que vaya a obtener de la
media comparado con el verdadero no sea superior a 0.02 decilitros con una confianza del
95%. De qu tamao debe escoger la muestra, o sea cuntas mediciones debe realizar para
que cumpla el plan propuesto?
Solucin:
La informacin dada es:
y

, d=0.02 y un nivel de confianza del 95% por lo tanto, el nivel de significancia


.

Reemplazando tenemos,
(

) (
(

mediciones.

El ingeniero tendra que escoger una muestra de 216 mediciones.

1.2. Poblacin finita y muestreo sin repeticin


El tamao de muestra en una poblacin finita est dada por la ecuacin,
(

Estadstica Inferencial

Jorge Luis Bustos Galindo

Pgina 27

Ejemplo 2. Para efectos de una planeacin econmica en cierta zona del pas, es necesario
estimar entre 10 000 establos lecheros, el nmero de vacas lecheras por establo con un error
de estimacin de 4 y un nivel de confianza del 90%. Si se sabe que
. Cuntos
establos deben visitarse para satisfacer estos requerimientos?
Solucin:
La informacin dada es:
N=10 000,
y

, d=4 y un nivel de confianza del 90% por lo tanto, el nivel de significancia


.

Reemplazando tenemos,
(

)(

)( )

) (
(

)
) (

establos.

Se debe visitar a 166 establos.

2. Tamao de muestra proporcional a la poblacin


2.1. Poblacin infinita o muestreo con repeticin
Cuando es el caso de tomar el tamao de una muestra proporcional a una poblacin infinita o
un muestreo con repeticin, utilizaremos la frmula,
(

En donde corresponde a la proporcin estimada, d el error de estimacin. Cuando no se da


estimacin alguna de , el clculo de la muestra se hace tomando a
. Esto arroja por
lo general una muestra mucho mayor de la indicada, pero es el precio que debemos pagar por
no tener mayor informacin sobre el caso.
Ejemplo 3. Se est planeando una encuesta con el fin de determinar la proporcin de familias
que carecen medios econmicos para atender los problemas de salud. Existe la impresin de
que esta proporcin est prxima a 0.35. Se desea determinar un intervalo de confianza del
99% con un error de estimacin de 0.05. De qu tamao debe tomarse la muestra?
Solucin:
La informacin dada es:

, d=0.05, un nivel de confianza del 99% por lo tanto, el nivel de significancia


.

Reemplazando tenemos,
(

) (

)(

familias.

Se debe encuestar a 603 familias.

2.2 Poblacin finita y muestreo sin repeticin


Si el tamao de la poblacin debe ser tenido en cuenta el tamao de muestra est dado por
(
(

)
(

Ejemplo 4. El decano de una facultad desea realizar una encuesta para determinar la
proporcin de estudiantes que est a favor del cambio de sede. Ya que entrevistar a 2000
estudiantes es una tarea casi imposible, determine el tamao de muestra necesario para
estimar la proporcin de estudiantes que estn a favor, con un error de estimacin de 0.05 y
un nivel de confianza del 95%.

Estadstica Inferencial

Jorge Luis Bustos Galindo

Pgina 28

Solucin:
La informacin dada es:
N=2000, como se desconoce la proporcin, entonces
95% por lo tanto, el nivel de significancia
y

, d=0.05, un nivel de confianza del


.

Reemplazando tenemos,
(
(

)(
)(

) (

)(

) (

)
)(

estudiantes.

Por lo tanto, debe entrevistar a 322 estudiantes.

GUA DE CLASE N 4
1. Suponga que las estaturas de los hombres tienen distribucin normal con desviacin
estndar de 2.5 pulgadas. De qu tamao se debe tomar la muestra si se desea
determinar un intervalo de confianza del 95% para una media con un error de estimacin de
0.5?
2. Un qumico ha preparado un producto diseado para matar el 80% de un tipo particular de
insectos, de qu tamao se debe escoger la muestra para estimar la verdadera proporcin
si se requiere un intervalo de confianza del 95% y un error de estimacin del 2%?
3. Un tcnico desea determinar el tiempo promedio que los operarios tardan en preparar sus
equipos. Qu tamao debe tener la muestra si se necesita una confianza del 95% de que
su media muestral estar dentro de 15 segundos del promedio real? Suponga que por
estudios anteriores se sabe que
segundos.
4. Se desea estimar el peso promedio de un lote de 500 naranjas. Para ello se va escoger
aleatoriamente cierto nmero de naranjas. Se desea que el error de estimacin sea mximo
de 2 onzas con un nivel de confianza del 90%. Cuntas naranjas deben seleccionarse?
Suponga que
.
5. Se desea estimar la proporcin de estudiantes que estn a favor de la legalizacin de las
drogas prohibidas. El error de estimacin se requiere del 1% y un nivel de confianza del
99%. Cuntos estudiantes deben incluirse en la muestra?
6. Se desea estimar la fuerza promedio para levantar a un nio de seis aos. Como no se
tena informacin sobre la varianza de esta poblacin se procedi a tomar una muestra
piloto para estimarla; los resultados fueron los siguientes: 2.24, 2.26, 2.47, 1.56, 1.72, 1.48,
2.40, 2.03, 1,72, 2.10, 1.74, 1.55. Si se desea estimar un intervalo del 95% de confianza con
un error de estimacin de 0.1. De qu tamao se debe escoger la muestra?
7. El jefe de personal de una empresa desea realizar una encuesta para determinar la
proporcin de trabajadores que est a favor de un cambio del horario de trabajo. Como es
imposible consultar a los 500 trabajadores en un lapso razonable, procede a escoger
aleatoriamente cierto nmero de trabajadores para entrevistarlos; determine el nmero de
trabajadores que debe entrevistarse si se desea que la proporcin estimada presente un
error mximo del 5% y un nivel de confianza del 95%.

Estadstica Inferencial

Jorge Luis Bustos Galindo

Pgina 29

PRUEBAS DE HIPTESIS
Dentro de la inferencia estadstica, una prueba de hiptesis (tambin denominado test de
hiptesis o prueba de significacin) es un procedimiento para juzgar si una propiedad que
se supone en una poblacin estadstica es compatible con lo observado en una muestra de
dicha poblacin. Fue iniciada por Ronald Fisher y fundamentada posteriormente por Jerzy
Neyman y Karl Pearson.
Mediante esta teora, se aborda el problema estadstico considerando una hiptesis nula
( ) y una hiptesis alternativa ( ), y se intenta averiguar cul de las dos es la hiptesis
verdadera, tras aplicar el problema estadstico a un cierto nmero de experimentos.
Est fuertemente asociada a los considerados errores de tipo I y II en estadstica, que definen
respectivamente, la posibilidad de tomar un suceso falso como verdadero, o uno verdadero
como falso.
Existen diversos mtodos para desarrollar dicho test, minimizando los errores de tipo I y II, y
hallando por tanto con una determinada potencia, la hiptesis con mayor probabilidad de ser
correcta. Los tipos ms importantes son los test centrados, de hiptesis y alternativa simple,
aleatorizados, etc. Dentro de los test no paramtricos, el ms extendido es probablemente
el test de la U de Mann-Whitney.

Planteamiento clsico del contraste de hiptesis


Se denomina hiptesis nula a la hiptesis ( ) que se desea contrastar. El nombre de "nula"
significa sin valor, efecto o consecuencia, lo cual sugiere que ( ) debe identificarse con la
hiptesis de no cambio (a partir de la opinin actual); no diferencia, no mejora,
etc. ( ) representa la hiptesis que mantendremos a no ser que los datos indiquen su
falsedad, y puede entenderse, por tanto, en el sentido de neutra. La hiptesis ( ) nunca se
considera probada, aunque puede ser rechazada por los datos. Por ejemplo, la hiptesis de
que dos poblaciones tienen la misma media puede ser rechazada fcilmente cuando ambas
difieren mucho, analizando muestras suficientemente grandes de ambas poblaciones, pero no
puede ser "demostrada" mediante muestreo, puesto que siempre cabe la posibilidad de que las
medias difieran en una cantidad lo suficientemente pequea para que no pueda ser
detectada, aunque la muestra sea muy grande.
A partir de una muestra de la poblacin en estudio, se extrae un estadstico (esto es, una valor
que es funcin de la muestra) cuya distribucin de probabilidad est relacionada con la
hiptesis en estudio y sea conocida. Se toma entonces como regin de rechazo al conjunto de
valores que es ms improbable bajo la hiptesis, esto es, el conjunto de valores para el que
rechazaremos la hiptesis nula si el valor del estadstico observado entra dentro de l.
La probabilidad de que se obtenga un valor del estadstico que entre en la regin de rechazo
an siendo cierta la hiptesis puede calcularse. De esta manera, se puede escoger dicha
regin de tal forma que la probabilidad de cometer este error sea suficientemente pequea.
Siguiendo con el anterior ejemplo de la moneda trucada, la muestra de la poblacin es el
conjunto de los treinta lanzamientos a realizar, el estadstico escogido es el nmero total de
caras obtenidas, y la regin de rechazo est constituida por los nmeros totales de caras
iguales o superiores a 25. La probabilidad de cometer el error de admitir que la moneda est
trucada a pesar de que no lo est es igual a la probabilidad binomial de tener 25 "xitos" o ms
en una serie de 30 ensayos de Bernoulli con probabilidad de "xito" 0,5 en cada uno, entonces:
0,0002, pues existe la posibilidad, aunque poco probable, que la muestra nos d ms de 25
caras sin haber sido la moneda trucada.

Procedimientos de prueba
Un procedimiento de prueba es una regla con base en datos muestrales, para determinar si se
rechaza
.
Ejemplo 1. El ingeniero de control de calidad de una fbrica de tornillos tiene la sospecha de
que el proceso de produccin de tales tornillos no se est cumpliendo la especificacin en
cuanto la longitud promedio que debe ser de 5 cm, y que sta, por el contrario, es menor. Si

Estadstica Inferencial

Jorge Luis Bustos Galindo

Pgina 30

ello es as, ser necesario detener la produccin para hacer los ajustes del caso. Como
podemos apreciar en este caso, la decisin que se tome traer sus consecuencias; por ello se
debe ser consciente al tomar la decisin. En la consideracin anterior podemos apreciar dos
posibilidades la hiptesis estadstica, constituidas por:
La proposicin o afirmacin que el ingeniero espera aceptar, denominada
, y denominada
hiptesis alterna. En nuestro caso esta hiptesis corresponde a la afirmacin: La longitud
media de los tornillos es menor de 5 cm. Simblicamente la denotaremos
, siendo
longitud promedio de los tornillos.
La proposicin que el ingeniero espera rechazar, denotada
, llamada hiptesis nula, que
en el presente caso corresponde a la afirmacin: La longitud promedio de los tornillos es de
5 cm. Simblicamente la denotaremos
.
Las dos anteriores hiptesis se escriben conjuntamente de la manera siguiente:
La escritura nos indica que existe una confrontacin de afirmaciones y slo la evidencia de los
datos nos podr indicar hacia dnde debemos inclinarnos, lo que no requiere decir que queda
demostrada, sino que no queda validada ante la evidencia de la muestra. Esto hay que tenerlo
en cuenta porque olvidarlo o desconocerlo da origen a las muchas conclusiones erradas que se
hacen y que motivan una crtica injustificada a las conclusiones con base en la inferencia
estadstica.
Un procedimiento de prueba se especifica por lo siguiente:
1. Un estadstico de prueba: una funcin de los datos muestrales en los cuales se basa la
decisin de rechazar
o no rechazar
.
2. Una regin de rechazo, el conjunto de todos los valores del estadstico de prueba para los
cuales
ser rechazada.
Entonces, la hiptesis nula ser rechazada si y solo si el valor observado o calculado del
estadstico de prueba se ubica en la regin de rechazo.
La regin de aceptacin es un conjunto de valores, determinado bajo ciertas reglas, tal que si el
valor de la estadstica de prueba cae dentro, la hiptesis nula
se declara no contraria al valor
de la estadstica (esto no significa que sea verdadera sino que su falsedad no ha sido
probada). La regin de rechazo, tambin llamada regin crtica, es un conjunto de valores
distinto a los anteriores; si la estadstica de prueba asume un valor que est dentro, la hiptesis
nula
se declara contraria a la evidencia de la muestra y por lo tanto debe ser rechazada.
El valor crtico es aquel nmero que separa la regin de aceptacin de la regin de rechazo.
As por ejemplo, si la regla de decisin es rechazar
crtico.
Rechazo

si

, entonces 5 es un valor

Aceptacin

5
Cuando la regin de rechazo est localizada en un solo extremo de la curva de la distribucin
de la estadstica de prueba, la prueba se dice de una cola. Cuando la regin de rechazo est
localizada en ambos extremos la prueba se dice de dos colas.
Si se trata de una prueba de una media para poblacin normal, las distintas pruebas respecto
de las posibilidades para la hiptesis alterna son:
1.

Zona de rechazo
( )

Prueba de una cola a la derecha.

Estadstica Inferencial

Jorge Luis Bustos Galindo

Pgina 31

2.

Zona de rechazo
( )

Prueba de una cola a la izquierda


3.

Zona de rechazo
( )

Zona de rechazo
( )

Prueba de dos colas


En los casos anteriores la hiptesis nula tambin puede formularse como
caso 1, y
para el caso 2. Sin embargo, en los clculos siempre se tomar

, para el
.

En el mejor de los casos podran desarrollarse procedimientos de prueba para los cuales
ningn tipo de error es posible. Pero esto puede alcanzarse solo si una decisin se basa en un
examen de toda la poblacin, lo que casi nunca es prctico. La dificultad al usar un
procedimiento basado en datos muestrales es que debido a la variabilidad en el muestreo
puede resultar una muestra no representativa.
Un buen procedimiento es aquel para el cual la probabilidad de cometer cualquier tipo de error
es pequea. La eleccin de un valor particular de corte de la regin de rechazo fija las
probabilidades de errores tipo I y II. Estas probabilidades de error son representadas por y ,
respectivamente.

Errores en el contraste
Una vez realizado el contraste de hiptesis, se habr optado por una de las dos
hiptesis,
o
, y la decisin escogida coincidir o no con la que en realidad es cierta. Se
pueden dar los cuatro casos que se exponen en el siguiente cuadro:

Estado de naturaleza
es cierta
es falsa

Decisin
Aceptar
Descartar
Accin correcta
Error de tipo I
(
)
( )
Error d tipo II
Accin correcta
( )
(
)

Si la probabilidad de cometer un error de tipo I est unvocamente determinada, su valor se


suele denotar por la letra griega , y en las mismas condiciones, se denota por la
probabilidad de cometer el error de tipo II, esto es:
(

En este caso, se denomina Potencia del contraste al valor 1-, esto es, a la probabilidad de
escoger
cuando sta es cierta

Estadstica Inferencial

Jorge Luis Bustos Galindo

Pgina 32

Cuando es necesario disear un contraste de hiptesis, sera deseable hacerlo de tal manera
que las probabilidades de ambos tipos de error fueran tan pequeas como fuera posible. Sin
embargo, con una muestra de tamao prefijado, disminuir la probabilidad del error de tipo I, ,
conduce a incrementar la probabilidad del error de tipo II, .
Ejemplo 2. En un procedimiento judicial, cuando se acusa a alguien de un asesinato, cuando
se llama a juicio se presume que el acusado es inocente, es decir, no culpable hasta que se
demuestra lo contrario. El error tipo I corresponde al caso de condenar a un inocente y el error
tipo II al dejar libre a un culpable.
Cuando tomamos decisiones con base en los datos muestrales, cualquier cosa puede ocurrir,
desde lo ms grave (cometer el error tipo I) hasta lo ms acertado (tomar una decisin
correcta), y aun lo menos grave que sera cometer el error tipo II. Ante la gravedad de cometer
el error tipo I y ante la imposibilidad de descartarlo, la nica alternativa que nos queda es la
asignarle una probabilidad, obviamente pequea, de que ste ocurra; llegamos de esta manera
al concepto de nivel de significancia.
El nivel de significancia de una prueba corresponde a la probabilidad de cometer el error tipo
I. Es decir, es la probabilidad de rechazar
siendo
verdadera. Esta probabilidad se denota
con la letra y corresponde al rea de rechazo; de tal forma que se igualar al total del rea
derecha o izquierda, si se trata de pruebas de una cola o se repartir en partes iguales entre
las dos colas, si se trata de una prueba bilateral.
Usualmente, se disean los contrastes de tal manera que la probabilidad sea el 5% (0,05),
aunque a veces se usan el 10% (0,1) o 1% (0,01) para adoptar condiciones ms relajadas o
ms estrictas. El recurso para aumentar la potencia del contraste, esto es, disminuir ,
probabilidad de error de tipo II, es aumentar el tamao muestral, lo que en la prctica conlleva
un incremento de los costes del estudio que se quiere realizar.

Pasos en una prueba de hiptesis


Primer paso. Formular la hiptesis o asegurar que es verdadera. Esta formulacin puede ser
literal, pero generalmente traducida en trmino de parmetros (
).
Segundo paso. Establecer el tamao de muestra (n) y el nivel de significancia ( ).
Tercer paso. Determinar una estadstica de prueba o una regla que sea lgica en el contexto
del problema formulado por la hiptesis. La estadstica de prueba proporciona un nmero a
partir de los datos muestrales.
Cuarto paso. Formular una regla de decisin. Esto es, definir la posicin que se asumir para
cada resultado posible del experimento. La regla de decisin debe especificar qu valores de la
estadstica de prueba se toman para aceptar
y cuales para rechazarla.
Quinto paso. Recolectar los datos mediante algn procedimiento de muestreo y calcular el
correspondiente valor de la estadstica de prueba.
Sexto paso. Aplicar la regla de decisin. Si el valor de la estadstica de prueba cae en la regin
de rechazo, entonces rechazamos ; si el valor cae en la regin de aceptacin, entonces no
rechazamos
o mejor dicho, no hay evidencia para rechazarla.
El rechazo o no rechazo de la hiptesis nula conduce a una decisin clnica, administrativa,
cientfica, etc.

Estadstica Inferencial

Jorge Luis Bustos Galindo

Pgina 33

PRUEBAS DE HIPTESIS RESPECTO DE LAS MEDIAS EN POBLACIONES


NORMALES
Es un procedimiento estadstico que nos permite decidir si los datos muestrales son
consistentes o no con algun valor que hemos fijado para la media de una poblacin
normalmente distribuida. Existen dos casos relacionados: cuando la varianza de la poblacin
es conocida y cuando sta es desconocida.
1. Pruebas para una muestra
1.1. Varianza poblacional conocida.
En este caso la prueba estadstica se desarrolla con base en la distribucin normal:
)
(

Ejemplo 1. Los siguientes datos corresponden a la longitud medida en centmetros de 18


pedazos de cable sobrantes en cada rollo utilizado: 9.00, 3.41, 6.13, 1.99, 6.92, 3.12, 7.86,
2.01, 5.98, 4.15, 6.87, 1.97, 4.01, 3.56, 8.04, 3.24, 5.05, 7.37. Basados en estos datos,
podemos decir que la longitud media de los pedazos de cables es mayor de 4 cm? Suponga
poblacin normal y tome el nivel de significancia
.
Solucin:
Aplicando los pasos de una prueba de hiptesis tenemos:
1. Hiptesis
Longitud promedio de los pedazos de cable.

2. n = 18,

3. Estadstica de prueba.
)
(
( )
4. Regla de decisin.

Se rechaza H0, si

5. Clculos.

El valor de tabla (
(

):

Estadstica Inferencial

Jorge Luis Bustos Galindo

Pgina 34

6. Decisin.

Como

, entonces se rechaza H0 de que la longitud promedio es menor o igual a 4 cm.

1.2. Varianza poblacional desconocida y muestra pequea.


En este caso se toma como estadstica de prueba a la distribucin t-student:
)
(
con (n 1) grados de libertad.
Ejemplo 2. Un agrnomo mide el contenido promedio de humedad en cierta variedad de trigo
que fue secado especialmente en una muestra de 16 toneladas: 7.2, 6.8, 7.3, 7.0, 7.3, 7.3, 7.5,
7.3, 7.4, 7.2, 7.6, 7.1, 7.4, 6.7, 7.4, 6.9. Si el promedio de humedad excede de 7.1, el proceso
de secado debe continuar. Deber continuarse con el proceso de secado, de acuerdo con
esta evidencia? Tome
.
Solucin:
1. Hiptesis
contenido promedio de humedad de cada tonelada de trigo.

2. n = 16,

3. Estadstica de prueba.
)
(
(
)
4. Regla de decisin.

Se rechaza H0, si

5. Clculos.

El valor de tabla ( ):
(

Estadstica Inferencial

Jorge Luis Bustos Galindo

Pgina 35

6. Decisin.

Como
, entonces se rechaza H0 de que el promedio de humedad de cada tonelada de
trigo es menor o igual a 7.1, ante esta evidencia el proceso de secado debe continuar.
2. Pruebas para dos muestras independientes
Cuando se trata de pruebas de dos medias relacionadas con poblaciones independientes, las
hiptesis a probar son:
Equivalente a:
.

Prueba de una cola a la derecha.

Prueba de una cola a la izquierda.

Equivalente a:

Equivalente a:
. Prueba de dos colas.
Tambin se tienen en cuenta dos casos, cuando las varianzas de las poblaciones son
conocidas o cuando las varianzas son desconocidas.
Si las varianzas poblacionales son conocidas, se utiliza como estadstica de prueba la variable
con distribucin normal estndar:
(
)
) (


Cuando las varianzas poblacionales son desconocidas pero supuestas iguales con muestras
pequeas, se utiliza como estadstica de prueba a la distribucin t-student:
(
)
) (

con (n1 + n2 2) grados de libertad y donde,
(
)
(
se llama varianza ponderada.

)
)

Ejemplo 3. Mediciones del dimetro transversal del corazn de los adultos del sexo masculino
y femenino dieron los resultados siguientes:
Grupo
Hombres
Mujeres

Tamao de muestra
12
9

en cm.
13.21
11.00

S en cm.
1.05
1.01

Suponga que las varianzas de las dos poblaciones son iguales. Proporcionan estos datos
suficiente evidencia que indique que el dimetro transversal promedio del corazn de los
hombres es igual al de las mujeres? Tome
.

Estadstica Inferencial

Jorge Luis Bustos Galindo

Pgina 36

Solucin:
1. Hiptesis
dimetro transversal promedio de los hombres.
dimetro transversal promedio de las mujeres.

2. n1 = 12, n2 =9,

3. Estadstica de prueba.
(

4. Regla de decisin.

Se rechaza H0, si

5. Clculos.
(

)(

)(

El valor de tabla ( ):
(

6. Decisin.

Como
, entonces se rechaza H0 de que el dimetro transversal promedio del corazn de
los hombres es igual al de las mujeres.
3. Pruebas sobre medias cuando las observaciones son pareadas
Esta prueba aparece cuando por ejemplo, comparamos los pesos de las personas antes y
despus de un tratamiento para bajar peso. La aplicacin de esta prueba requiere que las
unidades que formen la pareja tengan las mismas caractersticas, como sucede en los
siguientes casos:

Estadstica Inferencial

Jorge Luis Bustos Galindo

Pgina 37

Los mismos individuos reciben el tratamiento antes y despus.


Las parejas son gemelos que reciben tratamientos distintos.
Dos partes del mismo material son sometidos a tratamientos distintos.
El procedimiento estadstico para analizar el comportamiento de la variable de inters se basa
en la diferencia de las mediciones de las unidades que forman la pareja y es similar al que se
sigue para la prueba de una media al utilizar la distribucin t-student, slo que se toma como
estadstica de prueba a la variable:
)
(

con (n 1) grados de libertad.


= diferencia promedio de los datos muestrales, Sd = desviacin estndar de las diferencias.
Ejemplo 4. Diez personas fueron sometidas a un test antes y despus de recibir cierta
instruccin. Los resultados fueron los siguientes:
Individuo
Antes
Despus

1
2
3 4
5
6
7
8
9 10
70 84 88 110 105 100 110 67 79 86
115 148 176 191 158 178 179 140 161 157

Proporcionan estos datos evidencia suficiente para decir que la instruccin fue efectiva?
Tome
.
Solucin:
1. Hiptesis
diferencia promedio del test aplicado a diez individuos.

2. n = 10,

3. Estadstica de prueba.
)
(
(
)
4. Regla de decisin.

Se rechaza H0, si

5. Clculos.

El valor de tabla ( ):
(

Estadstica Inferencial

Jorge Luis Bustos Galindo

Pgina 38

6. Decisin.

Como

, entonces se rechaza H0, los datos evidencian que la instruccin fue efectiva.

Estadstica Inferencial

Jorge Luis Bustos Galindo

Pgina 39

GUA DE CLASE N 5
1. Una fbrica de pilas garantiza que su producto tiene una vida media de 1000 horas y una
desviacin estndar de 50. Pruebe la hiptesis de que
en contraposicin de la
alterna
horas, si una muestra aleatoria de 30 bateras tiene una duracin promedio
de 950 horas. Utilice
.
2. Una muestra aleatoria de 36 refrescos de una mquina despachadora tiene un contenido
promedio de 19.8 decilitros, con una desviacin estndar de 1.3 decilitros. Pruebe la
hiptesis de
decilitros en contraposicin a la hiptesis alterna
. Use el nivel de
significancia
.
3. Los siguientes datos representan el contenido de grasa en los cuerpos de 10 hombres: 4.22,
3.99, 5.41, 4.23, 4.29, 4.62, 4.55, 4.13, 4.23, 4.48. Evidencian estos datos que el contenido
promedio de grasa en los hombres es menor de 4.464? Considere
y tome
.
4. Se espera que dos operarios produzcan en promedio el mismo nmero de unidades
terminadas en el mismo tiempo. Los siguientes datos dan los nmeros de las unidades
terminadas para ambos trabajadores en una semana de trabajo.

Operario 1
10
9
16
14
11

Operario 2
12
16
16
15
14

Si supone que el nmero de unidades terminadas diariamente por los trabajadores son
variables aleatorias independientes distribuidas normalmente con varianzas iguales, puede
concluirse alguna diferencia entre las medias? Tome
.
5. Las siguientes son las distancias en metros que cierto animal se aleja de su morada: 194,
202, 335, 515, 184, 369, 142, 552, 200, 344, 421, 590, 301, 439. Podemos concluir que la
distancia promedio en que se aleja es mayor de 338 m? Suponga
y tome
.
6. Pruebe la hiptesis segn la cual el contenido promedio de un aceite comestible es de 5
litros. Si los contenidos de una muestra aleatoria de 10 recipientes son: 5.2, 4.7, 5.1, 5.3,
5.1, 4.8, 4.9, 5.4, 5.3, 4.8. Utilice un nivel de significancia de
y suponga que la
distribucin de los contenidos es normal.
7. Se desea comparar dos mtodos para ensear estadstica. Para ello se tomaron 10 pares
de estudiantes del mismo nivel de aprovechamiento en estadstica. De cada par, a uno se le
asigna al azar el mtodo A y al otro al mtodo B. Despus de un periodo de cuatro
semanas, cada estudiante se someti a un examen, con las puntuaciones siguientes:
Par
Mtodo A
Mtodo B

1 2 3 4 5 6 7 8 9 10
36 37 41 42 36 35 42 33 40 38
35 35 42 41 36 34 40 31 39 37

Proporcionan estos datos suficiente evidencia como para indicar que los niveles medios de
aprovechamiento de los mtodos son distintos? Sea
.
8. Los siguientes datos son los tiempos que tardan dos grupos de estudiantes para resolver un
examen de estadstica.
Grupo
1
2

Estadstica Inferencial

Tiempo mnimo
100 84 96 107 89
79 163 95 132 91 85

Jorge Luis Bustos Galindo

Pgina 40

Considere que se trata de poblaciones normales de igual varianza y pruebe que el tiempo
de duracin promedio para responder el examen del grupo 1 es mayor que el promedio del
grupo 2. Tome
.
9. Los siguientes datos corresponden a los dimetros de dos muestras de arandelas
producidas por dos mquinas distintas.
Muestra 1
Muestra 2

0.91 1.82 1.46 1.95 1.57 1.61 1.32


1.03 1.99 1.65 2.07 1.66 1.76 1.28 2.01

Considere que los dimetros se distribuyen normalmente y que las varianzas respectivas
son
. Evidencian estos datos que los dimetros promedios de las
arandelas producidas por las dos mquinas son iguales? Tome
.
10. Cinco personas con exceso de peso se pusieron a dieta durante tres meses. Fueron
observados sus pesos al comienzo y al final de la dieta. Estos datos se muestran en la
tabla que sigue:
Individuo
Peso inicial
Peso final

1
2
3
4
5
295 305 323 299 310
251 259 267 265 263

Se puede concluir segn estos datos que la dieta es efectiva? Tome

11. Suponga que tienen dos poblaciones X y Y independientes, distribuidas normalmente y de


igual varianza. De cada una de estas poblaciones se extrae una muestra. En la tabla que
sigue se dan los resultados:

Poblacin
X
Y

Media
4.52
5.31

Desviacin estndar
1.40
1.95

Se puede concluir a partir de estos datos, que


Tome
.

Tamao de muestra
5
23
es mayor de 1?

12. Suponga que la varianza de los cocientes intelectuales de los estudiantes de enseanza
secundaria media en una ciudad es de 225. Una muestra aleatoria de 25 estudiantes
arroja un coeficiente intelectual de 106. Se puede concluir a partir de estos datos que el
coeficiente intelectual medio de los estudiantes es superior a 100? Tome
.
13. Una muestra aleatoria de tamao n1 = 25, tomada de una poblacin normal con desviacin
estndar de
, tiene una media
. Una segunda muestra aleatoria de tamao
n2 = 36, tomada de una poblacin normal diferente con desviacin estndar
, tiene
media
. Pruebe la hiptesis de
, en contraposicin a la alterna
.
Tome
.
14. Se conduce una prueba sobre la potencia de friccin producida por ciertas mquinas
lubricadas con dos aceites comerciales. Los resultados fueron:
Marca 1

Marca2

Considere que se trata de poblaciones normales con igual varianza. Evidencian estos
datos que las potencias promedios son iguales? Tome
.

Estadstica Inferencial

Jorge Luis Bustos Galindo

Pgina 41

PRUEBAS DE HIPTESIS RESPECCTO DE LAS VARIANZAS EN


POBLACIONES NORMALES
Las pruebas referentes a varianzas pueden ser para una o dos varianzas. Si se trata de una
sola varianza utilizamos como estadstico de prueba la variable con distribucin Ji cuadrado:
(
)

y con un valor de tabla (


la cola derecha.

):

), en donde k = (n 1) grados de libertad y q la medida de

Ejemplo 1. Se tom una muestra aleatoria de tamao n= 25 se obtuvo un valor S=150, con
estos datos. Pruebe la hiptesis
vs.
.
Solucin
1. Hiptesis
vs.
2. n = 25
3. Estadstica de prueba.
(
)

4. Regla de decisin.

Se rechaza H0, si
5. Clculos.
(
)(

.
)

El valor de tabla (
(
)
(

):
)

6. Decisin.

36.415

Como,

54

entonces rechaza H0.

Cuando se trata de comparar varianzas se utiliza la variable con distribucin F:

Estadstica Inferencial

Jorge Luis Bustos Galindo

Pgina 42

En donde
y
son las varianzas muestrales de las dos poblaciones y con un valor de tabla
(F): ( (
)(
)) , con q la medida de la cola derecha, n 1 grados de libertad del numerador y
n2 grados de libertad del denominador.
Se recomienda colocar siempre en el numerador la varianza muestral asociada a la varianza
poblacional mayor. Esto es,
i) Si

, entonces el estadstico de prueba se toma como

ii) Si

, entonces el estadstico de prueba se toma como

iii) Si
, entonces el estadstico de prueba se toma de tal manera que la mayor de
las variables aparezca en el numerador.
Ejemplo 2. Se compar la eficiencia de dos tipos de aceites para evitar el desgaste en ciertas
piezas sometidas a intenso trabajo. En trece piezas se utiliz el aceite 1 y en otras trece el
aceite 2. Las varianzas muestrales fueron
. Pruebe la hiptesis nula segn la
cual las varianzas de las dos poblaciones son iguales. Tome
.
Solucin
1. Hiptesis

2. n1 = 13, n2 = 13,

3. Estadstica de prueba.

4. Regla de decisin.

1/F
Se rechaza H0, si

F
.

5. Clculos.

El valor de tabla ( ):
( (

)(

))

( (

)(

))

6. Decisin.

0.305

Como

3.28

, entonces rechaza H0, de que las varianzas de las dos poblaciones son iguales.

Estadstica Inferencial

Jorge Luis Bustos Galindo

Pgina 43

GUA DE CLASE N 6
1. Se afirma que un dispensador de gaseosas est fuera de control si la varianza de los
contenidos excede de 1.0 decilitros. Si una muestra aleatoria de 16 vasos despachados por
este dispensador dio una varianza muestral de 1.9 decilitros, qu puede decirse del mismo
acerca de si est bajo control? Tome
.
2. Se sabe que el contenido de nicotina de una marca de cigarrillos tiene distribucin normal
con varianza de 1.3 miligramos. Pruebe la hiptesis de que
, si una muestra
aleatoria de 8 de estos cigarrillos tiene una desviacin estndar
. use
.
3. Se conduce una prueba sobre la potencia de friccin producida por ciertas mquinas
lubricadas con dos aceites comerciales. Los resultados fueron:
Marca 1

Marca2

Proporcionan estos datos una evidencia de que

? Tome

4. Se compara el nivel de colesterol en la sangre de los pacientes seleccionados al azar y


sometidos a dos dietas distintas; una baja en grasa y la otra normal. Las varianzas y
tamaos de muestra se dan a continuacin:
Baja en grasas
Normal
Proporcionan estos datos suficiente evidencia que indique una diferencia en la variabilidad
de las dos poblaciones de donde se obtuvieron las muestras? Tome
.
5. Una firma fabricante de detergentes elabora dos marcas. Si se encuentra que 56 amas de
casa de 200 consultadas prefieren la marca A; y que 29 de 150 la marca B. Es esto
evidencia suficiente para sostener que la marca A es preferida a la B? Tome
.
6. Se realizo una encuesta para determinar la diferencia que pueda existir entre las fracciones
de casados y solteros entre 20 y 30 aos que fuman. Se entrevistaron 200 personas de
cada grupo y se encontraron 64 casados y 80 solteros que fuman. Contienen los datos
suficiente evidencia que indique que existe una diferencia entre las dos fracciones de
fumadores para las dos poblaciones? Tome
.
7. Dos maquinas diferentes A y B se utilizan para producir pernos idnticos que se suponen de
2 pulgadas de longitud. Se toman dos muestras aleatorias de 25 pernos cada una de la
produccin de ambas mquinas Y arrojan dos varianzas
pulgadas para la
mquina A, y
pulgadas para la mquina B. Evidencian estos datos que las
varianzas son iguales? Tome
.
8. La desviacin estndar de cierto proceso de produccin es de 4 pulgadas. Se sospecha que
la varianza se ha hecho demasiado grande. Se toma una muestra de 9 partes producidas en
dicho proceso y sus medidas son: 5, 7, 2, 4, 8, 9, 8, 6 y 5 pulgadas. Pruebe la hiptesis de
que el proceso conserva an la varianza
. Tome
.

Estadstica Inferencial

Jorge Luis Bustos Galindo

Pgina 44

MTODOS NO PARAMTRICOS
Hemos visto en casi todas las pruebas hasta ahora estudiadas permitan que se estimaran
algunos valores desconocidos de los parmetros a partir de valores calculados gracias a
muestras elegidas al azar en una poblacin dada.
Las hiptesis se enunciaban en funcin del valor o valores especificados de los parmetros de
la poblacin.
Como se presentan muchas situaciones en las que no cumplen los supuestos, se han
desarrollado recientemente numerosas pruebas estadsticas que no exigen supuestos
rigurosos acerca de la distribucin de la poblacin y que no requieren enunciar las hiptesis en
trminos de valores especificados de los parmetros, son por consiguiente, pruebas que se
pueden llamar de distribucin libre o no paramtricos. El trmino de distribucin libre describe
un mtodo de probar hiptesis o de definir un intervalo de confianza que no depende de la
naturaleza de la distribucin de la poblacin que se est considerando; el trmino no
paramtrico se utiliza para indicar que no hay hiptesis enunciada en trminos de valores
especificados de parmetros.
No obstante, los mtodos no paramtricos tienen sus ventajas por ser fciles de aplicar. Son
relativamente sencillos, claros de exponer y de comprender en comparacin con los mtodos
paramtricos. De ah que a veces se les llame mtodos abreviados y que se les emplee a
menudo, al aumentar el tamao de la muestra, incluso en situaciones en que se cumplen en
realidad supuestos paramtricos.
En esta gua nos ocuparemos al estudio de algunos mtodos ms frecuentemente empleados.

Prueba de rangos signados


La prueba de signos deja completamente de lado la magnitud de la diferencia entre cada par
de valores. Frank Wilcoxon, en 1945, sugiri un mtodo para mejorar la prueba de signos. sta
mejora, llamada prueba de rangos signados de Wilcoxon, toma en consideracin la magnitud
de las diferencias. Para llevarla a cabo, el primer paso consiste en ordenar todos los valores
absolutos de las diferencias entre observaciones pareadas, del menor al mayor. El rango de la
diferencia ms pequea es entonces 1, el que sigue es 2 y as sucesivamente. Como se asigna
rangos a las diferencias independientemente del signo, por ejemplo a las diferencias -1 y +1 se
les da el mismo rango, es decir, cada diferencia le corresponde un rango y como se omite el
signo entonces ocupara el mismo rango, entonces se promedia los rangos que le corresponde
y ese seria el rango para cada uno de ellos. Una vez ordenadas por rangos las diferencias, se
da a cada rango el signo de la diferencia. Se calculan entonces por aparte la suma de de
rangos positivos y la suma de los rangos negativos y la suma menor omitido el signo, es la
estadstica de prueba que se suele designar por T.
Si la hiptesis nula segn la cual las dos poblaciones tienen idntica distribucin (relativa) es
cierta, podra esperarse que las dos sumas sean aproximadamente iguales, y si las dos sumas
son muy diferentes entre y s, habra que concluir que las dos poblaciones no son idnticas; es
decir, habra que descartar la hiptesis nula.
La estadstica de prueba T se puede emplear para pruebas de una o dos colas. Para de una
cola es necesario anticipar el signo de la suma de los rangos menor, en caso de ser falsa la
hiptesis nula. Si la suma ms pequea tiene signo distinto del que se anticip, no se rechaza
la hiptesis nula.
Ejemplo 1. Suponga que se desea averiguar si un periodo de vacaciones aumentara la
productividad de los trabajadores. Suponga adems que para este fin se recolectan datos
sobre las producciones semanales de 22 trabajadores de una fbrica en la semana anterior y
posterior a las vacaciones. Sean X y Y las producciones semanales antes y despus de las
vacaciones.
Como se trata de una prueba de una cola y la hiptesis alterna es la de que un periodo de
vacaciones aumentara la productividad de los trabajadores, se anticipa que la suma menor
tiene signo negativo.

Estadstica Inferencial

Jorge Luis Bustos Galindo

Pgina 45

Trabajadores

Diferencias
YX

A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V

83
85
75
91
80
75
90
65
78
85
83
75
78
80
82
88
85
80
78
81
70
80

79
87
70
93
85
75
80
71
80
88
82
71
75
85
86
85
82
87
78
84
85
81

-4
+2
-5
+2
+5
0
-10
+6
+2
+3
-1
-4
-3
+5
+4
-3
-3
+7
0
+3
+15
+1

Rango
12
4
15
4
15
19
17
4
8
1.5
12
8
15
12
8
8
18
8
20
1.5
T=

Rango signado
Negativo
-12

Positivo
+4

-15
+4
+15
-19
+17
+4
+8
-1.5
-12
-8
+15
+12
-8
-8
+18

-83.5

+8
+20
+1.5
126.5

La menor suma es la negativa -83.5 y por consiguiente la estadstica de prueba es 83.5, al


omitir el signo. El valor T se refiere entonces a la tabla de T construida por Wilcoxon para
compararlo con el valor crtico para un valor de significancia dado. En la tabla I se da una
porcin de la tabla T. La tabla da los valores crticos de T a valores especificados de de
0.005, 0.01 y 0.025 para una cola y 0.01, 0.02 y 0.05 para dos colas. Para una cola con n = 20,
el valor crtico de T a = 0.01 es 43, el cual o debajo del cual se encuentra la regin crtica.
Como el valor observado es 83.5, no se rechaza la hiptesis nula o sea que un periodo de
vacaciones no obtiene efecto favorable de alguna significancia en la productividad de los
trabajadores.
Tabla I. Valores crticos de T para la prueba de rangos signados de Wilcoxon.
Pares
n
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25

Nivel de significancia
Prueba de una cola:
0.005
0.01
Prueba de dos colas:
0.01
0.02
0
0
2
2
3
3
5
5
7
7
10
10
13
13
16
16
20
20
24
23
28
28
33
32
38
38
43
43
49
49
56
55
62
61
69
68
77

0.025
0.05
0
2
4
6
8
11
14
17
21
25
30
35
40
46
52
59
66
73
81
89

Fuente: Adaptado de Frank Wilcoxon, Some Rapid Approximate Statistical Procedures


American Cyanamid Company, Nueva York, 1949, con autorizacin del autor y del editor.

Estadstica Inferencial

Jorge Luis Bustos Galindo

Pgina 46

Observe que si se desea llevar a cabo una prueba de dos colas el valor crtico 43 viene
asociado a un nivel de significancia de 0.02 para n = 20.
En pares mayores de 25 la tabla de valores T ya no puede emplearse. Afortunadamente, para
n grande la distribucin de T es aproximadamente normal y lo usual es emplear el mtodo de
aproximacin normal. En efecto, T es aproximadamente N[ ( ) ] con n no inferior de 8.
Damos en seguida las frmulas para calcular la media y la desviacin estndar de la
distribucin T:
( )

El valor Z se calcula como sigue:

)(

( )

En el ejemplo anterior se tiene

( )

)
)(

Que es mayor que el valor crtico -1.645 con


. Por consiguiente, no se rechaza la
hiptesis nula de que el periodo de vacaciones no da por resultado aumento de la
productividad. Este resultado es el mismo obtenido por la prueba de signos estudiada antes.

Prueba de independencia
Entre todas las aplicaciones que se ofrecen de la distribucin Ji cuadrado, es tal vez la prueba
de independencia la que mayor empleo tiene. Este procedimiento consiste en probar la
hiptesis nula segn la cual dos criterios de clasificacin cuando se aplican a dos conjuntos de
entidades, son independientes. Por ejemplo, probar que el hbito de fumar es independiente
del sexo o probar que los retrasos en la llegada al trabajo de las personas que laboran en una
empresa es independiente del tiempo de vinculacin del trabajador.
La clasificacin de un conjunto de entidades, de acuerdo con dos criterios, puede presentarse
mediante una tabla en la que los renglones (filas) representan los diversos niveles de uno de
los criterios de clasificacin y las columnas representan los diversos niveles del segundo
criterio. Una tabla construida de esta forma se denomina, como una tabla de contingencia. La
interseccin de un rengln con una columna se denomina celda.
La hiptesis nula (H0) corresponde a la proposicin: Los dos criterios de clasificacin son
independientes. Si se llega rechazar H0, se concluir que los dos criterios de clasificacin no
son independientes en esta poblacin.
El procedimiento para realizar la prueba incluye los siguientes pasos bsicos:
1. Se especifica cada criterio con sus distintos niveles. Esto determinar los renglones y las
columnas.
2. Se registra en cada celda el nmero de individuos o entidades que satisfacen el nivel dado
por el rengln y la columna simultneamente.
3. Se calculan las frecuencias esperadas, las cuales se colocan en la parte inferior derecha de
la celda o al lado de la frecuencia observada, entre parntesis.
4. Se calcula la suma, valor de la estadstica de prueba,

en donde,
= Nmero de entidades o individuos clasificados en las celdas .
= Frecuencia esperada para la celda .
k = Nmero de celdas.
5. Se busca en la tabla de Ji cuadrado el valor [
(
)(
)] , r = nmero de renglones y c =
nmero de columnas.

Estadstica Inferencial

Jorge Luis Bustos Galindo

Pgina 47

Si el valor

, entonces se rechaza H0 al nivel de significancia .

Ejemplo 2. Suponga que se desea averiguar si existe alguna relacin entre el nivel de
formacin acadmica y el rendimiento laboral para un grupo de 200 empleados. El nivel de
formacin acadmica se clasifica en tres clases: escuela media o primaria, escuela superior y
escuela de especializacin, en tanto que el rendimiento en el trabajo se clasifican como
excelente, bueno o regular. La distribucin de frecuencia conjunta de las 200
observaciones est representada en la siguiente tabla.

Rendimiento
Excelente
Bueno
Regular
Total

Formacin acadmica
Superior Especializacin
40 (30)
10 (15)
30 (40)
20 (20)
30 (30)
20 (15)
100
50

Media o primaria
10 (15)
30 (20)
10 (15)
50

Total
60
80
60
200

La frecuencia esperada (nmero que aparece entre el parntesis) se obtiene al multiplicar el


total de la columna por el total del respectivo rengln y dividir por el total de observaciones.
Ejemplo de las primeras frecuencias esperadas:
,
,
,
A partir de la tabla anterior se obtiene
(

como sigue:

Este valor calculado se confronta con el valor de tabla Ji cuadrado (


con
tenemos,
[

y con

)(

)]

)(

)]

),

.
[
]
El valor calculado es considerablemente superior a estos valores. As que aunque se fijara el
nivel de significancia al 1%, se podra rechazar la hiptesis nula de que no hay relacin
significativa entre la formacin acadmica de los empleados y su rendimiento en el trabajo.
Un caso especial en la prueba de independencia es aquel que emplea una tabla de
contingencia de 2x2. Si se utiliza tal tabla pude aplicarse una frmula simplificada para calcular
.
Suponga que las frecuencias observadas en una tabla de contingencia 2x2, sean a, b, c y d
como sigue:
Individuos o entidades
X
Y
Total
El valor

A
a
c
a+c

B
b
d
b+d

Total
a+b
c+d
n

puede calcularse entonces por la frmula siguiente:


(
(

)(

)
)(

)(

(1)

con (2 1)(2 1) =1 grado de libertad.


Con frecuencia se aplica la correlacin por continuidad de Yates, anloga a la correccin de
continuidad de la aproximacin normal a la binomial, para mejorar la aproximacin a la
probabilidad multinominal exacta. El valor
corregido se calcula as:
(|
(

Estadstica Inferencial

)(

|
)(

)
)(

Jorge Luis Bustos Galindo

(2)

Pgina 48

Ejemplo 3. En un estudio para determinar si exista relacin entre el sexo y el propsito de


elegir una carrera tcnica se entrevistaron 120 aspirantes a la universidad. Los resultados
fueron los siguientes:

Aspira a carrera tcnica


Si
No
40
30
10
40
50
70

Sexo
Hombre
Mujer
Total

Total
70
50
120

Aplicando la frmula (1) tenemos,


(

De la tabla III tenemos que para un grado de libertad el valor crtico


que separa 0.1%
superior es 10.828. Por lo tanto, la hiptesis segn la cual existe independencia entre el sexo y
el propsito de elegir una carrera tcnica debe ser rechazada.
Si se tiene en cuenta la correccin por continuidad de Yates (2) obtenemos:
(|

que es ligeramente menor que el valor antes obtenido, pero aun as la hiptesis de
independencia debe ser rechazada.

Estadstica Inferencial

Jorge Luis Bustos Galindo

Pgina 49

GUA DE CLASE N 7
1. Se desea determinar la eficacia de cierta dieta para adelgazamiento. Se sometieron a la
dieta 17 personas y se les tomaron sus pesos antes y despus de la dieta. Los resultados
se dan a continuacin:
Personas
Pesos antes
Pesos despus

A B
C
D E
F G
H
I
J
K L M
N O
P Q
210 197 203 175 234 178 252 230 190 195 154 179 243 195 198 169 217
208 196 195 175 229 170 242 221 213 180 150 173 235 204 193 169 210

Aplique la prueba T de Wilcoxon para determinar si la dieta ha reducido significativamente


los pesos de las personas del experimento a un nivel del 1%.
2. Los datos que siguen se reunieron con el propsito de determinar si las edades de los
esposos se pueden considerar superiores a las de las esposas.
Esposos
Esposas

58 46 30 35 53 20 45 35 38 43 25 22 37 61 78
47 35 25 38 49 21 42 40 38 38 26 24 39 60 68

Qu puede decir, de acuerdo con estos datos? Empleando la prueba T de Wilcoxon.


Emplee el nivel de significancia
.
3. Se desea determinar si un alza en los salarios incrementara la produccin por hora de los
trabajadores. Sea X esta produccin por hora antes de alza de salarios y sea Y la misma
produccin despus del alza. Una muestra de 20 trabajadores arroja los siguientes datos:
Trabajadores
X
Y

A B C D E F G H I J K L M N O P Q R S T
91 83 70 64 85 86 91 66 72 60 75 84 71 80 70 85 65 75 75 65
88 87 67 69 83 81 94 67 76 55 74 86 72 90 75 83 75 82 65 67

Utilice la estadstica de prueba T para probar la hiptesis nula de que el alza de salarios no
tiene efecto sobre la produccin horaria de los trabajadores, con la hiptesis alterna de que:
a. La produccin por hora tras el alza es superior a la de antes del alza a un nivel de
significancia del
.
b. La produccin por hora tras el alza difiere de la produccin anterior al alza a un nivel de
significancia del
.
4. Suponga que la siguiente es una muestra aleatoria de 1 000 electores clasificados por
afiliacin a partidos y preferencias de voto sobre determinada cuestin:
Preferencia
Pro
Contra

Izquierdista
400
250

Derechista
150
200

Pruebe la hiptesis segn la cual la afiliacin al partido no tiene nada que ver con la
preferencia del voto. Tome
.
5. Cierta compaa desea determinar si el ausentismo se relaciona con la edad. Se toma una
muestra de 200 empleados al azar y se clasifican segn edad y causa de ausentismo as:
Causa
Enfermedad
Otras

Menos de 30
40
20

Edad
30 50
28
36

Ms de 50
52
24

Se encuentra la edad relacionada con el ausentismo? Tome

Estadstica Inferencial

Jorge Luis Bustos Galindo

Pgina 50

6. Una fbrica de automviles quieren averiguar si el sexo de sus posibles clientes no tienen
relacin con la preferencia del modelo. Se toma una muestra aleatoria de 2 000 posibles
clientes y se clasifican as:
Sexo
Varn
Mujer

I
350
340

Modelo
II
III
270 380
400 260

Pruebe la hiptesis segn la cual el sexo no tiene relacin con la preferencia del modelo.
Tome
.
7. La administracin de cierta firma elabor una encuesta para determinar si el tipo de empleo
se relaciona con preferencias por una pliza de seguros. Una muestra de 300 empleados a
los que se entrevist arroj los datos siguientes:
Tipo de empleados
Inspectores
Empleados de oficina
Obreros

Pliza de seguro
I
II
III
18
6
12
42
24
30
36
72
60

Pruebe la hiptesis segn la cual el tiempo de empleo es independiente de la preferencia


por la pliza de seguros. Tome
.

Estadstica Inferencial

Jorge Luis Bustos Galindo

Pgina 51

Tabla I. Distribucin normal estndar

Estadstica Inferencial

Jorge Luis Bustos Galindo

Pgina 52

TABLA II. DISTRIBUCION TSTUDENT

c t1, r
La tabla da reas 1 y valores
, donde, P[T c] 1 , y donde T tiene
distribucin t-Student con r grados de libertad.

0.75

0.80

0.85

0.90

0.95

0.975

0.99

0.995

1
2
3
4
5

1.000
0.816
0.765
0.741
0.727

1.376
1.061
0.978
0.941
0.920

1.963
1.386
1.250
1.190
1.156

3.078
1.886
1.638
1.533
1.476

6.314
2.920
2.353
2.132
2.015

12.706
4.303
3.182
2.776
2.571

31.821
6.965
4.541
3.747
3.365

63.657
9.925
5.841
4.604
4.032

6
7
8
9
10

0.718
0.711
0.706
0.703
0.700

0.906
0.896
0.889
0.883
0.879

1.134
1.119
1.108
1.100
1.093

1.440
1.415
1.397
1.383
1.372

1.943
1.895
1.860
1.833
1.812

2.447
2.365
2.306
2.262
2.228

3.143
2.998
2.896
2.821
2.764

3.707
3.499
3.355
3.250
3.169

11
12
13
14
15

0.697
0.695
0.694
0.692
0.691

0.876
0.873
0.870
0.868
0.866

1.088
1.083
1.079
1.076
1.074

1.363
1.356
1.350
1.345
1.341

1.796
1.782
1.771
1.761
1.753

2.201
2.179
2.160
2.145
2.131

2.718
2.681
2.650
2.624
2.602

3.106
3.055
3.012
2.977
2.947

16
17
18
19
20

0.690
0.689
0.688
0.688
0.687

0.865
0.863
0.862
0.861
0.860

1.071
1.069
1.067
1.066
1.064

1.337
1.333
1.330
1.328
1.325

1.746
1.740
1.734
1.729
1.725

2.120
2.110
2.101
2.093
2.086

2.583
2.567
2.552
2.539
2.528

2.921
2.898
2.878
2.861
2.845

21
22
23
24
25

0.686
0.686
0.685
0.685
0.684

0.859
0.858
0.858
0.857
0.856

1.063
1.061
1.060
1.059
1.058

1.323
1.321
1.319
1.318
1.316

1.721
1.717
1.714
1.711
1.708

2.080
2.074
2.069
2.064
2.060

2.518
2.508
2.500
2.492
2.485

2.831
2.819
2.807
2.797
2.787

26
27
28
29
30

0.684
0.684
0.683
0.683
0.683

0.856
0.855
0.855
0.854
0.854

1.058
1.057
1.056
1.055
1.055

1.315
1.314
1.313
1.311
1.310

1.706
1.703
1.701
1.699
1.697

2.056
2.052
2.048
2.045
2.042

2.479
2.473
2.467
2.462
2.457

2.779
2.771
2.763
2.756
2.750

40
60
120

0.681
0.679
0.677
0.674

0.851
0.848
0.845
0.842

1.050
1.046
1.041
1.036

1.303
1.296
1.289
1.282

1.684
1.671
1.658
1.645

2.021
2.000
1.980
1.960

2.423
2.390
2.358
2.326

2.704
2.660
2.617
2.576

Estadstica Inferencial

Jorge Luis Bustos Galindo

Pgina 53

TABLA III. DISTRIBUCION

Grados libertad
1
2
3
4
.
5
6
7
8
9

0,1
2,71
4,61
6,25
7,78

0,05
3,84
5,99
7,81
9,49

0,025
5,02
7,38
9,35
11,14

0,01
6,63
9,21
11,34
13,28

0,005
7,88
10,60
12,84
14,86

9,24
10,64
12,02
13,36
14,68

11,07
12,59
14,07
15,51
16,92

12,83
14,45
16,01
17,53
19,02

15,09
16,81
18,48
20,09
21,67

16,75
18,55
20,28
21,95
23,59

10
11
12
13
14
.
15
16
17
18
19
.
20
21
22
23
24
.
25
26
27
28
29
.
30
40
50
60

15,99
17,28
18,55
19,81
21,06

18,31
19,68
21,03
22,36
23,68

20,48
21,92
23,34
24,74
26,12

23,21
24,73
26,22
27,69
29,14

25,19
26,76
28,30
29,82
31,32

22,31
23,54
24,77
25,99
27,20

25,00
26,30
27,59
28,87
30,14

27,49
28,85
30,19
31,53
32,85

30,58
32,00
33,41
34,81
36,19

32,80
34,27
35,72
37,16
38,58

28,41
29,62
30,81
32,01
33,20

31,41
32,67
33,92
35,17
36,42

34,17
35,48
36,78
38,08
39,36

37,57
38,93
40,29
41,64
42,98

40,00
41,40
42,80
44,18
45,56

34,38
35,56
36,74
37,92
39,09

37,65
38,89
40,11
41,34
42,56

40,65
41,92
43,19
44,46
45,72

44,31
45,64
46,96
48,28
49,59

46,93
48,29
49,65
50,99
52,34

40,26
51,81
63,17
74,40

43,77
55,76
67,50
79,08

46,98
59,34
71,42
83,30

50,89
63,69
76,15
88,38

53,67
66,77
79,49
91,95

70
80
90
100

85,53
96,58
107,57
118,50

90,53
101,88
113,15
124,34

95,02
106,63
118,14
129,56

100,43
112,33
124,12
135,81

104,21
116,32
128,30
140,17

Estadstica Inferencial

Jorge Luis Bustos Galindo

Pgina 54

TABLA VI. DISTRIBUCION F

0.10 superior

10

12

15

20

24

30

40

60

120

39.8634

49.5000

53.5932

55.8329

57.24

58.2044

58.9059

59.4389

59.8575

60.1949

60.7052

61.2203

61.7402

62.002

62.2649

62.529

62.7942

63.0606

63.3281

8.52632

9.00000

9.16179

9.24342

9.29263

9.32553

9.34908

9.36677

9.38054

9.39157

9.40813

9.42471

9.44131

9.44962

9.45793

9.46624

9.47456

9.48289

9.49122

5.53832

5.46238

5.39077

5.34264

5.30916

5.28473

5.26619

5.25167

5.24

5.23041

5.21562

5.20031

5.18448

5.17636

5.16811

5.15972

5.15119

5.14251

5.1337

4.54477

4.32456

4.19086

4.10725

4.05058

4.00975

3.97897

3.95494

3.93567

3.91988

3.89553

3.87036

3.84434

3.83099

3.81742

3.80361

3.78957

3.77527

3.76073

4.06042

3.77972

3.61948

3.5202

3.45298

3.40451

3.3679

3.33928

3.31628

3.2974

3.26824

3.23801

3.20665

3.19052

3.17408

3.15732

3.14023

3.12279

3.105

3.77595

3.4633

3.28876

3.18076

3.10751

3.05455

3.01446

2.98304

2.95774

2.93693

2.90472

2.87122

2.83634

2.81834

2.79996

2.78117

2.76195

2.74229

2.72216

3.58943

3.25744

3.07407

2.96053

2.88334

2.82739

2.78493

2.75158

2.72468

2.70251

2.66811

2.63223

2.59473

2.57533

2.55546

2.5351

2.51422

2.49279

2.47079

3.45792

3.11312

2.9238

2.80643

2.72645

2.66833

2.62413

2.58935

2.56124

2.53804

2.50196

2.46422

2.42464

2.4041

2.38302

2.36136

2.3391

2.31618

2.29257

3.3603

3.00645

2.81286

2.69268

2.61061

2.55086

2.50531

2.46941

2.44034

2.41632

2.37888

2.33962

2.29832

2.27683

2.25472

2.23196

2.20849

2.18427

2.15923

10

3.28502

2.92447

2.72767

2.60534

2.52164

2.46058

2.41397

2.37715

2.34731

2.3226

2.28405

2.24351

2.20074

2.17843

2.15543

2.13169

2.10716

2.08176

2.05542

11

3.2252

2.85951

2.66023

2.53619

2.45118

2.38907

2.34157

2.304

2.2735

2.24823

2.20873

2.16709

2.12305

2.10001

2.07621

2.05161

2.02612

1.99965

1.97211

12

3.17655

2.8068

2.60552

2.4801

2.39402

2.33102

2.28278

2.24457

2.21352

2.18776

2.14744

2.10485

2.05968

2.03599

2.01149

1.9861

1.95973

1.93228

1.90361

13

3.13621

2.76317

2.56027

2.43371

2.34672

2.28298

2.2341

2.19535

2.16382

2.13763

2.09659

2.05316

2.00698

1.98272

1.95757

1.93147

1.90429

1.87591

1.8462

14

3.10221

2.72647

2.52222

2.39469

2.30694

2.24256

2.19313

2.1539

2.12195

2.0954

2.05371

2.00953

1.96245

1.93766

1.91193

1.88516

1.85723

1.828

1.79728

15

3.07319

2.69517

2.48979

2.36143

2.27302

2.20808

2.15818

2.11853

2.08621

2.05932

2.01707

1.97222

1.92431

1.89904

1.87277

1.84539

1.81676

1.78672

1.75505

16

3.04811

2.66817

2.46181

2.33274

2.24376

2.17833

2.128

2.08798

2.05533

2.02815

1.98539

1.93992

1.89127

1.86556

1.83879

1.81084

1.78156

1.75075

1.71817

17

3.02623

2.64464

2.43743

2.30775

2.21825

2.15239

2.10169

2.06134

2.02839

2.00094

1.95772

1.91169

1.86236

1.83624

1.80901

1.78053

1.75063

1.71909

1.68564

18

3.00698

2.62395

2.41601

2.28577

2.19583

2.12958

2.07854

2.03789

2.00467

1.97698

1.93334

1.88681

1.83685

1.81035

1.78269

1.75371

1.72322

1.69099

1.65671

19

2.9899

2.60561

2.39702

2.2663

2.17596

2.10936

2.05802

2.0171

1.98364

1.95573

1.9117

1.86471

1.81416

1.78731

1.75924

1.72979

1.69876

1.66587

1.63077

20

2.97465

2.58925

2.38009

2.24893

2.15823

2.09132

2.0397

1.99853

1.96485

1.93674

1.89236

1.84494

1.79384

1.76667

1.73822

1.70833

1.67678

1.64326

1.60738

Estadstica Inferencial

Jorge Luis Bustos Galindo

Pgina 55

21

2.96096

2.57457

2.36489

2.23334

2.14231

2.07512

2.02325

1.98186

1.94797

1.91967

1.87497

1.82715

1.77555

1.74807

1.71927

1.68896

1.65691

1.62278

1.58615

22

2.94858

2.56131

2.35117

2.21927

2.12794

2.0605

2.0084

1.9668

1.93273

1.90425

1.85925

1.81106

1.75899

1.73122

1.70208

1.67138

1.63885

1.60415

1.56678

23

2.93736

2.54929

2.33873

2.20651

2.11491

2.04723

1.99492

1.95312

1.91888

1.89025

1.84497

1.79643

1.74392

1.71588

1.68643

1.65535

1.62237

1.58711

1.54903

24

2.92712

2.53833

2.32739

2.19488

2.10303

2.03513

1.98263

1.94066

1.90625

1.87748

1.83194

1.78308

1.73015

1.70185

1.6721

1.64067

1.60726

1.57146

1.5327

25

2.91774

2.52831

2.31702

2.18424

2.09216

2.02406

1.97138

1.92925

1.89469

1.86578

1.82

1.77083

1.71752

1.68898

1.65895

1.62718

1.59335

1.55703

1.5176

26

2.90913

2.5191

2.30749

2.17447

2.08218

2.01389

1.96104

1.91876

1.88407

1.85503

1.80902

1.75957

1.70589

1.67712

1.64682

1.61472

1.5805

1.54368

1.5036

27

2.90119

2.51061

2.29871

2.16546

2.07298

2.00452

1.95151

1.90909

1.87427

1.84511

1.79889

1.74917

1.69514

1.66616

1.6356

1.6032

1.56859

1.53129

1.49057

28

2.89385

2.50276

2.2906

2.15714

2.06447

1.99585

1.9427

1.90014

1.8652

1.83593

1.78951

1.73954

1.68519

1.656

1.62519

1.5925

1.55753

1.51976

1.47841

29

2.88703

2.49548

2.28307

2.14941

2.05658

1.98781

1.93452

1.89184

1.85679

1.82741

1.78081

1.7306

1.67593

1.64655

1.61551

1.58253

1.54721

1.50899

1.46704

30

2.88069

2.48872

2.27607

2.14223

2.04925

1.98033

1.92692

1.88412

1.84896

1.81949

1.7727

1.72227

1.66731

1.63774

1.60648

1.57323

1.53757

1.49891

1.45636

40

2.83535

2.44037

2.22609

2.09095

1.99682

1.92688

1.87252

1.82886

1.7929

1.76269

1.71456

1.66241

1.60515

1.57411

1.54108

1.50562

1.46716

1.42476

1.37691

60

2.79107

2.39325

2.17741

2.04099

1.94571

1.87472

1.81939

1.77483

1.73802

1.70701

1.65743

1.60337

1.54349

1.51072

1.47554

1.43734

1.3952

1.34757

1.29146

120

2.74781

2.34734

2.12999

1.9923

1.89587

1.82381

1.76748

1.72196

1.68425

1.65238

1.6012

1.545

1.48207

1.44723

1.40938

1.3676

1.32034

1.26457

1.19256

2.70554

2.30259

2.0838

1.94486

1.84727

1.77411

1.71672

1.6702

1.63152

1.59872

1.54578

1.48714

1.4206

1.38318

1.34187

1.29513

1.23995

1.1686

Estadstica Inferencial

Jorge Luis Bustos Galindo

Pgina 56

TABLA VI. DISTRIBUCION F (Continuacin)

0.05 superior

10

12

15

20

24

30

40

60

120

df2=1

161.447

199.5

215.707

224.583

230.161

233.986

236.768

238.882

240.543

241.881

243.906

245.949

248.013

249.051

250.095

251.143

252.195

253.252

254.314

18.5128

19

19.1643

19.2468

19.2964

19.3295

19.3532

19.371

19.3848

19.3959

19.4125

19.4291

19.4458

19.4541

19.4624

19.4707

19.4791

19.4874

19.4957

10.128

9.5521

9.2766

9.1172

9.0135

8.9406

8.8867

8.8452

8.8123

8.7855

8.7446

8.7029

8.6602

8.6385

8.6166

8.5944

8.572

8.5494

8.5264

7.7086

6.9443

6.5914

6.3882

6.2561

6.1631

6.0942

6.041

5.9988

5.9644

5.9117

5.8578

5.8025

5.7744

5.7459

5.717

5.6877

5.6581

5.6281

6.6079

5.7861

5.4095

5.1922

5.0503

4.9503

4.8759

4.8183

4.7725

4.7351

4.6777

4.6188

4.5581

4.5272

4.4957

4.4638

4.4314

4.3985

4.365

5.9874

5.1433

4.7571

4.5337

4.3874

4.2839

4.2067

4.1468

4.099

4.06

3.9999

3.9381

3.8742

3.8415

3.8082

3.7743

3.7398

3.7047

3.6689

5.5914

4.7374

4.3468

4.1203

3.9715

3.866

3.787

3.7257

3.6767

3.6365

3.5747

3.5107

3.4445

3.4105

3.3758

3.3404

3.3043

3.2674

3.2298

5.3177

4.459

4.0662

3.8379

3.6875

3.5806

3.5005

3.4381

3.3881

3.3472

3.2839

3.2184

3.1503

3.1152

3.0794

3.0428

3.0053

2.9669

2.9276

5.1174

4.2565

3.8625

3.6331

3.4817

3.3738

3.2927

3.2296

3.1789

3.1373

3.0729

3.0061

2.9365

2.9005

2.8637

2.8259

2.7872

2.7475

2.7067

10

4.9646

4.1028

3.7083

3.478

3.3258

3.2172

3.1355

3.0717

3.0204

2.9782

2.913

2.845

2.774

2.7372

2.6996

2.6609

2.6211

2.5801

2.5379

11

4.8443

3.9823

3.5874

3.3567

3.2039

3.0946

3.0123

2.948

2.8962

2.8536

2.7876

2.7186

2.6464

2.609

2.5705

2.5309

2.4901

2.448

2.4045

12

4.7472

3.8853

3.4903

3.2592

3.1059

2.9961

2.9134

2.8486

2.7964

2.7534

2.6866

2.6169

2.5436

2.5055

2.4663

2.4259

2.3842

2.341

2.2962

13

4.6672

3.8056

3.4105

3.1791

3.0254

2.9153

2.8321

2.7669

2.7144

2.671

2.6037

2.5331

2.4589

2.4202

2.3803

2.3392

2.2966

2.2524

2.2064

14

4.6001

3.7389

3.3439

3.1122

2.9582

2.8477

2.7642

2.6987

2.6458

2.6022

2.5342

2.463

2.3879

2.3487

2.3082

2.2664

2.2229

2.1778

2.1307

15

4.5431

3.6823

3.2874

3.0556

2.9013

2.7905

2.7066

2.6408

2.5876

2.5437

2.4753

2.4034

2.3275

2.2878

2.2468

2.2043

2.1601

2.1141

2.0658

16

4.494

3.6337

3.2389

3.0069

2.8524

2.7413

2.6572

2.5911

2.5377

2.4935

2.4247

2.3522

2.2756

2.2354

2.1938

2.1507

2.1058

2.0589

2.0096

17

4.4513

3.5915

3.1968

2.9647

2.81

2.6987

2.6143

2.548

2.4943

2.4499

2.3807

2.3077

2.2304

2.1898

2.1477

2.104

2.0584

2.0107

1.9604

18

4.4139

3.5546

3.1599

2.9277

2.7729

2.6613

2.5767

2.5102

2.4563

2.4117

2.3421

2.2686

2.1906

2.1497

2.1071

2.0629

2.0166

1.9681

1.9168

19

4.3807

3.5219

3.1274

2.8951

2.7401

2.6283

2.5435

2.4768

2.4227

2.3779

2.308

2.2341

2.1555

2.1141

2.0712

2.0264

1.9795

1.9302

1.878

20

4.3512

3.4928

3.0984

2.8661

2.7109

2.599

2.514

2.4471

2.3928

2.3479

2.2776

2.2033

2.1242

2.0825

2.0391

1.9938

1.9464

1.8963

1.8432

Estadstica Inferencial

Jorge Luis Bustos Galindo

Pgina 57

21

4.3248

3.4668

3.0725

2.8401

2.6848

2.5727

2.4876

2.4205

2.366

2.321

2.2504

2.1757

2.096

2.054

2.0102

1.9645

1.9165

1.8657

1.8117

22

4.3009

3.4434

3.0491

2.8167

2.6613

2.5491

2.4638

2.3965

2.3419

2.2967

2.2258

2.1508

2.0707

2.0283

1.9842

1.938

1.8894

1.838

1.7831

23

4.2793

3.4221

3.028

2.7955

2.64

2.5277

2.4422

2.3748

2.3201

2.2747

2.2036

2.1282

2.0476

2.005

1.9605

1.9139

1.8648

1.8128

1.757

24

4.2597

3.4028

3.0088

2.7763

2.6207

2.5082

2.4226

2.3551

2.3002

2.2547

2.1834

2.1077

2.0267

1.9838

1.939

1.892

1.8424

1.7896

1.733

25

4.2417

3.3852

2.9912

2.7587

2.603

2.4904

2.4047

2.3371

2.2821

2.2365

2.1649

2.0889

2.0075

1.9643

1.9192

1.8718

1.8217

1.7684

1.711

26

4.2252

3.369

2.9752

2.7426

2.5868

2.4741

2.3883

2.3205

2.2655

2.2197

2.1479

2.0716

1.9898

1.9464

1.901

1.8533

1.8027

1.7488

1.6906

27

4.21

3.3541

2.9604

2.7278

2.5719

2.4591

2.3732

2.3053

2.2501

2.2043

2.1323

2.0558

1.9736

1.9299

1.8842

1.8361

1.7851

1.7306

1.6717

28

4.196

3.3404

2.9467

2.7141

2.5581

2.4453

2.3593

2.2913

2.236

2.19

2.1179

2.0411

1.9586

1.9147

1.8687

1.8203

1.7689

1.7138

1.6541

29

4.183

3.3277

2.934

2.7014

2.5454

2.4324

2.3463

2.2783

2.2229

2.1768

2.1045

2.0275

1.9446

1.9005

1.8543

1.8055

1.7537

1.6981

1.6376

30

4.1709

3.3158

2.9223

2.6896

2.5336

2.4205

2.3343

2.2662

2.2107

2.1646

2.0921

2.0148

1.9317

1.8874

1.8409

1.7918

1.7396

1.6835

1.6223

40

4.0847

3.2317

2.8387

2.606

2.4495

2.3359

2.249

2.1802

2.124

2.0772

2.0035

1.9245

1.8389

1.7929

1.7444

1.6928

1.6373

1.5766

1.5089

60

4.0012

3.1504

2.7581

2.5252

2.3683

2.2541

2.1665

2.097

2.0401

1.9926

1.9174

1.8364

1.748

1.7001

1.6491

1.5943

1.5343

1.4673

1.3893

120

3.9201

3.0718

2.6802

2.4472

2.2899

2.175

2.0868

2.0164

1.9588

1.9105

1.8337

1.7505

1.6587

1.6084

1.5543

1.4952

1.429

1.3519

1.2539

3.8415

2.9957

2.6049

2.3719

2.2141

2.0986

2.0096

1.9384

1.8799

1.8307

1.7522

1.6664

1.5705

1.5173

1.4591

1.394

1.318

1.2214

Estadstica Inferencial

Jorge Luis Bustos Galindo

Pgina 58

TABLA VI. DISTRIBUCION F (Continuacin)

0.025 superior

10

12

15

20

24

30

40

60

120

647.789

799.5

864.163

899.583

921.847

937.111

948.216

956.656

963.284

968.627

976.707

984.866

993.102

997.249

1001.41

1005.59

1009.8

1014.02

1018.258

38.5063

39

39.1655

39.2484

39.2982

39.3315

39.3552

39.373

39.3869

39.398

39.4146

39.4313

39.4479

39.4562

39.465

39.473

39.481

39.49

39.498

17.4434

16.0441

15.4392

15.101

14.8848

14.7347

14.6244

14.5399

14.4731

14.4189

14.3366

14.2527

14.1674

14.1241

14.081

14.037

13.992

13.947

13.902

12.2179

10.6491

9.9792

9.6045

9.3645

9.1973

9.0741

8.9796

8.9047

8.8439

8.7512

8.6565

8.5599

8.5109

8.461

8.411

8.36

8.309

8.257

10.007

8.4336

7.7636

7.3879

7.1464

6.9777

6.8531

6.7572

6.6811

6.6192

6.5245

6.4277

6.3286

6.278

6.227

6.175

6.123

6.069

6.015

8.8131

7.2599

6.5988

6.2272

5.9876

5.8198

5.6955

5.5996

5.5234

5.4613

5.3662

5.2687

5.1684

5.1172

5.065

5.012

4.959

4.904

4.849

8.0727

6.5415

5.8898

5.5226

5.2852

5.1186

4.9949

4.8993

4.8232

4.7611

4.6658

4.5678

4.4667

4.415

4.362

4.309

4.254

4.199

4.142

7.5709

6.0595

5.416

5.0526

4.8173

4.6517

4.5286

4.4333

4.3572

4.2951

4.1997

4.1012

3.9995

3.9472

3.894

3.84

3.784

3.728

3.67

7.2093

5.7147

5.0781

4.7181

4.4844

4.3197

4.197

4.102

4.026

3.9639

3.8682

3.7694

3.6669

3.6142

3.56

3.505

3.449

3.392

3.333

10

6.9367

5.4564

4.8256

4.4683

4.2361

4.0721

3.9498

3.8549

3.779

3.7168

3.6209

3.5217

3.4185

3.3654

3.311

3.255

3.198

3.14

3.08

11

6.7241

5.2559

4.63

4.2751

4.044

3.8807

3.7586

3.6638

3.5879

3.5257

3.4296

3.3299

3.2261

3.1725

3.118

3.061

3.004

2.944

2.883

12

6.5538

5.0959

4.4742

4.1212

3.8911

3.7283

3.6065

3.5118

3.4358

3.3736

3.2773

3.1772

3.0728

3.0187

2.963

2.906

2.848

2.787

2.725

13

6.4143

4.9653

4.3472

3.9959

3.7667

3.6043

3.4827

3.388

3.312

3.2497

3.1532

3.0527

2.9477

2.8932

2.837

2.78

2.72

2.659

2.595

14

6.2979

4.8567

4.2417

3.8919

3.6634

3.5014

3.3799

3.2853

3.2093

3.1469

3.0502

2.9493

2.8437

2.7888

2.732

2.674

2.614

2.552

2.487

15

6.1995

4.765

4.1528

3.8043

3.5764

3.4147

3.2934

3.1987

3.1227

3.0602

2.9633

2.8621

2.7559

2.7006

2.644

2.585

2.524

2.461

2.395

16

6.1151

4.6867

4.0768

3.7294

3.5021

3.3406

3.2194

3.1248

3.0488

2.9862

2.889

2.7875

2.6808

2.6252

2.568

2.509

2.447

2.383

2.316

17

6.042

4.6189

4.0112

3.6648

3.4379

3.2767

3.1556

3.061

2.9849

2.9222

2.8249

2.723

2.6158

2.5598

2.502

2.442

2.38

2.315

2.247

18

5.9781

4.5597

3.9539

3.6083

3.382

3.2209

3.0999

3.0053

2.9291

2.8664

2.7689

2.6667

2.559

2.5027

2.445

2.384

2.321

2.256

2.187

19

5.9216

4.5075

3.9034

3.5587

3.3327

3.1718

3.0509

2.9563

2.8801

2.8172

2.7196

2.6171

2.5089

2.4523

2.394

2.333

2.27

2.203

2.133

20

5.8715

4.4613

3.8587

3.5147

3.2891

3.1283

3.0074

2.9128

2.8365

2.7737

2.6758

2.5731

2.4645

2.4076

2.349

2.287

2.223

2.156

2.085

Estadstica Inferencial

Jorge Luis Bustos Galindo

Pgina 59

21

5.8266

4.4199

3.8188

3.4754

3.2501

3.0895

2.9686

2.874

2.7977

2.7348

2.6368

2.5338

2.4247

2.3675

2.308

2.246

2.182

2.114

2.042

22

5.7863

4.3828

3.7829

3.4401

3.2151

3.0546

2.9338

2.8392

2.7628

2.6998

2.6017

2.4984

2.389

2.3315

2.272

2.21

2.145

2.076

2.003

23

5.7498

4.3492

3.7505

3.4083

3.1835

3.0232

2.9023

2.8077

2.7313

2.6682

2.5699

2.4665

2.3567

2.2989

2.239

2.176

2.111

2.041

1.968

24

5.7166

4.3187

3.7211

3.3794

3.1548

2.9946

2.8738

2.7791

2.7027

2.6396

2.5411

2.4374

2.3273

2.2693

2.209

2.146

2.08

2.01

1.935

25

5.6864

4.2909

3.6943

3.353

3.1287

2.9685

2.8478

2.7531

2.6766

2.6135

2.5149

2.411

2.3005

2.2422

2.182

2.118

2.052

1.981

1.906

26

5.6586

4.2655

3.6697

3.3289

3.1048

2.9447

2.824

2.7293

2.6528

2.5896

2.4908

2.3867

2.2759

2.2174

2.157

2.093

2.026

1.954

1.878

27

5.6331

4.2421

3.6472

3.3067

3.0828

2.9228

2.8021

2.7074

2.6309

2.5676

2.4688

2.3644

2.2533

2.1946

2.133

2.069

2.002

1.93

1.853

28

5.6096

4.2205

3.6264

3.2863

3.0626

2.9027

2.782

2.6872

2.6106

2.5473

2.4484

2.3438

2.2324

2.1735

2.112

2.048

1.98

1.907

1.829

29

5.5878

4.2006

3.6072

3.2674

3.0438

2.884

2.7633

2.6686

2.5919

2.5286

2.4295

2.3248

2.2131

2.154

2.092

2.028

1.959

1.886

1.807

30

5.5675

4.1821

3.5894

3.2499

3.0265

2.8667

2.746

2.6513

2.5746

2.5112

2.412

2.3072

2.1952

2.1359

2.074

2.009

1.94

1.866

1.787

40

5.4239

4.051

3.4633

3.1261

2.9037

2.7444

2.6238

2.5289

2.4519

2.3882

2.2882

2.1819

2.0677

2.0069

1.943

1.875

1.803

1.724

1.637

60

5.2856

3.9253

3.3425

3.0077

2.7863

2.6274

2.5068

2.4117

2.3344

2.2702

2.1692

2.0613

1.9445

1.8817

1.815

1.744

1.667

1.581

1.482

120

5.1523

3.8046

3.2269

2.8943

2.674

2.5154

2.3948

2.2994

2.2217

2.157

2.0548

1.945

1.8249

1.7597

1.69

1.614

1.53

1.433

1.31

5.0239

3.6889

3.1161

2.7858

2.5665

2.4082

2.2875

2.1918

2.1136

2.0483

1.9447

1.8326

1.7085

1.6402

1.566

1.484

1.388

1.268

Estadstica Inferencial

Jorge Luis Bustos Galindo

Pgina 60

TABLA VI. DISTRIBUCION F (Continuacin)

0.01 superior

10

12

15

20

24

30

40

60

120

4052.18

4999.5

5403.35

5624.58

5763.65

5858.98

5928.35

5981.07

6022.47

6055.84

6106.32

6157.28

6208.73

6234.63

6260.64

6286.78

6313.03

6339.39

6365.86

98.503

99

99.166

99.249

99.299

99.333

99.356

99.374

99.388

99.399

99.416

99.433

99.449

99.458

99.466

99.474

99.482

99.491

99.499

34.116

30.817

29.457

28.71

28.237

27.911

27.672

27.489

27.345

27.229

27.052

26.872

26.69

26.598

26.505

26.411

26.316

26.221

26.125

21.198

18

16.694

15.977

15.522

15.207

14.976

14.799

14.659

14.546

14.374

14.198

14.02

13.929

13.838

13.745

13.652

13.558

13.463

16.258

13.274

12.06

11.392

10.967

10.672

10.456

10.289

10.158

10.051

9.888

9.722

9.553

9.466

9.379

9.291

9.202

9.112

9.02

13.745

10.925

9.78

9.148

8.746

8.466

8.26

8.102

7.976

7.874

7.718

7.559

7.396

7.313

7.229

7.143

7.057

6.969

6.88

12.246

9.547

8.451

7.847

7.46

7.191

6.993

6.84

6.719

6.62

6.469

6.314

6.155

6.074

5.992

5.908

5.824

5.737

5.65

11.259

8.649

7.591

7.006

6.632

6.371

6.178

6.029

5.911

5.814

5.667

5.515

5.359

5.279

5.198

5.116

5.032

4.946

4.859

10.561

8.022

6.992

6.422

6.057

5.802

5.613

5.467

5.351

5.257

5.111

4.962

4.808

4.729

4.649

4.567

4.483

4.398

4.311

10

10.044

7.559

6.552

5.994

5.636

5.386

5.2

5.057

4.942

4.849

4.706

4.558

4.405

4.327

4.247

4.165

4.082

3.996

3.909

11

9.646

7.206

6.217

5.668

5.316

5.069

4.886

4.744

4.632

4.539

4.397

4.251

4.099

4.021

3.941

3.86

3.776

3.69

3.602

12

9.33

6.927

5.953

5.412

5.064

4.821

4.64

4.499

4.388

4.296

4.155

4.01

3.858

3.78

3.701

3.619

3.535

3.449

3.361

13

9.074

6.701

5.739

5.205

4.862

4.62

4.441

4.302

4.191

4.1

3.96

3.815

3.665

3.587

3.507

3.425

3.341

3.255

3.165

14

8.862

6.515

5.564

5.035

4.695

4.456

4.278

4.14

4.03

3.939

3.8

3.656

3.505

3.427

3.348

3.266

3.181

3.094

3.004

15

8.683

6.359

5.417

4.893

4.556

4.318

4.142

4.004

3.895

3.805

3.666

3.522

3.372

3.294

3.214

3.132

3.047

2.959

2.868

16

8.531

6.226

5.292

4.773

4.437

4.202

4.026

3.89

3.78

3.691

3.553

3.409

3.259

3.181

3.101

3.018

2.933

2.845

2.753

17

8.4

6.112

5.185

4.669

4.336

4.102

3.927

3.791

3.682

3.593

3.455

3.312

3.162

3.084

3.003

2.92

2.835

2.746

2.653

18

8.285

6.013

5.092

4.579

4.248

4.015

3.841

3.705

3.597

3.508

3.371

3.227

3.077

2.999

2.919

2.835

2.749

2.66

2.566

19

8.185

5.926

5.01

4.5

4.171

3.939

3.765

3.631

3.523

3.434

3.297

3.153

3.003

2.925

2.844

2.761

2.674

2.584

2.489

20

8.096

5.849

4.938

4.431

4.103

3.871

3.699

3.564

3.457

3.368

3.231

3.088

2.938

2.859

2.778

2.695

2.608

2.517

2.421

Estadstica Inferencial

Jorge Luis Bustos Galindo

Pgina 61

21

8.017

5.78

4.874

4.369

4.042

3.812

3.64

3.506

3.398

3.31

3.173

3.03

2.88

2.801

2.72

2.636

2.548

2.457

2.36

22

7.945

5.719

4.817

4.313

3.988

3.758

3.587

3.453

3.346

3.258

3.121

2.978

2.827

2.749

2.667

2.583

2.495

2.403

2.305

23

7.881

5.664

4.765

4.264

3.939

3.71

3.539

3.406

3.299

3.211

3.074

2.931

2.781

2.702

2.62

2.535

2.447

2.354

2.256

24

7.823

5.614

4.718

4.218

3.895

3.667

3.496

3.363

3.256

3.168

3.032

2.889

2.738

2.659

2.577

2.492

2.403

2.31

2.211

25

7.77

5.568

4.675

4.177

3.855

3.627

3.457

3.324

3.217

3.129

2.993

2.85

2.699

2.62

2.538

2.453

2.364

2.27

2.169

26

7.721

5.526

4.637

4.14

3.818

3.591

3.421

3.288

3.182

3.094

2.958

2.815

2.664

2.585

2.503

2.417

2.327

2.233

2.131

27

7.677

5.488

4.601

4.106

3.785

3.558

3.388

3.256

3.149

3.062

2.926

2.783

2.632

2.552

2.47

2.384

2.294

2.198

2.097

28

7.636

5.453

4.568

4.074

3.754

3.528

3.358

3.226

3.12

3.032

2.896

2.753

2.602

2.522

2.44

2.354

2.263

2.167

2.064

29

7.598

5.42

4.538

4.045

3.725

3.499

3.33

3.198

3.092

3.005

2.868

2.726

2.574

2.495

2.412

2.325

2.234

2.138

2.034

30

7.562

5.39

4.51

4.018

3.699

3.473

3.304

3.173

3.067

2.979

2.843

2.7

2.549

2.469

2.386

2.299

2.208

2.111

2.006

40

7.314

5.179

4.313

3.828

3.514

3.291

3.124

2.993

2.888

2.801

2.665

2.522

2.369

2.288

2.203

2.114

2.019

1.917

1.805

60

7.077

4.977

4.126

3.649

3.339

3.119

2.953

2.823

2.718

2.632

2.496

2.352

2.198

2.115

2.028

1.936

1.836

1.726

1.601

120

6.851

4.787

3.949

3.48

3.174

2.956

2.792

2.663

2.559

2.472

2.336

2.192

2.035

1.95

1.86

1.763

1.656

1.533

1.381

6.635

4.605

3.782

3.319

3.017

2.802

2.639

2.511

2.407

2.321

2.185

2.039

1.878

1.791

1.696

1.592

1.473

1.325

Estadstica Inferencial

Jorge Luis Bustos Galindo

Pgina 62

FUENTES DE INFORMACION
TEXTO BSICO
Estadstica para las ciencias Administrativas, Lincoln, L. Chao. Editorial MC GRAWH HILL.
Tercera edicin.

FUENTES DE INTERNET
http://es.wikipedia.org/wiki/Probabilidad
http://www.slideshare.net/milit/muestreo-aleatorio-simple
http://es.wikipedia.org/wiki/Muestreo_en_estad%C3%ADstica
http://es.wikipedia.org/wiki/Contraste_de_hip%C3%B3tesis

Estadstica Inferencial

Jorge Luis Bustos Galindo

Pgina 63