You are on page 1of 10

UNMSM FISI EAPIS - CURSO: ESTADSTICA II SEMESTRE ACADMICO 2013-2

PROFESORA: LIC. JUSTA CARIDAD HUAROTO SUMARI Pgina 1



UNIDAD 3: MTODOS DE MUESTREO Y DISTRIBUCIONES MUESTRALES

INTRODUCCIN
En muchas investigaciones estadsticas el objetivo principal puede ser el estudio de un parmetro o
alguna caracterstica de la poblacin. Dicha caracterstica se presenta mediante una v.a. X. Asociada
a la v.a. est su distribucin de probabilidad f
x
(x;u), donde u representa al parmetro.
Por ejemplo, si se deseara tener informacin acerca de las utilidades obtenidas en el ao 2012 por las
empresas mineras que operan en el Per, el modelo asociado a la v.a. X que representa las utilidades
podra ser la distribucin normal, la cual depende de dos parmetros, uno de los parmetros sera la
utilidad promedio de las empresas.

En estadstica descriptiva se desarrollan mtodos para recolectar, presentar y resumir datos.

Mediante la teora de probabilidad se determinan los fundamentos de los modelos para describir
fenmenos que presentan variabilidad.

Ahora, mediante la estadstica inferencial se desarrollan mtodos para obtener conclusiones validas
acerca de algunas caractersticas de la poblacin, en base a la informacin contenida en una muestra
aleatoria. La inferencia estadstica es de naturaleza inductiva, emplea razonamientos que van de lo
particular a lo general y de lo observado a lo no observado.

Mediante la inferencia estadstica, una vez elegida la muestra, se abordan los dos siguientes aspectos:
(1) estimar el valor del parmetro desconocido u (estimacin de parmetros) y (2) "decidir" si u es
igual o no a cierto valor predeterminado (prueba de hiptesis).

La metodologa para hacer inferencias se apoya en la teora de la probabilidad.

A continuacin, definimos algunos trminos que se utilizan en la estadstica inferencial, dentro del
contexto de una investigacin estadstica.

INFERENCIA ESTADSTICA PARAMTRICA

Cuando los procedimientos inferenciales requieren la especificacin de una distribucin de
probabilidad para la poblacin de inters, entonces se har uso de los mtodos paramtricos.
Generalmente, la distribucin de probabilidad que se asigna como modelo terico a la v.a. X depende
de parmetros que no se conocen y la inferencia estadstica se aplica con el propsito de conocer
tales parmetros.

INFERENCIA ESTADSTICA NO PARAMTRICA

Cuando los procedimientos inferenciales no necesitan considerar un modelo probabilstico o una
distribucin de probabilidad para la poblacin de inters, entonces se har uso de los mtodos no
paramtricos, conocidos tambin como mtodos de libre distribucin.

UNIDAD ESTADSTICA

Es el elemento bsico de la poblacin, del cual se desea obtener informacin. Dependiendo del tipo
de investigacin, la U.E. puede ser una persona, una familia, una empresa, una institucin, una
vivienda, una parcela, una maquina, un producto manufacturado, etc. Tambin se le conoce como
unidad experimental o unidad de anlisis.
UNMSM FISI EAPIS - CURSO: ESTADSTICA II SEMESTRE ACADMICO 2013-2

PROFESORA: LIC. JUSTA CARIDAD HUAROTO SUMARI Pgina 2

POBLACIN ESTADSTICA

Es cualquier coleccin o agregacin bien definida de unidades estadsticas, de las cuales deseamos
hacer inferencias. El tamao de la poblacin se denota por N. Como ejemplo tenemos la poblacin
conformada por los alumnos de la FISI, UNMSM, matriculados en el semestre actual. La poblacin
debe estar bien definida en cuanto a su contenido y delimitada en el tiempo y en el espacio. En I.E.,
generalmente, se representa a la poblacin mediante una v.a. X, la cual tiene una distribucin de
probabilidad f
x
(x; u). Algunas veces se har referencia a una poblacin de unidades de anlisis (por
ejemplo: poblacin de alumnos del aula) y otras veces se har referencia a una poblacin de
mediciones (por ejemplo: poblacin de edades de los alumnos del aula). En inferencia estadstica,
nuestra atencin se concentrar en las poblaciones de nmeros. De acuerdo con esto, podemos
definir una poblacin como el conjunto total de mediciones de inters para determinada variable
aleatoria.

PARMETRO

Sea la poblacin X
1
, X
2
,..., X
N
. Se llama parmetro a toda funcin matemtica aplicada a la
poblacin. Un parmetro se denota como u .

Ejemplo de parmetro: u = =

=
N
i
i
N
x
1
, la media poblacional.
Un parmetro describe parcial o completamente- la distribucin de probabilidad de la variable de
inters en una poblacin. Por ejemplo, si X es la edad de los alumnos de este curso, no se sabe qu
distribucin tiene X pero podra suponerse que las edades siguen una distribucin normal. Siendo los
parmetros : edad promedio y o
2
: varianza de las edades, ambos desconocidos, la distribucin
normal no se encuentra especificada.

MUESTRA ALEATORIA:

Intuitivamente, una muestra aleatoria es un subconjunto de la poblacin seleccionado con algn
mtodo de muestreo probabilstico.
Formalmente, una muestra aleatoria de tamao n, extrada de una poblacin X con funcin de
densidad f(x), es un conjunto de n variables aleatorias X1, X2, , Xn independientes e
idnticamente distribuidas, todas con la misma distribucin de X.

ESTADSTICA:

Una estadstica T=t(X
1
, X
2
, , X
n
) es una funcin real de la muestra aleatoria, que no contiene
parmetros desconocidos.
Ejemplos de estadsticas: la media muestral, la varianza muestral, la proporcin muestral.

DISTRIBUCIN MUESTRAL:

Se denomina distribucin muestral a la distribucin de probabilidad de una estadstica, obtenida a
partir de todas las posibles muestras de tamao n, elegidas aleatoriamente de una poblacin
determinada.
La distribucin muestral de una estadstica desempea un papel fundamental en la teora de la
inferencia estadstica.

UNMSM FISI EAPIS - CURSO: ESTADSTICA II SEMESTRE ACADMICO 2013-2

PROFESORA: LIC. JUSTA CARIDAD HUAROTO SUMARI Pgina 3

ESTIMADOR

Sea la muestra aleatoria X
1
, X
2
,..., Xn. Un estimador es una estadstica que se usa para estimar un
parmetro. Un estimador se denota como u

= T = t(X
1
, X
2
,..., Xn).

Ejemplo de estimador: u

= X =

=
n
i
i
n
x
1
, la media muestral.

ESTIMACIN ESTADSTICA

Es un procedimiento que consiste en utilizar datos muestrales para determinar los valores de los
parmetros desconocidos de una poblacin. La estimacin de un parmetro puede hacerse mediante
un nico valor (estimacin puntual) o mediante un conjunto de valores (estimacin por intervalo).

MUESTRA ALEATORIA
Una muestra aleatoria de tamao n, de una poblacin X, es un conjunto de n unidades
estadsticas, todas ellas elegidas con igual probabilidad y de manera independiente. De manera
equivalente, todas las muestras de tamao n tienen la misma probabilidad de ser seleccionadas.

OBSERVACIONES:

1) La definicin anterior equivale a decir que, una muestra aleatoria de tamao n, de X, es un
conjunto de n variables aleatorias X
1
, X
2
, ..., X
n
independientes e idnticamente distribuidas,
todas con la misma distribucin que X.
La variable X
i
denota el valor numrico del i-simo elemento muestreado.
2) Si en la poblacin, la media y la varianza de X son y o
2
, respectivamente, entonces cada
una de las variables X
i
de la muestra tendr la misma media y la misma varianza o
2
.
A los parmetros y o
2
se les llama media poblacional y varianza poblacional,
respectivamente. Recordar que, en una poblacin:

N
X X X
N
+ + +
=
...
2 1
y
2
1
2
) (
1
o =

=
N
i
i
X
N



MUESTREO PROBABILSTICO: SELECCIN DE LA MUESTRA

Obtener una muestra significa que en ella se vean reflejadas todas las caractersticas de la poblacin
en estudio. Las principales ventajas de estudiar una poblacin a partir de una muestra son las
siguientes: costo reducido, mayor rapidez, ms exactitud.

Unidad de muestreo: son colecciones no traslapadas de los elementos de la poblacin que cubren la
poblacin completa.

Marco muestral: Es una lista de unidades de muestreo.


MTODOS PROBABILISTICOS DE MUESTREO

UNMSM FISI EAPIS - CURSO: ESTADSTICA II SEMESTRE ACADMICO 2013-2

PROFESORA: LIC. JUSTA CARIDAD HUAROTO SUMARI Pgina 4

MUETREO ALEATORIO SIMPLE (M.A.S.):
Un Muestreo Aleatorio Simple es aqul que se formula de modo que todos los elementos de una
poblacin de tamao N tengan la misma probabilidad de ser incluidos en la muestra de tamao n.
En este tipo de muestreo cada muestra de tamao n tiene la misma probabilidad de ser elegida.
El M.A.S puede ser de dos formas: sin reposicin y con reposicin.
El M.A.S generalmente es usado en encuestas de pequea escala.
En encuestas de gran escala, el M.A.S es utilizado como parte del diseo de muestreo que es ms
complejo.
Este tipo de muestreo probabilstico se aplica cuando la poblacin es homognea.
A cada unidad de muestreo se le asigna un nmero y a travs de un medio ( esferas dentro de una
urna, tabla de nmeros aleatorios, nmeros aleatorios generados por una calculadora o software
informtica) se eligen tantos elementos como sean necesarios para completar el tamao de la
muestra

MUESTREO SISTEMTICO
Se tiene un marco muestral; es decir, una lista con todas las N unidades de muestreo definidas en la
poblacin (algunas veces ser una lista de N unidades de anlisis). Para extraer la muestra
sistemtica de tamao n, se elige un nmero i al azar entre 1 y k , donde k = N/n y los elementos que
integran la muestra son los que ocupan las posiciones i, i+k, i+2k, i+3k, , i+(n-1)k; vale decir, que
se seleccionan los elementos de k en k
Por ejemplo, si el marco muestral est conformado por 100 unidades de muestreo y se desea una
muestra de tamao 20, entonces se elige al azar un nmero entre 1 y N/n = 5. Supongamos que sale
el 4, entonces las unidades que conforman la muestra seran las numeradas con 4, 9, 14, 19, 24, etc.,
hasta completar la muestra.

MUESTREO ESTRATIFICADO
Una muestra estratificada es obtenida mediante la separacin de la unidades de muestreo en grupos
llamados Estratos
Luego se seleccionan muestras aleatorias de cada estrato, mediante una muestreo aleatorio simple o
un muestreo aleatorio sistemtico.
El tamao de muestra de cada estrato se determina por el mtodo de afijacin proporcional.
Seleccin de una muestra estratificada:
i) Dividir la poblacin en k estratos.
Cada estrato consta de Ni unidades muestrales por lo tanto la poblacin tendr
N=N1+N2+..+Nk unidades muestrales
ii) Se selecciona una muestra independiente de cada estrato, utilizando cualquier esquema de
muestreo probabilstico.
El tamao de muestra de cada estrato est dado por:

Donde n es el tamao de la muestra total y n
i
el tamao de muestra de cada estrato.

CARACTERSTICAS DE LOS ESTRATOS:
Las mediciones dentro de los estratos deben ser homogneas (Baja variabilidad)
Las mediciones entre estratos deben ser heterogneas (alta variabilidad)

MUESTREO POR CONGLOMERADOS
En las encuestas por muestreo a gran escala, las unidades de muestreo suelen ser un grupo de
elementos que comnmente es denominado CONGLOMERADO de elementos. Los
conglomerados son subconjuntos muy similares entre s y al interior de cada uno hay mucha
disparidad. El muestreo de estas unidades es llamado Muestreo por Conglomerados.
|
.
|

\
|
=
N
N
n n
i
i
UNMSM FISI EAPIS - CURSO: ESTADSTICA II SEMESTRE ACADMICO 2013-2

PROFESORA: LIC. JUSTA CARIDAD HUAROTO SUMARI Pgina 5

En este caso lo que se busca es una mayor diferencia de medidas dentro del conglomerado y
menor diferencia entre conglomerados. Para obtener la muestra por este mtodo se selecciona
cierto nmero de conglomerados hasta lograr el tamao de la muestra.



MUESTREO ESTRATIFICADO MUESTREO POR CONGLOMERADO


DISTRIBUCIONES MUESTRALES

A partir de una muestra aleatoria X
1
, X
2
, ..., X
n
se pueden formar otras variables aleatorias,
algunas de las cuales juegan un rol muy importante en la inferencia estadstica. Las principales
variables aleatorias que se pueden obtener a partir de una muestra aleatoria son la media muestral,

=
=
n
i
i
X X
1
n
1
; la varianza muestral,
2
1
2
) (
1
1
X X
n
S
n
i
i

=

=
y la proporcin muestral; estas
variables son comnmente conocidas como estadsticas muestrales.
A las distribuciones de probabilidad de cada una de estas estadsticas muestrales se les llama
distribuciones muestrales. As tenemos por ejemplo, la distribucin muestral de la media
muestral X .

Ejemplo: Con el siguiente ejemplo hipottico construiremos la distribucin muestral de la media
muestral X . Consideremos la siguiente poblacin de 5 ingresos anuales, en soles, de un grupo de
trabajadores de una empresa: {20, 40, 60, 80, 100}. La media poblacional de los puntajes es
5
...
5 2 1
X X X + + +
= = 60 y la varianza poblacional es
2
5
1
2
) (
5
1
o =

= i
i
X = 800.
Si de esta poblacin se extraen muestras aleatorias de tamao 2, el nmero total de posibles muestras
es 25, las cuales se detallan a continuacin:

(20,20) (40,20) (60,20) (80,20) (100,20)
(20,40) (40,40) (60,40) (80,40) (100,40)
(20,60) (40,60) (60,60) (80,60) (100,60)
(20,80) (40,80) (60,80) (80,80) (100,80)
(20,100) (40, 100) (60,100) (80, 100) (100,100)

Todas estas muestras son igualmente probables, con probabilidad igual a 1/25.
En cada muestra se calcula la media muestral X . Estas medias son, respectivamente:

POBLACIN
ESTRATOS
MUESTRA
POBLACIN
conglomerados
MUESTRA
UNMSM FISI EAPIS - CURSO: ESTADSTICA II SEMESTRE ACADMICO 2013-2

PROFESORA: LIC. JUSTA CARIDAD HUAROTO SUMARI Pgina 6

20 30 40 50 60
30 40 50 60 70
40 50 60 70 80
50 60 70 80 90
60 70 80 90 100

Ahora, tomando en cuenta estos 25 valores de medias muestrales, construyamos la distribucin de
frecuencias relativas o, lo que es lo mismo, la distribucin de probabilidad:

x : 20 30 40 50 60 70 80 90 100
p( x ): 1/25 2/25 3/25 4/25 5/25 4/25 3/25 2/25 1/25

Esta distribucin de probabilidad constituye la distribucin muestral de la media muestral, de este
ejemplo hipottico.
Si a partir de esta distribucin de medias calculamos la esperanza y la varianza, los valores de estos
parmetros son, respectivamente,
X
= ) (x p x

= 60 y ) ( ) (
2 2
x p x
x x
o =

= 400.

La media muestral es la estadstica muestral ms importante y es utilizada con mucha
frecuencia en problemas de toma de decisiones para medias poblacionales desconocidas.

DISTRIBUCIN MUESTRAL DE LA MEDIA MUESTRAL X

CUANDO EL MUESTREO
SE HACE DESDE CUALQUIER POBLACIN

Es la distribucin de probabilidad de la media muestral obtenida a partir de todas las posibles
muestras de tamao n extradas de una poblacin.

Siendo X una funcin de variables aleatorias independientes e idnticamente distribuidas, tambin
es una variable aleatoria. El valor esperado y la varianza de X son, respectivamente, E( X ) = y
Var( X ) =
o
2
n
.
Este resultado es vlido cualquiera que sea la distribucin de probabilidad de donde se obtuvo la
muestra.
En el ejemplo arriba citado, utilizando la distribucin de la media muestral se obtiene: E( X )= 60 =
y Var( X ) = 400 =
o
2
n
, cumplindose lo afirmado.

EL TEOREMA DEL LIMITE CENTRAL

Este teorema informa acerca de la distribucin muestral de medias, de muestras de tamao n.
Recurdese que bsicamente existen tres tipos de informacin que se desea conocer sobre una
distribucin: (1) dnde est el centro, (2) qu tanto vara, y (3) cmo est repartida. El Teorema del
Lmite Central proporciona informacin sobre estos tres aspectos.

Teorema del Lmite Central

Si se toman todas las posibles muestras de tamao n , de una poblacin con media y varianza o
2
,
entonces la distribucin muestral de las medias
UNMSM FISI EAPIS - CURSO: ESTADSTICA II SEMESTRE ACADMICO 2013-2

PROFESORA: LIC. JUSTA CARIDAD HUAROTO SUMARI Pgina 7

1. tendr una media,
x
, igual a ,
2. tendr una varianza, o
x
2
, igual a
o
2
n
,
3. ser de tipo aproximadamente normal, an cuando la distribucin de donde proceden las
muestras no sea normal. La aproximacin mejora cuando aumenta el tamao de la muestra (n >30) .

Podemos resumir la importancia de este teorema del modo siguiente: cualquiera que sea la
distribucin de la poblacin de donde provienen las muestras (no necesariamente normal), la
media muestral tendr una distribucin que se comporta como una normal, siempre que el
tamao de la muestra sea grande.

Si la muestra proviene de una poblacin normal, la media muestral tendr distribucin
normal, an cuando la muestra no sea grande.
De acuerdo con este teorema, si X ~ N (,
o
2
n
) entonces la v.a. Z =
x
n

o
~ N (0,1).
Notar que, la desviacin estndar de la media muestral es igual a
n
o
, y es una medida de la
dispersin de la misma; vemos que la dispersin decrece conforme n crece.
A la desviacin estndar de la media muestral se le conoce tambin como error estndar de la
media.

APLICACIONES DEL TLC
Puesto que las medias estn distribuidas de manera aproximadamente normal, puede utilizarse la
tabla normal para el clculo de probabilidades.

Ejemplo 1
Sea una poblacin normal con = 100 yo
2
= 400. si se selecciona aleatoriamente una muestra de
tamao 16, cul es la probabilidad de que la media muestral vare entre 90 y 110? Es decir, cunto
vale P (90< X <110)?

Solucin:
Segn el TLC, X ~ N (
x
, o
x
2
). Pero
x
= y o
x
=
o
n
, entonces
X ~ N (,
o
2
n
) = N( , / ) 100 400 16 . Estandarizando: Z =
x
n

o
~ N (0,1). Luego P (90< X <110) =
P (
90 100
20 16

<
x
n

o
<
110 100
20 16

) = P (-2<Z <2) = | (2) | (-2) = 0.9544


Siendo = 100 y o
x
= 5, la probabilidad hallada indica que aproximadamente el 95% de todas esas
medias muestrales estarn dentro del intervalo determinado por 10 unidades a la izquierda y a la
derecha de la media (dentro de dos desviaciones estndares con respecto a la media).
Conforme se incrementa el tamao de la muestra, o
x
se hace ms pequeo, de manera que la
distribucin de las medias muestrales se vuelve ms esbelta. Como el rea bajo la curva es 1, a
medida que se reduce el ancho de la curva, la altura tiene que aumentar para poder mantener esa
rea.

UNMSM FISI EAPIS - CURSO: ESTADSTICA II SEMESTRE ACADMICO 2013-2

PROFESORA: LIC. JUSTA CARIDAD HUAROTO SUMARI Pgina 8

Ejemplo 2
El ministerio de trabajo informa que en promedio los obreros estatales ganan 500 soles con una
desviacin estndar de 20 soles. Si se toma una muestra aleatoria de 81 obreros, qu probabilidad
hay de que la media de los 81 salarios sea menor que 450 soles?

Solucin:
Sea la v.a. X : salarios de los obreros estatales. No se conoce la distribucin de X. Pero, como el
tamao de la muestra es grande, de acuerdo al TLC, la media muestral de los 81 salarios tendr
aproximadamente distribucin normal con una media de 500 soles y una varianza igual a (20)
2
/81 =
4.94; esto es, X ~ N(500, 4.94).
Se pide P( X < 450). Estandarizando X se tiene:
P( X <450) = P[Z< (450-500)/2.22) = P(Z<-22.5) =
) 5 . 22 ( u
= 0. Es casi imposible que la media
de los 81 salarios sea inferior a 450 soles.

Ejemplo 3
Se tiene una mquina de llenado para vaciar 500 g. de cereal en una caja de cartn. Supngase que la
cantidad de cereal que se coloca en cada caja es una variable aleatoria normalmente distribuida con
media 500 g. y desviacin estndar igual a 20 g. Para verificar que el peso medio de cada caja se
mantiene en 500 g. , se toma una muestra aleatoria de 25 de stas en forma peridica y se pesa el
contenido de cada caja. El gerente de la planta ha decidido detener el proceso y corregir la falla cada
vez que el valor promedio de la muestra sea mayor de 510 g. o menor de 490 g. Calcular la
probabilidad de detener el proceso.

Solucin:
Como cada X
i
tiene distribucin normal con media 500 y varianza 400, para i=1,2,...,25, entonces la
media muestral X tiene distribucin normal con media 500 y varianza 400/25 = 16.
P(detencin del proceso) = 1 - P(490 < X < 510) = 1 - P(-2.5<Z<2.5) = 0.0124.


DISTRIBUCIN MUESTRAL DE LA MEDIA MUESTRAL X

CUANDO EL MUESTREO
SE HACE DESDE UNA POBLACIN NORMAL CON VARIANZA CONOCIDA

Teorema 1
Sea X X X
n 1 2
, ,..., una muestra aleatoria que consiste de n variables aleatorias independientes, cada
una con distribucin normal, con media E(X
i
)= y varianza Var(X
i
) =o
2
, i=1,2,...,n. Entonces la
distribucin muestral de la media X es normal con media y varianza o
2
/n.
De acuerdo a este teorema, X ~ N (,
o
2
n
) y
x
n

o
~ N (0,1).
Ejemplo 4
Se tiene una mquina de llenado para vaciar 500 g. de cereal en una caja de cartn. Supngase que la
cantidad de cereal que se coloca en cada caja es una variable aleatoria normalmente distribuida con
media 500 g. y desviacin estndar igual a 20 g. Para verificar que el peso medio de cada caja se
mantiene en 500 g. , se toma una muestra aleatoria de 25 de stas en forma peridica y se pesa el
contenido de cada caja. El gerente de la planta ha decidido detener el proceso y corregir la falla cada
vez que el valor promedio de la muestra sea mayor de 510 g. o menor de 490 g. Calcular la
probabilidad de detener el proceso.
UNMSM FISI EAPIS - CURSO: ESTADSTICA II SEMESTRE ACADMICO 2013-2

PROFESORA: LIC. JUSTA CARIDAD HUAROTO SUMARI Pgina 9

Solucin:
Como cada X
i
tiene distribucin normal con media 500 y varianza 400, para i=1,2,...,25, entonces la
media muestral X tiene distribucin normal con media 500 y varianza 400/25 = 16.
P(detencin del proceso) = 1 - P(490 < X < 510) = 1 - P(-2.5<Z<2.5) = 0.0124.

Otra estadstica importante empleada para formular inferencias con respecto a la varianza de la
poblacin es la varianza muestral S
2
. Usaremos la distribucin chi cuadrado para determinar la
distribucin de una variable aleatoria relacionada con la varianza muestral.

DISTRIBUCIN MUESTRAL DE LA VARIANZA MUESTRAL S
2

CUANDO EL
MUESTREO SE HACE DESDE UNA POBLACIN NORMAL

Teorema 2:
Sea una poblacin donde la v. a. X tiene distribucin normal con media y varianzao
2
.
Sea
X X X
n 1 2
, ,..., una muestra aleatoria de X. Sean X y S
2

la media y la varianza muestral,
respectivamente. Entonces se tiene lo siguiente:
a) E( S
2
) = o
2
.
b) (n-1) S
2
/ o
2
tiene distribucin chi cuadrado con parmetro n-1.
c) X y S
2
son variables aleatorias independientes.

Ejemplo 5:
Una mquina embotelladora puede regularse de tal manera que llene un promedio de onzas por
botella. Se ha observado que la cantidad de contenido que suministra la mquina presenta una
distribucin normal con o = 1. De la produccin de la mquina , un cierto da, se obtiene una
muestra aleatoria de n=10 botellas llenas y se mide las onzas del contenido de cada una con el fin de
calcular b
1
y

b
2
. Podra ser til especificar un intervalo de valores que incluyera a S
2
con una alta
probabilidad. Encuentre los nmeros b
1
y

b
2
tales que
P(b
1 s
S
2

s
b
2
) = 0.90
Solucin:
Observar que P(b
1 s
S
2

s
b
2
) = P((n-1)b
1
/ o
2
s
(n-1) S
2
/ o
2

s
(n-1)b
2
/ o
2
).
Siendo la distribucin de la v.a. (n-1) S
2
/ o
2
una chi cuadrado con parmetro n-1, usamos la tabla
_
2
con n=9 para determinar los valores de los cuantiles que delimitan un rea igual a 0.90.
Leyendo la tabla resulta: 9b
1
= 3..325 y 9b
2
= 16.919, de donde se obtiene
b
1
= 0.369 y b
2
= 1.88.
Luego, el intervalo que incluye a S
2
con una probabilidad de 0.90 es (0.369, 1.88).

A partir del teorema 1 se dedujo que, cuando se muestrea una poblacin normal con varianza
conocida o
2
, la distribucin de Z =
x
n

o
es N(0,1). En la prctica, generalmente, no se conoce el
valor de la varianza poblacional. Se la debe reemplazar por la varianza muestral S
2
. Pero, aunque la
muestra provenga de una poblacin normal, la distribucin de
x
s n

no es N(0,1). Obtendremos la
distribucin muestral exacta de
x
s n

cuando se muestrea una poblacin normal con media y
varianza o
2
desconocidas, utilizando la distribucin t de Student.
UNMSM FISI EAPIS - CURSO: ESTADSTICA II SEMESTRE ACADMICO 2013-2

PROFESORA: LIC. JUSTA CARIDAD HUAROTO SUMARI Pgina 10

DISTRIBUCIN MUESTRAL DE LA MEDIA MUESTRAL X

CUANDO SE HACE EL
MUESTREO DESDE UNA POBLACIN NORMAL CON VARIANZA DESCONOCIDA



Teorema 3: Sea una muestra aleatoria X X X
n 1 2
, ,..., obtenida de una poblacin normal con media
y varianza o
2
desconocida. Sean X y S
2
la media y la varianza muestral. Entonces la variable
aleatoria
T =
x
s n


tiene una distribucin t con parmetro n-1.


DISTRIBUCIN MUESTRAL DE LA PROPORCION MUESTRAL p CUANDO EL
MUESTREO SE HACE DESDE UNA POBLACIN DE BERNOULLI

Consideremos una poblacin en donde existe una proporcin p de elementos con el atributo A.
Si de esta poblacin se toma una muestra aleatoria de n elementos, la proporcin de elementos que
tienen el atributo A en la muestra, p
, corresponde a una variable aleatoria que se llama proporcin
muestral de tamao n.

Teorema 4: Sea una muestra aleatoria X X X
n 1 2
, ,..., obtenida de una poblacin de Bernoulli con
media p y varianza ) 1 ( p p . Entonces la proporcin muestral, que tiene las mismas caractersticas
de la media muestral, cumple las propiedades siguientes:
a) E(
p
) = p
b) Var(
p
) = p(1-p) / n
c) Cuando el tamao de la muestra es suficientemente grande, la distribucin de la variable aleatoria
n p p
p p
/ ) 1 (

se aproxima a la distribucin normal estndar, debido al teorema del lmite central.


(La aproximacin mejora si 30 > n )

Todas las distribuciones muestrales que hemos visto juegan un rol muy importante en el proceso de
inferencia estadstica.