You are on page 1of 46

TEORÍA DE MUESTRAS

- CURSO 2022 -
INTRODUCCIÓN

POBLACIÓN Y MUESTRA

La población representa la colección completa de


elementos o resultados sobre la información buscada.

La muestra constituye un subconjunto de la población,


que contiene elementos o resultados que realmente se
observan

Muestra

Población
ESTADÍSTICOS Y SUS DISTRIBUCIONES (1)
Considérese seleccionar dos muestras diferentes de tamaño n de la
misma distribución de población.

Por ejemplo: en un análisis sobre eficiencia de combustible, una


primera muestra de n1 = 3 automóviles podría producir las
eficiencias, a saber x1 = 30,7; x2 = 29,4; x3 = 31,1; mientras que una
segunda muestra n2 puede dar x1 = 28,7; x2 = 30,1; x3 = 31,2.

Antes de obtener los datos, existe incertidumbre sobre el valor de


cada xi.

Debido a esta incertidumbre, antes de que los datos estén


disponibles, cada observación se considera como una variable
aleatoria y la muestra se denota por X1, X2, . . . , Xn (letras
mayúsculas para variables aleatorias).
ESTADÍSTICOS Y SUS DISTRIBUCIONES (2)

DEFINICIÓN
Un estadístico es cualquier cantidad cuyo valor puede ser calculado
a partir de datos muestrales.

Un estadístico es una variable aleatoria y será denotada por una


letra mayúscula; se utiliza una letra minúscula para representar el
valor calculado u observado del estadístico.
ESTADÍSTICOS Y SUS DISTRIBUCIONES (3)

Muestras aleatorias
La distribución de probabilidad de cualquier estadístico particular
depende no sólo de la distribución de la población (normal, uniforme,
etc.) y el tamaño de muestra n, sino además del método de muestreo.

DEFINICIÓN
Se dice que las variables aleatorias X1, X2, . . . , Xn forman una
muestra aleatoria simple de tamaño n si:
1. Las Xi son variables aleatorias independientes.
2. Cada Xi tiene la misma distribución de probabilidad.
ESTADÍSTICOS Y SUS DISTRIBUCIONES (4)

Ejemplo:
Un centro de servicio automotriz cobra $40, $45 y $50 por
determinado arreglo de autos de cuatro, seis y ocho cilindros,
respectivamente. Si 20% de sus arreglos se realizan en autos de
cuatro cilindros, 30% en autos de seis cilindros y 50% en autos de
ocho cilindros.
ESTADÍSTICOS Y SUS DISTRIBUCIONES (5)
La distribución de probabilidad de los ingresos por un arreglo
seleccionado al azar está dada por
Población

(A)

Suponga que en un día particular sólo se realizan dos trabajos de


servicio que implican arreglos. Sea X1 = ingreso por primer arreglo
y X2 = ingreso por segundo arreglo.
Suponga que X1 y X2 son independientes, cada una con la
distribución de probabilidad mostrada en (A), de modo que X1 y X2
constituyen una muestra aleatoria de la distribución (A).
ESTADÍSTICOS Y SUS DISTRIBUCIONES (6)

Prob. conjunta (supone independencia)

Fuente: DeVore (2008)


ESTADÍSTICOS Y SUS DISTRIBUCIONES (7)
Ahora para obtener la distribución de probabilidad de X  , el ingreso
promedio muestral por arreglos, se debe considerar cada valor
posible de x y calcular su probabilidad. Ej: para x = 45, ocurre

Distribuciones
de muestreo
2
de X
yS

Fuente: DeVore (2008)


ESTADÍSTICOS Y SUS DISTRIBUCIONES (8)

Histogramas de probabilidad de distribución inicial y de distribución X

DeVore (2008)
ESTADÍSTICOS Y SUS DISTRIBUCIONES (9)

Fuente: DeVore (2008)


ESTADÍSTICOS Y SUS DISTRIBUCIONES (10)
A L G U N O S E S TA D Í S T I C O S I M P O R TA N T E S
1. Si X1, X2, … ,Xn representan una muestras aleatorias de tamaño
n, entonces la media muestral está definida por el estadístico
n
xi
X=∑
i =1 n
2. El rango de una muestra aleatoria X1, X2, … ,Xn, arreglado con
orden creciente de magnitud, está definido por el estadístico
R = X(n) – X (1)
3. Si X1, X2, … ,Xn representan una muestras aleatorias de tamaño
n, entonces la varianza muestral está definida por el
estadístico 2
S =∑
2
n
(x i − X )
i =1 n −1
ESTADÍSTICOS Y SUS DISTRIBUCIONES (11)
C U E S T I O N E S D E R E PA S O

Cualquier función de las variables aleatorias que constituyen


una muestra aleatoria se denomina estadístico

Cualquier valor calculado a partir de una muestra aleatoria


se denomina estadístico

Un estadístico es una variable aleatoria que depende


únicamente de la muestra aleatoria obtenida/observada

La distribución de probabilidad de un estadístico se denomina


distribución muestral.
DISTRIBUCIÓN DE MUESTRAS
CONSIDERACIONES INICIALES
El valor del parámetro es fijo, mientras que el valor de un
estadístico está en función de la muestra seleccionada y por lo
tanto podrá variar de una muestra a otra.
Si de alguna manera, pudiéramos medir la precisión de este
proceso, es decir, si pudiéramos evaluar si el valor del estadístico
va a estar cerca del valor del parámetro correspondiente, para
cualquier muestra extraída de la población, entonces estaríamos
en condiciones de hacer “buenas inferencias”.
Sólo cuando se utiliza el azar para escoger los elementos que
conforman una muestra, podemos describir cómo varía el
estadístico.
DISTRIBUCIÓN MUESTRAL DE MEDIAS (1)
DEFINICIÓN
La distribución muestral de la media es la distribución de la
variable X
 , donde todas las muestras tienen el mismo tamaño
n tomado de la misma población.

Fuente: Triola (2018)


DISTRIBUCIÓN MUESTRAL DE MEDIAS (2)
DEFINICIÓN n
xi
Sea X1, X 2, … , Xn una muestra aleatoria con media X = ∑
n
tomada de X ∼ f(E[X], V[X]), entonces i =1

 n xi  1 n 1 n
n E[X]
E[ X ] = E ∑ n  n ∑
= E[ x i ] = E[ X ]∑ 1 = =µ
 i=1  i =1 n i =1 n

Por ser variable aleatoria independiente


 n xi  1 n 1 n
V[X] 2
V[ X ] = V ∑  = 2 ∑ V[ x i ] = 2 V[ X ]∑ 1 =
σ
=
 i =1 n  n i =1 n i =1 n n

Finalmente X ∼ f µ,(σ 2

n
)
DISTRIBUCIÓN MUESTRAL DE MEDIAS (3)

Comportamiento de las medias muestrales


1. La distribución de las medias muestrales tiende a ser una
distribución normal a medida que aumenta el tamaño de
la muestra.

2. Las medias muestrales se acercan al valor de la media


de la población (la media de las medias muestrales es la
media de la población).

3. El valor esperado de la media muestral es igual a la


media de la población.
DISTRIBUCIÓN MUESTRAL DE MEDIAS (4)
DISTRIBUCIÓN MUESTRAL DE MEDIAS (5)
TEOREMA DEL LÍMITE CENTRAL (1)
DEFINICIÓN (A)
Si X es la media de un muestra aleatoria de tamaño n tomada de una
población con media µ y varianza finita σ2 entonces la forma limite de
la distribución de:
X −µ
Z=
σ
n
cuando n → ∞, es la distribución estandarizada N(0, 1) ó n(z, 0, 1).

DEFINICIÓN (B)
Para todas las muestras del mismo tamaño n, con n > 30, la
distribución muestral de x puede aproximarse mediante una
distribución normal con media µ y desviación estándar ⁄ 
TEOREMA DEL LÍMITE CENTRAL (2)
INTERPRETACIÓN
 Cuando se suma un número grande de variables aleatorias, la
variable resultante es una variable con distribución
aproximadamente igual a la distribución normal.
 Se utiliza el término número grande (porque matemáticamente el
teorema se establece cuando n tiende a infinito), sin embargo, en
la práctica, con tener que n sea un número mayor o igual a 30,
la aproximación ya proporciona buenos resultados.
 El teorema es cierto independientemente de la distribución que
sigan las variables que se sumen (no importa si son
exponenciales, binomiales, geométricas, etc.); lo único que se
necesita es saber su media y su varianza.
TEOREMA DEL LÍMITE CENTRAL (3)

Teorema del límite central ilustrado - Fuente: DeVore (2008)


TEOREMA DEL LÍMITE CENTRAL (4)

Teorema del
límite central
ilustrado -
(Navidi, 2006)
TEOREMA DEL LÍMITE CENTRAL (5)

RESUMEN
 La aproximación normal para X
 generalmente será buena si
n ≥ 30 sin importar la forma de la población.

 Si n < 30, la aproximación es buena sólo si la población no


difiere mucho de una distribución normal.

 Si se sabe que la población es normal, la distribución


 seguirá exactamente una distribución normal,
muestral de X
sin importar que pequeño sea el tamaño de las muestras.
TEOREMA DEL LÍMITE CENTRAL (6)
Ejemplo 1: se sabe que la vida media de las lámparas
producidas por una fabrica A (considerada normal) es de
1000 hs. con una desviación estándar de 160 hs. Sea X la
media de una muestra aleatoria de tamaño 25. Encontrar
que distribución tiene X . Estandarice.
(160)2
E[ X ] = 1000 V [ X ] = = 1024 X ∼ N (1000, 1024 )
25
Al estandarizar a partir del teorema del límite central
X −µ X − 1000
Z= = → Z ∼ N (0,1)
σ 160
n 25
TEOREMA DEL LÍMITE CENTRAL (7)
Ejercicio 1: En cierta universidad, la media de la edad de los estudiantes
es 22,3 años y la desviación estándar es de 4 años. Se toma una muestra
aleatoria de 64 estudiantes. ¿Cuál es la probabilidad de que la edad
promedio de estos estudiantes sea mayor a 23 años?
DISTRIBUCIÓN MUESTRAL DE VARIANZAS (1)
DEFINICIÓN
La distribución muestral de la varianza muestral es la distribución
de las varianzas muestrales (variable  ), donde todas las muestras
tienen el mismo tamaño n, tomado de la misma población.

Triola (2018)
DISTRIBUCIÓN MUESTRAL DE VARIANZAS (2)

Comportamiento de las varianzas muestrales

1. La distribución de las varianzas muestrales tiende a ser


una distribución sesgada a la derecha.

1. Las varianzas muestrales se dirigen al valor de la


varianza poblacional (la media de las varianzas
muestrales es la varianza poblacional; de otro modo, el
valor esperado de la varianza muestral es igual a la
varianza poblacional).
DISTRIBUCIÓN MUESTRAL DE VARIANZAS (3)
DISTRIBUCIÓN CHI-CUADRADO (1)
DEFINICIÓN
Si S2 es la varianza de una muestra aleatoria de tamaño n, tomada
de una población normal que tiene varianza σ2, entonces
−1 
χ =
σ
es una variable aleatoria que tiene la distribución chi-cuadrado con
parámetro ѵ = n – 1 grados de libertad.
Distribución χ con ѵ grados de
libertad
DISTRIBUCIÓN MUESTRAL DE VARIANZAS (4)
DISTRIBUCIÓN CHI-CUADRADO (2)
EJEMPLO: Sean X1, X 2, … , X18 variables aleatorias
normales e independientemente distribuidas con media 25 y
varianza σ2. Encontrar P(S/σ ≥ 1,1)

 (n − 1) S2 2
P(S/σ ≥ 1,1) = P  2
≥ 17 (1,1)  = P (U ≥ 20 ,57 )
 σ 
= 1 − P(U < 20,57 ) = 1− 0,75 = 0,25
2
… 2 f(x)
ν χ 0 , 005 χ 0 , 75
1
… 1-α X
17 5,70 … 20,49
α
20,57
DISTRIBUCIÓN MUESTRAL DE VARIANZAS (5)
DISTRIBUCIÓN CHI-CUADRADO (3)
Tabla de distribución acumulada
DISTRIBUCIÓN MUESTRAL DE MEDIAS – cont. (5)
DISTRIBUCIÓN " t " DE STUDENT (1)
Muestras pequeñas
¿Qué se puede hacer si  es la media de una muestra pequeña? Si éste es
pequeño, s podría no estar cercano a , y  puede no ser aproximadamente
normal. Si no se sabe nada acerca de la población de la que la muestra
pequeña fue extraída, entonces no hay ningún método fácil para calcular
probabilidades. Sin embargo, si la población es aproximadamente normal, 
lo será incluso cuando el tamaño muestral sea pequeño.

Para muestras pequeñas en la cantidad ( – )/(⁄ ), s no estará


necesariamente cercana a , y por lo tanto dicha cantidad no tendrá
una distribución normal. En su lugar, tiene la distribución t de
Student con n – 1 grados de libertad, que se denota por  . El
número de grados de libertad para la distribución t es uno menos
que el tamaño muestral.
DISTRIBUCIÓN MUESTRAL DE MEDIAS – cont. (6)
DISTRIBUCIÓN " t " DE STUDENT (2)

La curva t con un grado de libertad tiene mucho más área en las colas. Para
tamaños muestrales más grandes, el valor de s es menos probable que esté lejos de
 y la curva t es más cercana a la curva normal. Con diez grados de libertad
(corresponde n = 11), la diferencia entre la curva t y la curva normal no es grande.
Una curva t con 30 grados de la libertad es casi indistinguible de la curva normal.
DISTRIBUCIÓN MUESTRAL DE MEDIAS – cont. (7)
DISTRIBUCIÓN " t " DE STUDENT (3)
2 ∴ X −µ
σ → ŝ2
Z=
S n
∼ N(0, 1)
Si n < 30,
30,
X −µ N(0,1)
T= ∼ t α, (n - 1) T= ∼ t α, ( ν )
S n χ 2
(ν) ν

X −µ
σ n X −µ
T= 2
= ∼ t α, ( n -1)
(n − 1) S S n
σ 2 (n − 1)
DISTRIBUCIÓN MUESTRAL DE MEDIAS – cont. (8)
DISTRIBUCIÓN " t " DE STUDENT (4)
Gráficas de la función
de densidad de
probabilidad de la
curva t de Student
para diferentes grados
de libertad.
La curva normal con
media 0 y varianza 1
(curva z) es graficada
para comparar.
Las curvas t están
más extendidas que la
normal, pero la
cantidad de extensión
adicional disminuye
conforme se aumenta
el número de grados
de libertad.
Fuente: Navidi (2006)
DISTRIBUCIÓN MUESTRAL DE MEDIAS – cont. (9)
DISTRIBUCIÓN " t " DE STUDENT (5)
Ejercicio 2:
Se extrae una muestra aleatoria de tamaño 10 de una distribución normal
con media 4. La estadística t de Student t = ( – 4)/(⁄ 10) es calculada.
¿Cuál es la probabilidad de que t > 1.833?
DISTRIBUCIÓN MUESTRAL DE MEDIAS – cont. (10)
DISTRIBUCIÓN " t " DE STUDENT (6)
Ejercicio 3: De una población con distribución normal con S2 = 4
y µ = 17 se toma una muestra de tamaño 25.
Encontrar

 X − µ 16,22 − 17  16,22
1. P (X ≥ 16,22) = P  ≥ 
S n 25 
= P (t ≥ −1,95) = P (t ≤ 1,95) = 0,975

ν t0,55 … t0,95 t0,975 Áreas


iguales
1

24 0,127 … 1,71 2,06
1,95
Busco el valor más próximo a 1,95 en la tabla
DISTRIBUCIÓN MUESTRAL DE MEDIAS – cont. (11)
DISTRIBUCIÓN " t " DE STUDENT (7)
Tabla de distribución acumulada
DISTRIBUCIÓN MUESTRAL DE MEDIAS – cont. (12)
DISTRIBUCIÓN " t " DE STUDENT (8)
 C − 17 
2. P (X ≥ C ) = 0,95 → Pt ≥  = 0,95
 25 
 C − 17 
Pt ≤  = 0,05
 25 

C − 17 = −1,711
C
2/5
Busco en tabla una probabilidad
acumulada de 0,95, y por
simetría tomo el valor de t pero
con signo negativo

0,05 0,05
C = 16,3 C C*
DISTRIBUCIÓN MUESTRAL DE MEDIAS – cont. (13)
DISTRIBUCIÓN " t " DE STUDENT (9)
Tabla de distribución acumulada
DISTRIBUCIÓN MUESTRAL DE VARIANZAS –
DOS POBLACIONES (1)
DISTRIBUCIÓN “F” DE FISHER (1)
La distribución F se define como la razón de dos
variables aleatorias Chi – Cuadrado independientes,
dividas entre sus grado de libertad
U1 ν1
F= ∼ Fα, (ν1 ,ν 2 )
U2 ν2

donde U1 y U2 son variables aleatorias independientes


χ 2
que tienen una distribución α con υ1 y υ2 grados de
libertad respectivamente.
DISTRIBUCIÓN MUESTRAL DE VARIANZAS –
DOS POBLACIONES (2)
DISTRIBUCIÓN “F” DE FISHER (2)
PROPIEDADES
1. Si α = P (F < F1 ) entonces a F1 lo denotamos como
F1 = Fα, (ν1 ,ν 2 )

2. Si α no figura en la tabla, la distribución de F


también cumple que f(x)
1
Fα,( ν1 ,ν 2 ) =
F1−α,( ν 2 ,ν1 ) X
α

DISTRIBUCIÓN MUESTRAL DE VARIANZAS –
DOS POBLACIONES (3)
DISTRIBUCIÓN “F” DE FISHER (3)
Tabla de distribución acumulada
DISTRIBUCIÓN MUESTRAL DE VARIANZAS –
DOS POBLACIONES (4)
DISTRIBUCIÓN “F” DE FISHER (4)
Ejercicio 4:
1. Si Fα (10, 30) encontrar P (F < 2,51) = 0,975
n m 1 … 10
0,90 2,88 1,82
0,95 4,17 2,16
0,975 30 5,57 2,51
0,99 7,56 2,98
0,995 9,18 3,34

2. Si Fα (8, 7) encontrar P (F > 3,73)


P (F > 3,73) = 1 - P (F < 3,73) = 1 - 0,95 = 0,05
DISTRIBUCIÓN MUESTRAL DE VARIANZAS –
DOS POBLACIONES (5)
DISTRIBUCIÓN “F” DE FISHER (5)
3. Si Fα (7, 10) encontrar P (F > C) = 0,95
P (F > C ) = 0,95 f(x)
P (F < C ) = 0,05
1 1 0,95 X
C = F0,05; (7,10) = = = 0,275
0,05
C
F0,95; (10, 7 ) 3,64
DISTRIBUCIÓN MUESTRAL DE VARIANZAS –
DOS POBLACIONES (5)
DISTRIBUCIÓN “F” DE FISHER (5)
4. Si Fα (5, 12) encontrar P (C1 < F < C2) = 0,95
C 2 = F0,975; (5,12) = 3,89 0,025
1 1
C1 = F0,025; (5,12) = = 0,95
F0,975,(12, 5) 6,52 X
= 0,153 C1 C2

You might also like