You are on page 1of 61

Estadstica I I

Monica Gerber
Facultad de Sociologa - Universidad Alberto
Hurtado
Estadstica inferencial 1 de Abril, 2013
a. Resumen clase anterior
b. Curva normal y puntajes estandarizados
c. Distribuciones muestrales
d. Teorema Central del Lmite
e. Clculo del tamao de la muestra

Mdulo 1. Estadstica I nferencial
Resumen clase anterior
Distincin entre descripcin e inferencia

Estadstica inferencial: obtener
conclusiones sobre las caractersticas de una
poblacin en base a observaciones hechas
de una muestra

Desde muestras probabilsticas resulta
pertinente inferir a la poblacin

Lo fundamental de la inferencia es que si
bien no podemos evitar un error en la
estimacin, podemos conocer el error y
buscar formas de reducirlo



Poblacin
Muestra
Muestreo
I nferencia
Estadstica
Resumen clase anterior
Poblacin
Es un conjunto de elementos del que se pretende obtener informacin.
Su tamao se define con la letra N.
Los estadsticos de la poblacin son llamados parmetros.
Media:
Desviacin estndar:

Muestra
Una muestra hace referencia a una parte de la poblacin.
Su tamao se define con la letra n.
Los datos obtenidos en la muestra se denominan estadsticos.
Media: x
Desviacin estndar: s




Resumen clase anterior
El diseo de muestras tiene como objetivo obtener mtodos de seleccin y
estimacin para sustituir la informacin que suministra una poblacin por la
que suministra una muestra

Muestras:
Probabilsticas: cuando todo sujeto perteneciente a la poblacin tiene una
probabilidad conocida y distinta de 0 1 de ser elegidos

No probabilstica: cuando no se conoce la probabilidad de seleccin de los
componentes

En el muestreo probabilstico se puede conocer el error en la estimacin (y
por lo tanto se puede inferir a la poblacin). No es posible calcular el error e
inferir en el caso de muestras no probabilsticas




Resumen clase anterior
Tipos de muestreo

- Muestreo Aleatorio Simple (MAS): La seleccin de los elementos se lleva
a cabo de forma aleatoria desde un listado de los elementos

- Muestreo Sistemtico: Similar al muestreo aleatorio simple pero la
seleccin se hace por intervalos

- Muestreo estratificado: Se seleccionan elementos dentro de estratos
homogneos (por ejemplo, personas de clase baja y alta)

- Muestreo por conglomerados: divisin de la poblacin en grupos que son
parecidos entre ellos y con alta variacin interna. Se seleccionan
conglomerados o elementos dentro de conglomerados (ejemplo, muestreo
por reas)



Error de muestreo
Los estadsticos que se calculan desde las muestras permiten estimar el
parmetro poblacional

Sin embargo, los estadsticos de algunas muestras estarn ms cerca del
valor real del parmetro poblacional

La teora de la probabilidad nos otorga herramientas para
Determinar la probabilidad de obtener distintos estadsticos (y que tan
seguido un estadstico har una prediccin equivocada)
La confianza con la que podemos hacer una estimacin sobre la
poblacin






a. Resumen clase anterior
b. Curva normal y puntajes estandarizados
c. Distribuciones muestrales
d. Teorema Central del Lmite

Mdulo 1. Estadstica I nferencial
Distribuciones de frecuencias
Distribucin de frecuencias: histograma de frecuencias de una variable
desde sus valores ms bajos (izquierda) hasta sus valores ms altos
(derecha).
Distribucin puede ser poblacional (distribucin de las frecuencias en la
poblacin) o muestral (distribucin de las frecuencias en la muestra)









Distribuciones de frecuencias
Curva de distribucin de frecuencias: similar a un histograma de
frecuencias pero utilizando una curva suavizada que estima la distribucin
de las puntuaciones en la poblacin. El rea bajo la curva representa el
100% de los casos en la poblacin








Distribucin Normal
Curva de distribucin de frecuencias con forma de campana
Mayor probabilidad de ocurrencia de los valores cercanos a la media,
mientras que las probabilidades van decreciendo hacia los extremos
Media, la mediana y la moda de una variable son iguales entre s
Fenmenos sociales frecuentemente se distribuyen normalmente: altura,
puntajes en una prueba








Distribucin Normal
Se define en base a dos
nmeros: la media () y
la desviacin estndar
()

Media: define la posicin
de la curva

Desviacin estndar:
define nivel de
dispersin alrededor de
la media



Distribucin normal estndar
Ms utilizada es la distribucin normal estndar, donde:
Media () = 0
Desviacin estndar () = 1





-1 -2 -3 1 2 3
Puntuaciones de desviacin
La puntuaciones de desviacin indican cunto se alejan las puntuaciones de
los individuos respecto a la media
Las puntuaciones de desviacin otorgan informacin acerca de:
a. La magnitud de distancia entre una puntuacin y la media
b. La direccin de la desviacin (positiva si el puntaje est por arriba de
la media y negativa si el puntaje est por debajo de la media)


Puntuacin de desviacin: X X



Donde:
X = Una puntuacin individual
X

=
X
n
= Media de x
n = Tamao de la muestra


Desviacin Estndar
La desviacin estndar es una medida de dispersin que describe como las
puntuaciones de una variable se dispersan a lo largo de su distribucin
En trminos simples corresponde a un promedio del cuadrado de las
puntuaciones de desviacin de los individuos en la muestra
La suma de cuadrados se divide por el tamao de la muestra (n) menos 1




Donde:
s
x
= desviacin estndar para la variable x de intervalo/ razn
X = Puntuacin individual
X

=
X
n
= Media de x
n = Tamao de la muestra

s
x
=
(X X

)
2
n 1

Desviacin Estndar
Ejemplo: Clculo de la desviacin estndar de las notas de un curso de
tamao n=10 y media X

=5.0
Alumno/ a Nota (X) X X

(X X

)
2
1 4.0 -1.0 1.00
2 3.5 -1.5 2.25
3 5.5 +0.5 0.25
4 6.6 +1.6 2.56
5 3.1 -1.9 3.61
6 7.0 +2.0 4.00
7 3.5 -1.5 2.25
8 5.8 +0.8 0.64
9 6.2 +1.2 1.44
10 4.8 -0.2 0.04
n=10 X =50 X X

=0 X X

2
=18.04
Desviacin Estndar




Utilizando la frmula:

n = 10
X

=5.0
(X X

)
2
= 18.04


s
x
=
(X-X

)
2
n-1
=
18.04
10-1
= 2.00 = 1.41

I nterpretacin: La desviacin estndar de las notas del curso es de 1.41
Ejemplo: Clculo de la desviacin estndar de las notas de un curso de
tamao n=10 y media X

=5.0
Puntuaciones estandarizadas (puntuaciones
Z)
Las puntuaciones de desviacin proporcionan una medida para comparar a
un individuo con respecto al promedio de la muestra

Dado que distintas muestras varan en su nivel de dispersin interna, las
puntuaciones de desviacin no sirven para comparar variables con unidades
de medida diferentes

Dividiendo las puntuaciones de desviacin por la desviacin estndar
obtenemos una medida estandarizada de cuanto un individuo se aleja de la
media







Puntuaciones estandarizadas (puntuaciones
Z)
Puntuaciones estandarizadas Z: Distancia estandarizada de un valor X
hacia la media. Distancia de un valor X dividida por por desviacin estndar
de esa distancia
La puntuacin Z indica la direccin de la puntuacin ( - +) y la distancia
hacia la media
Proporciona una medida para comparar variables y muestras en una unidad
comn




Donde:
s
x
= desviacin estndar para la variable x de intervalo/ razn
X = una puntuacin individual
X

=
X
n
= Media de x


Z =
X X

s
x

Puntuaciones estandarizadas (puntuaciones
Z)
La distribucin de puntuaciones Z tiene una media de cero y una desviacin
estndar de 1.

Ventajas:
Miden una escala de intervalos, en trminos de unidades de desviacin
estndar.
Permite comparar calificaciones de varias pruebas en forma directa,
incluso cuando se tienen medias y desviaciones estndar diferentes




Puntuaciones estandarizadas (puntuaciones
Z)
Puntuacin de desviacin
X X

= 6.5 5.0 = 1.5



Puntuacin estandarizada
Z =
X-X

s
x
=
6.5-5.0
1.41
= 1.06
Ejemplo: Clculo de la puntuacin de desviacin y puntuacin estandarizada
para un/ a estudiante que obtuvo una nota X=6.5 en un curso con promedio
X

= 5.0 y desviacin estndar s=1.41


I nterpretacin: El/ la estudiante obtuvo una nota 1.5 puntos por encima de la
media, correspondientes a 1.06 desviaciones estndar por sobre la media
Puntuaciones estandarizadas (puntuaciones
Z)
Ejemplo: Quin obtuvo una nota relativamente mejor? El Estudiante A que
obtuvo un X=6.0 en una prueba con X

=5.0 y s=1.5 o el Estudiante B que


obtuvo un X=5.5 en una prueba con X

=4.5 y s=1.0?
I nterpretacin: La nota del Estudiante A se encuentra a 0.67 unidades de
desviacin estndar por sobre la media de la prueba, mientras que la nota del
Estudiante B se encuentra a 1 desviacin estndar por sobre la media. Es
decir, el estudiante B obtuvo una nota que se encuentra ms lejana del
promedio que el estudiante A.
Conociendo la puntuacin Z de un valor, podemos comparas puntuaciones
en distintas escalas






Z
A
=
6.0-5.0
1.5
= 0.67
Z
B
=
5.5-4.5
1.0
= 1
Curva normal y puntuaciones estandarizadas
Para variables que se distribuyen normalmente es posible calcular
puntuaciones estandarizadas y determinar la proporcin de casos que se
encuentran entre dos puntuaciones

Otra interpretacin es que podemos calcular la probabilidad de seleccionar
un caso que se encuentre entre dos puntuaciones estandarizadas

Particin de rea: calcular la proporcin de casos que se encuentran entre
dos puntuaciones






Curva normal y puntuaciones estandarizadas
Sabemos, por ejemplo que:
El 68% de los casos se encuentran entre -1 y +1 desviaciones estndar
de la media
El 95.5% de los casos se encuentran entre -2 y +2 desviaciones
estndar de la media
El 99.7% de los casos se encuentran entre -3 y +3 desviaciones
estndar de la media







-1 -2 -3 1 2 3
99,7 %
95,5 %
68 %

Curva normal y puntuaciones estandarizadas
El clculo de reas bajo la curva normal considera tres elementos:

Puntaciones X: corresponden a las puntuaciones brutas, por ejemplo,
una nota de 6.0 en una escala de 1 a 7

Puntuaciones Z: corresponden a las puntuaciones estandarizadas y
representadas en unidades de desviacin estndar. En el ejemplo
anterior una nota 6.0 corresponda a 0.67 unidades estndar por sobre la
media (es decir, a Z=0.67)

p (proporciones): corresponden a las proporciones de rea bajo la
curva normal. Por ejemplo, podemos calcular la proporcin de individuos
que obtuvieron una nota bajo 6.0 o bajo 0.67 desviaciones estndar
sobre la media.




Curva normal y puntuaciones estandarizadas
Con ayuda de una tabla de distribucin normal y de la frmula de Z
podemos calcular estos distintos elementos

Conociendo uno de estos elementos es posible calcular los otros dos:
Conociendo X es posible obtener Z y p
Conociento p es posible obtener X y Z
Conociendo Z es posible obtener X y p









Tablas de distribucin normal
Permiten derivar probabilidades para distintas puntuaciones estandarizadas

Ojo: Algunas tablas presentan proporciones bajo una puntuacin Z
determinada, mientras que otras tablas presentan proporciones entre Z=0 y
una puntuacin Z determinada

Dado que la curva normal es simtrica, los valores positivos y negativos de
Z son los mismos








z 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
0.0 0.000 0.004 0.008 0.012 0.016 0.020 0.024 0.028 0.032 0.036
0.1 0.040 0.044 0.048 0.052 0.056 0.060 0.064 0.068 0.071 0.075
0.2 0.079 0.083 0.087 0.091 0.095 0.099 0.103 0.106 0.110 0.114
0.3 0.118 0.122 0.126 0.129 0.133 0.137 0.141 0.144 0.148 0.152
0.4 0.155 0.159 0.163 0.166 0.170 0.174 0.177 0.181 0.184 0.188
0.5 0.192 0.195 0.199 0.202 0.205 0.209 0.212 0.216 0.219 0.222
0.6 0.226 0.229 0.232 0.236 0.239 0.242 0.245 0.249 0.252 0.255
0.7 0.258 0.261 0.264 0.267 0.270 0.273 0.276 0.279 0.282 0.285
0.8 0.288 0.291 0.294 0.297 0.300 0.302 0.305 0.308 0.311 0.313
0.9 0.316 0.319 0.321 0.324 0.326 0.329 0.332 0.334 0.337 0.339
1.0 0.341 0.344 0.346 0.349 0.351 0.353 0.355 0.358 0.360 0.362
1.1 0.364 0.367 0.369 0.371 0.373 0.375 0.377 0.379 0.381 0.383
1.2 0.385 0.387 0.389 0.391 0.393 0.394 0.396 0.398 0.400 0.402
1.3 0.403 0.405 0.407 0.408 0.410 0.412 0.413 0.415 0.416 0.418
1.4 0.419 0.421 0.422 0.424 0.425 0.427 0.428 0.429 0.431 0.432
1.5 0.433 0.435 0.436 0.437 0.438 0.439 0.441 0.442 0.443 0.444

reas bajo la distribucin normal estndar de probabilidad
entre la media y un valor z determinado
Tablas de distribucin normal
z=1.00,
p=0.341
z=1.44, p=0.425
En las tablas de distribucin normal la primera columna presenta las
unidades y dcimas de las puntuaciones Z mientras que las dems columnas
especifican las centsimas








Divisin de reas bajo la curva normal
Pasos (basado en Ritchey, 2008):

1. Revisa los requisitos: variable es de nivel de medicin intervalar/ razn y las
puntuaciones se distribuyen normalmente
2. Calcula la media y desviacin estndar de X (a menos que estn dadas)
3. Dibuja la curva normal y marca el rea buscada segn especificado en el
ejercicio
4. Calcula las puntuaciones Z correspondientes
5. Consulta la tabla de curva normal para obtener la proporcin p que
corresponde al Z calculado





Ejemplo 1: Estimacin de la proporcin de casos
mayores a una puntuacin X
Ejemplo: Qu porcentaje de estudiantes obtuvo una nota mayor a X=6.2 en una prueba
con X

=5.5 y s=0.5?
Pasos: Transforma la puntuacin bruta de 6.2 en puntajes Z (en este caso, Z=1.4). Busca
en la tabla la proporcin asociada a Z=1.4 (p=0.419). Este valor corresponde a la
proporcin que se ubica entre Z=0 y Z=1.4. Para obtener la proporcin sobre Z=1.4 es
necesario restar esta proporcin de 0.50 (el rea total sobre la media). En este caso:
0.50-0.419= 0.081. Para obtener la probabilidad, se debe multiplicar por 100.
I nterpretacin: Podemos concluir que 8.1% de los/ las estudiantes obtuvo una nota
superior a 6.2.
8.1%
Z
6.2
=
X-X

s
x
=
6.2-5.5
0.5
=1.4
Ejemplo 2: Estimacin de la proporcin de casos
menores a una puntuacin X
Ejemplo: Qu porcentaje de estudiantes obtuvo una nota inferior a X=5.2 en una
prueba con X

= 5.5 y s=0.5?
Pasos: Transforma la puntuacin bruta de 5.2 en puntaje Z (en este caso, Z=-0.6). Busca
en la tabla la proporcin asociada a Z=0.6 (p=0.226). Este valor corresponde a la
proporcin que se ubica entre Z=0 y Z=0.6 (o, lo que es lo mismo, entre Z=0 y Z=-0.6).
Para obtener la proporcin bajo Z=-0.6 es necesario restar esta proporcin de 0.50 (el
rea total bajo la media). En este caso: 0.50-0.226= 0.274.
I nterpretacin: Podemos concluir que 27.4% de los/ las estudiantes obtuvo una nota
inferior a 5.2.
27.4%
Z
5.2
=
X-X

s
x
=
5.2-5.5
0.5
=-0.6
Ejemplo 3: Estimacin de la proporcin de casos
entre la media y alguna puntuacin X
Ejemplo: Qu porcentaje de estudiantes obtuvo una nota entre X=4.5 y X=5.5 en una
prueba con X

= 5.5 y s=0.5?
Pasos: Transforma la puntuacin bruta de 4.5 en puntajes Z (en este caso, Z=-2). Busca
en la tabla la proporcin asociada a Z=2 (p=0.477). Este valor corresponde a la
proporcin entre Z=0 y Z=2 (o, lo que es lo mismo, entre Z=0 y Z=-2).
I nterpretacin: Podemos concluir que 47.8% de los/ las estudiantes obtuvo una nota
entre 4.5 y 5.5.
47.8%
Z
4.5
=
X-X

s
x
=
4.5-5.5
0.5
=-2
Ejemplo 4: Estimacin de la proporcin de casos entre la
una puntuacin X bajo y una puntuacin X sobre la media
Ejemplo: Qu porcentaje de estudiantes obtuvo una nota X=4.8 y X=5.7 en una prueba
con X

= 5.5 y s=0.5?
Pasos: Transforma ambas puntuaciones brutas a puntajes Z (en este caso, Z
4.8
=-1.4 y
Z
5.7
=0.4). Busca en la tabla la proporcin asociada a Z=1.4 (p=0.419) y la proporcin
asociada a Z=0.4 (p=0.155). Suma ambas proporciones para obtener la proporcin total.
Obtenemos: 0.419+0.155=0.574.
I nterpretacin: Podemos concluir que 57.4% de los/ las estudiantes obtuvo una nota
entre entre 4.8 y 5.7.
57.4%
Z
4.8
=
X-X

s
x
=
4.8-5.5
0.5
=-1.4
Z
5.7
=
X-X

s
x
=
5.7-5.5
0.5
=0.4
Ejemplo 5: Estimacin de la proporcin de casos
entre dos puntuaciones X a un lado de la media
Ejemplo: Qu porcentaje de estudiantes obtuvo una nota entre X=6.0 y X=7.0 en una
prueba con X

= 5.5 y s=0.5?
Pasos: Transforma ambas puntuaciones brutas a puntajes Z (en este caso, Z
6.0
=1.0 y
Z
7.0
=3.0). Busca en la tabla la proporcin asociada a Z=1 (p=0.341) y la proporcin
asociada a Z=3 (p=0.499). Resta la proporcin asociada a Z=1 de la proporcin asociada
a Z=3 para obtener la proporcin entre Z=1 y Z=3. Obtenemos: 0.499-0.341=0.158
I nterpretacin: Podemos concluir que 15.8% de los/ las estudiantes obtuvo una nota
entre 6.0 y 7.0.
15.8%
Z
6.0
=
X-X

s
x
=
6.0-5.5
0.5
=1
Z
7.0
=
X-X

s
x
=
7.0-5.5
0.5
=3
Ejemplo 6: Estimacin de la puntuacin X
correspondiente a una proporcin determinada
Ejemplo: Qu nota divide al 20% superior del 80% inferior en una distribucin de X

=
5.5 y s=0.5?
Pasos: En este caso el procedimiento es un poco distinto. Primero, debemos buscar en la
tabla el Z que divide al 20% superior del 80% inferior. Esto es, el Z que corresponde a
una probabilidad de 0.30 (Z=0.84). Reemplazando en la frmula obtenemos un X=5.92.
I nterpretacin: Podemos concluir que 20% de los/ las estudiantes obtuvo una nota
superior a 5.92.
X=X

+sx Z
X =5.5 +(0.5 0.84)
X =5.92
Z =
X X

s
x


I nvirtiendo la frmula..
20%
Actividad 1
Trabaja en grupos de a 2

En una muestra de 1000 recin nacidos, el promedio de peso fue de X

= 3.6
kilos, con una desviacin estndar de s=400 gramos

Calcula lo siguiente:
1. Qu porcentaje de recin nacidos pes ms de 4 kilos?
2. Qu porcentaje de recin nacidos pes menos de 2.5 kilos?
3. Qu porcentaje de recin nacidos pes entre 2.5 y 3 kilos?
4. Qu peso en kilos corresponde al percentil 90?







a. Resumen clase anterior
b. Curva normal y puntajes estandarizados
c. Distribuciones muestrales
d. Teorema Central del Lmite
e. Clculo del tamao de la muestra

Mdulo 1. Estadstica I nferencial
I nferencia estadstica
Los estadsticos de una muestra nica son solamente estimaciones del
parmetro

Los resultados pueden ser distintos de una muestra a la otra y solamente
podemos estimar el valor de una variable en la poblacin

Error de muestreo: sin importar qu tan bien hayamos diseado el
muestreo, siempre podemos esperar por simple casualidad que haya una
diferencia entre una muestra y la poblacin

Sin embargo, el error de muestreo es sistemtico y predecible

Para calcular el error, debemos primero considerar el concepto de
distribucin muestral




Distribucin muestral
Muestreo repetido: tomar distintas muestras y calcular estadsticos para
cada una
Cada media muestral se distancia en cierto grado de la media poblacional



x=3 x=5 x=10
x=9 x=1 x=7
x=2 x=3 x=6
x=5
x
=4.5 x=1
x=4 x=5 x=9
x=8 x=10 x=2
x=3 x=6
x=5 x=4
x=5
x=7 x=3
x=4.0
x=2 x=4
x=1
x=6
x=7 x=4
x=5.1
x=2 x=5
x=3
x=5
x=6 x=7
x=4.6
x=8 x=4
x=2
Distribucin muestral
Distribucin muestral: "A partir del muestreo repetido, una distribucin
muestral es una descripcin matemtica de todos los resultados posibles del
muestreo y la probabilidad de cada uno " (Ritchey, 2008, p. 209)

Se obtienen (tericamente) las medias (u otro estadstico) de todas las
muestras posibles de tamao n

La distribucin muestral es la distribucin de estas medias








Distribucin muestral
Ejemplo

Cuntas horas trabajan las personas a la semana?
Distribucin poblacional
(datos ficticios)
=38.74
=15.719
Nmero de horas trabajadas a la semana
F
r
e
c
u
e
n
c
i
a

Distribucin muestral
Obtenemos una muestra de n=100 y calculamos el promedio..

Muestra 1: x
1
=40.95, s
1
=17.62


Obtenemos otra muestra de n=100 y calculamos el promedio...

Muestra 2: x
2
=36.79 , s
3
=15.34


Obtenemos otra muestra de n=100 y calculamos el promedio...

Muestra 3: x
3
=34.2, s
3
=16.42


Distribucin poblacional
(datos ficticios)
=38.74
=15.719
Distribucin Muestral 1
X

1
=40.95
s
1
=17.62
n =100
Distribucin Muestral 2
X

2
=36.79
s
2
=15.34
n =100
Nmero de horas trabajadas a la semana
Nmero de horas trabajadas a la semana
Nmero de horas trabajadas a la semana
F
r
e
c
u
e
n
c
i
a

F
r
e
c
u
e
n
c
i
a

F
r
e
c
u
e
n
c
i
a

Distribucin poblacional
(datos ficticios)
=38.74
=15.719
Nmero de horas trabajadas a la semana
F
r
e
c
u
e
n
c
i
a

Distribucin muestral de medias
2 muestras
X

1
=40.95
X

2
=36.79
F
r
e
c
u
e
n
c
i
a

Promedio de horas trabajadas a la semana
Distribucin poblacional
(datos ficticios)
=38.74
=15.719
Nmero de horas trabajadas a la semana
F
r
e
c
u
e
n
c
i
a

Distribucin muestral de medias
10 muestras
X

1
=40.95
X

2
=36.79
.
.
X

10
=41.43
F
r
e
c
u
e
n
c
i
a

Promedio de horas trabajadas a la semana
Distribucin poblacional
(datos ficticios)
=38.74
=15.719
Nmero de horas trabajadas a la semana
F
r
e
c
u
e
n
c
i
a

Distribucin muestral de medias
50 muestras
X

1
=40.95
X

2
=36.79
.
.
X

50
=38.34

F
r
e
c
u
e
n
c
i
a

Promedio de horas trabajadas a la semana
Distribucin poblacional
(datos ficticios)
=38.74
=15.719
Nmero de horas trabajadas a la semana
F
r
e
c
u
e
n
c
i
a

Distribucin muestral de medias
100 muestras
X

1
=40.95
X

2
=36.79
.
.
X

100
=35.77
F
r
e
c
u
e
n
c
i
a

Promedio de horas trabajadas a la semana
Distribucin poblacional
(datos ficticios)
=38.74
=15.719
Nmero de horas trabajadas a la semana
F
r
e
c
u
e
n
c
i
a

Distribucin muestral de medias
200 muestras
X

1
=40.95
X

2
=36.79
.
.
X

200
=38.22
F
r
e
c
u
e
n
c
i
a

Promedio de horas trabajadas a la semana
Distribucin poblacional
(datos ficticios)
=38.74
=15.719
Nmero de horas trabajadas a la semana
F
r
e
c
u
e
n
c
i
a

Distribucin muestral de medias
500 muestras
X

1
=40.95
X

2
=36.79
.
.
X

500
=40.41
F
r
e
c
u
e
n
c
i
a

Promedio de horas trabajadas a la semana
Distribucin poblacional
(datos ficticios)
=38.74
=15.719
Nmero de horas trabajadas a la semana
F
r
e
c
u
e
n
c
i
a

Distribucin muestral de medias
1000 muestras
Media de las medias =38.83
Desviacin estndar de las medias
(error estndar) =1.506
F
r
e
c
u
e
n
c
i
a

Promedio de horas trabajadas a la semana
Distribucin poblacional
(datos ficticios)
=38.74
=15.719
Nmero de horas trabajadas a la semana
F
r
e
c
u
e
n
c
i
a

Distribucin muestral de medias
Nmero infinito de muestras



Donde:
p
X

= Media de las medias de todas las


muestras
p = Media poblacional
o
X
= Desviacin estndar de las medias
(error estndar)
o = desviacin estndar en la poblacin
n = Tamao de la muestra

F
r
e
c
u
e
n
c
i
a

Promedio de horas trabajadas a la semana
p
X

=p
o
X

=
o
n
=
o
2
n

Distribucin poblacional
(datos ficticios)
=38.74
=15.719
Nmero de horas trabajadas a la semana
F
r
e
c
u
e
n
c
i
a

Distribucin muestral
Nmero infinito de muestras



F
r
e
c
u
e
n
c
i
a

Promedio de horas trabajadas a la semana
Para n=100

p
X

=p = 38.74


o
X

=
15.719
100
=1.57
Distribucin muestral
Observacin 1: la mayora de las medias muestrales caen cerca del valor
de la poblacin y el nmero de medias muestrales decrece a medida que
uno se aleja del promedio poblacional

Observacin 2: La media de todas las medias posibles corresponde a la
media poblacional

Observacin 3: Entre mayor sea el tamao de la muestra, menor es el
rango de los errores en las muestras repetidas



I nferencia Estadstica
Teorema del Lmite Central
I ndependiente de la distribucin de la variable, si el tamao de la muestra
es relativamente grande (n>30), las medias muestrales se distribuyen
aproximadamente segn la ley normal

Esto se evidencia cuando el tamao de la muestra es grande

Ley de los Grandes Nmeros
Si se extraen diversas muestras (n) al azar de una poblacin, a medida que
n crece, la distribucin muestral de las medias de todas las muestras se
aproxima a la normalidad

Es decir, a medida que crece el tamao de la muestra, menor ser el error
estndar



I nferencia Estadstica
Solamente obtenemos una muestra de todas las posibles.

Sin embargo, dado que la distribucin muestral se acerca a la normalidad a
medida que el tamao de la muestra aumenta, es posible calcular la
probabilidad de ocurrencia de cada resultado muestral:

68% de las medias de todas las posibles muestras caern a una
desviacin estndar de la media poblacional
95.5% de las medias de todas las posibles muestras caern a dos
desviaciones estndar de la media poblacional
99.7% de las medias de todas las posibles muestras caern a tres
desviaciones estndar de la media poblacional






Actividad 2
En grupos de a 2:

1. Tirar el dado y calcular promedios

Grupos A: tirar el dado 3 veces y calcular el promedio. Repetir 20 veces

Grupos B: tirar el dado 30 veces y anotar el promedio. Repetir 4 veces

2. Marcar promedios en la pizarra







Error estndar de la distribucin muestral
Error estndar: Desviacin estndar de una distribucin muestral. El error
estndar mide la dispersin del error de muestreo que ocurre cuando se
muestrea repetidamente una poblacin (Ritchey, 2008, p. 211)
Normalmente no conocemos el error estndar (no contamos con los datos
de todas las muestras). Sin embargo, podemos estimarlo utilizando la
desviacin estndar de la muestra:


s
x

=
s
x
n



Donde:
s
x

= error estndar de medias estimado


s
x
= desviacin estndar de la muestra
n = tamao de la muestra


Error estndar de la distribucin muestral






Mnimo Mximo Media
Desviacin
estndar
n=4 1.00 6.00 3.63 .91
n=25 2.52 4.44 3.45 .33
n=50 2.76 4.24 3.47 .24
Tirando el dado: resultados para 1000 muestras de distintos tamaos








A mayor tamao de muestra, menor es el rango de medias, menor es la
desviacin estndar y ms cercana se encuentra la media a la media
poblacional (3.5)
Cmo cambia el error estndar en funcin del tamao de la muestra?



Error estndar de la distribucin muestral







El error estndar disminuye a medida que el tamao de la muestra
aumenta
n=4
n=25
n=50
s
x

=
s
x
n
=
.91
4
=.46
s
x

=
s
x
n
=
.33
25
=.07
s
x

=
s
x
n
=
.24
50
=.03
a. Estimacin puntual
b. Estimacin intervalar
c. Clculo del tamao de la muestra


Prxima semana...

You might also like