You are on page 1of 51

BIOESTADISTICA I

Introduccin al Muestreo y Distribuciones Muestrales


Dr. Jos Piaggio - 2012
DISTRIBUCIN DEL MUESTREO

OBJETIVOS:
Describir situaciones donde el muestreo es el mtodo de
estudio indicado.
Describir los mtodos de obtencin de muestras aleatorias.
Analizar la relacin entre parmetros y estadsticos.
CONTENIDO
Poblaciones y muestras.
Parmetros y Estadsticos
Muestreo aleatorio
Propiedades de la distribucin en el muestreo.
Teorema Central del Lmite.

Poblacin
Conjunto de todas las unidades de inters
(animales, establecimientos, personas) sobre
las que se quiere conocer algo.
Ej. Estudio de prevalencia de una enfermedad en
bovinos
Poblacin: todos los bovinos del pas
Unidad de inters: el bovino
Ej. Estudio de prevalencia de establecimientos con
animales infectados de la enfermedad
Poblacin: Todos los establecimientos ganaderos con
animales susceptibles.
Unidad de inters: el establecimiento
Muestra
La muestra es un
subconjunto de unidades de
inters (animales,
establecimientos, gente)
que han sido seleccionados
de la poblacin.

Cada elemento de la
muestra es examinado para
extraer informacin.

Muestra
Poblacin
Parmetros y Estadsticos
PARAMETRO
Medida numrica descriptiva de
la poblacin calculada con todos
los elementos de la misma
Constantes


ESTADSTICO
Medida numrica descriptiva de
una muestra calculada a travs de
las unidades observadas en la
misma.
Varan de muestra en muestra
CENSO
DEFINICIN:
Implica el examen de todos los elementos de una
poblacin

SE UTILIZA CUANDO SE:
Necesita un marco de muestreo
Poblacin muy pequea resultando en costos y
tiempo similares al necesario para el muestreo.
Tamao de la muestra n es grande con relacin al
tamao de la poblacin N, debido a mucha
variabilidad
Necesita precisin completa.
Dispone de la informacin en una base de datos.
Limitantes del Censo
Pueden ser inviables, lentos y muy caros (hay
que examinar una gran cantidad de individuos,
lo cual requiere muchos recursos)
Poco flexibles (debido a su complejidad, es muy
difcil modificarlos cuando se han puesto en
marcha).
Irrealizable
si requiere disponer de personal entrenado,
instalaciones (laboratorios, ...) que no estn
disponibles
si los recursos necesarios no son suficientes: los
datos obtenidos pueden contener errores y por tanto
no van a proporcionar una buena informacin.
Muestreo
Es el proceso de seleccionar un
subconjunto de unidades de la poblacin
que constituyen la muestra, que sern
examinados a efectos de estimar alguna
caracterstica de la poblacin de la que
proceden.

Brinda informacin rpida y de menor
costo

RAZONES PARA MUESTREAR
Naturaleza destructiva de ciertas pruebas.
Ej. Evaluaciones sensoriales de alimentos, resistencia de la mecha
de lana, germinacin de semillas, lmparas, municiones, dispositivos
de seguridad.
Imposibilidad fsica de revisar todos los integrantes de la
poblacin.
Ej.: poblaciones de peces, aves, Son poblaciones grandes que estn
en movimiento constante.
Costo de estudiar a todos los integrantes de una poblacin a
menudo es prohibitivo.
Las empresas de opinin pblica comnmente entrevistan a 2.000
familias para sacar conclusiones sobre todo el pas.
Precisin-uniformidad.
Menor nmero de encuestadores, ms entrenados, ms
coordinados.
Oportunidad de la informacin (informacin inmediata o
actualizacin).
Ej poltico, material perecible, enfermedades agudas
Muestreo
FINALIDAD:
Hacer generalizaciones sobre una poblacin sin
necesidad de examinar cada uno de sus
elementos.

Una vez que hemos examinado cada elemento de la muestra, sabemos
exactamente cul es el estado de la variable de inters en la muestra
Si una encuesta ofrece mucha informacin sobre un nmero muy pequeo
de unidades, pero ninguna sobre el resto de la poblacin, Cul es su valor?
Cmo podemos utilizar los resultados de una encuesta para saber algo
sobre las unidades que no hemos investigado?
Inferencia
Inferencia
Proceso que permite estudiar caractersticas de la
poblacin a partir de una muestra
Permite inferir sin necesidad de examinar a toda la
poblacin.
Siempre tiene asociado un margen de error.
Puede llevar a conclusiones errneas si el muestreo no
es bien diseado.



La inferencia siempre asume el riesgo de cometer errores,
pero la metodologa empleada en el muestreo nos permite su
cuantificacin.
Muestra
Poblacin
Inferencia
TEORA DEL MUESTREO
Estudia la relacin entre la
poblacin y las muestras
extradas de la misma.
Es una distribucin de
probabilidad de un estadstico.
Nos permite conocer como un
estadstico tiende a variar a
causa del muestreo aleatorio. La
distribucin es generada por la
repeticin del muestreo un gran
nmero de veces.

Depende de:
Estadstico Considerado
Tamao de la Muestra
Variabilidad de la poblacin sometida a muestreo

DISTRIBUCIN MUESTRAL
UNIDAD DE MUESTREO
Debe ser definida. Elementos individuales de
inters.
Unidad de anlisis en la poblacin. Ej. animal,
galpn, establecimiento.
MARCO DE MUESTREO
Es el listado de nuestro universo de N unidades
de donde ser seleccionada la muestra.
FRACCIN DE MUESTREO
Proporcin de la poblacin que forma parte
de la muestra.
Definiciones
Definiciones
POBLACIN OBJETIVO
Es la poblacin sobre la cual
queremos obtener informacin.
(productores, veterinarios,
establecimientos, animales, )
POBLACIN MUESTREADA o
ESTUDIADA
Es el conjunto de todos los
posibles elementos que pueden
ser seleccionados en una muestra,
Es la que est en el marco de
muestreo
Poblacin que realmente
podemos estudiar
Sesgo de seleccin:
Tendencia sistemtica a excluir ciertas unidades de la poblacin objetivo
Diseo de Muestreo
Es un plan, especificado de antemano, para
obtener una muestra de una poblacin.

Debe contener toda la informacin sobre la
poblacin y la metodologa de muestreo
empleada, de forma de permitir un adecuado
anlisis de los resultados.
TIPOS DE MUESTREO

NO PROBABILISTICO donde la eleccin de la
muestra queda en manos del investigador

PROBABILISTICO se utiliza un mtodo formal
de eleccin. Cada miembro de la poblacin
tiene una probabilidad conocida diferente de 0
de integrar la muestra. Es el nico que garantiza
que la muestra que se obtenga sea representativa
de la poblacin
Muestreo no probabilstico
Es un muestreo que no permite
generalizar ni tener certeza que la muestra
sea representativa, pues no todos los
miembros de la poblacin tienen
probabilidad conocida de ser elegidos.
Muestreo discrecional o de Conveniencia
(elegido por el investigador)
Muestreo casual o incidental (voluntarios)
MUESTREO ALEATORIO
Es un procedimiento que produce una muestra
probabilstica donde cada elemento de la
poblacin tiene una probabilidad diferente de 0
de ser seleccionada.

Cada una de las posibles muestras tiene una
probabilidad conocida de ser seleccionada
TCNICAS DE MUESTREO
M.A.S. Aleatorio Simple.
M.S. Sistemtico.
P.P.T. Probabilidad Proporcional a Tamao
Muestreo Aleatorio Simple (M.A.S.)
Toda muestra posible de tamao n tiene la misma
probabilidad de ser muestreada.
n = tamao de muestra
N = tamao de la poblacin
n/N = fraccin de muestreo

Ejemplo:
Listar y numerar las unidades de estudio (marco) y
Seleccionar mediante un sorteo, una tabla de nmeros
aleatorios o N generados por una calculadora/ PC la muestra.
Tcnica para el MAS
Aleatoriedad Fsica
Bolillero
Papelitos
Monedas, dados, naipes.

Nmeros Aleatorios
Los nmeros aleatorios son nmeros que han sido
generados de forma que cada cifra tiene la misma
probabilidad de ocurrencia. Existen tablas de nmeros
aleatorios o se pueden generar con la calculadora o diversos
programas en la computadora.
NUMEROS ALEATORIOS
Reemplazo
Muestras con reemplazo
Cada unidad es observada y luego retornada al marco.
(puede ser nuevamente seleccionada)
Probabilidad de seleccin permanece constante (si
observamos atributos dicotmicos Distribucin Binomial)

Sin reemplazo
La unidad seleccionada es examinada y quitada del marco
Probabilidad de seleccin para una caracterstica cambia
luego de cada unidad seleccionada (si observamos
atributos dicotmicos Distribucin Hipergeomtrica).
Muestreo Aleatorio Simple (M.A.S.)
Se usa cuando:
Es posible tener un listado completo de todas las unidades de
muestreo
No se conoce la existencia de subpoblaciones con marcadas
diferencias en esa caracterstica
No hay gran dispersin geogrfica
MUESTREO SISTEMTICO. MS.
Los integrantes de la poblacin se ordenan por
algn mtodo y elegimos individuos igualmente
espaciados de la lista, donde el primero ha sido
elegido aleatoriamente.

Se selecciona aleatoriamente un punto de inicio y
despus se elige cada k-esimo elemento de la
poblacin para la muestra. k=N/n

Ej. Tambo N=100 n=5 entonces k=20
Se selecciona aleatoriamente uno de entre los primeros
20 animales y luego cada k-simo animal.
Puede existir un sesgo si hay algn tipo de periodicidad en
la lista.
MUESTREO SISTEMTICO. MS.
PROBABILIDAD PROPORCIONAL AL TAMAO PPT
En el muestreo aleatorio simple, cada unidad de inters de la
poblacin tiene la misma oportunidad o probabilidad de ser
elegida para formar parte de la muestra. El muestreo con
probabilidad proporcional al tamao (PPT) es otra tcnica de
muestreo probabilstico muy til en algunas ocasiones. Cada
unidad de inters en el muestreo PPT tiene una probabilidad
de ser elegida proporcional a alguna medida del tamao de
la unidad de Inters.
Ej. probabilidad proporcional a la poblacin (N de bovinos,
cerdos etc.)
Requiere disponer de buena in formacin sobre las unidades
de inters y generalmente se selecciona la muestra mediante
un programa informtico especfico.
MTODOS, PLANES ESTRATEGIAS DE MUESTREO
MAS UTILIZADOS
M.A.E. Aleatorio Estratificado.
M.C. por Conglomerados.
M.E. por Etapas.
Muestreo Aleatorio Estratificado (M.A.E.)
Se aplica cuando sabemos que hay ciertos factores
(variables, subpoblaciones o estratos) que pueden influir
en el estudio y queremos realizar estimaciones para cada
tipo:
Giro productivo (carne, leche)
Regiones (suelos, clima)

La poblacin se divide primero en subgrupos,
denominados estratos, y se realiza entonces una M.A.S. de
las unidades de cada uno de los estratos.

Al extrapolar los resultados a la poblacin hay que tener
en cuenta el tamao relativo del estrato con respecto al
total de la poblacin.
MUESTREO ALEATORIO ESTRATIFICADO
Este muestreo es muy
eficiente cuando las
unidades son
homogneas dentro de
los subgrupos o
estratos, y a su vez los
mismos difieren entre s.
Los estratos deben ser
mutuamente excluyentes.

Despus, la muestra se
extrae, proporcionalmente
o no, de todos los estratos.

MUESTREO ALEATORIO ESTRATIFICADO
MUESTREO POR CONGLOMERADOS. MC
La poblacin est dividida en
conglomerados (unidades
primarias) y se seleccionan
estos para luego recabar la
informacin de todas las
unidades secundarias.

Ej. Seleccin aleatoria de
establecimientos (grupos o
conglomerados) y tomar
muestras a todos los
animales del mismo.
Muestreo por Conglomerados (M.C.)
Puede aplicarse cuando es difcil tener una lista de todos
las unidades que forman parte de la poblacin de estudio,
pero sin embargo sabemos que se encuentran agrupados
naturalmente en grupos.

Al igual que en el muestreo estratificado, al extrapolar los
resultados a la poblacin hay que tener en cuenta el
tamao relativo de unos grupos con respecto a otros.

Este muestreo es muy eficiente cuando los conglomerados
difieren poco entre s, y a su vez dentro del mismo existe
variabilidad entre las unidades que lo forman.
MUESTREO EN DOS ETAPAS

Seleccin de una muestra aleatoria de
establecimientos (grupos o
conglomerados) y dentro de cada grupo
una muestra aleatoria de unidades de
estudio.

Unidad primaria de muestreo (PSU):
Son los conglomerados
seleccionados en primer lugar.
Generalmente las PSU son los
Establecimientos (DICOSE fsico) de
un censo reciente (declaracin
jurada).

En etapas
Seleccin al
azar de cada grupo
Errores del Muestreo
Muestreales
Aleatorio causado por la fluctuaciones del muestreo
Formas de Control:
Aumentando tamao de muestra
Modificando el mtodo de muestreo (xj estratificacin)
No Muestreales
Errores de Medida
No Respuesta
Sesgo
Error sistemtico inherente a la tcnica utilizada,
predecible y repetitivo para cada observacin
Cuando, en promedio, la estimacin de una muestra es
diferente del valor real en la poblacin, se dice que la
estimacin est sesgada.
Es la diferencia entre el valor verdadero del parmetro y el
valor estimado en muestreos repetidos.
Exactitud (centrados) ausencia de sesgo
Precisin (dispersin de las estimaciones)
sesgo
TEORA DEL MUESTREO
Estudia la relacin entre la poblacin y las
muestras extradas de la misma.

DISTRIBUCIN MUESTRAL
Es una distribucin de probabilidad que indica
hasta que punto un estadstico tiende a variar a
causa del muestreo aleatorio. La distribucin
es generada por la repeticin del muestreo un
gran nmero de veces.
Cuan prximo est el estadstico al
parmetro poblacional?
Depende de:
Estadstico Considerado
Tamao de la Muestra
Variabilidad de la poblacin
sometida a muestreo
CREACIN DE UNA DISTRIBUCIN
Distribucin Muestral
Uno de los objetivos de la estadstica es conocer los
parmetros poblacionales tales como: la media (), la
varianza (
2
) o la proporcin (p).
De una poblacin finita de tamao N, se extraen de
manera aleatoria todas las muestras posibles de
tamao n.
Se calcula el estadstico de inters para cada muestra.
Ej.:
Listar en una columna los distintos valores observados
del estadstico y en otra columna las frecuencias
correspondientes de cada valor observado.
x
Distribucin en el muestreo de las
medias
1
8 10 12 14
11
4
N
i
i
x
N

=
+ + +
= = =

8 10 12 14
8 8 9 10 11
10 9 10 11 12
12 10 11 12 13
14 11 12 13 14
Cual es la distribucin en el muestreo de la media muestral
de peso de lechones?
Tenemos una poblacin N=4 de lechones que pesan 8, 10, 12 y
14 kgs

Tomamos todas las muestras posibles n=2 con reposicin y
calculamos la media aritmtica muestral de c/u
N de Muestras posibles (diferentes):
Muestreo Sin Reposicin
Muestreo con reposicin N
n

Distribucin en el muestreo de las
medias
8 10 12 14
8 8 9 10 11
10 9 10 11 12
12 10 11 12 13
14 11 12 13 14
f fr
8 1 0,063
9 2 0,125
10 3 0,188
11 4 0,250
12 3 0,188
13 2 0,125
14 1 0,063
16 1,000
i
x
Poblacin: 8; 10; 12; 14
i
x
n
o
o =
2
2
i
x
n
o
o =
1
8 10 12 14
11
4
N
i
i
x
N

=
+ + +
= = =

2
2
176
11
16
176
1976
16
2.5
16
i
i
x
x

o
= =

= =
i
x
=
f fr
8 1 0,063
9 2 0,125
10 3 0,188
11 4 0,250
12 3 0,188
13 2 0,125
14 1 0,063
16 1,000
i
x
Medias Muestrales:
Muestreo de una poblacin con Distribucin
Normal:
La distribucin de las medias ser Normal
La media de la distribucin de las medias muestrales
ser igual a la media poblacional

La varianza de la distribucin de las medias ser igual
a la varianza poblacional dividida por el tamao de la
muestra

Cuando el tamao de la muestra aumenta la
distribucin de los resultados muestrales tiende
a una Distribucin Normal
i
x
=
2
2
i
x
n
o
o =
TEOREMA CENTRAL DEL LIMITE
Si la poblacin muestreada tiene distribucin
normal, la distribucin de las medias muestrales
ser normal para todos los tamaos de muestra.

Para muestras de tamao grande la distribucin
de la media muestral ser aproximadamente
Normal sin considerar la distribucin de
probabilidad de la poblacin. En el curso
utilizaremos como criterio para emplear la Distribucin
Normal para las medias muestrales si n>30
Distribucin de la medias en el
Muestreo
Resultados
de la suma
de n dados
1 lim
: e equivalent forma de o
0 lim
=
|
|
.
|

\
|
<
=
|
|
.
|

\
|
>


c
c
n
S
P
n
S
P
n
n
n
n
Ley de los grandes nmeros
Sean X
1
, X
2
, ..., X
n
variables aleatorias independientes,
con la misma distribucin y con valores esperados y
varianzas finitas. Entonces para la suma:
S
n
= X
1
+ X
2
+ ... + X
n

y cualquier real c > 0:

En su "forma fuerte" nos dice que si repetimos el
lanzamiento de una moneda, la proporcin de
caras se aproxima ms y ms a 1/2 a medida que
aumentamos el nmero de lanzamientos.

Si S
n
es el nmero de caras en n lanzamientos, la
ley fuerte de los grandes nmeros dice que
cuando n tiende a infinito:
1
2
1
=
|
.
|

\
|

n
S
P
n
10 50 100 200 500 1000 10000
Proporcin de caras en el lanzamiento de una moneda n veces
Resultados
de lanzar
una moneda
Proporcin
de caras en
n ensayos

You might also like