POBLACIÓN Y PLAN

DE MUESTREO
Prof. Sergio A. Chafloque Viteri
*
Es todo aquello que tenga características,
propiedades y tendencias propias; capaz o
no de impresionar a nuestros sentidos.
Ejemplo
*Contaminación Ambiental
*Pobreza Extrema.
*Caos Vehicular en el centro de Trujillo.
*Calidad de servicios ofrecidos por la
empresas de Trujillo.
*Sistemas de canalización de agua para tierras
de cultivo recientemente habilitadas.
*Asignación o redistribución de recursos en
una empresa.
*Determinación de los niveles de azúcar en
caña en una empresa agroindustrial.
*Evaluación de Yacimientos mineros.
Cuando impresionan a nuestros sentidos se
denomina realidad problemática.
Los elementos inmersos en una realidad
problemática se agrupan en poblaciones.
Población Objetivo o Universo:
*Es un conjunto de elementos que poseen
características y tendencias comunes, ilimitado en el
tiempo y el espacio.

Población Muestral:
*Es un conjunto o subconjunto de elementos del
universo, que poseen características y tendencias
comunes, limitado en el tiempo, espacio y en
dimensión y tamaño.
Ejemplos:
*Trabajadores de la empresa Agroindustrial
“Trujillo Verde 118” en el mes de julio del 2014.
Aproximadamente 1245 trabajadores
*Empresas pequeñas y medianas registradas de
manera formal en la ciudad de Trujillo en el mes
de marzo del 2014

*Una I nadecuada definición de la Población
puede llevar a conclusiones erradas, ya que a ella
se referirán todos los hechos que se descubran
durante el estudio.
La Muestra:
*Es un subconjunto de elementos, que poseen
características y tendencias comunes, limitado en el
tiempo, espacio y en dimensión y tamaño
*Una muestra debe ser representativa y adecuada

*La muestra es Representativa, cuando sus elementos
tienen las mismas características que los elementos
de la población.

*La muestra es Adecuada, cuando el tamaño garantiza
las generalizaciones a la población de estudio.
¿Por que usar muestras?

*Naturaleza destructiva
de algunas pruebas.
*Imposibilidad de revisar
toda la población.
*Costo prohibitivo de
estudiar a la población.
*Excesivo tiempo para
entrevistar a la
población.
Muestreo Probabilístico:
*El muestreo es probabilístico cuando se
conoce la probabilidad de cada uno de los
elementos de la población de pasar a
constituir la muestra.
Muestreo Aleatorio Simple
*Aplicable a poblaciones homogéneas, donde
todos los elementos de la población tienen
la misma probabilidad de ser seleccionados
en la muestra.
Muestreo Aleatorio Estratificado
*Aplicable a poblaciones heterogéneas. Para
aplicar esta técnica se suele dividir a la
población en grupos o estratos de
elementos que tienden a ser homogéneos.
Muestreo de Conglomerados.
*Aplicable cuando las unidades de estudio
se encuentran contenidas en otras mas
grandes.

P
o µ
Población (N)
Muestreo
Muestra (n)
Inferencia
. Estimación de Parámetros.
. Prueba de Hipótesis
p
_
X
S
Marco Muestral:

*Es el registro actualizado de todos los elementos
perfectamente Identificados de la población, de
manera que pueden ser ubicados desde el primero
hasta el último elemento de la población. (Las
especificaciones del Marco Muestral, definen su
alcance geográfico, fecha y fuente de donde se
obtuvo)
*Ejemplos:
*Padrón de viviendas del registro predial, Base de
datos de clientes de la empresa ABC, etc.
Unidad de Muestreo
*Es cada uno de los elementos del marco muestral, que
aparecen por separado y por una sola vez.

Unidad de Análisis
*Son los entes que son motivos de estudio y a quienes en
última instancia se aplicará el instrumento de medición.
Permite determinar la población a estudiar.

Criterios de Inclusión:
*Se refiere alas características que hacen posibles que
una unidad (individuo, familia, etc) sea parte de la
población de estudio. Por ejemplo que la unidad
cumpla con la definición operacional de la entidad
estudiada como edad del cliente lugar de procedencia,
etc.

Criterios de Exclusión:
*Atienden a las características cuya presencia hace que
una unidad no sea parte de la población de estudió; por
ejemplo, clientes esporádicos o compradores por
encargo.
*
El tamaño de la muestra es el número mínimo de elementos que se debe
seleccionar de la población de estudio, para efectuar la inferencia.

Nivel de Precisión
*Viene a ser la diferencia máxima aceptable entre el valor del estimador
y el del parámetro.
Nivel de Confianza
*Es la probabilidad de que un intervalo de confianza incluya al parámetro
de la población. Los mas utilizados son del 90%, 95%, y 99%; cuyos
valores tabulares son 1.64, 196, y 2.57 respectivamente.
Desviación Estándar
*Es la variabilidad de los datos con respecto al parámetro de la
población.
*
Para estimar la proporción poblacional:
2
2
2 /
) 1 (
E
P P Z
n
÷
=
o
Donde:
Z = 1.96 Coeficiente de confiabilidad para = 0.05
P = Proporción de elementos a favor de la variable de interés.
Se obtiene: De estudios previos.
De una muestra piloto
De asumir P = 1 – P = 0.5
E = error de tolerancia

Si la población es pequeña o > 0.05 se ajusta por:

o
N
n
N
n
n
n
f
+
=
1
*

Se desea estudiar la proporción de estudiantes de la
UNT que acuden a tienda metro del ovalo; se desea
un nivel de confianza del 95%. De estudios anteriores.
Se conoce que el 40% de los estudiantes frecuentan
tiendas metro del ovalo. Se desea asumir un error del
5%. Además se sabe que N= 12000 estudiantes ¿Cuál
debe ser el tamaño de la muestra?

*
o
Para estimar la media poblacional:
Donde:
Z = 1.96 Coeficiente de confiabilidad para = 0.05
S = Desviación estándar de la variable de interés.
Se obtiene: De estudios anteriores.
De una muestra piloto
E = % error de tolerancia

Si la población es pequeña o > 0.05 se ajusta por:

N
n
N
n
n
n
f
+
=
1
2
2 2
2
E
S Z
n
o
=
_
X
*

Se desea estimar el tiempo promedio para realizar una
tarea específica en una fábrica, con una confianza del
95%. De una muestra piloto se encontró una media
de 4.5 minutos y una desviación estándar de 1.1
minutos y se asume un error de 0.5 minutos.

Donde:
= 1.96 Coeficiente de confiabilidad para = 0.05
= 0.84 Coeficiente de confiabilidad para = 0.20
= Proporción a favor de la variable de estudio en grupo I
= Proporción a favor de la variable de estudio en grupo II

Se puede ajustar la muestra en forma similar
*
o
Para comparar dos proporciones:
2
2 1
2 2 1 1
2
2
) (
) ( ) (
p p
q p q p Z Z
n
÷
+ +
=
| o
|
2
o
Z
|
Z
1
p
2
p
Donde:
= 1.96 Coeficiente de confiabilidad para = 0.05
= 0.84 Coeficiente de confiabilidad para = 0.20
= La mayor desviación estándar de los grupos
= Promedio de la variable de estudio en grupo I
= Promedio de la variable de estudio en grupo II

*
o
2
2
_
1
_
2 2
2
) (
2 ) (
X X
S Z Z
n
÷
+
=
| o
Para comparar dos medias:
2
o
Z
|
Z |
2
S
1
_
X
2
_
X
Sergio Albert Chafloque Viteri
Estadístico
*Una de las tareas básicas de un
Investigador Científico, es precisamente, la
búsqueda de un modelo probabilístico con
el objeto de describir el comportamiento de
los datos de que dispone
*
*Muchas veces suele ocurrir que no se cumplen los
supuestos de la teoría en base a muestras grandes,
debido a que nos enfrentamos a un nuevo problema,
o debido a que el tamaño de la muestra es pequeño
como suele ocurrir en las investigaciones
experimentales o quizá en alguna otra investigación
de carácter biológico, donde el uso de material para
hacer las observaciones es costoso o escaso.
*
* Se emplea para variable aleatorias continuas.
* Se utiliza para muestras pequeñas (ns30).
* Se utiliza cuando no se conoce la varianza
poblacional o2
* Se utiliza para estimar el intervalo de confianza de
la media poblacional y la diferencia de 2 medias
poblacionales.
* Se emplea para realizar pruebas de hipótesis de la
media y diferencia de medias poblacionales.
Se trata de los llamados tests de independencia. La
noción de independencia estadística o probabilística
muestra que si dos sucesos son independientes, la
probabilidad de que ocurran juntos se puede
calcular con el producto de sus probabilidades
individuales.
En la Prueba de Independencia de Criterios, estamos
interesados en determinar si dos cualidades o variables
referidas a individuos de una población están
relacionadas.

A partir de la prueba de I ndependencia de criterios
usando la distribución chi-cuadrado, se han propuesto
cierto número de medidas de asociación entre variables
cuando tenemos frecuencias en tablas de contingencia.
Es decir, la cuestión aquí no es decir si la relación es
significativa o no, sino cuantificar la fuerza de la
relación.
*
*Es una medida del grado de relación, asociación o dependencia de
los factores analizados en una tabla de contingencia. Es bastante
útil cuando se tiene solamente información clasificatoria (escala
nominal) acerca de uno o ambos factores.

) χ /(n χ C
2 2 2
+ =
*
*El ANVA es una prueba semejante a la prueba t
Student, en cuanto a la práctica, pero la
comparación ya no es entre dos grupos sino entre
mas de dos grupos

*Básicamente el análisis de Varianza, se utiliza para
corroborar si la significación de diferencias entre
medias de dos o mas grupos, son o no debidas al
azar.
*
*El objeto de un análisis de regresión es investigar la
relación estadística que existe entre una variable
dependiente (Y) y una o más variables independientes
(, ... ). Para poder realizar esta investigación, se debe
postular una relación funcional entre las variables.
Debido a su simplicidad analítica, la forma funcional
que más se utiliza en la práctica es la relación
lineal. Cuando solo existe una variable
independiente, esto se reduce a una línea recta:


X b b Y
1 0
ˆ
+ =
*
*Se usa cuando se trata de medir el grado de
correlación entre dos variables, independientemente
si se trata de un caso de relación como en el ARL

*
*
*
*
*
- CRISTÓBAL EXEBIO. “Muestreo y Aplicaciones” Edit. EXLO Trujillo-Perú 1990
- CRISTÓBAL EXEBIO. “Estadística Aplicada a la Investigación Científica en
Ciencias de la Salud” Edit. EXLO Trujillo-Perú 2001
- COCHRAN, WILLIAM. :“Técnicas de Muestreo” Edit. C.E.C.S.A. 2da Edición.
México. 1980.
- HERNÁNDEZ R, C FERNÁNDEZ Y P BAPTISTA. Metodología de la
Investigación. 5ª Edición. McGraw Hill. México. 2010