You are on page 1of 57

Universidad Nacional “Santiago Antúnez de Mayolo”

MUESTREO

01

Página 1
Universidad Nacional “Santiago Antúnez de Mayolo”

PLAN DE LA UNIDAD 01

Proporciona una introducción al concepto de muestreo y a la forma como se utilizan


las muestras para hacer inferencias sobre la población.

Distribuciones Muestrales

Para medias Para proporciones Procedimientos de


Muestrales muestrales muestreo

Error de Error de
muestreo muestreo Errores y sesgo

El error Métodos de
La media de estándar muestreo
las medias
muestrales
Muestre
Aplicación
o
para una
Aleatori
distribució
El error o Simple
n normal
estándar
Muestreo
Aplicación El teorema Estratificado
para una del Límite
distribució Central
n muestral Muestreo
Sistemátic
Factor de o
El Correcció
teorema n por
del Límite Muestreo por
finitud conglomerados
Central
Factor de
Correcció
n por
finitud

Página 2
Universidad Nacional “Santiago Antúnez de Mayolo”

I. INTRODUCCIÓN

Hoy, la estadística está considerada como la teoría de la información, no sólo como


función descriptiva, sino con el objeto básico de hacer estimaciones acerca de los valores
estadísticos de la población o en la comprobación de hipótesis de aquellas características que
han sido investigadas.

En el primer aspecto se observa que la estadística cubre dos aspectos de gran importancia:
la estadística descriptiva a través de la recolección, clasificación, presentación, ya sea en
forma de cuadros o gráficas, la aplicación de medidas como promedios, desviaciones, etc.,
y la interpretación y análisis de datos a fin de obtener conclusiones de forma deductiva de lo
general a lo particular.

El segundo aspecto es la inferencia estadística o método inductivo, el cual, mediante


investigaciones por muestreo, logra obtener resultados considerados como estimadores de
los valores estadísticos, correspondientes a las características de las unidades que conforman
la población, correspondiendo al método inductivo, que denominaremos inferencia. A ello
se podría afirmar que la tarea más importante de la estadística es la realización de inferencias
acerca de una población objetivo, con base en los resultados obtenidos a través de una
muestra.

El objetivo principal de muestreo es considerar el mayor número de unidades con el menor


costo posible.

La muestra, para que sea representativa de la población, requiere que todas las unidades de
la población tengan la misma probabilidad de ser seleccionadas, es decir, debe ser aleatoria,
al azar o probabilística.

Página 3
Universidad Nacional “Santiago Antúnez de Mayolo”

 MARCO TEÓRICO
1.1. MUESTREO

Definición: El muestreo es un proceso estadístico en el cual se estudia un fenómeno que


afecta a un colectivo extenso o población, a partir de una muestra escogida o aleatoria de la
misma.

La población es el conjunto de todos los individuos que porten información sobre el


fenómeno que se estudia. Los individuos corresponden a personas, objetos u otros elementos
que pueden ser escuelas, cursos, familias y hasta unidades territoriales.

Los problemas más corrientes que se presentan en la práctica, cuando se procede a investigar
las características de una población estadística es la imposibilidad de estudiar a cada uno de
los individuos u objetos que la conforman; por ello debemos depender de un subconjunto o
parte de la población como base para llegar a hipótesis relacionadas a varias características
o parámetros de ella. Por lo tanto, en estos casos resulta más conveniente por razones de
economía, tiempo y eficiencia analizar una muestra que es un número determinado de
individuos u objetos de la población y suponer que se pueden ver en ellos con cierto grado
de confianza lo que se quiere conocer acerca del universo de donde provienen.

El estudio de estos aspectos recae sobre la estadística inductiva o inferencial cuya finalidad
es obtener conocimientos sobre algún conjunto extenso de datos, a partir de muestras de los
mismos, que permitan la inferencia de los resultados estadísticos, los cuales representan
cálculos aritméticos realizados sobre los valores obtenidos de la muestra de la población que
ha sido seleccionada rigurosamente.

Para que estos datos estadísticos sean de utilidad tienen que presentar dos características
básicas:

1. Deben ser pertinentes; es decir, deben guardar una relación con el tema a investigar.

2. Deben ser in sesgado; es decir no deben tener deformaciones o errores provenientes


de los instrumentos empleados en la recolección de los datos.

Por otro lado se podría afirmar que la tarea más importante de la estadística es la realización
de inferencia acerca de una población objetivo, con base en los resultados obtenidos a través
de una muestra.

Página 4
Universidad Nacional “Santiago Antúnez de Mayolo”

Hacemos un pequeña síntesis de los que consideramos que el estudiante debe recordar y
afianzar.

- Elemento o unidad de análisis: Persona, familia, zona, animal u objeto

Del elemento se estudian sus características cualitativas o atributos, expresadas por


por palabras y se cuantifican mediante el conteo o recuento; las cuantitativas o
variable expresadas en forma numérica, que pueden ser medidas (variable continua)
o contadas (variable discreta).

- Marco Muestral: Es un listado, actualizado y revisado, de todos los elementos que


constituyen la población que va a ser objeto de investigación. También puede ser un
mapa o croquis con las unidades de selección plenamente identificadas.
- Encuesta preliminar, piloto o pretest: Antes de iniciar la investigación, se recomienda
realizar una pequeña encuesta preliminar con el fin de probar el cuestionario, conocer
mejor la población, entrenar al entrevistador, determinar el tiempo que requiere la
entrevista y en especial tener un mayor conocimiento acerca de algunos parámetros.

1.2. CARACTERÍSTICAS DE LAS MUESTRAS

Para que una muestra sea aceptable desde el punto de vista del análisis estadístico deberá
reunir las siguientes características:

a) Deberá seleccionarse de manera que sea representativa de la población de la cual se


obtuvo.

Es una muestra de un tamaño apropiado que ha sido escogida por procedimientos aleatorios
y se considera que las características observadas “representan” o corresponden a la población
de donde ella proviene.

b) La muestra además de permitir obtener estimaciones de características de la población


(totales, promedios, porcentajes, entre otros) deberá proporcionar medidas de la precisión
de dichas estimaciones.

c) La muestra debe ser bastante reducida para evitar gastos innecesarios y lo bastante amplia
para que el error de muestreo sea admisible y además debe reunir las exigencias de
eficiencia, representatividad, seguridad y flexibilidad.

Página 5
Universidad Nacional “Santiago Antúnez de Mayolo”

1.3. CONDICIONES DEL MUESTREO ALEATORIO

Implican consideraciones importantes:(a) se debe seguir un diseño necesaria, en términos de


un límite, en cuanto al error de estimación a un menor costo; (b) la selección de los elementos
al azar, para luego recolectar diseño estadístico específico(muestreo aleatorio, simple,
estratificado, etc); el mejor es aquel que proporciona la precisión, en términos de un límite,
en cuanto al error de estimación a un menor consto; (b) la selección de los elementos al azar,
para luego recolectar la información por cualquiera de los métodos: entrevista, observación
directa, correo, teléfono, etc.; (c) el error muestral, es decir, la diferencia que debe haber
entre el resultado realizado mediante la muestra y el obtenido posiblemente mediante la
investigación total o censo.

El error de estimación, es la diferencia que puede haber entre la estimación puntual y el


parámetro.

Cuando la estimación no representa bien al parámetro, a pesar de estar perfectamente


diseñada, nos referiremos a errores muestrales; los errores no muestrales son ocasionados
por el mal diseño del formulario, errores cometidos en el proceso de recolección,
procesamiento y análisis de los datos.

Parámetro (poblacional), son las medidas descriptivas numéricas aplicadas a las


características en las unidades de la población. También se les denomina como valores
estadísticos de la población.

Estimador puntual, son las medidas descriptivas numéricas aplicadas a las características en
las unidades de la muestra. Se podrá decir que el estimador es una norma o método para
estimar una constante perteneciente a una población. La estimación hace referencia a los
valores numéricos de los parámetros poblacionales desconocidos, a los cuales se llega
mediante una muestra.

El estimador por intervalos, es una regla que nos indica cómo calcular dos puntos o valores
a través de una muestra. La estimación por intervalos es la estimación del parámetro
mediante la especificación de un intervalo de valor, determinado por un límite inferior y otro
superior (límites de confianza) dentro del cual estará comprendido el valor verdadero o
parámetro poblacional.

Página 6
Universidad Nacional “Santiago Antúnez de Mayolo”

1.4. VENTAJAS Y DESVENTAJAS DEL MUESTREO

A grandes rasgos la aplicación del muestreo es aconsejable principalmente en los siguientes


casos:

 Cuando la población sea infinita o tan grande que sea imposible la enumeración completa
de cada uno de los elementos o unidades.
 Cuando la población tenga las mismas características tal que una muestra sea una imagen
aceptable de la misma población.
 Con respecto a la parte técnica operacional y administrativa tenemos:
- Economía de tiempo y dinero
- Ampliación del alcance de una investigación.
- Mejor formación y control del personal que interviene en la investigación.
- Mayor control, calidad, rapidez y eficiencia en el procesamiento y publicación de
los datos.
 Permite la verificación posterior a una investigación utilizando menor personal y otros
recursos.
- Mayor confiabilidad y precisión de los datos obtenidos.
 Por otra parte, la aplicación del muestreo presenta algunas limitaciones comunes entre las
cuales tenemos:
- No permite hacer cálculos, proyecciones o tabulaciones con respecto a sectores
pequeños de una población o cuando se requiere información de cada elemento de
la población, ya que las dudas serían tan importantes que no es posible tener una
acertada predicción en base de la muestra.
- El cálculo de los resultados está sujeto a los errores del muestreo en sí y de errores
ajenos al muestreo.
- Las investigaciones completas ofrecen un margen más sólido y eficiente de exactitud
que los obtenidos en base a la muestra.
- En base a una muestra se dificulta la tabulación cruzada de algunas características
investigadas.
- Las probabilidades de error se multiplican en las diferentes operaciones y en las
complicaciones que surjan de su propio mecanismo.
- La preparación estadístico-matemática del muestrísta para el diseño eficiente de la
muestra en todas sus etapas.

Página 7
Universidad Nacional “Santiago Antúnez de Mayolo”

1.5. ESTIMADORES DEL PARÁMETRO POBLACIONAL

Los estadísticos muéstrales son valores que nos permiten estimar los parámetros
poblacionales. Se trata de valores calculados en la muestra que operan como referencia
empírica del valor desconocido correspondiente a la población.
En virtud de la función que cumplen, los estadísticos muéstrales son conocidos como
estimadores. En principio pueden obtenerse infinitos valores para estimar un parámetro
poblacional existirá un estadístico muestral que es su mejor estimador.
Nótese que un estimador es un suceso aleatorio que se asume diversos valores con
probabilidades distintas. En efecto, en cada muestra de tamaño n extraída de una población
de tamaño N, el estimador asumiría un valor diferente. En consecuencia, un estimador
varía en forma aleatoria en torno al parámetro poblacional. Así, por ejemplo, la media
muestral de cada una de las muestras se aproxima en distinto grado al valor parámetro
poblacional.

1.5.1. Propiedades de los estimadores o estimaciones

Los estimadores presentan un conjunto de propiedades que permiten evaluar su


pertenencia en la estimación del parámetro poblacional. La teoría de la estimación ha
establecido cuáles son los atributos que caracterizan a un buen estimador. En particular, se
señala que un buen estimador debe ser insesgado, consistente, eficiente y resistente.
Se conoce también como el proceso mediante el cual se obtiene la estimación. Una
estimación es el resultado numérico del estimador.

Para desempeñarse de manera confiable, los estimadores deben ser insesgados, eficientes,
consistentes y suficiente. Cada propiedad se discute a su tiempo con esta sección de
estudio.

1.5.1.1. Estimador Insesgado


Un estimador es insesgado cuando la esperanza matemática del estimador coincide con

el valor del parámetro poblacional. Se dice que una estadística 𝜽es un estimador insesgado

del parámetro 𝜽 si:

𝝁𝜽= 𝑬(𝜽
)= 𝜽
1.5.1.2. Estimador consistente

Página 8
Universidad Nacional “Santiago Antúnez de Mayolo”

Un estimador es consistente si el valor de la estimación tiende a coincidir con el valor


del parámetro, cuando el tamaño de la muestra tiende a aproximarse al tamaño de la
población. En un estimador consiste la probabilidad que el estimador coincida con el
parámetro poblacional es 1 cuando el tamaño de la muestra aumenta hasta coincidir con el
tamaño de la población.

𝑷(|𝑿− 𝝁| > 𝓔
La probabilidad que la diferencia entre la media muestral y el parámetro poblacional sea
mayor que un número cualquiera 𝓔 tiende a 0 cuando el tamaño de la muestra tiende al
tamaño de la población.

1.5.1.3. Estimador eficiente

Un estimador es eficiente en términos absolutos cuando es el estimador de menor


dispersión entre todos los estimadores insesgados del parámetro. Por otra parte, un
estimador es eficiente en términos relativos cuando, comparado con otro estimador, se
establece que presenta menor dispersión respecto al parámetro poblacional. En general, un
estimador se caracteriza como relativamente más eficiente cuando sus estimaciones son
más próximas al parámetro poblacional que las de otro estimador.
Si
de consideramos todos
menor varianza los posibles
se llama estimadores
estimador eficiente insesgado
de 𝜽 de algún parámetro 𝜽 , el

1.5.1.4. Eficiencia Absoluta


Para estudiar la eficiencia absoluta se compara la eficiencia de cualquier estimador en
relación al de mínima dispersión. Así, por ejemplo, siendo 𝑒�𝑖� y 𝑒���� estimadores
de varianza mínima y varianza otro la expresión de la eficiencia absoluta es la
siguiente:
𝑣𝑎�(𝑒����)

𝑬� � �= 𝑣𝑎�(𝑒�𝑖�)
Se puede conocer el estimador de varianza mínima utilizando la desigualdad de Cramer –
Rao. Se demuestra mediante este procedimiento que la media muestral es un estimador
eficiente de la media poblacional.

Página 9
Universidad Nacional “Santiago Antúnez de Mayolo”

1.5.1.5. Eficiencia Relativa


Para verificar la eficiencia relativa se comparan las varianzas de dos estimadores. Así,
por ejemplo, los estimadores 𝑒1 �𝑒2 con varianzas 2 y 4, respectivamente, permiten la
siguiente conclusión a este respecto.
𝑣𝑎�(𝑒1) 2
𝑬 �𝑒 = = = 0,5
𝑣𝑎�(𝑒2) 4
Se deduce que para el mismo tamaño de muestra la eficiencia relativa de 𝑒2 con

respecto a 𝑒1 es del 50%. Es decir, e2 es la mitad de eficiente.


1.5.1.6. Estimador suficiente

Un estimador es suficiente si utiliza la información muestral en forma extensa, de modo


que ningún otro estimador logra con la misma muestra una mejor estimación del parámetro
poblacional. La media aritmética muestral es un estimador suficiente de la media
aritmética poblacional, porque otros posibles estimadores – media geométrica, media
armónica – no utilizan toda la información muestral como la media aritmética para estimar
el parámetro poblacional. Se demuestra que la proporción muestral es un estimador
suficiente del valor de la proporción en la población origen de la muestra.

Para evaluar la suficiencia de un estimador se utiliza el teorema de factorización.

1.5.1.7. Estimador resistente

Un estimador es resistente si no se ve afectado por la presencia de valores anómalos.


Los valores anómalos inciden negativamente en la calidad de la inferencia. Se usa el
término anómalo para designar valores aberrantes y valores contaminantes. Un valor
aberrante es un valor discordante con los datos que componen la muestra. Por ejemplo, un
valor extremo. Un valor es contaminante cuando está presente en la muestra no siendo
parte de la población objeto.

1.6. TIPOS DE MUESTREO

Existen varias clases de muestreo, que se resumen en dos grandes grupos: muestreo
probabilístico y no probabilístico.

 Probabilístico
- Muestreo aleatorio simple

Lic. Emerson Damián Norabuena Figueroa


Página 10
Universidad Nacional “Santiago Antúnez de Mayolo”

- Muestreo aleatorio estratificado


- Muestreo por conglomerados
- Muestreo sistemático

 No probabilística
- Muestreo de convivencia
- Muestreo por juicio u opinión
- Muestreo por cuotas
- Muestreo por bola de nieve
- Muestreo discrecional

3.1. Muestreo Aleatorio Simple:

MUESTREO ALEATORIO SIMPLE


Objetivo: Seleccionar una muestra para representativa de la población, con el fin de
obtener estimadores de los parámetros. Para lograrlo existen varios métodos y en cada
uno de ellos se puede establecer:
a. El grado de precisión requerida en los estimadores.
b. Tamaño de la muestra.
c. Costo y tiempo.
Se denomina muestreo aleatorio simple a aquel en que todos los elementos de la población
tienen la misma probabilidad de formar parte de la muestra y ésta es determinada únicamente
por el azar. Se trata de un tipo de muestreo probabilístico que permite con facilidad llevar a
cabo inferencias estadísticas y calcular la probabilidad de error asociada a las mismas.

Concretando, el muestreo aleatorio simple consiste en seleccionar n elementos con o sin


reemplazamiento de entre los N elementos que componen la población, de tal modo que
todas las muestras de tamaño n que se puedan formar tengan la misma probabilidad de ser
elegidas.

Si la muestra se selecciona sin reemplazamiento (es decir, cuando un elemento ha sido


extraído queda descartado de cara a la siguiente extracción) se habla de muestreo aleatorio
sin reposición, también llamado muestreo irrestrictamente aleatorio.

Si la muestra se selecciona con reemplazamiento (es decir, el elemento elegido en cada


extracción vuelve a ser incluido en la población antes de extraer el siguiente elemento) se

Lic. Emerson Damián Norabuena Figueroa


Página 11
Universidad Nacional “Santiago Antúnez de Mayolo”

habla de muestreo aleatorio con reposición, también llamado generalmente muestreo


aleatorio simple.

Si bien los dos métodos son distintos, cuando el tamaño de la población es infinito o tan
grande que pueda considerarse como infinito, ambos métodos llegan a las mismas
n
conclusiones. Si la fracción de muestreo es mayor de 0.1 (se muestrea más del 10 % de
N
la población) la diferencia entre ambos métodos puede ser apreciable, llegando a
conclusiones contradictorias según se aplique un método u otro.

 Distribución de medias muestrales �


Simbología que será utilizada:

Medidas Población Muestra


Media aritmética 𝜇 �
Varianza 𝜎2 �2
Desviación típica 𝜎 s
Tamaño N n

𝜇𝑥 : Media de todas las medias muestrales

𝜎𝑥 : Desviación típica de todas las medias muestrales


M : Número de muestras posibles

𝑁
M=( )= , cuando la selección se hace sin reposición

𝑛 (�− �) �

M = 𝑁� , cuando se hace la selección con reposición.

Cabe considerar una población de N elementos, con media 𝜇 y desviación típica 𝜎 ,


si se obtienen M número de muestras posibles, de tamaño n, simbolizamos a cada
media muestral por: �1 , 2, 3, …, ��y cada desviación típica muestral, por �1, �2,
�3, … , ��

Lic. Emerson Damián Norabuena Figueroa


Página 12
Universidad Nacional “Santiago Antúnez de Mayolo”

Teorema: Dada una población, si extraemos todas las muestras posibles de un mismo
tamaño, entonces la media de la distribución de todas las medias muestrales posibles, será
igual a la media poblacional.

Lic. Emerson Damián Norabuena Figueroa


Página 13
Universidad Nacional “Santiago Antúnez de Mayolo”

Lic. Emerson Damián Norabuena Figueroa


Página 14
Universidad Nacional “Santiago Antúnez de Mayolo”

Lic. Emerson Damián Norabuena Figueroa


Página 15
Universidad Nacional “Santiago Antúnez de Mayolo”

El teorema del límite central: las medias de muestras grandes y aleatorias son
aproximadamente normales

El teorema del límite central es un teorema fundamental de probabilidad y estadística.


El teorema establece que la distribución de , que es la media de una
muestra aleatoria de una población con varianza finita, tiene una
distribución
aproximadamente normal cuando el tamaño de la muestra es grande,
independientemente de la forma de la distribución de la población. Muchos
procedimientos estadísticos comunes requieren que los datos sean aproximadamente
normales, pero el teorema del límite central le permite aplicar estos procedimientos
útiles a poblaciones que son marcadamente no normales. El tamaño que debe tener
la muestra depende de la forma de la distribución original. Si la distribución de la
población es simétrica, un tamaño de muestra de 5 podría generar una aproximación
adecuada; si la distribución de la población es marcadamente asimétrica, se requiere

Lic. Emerson Damián Norabuena Figueroa


Página 16
Universidad Nacional “Santiago Antúnez de Mayolo”

un tamaño de muestra de 50 o más. Las siguientes gráficas muestran ejemplos de


cómo la distribución afecta el tamaño de la muestra que usted necesita.

Distribución uniforme
Medias de las muestras

Una población que sigue una distribución uniforme es simétrica, pero marcadamente no
normal, como lo indica el primer histograma. Sin embargo, la distribución de 1000 medias
de la muestra (n=5) de esta población es aproximadamente normal debido al teorema del
límite central, como lo demuestra el segundo histograma. Este histograma de medias de la
muestra incluye una curva normal superpuesta para ilustrar esta normalidad.

Distribución exponencial M edias de las muestras

Una población que sigue una distribución exponencial es asimétrica y no normal, como lo
demuestra el primer histograma. Sin embargo, la distribución de medias de la muestra de
1000 muestras de tamaño 50 de esta población es aproximadamente normal, debido al
teorema del límite central, como lo demuestra el segundo histograma. Este histograma de
medias de la muestra incluye una curva normal superpuesta para ilustrar esta normalidad.

Lic. Emerson Damián Norabuena Figueroa


Página 17
Universidad Nacional “Santiago Antúnez de Mayolo”

De a cuerdo con el teorema del límite central, la variante Z para distribuciones de medias
muestrales será(estandarización de la muestra) :

𝑋−𝜇𝑥 𝑋−𝜇
z = =
𝜎𝑥
𝜎/√�
Por la cual consideramos que se aproxima a
una distribución normal

Aplicación de estudio
𝐸1 : La altura media de 400 alumnos de un plantel de secundaria es de 1,50 mts, y su
desviación típica es de 0,25 mts. Determinar la probabilidad de que en una muestra de 36
alumnos, la media sea superior a 1,60 mts.

Datos:

N = 400 𝜇 = 1.50

n = 36 𝜎 = 0.25

�= 1.60
Solución

𝑋−𝜇 1.60 − 1.50


z= = 0.25 = 2.40
𝜎/√� √36

z = 2.40 A(0.9918) ver tabla anexa 01

p(�> 1.60) = 1 - p(�≤ z)

= 1 – 0.9918

= 0.0082
Por lo tanto la probabilidad de que en una muestra de 36 alumnos del colegio “Nuestra señora
del Sagrado Corazón de Jesús” se superior a 1.60 es de 0.0082.

Lic. Emerson Damián Norabuena Figueroa


Página 18
Universidad Nacional “Santiago Antúnez de Mayolo”

𝐸2 : La consultoría Yachakuy Perú S.A.C, realizó un estudio de mercado para la venta


de un lote de 1000 pollos, con un peso promedio de 3,50 kg y una desviación estándar
de 0,18kg. ¿Cuál es la probabilidad de que una muestra aleatoria, 100 pollos pesen
entre 3,53 y 3,56kg?

Datos:

𝐸3 : El fabricante de champú “Muestritas” para cabello, distribuye el tamaño


profesional de su producto en 100 salones de belleza de Perú, donde se ha
determinado que el consumo promedio de su producto es de 2800 cojines. Si se toma
una muestra probabilística de 36 salones ¿Cuál es la probabilidad de que el consumo
promedio en un mes sea inferior a 2700?.

Datos:

Lic. Emerson Damián Norabuena Figueroa


Página 19
Universidad Nacional “Santiago Antúnez de Mayolo”

 Aplicaciones Propuestas

Lic. Emerson Damián Norabuena Figueroa


Página 20
Universidad Nacional “Santiago Antúnez de Mayolo”

Lic. Emerson Damián Norabuena Figueroa


Página 21
Universidad Nacional “Santiago Antúnez de Mayolo”

Lic. Emerson Damián Norabuena Figueroa


Página 22
Universidad Nacional “Santiago Antúnez de Mayolo”

Lic. Emerson Damián Norabuena Figueroa


Página 23
Universidad Nacional “Santiago Antúnez de Mayolo”

Lic. Emerson Damián Norabuena Figueroa


Página 24
Universidad Nacional “Santiago Antúnez de Mayolo”

Lic. Emerson Damián Norabuena Figueroa


Página 25
Universidad Nacional “Santiago Antúnez de Mayolo”

 Aplicación Propuesta

Lic. Emerson Damián Norabuena Figueroa


Página 26
Universidad Nacional “Santiago Antúnez de Mayolo”

Lic. Emerson Damián Norabuena Figueroa


Página 27
Universidad Nacional “Santiago Antúnez de Mayolo”

Lic. Emerson Damián Norabuena Figueroa


Página 28
Universidad Nacional “Santiago Antúnez de Mayolo”

Lic. Emerson Damián Norabuena Figueroa


Página 29
Universidad Nacional “Santiago Antúnez de Mayolo”

Lic. Emerson Damián Norabuena Figueroa


Página 30
Universidad Nacional “Santiago Antúnez de Mayolo”

Lic. Emerson Damián Norabuena Figueroa


Página 31
Universidad Nacional “Santiago Antúnez de Mayolo”

TAMAÑO DE LA MUESTRA

En la práctica el procedimiento de muestreo aleatorio consiste en extraer al azar los


elementos que constituyen la muestra, obteniendo la muestra unidad a unidad. Para ello, si
la población es finita, se enumeran los elementos de la población desde 1 hasta N, y se
extraen a continuación n elementos usando una urna o un bombo. Este procedimiento,
aunque sencillo, requiere tener unos medios materiales: un bombo o una urna, papeles
numerados o bolas numeradas, etc., por lo que se suelen utilizar otras alternativas como las
tablas de números aleatorios o la generación de números aleatorios con la calculadora.

Las tablas de números aleatorios son tablas de números colocados de tal forma que no exista
ninguna relación entre ellos sea cual sea el sentido en que los leamos. Al final de los
contenidos teóricos de este tema aparece una tabla de números aleatorios.

 Etapas del muestreo:


1) Definir la población de estudio(Objetivo – Marco muestral )
2) Seleccionar un procedimiento de muestreo
3) Definir el tamaño de muestra (según el tipo de muestreo de estudio).

Lic. Emerson Damián Norabuena Figueroa


Página 32
Universidad Nacional “Santiago Antúnez de Mayolo”

4) Seleccionar la(s) unidades muestrales de manera sistemática por medio de algún


medio mecánico (Tablas de números aleatorios, bolas dentro de una bolsa, números
aleatorios generados con una calculadora, etc.)

 Tamaño de la muestra en población


- En la variable - En la proporción
�𝝈�
� ��
��

�=
��

��=
p = Probabilidad de éxito
q = (1 – p) = Probabilidad de fracaso
1 – α = Nivel de confianza
e = error de diseño

- Error de muestreo o estimación


Es es la diferencia que puede haber entre la estimación puntual y el parámetro.
Cuando la estimación no representa bien al parámetro, a pesar de estar perfectamente
diseñada, nos referiremos a errores muestrales; los errores no muestrales son ocasionados
por el mal diseño del formulario, errores cometidos en el proceso de recolección,
procesamiento y análisis de los datos.

El tamaño de error depende del investigador que está dispuesto a aceptar, caso contrario
está más allá del control del investigador (no hay nada que se pueda hacer sobre la varianza
de la población), sí es posible limitar el tamaño de error.
El tamaño de error que el investigador puede tolerar, depende de qué tan crítico es el
trabajo. Algunas tareas extremadamente delicadas requieren de resultados exactos: lo
procedimientos médicos vitales de los cuales dependen vidas humanas, o la producción de
piezas de una máquina que deba cumplir medidas precisas, pueden tolerar sólo un pequeño
error. En otros casos, los erros más grandes pueden tener consecuencia menos grave.
Parámetro: Son las medidas descriptivas numéricas aplicadas a las características en las
unidades de la población. También se les denomina como valores estadísticos de la
población

Lic. Emerson Damián Norabuena Figueroa


Página 33
Universidad Nacional “Santiago Antúnez de Mayolo”

Estimador puntual, son las medidas descriptivas numéricas aplicadas a las características
en las unidades de la muestra. Se podrá decir que el estimador es una norma o método para

Lic. Emerson Damián Norabuena Figueroa


Página 34
Universidad Nacional “Santiago Antúnez de Mayolo”

estimar una constante perteneciente a una población. La estimación hace referencia a los
valores numéricos de los parámetros poblacionales desconocidos, a los cuales se llega
mediante una muestra.
El estimador por intervalos, es una regla que nos indica cómo calcular dos puntos o valores
a través de una muestra. La estimación por intervalos es la estimación del parámetro
mediante la especificación de un intervalo de valores, determinado por un límite inferior y
otro superior (limites de confianza) dentro del cual comprendido el valor verdadero o
parámetro poblacional.
La probabilidad de que un intervalo de confianza contenga el parámetro que se estima, se
denomina coeficiente de confianza.

- Tamaño de la muestra cuando se conoce la población (ajuste)


��
n = � −�
�+( � )

𝑵
- Estandarización de la media de la muestra

Media de muestra Media Poblacional



−𝝁
z=

𝝈� 𝝈
Error estándar de la media =
√�
Nota: En general se cumple que al aumentar la precisión, es decir, al disminuir el grado
de error, aumenta el tamaño de muestra necesaria. En el caso de proporciones, el error se
expresa como un porcentaje del valor que puede tener el parámetro, es decir, 5% o 6%, en
caso se habla de precisión relativa.

El nivel de confianza, generalmente se fija en 95% si no existiese en el diseño. El efecto


de este valor sobre el tamaño de muestra es directo; es decir, para una precisión dada, el
tamaño de muestra aumenta al incrementar el nivel de confianza.

Ejemplo 01: La empresa YACHAKUY S.A.C, pretende realizar un estudio de mercado


de panel solares para el departamento de Ancash – Zona Urbana, cuyo objetivo se centra
innovar tecnología, bajo el control de ingenieros energéticos y dicha empresa, con el fin
establecer dicho producto al mercado. ¿Qué tamaño de muestra se requiere para llevar a
cabo dicha investigación con un 95% de confianza?

Lic. Emerson Damián Norabuena Figueroa


Página 35
Universidad Nacional “Santiago Antúnez de Mayolo”

Solución:
N =
1–α = Z=
e =
p =
q =

- Entonces calculamos el tamaño de la muestra


��= =
Ajuste del tamaño de la muestra

� =
- Interpretación:
………………………………………………………………………………………
………………………………………………………………………………………
………………………………………………………………………………………

Ejemplo 02: La empresa I-STATIC S.A.C está considerando comprar máquinas para
hacer nieve y ayudar a la Madre Naturaleza a proporcionar una base apropiada para los
turistas nacionales y extranjeros. Si el promedio de nevados parece ser insuficiente, piensa
que la máquina debería pagarse muy pronoto por sí misma. Para lo cual Planea estimar las
pulgadas promedio de nieve que cae en el área, pero no tiene idea qué tan grande debería
ser la muestra. Sólo sabe que desea un 99% de confianza en sus hallazgos y que el error no
debe exceder de 1pulgada. El Gerente les promete tiquetes gratuitos de temporada para el
ingreso a los turistas ¿Realice los cálculos pertinentes para el proyecto piloto?

Nota: Se realiza dicho proyecto a partir de una muestra piloto que produce una desviación
estándar de 3.5 pulgadas.

Solución:

Lic. Emerson Damián Norabuena Figueroa


Página 36
Universidad Nacional “Santiago Antúnez de Mayolo”

N =
1–α = Z=
e =
p =
q =

- Entonces calculamos el tamaño de la muestra


��= =
- Interpretación:
………………………………………………………………………………………
………………………………………………………………………………………
………………………………………………………………………………………
Ejemplo 03: Se requiere obtener una muestra de egresados del Congreso Nacional de
Ingeniería Agrícola CONIA 2015, que tiene por finalidad proyectar dicha asistencia para el
año 2016. Por lo que se evaluará con 95 %, 97% y 99% de confianza ,con error del 5% y
una población de .¿Realice los cálculos pertinentes para el proyecto 2016 - CONIA ?

Solución:

N =
1–α = Z=
e =
p =
q =

- Entonces calculamos el tamaño de la muestra


��= =

Lic. Emerson Damián Norabuena Figueroa


Página 37
Universidad Nacional “Santiago Antúnez de Mayolo”

Ajuste del tamaño de la muestra



� =
- Interpretación:
………………………………………………………………………………………
………………………………………………………………………………………
………………………………………………………………………………………

 Aplicaciones Propuestas
a) La empresa I-STATIC, pretende investigar el consumo y el ingreso de la
población de Huaraz – Independencia. Se seleccionaron 14 familias que
formarán la muestra piloto del estudio de investigación (la población está
numerada desde 001 hasta 355), sin tener en cuenta números superiores o
repetidos. Del cual se obtuvo los siguientes resultados:
Selección de muestras (aleatorias)
335 004 289 128 097 271 253
348202 349 197 018 020 207
- Información obtenida mediante Encuesta Preliminar o piloto.

N° Número Ingresos Vivienda N° total de Género


Orden Laborando Consumo diario
Aleatorios (Miles $) Propia personas M F de carne (grs)
1 335 2.420 Si 3 1 2 1 760
2 004 1.060 Si 3 1 2 1 765
3 289 2.860 No 3 1 2 2 592
4 128 2.320 No 3 1 2 2 520
5 97 1.120 Si 3 1 2 1 610
6 271 2.500 Si 5 1 4 2 636
7 253 1.930 Si 2 0 2 2 650
8 348 1.020 Si 3 2 1 1 605
9 202 1.960 Si 2 1 1 1 642
10 349 1.110 No 2 0 2 1 520
11 197 970 No 2 1 1 1 508
12 18 1.790 No 4 2 2 1 767
13 20 2.250 No 3 1 2 2 842
14 207 1.750 Si 2 0 2 1 684

Lic. Emerson Damián Norabuena Figueroa


Página 38
Universidad Nacional “Santiago Antúnez de Mayolo”

b) Con al anterior información obtenida de la encuesta preliminar, se determina la


varianza y se calcula el tamaño óptimo de la muestra, dependiendo de las
características que hayamos seleccionado. Veamos los resultados, cuanto
trabajamos con un error de muestreo del 5% para las variables (ingrso y
consumo) y del 8% para el atributo (propiedad). La confianza de los 3 casos es
de 95.5% .
Solución:

a. Ingreso promedio : �=

e = 0.05( ) =
𝑺� = ∑ 𝒊�− ��


�− �

�𝒔�
��= 𝐞�
��
n = � −�
�+( � )

𝑵
𝑵��𝒔�

�=
𝐍𝐞�− ��𝒔�
- También se puede calcular mediante :
n = 𝒔�
𝐞 𝒔�
( )+ ( )

� 𝑵

b. Consumo promedio de carne diaria por familia

�=

e = 0.05 ( ) =
𝑺� = ∑ 𝒊�− ��


�− �

�𝒔�

��=
𝐞�

Lic. Emerson Damián Norabuena Figueroa


Página 39
Universidad Nacional “Santiago Antúnez de Mayolo”

��
n = � −�
�+( � )

𝑵
𝑵��𝒔�

�=
𝐍𝐞�− ��𝒔�
- También se puede calcular mediante :
n = 𝒔�
𝐞 𝒔�
( )+ ( )

� 𝑵

c. Cuando hay cierto grado de homogeneidad en la característica investigada,


el tamaño tiende a ser pequeño, tal es el caso observado con el consumo de
carne diaria donde se obtuvo 37 familias. El grado de homogeneidad se
estable cuando el coeficiente de variación calculado es menor del 30% en
estos casos es recomendable la aplicación del M.A.S, en caso contrario es
aconsejable el muestreo aleatorio estratificado, siendo en nuestro caso, la
variable ingreso.

cv = . 100%

𝑥
d. Proporción de familias con vivienda propia

P=

Cuestionario:
- Decir si es cierto o falso a los siguientes puntos:
a. Población estadística, es un conjunto de elementos que representan una
característica común.
b. Una población finita es aquélla que está formada por un limitado
número de elementos que representan un característica que está
formada por un límite número de elementos que representan una
característica (cualitativa o cuantitativa), común.
c. La muestra aleatoria puede no ser representativa del universo o
población de la que se extrajo.
d. El método de selección al azar, no está basada en el cálculo de las
probabilidades.
e. La muestra, es obtenida con el fin de investigar, a partir del
conocimiento de sus características particulares, las propiedades de
toda la población.
f. Una de las ventajas del muestreo, es el de mayor control de la
integralidad y calidad de la enumeración.

Lic. Emerson Damián Norabuena Figueroa


Página 40
Universidad Nacional “Santiago Antúnez de Mayolo”

g. No es necesario utilizar la misma unidad de selección para la aplicación


del muestreo, que para la tabulación y análisis.

b. Para efectos de planeación económica en la Sabana de Bogotá, es necesario estimar


entre 2.200 hatos:
- El número de vacas lecheras por hato, con un error del 8% y una confianza del
95.5%.
- El rendimiento medio de leche por hato, con un error del 8% y una confianza del
95.5%.
c. La proporción de hatos con un rendimiento medio de leche superior a los 250 litros,
un error del 8% y confianza del 95.5. Una encuesta preliminar de tamaño 40, arrojo
las siguientes estimaciones:
- Promedio de vacas por hato, 46 y desviación típica, 40.
- Rendimiento medio de leche por hato, 345 litros y varianza, 9.700 litros.
- 60% de los hatos con rendimiento medio de leche superior a 250 litros

¿Qué tamaño de muestra recomendaría usted?

d. Si en el ejercicio anterior se desea estimar el número total de vacas lecheras en


2.200 hatos, con un error de 8.000 vacas y una confianza del 95.5%. ¿Qué tamaño
de muestra se requeriría?
e. La empresa Montoya Tours S.A.C permite que ciertos gasto de sus afiliados
(gasolina, lubricantes y lavado) se haga mediante la utilización de la tarjeta de
crédito expedida para pago en las bombas de gasolina locales. La empresa ha
expedido 10.050 tarjetas de crédito. Se desea hacer una investigación sobre la
utilización de la tarjeta y otras características.
Para ello se realizó una encuesta preliminar de 90 tarjetas y se encontró que 63
de ellas fueron utilizadas para pagar servicios durante el mes de referencia. Por
otra parte, el total de los gastos cancelados con tarjetas fueron $2390.00 y la
desviación típica de $4.000. Se desea determinar el tamaño de la muestra, con
un error del 2% y una confianza del 95% para estimar.
a. La proporción de afiliados que utilizan la tarjeta.
b. El gasto promedio mensual cancelado con tarjeta.
c. El total del gasto mensual, cancelado con tarjeta.
d. De los tamaños anteriormente obtenidos.

¿Cuál aconsejaría usted?

Lic. Emerson Damián Norabuena Figueroa


Página 40
Universidad Nacional “Santiago Antúnez de Mayolo”

Estadísticos Muéstrales:

 Varianza Muestral:

 Estimador de la Población 𝝁 :

 Varianza Estimada Poblacional �


:
 Límite del error de estimación :

Lic. Emerson Damián Norabuena Figueroa


Página 41
Universidad Nacional “Santiago Antúnez de Mayolo”

Lic. Emerson Damián Norabuena Figueroa


Página 42
Universidad Nacional “Santiago Antúnez de Mayolo”

Lic. Emerson Damián Norabuena Figueroa


Página 43
Universidad Nacional “Santiago Antúnez de Mayolo”

Lic. Emerson Damián Norabuena Figueroa


Página 44
Universidad Nacional “Santiago Antúnez de Mayolo”

 Aplicación Propuesta

Lic. Emerson Damián Norabuena Figueroa


Página 45
Universidad Nacional “Santiago Antúnez de Mayolo”

Lic. Emerson Damián Norabuena Figueroa


Página 46
Universidad Nacional “Santiago Antúnez de Mayolo”

Lic. Emerson Damián Norabuena Figueroa


Página 47
Universidad Nacional “Santiago Antúnez de Mayolo”

3.1. Muestreo Aleatorio Estratificado (MAE)

El muestro aleatorio estratificado, denominado también muestreo aleatorio restringido, es


un método que permite una selección más eficiente que el obtenido mediante el muestreo
aleatorio simple, en especial, cuando la característica que se investiga es de gran variedad,
lo cual, implica un tamaño maestral relativamente grande, en comparación al del muestreo
aleatorio estratificado.
En una muestra aleatoria estratificada, la población se divide en grupos relativamente
homogéneas con relación a la característica en estudio. Estos grupos se denominan estratos,
donde la unidad o el elemento investigado presentan una característica tal, que sólo le
permite pertenecer a un estrato.
Es necesario entender que en un estrato es un subpoblación y, como tal, cada uno se
constituye en dominio de estudio.
Los estratos pueden o no estar compuestos del mismo número de unidades, por tal razón la
fracción de muestreo puede variar de un estrato a otro.
Al conformar los estrato, lo primero que se debe considerar, siempre que sea posible, es la
característica de interés principal, que guarde relación con los objetivos de la investigación,
para lo cual deben elaborarse estratos que generen la mayor homogeneidad posible. Las
investigaciones de sondeo o las encuestas preliminares ayudar, no sólo a identificar las
características de la población, sino que permiten una buena estratificación.
Por lo que se logra:
- Una mayor precisión en los estimadores, a pesar de ser menor el número de unidades
seleccionadas, en comparación al M.A.S.
- Garantizar la representatividad y una reducción del error de la muestra, por
agrupación de aquellos elementos que se parecen más por la característica que se
investiga, que por pertenecer a la población.
- Las características de la población total quedan representadas, además, los errores
de muestreo que resultan de una M.A.S, serán mayores que la M.A.E del mismo
tamaño.
- Allegar información detallada para un grupo o estrato específico, ya que se logra
una muestra independiente de los demás estratos. De cada uno se obtienen

Lic. Emerson Damián Norabuena Figueroa


Página 48
Universidad Nacional “Santiago Antúnez de Mayolo”

promedios y varianzas separados mediante la ponderación, se calcula el valor del


estimador promedio y de la varianza.
- Dividir la población en grupos o estratos más o menos homogéneos en cuanto a su
composición interna, pero heterogéneos si se comparan los estratos entre sí.
- Ventajas administrativas.
Un plan de estratificación es óptimo, cuando se minimiza la desviación estándar del
estrato. Mientras más estratos se establezcan, tanto más homogéneos serán. Sin
embargo, para algunos autores, hay incrementos en los costos en consideración al
número de elementos que conlleva la muestra en cada estrato. Por otra parte, la
estratificación será efectiva, dependiendo de la estrecha relación que guarden los
factores de estratificación con las características que se investigan.
Las estimaciones podrán ser más precisas en la medida del tamaño de muestra por
estrato y, en especial, por la forma en que se realiza la selección de las unidades de la
muestra en cada uno de ellos.
Para su cálculo, se utilizan varios métodos:
 Muestras de igual tamaño, denominado también afijación igual, consistiendo en
seleccionar el mismo número de unidades para cada estrato muestral.
 Muestras de asignación o afijación proporcional, donde los tamaños muestrales
en cada estrato, tendrán un número de unidades en forma proporcional a las de
los estratos poblacional.
 Muestras de asignación o afijación óptima, cuyo tamaño estará determinado
teniendo en cuenta los costos y el grado de variabilidad, en tal forma que el error
de estimación sea mínima para un costo total dado.

Lic. Emerson Damián Norabuena Figueroa


Página 49
Universidad Nacional “Santiago Antúnez de Mayolo”

Lic. Emerson Damián Norabuena Figueroa


Página 50
Universidad Nacional “Santiago Antúnez de Mayolo”

Lic. Emerson Damián Norabuena Figueroa


Página 51
Universidad Nacional “Santiago Antúnez de Mayolo”

Etapas del M.A.E:

1) Definir la población de estudio.


2) Determinar el tamaño de muestra requerido.
3) Establecer los estratos o subgrupos.
4) Determinar la frecuencia relativa del muestreo de cada estrato, dividiendo el tamaño
del estrato entre el tamaño de la población de estudio.
5) Multiplicar la frecuencia relativa del muestreo de cada estrato por el tamaño de la
muestra total, para obtener de cada estrato la cantidad de individuos que se integrarán a dicha
muestra.
6) Seleccionar y extraer de cada estrato la cantidad de individuos que formaran parte de
la muestra total aplicando el procedimiento de muestreo aleatorio simple.

Lic. Emerson Damián Norabuena Figueroa


Página 52
Universidad Nacional “Santiago Antúnez de Mayolo”

Lic. Emerson Damián Norabuena Figueroa


Página 53
Universidad Nacional “Santiago Antúnez de Mayolo”

Lic. Emerson Damián Norabuena Figueroa


Página 54
Universidad Nacional “Santiago Antúnez de Mayolo”

Lic. Emerson Damián Norabuena Figueroa


Página 55
Universidad Nacional “Santiago Antúnez de Mayolo”

ANEXO 01

Área bajo la curva normal estándar. Los valores de la tabla que no se muestran en negrita
representan la probabilidad de observar un valor menor o igual a z. La cifra entera y el primer
decimal de x se buscan en la primera columno y el segundo decimal en la cabecera de la
tabla.

Lic. Emerson Damián Norabuena Figueroa


Página 56

You might also like