Professional Documents
Culture Documents
MUESTREO
01
Página 1
Universidad Nacional “Santiago Antúnez de Mayolo”
PLAN DE LA UNIDAD 01
Distribuciones Muestrales
Error de Error de
muestreo muestreo Errores y sesgo
El error Métodos de
La media de estándar muestreo
las medias
muestrales
Muestre
Aplicación
o
para una
Aleatori
distribució
El error o Simple
n normal
estándar
Muestreo
Aplicación El teorema Estratificado
para una del Límite
distribució Central
n muestral Muestreo
Sistemátic
Factor de o
El Correcció
teorema n por
del Límite Muestreo por
finitud conglomerados
Central
Factor de
Correcció
n por
finitud
Página 2
Universidad Nacional “Santiago Antúnez de Mayolo”
I. INTRODUCCIÓN
En el primer aspecto se observa que la estadística cubre dos aspectos de gran importancia:
la estadística descriptiva a través de la recolección, clasificación, presentación, ya sea en
forma de cuadros o gráficas, la aplicación de medidas como promedios, desviaciones, etc.,
y la interpretación y análisis de datos a fin de obtener conclusiones de forma deductiva de lo
general a lo particular.
La muestra, para que sea representativa de la población, requiere que todas las unidades de
la población tengan la misma probabilidad de ser seleccionadas, es decir, debe ser aleatoria,
al azar o probabilística.
Página 3
Universidad Nacional “Santiago Antúnez de Mayolo”
MARCO TEÓRICO
1.1. MUESTREO
Los problemas más corrientes que se presentan en la práctica, cuando se procede a investigar
las características de una población estadística es la imposibilidad de estudiar a cada uno de
los individuos u objetos que la conforman; por ello debemos depender de un subconjunto o
parte de la población como base para llegar a hipótesis relacionadas a varias características
o parámetros de ella. Por lo tanto, en estos casos resulta más conveniente por razones de
economía, tiempo y eficiencia analizar una muestra que es un número determinado de
individuos u objetos de la población y suponer que se pueden ver en ellos con cierto grado
de confianza lo que se quiere conocer acerca del universo de donde provienen.
El estudio de estos aspectos recae sobre la estadística inductiva o inferencial cuya finalidad
es obtener conocimientos sobre algún conjunto extenso de datos, a partir de muestras de los
mismos, que permitan la inferencia de los resultados estadísticos, los cuales representan
cálculos aritméticos realizados sobre los valores obtenidos de la muestra de la población que
ha sido seleccionada rigurosamente.
Para que estos datos estadísticos sean de utilidad tienen que presentar dos características
básicas:
1. Deben ser pertinentes; es decir, deben guardar una relación con el tema a investigar.
Por otro lado se podría afirmar que la tarea más importante de la estadística es la realización
de inferencia acerca de una población objetivo, con base en los resultados obtenidos a través
de una muestra.
Página 4
Universidad Nacional “Santiago Antúnez de Mayolo”
Hacemos un pequeña síntesis de los que consideramos que el estudiante debe recordar y
afianzar.
Para que una muestra sea aceptable desde el punto de vista del análisis estadístico deberá
reunir las siguientes características:
Es una muestra de un tamaño apropiado que ha sido escogida por procedimientos aleatorios
y se considera que las características observadas “representan” o corresponden a la población
de donde ella proviene.
c) La muestra debe ser bastante reducida para evitar gastos innecesarios y lo bastante amplia
para que el error de muestreo sea admisible y además debe reunir las exigencias de
eficiencia, representatividad, seguridad y flexibilidad.
Página 5
Universidad Nacional “Santiago Antúnez de Mayolo”
Estimador puntual, son las medidas descriptivas numéricas aplicadas a las características en
las unidades de la muestra. Se podrá decir que el estimador es una norma o método para
estimar una constante perteneciente a una población. La estimación hace referencia a los
valores numéricos de los parámetros poblacionales desconocidos, a los cuales se llega
mediante una muestra.
El estimador por intervalos, es una regla que nos indica cómo calcular dos puntos o valores
a través de una muestra. La estimación por intervalos es la estimación del parámetro
mediante la especificación de un intervalo de valor, determinado por un límite inferior y otro
superior (límites de confianza) dentro del cual estará comprendido el valor verdadero o
parámetro poblacional.
Página 6
Universidad Nacional “Santiago Antúnez de Mayolo”
Cuando la población sea infinita o tan grande que sea imposible la enumeración completa
de cada uno de los elementos o unidades.
Cuando la población tenga las mismas características tal que una muestra sea una imagen
aceptable de la misma población.
Con respecto a la parte técnica operacional y administrativa tenemos:
- Economía de tiempo y dinero
- Ampliación del alcance de una investigación.
- Mejor formación y control del personal que interviene en la investigación.
- Mayor control, calidad, rapidez y eficiencia en el procesamiento y publicación de
los datos.
Permite la verificación posterior a una investigación utilizando menor personal y otros
recursos.
- Mayor confiabilidad y precisión de los datos obtenidos.
Por otra parte, la aplicación del muestreo presenta algunas limitaciones comunes entre las
cuales tenemos:
- No permite hacer cálculos, proyecciones o tabulaciones con respecto a sectores
pequeños de una población o cuando se requiere información de cada elemento de
la población, ya que las dudas serían tan importantes que no es posible tener una
acertada predicción en base de la muestra.
- El cálculo de los resultados está sujeto a los errores del muestreo en sí y de errores
ajenos al muestreo.
- Las investigaciones completas ofrecen un margen más sólido y eficiente de exactitud
que los obtenidos en base a la muestra.
- En base a una muestra se dificulta la tabulación cruzada de algunas características
investigadas.
- Las probabilidades de error se multiplican en las diferentes operaciones y en las
complicaciones que surjan de su propio mecanismo.
- La preparación estadístico-matemática del muestrísta para el diseño eficiente de la
muestra en todas sus etapas.
Página 7
Universidad Nacional “Santiago Antúnez de Mayolo”
Los estadísticos muéstrales son valores que nos permiten estimar los parámetros
poblacionales. Se trata de valores calculados en la muestra que operan como referencia
empírica del valor desconocido correspondiente a la población.
En virtud de la función que cumplen, los estadísticos muéstrales son conocidos como
estimadores. En principio pueden obtenerse infinitos valores para estimar un parámetro
poblacional existirá un estadístico muestral que es su mejor estimador.
Nótese que un estimador es un suceso aleatorio que se asume diversos valores con
probabilidades distintas. En efecto, en cada muestra de tamaño n extraída de una población
de tamaño N, el estimador asumiría un valor diferente. En consecuencia, un estimador
varía en forma aleatoria en torno al parámetro poblacional. Así, por ejemplo, la media
muestral de cada una de las muestras se aproxima en distinto grado al valor parámetro
poblacional.
Para desempeñarse de manera confiable, los estimadores deben ser insesgados, eficientes,
consistentes y suficiente. Cada propiedad se discute a su tiempo con esta sección de
estudio.
el valor del parámetro poblacional. Se dice que una estadística 𝜽es un estimador insesgado
𝝁𝜽= 𝑬(𝜽
)= 𝜽
1.5.1.2. Estimador consistente
Página 8
Universidad Nacional “Santiago Antúnez de Mayolo”
𝑷(|𝑿− 𝝁| > 𝓔
La probabilidad que la diferencia entre la media muestral y el parámetro poblacional sea
mayor que un número cualquiera 𝓔 tiende a 0 cuando el tamaño de la muestra tiende al
tamaño de la población.
𝑬� � �= 𝑣𝑎�(𝑒�𝑖�)
Se puede conocer el estimador de varianza mínima utilizando la desigualdad de Cramer –
Rao. Se demuestra mediante este procedimiento que la media muestral es un estimador
eficiente de la media poblacional.
Página 9
Universidad Nacional “Santiago Antúnez de Mayolo”
Existen varias clases de muestreo, que se resumen en dos grandes grupos: muestreo
probabilístico y no probabilístico.
Probabilístico
- Muestreo aleatorio simple
No probabilística
- Muestreo de convivencia
- Muestreo por juicio u opinión
- Muestreo por cuotas
- Muestreo por bola de nieve
- Muestreo discrecional
Si bien los dos métodos son distintos, cuando el tamaño de la población es infinito o tan
grande que pueda considerarse como infinito, ambos métodos llegan a las mismas
n
conclusiones. Si la fracción de muestreo es mayor de 0.1 (se muestrea más del 10 % de
N
la población) la diferencia entre ambos métodos puede ser apreciable, llegando a
conclusiones contradictorias según se aplique un método u otro.
𝑁
M=( )= , cuando la selección se hace sin reposición
�
𝑛 (�− �) �
Teorema: Dada una población, si extraemos todas las muestras posibles de un mismo
tamaño, entonces la media de la distribución de todas las medias muestrales posibles, será
igual a la media poblacional.
El teorema del límite central: las medias de muestras grandes y aleatorias son
aproximadamente normales
Distribución uniforme
Medias de las muestras
Una población que sigue una distribución uniforme es simétrica, pero marcadamente no
normal, como lo indica el primer histograma. Sin embargo, la distribución de 1000 medias
de la muestra (n=5) de esta población es aproximadamente normal debido al teorema del
límite central, como lo demuestra el segundo histograma. Este histograma de medias de la
muestra incluye una curva normal superpuesta para ilustrar esta normalidad.
Una población que sigue una distribución exponencial es asimétrica y no normal, como lo
demuestra el primer histograma. Sin embargo, la distribución de medias de la muestra de
1000 muestras de tamaño 50 de esta población es aproximadamente normal, debido al
teorema del límite central, como lo demuestra el segundo histograma. Este histograma de
medias de la muestra incluye una curva normal superpuesta para ilustrar esta normalidad.
De a cuerdo con el teorema del límite central, la variante Z para distribuciones de medias
muestrales será(estandarización de la muestra) :
𝑋−𝜇𝑥 𝑋−𝜇
z = =
𝜎𝑥
𝜎/√�
Por la cual consideramos que se aproxima a
una distribución normal
Aplicación de estudio
𝐸1 : La altura media de 400 alumnos de un plantel de secundaria es de 1,50 mts, y su
desviación típica es de 0,25 mts. Determinar la probabilidad de que en una muestra de 36
alumnos, la media sea superior a 1,60 mts.
Datos:
N = 400 𝜇 = 1.50
n = 36 𝜎 = 0.25
�= 1.60
Solución
= 1 – 0.9918
= 0.0082
Por lo tanto la probabilidad de que en una muestra de 36 alumnos del colegio “Nuestra señora
del Sagrado Corazón de Jesús” se superior a 1.60 es de 0.0082.
Datos:
Datos:
Aplicaciones Propuestas
Aplicación Propuesta
TAMAÑO DE LA MUESTRA
Las tablas de números aleatorios son tablas de números colocados de tal forma que no exista
ninguna relación entre ellos sea cual sea el sentido en que los leamos. Al final de los
contenidos teóricos de este tema aparece una tabla de números aleatorios.
��=
p = Probabilidad de éxito
q = (1 – p) = Probabilidad de fracaso
1 – α = Nivel de confianza
e = error de diseño
El tamaño de error depende del investigador que está dispuesto a aceptar, caso contrario
está más allá del control del investigador (no hay nada que se pueda hacer sobre la varianza
de la población), sí es posible limitar el tamaño de error.
El tamaño de error que el investigador puede tolerar, depende de qué tan crítico es el
trabajo. Algunas tareas extremadamente delicadas requieren de resultados exactos: lo
procedimientos médicos vitales de los cuales dependen vidas humanas, o la producción de
piezas de una máquina que deba cumplir medidas precisas, pueden tolerar sólo un pequeño
error. En otros casos, los erros más grandes pueden tener consecuencia menos grave.
Parámetro: Son las medidas descriptivas numéricas aplicadas a las características en las
unidades de la población. También se les denomina como valores estadísticos de la
población
Estimador puntual, son las medidas descriptivas numéricas aplicadas a las características
en las unidades de la muestra. Se podrá decir que el estimador es una norma o método para
estimar una constante perteneciente a una población. La estimación hace referencia a los
valores numéricos de los parámetros poblacionales desconocidos, a los cuales se llega
mediante una muestra.
El estimador por intervalos, es una regla que nos indica cómo calcular dos puntos o valores
a través de una muestra. La estimación por intervalos es la estimación del parámetro
mediante la especificación de un intervalo de valores, determinado por un límite inferior y
otro superior (limites de confianza) dentro del cual comprendido el valor verdadero o
parámetro poblacional.
La probabilidad de que un intervalo de confianza contenga el parámetro que se estima, se
denomina coeficiente de confianza.
𝑵
- Estandarización de la media de la muestra
𝝈� 𝝈
Error estándar de la media =
√�
Nota: En general se cumple que al aumentar la precisión, es decir, al disminuir el grado
de error, aumenta el tamaño de muestra necesaria. En el caso de proporciones, el error se
expresa como un porcentaje del valor que puede tener el parámetro, es decir, 5% o 6%, en
caso se habla de precisión relativa.
Solución:
N =
1–α = Z=
e =
p =
q =
Ejemplo 02: La empresa I-STATIC S.A.C está considerando comprar máquinas para
hacer nieve y ayudar a la Madre Naturaleza a proporcionar una base apropiada para los
turistas nacionales y extranjeros. Si el promedio de nevados parece ser insuficiente, piensa
que la máquina debería pagarse muy pronoto por sí misma. Para lo cual Planea estimar las
pulgadas promedio de nieve que cae en el área, pero no tiene idea qué tan grande debería
ser la muestra. Sólo sabe que desea un 99% de confianza en sus hallazgos y que el error no
debe exceder de 1pulgada. El Gerente les promete tiquetes gratuitos de temporada para el
ingreso a los turistas ¿Realice los cálculos pertinentes para el proyecto piloto?
Nota: Se realiza dicho proyecto a partir de una muestra piloto que produce una desviación
estándar de 3.5 pulgadas.
Solución:
N =
1–α = Z=
e =
p =
q =
Solución:
N =
1–α = Z=
e =
p =
q =
Aplicaciones Propuestas
a) La empresa I-STATIC, pretende investigar el consumo y el ingreso de la
población de Huaraz – Independencia. Se seleccionaron 14 familias que
formarán la muestra piloto del estudio de investigación (la población está
numerada desde 001 hasta 355), sin tener en cuenta números superiores o
repetidos. Del cual se obtuvo los siguientes resultados:
Selección de muestras (aleatorias)
335 004 289 128 097 271 253
348202 349 197 018 020 207
- Información obtenida mediante Encuesta Preliminar o piloto.
a. Ingreso promedio : �=
e = 0.05( ) =
𝑺� = ∑ 𝒊�− ��
�
�
�− �
�
�𝒔�
��= 𝐞�
��
n = � −�
�+( � )
𝑵
𝑵��𝒔�
�=
𝐍𝐞�− ��𝒔�
- También se puede calcular mediante :
n = 𝒔�
𝐞 𝒔�
( )+ ( )
� 𝑵
�=
e = 0.05 ( ) =
𝑺� = ∑ 𝒊�− ��
�
�
�− �
�
�𝒔�
��=
𝐞�
��
n = � −�
�+( � )
𝑵
𝑵��𝒔�
�=
𝐍𝐞�− ��𝒔�
- También se puede calcular mediante :
n = 𝒔�
𝐞 𝒔�
( )+ ( )
� 𝑵
𝑥
d. Proporción de familias con vivienda propia
P=
Cuestionario:
- Decir si es cierto o falso a los siguientes puntos:
a. Población estadística, es un conjunto de elementos que representan una
característica común.
b. Una población finita es aquélla que está formada por un limitado
número de elementos que representan un característica que está
formada por un límite número de elementos que representan una
característica (cualitativa o cuantitativa), común.
c. La muestra aleatoria puede no ser representativa del universo o
población de la que se extrajo.
d. El método de selección al azar, no está basada en el cálculo de las
probabilidades.
e. La muestra, es obtenida con el fin de investigar, a partir del
conocimiento de sus características particulares, las propiedades de
toda la población.
f. Una de las ventajas del muestreo, es el de mayor control de la
integralidad y calidad de la enumeración.
Estadísticos Muéstrales:
Varianza Muestral:
Estimador de la Población 𝝁 :
Aplicación Propuesta
ANEXO 01
Área bajo la curva normal estándar. Los valores de la tabla que no se muestran en negrita
representan la probabilidad de observar un valor menor o igual a z. La cifra entera y el primer
decimal de x se buscan en la primera columno y el segundo decimal en la cabecera de la
tabla.