UNIVERSIDAD DE LOS ANDES

FACULTAD DE CIENCIAS ECONÓMICAS Y SOCIALES
ESCUELA DE ESTADÍSTICA

CURSO DE MUESTREO

Prof. Elizabeth Torres Rivas

Mérida, Junio 2004

2

INDICE

INTRODUCCIÓN 3

TEMA 1. ORGANIZACIÓN DE UNA INVESTIGACIÓN POR MUESTREO DE
ENCUESTA 4

VENTAJAS MUESTREO VS. CENSO. (VENTAJAS MUESTREO VS. CENSO) 5
TIPOS DE ENCUESTA POR MUESTREO 5
DISEÑO DE ENCUESTAS 6
DISEÑO DE CUESTIONARIOS 6
CONCEPTUALIZACION Y DISEÑO DEL INSTRUMENTO 7
FORMATO DE PRESENTACIÓN DEL CUESTIONARIO 8
SECUENCIA Y ORDENAMIENTO DE LAS PREGUNTAS 10
REPRODUCCIÓN DEL CUESTIONARIO 10
TIPOS DE MUESTREO 13
TIPOS DE MUESTREO PROBABILÍSTICO 14

TEMA 2. MUESTREO ALEATORIO SIMPLE 16

PROBABILIDAD QUE TIENE UNA UNIDAD DE PERTENECER A LA MUESTRA
17
ESTIMACIÓN DE LA MEDIA Y EL TOTAL 19
ESTIMACIÓN DE LA MEDIA POBLACIONAL 21
ESTIMACION DEL TOTAL POBLACIONAL  23
FORMAS DE CALCULAR ESTIMACIONES DE  2 25
ESTIMACIÓN DE LA PROPORCIÓN P 25
VENTAJAS DEL MUESTREO ALEATORIO SIMPLE 29
DESVENTAJAS DEL MUESTREO ALEATORIO SIMPLE 29

TEMA 3. MUESTREO ESTRATIFICADO 29

RAZONES PARA ESTRATIFICAR 29
¿CÓMO SELECCIONAR UNA MUESTRA ALEATORIA ESTRATIFICADA? 30
ESTIMACIÓN DE LA MEDIA 30
ESTIMACIÓN DEL TOTAL 33
ASIGNACIÓN DE LA MUESTRA 38
TIPOS DE ASIGNACIÓN. 38

TEMA 4. MUESTREO POR CONGLOMERADOS 47

¿CÓMO SELECCIONAR UNA MUESTRA POR CONGLOMERADOS? 48

ESTIMACIÓN DE LA MEDIA POBLACIONAL 49 ESTIMACIÓN DEL TOTAL POBLACIONAL 50 ESTIMADOR DE LA PROPORCIÓN 53 BIBLIOGRAFÍA 55 2 .

Demasiado poca información le impide realizar buenas estimaciones. 3 . esto no siempre es posible. Bajo costo. Es una técnica inductiva para estimar totales o promedios. Este conjunto de elementos es lo que se denota con el nombre de población o universo estadístico. con información muestral. mientras que mucha información ocasiona un despilfarro de dinero. proceso que recibe el nombre de muestreo. o que la población tenga infinitos elementos. ya sea porque es costoso. INTRODUCCIÓN En toda investigación estadística existe un conjunto de elementos sobre los que se toma información. el investigador debe determinar que tanta información debe comprar. Toda sociedad requiere INFORMACIÓN  toma de decisiones. El medio para la inferencia es la MUESTRA. requiere mucho tiempo. Oportuna (tiempo) 3. La estimación puede ser tan exacta como queramos al incrementar el tamaño de la muestra. Ya que la información cuesta dinero. decimos que se realiza un censo. Puede ser acompañada por un límite de error de estimación o bien expresada como un intervalo de confianza. Estadística moderna es una teoría de la información con la inferencia como su objetivo. El objetivo de la mayoría de las investigaciones estadísticas consiste en hacer generalizaciones válidas. Sin embargo. Censo Método de búsqueda de información Muestreo ¿Qué es el muestreo?. Calidad Confiable 2. Cuando se toma información de todos y cada uno de los elementos de dicha población. CARACTERÍSTICAS DE LA INFORMACIÓN Suficiente 1. o bien porque la toma de información lleve consigo la destrucción de los elementos en cuestión. Este problema hace que el investigador tome la información de una parte de la población. acerca de poblaciones de las cuales provienen las muestras.

Agricultura.3. Ejemplo: . comportamientos del colectivo). . los otros realizan ENCUESTAS. determinación del tamaño de muestra y la inferencia estadística. 4. TEMA 1. sobre todo requisito fundamental para las asignaturas de Análisis de Datos y Análisis Multivariante. Mano de obra. . 4. 4. administración. Diseñar los instrumentos o cuestionarios de la encuesta.2. el cual consiste en el método de selección de la muestra. se va haciendo especial énfasis en los aspectos conceptuales y analíticos. . Inferencias. Diseño de la muestra. La necesidad de recopilar datos surge en todo campo de la actividad humana. Población. 3. Este curso es de particular interés para los alumnos de la Licenciatura de Estadística. . Los físicos realizan EXPERIMENTOS. 4. Justificación Se presenta de forma intuitiva una introducción general a los métodos de muestreo y gradualmente. Con la investigación por muestreo se persigue encontrar perfiles de la población (medidas. Industria. Economía de adquirir una cantidad específica de información. Determinación de tamaño de muestra.¿Qué se pretende con el curso muestreo? Objetivos del Curso: 1. La finalidad de una encuesta por muestreo es obtener información para satisfacer una necesidad definida. Comercio Interno. sociales. 4 . economía. El muestreo abarca 3 grandes áreas. comercio. Tipos de muestreo  para científicos.1. resumen. Determinación de tamaños de muestra con error especificado. ORGANIZACIÓN DE UNA INVESTIGACIÓN POR MUESTREO DE ENCUESTA La encuesta por muestreo es una metodología que abarca más allá del muestreo propiamente dicho. ciencias forestales. No se persigue encontrar características personales. 2.

VENTAJAS MUESTREO Vs. Recolección de la Información. Se emplean técnicas multivariantes. Un censo completo no revela el margen de incertidumbre al cual está sometido. es decir. 2. Planificación. Estimar validamente el margen de error y decidir si los resultados son suficientemente exactos. Analíticas. 3.Una investigación por muestreo se puede dividir en 3 etapas básicas: 1. b. OBJETIVOS Descriptivas: Permiten describir el comportamiento del fenómeno en estudio. Sirven de base para estudios posteriores y requieren un análisis descriptivo. Mayor exactitud. TIPOS DE ENCUESTA POR MUESTREO Según el objetivo que se persiga en la investigación por muestreo. CENSO. Mayor rapidez (El muestreo emplea menos tiempo en recopilar y procesar los datos que el censo). 2. Exploratorias. Costo reducido (Los gastos son menores que los que se realizarían si le lleva a cabo un censo). las encuestas se clasifican en: 1. c. En poblaciones pequeñas  censo. Exploratorias: proporcionan un mecanismo de búsqueda cuando se está comenzando a indagar sobre un tema particular. 3. En el censo surgen más errores por la complejidad y magnitud del trabajo. es posible capacitarlos mejor y supervisar su trabajo. Ejemplo: número de hombres que ven televisión. d. a. 5 . Analíticas: aquellas que permiten hacer comparaciones entre subgrupos de una población para averiguar si existen ciertas diferencias entre ellos y formular o verificar hipótesis sobre sus causas. El muestreo emplea personas de mayor calibre. Se espera que una encuesta bien empleada produzca resultados más exactos que el censo. con ellas se puede conocer cierta información sobre grandes grupos. Descriptivas. Análisis de los resultados.

Los objetivos de la encuesta deben definir la población que se quiere cubrir. Nominal. por qué. Ordinal. Definición de Objetivos. DISEÑO DE ENCUESTAS Formulación del problema de investigación. La primera tarea es fijar en términos concretos los objetivos de la encuesta. es decir. Atributos: De acuerdo a los atributos la variable se clasifica en: Cuantitativas Discretas Continuas Tipos de Variables Cualitativas Nominal o Categóricas Ordinal Escalas de Medición. Razón o proporción. . Intervalo. . para qué y cómo. Variable: función real valorada. definir el qué. . Característica que puede tomar diferentes valores. Cobertura: población que se cubrirá. DISEÑO DE CUESTIONARIOS 6 . VARIABLES Y ATRIBUTOS INVOLUCRADOS EN LAS HIPÓTESIS. . Se refiere al planteamiento del problema a investigar.

El objetivo fundamental de realizar una encuesta piloto es probar la validez. Deben evitarse las preguntas que orientes respuestas. Es importante cuidar el lenguaje en relación al público que está dirigido la encuesta. Las preguntas deben ser claras. Una pequeña prueba previa siempre es útil para decidir sobre un método efectivo para plantear las preguntas. se determina la composición final del cuestionario. Las preguntas vagas no proporcionan respuestas claras. correo.El cuestionario es una parte muy importante de la encuesta por muestreo. Se debe evitar preguntas que induzcan respuestas y también. Tipos de cuestionarios  Autoadministrado  Entrevistas  Por teléfono. determinar costos y tamaño de muestra de la encuesta. También. Una vez probado el instrumento. Como éstas podrían depender en alguna medida del ORDEN en que se hacen la preguntas. Se recomienda que no contenga más de 20 palabras. Todos términos técnicos que se utilizan deberán ser definidos adecuadamente. El número de preguntas esta asociado inversamente a la tasa de respuesta. 39). Prueba Piloto. confiabilidad y precisión del cuestionario o instrumento de medición. Debe ser en positivo la redacción de la pregunta. tiene como propósito. el problema de su presentación requiere considerable habilidad. Habiendo decidido cuál es la información que se desea obtener. sin ambigüedades. 7 . sin ambigüedades y al punto. (Des Raj. se debe tener cuidado si el orden de la preguntas induce a las respuestas. debe considerarse también su orden. Preguntas referentes a temas sensibles. personal —> inspección Tipos de Preguntas  Abiertas  Cerradas  Selección Múltiple  Selección dicotómica Redacción de las Preguntas Debe ser clara.

tales conceptos generales deben ser especificados. poder. Para permitir rigurosa investigación. educación. Ejemplo: Estatus social puede ser definido por varios elementos: ingreso. ya que el N° de preguntas está asociado inversamente a la tasa de repuesta. indicadores empíricos. Operacionalización.Validez:  Validez de Contenido  Validez de Constructo FORMATO DE PRESENTACIÓN DEL CUESTIONARIO El formato del cuestionario debe ser tan importante como la naturaleza y redacción de las preguntas.Precisión . deben ser reducidos para especificar.Confiabilidad . Los conceptos son codificados generales de la experiencia y observaciones. riqueza. esto es. . 8 . CONCEPTUALIZACION Y DISEÑO DEL INSTRUMENTO En la investigación por muestreo. .Operacionalización es el proceso mediante el cual los investigadores especifican observaciones empíricas que pueden ser tomados como atributos contenidos dentro de un concepto dado. En ciencias tales conceptos toman la forma de variables que traen una colección de atributos relacionados. a fin de garantizar la adquisición de información de calidad. prestigio ocupacional. Lógica de Conceptualización. estatus familiar y valores morales. Se debe evitar:  Cuestionarios demasiados largos. CALIDAD DE LA MEDICIÓN Los elementos siguientes deben ser considerados en el diseño de la encuesta. Una inapropiada presentación del cuestionario puede conducir a respuestas erróneas. sin embargo. esos conceptos deben ser convertidos en preguntas en un cuestionario que permite la recolección de los datos empíricos relevantes para analizar.

A menudo.  Demasiadas páginas del cuestionario —> que el entrevistado sienta que gasta poco tiempo en responder el cuestionario. en Desacuerdo (D).  Cuestionario muy comprimido en espacio son desastrosos. Típico caso es el de escala Likert. No sabe Preguntas Contingencia A menudo en una encuesta.. Ud.. Estas segundas preguntas deben ser indentadas sobre el cuestionario. Completamente en Desacuerdo (CD) o Indeciso (I). Ejemplo: 17. está completamente de Acuerdo (CA). No [ ] No sabe ( ) No sabe 3. indique si Ud. Preguntas Matriz. Pregunta de Contingencia: significa que la segunda pregunta es un contingente. ciertas preguntas serán claramente relevantes solo para un subconjunto de respondientes. La segunda pregunta se debe evitar que comience ¿ Si. deseará preguntar varias cuestiones que tengan el mismo conjunto de categorías de respuesta. Formatos para respuestas [ ] Si ( ) Si 1. Acuerdo (A). condicionalmente porque puede inducir a respuesta. Al lado de cada afirmación que se presenta más abajo. CA A D CD I 9 . cuya respuesta depende de la primera.. Varias preguntas en una sola línea.. Si [ ] No ( ) No 2.  Preguntas abreviadas. El uso apropiado de estas preguntas puede facilitarle al respondiente la tarea de responder el cuestionario y también puede mejorar la calidad de los datos producidos. encerradas en cajas y conectadas con la pregunta base a través de flechas.

Este país necesita más leyes y orden [ ] [ ] [ ] [ ] [ ] b. Preguntas referentes a temas sensibles. Existen algunos peligros inherentes al uso de este formato como: Los respondientes pueden desarrollar algún patrón de respuesta. Durante los disturbios se deben [] [] [] [] [] disparar perdigones a los saqueadores. La solución más segura es la sensibilidad del problema. INSTRUCCIONES 10 . proporcionara mejores datos. La política debe ser el desarme. moral o espiritual del encuestado. Se deben evitar las preguntas directas que comprometan la integridad física. un cuestionario nítidamente reproducido indicará a una alta tasa de respuesta y así. Por ejemplo. así como toda la actividad de recolección. y los cuales dependerán de los recursos disponibles. la presencia de una pregunta puede afectar las respuestas dadas en las siguientes preguntas.a. si es autoadministrado o entrevista. Varios métodos están disponibles. usualmente es mejor comenzar el cuestionario con el conjunto de preguntas más interesantes. SECUENCIA Y ORDENAMIENTO DE LAS PREGUNTAS El orden en el cual las preguntas son presentadas pueden afectar las respuestas. [] [] [] [] [] c. En el primer caso. El orden de las preguntas depende el tipo de cuestionario. Las preguntas de identificación se deben dejar por el final de la encuesta. emocional. Se debe construir más de una versión del cuestionario que contenga diferentes ordenamientos de las preguntas. Algunos investigadores intentan este efecto "aleatorizando" el orden de las preguntas. Las preguntas iniciales no deben ser amenazantes. facilidades locales y tiempo. REPRODUCCIÓN DEL CUESTIONARIO El método de reproducción del cuestionario es importante para el logro de éxito del estudio.

d. mapa. 11 . Selección de la muestra  objetivo del curso. Lista. Instrucciones Generales Cada cuestionario autoadministrado debe comenzar con instrucciones básicas para seguir su completación. Caso de respuestas múltiples. Población bajo muestreo: los objetivos de la encuesta deben definir la población que se quiere cubrir. Algunas preguntas pueden requerir instrucciones específicas para facilitar la respuesta apropiada. debe contener instrucciones claras y comentarios introductorios donde sean apropiados. Introducciones Si el cuestionario esta organizado de acuerdo al contenido de subsecciones. Para los propósitos de la selección de la muestra debe ser posible dividir a la población en unidades de muestreo. La palabra población se emplea para denominar el conjunto del que se elige la muestra. Población objetivo  Población muestreada Pueden coincidir (es más restringida) c. que sirve como guía al universo que se cubrirá. Instrucciones para el entrevistador Proporcionar instrucciones claras en el lugar apropiado para los entrevistadores. es útil introducir cada sección oraciones cortas relacionadas con el contenido y propósito. La población que se procura cubrir será por lo general diferente de la que en realidad es objeto de muestreo. si es autoadministrado o si es administrado por el encuestador. debe examinarse que esté libre de defecto y actualizada. No aclarar la finalidad de la encuesta disminuirá su valor en última instancia. Implica la definición de lo que es población y de sus elementos. Fijar en términos concretos los objetivos de la encuesta. Evitar ambigüedades. ETAPAS PRINCIPALES INVESTIGACIÓN POR MUESTREO  PLANEACIÓN Y EJECUCIÓN DE UNA ENCUESTA a. El marco. Objetivos de la encuesta. Unidad de muestreo. e. Los resultados que se obtengan serán aplicados a la población muestreada.Cada cuestionario. Instrucciones Específicas. b. El encuestador debe ser capaz de decidir en el campo sin demasiados titubeos si un caso dudosos pertenece o no a la población.

Dicho análisis se realiza según el plan de tabulaciones diseñado y las técnicas estadísticas propuestas para cumplir con los objetivos previstos en la investigación. l. k. Un cuestionario demasiado largo produce una baja general en la calidad de los resultados. i. La capacitación de los entrevistadores y supervisión. a sí se eliminará información no pertinente. Resultados  incertidumbre  Muestra Errores en las mediciones deseadas. Información que se recopilará.f. Cuestionario u hoja de encuesta. Método de obtener la información. Las preguntas deben ser claras y sin ambigüedades y al punto. g. Referencia de tiempo y período de referencia. Preguntas control. . . Control de calidad de la información. Qué información se busca obtener debe ser considerada en una de la primeras etapas de planeación de a encuesta. j. La falta de certeza se reduce al tomar muestras grandes y emplear mejores dispositivos.Encuestas por teléfono. Personas que se rehúsan responder. Prueba piloto. Deben evitarse preguntas que orienten las respuestas. instrucciones detalladas en los métodos que se emplearán las mediciones.Encuestas con preguntas abiertas y/o cerradas. m.Período de referencia: período para el cual se obtiene la información de las unidades de muestreo. Elaborarse procedimientos para tratar con quienes no respondan. Definir los términos técnicos adecuadamente.  PRESENTACIÓN Y ANÁLISIS DE DATOS. Grado de precisión deseado. Lo práctico es preparar BOSQUEJOS de los cuadros que debe producir la encuesta. Con función de la información a obtener  definir presentación encuesta.Entrevistas. . Inspección de la información entregada. Sólo deben de tenerse datos de interés para los propósitos de la encuesta. Implica costos y tiempo. . Orden de preguntas. Cuestionarios precodificados. . . Es mejor especificar el grado de precisión deseado. correo o visitas personales. h.Encuesta que emplea un cuestionario autoadministrado. 12 .Referencia de tiempo (período al que pertenecerán los resultados de la encuesta).

En esta última etapa se redacta el informe contentivo de los resultados de la investigación por muestreo y se ejecuta el plan de publicación de los mismos. . la Unidad de muestreo = Unidad elemental. Un conjunto finito o infinito de elementos. CONCEPTOS GENERALES Población: es una colección de objetos acerca de los cuales deseamos hacer alguna inferencia. Encuesta sobre Ingreso Familiar  Unidad de muestreo: vivienda. Definida Es la población de donde se extrae la por los objetivos de la encuesta. Es la muestra. Encuesta de Viviendas  Unidad de muestreo: manzanas definidas de tal manera que cada vivienda no pueda ser muestreada más de una vez y que cada vivienda tenga una oportunidad de ser seleccionada en la muestra. aplicados a la población muestreada. por tanto. También es la unidad donde realizamos la muestra. En el muestreo de elementos cada unidad de muestreo contiene un solo elemento. Ejemplo: . Unidad elemental: votantes. Marco muestral: es una lista de todas las unidades de muestreo. Los colección completa de observaciones que resultados que se obtengan serán deseamos estudiar. es más restringida. Unidades de muestreo: son colecciones no traslapadas de elementos de la población que cubran la población completa. Muestra: es un subconjunto de la población. Otra definición es: colecciones o grupos no solapados de unidades elementales. 13 . INFORME Y PUBLICACIÓN DE RESULTADOS. una muestra aleatoria es una sucesión de variables aleatorias independientes e idénticamente distribuidas. Elemento o unidad elemental o unidad de observación: objeto sobre el cual se realizan las mediciones de la característica. Proporción de votantes que favorecieron la emisión de bonos  Unidad de muestreo: hogares. POBLACIÓN OBJETIVO POBLACIÓN MUESTREADA Población que se pretende cubrir. Es una colección de unidades seleccionadas de un marco o de varios marcos. En una población infinita. Es un objeto en el cual se toman las mediciones. .

Y. TIPOS DE MUESTREO PROBABILÍSTICO 1) Muestreo Irrestricto Aleatorio. 2. Muestra Muestreo Inferencia Estimaciones Y . 7) Muestreo Mixto. 5) Muestreo Bietápico. Controlar la precisión de las estimaciones muestrales dentro de ciertos límites fijados con anticipación y con cierto grado de confianza. 3) Muestreo Sistemático.Sin norma circunstancial o errático . Muestreo Aleatorio: Consiste en asignar a cada elemento poblacional una probabilidad no nula.por cuotas: a conveniencia adminis-trativa o económica.Intencional u opinático (representatividad subjetiva) .a capricho o comodidad. Muestreo No Probabilístico: . 6) Muestreo Polietápico. 4) Muestreo por Conglomerados o por Áreas. ¿CÓMO SELECCIONAR LA MUESTRA?.Juicio: el investigador emplea su propio juicio para elegir la muestra. Con este muestreo podemos hacer estimaciones de las magnitudes de los errores de muestreo (valor estimado  Valor poblacional ). . Muestreo Probabilístico: Cuando de antemano se conoce la probabilidad asociada a cada muestra posible. de ser seleccionado. 2) Muestreo Estratificado. . total 14 . El objetivo del muestreo es estimar parámetros de la población. tales como media. el total y proporción basándose en la información contenida en la muestra. TIPOS DE MUESTREO 1.

Población
Tamaño de muestra controla la cantidad de
información a extraer

ˆ : Estimador. Medida estadística que describe cierta característica numérica
de una muestra, siendo una magnitud variable de una muestra a otra.

 : Parámetro. Medida estadística que describe cierta característica numérica
de una población y que se considera constante y desconocida.

¿Cómo podemos determinar cual procedimiento usar y el número de observaciones a
incluir en la muestra?. La respuesta depende de cuanta información se desee obtener. La
cantidad de información obtenida en la muestra depende del número de elementos
muestreados y de la cantidad de variación en los datos. Debemos fijar un límite para el
error de estimación menor que B.

Error de estimación = ˆ    B = errores en el muestreo.
B  e  límite de error de estimación.

 
Pr ˆ    e  1  
El límite de error de estimación viene generalmente expresado en unidades de ˆ
e  t ˆ = error máximo admisible. t  es dado a función 1-  ; 1-  = coeficiente
confidencial.

El error de estimación se debe a que una muestra no proporciona información completa
sobre una población. Esta clase de error se llama error de muestreo, el cual puede ser
controlado por un diseño cuidadoso de la encuesta.

El margen de error dado en las encuestas es un expresión del error de muestreo, el cual
resulta al considerar una muestra y no al examinar toda la población (Lohr, 2000, p. 15)

ERRORES AJENOS AL MUESTREO

Son aquellos que no se deben al muestreo, los cuales no se pueden atribuir a la variabilidad
entre las muestras (Lohr, 2000) e influyen en la validez y confiabilidad de las estimaciones.
Se pueden clasificar en:
a) Sesgos de estimación: debido al uso inadecuado de un estimador. Cuando se utilizan
estimadores sesgados. Mal uso por parte del investigador.
b) Sesgos de selección: errores cometidos cuando el proceso de selección de la muestra
no es totalmente aleatorio; pues incluye elementos opináticos y erráticos. Este ocurre
cuando alguna parte de la población objetivo no está en la población muestreada.

15

c) Sesgo de medición: ocurre cuando el instrumento con el que se mide tiene una
tendencia a diferir del valor verdadero en alguna dirección. Este debe ser minimizado
en la etapa de diseño de la encuesta (Lohr, 2000).
d) Errores de observación o de medida: son el resultado de la interacción entre el
observador, el instrumento y el individuo medido (sustituciones fortuitas pueden
sesgar los resultados).
e) Errores por omisión: se refiere a la no respuesta, inaccesibilidad del elemento, o
pérdida del dato.
f) Equivocaciones en el diseño de la encuesta.

Exactitud: se refiere a la magnitud de las desviaciones respecto a la media verdadera .
Precisión: se refiere a la magnitud de las desviaciones respecto a la media Y muestral.
TEMA 2. MUESTREO ALEATORIO SIMPLE

En una muestra aleatoria simple cada unidad o elemento de la población tiene una
probabilidad de selección conocida; se emplea un método aleatorio para elegir las unidades
a incluir en la muestra (Lohr, 2000). Los elementos o unidades podrán ser seleccionados de
dos formas: con o sin reposición.

En el muestreo aleatorio simple con reemplazo o con reposición una unidad o elemento se
puede incluir más de una vez en la muestra; mientras en el muestreo sin reemplazo o sin
reposición, todas las unidades en la muestra son distintas.

Una muestra aleatoria con reposición, de tamaño n obtenida de una población de N
unidades, se puede pensar como la extracción de n muestras independientes de tamaño 1.
Cada unidad se extrae de la población al azar, por ser la primera unidad muestreada, con
una probabilidad de 1/N, la cual se reemplaza en la población, y siguiente unidad se
selecciona al azar con una probabilidad de 1/N. Este procedimiento se repite hasta que la
muestra contenga las n unidades y puede tener duplicados.

16

El muestreo aleatorio sin reemplazo o sin reposición de poblaciones finitas se conoce con el
nombre de muestreo irrestricto aleatorio, el cual consiste en la selección de n elementos

1 n!N n!
sacados de una población con N unidades, de modo que todas las muestras posibles

N SP )(  
(distintas)   de tamaño n tengan la misma probabilidad de ser seleccionada  N  N! .

n   
n 
P  S  es la probabilidad de elegir cualquier muestra individual S de n unidades.

La probabilidad de la muestra también puede calcularse utilizando el cálulo de
probabilidades:
n
1ª selección probabilidad
N
n 1
2ª selección probabilidad
N 1

Luego, la probabilidad de selección de una muestra P S  es:

n (n  1) (n  2) 1 n (! N  n)! 1
P( S )  . . . .  
N (N  1) (N  2) (N  n  1) N!  N 
 
n 
Otra forma de calcularla es la que se presenta a continuación. Sea la muestra
S   u1 , u 2 ,..., u n  , luego su probabilidad es una probabilidad condicional,

P S   P u1 , u 2 ,..., u n   n! P  u1 , u 2 ,..., u n    n! P u1  P u 2 / u1  P u 3 / u1u 2 ...P u n / u1u 2 ...u n 1 

17

la muestra S   u1 .. Sin reposición: las unidades pueden ser seleccionadas una sola vez. 1 1 1 1 1 n! N  n ! 1 1 P S   n!   n!    N N 1 N  2 N   n  1 N! N! N! N    N  n ! n! N  n !  n  En el cálculo anterior hemos supuesto que al no intervenir el orden en la colocación de los elementos. luego. PROBABILIDAD QUE TIENE UNA UNIDAD DE PERTENECER A LA MUESTRA Se mencionó que los elementos que formarán la muestra pueden ser seleccionados de dos maneras: 1. así cada selección y probabilidad es: 1 1ª selección probabilidad N 1   N  1  1 2ª selección probabilidad N 1 N N 1   N  2  N  1  1 3ª selección probabilidad N  2 N 1 N N 1 N   n  1 N 1 1 nª selección probabilidad    N   n  1 N   n  2  N N 18 . la probabilidad final de forme parte de la muestra de tamaño n es: 1 1 1 n      . Por lo tanto. y cada una de las n selecciones son independientes unas de otras.. Recibe el nombre muestreo irrestrictamente aleatorio. u 2 . 2. u n  contiene las n! posibles ordenaciones de dicho conjunto.. Este tipo de selección coincide con el muestreo de poblaciones N N N N infinitas. Con reposición: en este procedimiento los elementos pueden ser seleccionados varias veces.. la probabilidad de que un elemento forme parte de la muestra es 1/N. y la probabilidad que un elemento sea escogido en la i-ésima extracción estará condicionada a la probabilidad de que no haya sido escogido en los (i-1) sorteos anteriores.

Determinación del tamaño de muestra. su probabilidad es:  N  1   No. La selección aleatoria garantiza: a. aquí se aplica la sumatoria de las probabilidades de cada una de n N selecciones en las que puede ser elegido el elemento i en la muestra. muestras favorables  n  1  n i    No. b. Modificaciones al diseño básico. 2. N  N 1 También podemos decir que de las   muestras posibles. 3. cuya varianza poblacional tienda a cero. muestras posibles N N   n Todo diseño muestral comprende las siguientes partes: 1. es decir. Dos factores afectan la cantidad de información contenida en la muestra y por tanto. la precisión (tamaño muestra y cantidad de variación que se controla por el tipo de muestreo). exige disponer una lista enumerada de 1 a N y de allí mediante un experimento aleatorio seleccionar a cada uno de los n elementos de la muestra. por tanto. de ellas   contienen un n   n 1  elemento particular. Inferencias estadísticas válidas. 4. Método de selección de la muestra. . Computadora Este método de muestreo se usa en poblaciones suficientemente homogéneas. Mejoramientos acumulativos a través de la separación y evaluación objetivo de sus fuentes de error. Tablas de número aleatorios. Estimadores a utilizar y propiedades. . Forma de seleccionar una muestra irrestricta aleatoria . 19 .De allí que la probabilidad de que un elemento sea seleccionado en cualquiera de las n 1 elecciones será igual a y la probabilidad final de que un elemento sea incluido en la N n muestra es  i  .

y j )  E ( y i   )( y j   )  E y i y j  y i  y j   2  E y i y j   2   2 N  1  1  N    u i u j    2   u i  i j  N ( N  1)  N  i 1   N    ui u j 2 1  i j 1  N       ui  N  N 1 N  i 1        u  N   ui   ui ui 2 2 Como i i 1 i j 20 . yn es una muestra irrestricta aleatoria (m.i. ESTIMACIÓN DE LA MEDIA Y EL TOTAL Simbología básica: yi = i . n y N 1   E ( yi )   i    media poblacional E ( yi )     u i   i 1 N i 1 N 2 varianza poblacional 1 1 N 2 2 1    Yi   2 V  Yi   E Yi       Yi         Yi  N    Yi    2 2 2 2  N  N  i 1  N  N   La varianza muestral es: y    2 y  1   1  n 2 2  y i  2 y i y  y     y i  n y  i 2 2 S 2   n 1  n 1  n  1  i 1   1   y  2     y i  2 i S2   n  1  n   La Covarianza poblacional en el m.. uN.i. u2. .ésimo elemento de la muestra N = total ui = elemento genérico de la población n y y   i media muestral i 1 n Suponga que y1.. es  0     Cov( y i . (considere que yi la muestra aleatoria es de tamaño uno)... y2. . .a. .a) de una población de valores u1..

2 N  N  N Entonces  i j u u i i    u  i 1  i    i 1 ui 2 Sustituyendo en la covarianza se tiene  N  2     ui    ui 2  Cov( y i . y j )   1 N ( N  1)  u i 2  N 2   1 N ( N  1)   ui    2   1  2 N 1 ESTIMACIÓN DE LA MEDIA POBLACIONAL El estimador de la media  es ̂  y  y i n Por definición la varianza muestral es:  2 yi  n y 2 entonces   yi  y  2 S  2 S 2  n 1 n 1 Consideremos que: 1) La media muestra es un estimador insesgado. Cov( y i . y j )  1   i 1    1  u  i 2   N N 1 N     1  1   ui  2    u i   2 1    N   N  1 N  N  1  1   ui  2  1    u i  2    N  N ( N  1)   N  1      1  1    2 ui  1   u i  2  N  N 1 N ( N  1)  1  1 N 2   2   ui   N  N 1 N  1 En definitiva. es decir E ( y )   21 . la covarianza queda igual.

estime μ. La media muestra es un estimador insesgado. Por definición. Ejercicio 4. 68.7: Una muestra irrestricta aleatoria de n = 100 medidores de agua es controlada dentro de una comunidad para estimar el promedio de consumo de agua diario por casa. durante un periodo estacional seco. Por definición la media muestral es y   i al aplicar operador esperanza se tiene y n  n    yi   1 n 1 n  N 1 1 E  y   E  i 1  E  y i      u j    n     n  n i 1 n i 1  j 1 N  n     2  N n 2.  2  N n S2  N n 2) La varianza de la media es V ( y )    y su estimador es Vˆ ( y )    n  N 1  n  N  que también es insesgado. (Mendenhall. S 2  1252 . el promedio de consumo diario verdadero. el límite de error de estimación es e  B  t Vˆ ( y ) Ahora vamos a demostrar los 2 puntos anteriores: 1. N = 10000 Se pide estimar  y B 22 . es n  N 1  decir que E Vˆ  y    V  y  . es decir E ( y)   Considere que yi es una muestra aleatoria es de tamaño uno.5 . y  12. y establezca un límite para el error de estimación.) Datos n = 100. La varianza de la media es V ( y )    y su estimador es también insesgado.000 casas dentro de la comunidad.5 y S 2  1252 Si suponemos que hay N = 10. A continuación vamos a realizar un ejercicio para estimar la media y determinar el error de estimación. La media y la varianza muéstrales fueron y  12. pag.

Sˆ 2  N  n  1252  10000  100  B  2 Vˆ  y   2   2    2 * 3. el cual queda igual a: S2  N  n  2 S 2 V ˆ   N 2  N 1  f  .54 Se puede interpretar los resultados de la siguiente manera: “Se tiene por lo menos un 75 % de confianza que el verdadero valor del promedio diario de consumo de agua se encuentre entre 5.04   5.96 * 3.46 . el error de estimación es igual a: B = 1. y  B  Sustituyendo los valores obtenidos se tiene que el intervalo es: 12. A continuación vamos a estudiar la estimación del total poblacional.40 y 19.04 .40 . Como el tamaño de la muestra es grande se puede emplear el teorema central del limite y asumir que la media se aproxima a una normal. En este ejemplo. 19. 12.5  7. donde f  n / N es la fracción de muestreo n  N  n La varianza estimada del total estimado ˆ es: Sˆ 2  N  n  ˆ2 2 S V  ˆ   N 2  N 1  f  n  N  n El limite para error de estimación es B = e = 2 V̂  ˆ  o B  t k V̂  ˆ  23 .52 =6.52 n  N  100  10000  El error de estimación es B = 7. y el intervalo es (5. 19.54”.60) el cual indica que tenemos un 95% de confianza que el verdadero valor del consumo de agua promedio poblacional se encuentra entre 5. ESTIMACION DEL TOTAL POBLACIONAL  n N  yi Ya sabemos que su estimador es ˆ  Ny  i n La varianza poblacional del total estimado ˆ se obtiene al aplicar el operador varianza a la definición de dicho estimador.60.04 El intervalo de confianza para la Media Poblacional es: y  B   y  B.8992.46 y 19. sus varianzas y la determinación del tamaño de muestra.5  7.

68.25 B  tk Vˆ (Tˆ )  2 Vˆ (Tˆ )  2 * 35206.5  125000   Vˆ Tˆ  Vˆ  Ny   N 2Vˆ  yˆ   N 2 S2  N  n  n  N   2 1252   10000  100    Vˆ Tˆ  10000 100   100   1239.480. (Mendenhall.Ejemplo 4. el tamaño de muestra queda igual a: 24 .25  70412. usado diariamente durante el periodo seco. N=10000.8: Usando los datos del ejercicio 4.48 * 10000  1. Tˆ  B. estime el número total de galones de agua.239.5 TAMAÑO DE LA MUESTRA PARA ESTIMAR LA MEDIA Para determinar el tamaño de la muestra se despeja n de B con varianza poblacional (4) o varianza estimada (5) 2  N n e  B  t Vˆ  y   t   (4) n  N 1  Sˆ 2  N n e  B  t Vˆ  y   t   (5) n  N 1  despejando n de (4) se tiene que: 2   N n 2  e2  e  t   n 2  N  1  N  n 2 2 2  n  N 1   t   e2  n 2  N  1  n 2  N 2  t  Finalmente.195412.7. τ.5. Tˆ  B    54587.5 . Establezca un límite para el error de estimación. S2=1252 Tˆ  Ny  10000 * 12. y  12. pag.) Solución: n =100 medidores.5 Intervalo de confianza para el total de galones de agua usado durante el periodo seco.000  2 Vˆ (Tˆ )  123948 * 10 4  35206.

25 . 2. N 2 N 3 2 t2 N 2 n    N  1 2e 2   2  N  1 e   t N  N  1 D   2 2 2 2 2 2 t N e2 B2 D  t2  4 t2 N 2 t2 N 2 Tanto en el caso de muestras para estimar el total o la media se supone que el investigador debe conocer  2 FORMAS DE CALCULAR ESTIMACIONES DE  2 La estimación de la varianza poblacional σ 2 para calcular el tamaño de muestra se puede realizar a través de: 1. Muestra piloto. Consideraciones prácticas acerca de la estructura poblacional. ESTIMACIÓN DE LA PROPORCIÓN P El investigador que realiza una encuesta por muestreo frecuentemente esta interesado en estimar la proporción de la población que posee una característica. 3. Usando el rango de la variable (dos desviaciones de la media) rango de Y   4 4. Estudios anteriores. N 2 N 2 n n  e2  D N  1   2  2  N  1   2 t    TAMAÑO DE LA MUESTRA PARA ESTIMAR EL TOTAL Por un procedimiento similar al de la media se determina el tamaño de muestra para estimar el total.

Ejemplo: proporción de personas que opinan que el servicio de BIECI es bueno. n  N  n 1 N  pˆ qˆ n  N n pˆ qˆ  N  n  ˆ Vˆ  y   n  1      V  pˆ  es la varianza estimada de la proporción. Sea yi = 0 si el i-ésimo elemento seleccionado no posee la característica especifica. Las propiedades de ̂ son equivalentes a las de y en el muestreo irrestricto aleatorio. y y i = 1 si las posee. y i pˆ   y es el estimador de p n PQ  N  n  La varianza poblacional de la proporción es: V  p     n  N 1  pˆ qˆ  N  n  Varianza estimada de p̂ es: Vˆ  pˆ     n 1 N  A continuación vamos a demostrar: la varianza estimada de la proporción Vˆ  pˆ  : y i Sabemos que y   pˆ  y i  np n Sea la cuasivarianza:   yi  y 2  2 y i  ny 2 np  np 2 n n S  2    p (1  p) = n  1 pq y además n 1 n 1 n 1 n 1 S2  N n n Vˆ  y     . sustituyendo S  2 pq se tiene n  N  n 1 pq n  N n pq  N  n  Vˆ  y   n  1      V  pˆ  esto es lo que queríamos demostrar. n  N  n 1 N  El error de estimación es: e  B  t V ( pˆ ) 26 .

pag.. .Ejercicio 4. .30). y y i  1 si considera que es adecuado (i=1. . Sea y i  0 si jefe del i-ésimo grupo muestreado considera que el espacio del área disponible para acampar no es adecuado.. 67-68.. Establezca un limite para el error de estimación (Mendenhall. Las autoridades decidieron tomar una muestra irrestricta aleatoria de n = 30 de los primeros N = 300 grupos acampados que visitan el campo. la proporción de personas que acampan y que consideran que el espacio del área disponible para acampar es adecuado. Use los datos de la tabla adjunta para estimar p.5: Las autoridades de un parque estatal están interesadas en la proporción de personas que acampan y que consideran que el espacio del área disponible para acampar en un terreno en particular es adecuado.2. 29 1 30 1 30 y i 1 i  25 27 . . .) Respuesta Persona Muestreada yi 1 1 2 0 3 1 ..

Al calcular el intervalo de confianza queda igual a (0.00431103 n 1 N  30  1  300  El error de estimación resulta igual a: B=2*0.1667   300  30  Vˆ  pˆ        0.5 para determinar el tamaño de muestra requerido para estimar p con un límite para el error de estimación de magnitud B = 0.8333 0. TAMAÑO DE LA MUESTRA PARA ESTIMAR p Sabemos que el tamaño de muestra para estimar la media en el muestreo irrestricto aleatorio es: N 2 N 2 n 2  e  D N  1   2  2  N  1   2 t k  Haciendo la varianza poblacional igual a  2  PQ y sustituyéndola se tiene: NPQ n 2 e  N  1  PQ t 2k e  t k Vˆ  p  pˆ qˆ  N  n  Vˆ  pˆ     n 1 N  n0 n t 2 pq n .Solución: y i  25 n = 30 N=300 y i 25 pˆ    0.8333 y qˆ  1  pˆ  0. Pag 68.1313.) 28 . n0  1 0 e2 N Ejemplo 4. (Mendenhall.702 . 0.065658=0.1667 30 30 pˆ qˆ  N  n   0.9646).05.6: Use los datos del Ejercicio 4.

1 n  yi  El Estimador del total T es: Tˆpp     n i 1   i  2    yi  n 1 Varianza estimada del Tˆpp es: Vˆ Tˆpp    n n  1 i 1   i  Tˆpp   El limite para el error de estimación es: tk Vˆ (Tˆpp ) Estimador de la media poblacional  : 1 ˆ 1 n  yi  ˆ pp  Nn T pp   Nn i 1   i   2  yi    n 1 Varianza estimada de ̂ pp es: Vˆ ˆ pp     T pp  N n n  1 i 1   i 2  El limite para el error de estimación es tk Vˆ  ̂ pp  VENTAJAS DEL MUESTREO ALEATORIO SIMPLE 29 .8333 y qˆ  1  pˆ  0.05 = e t=2 y i 25 pˆ    0.90  128  e2   0.1667 30 30 NPQ 300 0.83333 0.83 0.17  t   4  MUESTREO CON PROBABILIDADES PROPORCIONALES AL TAMAÑO Sea  i  la probabilidad de que yi aparezca en la muestra.05 2   N  1  2   PQ  300  1  2    0.Solución: y i  25 N = 300 n=? B = 0.1667 n   127.

puede hacerse una mejor estimación. 3) Tiende a reflejar todas las características del universo. Calculándose para cada estrato sus estimadores y el estimador de la población se calcula como una ponderación adecuada de las estimaciones por estrato. ésta se hace cada vez más representativa del universo o población. La estratificación puede producir un limite más pequeño para el error de estimación que el que se produciría con un muestreo aleatorio simple. podría ser imposible obtener una estimación lo suficientemente precisa tomando una muestra aleatoria simple. si podemos clasificar los elementos de la población en grupos (estratos)de manera que se reduzca la variación de la variable Y dentro de cada estrato. Es decir. 30 . por tanto. cuando el tamaño de la muestra crece. 4) Costos mayores con la dispersión espacial de las unidades muestreadas. TEMA 3. dentro de cada estrato se selecciona en forma independiente una muestra irrestricta aleatoria. en la cual. 2) Si la población es muy grande la numeración demanda tiempo y trabajos que pueden ser ahorrados si se emplea otro diseño muestral. Ejemplo: Cargos vacantes en las empresas. Criterio de estratificación: tamaño de la empresa. DESVENTAJAS DEL MUESTREO ALEATORIO SIMPLE 1) Suponemos un listado completo. 2) Disminuir los costos al estratificar y variar las fracciones de muestreo dentro de los estratos. 2) Es relativamente simple determinar la precisión de las estimaciones que se hacen a partir de las observaciones muestrales. esto es. 3) El tamaño de n estratificado es mejor que el tamaño de n aleatorio para el mismo nivel de confiabilidad. el tamaño de la muestra aumenta para una precisión dada. RAZONES PARA ESTRATIFICAR 1) Aumentar la precisión de las estimaciones al disminuir la variación dentro de los estratos. DEFINICIÓN: Una muestra aleatoria estratificada es la obtenida mediante la división de la población en subpoblaciones denominadas estratos. Pero.1) Las ventajas derivadas de realizar muestreo. MUESTREO ESTRATIFICADO En el muestreo aleatorio simple la varianza del estimador depende del tamaño de la muestra y de la dispersión de la variable en estudio. Si la población es muy heterogénea y las consideraciones de costos limitan el tamaño de la muestra.

pero no es conveniente aumentar mucho el número de estratos si tal aumento no compensa las complicaciones de cálculo y la disminución del tamaño de la muestra dentro de los estratos. ¿CÓMO SELECCIONAR UNA MUESTRA ALEATORIA ESTRATIFICADA? Dividir la población en estratos de acuerdo a las razones para estratificar. L = número de estratos. Ni = tamaño del i-ésimo estrato i = 1. la precisión aumenta con el número de estratos si estos están bien elegidos. asignar el tamaño muestral de cada estrato ni (de L modo que si los L estratos y n es el tamaño de la muestra n i 1 i  n y seleccionar muestras aleatorias simples en cada estrato de forma independiente.2.3) Permitir definir los estratos como dominios de estudio y obtener estimaciones con precisión conocida para los estratos. NOTACIÓN N = tamaño de la población. La estratificación se realiza de acuerdo a la distribución de la variable en estudio o de acuerdo a una variable X altamente correlacionada con la variable en estudio o de acuerdo a un criterio de disminución de los costos.. ubicar cada unidad muestral en su respectivo estrato... L L  Ni  N i n i 1 i n Wi = Ni/N tamaño proporcional del estrato i  Wi  1 Wi = ni/n proporción de la muestra en el estrato i  wi  1 ESTIMACIÓN DE LA MEDIA L 1 Para estimar la media poblacional  el estimador es: y st  N N yi i i ni y ij Sea yi   la media muestral del i-ésimo estrato j 1 ni 31 .L N = tamaño de la muestra. En general..

pag. y st  ? y B  ? 32 .000 n1 n2  yi2  2.980.000 i 1 y i 1 2 i  6. El uso de ambos distritos de votantes en el suburbio como los estratos es conveniente porque se tienen disponibles listas separadas de las viviendas en cada distritos. E  y st    El estimador y st es un estimador insesgado puesto que los y i son insesgados.4: Se forma una comisión de Zonificación para estimar el valor promedio de avalúo en un suburbio residencial de una ciudad. es decir.000 Se pide determinar la media y el error de estimación.000 i 1 y i 1 i  420. 1 L 1 1 T  y st    N i  y i    N i Yi   Ti  Y   N i 1 N N N Tarea: Demostrar que la varianza estimada de y st es un estimador insesgado de V  y st  Si las fracciones de muestreo ni/Ni son despreciables   en todos los estratos entonces 1 L N i Sˆ i 2 2 V  y st   2  ˆ N i 1 ni Ejemplo 5. es decir. (Mendenhall.) ESTRATO I ESTRATO II N 1  110 N 2  168 n1  20 n 2  30 n1 n2  yi  240. estime el valor promedio de avalúo para todas las casas en el suburbio.010. 113-114.000. De los datos presentados en la tabla acompañante. y establezca un límite para el error de estimación (nótese que se utilizó la asignación proporcional).La Varianza poblacional de y st es: 1 L  S i  2 1  1 L  2  N  ni L V  y st   N i y i   2  N i V  y i    2  N i  i   2 V N i 1  N  i 1  N  i 1  Ni  ni   La Varianza estimada de y st es: 1 L  Sˆ i  2 1 L  1 L   N  ni Vˆ  y st   V   2    2   N i 2  i   2 N y i i  N V y i    ni  i N i 1  N  i 1  N  i 1  Ni  Vamos a demostrar que la media es un estimador insesgado.000.

208.000 30 6.263.482.48 Los límites de confianza son: yB luego.000.758.63+560.895 19 420.63-560.895  2  168  30  4482758. en este ejemplo.63 es el valor promedio de valúo para 278 todas las casas del suburbio.157.010.000  20  12.000 y1   12.62   Vˆ  y   110   110    168     278  2   20   168  30  Vˆ  y   7853.000.52  560. 13208.000 20 2.48) 33 . 1 L  Sˆi  2 2  N  ni La varianza estimada es: Vˆ  y st   2  N i  i   al sustituir los valores N  i 1   Ni  ni  respectivos tenemos: 1  2  110  20  526157.000 2 S  1 2  5.000  30  14. L 1 y st  N N i 1 i yi ni y ij Sabemos que: yi  j 1 ni ni  y  2 y ij 2  ny i 2 y 2 ij  ni ij Sˆ i2  j 1  ni  1 ni  1 240.000 2 S 22   4.980. yB (13208.000  168 14000  13.62 29 1 y st  110 12.52 El error de estimación es: B  t k Vˆ  y   2 7853.000 y2   14.48.

11$.69 (11071. 14700. 2928. Como en este tipo de muestreo.69) 34 . Es decir que se estima que con por lo menos un 75% de confianza el valor promedio de avalúo para todas las casas en el suburbio oscile entre 12648. entonces se puede realizar estimaciones separadas. 13769. las muestras en cada estrato son independientes.15 y 13769.31.03) (13299.15.03 14000  700.97. así: Estrato 1 Estrato 2  N  n  sˆ 2  N 2  n2  sˆ22 y1  t k  1 1  1 y 2  t k    N 1  n1  N 2  n2 12000  928.El intervalo resultante es: (12648.11).

ESTIMACIÓN DEL TOTAL L L L 1 El estimador del total es: Tˆst  Ny st  N  Wi y i  N  N i y i  N i y i i N i i La Varianza poblacional de Tˆst :    N  ni  S i2  L V Tˆst  Vˆ  Ny st   N 2Vˆ  y st    N i2  i   i  Ni  ni  La Varianza estimada de Tˆst :  Sˆ i2     N  ni L Vˆ Tˆst  Vˆ  Ny st   N 2Vˆ  y st    N i2  i     i  Ni  ni  Ejemplo 5. Use los datos de la tabla acompañante.2 estime el número total de horas-hombre perdidas durante el mes indicado y establezca un límite para el error de estimación. 113. pag. obtenida en una muestra de 18 obreros. (Mendenhall.3: Para el Ejercicio 5.) I II III (Obreros) (Técnicos) (Administrativos) 8 24 0 4 5 1 0 16 32 0 24 8 7 4 4 8 12 9 5 8 3 2 18 2 0 1 8 35 . 10 técnicos y 2 administrativos.

7 y 3  4. I II III Obreros Técnicos Administrativos n1  18 n 2  10 n3  2 y1  8.5 S  81.hombre perdidas.5 N1= 132 N1= 92 N3 = 27 36 .4556 2 2 S 32  24.8333 y 2  6.5588 1 2 S  50.Solución: Se desea estimar el número total de horas .

515.76.9  676.23 El límite de error 552.1688.515.24 )  643.5   132     92   2      27      132  18   92  10   27  2    Vˆ Tˆst  114 .803  676. SELECCIÓN DEL TAMAÑO DE LA MUESTRA PARA ESTIMAR μ 37 .8956  1903.9 Número total de horas – hombres perdidas por accidente en un mes determinado.61 B  e  t k Vˆ  Tst   e  2 114.1 .8333  92  6.157 ) (1165.24 es muy grande porque S 12 es grande y por tanto se obtiene una estimación deficiente. la muestra del estrato debe ser lo suficientemente grande para proporcionar un límite razonable para el error de estimación. Si se desea una estimación para un estrato particular. L Tˆst   N i yi  132  8.8 Intervalo de confianza del Total Tˆst Tˆst  B ( 1903.   2  N  ni  S i2 L Vˆ Tˆst   N i  i  i 1  Ni  ni 2  132  18  81.7  27  4.7  2  S1  N 1  n1  2 ˆ La estimación separada del total para el estrato 1 es: T1  t k N1     n1  N1  (1165.996  552.996 2 68.61  2  338.5 i 1 Tˆst  1903.402  676.8 ) El verdadero número total de horas perdidas por enfermedad está en el intervalo 1227.4556  2  27  2  24.183.5588   92  10  50. 2580.

n.. e  t k Vˆ  y  .N1.. El tamaño de muestra para una población que tiende a infinito es:  L 2 S i2  t2 n0    Wi  2   i w i e 38 .Prefijados el error máximo admisible (precisión mínima del estimador) indicado por...N2. wi = ni/n 1 1  L  N  ni  S i2 2 e  t Vˆ  y st   t 2   N i2  i    N  i 1  Ni  ni  Para determinar el tamaño de muestra se fija el nivel del error de estimación que se está dispuesto a cometer. El coeficiente de confianza 1-α determina el valor de t (acorde a la forma de distribución del estimador) y la variabilidad de la población (paradoja de Friedman)..Nl. se supone que wi=ni/n para poder despejar n  haciendo ni =win y se sustituye: 2  N i  wi n  S i 2 2 1 L N 2e2 L N i2 S i2 L 2   e 2  t N i      2    N i S i2 N i  N i  wi n t i 1 wi n i 1 2 N 2e2 L 1 L N i2 S i t2   i N S i i 2   n i  wi El tamaño de la muestra aproximado para estimar  es: L N i2 S i2  i 1 wi n 2 2 L N e 2 t   i 1 N i S i2 Como Wi = Ni/N y si dividimos ambos miembros por N2 tenemos: 1 L N i2 S i2 L 2 Si 2 L 2 Si 2  N 2 i 1 wi i 1 Wi wi  i 1 Wi wi n 2 2  2  2 es el tamaño de muestra N e 1 L e 1 L e 1 2 2  N t N i 1 2  N i S i 2 2  t N i 1 2  i i N S2 2 t N   Wi S i2 aproximado para estimar la media. Si 1-α  t   x  si n  En este diseño supones conocidos: N. También..

partiendo del error de estimación para estimar el total:   N  ni  S i2 L e 2  T2Vˆ Tˆ  t2  N i2  i  si ni =nwi i 1  Ni  ni e2 L S i2  N   i i i nw N  nw  t2 i 1 i e 2 L N i2 S i2  N i S i2 nwi L N i2 S i2 L     N i Si 2 2 t i 1 nwi i 1 nwi i e2 L 1 L N i2 S i2   Ni Si   2 t2 i 1 n i 1 wi Despejando n se obtiene el tamaño de muestra aproximado para estimar el total: 39 . el tamaño de muestra es: n0 n 1 L 1  NV i 1 Wi S i2 TAMAÑO DE LA MUESTRA PARA EL TOTAL (TAMAÑO APROXIMADO) Este tamaño de muestra se obtiene de igual forma.V = (e/t)2 es una varianza especificada en función del margen de error. también se denomina varianza anticipada. L S i2  i 1 w wi 2 i n L 1 V   N i S i2 N i 1  L S2  t2 1  L S2  n0    Wi 2 i  2    Wi 2 i   i wi  e V  i 1 wi  luego.

909 0.4776 1.194 1.1791 0 0 0.143 1 Escuque 3 0.133 0.0445 0 0 0.1045 2.476 3 Valera 7 0.22 40 .048 6 Boconó 32 0.286 1 Trujillo 12 0.676 0.048 N = 67  Wi 2 S i2 / wi  1.333 0.14 0. Suponga que se realizó una muestra piloto y se obtuvo los siguientes datos: ni Estratos Ni = Wi = Si2 Wi2Si2/wi wi = fincas Ni/N ni/n 10 Urdaneta 13 0.178 0. L N i2 S i2 L N i2 S i2  i 1 wi  i 1 wi n  e2 L L 2   N i S i2 V   N i S i2 t i 1 i 1 Ejemplo: A continuación se realiza un ejemplo del cálculo del tamaño de muestra necesario para determinar la Calidad de la Leche (variable: acidez).

41 . la determinación de los L valores n i de modo que ni + n2 + . pero el costo por cada unidad ci puede variar entre los estratos. 1) Los factores que influyen en la asignación son: 2) El número total de elementos en cada estrato. 4) El costo de observación en cada estrato.22 n   21 Fincas 1 L 1 V   Wi S i 0. Cada asignación puede originar una varianza diferente al estimador. 3) La dispersión en cada estrato y.041 n i 1 wi n i 1 21 67 L Wi 2 S i2 i 1 wi 1.041  2 1. TIPOS DE ASIGNACIÓN.22  1. nuestro objetivo es determinar un esquema de asignación que aumente la precisión y minimice los costos . es decir. n 1. L La función de costo fijo más sencilla es C  c0   ci ni ..113  N i 1 67 ASIGNACIÓN DE LA MUESTRA Se denomina asignación o afijación al reparto o distribución del tamaño de la muestra n entre los diferentes estratos. Dentro de cualquier estrato el i 1 costo es proporcional al tamaño de la muestra. Proporcional. Optima. Igual ni  L 2. + nl =n. 1 L Wi 2 S i2 1 L 1 1 V    Wi S i2  1... 3.113  0. ASIGNACIÓN OPTIMA: en el muestreo estratificado los valores de los tamaños de la muestra por estrato puede ser asignados con la finalidad de minimizar la variabilidad del estimador para un costo fijo o para minimizar el costo para un valor específico de la varianza de la media Vˆ  y st  .

L e igualando a cero. Wi S i  ni  (1) ci Sumando (¡) sobre i se obtiene: L WS WS i 1 ni    i i ci  n    i i (2) ci haciendo el cociente de (1) y (2) para eliminar  ni  Wi S i / c i ni Wi S i / ci  L  L n  Wi S i  n Wi S i i es un valor específico del estrato. las L ecuaciones obtenidas son: Wi 2 S i2 Wi 2 S i2  2  ci  0   c i ni ni2 Extrayendo la raíz cuadrada...Por tanto. Sabemos que la varianza estimada de la media es:  1 L  N  ni  S i2 l N i2 S i2 L N i S i2 Vˆ  y st    2  N i2 i   2  2  N  i 1 Ni ni i 1 N ni i 1 N haciendo N i / N  Wi obtenemos: W 2S 2 1 Vˆ  y st    i i   Wi S i2 ni N Ahora. L C 0   c1 ni  C  0 i 1 Usando el método de los multiplicadores de Lagrange debemos minimizar.. i = 1. + cLnL = C .. la función: W 2S 2 W 2S 2   ni    i i   i i     ni c i  c  c 0  L L i 1 ni i 1 Ni Diferenciando con respecto a ni.2.. en cada uno de L estratos.. C0 representa un costo general y ci el costo por unidad encuestada en el estrato i.  i 1 ci  i 1 ci 42 ..C0. vamos a minimizar la varianza Vˆ  y st  sujeto a la restricción c1 n1 + c2 n2 +..

1 TAMAÑO DE LA MUESTRA PARA LA ASIGNACIÓN OPTIMA.  El muestreo es mas barato en el estrato. El tamaño de muestra según asignación o afijación optima. a) En el primer caso. entonces. o b) Para dar una varianza de  y st  especifica.   L   L N i S i / ci  C  c 0   ci ni  C  c 0   ci n  l     N i S i / ci  i i 1  i 1    L L  C  c0   N i S i / ci   c i n N i S i / ci i 1 i 1 L L  C  c0   N i S i / ci  n N i S i ci i 1 i 1 43 . se minimiza V  y st  . Quiere decir que en la función de costos sustituimos el valor de ni . 1. Si el costo es fijo. Ni S i / ci ni N Como wi = ni /n  n  1 L Ni Si  N i 1 ci ni N i S i / c i N i S i / ci  L ni  n Entonces n N i Si luego L N i Si  i 1 ci  i 1 ci Este resultado nos indica que en un estrato dado se debe tomar una muestra grande si:  El estrato es grande (Ni  ). a su vez depende de: a) Si la muestra es escogida para satisfacer un costo total C especifico.  El estrato es más variable internamente.

al sustituir wi = ni /n en la fórmula de la varianza 1 wi2 s i2 wi2 s i2 de la media V  y st   V   w  N  o en la fórmula de tamaño N i i aproximado de la muestra...= CL = C.. Si los costos son conocidos se puede suponer que los costos son iguales. L  C  c0   N i S i / ci i 1 Despejando n se tiene: n   N S  L i i ci i 1 b) Si la varianza se fija con anticipación.. CASO DE COSTOS IGUALES POR ESTRATO (ASIGNACIÓN DE NEYMANN) En algunos problemas el costo para obtener información en cada uno de loa estratos es el mismo.2 TAMAÑO DE LA MUESTRA. así C1 = C2 = . se sustituye Wi = Ni /N 1 2  N S i i ci  N S i i / ci   N S ci  N S / ci  n N i i i i L  L 1 V N2  N i S i2 i 1 N 2V   N i S i2 i 1 1. tenemos: L W i 1 i 2 S i / wi n L donde: V = e2/t2 es la varianza anticipada 1 V N W S i 1 i Sustituyendo Wi S i / ci N i S i / ci wi  ni / n    W S   N S  nos queda L L i i / ci i i / ci i 1 i 1 n W S i i ci  W S i i ci  1 L V  N i 1 Wi S i2 para expresarla en términos de Ni. 44 ..

.n 2. se distribuyen de acuerdo al peso del estrato en la población.  Ni Si  2 e2 En este caso n  V N 2V   N i S i 2 t2  W S  i i 2 n L 1 V N W i 1 i S i2 1. nN i S i Wi S i ni   n este tipo de asignación se conoce como asignación de  N i Si  Wi S i Neyman (asignación óptima supuesta)..nL.3 TAMAÑO DE MUESTRA PARA COSTOS IGUALES. Este método de asignación de la muestra se denomina asignación proporcional porque los tamaños de la muestra n1 . ASIGNACIÓN PROPORCIONAL... por tanto: 1 Yst  N N i y i   Wi y i N i ni Wi   N n Sea la definición de varianza:  N  ni  S i2 V  y st    Wi 2V  y i    Wi 2  i   Ni  ni Al sustituir en términos de los pesos de los estratos poblacionales.. 2  NWi  nWi  S i 2 2 2  N  n  Si   Wi  Wi   NWi ni  N  nWi V  y st    N  n S i2  N  n  Nn  Wi 2 Wi  Nn  Wi S i2 ni N i Para determinar el tamaño de muestra.. hacemos   wi  Wi y luego al sustituir en n N 45 . VARIANZAS IGUALES..

. = cL     N i S i / ci   i 1  Ni Se tiene ni  n y el valor de N N  Ni i Empleando la formula de tamaño aproximado para estimar la media:   N S 2 2 2 N i S i / wi N i S i / Wi i i n L  L  L 1 N V   N i Si N 2V   N i S i NV   N S 2 2 2 2 i i i 1 i 1 N i 1 si dividimos numerador y denominador por NV.      N i S i / c i  ni  n L S1 = S2 = . entonces.a. la variación total se divide en dos fuentes de variación: entre y dentro de los estratos... asumamos que tenemos una población estratificada y por tanto. no es verdad que el muestreo estratificado dé siempre una varianza menor que en el muestreo aleatorio simple. 46 . Si se usa inteligentemente la estratificación. Para obtener la varianza S2 en el muestreo irrestricto aleatorio (m.).i... Comparación de la precisión del muestreo aleatorio estratificado con relación al muestreo irrestricto aleatorio..  2 N i Si 1  N i Si 2 NV  Wi S i2 n L  L  V 1 1 L N S N S  2 2 NV  i i i i 1 Wi S i2 N i 1 1 i 1 NV i 1 1 N NV n0 1 n haciendo n0  V  Wi S i2 queda n 1 0 N Esta asignación puede utilizarse también cuando los costos y las varianzas no son iguales (pero no son tomados en cuenta al momento de fijar los tamaños de la muestra). si es el modelo de muestreo adecuado. es decir... Sin embargo. da como resultado una varianza más pequeña para el estimador que la obtenida mediante muestreo aleatorio simple. = SL y c1 = c2 = . una ventaja al usar esta descomposición es que y S  y ..

en el muestreo estratificado la varianza de la media es: 1 L  Sˆ i  2 2  N  ni Vˆ  y st   2  N i  i   N  i 1   Ni  ni   Si en esta definición realizamos las sustituciones de acuerdo al tipo de afijación de la muestra. Es el caso de la afijación proporcional. obtendremos la varianza de la media según ese tipo de asignación o afijación. así: N i ni Wi    wi N n V prop  V Yst   1 n   W S   1Nn i  f N S i 2 i i 2 La varianza de la media según la asignación óptima (Neymann) es: Vopt  V Yst   1  W S  i i 2  1  W S  i i 2 1  W S  i i 2  1 W S i i 2 n n nN 2 N2 Expresada en términos de los tamaño de los estratos. es: Vopt  V Yst   1  N i S i  2  12  N i S i2 2  nN N 47 . al sustituir los pesos de los estratos. Ni  Y  Y    Yij  Yi    N i Yi  Y  L L L L 2 2 2 ij asumamos que YS  Y i 1 i 1 i 1 j 1 i 1 2  N  1 S 2    N i  1S i 2   N i Yi Y  L L i 1 i 1 2   N i  1S i   N i Yi  Y  L L 2 i 1 i 1 S2   N  1 Sabemos que en el muestreo aleatorio simple sin reposición la varianza de la media es: S2 1  f   S  N  n  2 Vram  n n  N  Ahora. se obtiene la varianza proporcional.

 N L pˆ L   1 N i pˆ i N N i 1 1 L 1 L  N i  ni  pˆ i qˆ i Vˆ  pˆ S   2  N i Vˆ  pˆ i   2 N   2 2   ni  1 i N i 1 N i 1  Ni TAMAÑO DE LA MUESTRA PARA LA PROPORCIÓN Las fórmulas de calculo del tamaño de la muestra para la proporción son iguales a la de la ˆ i qˆ i media excepto en que Si2 = p  2 N i pˆ i qˆ i / wi n  e2  L es el tamaño de muestra aproximado para estimar la proporción.Teorema (Cochran): Vopt  V prop  V ran (tarea demostrar) Se puede medir la eficiencia del diseño de muestreo estratificado utilizando el siguiente cociente: Vprop / Vran = mide el efecto del diseño. ESTIMACIÓN DE LA PROPORCIÓN p Si queremos estimar la proporción de unidades de la población que posee una característica. L 1 pˆ S   N 1 pˆ i  N 2 pˆ 2  . es decir. Sabemos que la proporción p̂ es un caso particular de y . las que no lo poseen. Vop / Vran.. También se puede calcular con relación a la varianza óptima.. la estratificación ideal es dividir la población en dos estratos. Esto es en general imposible por ello trataremos de construir estratos que la proporción varíe tanto como sea posible de estrato a estrato. uno el de todas las unidades que poseen la característica y el otro. N  2 2    N i pˆ i qˆ i t  i 1 Asignación optima: que minimiza el costo para Vˆ  pˆ S  dada o minimiza Vˆ  pˆ S  para el costo dado. si es igual a 1 es preferible usar el muestreo aleatorio simple y si es mayor que 1 no es eficiente. nN i pˆ i qˆ i / ci ni  L Ni 1 i pˆ i qˆ i / ci 48 . para una variable dicotómica. Si el resultado es menor que 1 indica que es eficiente.

La población se subdivide en subpoblaciones y algunas de ellas. el tamaño de muestra n óptimo (Neymann) es: 2  L  nN i pˆ i qˆ i   N i pˆ i qˆ i  ni   i 1  L en este caso n N i 1 i pˆ i qˆ i e 2 L N 2  2    N i pˆ i qˆ i  t  i 1 Asignación proporcional: se presenta cuando existen costos iguales y también las varianzas de los estratos son iguales.El tamaño de la muestra para satisfacer un costo total C es:  c  c0   N i pˆ i qˆ i / c i n L N i 1 i pˆ i qˆ i / c i El tamaño de muestra óptimo que minimiza la varianza es: 1 2  N i pˆ i qˆ i ci  N i pˆ i qˆ i / ci   N pˆ i qˆ i ci  N pˆ i qˆ i / ci  n N i i L  L 1 V N2 N i 1 i pˆ i qˆ i N 2V   N i pˆ i qˆ i i 1 2 e donde V  es la varianza anticipada. que denominaremos conglomerados. MUESTREO POR CONGLOMERADOS Se caracteriza porque las unidades de muestreo contienen a dos o más unidades primarias (últimas). pero se diferencian en que la unidad de muestreo es un conjunto de unidades primarias o elementales. pero no todas serán incluidas en la muestra. t2 Si los costos son iguales. 49 . L  N pˆ qˆ i i i N  n i n i  n i  y N   e2  1 L N  2 2   N i pˆ i qˆ i t  N i 1 TEMA 4. El muestreo por conglomerados es similar al muestreo aleatorio simple.

los conglomerados son áreas físicas o geográficas. Ejemplo: animales. ¿CÓMO SELECCIONAR UNA MUESTRA POR CONGLOMERADOS? 50 . La diferencia de objetivos entre estratificación y conglomerados conduce a diferentes criterios para establecer los conglomerados o los estratos. 4) También. un muestreo efectivo para obtener la información deseada a un menor costo. donde las unidades primarias están contiguas. el costo es exageradamente alto. el muestreo por conglomerado permite disminuir las distancias. en muchos casos. pueden existir consideraciones administrativos que jueguen papel importante en la colección del diseño a utilizar. 2) Cuando no existe lista de las unidades primarias (o últimas) sobre los cuales hay que tomar las observaciones. aunque el uso de los conglomerados conlleve en algunos casos a una varianza mayor de los estimadores. pero siempre todos los estratos están representados en la muestra. la varianza del estimador se hace pequeña al hacer el conglomerado. en comparación con el costo de muestrear sobre conglomerados. el muestreo por conglomerados es utilizado debido a que muestrear directamente sobre las unidades primarias. y el costo de levantar un marco muestral de estas unidades es alto. puede ser posible y fácil. donde la población también se subdivide en subpoblaciones. Mientras que el muestreo estratificado es diseñado y utilizado fundamentalmente con el objeto de reducir la varianza de los estimadores. Los casos en los cuales se justifica la aplicación de este diseño muestral son: 1) Donde existe un alto costo por la movilización o traslado entre las unidades primarias. y todas los conglomerados deben ser en lo posible construidos de modo que sean lo más semejante entre sí. tanto como sea posible. A diferencia del muestreo estratificado. dividir con población en unidades mayores y luego muestrear y medir aquellas unidades mayores seleccionadas. 3) Para pequeñas unidades donde puede ser difícil fijar con precisión sus limites.A diferencia con el muestreo estratificado. En contraste. Este muestreo es. donde los estratos deben ser homogéneos dentro de sí y heterogéneos entre sí. sin embargo. los cuales si pueden disponer de un marco o directorio. representativo de la diversidad de toda población. con el estratificado. pues por lo general.

Este proceso se puede generalizar a más de dos etapas y el muestreo se denomina Polietápico. tales como: procesos de producción (control de calidad). El tamaño del conglomerado óptimo es aquel para el cual la varianza del estimador es mínimo donde el costo de la investigación o el costo de la encuesta es mínimo dada la varianza. el muestreo se denomina Bietápico. pues la muestra se selecciona en dos etapas. i 1 51 . el muestreo se denomina muestreo por conglomerados Monoetápico. Si hacemos un muestreo o encuestamos todas las unidades de los conglomerados seleccionados. Resolviendo las imperfecciones que el marco pueda tener y garantizando que todos las unidades primarias que están en los conglomerados esta en uno y solo uno de los conglomerados. pero se constituyen una introducción sencilla al estudio del método por muestreo. El tamaño óptimo de los conglomerados no es una característica que depende exclusivamente de la población. el tamaño del conglomerado se hace más pequeño cuando aumenta la duración de la entrevista. cuando la densidad del conglomerado es mayor y cuando el presupuesto del gasto aumenta. listando los conglomerados en los cuales se ha particionando la población. rara vez se logran en la practica. El problema de elegir un tamaño de conglomerado (mi) apropiado puede ser un proceso un tanto complicado. por ejemplo.  Seleccionar los conglomerados que van en la muestra utilizando un muestreo irrestricto aleatorio. los conglomerados son de tamaños diferentes unas de otras. Definir el conglomerado tipo (tamaño del conglomerado). Si en vez de entrevistar u observar a todos los individuos o unidades primarias del conglomerado observado en la muestra a su vez tomamos muestras de estas unidades primarias de los conglomerados seleccionados. En la mayoría de los métodos por conglomerados. Notación: N= números de conglomerados en la población n= números de conglomerados en la muestra mi = números de unidades elementales (primarias) en el i-ésimo conglomerado N M=  mi Total de elementos en la población. El número de elementos que integran un conglomerado se denomina tamaño. sino también de la estructura de costos de la investigación.  Formar el marco muestral. los conglomerados de igual tamaño. Así. y pueden resultar en situaciones practicas donde las condiciones fueran las indicadas. cuando el traslado entre las unidades primarias es barato.

M M  Tamaño promedio del conglomerado en la población N y i  total del conglomerado i-ésimo n m i Tamaño promedio del conglomerado en la muestra. por lo tanto. m i n ESTIMACIÓN DE LA MEDIA POBLACIONAL N y i Por definición la media poblacional es:  = i 1 N m i i n y i Luego. la estimación de la Media Poblacional es: ̂  y  i 1 n m i 1 i Este estimador de la media tiene la forma de un estimador de razón. M puede ser estimado n con m i m i n El límite para el error de estimación es:  N n   ( y  ym ) i i 2 e  B  t k Vˆ ( y )  t k  2   NnM  n 1 52 . entonces. la varianza de la media tiene la forma de la varianza del estimador de razón. así: n   y  ym  i i 2   N  n Vˆ ( y )    i  NnM  n 1 Si se desconoce el total de elementos en la población M.

Por lo tanto. así como en el muestreo aleatorio simple. el cual no depende de M : n N ˆ  Ny t  n y i 1 i donde: N/n =factor de expansión 53 . el total puede ser estimado por: n y i ˆ  My  M i 1 n m i 1 i La varianza estimada de ˆ  My : n  y  ym i  2 i  N n Vˆ  My   M 2Vˆ  y   N 2   i 1  Nn  n 1 El límite para el error de estimación es: n  y  ym i  2 i  N n e  B  t k Vˆ ( y )  t k N 2   i  Nn  n 1 Observe que este estimador ˆ  My es útil solo cuando se conoce M el total de elementos de la población. por tanto se debe utilizar otro tipo de estimador. Sin embargo. a menudo ese número de elementos de la población no se conoce.Los límites de confianza son: y  e En el muestreo por conglomerados Monoetápico distinguiremos dos casos: 1. 2. Todos los conglomerados son de igual tamaño. Todos los conglomerados son de tamaño diferentes ESTIMACIÓN DEL TOTAL POBLACIONAL El total poblacional  puede ser determinado por M porque M denota el total de elementos en la población.

M   mi i 1 Los estimadores de  y  poseen propiedades especiales cuando todos los tamaños de los conglomerados son de igual tamaño. 54 . sin embargo. es decir. pues tiene la ventaja de que N no es necesario conocer el tamaño de la población. n 2 2. este estimador es a veces utilizado. n i 1 La varianza estimada de ˆ  Ny t : n  y  yt  2 i  N n Vˆ  Ny t   N 2Vˆ  y t   N 2   i 1  Nn  n 1 El límite para el error de estimación es: n  y  yt  2 i  N n e  B  t k Vˆ ( Ny t )  t k N 2   i  Nn  n 1 Este estimador ˆ tiene a menudo el inconveniente de ser poco preciso. las medias de los conglomerados varían poco y los mi varían mucho. Los estimadores del Total Poblacional ˆ  My y ˆ  Ny t son equivalentes.  m N  m : 1. El estimador y es un estimador insesgado de  .. también varia mucho de unidad a unidad y entonces V ˆ  es muy grande. 1 n yt   yi es el promedio de totales de conglomerado para la muestra seleccionada. m1  m 2  . pues por lo general. En este caso el total del conglomerado yi = mi y i . La varianza estimada  N n    y  ym i i es un estimador insesgado de la Vˆ  y    2  i  NnM  n 1 N 2 varianza poblacional  N n    y  ym  i i V  y   2  i  NnM  n 1 3..

ˆ  Ny t 2 N t n 2 . ˆ  My N 2 c n . se tiene que el tamaño de muestra es: N 2 c n . Para estimar el Total Poblacional. SELECCIÓN DEL TAMAÑO DE MUESTRA 1. donde ND   t 55 . donde  Nn   N n   N n  V  y    2  c2 es la varianza poblacional y Vˆ  y    2 S c2 es la varianza estimada. donde ND   2 c  e2  D   2  M 2 es la varianza anticipada t   2. En este caso tenemos dos tipos de estimadores: a. donde ND   2 c  e2  D   2 2  t kN  b.  NnM   NnM  Al despejar de la formula del error de estimación el valor de n. Para estimar la Media Poblacional: Por definición el error de estimación es:  N n 2 e  B  tk V  y  tk   c  t k V  y  .

esta varianza es estimada por  y i  yt  que es la cuasivarianza de S  t 2 i 1 n 1 totales de conglomerados en la muestra. El estimador usual en la proporción es el número de éxitos en la muestra entre el total de la muestra. su varianza es V  pˆ    c . Este estimador lo podemos considerar como un estimador de razón como el de la media. ESTIMADOR DE LA PROPORCIÓN La proporción es un parámetro muy frecuentemente estimado en las investigaciones por muestreo. La proporción no es mas que la media de una población dicotómica. donde: NnM 2 c  2 N 1 N n 2 Y el estimador de la varianza de la proporción es Vˆ  pˆ   Sc NnM 2 Donde: n a  pˆ mi  2 i S c2  i n 1 SELECCIÓN DEL TAMAÑO DE MUESTRA PARA ESTIMAR LA PROPORCIÓN Para obtener el tamaño de muestra para estimar la proporción se fija el error máximo admisible e=B y el multiplicador de confianza t k . 56 .  e2  D   2 2  t kN  n 2  t2 . N i  ai  pˆ mi  2 N n 2 Y así. n a i 1 i Como estimador se utiliza pˆ  n donde ai es el total de “éxitos” en el i-ésimo m i 1 i conglomerado. visto anteriormente.

y (c) De otras estimaciones.Por definición este error es: B  e  t k Vˆ  pˆ  Al elevarlo al cuadrado se tiene:  e2   e2  N n 2 e 2  t k Vˆ  pˆ    2   Vˆ  pˆ    2   NnM  c 2  tk   tk  Al despejar se encuentra el tamaño de muestra: N c2 N c2 n 2  e ND   c2 N M 2   2 c t2 D= es la varianza anticipada La varianza  c puede ser estimada por S c o proviene de: 2 2 (a) Muestras pilotos. (b) Censos anteriores. 57 .

Scheaffe. 58 . R. Sharon. Mendenhall. W. Duxbury Press. (2000) Muestreo: Diseño y Análisis. Boston. W. México. BIBLIOGRAFÍA Cochran. Madrid.. Lohr. L. (1991) Elementos de Muestreo. y Ott. Pérez. (1980) Muestreo. International Thomson Editores. Trillas. César. (2000) Muestreo con aplicaciones informáticas..