DISEÑO DE MUESTREO

Los estudios de consumo, oferta y abastecimiento de dendrocombustibles se realizan fundamentalmente utilizando técnicas de muestreo. Esto significa que a través del estudio de un pequeño grupo (muestra) elegido aleatoriamente, se obtienen datos de las variables de interés de un grupo de mayor tamaño (universo6), para después inferir sobre el comportamiento de esas variables en el universo. Esto es así porque hacer estos estudios en todo el universo, con excepción de aquéllos muy pequeños, tiene altos costos.
6

El "universo" también es llamado "población' en estadística.

3.1 Universo
El universo debe ser definido desde los objetivos del estudio y puede serlo en términos geográficos (una localidad, un municipio, un distrito, una provincia, un país o cualquier otra categoría intermedia) o en términos sectoriales (la población urbana, las industrias de cerámica, los productores de leña). También se debe dar límites temporales a la definición del universo, porque su composición y características pueden cambiar con el correr del tiempo. Se recomienda que el universo tenga límites espaciales coincidentes con las agrupaciones estándares, de uso común, u oficiales de cada país (políticas, administrativas, naturales, etc.), para que sea posible estimar sus dimensiones a partir de bases de información ya existentes. El universo se define en forma preliminar al inicio del diseño metodológico de un estudio, para después precisarlo al conocer su tamaño y distribución espacial y temporal, a través de la revisión de informaciones existentes. La redefinición del universo puede significar ampliarlo o reducirlo. El primer caso puede ocurrir cuando se reconoce que existe un área con uso importante de dendrocombustibles o donde hay oferta real o potencial de ellos. La eliminación de áreas del universo puede deberse, por una parte, a que sea tal la carencia de información sobre la demanda o la oferta, que su incorporación al estudio lleve a un error mayor que su eliminación; y por otra, a que se reconozca que alguna localidad o área no forman parte del universo por no contar con usuarios de importancia.

3.2 Marco muestral
Una vez definido el universo, se debe recabar información, lo más exacta posible, de sus dimensiones y distribución espacial y temporal, para con ello poder construir el marco muestral, que es la base para hacer el diseño de muestreo. El marco muestral es la información que ubica y dimensiona al universo y puede consistir de censos de vivienda y mapas agrupados por localidades, barrios, repartos, etc.; mapas de cobertura forestal con agrupamientos por tipos de vegetación o usos del suelo; listados de viviendas en localidades pequeñas, etc. La construcción del marco muestral se detalla en los apartados referentes a las variables generales de la demanda, oferta y abastecimiento (Capítulo 2).

3.3 Unidad de muestreo
Un concepto básico en la teoría del muestreo, que debe definirse claramente para construir el marco muestral, es la unidad de muestreo, que es la unidad mínima de observación de la que se obtendrá información de las variables útiles. Por convención estadística, se usará "N" para referirnos al número de unidades de muestreo que integran el Universo y "n" para el número de unidades de muestreo en la muestra. Para cada sector la unidad de muestreo más conveniente se

indica en la Tabla 3.1. Otras unidades de muestreo pueden ser definidas de acuerdo a los objetivos de los estudios. Tabla 3.1 Unidad de muestreo según el grupo temático y sector o ramo de estudio. Grupo Sector o ramo Residencial - urbana Demanda - rural Industrial Comercial Institucional Oferta Directa Indirecta Productores Abastecimiento Transportistas Comercializadores Después de haber definido el universo y la unidad muestral, y de contar con un marco muestral, el diseño del muestreo consiste de dos grandes etapas: definición del tipo de muestreo y determinación del tamaño de muestra. Productores empresas individuales, Parcela Establecimiento Establecimiento Vivienda Unidad de muestreo

3.4 Tipos de muestreo
Existen diferentes tipos de muestreo, pero todos se basan en el principio de aleatoriedad. Para poder hacer inferencias válidas de lo que ocurre en un universo a partir de una muestra es necesario que ésta sea representativa de él, lo cual se logra con la aleatoriedad y con un tamaño suficiente de la muestra. La base de la inferencia estadística es la aleatoriedad. Esto significa que todos los elementos del universo tengan la misma oportunidad de ser elegidos para componer la muestra. Si no se los eligiera aleatoriamente se corre el grave riesgo de tener resultados NO representativos de toda la población, sino de un sector de ella. A esto se le llama sesgo. Un ejemplo de sesgo por elección NO aleatoria en un inventario de recursos leñeros, es elegir las parcelas cercanas a las vías de acceso. Por esa condición, es muy probable que sean las más explotadas y que tengan menores existencias de madera. Así, hacer la extrapolación al Universo de los resultados de esta muestra NO aleatoria, llevaría a una subestimación de las existencias. El tamaño de la muestra es dependiente de la variabilidad del fenómeno a estudiar, del nivel de confianza fijado y del error admisible. Un error muy común es la afirmación de que, para que una muestra sea representativa de un Universo, debe ser de un tamaño directamente proporcional a su tamaño, es decir, que a mayor tamaño de¡ Universo debería ser mayor el tamaño de la muestra. Adelante se detallará la forma de obtener el tamaño de muestra.

3.4.1 Muestreo aleatorio simple

Consiste en elegir en forma aleatoria "n" unidades muestrales (UM) del universo. El proceso debe otorgar la misma oportunidad de selección a todas las UM en una sola ocasión. Se asigna un número a cada UM y se selecciona la muestra aleatoriamente con ayuda de tablas de números aleatorios, calculadoras, sorteo, etc. Esta técnica solo puede ser aplicada cuando se dispone de un marco muestral completo, que incluya a todas las UM, y éstas puedan ser reconocidas e identificadas sin dificultad en el terreno. Por ejemplo, un listado telefónico, o una lista de domicilios con identificación de calle y número, o nombre del ocupante de la vivienda. En el caso de muestreo de recursos naturales, suele ser difícil identificar o localizar exactamente a las parcelas sorteadas, ya que se necesita un mapa detallado e instrumentos de localización geográfica de precisión adecuada. Cuándo se debe usar el muestreo aleatorio simple:     Cuando se sabe que la variable de mayor interés se distribuye aleatoriamente en el universo. Para universos pequeños (no más de 200 UMs). Para universos de poca dispersión geográfica. Cuando no se conoce el patrón de distribución para la variable de interés.

Muestreo aleatorio simple Universo - 70 ladrilleras en una ciudad - Todas son pequeñas, con producción entre 30 mil y 60 mil ladrillos por año Marco Muestral - Listado de establecimientos de la Oficina Municipal Tributaria Unidad Muestral - Establecimiento Selección aleatoria - Se numeran los establecimientos y por medio de un sorteo o usando números aleatorios se eligen "n" establecimientos para entrevistar

3.4.2 Muestreo aleatorio estratificado
Este tipo de muestreo se utiliza cuando el universo original, de tamaño N, es fragmentado en estratos relativamente homogéneos en cuanto a la variable de interés. Esto es aconsejable siempre que la variación entre estratos sea mayor que la interna de cada estrato. A cada uno de estos estratos se les trata independientemente como un universo, en cuanto al método de selección de las UM y de estimación de parámetros. Al interior de cada estrato, las UM se pueden seleccionar en forma aleatoria, por conglomerados o sistemáticamente. El muestreo estratificado permite mejorar la precisión de las estimaciones con menor esfuerzo de muestreo, caracterizar a cada estrato por separado y facilitar la coordinación del trabajo de campo.

Parcela (de tamaño específico para cada uso del suelo) Selección aleatoria . es posible obtener datos de ellas por fuentes secundarias o por variables indicadoras.Mapa de uso del suelo a escala 1:20 000 Unidad muestral . acahual o capuera) Marco muestral . ¿Cuándo se debe usar el muestreo estratificado?   Se usa principalmente en poblaciones donde se supone o se conoce que la distribución de la(s) variable(s) de mayor interés es diferente entre subpoblaciones fácilmente identificables. Por su baja eficiencia del muestreo.Elección de "n" parcelas al azar dentro de cada estrato (uso del suelo) 3. con menos de 200 UM y variables de distribución normal. Para tomar la decisión de hacer un muestreo estratificado existen criterios generales. En el grupo de oferta directa la estratificación se hace por tipo de fuente. y abastecedores.Potreros (3 000 ha) . Para el grupo de oferta indirecta. Muestreo aleatorio estratificado Universo . productores. transportistas y comercializadores) se usa el volumen de producción o comercialización.Vegetación secundaria (5 500 ha de manigua. que los estratos deben ser reconocibles más allá de¡ grupo que hizo el estudio y que debe conocerse el tamaño del estrato. NO se recomienda aplicarlo en universos pequeños.Bosque natural (3 000 ha) . Como se trata de variables que se deben conocer antes de hacer el estudio. clase de cobertura o de uso de¡ suelo.4. No es recomendable formar muchos estratos. la saturación y el consumo son las variables que en primera instancia deben definir la pertinencia de estratificar. pues se complicaría innecesariamente el estudio a campo y el análisis de datos.Cercos vivos (4 000 ha) .Es muy importante considerar que las unidades de muestreo deben pertenecer a un solo estrato. En el grupo de demanda de dendrocombustibles.3 Muestreo por conglomerados Un conglomerado es un conjunto espacialmente compacto de UM. . lo cual se detalla en el Capítulo 2.15 500 ha de tierra donde se produce leña en diferentes Usos del Suelo Estratos .

y los restantes no tienen la misma probabilidad de ser incluidos en la muestra. La selección de la primera UM es aleatoria y las siguientes se eligen con un intervalo regular de UM.4.Manzanas (cuadras) Marco muestral .4 Selección sistemática Este no es propiamente un tipo de muestreo y es conveniente considerarlo como un esquema de selección regular de muestra. distancias o tiempo. Su limitación teórica consiste en que sólo el primer número se selecciona al azar. en ciudades grandes donde no se tienen listados de viviendas Cuando se dificulta el acceso a las UM. En cada una de ellas se visita a todas las viviendas 3.Número total de viviendas en la localidad . Su ventaja reside en que facilita la localización de UM en lugares donde hay dificultad de acceso y en que permite visitar UM que no se encuentren definidas en el marco muestral.Localidad con 650 viviendas distribuidas dispersamente en un área grande y con un trazado regular de calles. falta de caminos o en terrenos abruptos. ¿Cuándo se debe usar el muestreo por conglomerados? . Por ejemplo. ¿Cuándo se debe usar la selección sistemática?   Cuando no hay posibilidad de identificar en el marco muestral a cada una de las UM. Por ejemplo. en un inventario forestal.Croquis de la localidad con el trazado actualizado de calles y una estimación promedio del número de viviendas por manzana Unidad muestral .Viviendas Selección aleatoria . Muestreo por conglomerados Universo . por distancias.Los conglomerados se seleccionan aleatoriamente y dentro de cada uno se estudian todas sus UM o se hace un muestreo de ellos. Conglomerados . .Se aplica cuando existe alta dificultad para llegar a todas las UM del universo debido a una gran dispersión espacial o a tener barreras físicas de acceso.Se numeran las "manzanas" y se eligen al azar.

. t2 a ? )/ e2 (1) en términos de varianza y error absoluto ó no = (cvz . t2 a ? )/ e2 en términos de cv y error relativo donde: no = tamaño de la muestra s2 = varianza de la muestra 2 t a ? = valor crítico de la distribución t de Student. según sean las características de los sectores o ramos considerados y el grado de compromiso aceptado entre la precisión y el costo de ejecución del estudio.Ciudad con 3 000 viviendas distribuidas espacialmente en forma compacta Marco Muestral . el nivel de confianza fijado y el nivel de error aceptable. Selección sistemática Universo . con un nivel de significanciaa y? grados de libertad e = error aceptable cv = coeficiente de variación = desviación estándar de la muestra/ media muestral n = grados de libertad = n . Por ejemplo.Se determina el intervalo de visita a las viviendas dividiendo el número total de viviendas por el número de viviendas a muestrear. Esto se resume en la siguiente fórmula7: no = (s2 . Combinación de tipos de muestreo En un mismo estudio o diagnóstico.Croquis de las calles de la ciudad .1 .Número total de viviendas (actualizado) Unidad Muestral .5 Tamaño de la muestra El tamaño de la muestra debe definirse independientemente para cada universo. en función de tres factores: la variabilidad de la variable numérica más importante. en el sector residencial puede optarse por un muestreo estratificado bietápico con conglomerados. homogéneo y compacto se elija un aleatorio simple. es posible combinar diferentes tipos de muestreo. en tanto que para un ramo industrial pequeño.Vivienda Selección sistemática .La primera vivienda se elige al azar y las restantes se visitan de acuerdo al intervalo calculado 3.

para universos pequeños. (2) . e inversamente proporcional al cuadrado del error. se precisa el tamaño de la muestra.05(2). en un bosque tropical húmedo con la misma superficie que un bosque templado de pino. el tamaño de muestra será mayor en el primero porque es sabido que tiene más heterogeneidad en la variable existencia de madera que el bosque de pino. El error aceptable (e) se refiere a la diferencia que se permite entre la media de la muestra y la media del universo. Estos dos valores son los datos de entrada de las tablas de t.con los datos de una muestra preliminar o de algún estudio previo. Para este tipo de estudios es suficiente con un nivel de confianza de 0. y/o c) el error aceptable sea bajo. en donde el valor de n obtenido con la Fórmula 1 se utiliza para encontrar el valor de t.M. partiendo de iguales niveles de confianza y error aceptado. menores a 120 U. lo cual puede expresarse también en valores absolutos con las unidades de medición de la variable en cuestión. Sin embargo. Así.Para la definición del tamaño de muestra de cualquier sector o ramo de demanda de dendrocombustibles. el tamaño de la muestra será pequeño si encontramos un fenómeno poco variable. el nivel de confianza (1-a). que equivale a a = 0. con calculadora o con Excel. por medio de un proceso iterativo. definiéndose primero el nivel de significancia (a) o su complemento.La varianza (s2) o el coeficiente de variación (cv) indican el grado de heterogeneidad u homogeneidad de la variable de interés en la muestra y se los calcula -manualmente.95. El tamaño de muestra será grande cuando: a) el fenómeno en estudio sea muy variable (varianza o coeficiente de variación alto). En cambio. se recomienda utilizar la variable consumo unitario. Con ello queda demostrado que el tamaño de una muestra NO depende del tamaño del universo. es necesario corregir el valor de no obtenido de la Fórmula 1. fijamos una confianza baja y se acepta un error alto. Además. El valor crítico de t se obtiene de tablas en libros de estadística de Excel. Posteriormente. Variables para calcular el tamaño de muestra . se debe fijar preliminarmente un número de casos de la muestra (n) para definir los grados de libertad (? = n-1). corregido por población finita. Hasta ahora no se ha considerado el tamaño del universo para determinar el tamaño de muestra. En esta fórmula se aprecia que el número de elementos que componen la muestra es directamente proporcional a la varianza y al valor de t cuadrado. por ejemplo. a través del uso de la Fórmula8: n = no/(1 +( no -1/N) donde: no = tamaño de muestra obtenido en la fórmula anterior N = tamaño del universo n = tamaño definitivo de muestra En el Anexo III se muestra una tabla con el cálculo del tamaño de muestra en el sector residencial. b) el nivel de confianza fijado sea alto. que por un gran número de estudios de caso se conoce su coeficiente de variación. para la variable consumo específico de leña. Se fija de acuerdo al conocimiento previo que se tiene del fenómeno y es aconsejable que se encuentre entre el 10% y el 20%..

ramo o estrato. . como Zar 1999. etc. pero se recomienda el uso de la primera por haber más información secundaria y ser más fácil de medir en un muestreo preliminar. todas expresadas por unidad de tiempo. plantaciones. que está muy correlacionado con el consumo unitario.) se debe usar el volumen de producción por unidad de tiempo. . las variables relevantes pueden ser la existencia o la productividad.En los sectores de abastecimiento. despejando e de la Fórmula1. Fórmula usada para determinar el tamaño de muestra necesario para estimar la media poblacional.En los sectores o ramos de oferta indirecta(aserraderos. carpinterías. para lograr en ellos mayor precisión en la estimación. y Steel y Torrie 1988. etc. humanos y tiempo) para ejecutar el estudio a campo. con los comercializadores el volumen de venta y con los transportistas la capacidad de transporte.. puede utilizarse el área basa¡ (G).Para la oferta directa (bosques. es forzoso estudiar un mínimo de 10 unidades de muestreo por sector. Si no hay datos sobre existencias. . Se recomienda tener como apoyo algunos libros de estadística.En los sectores industrial. con los productores es conveniente usar el volumen de producción de dendrocombustibles. pues en pruebas de hipótesis para diferencias entre medias y varianzas existen otras fórmulas. comercio e institucionalno siempre es posible tener datos sobre consumo unitario. En aquellas situaciones en que no sea posible cubrir el tamaño de muestra derivado del cálculo estadístico. 7 8 Llamada "corrección por población finita". reportando en el informe del diagnóstico el error de estimación. La decisión final sobre el tamaño de muestra dependerá del compromiso entre la precisión esperada en la estimación y la disponibilidad de recursos (monetarios. Cochran 1977.). Se recomienda que los sectores o ramos con mayor importancia en demanda. . por lo que puede usarse el volumen de producción por unidad de tiempo. oferta y abastecimiento de dendrocombustibles se privilegien en la asignación de recursos para el estudio a campo.

integración de los equipos o brigadas de levantamiento de datos y asignación de responsabilidades. los objetivos pueden ser modificados. decidir el nivel de aproximación del estudio (estudios rápidos o detallados). y la redacción del informe final: a) La primera etapa es la definición de los objetivos del estudio. se elegirá el nivel de aproximación del estudio: rápido o detallado. que deben ser claros. los recursos monetarios. 4. c) De acuerdo a los objetivos. planeamiento de las rutas de levantamiento de datos y programación del trabajo en campo.2. 4. humanos y tiempo disponibles. será necesario hacer el diseño del muestreo. La información obtenida de esta revisión servirá para precisar los objetivos. elegir las variables a analizar y las técnicas de obtención y procesamiento de datos. En los objetivos debe precisarse también el ámbito del estudio. pero nuevamente las indicamos.2 Levantamiento de datos En este punto ya es posible hacer el diseño del levantamiento de datos en campo y se prepara la lista de ejecución de actividades que deben considerar los siguientes aspectos:      construcción de los instrumentos de registro de datos. y de la calidad de los antecedentes en el tema. se debe hacer la selección de las variables a analizar (Capítulo 2). b) Posteriormente se debe hacer una buena revisión de antecedentes.EJECUCIÓN DEL ESTUDIO 4. profundizando en los puntos referentes al levantamiento de datos en campo. tanto geográfico como sectorial. concisos. Conforme el estudio se desarrolla y sobre todo. su procesamiento y análisis. e) Si se opta por un estudio detallado. Éstas se han mencionado y tratado con mayor detalle en la Introducción y en los Capítulos precedentes. cuando se hace la revisión de antecedentes. d) Con base en los objetivos. capacitación del personal en levantamiento de datos en campo y procesamiento de información. alcanzables y contemplar las necesidades de todos los grupos de interesados. recomendaciones generales para el manejo de la información. para lo cual es preciso contar con una muy buena base de información como marco muestra¡ (Capítulo 3).1 Construcción de los instrumentos de registro de datos: .1 Diseño del estudio El diseño del estudio lleva varias etapas.

Algunas recomendaciones para el diseño de cuestionarios son:  El tipo y número de preguntas que contenga dependerá de las variables a analizar. etc. Éstas entrevistas utilizan cuestionarios. Para formular el cuestionario definitivo es necesario probar uno preliminar con una pequeña muestra de la población destino. En el Anexo IV. Se usan cuando el entrevistado es una persona de alta jerarquía o que tiene desconfianza para brindar la información. _ Entrevista estructurada. _ Diaqnósticos rápidos participativos. En lo posible. En el Anexo V se muestran algunos tipos de planillas de registro de datos. cuando no se quiere tener una entrevista muy formal. unidades locales. Se recomienda que sea breve. ya que éstas se presentan muy comúnmente en este tipo de ejercicios . se muestran algunos ejemplos de cuestionarios. No se debe incorporar preguntas que no tengan relación directa. las preguntas deben ser de respuesta cerrada. productores o comercializadores. Para asegurarse que las planillas sean completas. es necesario que se cotejen las variables asentadas en ellas con las planteadas en los objetivos del estudio. Su utilidad es que brinda una visión rápida de conjunto sobre el tema de interés. Las preguntas abiertas son muy útiles para detectar opiniones. pues con ello se logra reconocer la variabilidad de respuestas posibles o situaciones no consideradas originalmente. el diagnóstico rápido participativo y el regístro de informaciones secundarias y primarias. Cuando se trabaje con muestras muy grandes y con preguntas complejas. usando vocabulario sencillo y con una secuencia de preguntas de acuerdo a la lógica del entrevistado. En estudios detallados se utiliza la entrevista estructurada y planillas registro de datos de informaciones primarias.    _ Planillas de registro de datos. pesos específicos de madera. También es conveniente que se prueben en campo antes de considerarlas definitivas. a manera de "guía de preguntas". tales como tamaños de población. Consiste en la obtención de informaciones cualitativas con la participación colectiva de los sectores de usuarios. como es el caso de entrevistas a comerciantes de dendrocombustibles o a industrias usuarias. alturas y especies de árboles en parcelas de inventarios forestales. _ Entrevista no estructurada. diámetros. abastecimiento y en algunos casos de oferta indirecta. Sirven para registrar informaciones primarias y secundarias. Los cuestionarios pueden ser muy sencillos. Son aquéllas en las que se tiene un idea general de los temas de interés y que no lleva una secuencia preestablecida. Debe utilizarse solamente cuando se tengan vínculos muy estrechos con los participantes y exista la posibilidad de responder a sus expectativas. poder calorífico de combustibles. pues su procesamiento es más sencillo. Los cuestionarios más elaborados se usan en encuestas y censos donde el número de casos es grande (mayor a 30) o cuando hay más de tres encuestadores. para estas variables no se recomiendan las preguntas de respuesta cerrada. Sirven para tener una visión preliminar del tema. percepciones y preferencias.Para estudios rápidos las herramientas más comunes son la entrevista estructurada y no estructurada a informantes calificados. Se usan para la obtención de datos de demanda. Es muy importante que contengan todas las variables a registrar. es conveniente que las preguntas tengan instrucciones precisas de aplicación que queden resaltadas en el cuestionario.

CIDE-WRI et. 4. como son consumo. et. que se basará en el total de trabajo a realizar. Este tendrá la responsabilidad de asegurar el cumplimiento de las actividades programadas. Durante la capacitación debe ponerse énfasis en el correcto uso de las técnicas de obtención de datos y particularmente en las referidas a la aplicación del cuestionario y las mediciones directas. cuya aparición en campo o en el procesamiento de datos es muy común.. Antes de salir a campo es necesario contar con todos los materiales y equipos del levantamiento.al.4 Integración de los equipos o brigadas de levantamiento de datos y asignación de responsabilidades Al integrar las brigadas o equipos de trabajo en campo es muy importante que se definan las responsabilidades de cada integrante. Los cuestionarios deberán ser numerados antes de salir al campo.. Existen técnicas específicas que se pueden encontrar en publicaciones especializadas (ver McCraken. el diseño de muestreo. o el área de trabajo es muy extensa. con la finalidad de garantizar mayor calidad de datos. recabar la información con calidad y apoyar al supervisor en la revisión del registro de datos.3 Capacitación del personal en levantamiento de datos en campo y procesamiento de información.colectivos. Si en el estudio se incluyen análisis de la demanda. Es necesario que cada equipo cuente con un supervisor. las técnicas de obtención de datos y su procesamiento. WRI-GEA. primero con una numeración consecutiva y única por sector. las variables a analizar.2 Planeamiento de las rutas de levantamiento de datos y programación del trabaio en campo. resolver situaciones no previstas en el diseño y revisar la calidad de las informaciones recabadas día a día. 1988. el rendimiento del equipo de trabajo y el tiempo dedicado a traslados. 1990. Un elemento de apoyo para la programación del levantamiento es un cronograma de actividades. Al término de la capacitación tiene que hacerse una prueba de homogeneidad de registro de datos. proveer los materiales necesarios. que consiste en comparar los resultados de aplicar un cuestionario y/o realizar las mediciones directas con los mismos usuarios (en entrevistas colectivas) o unidades de muestreo. localidad y barrio. es conveniente localizar en un mapa todas las áreas de levantamiento de datos y programar rutas de trabajo donde coincidan diferentes sectores.al. Con esta actividad se espera que todas las personas que participen en el levantamiento de datos y el procesamiento conozcan con claridad los objetivos del estudio. pues de esta manera se logra mayor eficiencia de trabajo y calidad de datos. De esta manera se puede obtener el mayor número de datos en cada viaje.2. Siempre que sea posible es conveniente que el levantamiento de datos en campo se concentre en un periodo corto.2. Esto es de utilidad para que puedan resolver situaciones no previstas en el diseño. Cuando las respuestas o mediciones sean iguales o semejantes entre los participantes. J. porque se espera que en ambas actividades participen las mismas personas. Cada uno de los demás miembros será responsable de tener siempre los materiales y equipos individuales de trabajo. además de las indicaciones referentes al estrato. medición de árboles y pesado de unidades locales. 4. 1993). .y el supervisor se puede considerar que la calidad de registro de datos es adecuada y confiable.2. contenido de humedad. 4. Nótese que se habla tanto de levantamiento de datos como de su procesamiento. oferta y abastecimiento.

Esto es fundamental. c) cada encuestador debe guardar los cuestionarios y hojas de registro en bolsas de plástico cerradas herméticamente. 4. Si es necesario capacitarse en el uso de Excel.3.5 Recomendaciones generales para el manejo de la información Para asegurar que la información obtenida en campo no se pierda. El ingreso de datos y su procesamiento debe hacerse inmediatamente después del levantamiento en campo. La alternativa de diseñar una base de datos o un programa específicos se desaconseja: la ventaja de una mayor potencia de análisis que podría tener un programa especialmente diseñado no compensa las desventajas asociadas al costo y tiempo de su desarrollo. todas las planillas y registros de campo deben fotocopiarse y concentrarse en la oficina donde se hará el procesamiento.2. pues con el agua se borran. de difusión universal y conocido por muchísimas personas. Para ello debe reunirse todo el equipo para entregar los cuestionarios y planillas de registro al supervisor y apoyarle en su revisión. con lo cual se pueden ajustar las actividades posteriores. los propios encuestadoresmedidores podrán resolverlas. pues con el paso del tiempo la memoria es menos confiable. porque cualquier tinta se borra con el agua. Una computadora personal que cuente con Office de Microsoft es suficiente. porque al presentarse dudas sobre el significado de ciertas respuestas. 4. Estas sesiones al final de cada día también sirven para intercambiar impresiones sobre el trabajo.3 Procesamiento y análisis de datos Un vez terminado el levantamiento de datos en el campo debe iniciarse su procesamiento y análisis. . 4.2 Construcción de la base e inqreso de datos La base de datos se construye en hojas de cálculo de Excel. de forma tal que todos los campos queden llenos y se corrijan informaciones inconsistentes. evitando las desventajas antedichas. El diseño y ejecución de esta actividad son más complejos que los levantamientos de demanda y abastecimiento. para evitar desligarse del tema. Son adecuadas las fotocopias y las impresiones láser. el uso de funciones. Por ello es que en el Anexo VI se presenta una guía rápida para resolver las tareas fundamentales de estas actividades. Se recomienda que las personas que hicieron el levantamiento de datos se encarguen también de su ingreso a la base digital. b) siempre se debe escribir con lápiz de grafito. hay que seguir cuatro recomendaciones: a) los cuestionarios y planillas de registro que van a campo NUNCA deben ser impresas con impresora de chorro de tinta. se recomienda concentrarse en aprender cómo se introducen fórmulas. Se desaconseja totalmente que las revisiones se hagan varios días después de levantada la información. Un programa comercial como MS Excel es suficientemente potente. y d) en cuanto sea posible. la subsiguiente dependencia del programador y la necesidad de entrenar a los usuarios. 4.Es fundamental que como parte del programa diario de trabajo se haga una sesión de revisión de la información.3.1 Equipo y programas para el procesamiento de datos Los datos se procesarán en computadora. El Inventario de recursos leñeros. el uso de filtros y la generación de tablas dinámicas y gráficos. la ordenación de datos.

En preguntas de respuesta múltiple. se debe usar una columna para cada respuesta (ver ejemplo en recuadro). En la hoja de cálculo cada encabezado de columna será una variable o respuesta. "tablas dinámicas" y "gráficos". Esta hoja se llamará "Base". El uso de Excel facilita el ingreso de respuestas completas que se repiten. Por ejemplo. incluyendo a todos sus estratos.En un "libro" de Excel se ingresará la información de un sector de usuarios. ya que pueden no ser comprensibles para otros usuarios de la base o al paso del tiempo se puede olvidar su significado. forma de obtención de los combustibles. etc. La primera "hoja de cálculo" incluirá todos los datos primarios del sector. en cada hoja de cálculo pueden quedar los datos de cada estrato o incluso de cada parcela.. pues así se facilitan las posteriores. "marabú" y "marabu". En el caso de inventarios forestales. comercializadores o productores. las bases de datos se construirán de acuerdo a las necesidades y comodidad de los usuarios. Excel las considerará como respuestas diferentes Ejemplo de base de datos de la encuesta al sector residencial ¿Con qué cocina alimentos o hierve la ropa? Unida Periodici Cantid d Número Provin Estra dad de ad que Local consecut Compr compra compr cia to de ivo a (días) a compr Leñ Kerose GL Comp Recole a a ne P ra cta recole cta 1 2 3 4 5 6 San Juan San Juan San Juan San Juan San Juan San Juan 1 1 2 2 2 3 x x x x x x x x 30 45 60 20 1 1 1 1 20 kg 20 kg 30 kg 10 kg x 15 2 Paque te ¿Cómo consigue la leña? . como unidades locales o pesos específicos. como es el caso de especies usadas como leña. Las otras hojas que contendrá el libro serán: "campos calculados". pues tiene una memoria que pre-escribe la posible respuesta. Se desaconseja totalmente el uso de códigos para ingresar las respuestas. búsquedas de los datos originales. Para otro tipo de variables. si éstos son muchos. Al ingresar los datos hay que asegurarse que se registre primero el número consecutivo del cuestionario. Para los análisis posteriores es muy importante que la sintaxis de las respuestas sea uniforme. si se ingresa como un mismo tipo de respuesta "Marabú".

Con esta actividad se espera tener reportes de resultados presentados en forma sintética a diferentes escalas (unidad muestra¡. abastecimiento y oferta indirecta. En el caso de los datos de demanda. Para pocos datos se puede hacer visualmente. Los campos calculados más comunes. Para la oferta directa (inventarios forestales) los cálculos se harán primero para cada uno los elementos de las unidades muestrales (árboles dentro de las parcelas) y posteriormente para cada parcela. se presentan en el Anexo VII.7 San Juan San Juan 3 x x x x 30 1 Carga debur ro Rajas 8 3 x x x 2 10 Al término del ingreso de datos se debe hacer su validación para detectar errores en la digitación. según sector.3 Procesamiento de datos El procesamiento de datos involucra una serie de cálculos a partir de los datos obtenidos de fuentes secundarias o primarias. 4.3. establecimiento de usuario. productor). Las etapas del procesamiento son el cálculo de campos y la generación de reportes de resultados primarios y secundarios. para impedir su modificación involuntaria. Al detectar datos fuera de rango se debe regresar a los cuestionarios o planillas de registro originales para identificar el carácter del error y decidir si es posible corregirlo. sin omitir ninguna variable. En Excel es posible visualizar datos anómalos utilizando la función "ordenar". obtenidos por cuestionario. El tener completa una hoja de cálculo con datos originales y calculados permitirá hacer los reportes de resultados utilizando diferentes variables. Para facilidad del manejo de los datos es aconsejable que los campos calculados estén la derecha de la última columna de variables y no intercalados entre ellas.4 Cálculo de campos El cálculo de campos permite obtener un resultado a partir del procesamiento de los datos numéricos de cada unidad de muestreo. poniendo mucho cuidado en las variables numéricas. Como los campos calculados del inventario forestal llevan dos etapas. . los campos de "Parcelas" deberán integrarse en una nueva hoja resumen. Algunos análisis útiles y disponibles en paquetes estadísticos sencillos son las distribuciones de frecuencia. Cuando se manejen muchos datos se pueden hacer análisis exploratorios para detectar datos fuera de rango. el cálculo de campos se hará para cada unidad muestra¡ (familia. Una vez que se tiene la seguridad de que los datos son correctos. El cálculo de campos se debe hacer en una hoja del mismo libro. estratos y universo). diagramas de caja o diagramas de tallo y hoja. copiada de la hoja "Base" de datos original. 4. se debe grabar la hoja de cálculo "Base" protegiendo el archivo contra escritura.3.

abastecimiento y oferta indirecta deben presentarse desagregados a diferentes escalas: subestratos. para una mejor interpretación visual. además del digital.5 Reportes de resultados Los reportes de resultados son un resumen de los datos de las unidades muestrales.   Los Reportes de resultados para oferta directa. que puede hacerse con un análisis de varianza o una "t" de Student. en Inventarios de recursos leñeros son calculados para cada uno de los estratos de uso del suelo o tipo forestal. Por ejemplo. según algunas clases o grupos.4. Deben incluir:    para variables categóricas de respuesta cerrada: tablas de frecuencia absoluta y relativa. Una herramienta muy útil para generarlos son las tablas dinámicas de Excel. Estos reportes deben siempre tenerse en formato impreso. formas de adquisición. las principales tablas de resultados pueden presentarse como gráficos en una hoja de cálculo aparte. etc. pues su manejo para análisis posteriores es más sencillo. promedio de consumo familiar diario de leña según tipo de usuario (exclusivo de leña o múltiple). estrato y universo. a partir de los resultados finales de . análisis estadísticos de comparación de algunas variables que en los primeros reportes de resultados indiquen que hay diferencias según algún grupo de usuarios. Los reportes de resultados originados en Cuestionarios de los sectores demanda. etc. diámetro de leños según especies.3. para todas las variables numéricas y campos calculados: promedio. para variables categóricas de respuesta abierta. desviación estándar. número de casos y error estándar. un listado de las respuestas "crudas" con una agrupación por tipos de respuesta. De algunas variables y campos calculados se pueden estimar estos mismos estadísticos. Un ejemplo es la comparación de medias de consumos específicos de leña según dispositivos de combustión.

Estos reportes deben incluir: promedio. Este es el reporte principal. Las columnas que debe incluir esta tabla son: 1. se los consolida en otro reporte. productividad bruta (m 3/ha/año. superficie (ha). unidad local/ha/año). área basa¡ media (m2/ha). existencias netas (m3. t/año. volumen real medio (m 3/ha). unidades locales) (= existencias brutas x CD x CA). volumen cilíndrico (m3/ha).las parcelas medidas en cada estrato. 8. de las siguientes variables:       número de árboles. desvío estándar. biomasa leñosa en peso seco (t/ha). 4. biomasa leñosa en unidades locales. 9. 13. 11. número de casos y error estándar. tasa de crecimiento anual (coeficiente ó %). existencias brutas en volumen real. 2. biomasa leñosa en peso seco (t/ha). . biomasa leñosa en unidades locales (UUha). sinóptico. que dará una visión de conjunto sobre todos los recursos leñeros en términos absolutos y relativos. biomasa leñosa y unidades locales (son campos calculados a partir de 1 y 3. 12. productividad neta (m 3/año. tipo o clase de recurso. que es la Tabla de recursos leñeros. 10 coeficiente de disponibilidad (CD). 4. volumen real (m3/ha). 7. t. 5. coeficiente de accesibilidad (CA). para los totales y por clases diámetricas. 3. 5. 6). t/ha/año. Una vez generados los reportes de resultados primarios para cada uno de los estratos o tipos de recurso. Debe recordarse que cada parcela es una unidad muestra¡ y que el conjunto de las parcelas constituye la muestra del estrato. 6. área basal (m2/ha). unidades locales/año) (= productividad bruta x CD x CA).

Se hablará del marco de ejecución del estudio (instituciones participantes). resultados. son: objetivos. conclusiones y recomendaciones. en forma resumida. En el Capítulo 5 se habla a detalle de ellos y de cómo formularlos.En el Anexo IX se muestra un ejemplo de este tipo de tabla. son: a) Resumen ejecutivo. Pero también es posible organizarla como tabla de tendencias. Luego se puede introducir columnas adicionales para cada uno de los años o períodos futuros y mediante fórmulas sencillas (lineales para períodos cortos. se debe iniciar la redacción del informe final. En este caso la tabla es estática. la relevancia del estudio y los antecedentes en el tema.4 Redacción del informe final Una vez hecho el diagnóstico. El documento debe iniciar con un resumen del contenido para que el lector pueda tener una idea general de él. Después de que los datos se han procesado y analizado inicialmente. las herramientas e . d) Metodología. exponenciales para los mas largos). Debe contener la descripción del universo de estudio y los criterios que definieron su elección. Los puntos que contendrá. El diagnóstico puede ser parcial o integral. Deben plantearse en forma clara y concisa. si a la derecha del área para cada tipo de uso se agrega una columna con las respectivas tasas de cambio (estimadas o supuestas). 4. calcular las existencias y disponibilidades futuras. Es conveniente desagregarlos en objetivos generales y específicos. el diseño de muestreo completo y detallado. b) Introducción. porque muestra la situación en un año determinado. Adelante se precisa sobre cómo hacerlo: Los elementos que forzosamente incluirá un informe final de un estudio. es posible hacer un análisis con mayor profundidad: el diagnóstico. c) Objetivos.

los usuarios de combustibles. tablas. etc.). j) Unidades y equivalencias. informaciones personales. h) Bibliografía. Algunos resultados relevantes son tan puntuales. Deben incluir tanto unidades locales con su equivalencia al SI y unidades monetarias y su tasa de cambio a $EEUU. Para facilitar el entendimiento del texto. sino de todas las fuentes consultadas como pueden ser revistas. el modo de procesamiento de datos. Cuando en el documento se usan términos específicos. Para ello será necesario apoyarse fuertemente en las comparaciones con otras informaciones del tema. sino un ejercicio de análisis. etc. donde se integren otros elementos que sean relevantes. pero que no están directamente relacionados con los resultados del estudio. La redacción de resultados no debe ser una descripción de los gráficos y tablas. que no vale la pena incluirlos en Tablas. . Como existen diferentes formas de citarlas se recomienda que se revisen ejemplos en diversas publicaciones. y nunca a asuntos que no se han tratado en la investigación.instrumentos de obtención de datos. además de ser realizables. pero sí en el texto. a saber: los planeadores energéticos. otros documentos. l) Anexos. Se recomienda referirse a la Terminología Unificada en Dendroenergía (FAO en preparación). como pueden ser: importancia del uso de combustibles de madera. los abastecedores y los investigadores. saturación. etc. el sector público forestal y otras instituciones involucradas. Es la lista de referencias de las fuentes de información utilizadas para el estudio y mencionadas en el documento.. grabaciones. dispositivos de combustión. etc. En este apartado se deben incluir todos aquellos textos. patrones de abastecimiento y consumo. en una sección inicial del documento deben definirse los significados de todas las abreviaturas y acrónimos usados. e) Resultados. impacto ambiental. obtención de combustibles. Deben presentarse en forma muy clara y concreta. No se trata solo de libros. eficiencia de sistemas de aprovechamiento de combustibles. es muy necesario incluir un glosario. i) Abreviaturas y acrónimos. Las conclusiones se referirán a los objetivos del estudio y a los resultados más relevantes. Los resultados deberán presentar tablas y gráficos. o aquéllos que por su extensión resulta poco práctico incluirlos en el cuerpo del texto. eficiencia de dispositivos de combustión. En este capítulo se incluirán como un apartado los diagnósticos Integrales (Capítulo 5). pues el análisis a fondo ya fue hecho en el capítulo anterior. que sirven de apoyo para el análisis de informaciones dentro del texto. Por ello las recomendaciones deben ser acordes con los resultados y conclusiones. Para iniciar este capítulo es necesario precisar los grupos temáticos que se tratarán (por ejemplo. lo cual es común en este tipo de estudios. mapas. y los tiempos y costos (en trabajo y en dinero) de la aplicación del estudio en cada una de sus etapas. gráficos. las técnicas de levantamiento de datos en campo. Es aconsejable que se agrupen por líneas generales de análisis. diarios. f) Conclusiones. k) Glosario. los productores. Las recomendaciones sirven para orientar las acciones de los usuarios de la información. Es muy importante esta sección para permitir la comparación de los resultados del estudio con otros trabajos. incluyendo equipo y programas usados. Es importante que se citen completas y correctamente. impacto ambiental. g) Recomendaciones. consumo. impacto económico.

En caso de ser varios los objetivos principales se determina un tamaño de muestra para cumplir cada objetivo y entre todos ellos. que cada unidad de muestreo solo puede aparecer una sola vez en una muestra determinada. La muestra se selecciona sin repetición o sin sustitución. En la práctica. de tal manera que cada muestra posible de tamaño n tenga la misma probabilidad de ser seleccionada. cuando los elementos de la población no se pueden enumerar fácilmente. se debe utilizar una fórmula diferente para calcular el tamaño de la muestra. se elige el mayor. Las unidades de muestreo son numeradas de 1 a N. una muestra aleatoria simple es seleccionada unidad por unidad. Cuando se selecciona una muestra el objetivo es tener estimaciones para los parámetros a través de la información suministrada por la muestra. Dependiendo del tipo de estimador que se desee obtener. ( Donde: N = Población total S2 = Varianza = es el error de estimación ) ⁄ . Determinación del tamaño de la muestra Cuando deseamos estimar el tamaño de la muestra se debe tener en cuenta que los objetivos de la encuesta suelen requerir varias estadísticas y que al considerar cada una de ellas pueden llevar a un diseño diferente. para determinar el tamaño de la muestra se debe elegir el principal objetivo y calcular el tamaño de muestra necesario para cumplir dicho objetivo. es decir. del grado de variación o dispersión de la variable a estudiar y del error de estimación. el tipo de muestreo utilizado se llama irrestricto aleatorio. a continuación se seleccionan n números entre 1 y N. Este tipo de muestreo se utiliza cuando: la población es más o menos homogénea con respecto a las características que se desean estudiar. cuando las estimaciones que se deben obtener se refieren a todo el conjunto y no a subgrupos de la población.MUESTREO IRRESTRICTAMENTE ALEATORIO (MIA) Si de una población de tamaño N se selecciona una muestra de tamaño n. El tamaño de la muestra depende básicamente del tamaño de la población. ya sea utilizando una tabla de números aleatorios o colocando los N números en una urna y las unidades de muestreo que lleven los números seleccionados constituirán la muestra. del nivel de confianza o confiabilidad de las estimaciones. por lo tanto.

un error de estimación lógico puede ser del 3 por ciento.2 minutos Solución El error de estimación es 0. la cual puede ser estimada a partir de una muestra piloto o a partir de la información recopilada en una investigación similar. Tamaño de muestra para estimar el total ( Ejemplo ) ⁄ . realizada anteriormente.= percentil que se halla en una tabla de la distribución normal y depende del ) nivel de confianza ( ⁄ El nivel de confianza o confiabilidad lo fija arbitrariamente quien esté calculando el tamaño de la muestra.96: ( ( ) ( ( ) ) ) ( ) ( )( ) Debe seleccionar una muestra aleatoria de 18 obreros. en la tabla de la distribución normal el valor de ⁄ es 1. Para una confiabilidad del 95 por ciento. un error de estimación lógico puede ser de 7 kilos. teniendo en cuenta que dicha confiabilidad debe estar entre el noventa y el noventa y nueve por ciento. Tamaño de muestra para estimar el promedio aritmético Ejemplo Una empresa tiene 98 operarios y desea determinar el tamaño de muestra necesario para estimar el tiempo promedio que requiere un operario para completar una labor. El error de estimación es la máxima diferencia en valor absoluto. que se está dispuesto a aceptar. El grado de variación o dispersión de la variable se mide a través de la desviación estándar. pero si se va a estimar el peso promedio de un grupo de estudiantes.5 minutos ( ). Se toma una muestra piloto. con la cual se estima una desviación estándar de 1. entre el valor del estimador y el valor del parámetro. A mayor error de estimación menor tamaño de muestra. con un error de estimación máximo de medio minuto y una confiabilidad del 95 por ciento. Por ejemplo si se va a estimar la proporción de desempleados. a éste error de estimación se le nota como” ”. A mayor confiabilidad mayor tamaño de muestra. El valor del error de estimación depende del estimador que se desee obtener y de la magnitud de la variable.

5. desea estimar el tiempo total que necesitan sus obreros para terminar la labor. Por un trabajo realizado anteriormente se sabe que el porcentaje de empleados es del 75 por ciento. Tamaño de muestra para estimar la proporción ⁄ ( Donde: ) ⁄ ( ) ⁄ Cuando no se conoce la proporción (p). y para una confiabilidad del 95 por ciento ⁄ ciento. siempre y cuando permanezcan constantes las demás condiciones. El error de estimación ( . es el que nos proporciona el mayor tamaño de muestra posible. Solución ) y asumiendo un nivel de confianza del 95 por ciento. para estimar el tiempo total con un error máximo de 35 minutos y una confiabilidad del 95 por ciento. El tamaño de muestra requerido es: ( ( ) ( ( ) )( ) ) ( ) ( )( ) Debe seleccionar una muestra aleatoria de 30 operarios. se puede suponer un valor para p de 0. Ejemplo Se desea estimar el porcentaje de empleados en una ciudad que tiene una fuerza de trabajo de 35. ya que éste valor.( . Qué tamaño de muestra será necesario para estimar la proporción con un error de estimación máximo del 8 por ciento.Si la misma empresa del ejemplo.250 personas. Se remplaza en la ecuación: ⁄ ( ( ) ( ( )( ) ) )( ( ) )( ) Por lo tanto se debe seleccionar una muestra aleatoria de 112 personas para estimar el porcentaje de empleados . por lo tanto. con un error máximo de 35 minutos y una confiabilidad del 95 por ).

En le ME se requiere la siguiente notación adicional: L = número de estratos Ni = número de unidades muestrales en el estrato i N = tamaño de la población ( ) Cuando se utiliza el muestreo estratificado. Cuando además de las estimaciones para toda la población se necesitan estimaciones para subgrupos de esa población. aunque se debe conocer la probabilidad de selección que corresponde a cada uno. etc. A cambio de lo anterior.MUESTREO ALEATORIO ESTARTIFICADO (MAE) Muestreo estratificado (ME) consiste en clasificar primero los elementos de la población en grupos que no presenten traslapes o intersecciones. Razones para estratificar      Cuando los elementos de la población son muy heterogéneos respecto a las características a estudiar. Cuando se utiliza el muestreo estratificado las probabilidades de selección de un grupo al otro pueden ser iguales o diferentes. Para reducir el costo por observación. reduciendo el error de muestreo y permite obtener estimaciones para cada estrato. y de estos grupos o estratos seleccionar una muestra irrestricta aleatoria. tomando al menos un elemento de cada grupo o estrato. factores que constituyen los criterios básicos para estratificar. El proceso que se sigue para establecer los grupos se conoce como estratificación. Estos estratos pueden reflejar regiones geográficas de un país. se necesita más información que en MIA para definir los estratos y el cálculo de los errores es más complejo que en MIA. Para controlar o aislar los factores o variables que condicionan directa o indirectamente las diferencias entre las características de los elementos de la población. Para reducir las varianzas de las estimaciones. cuando existe máxima homogeneidad en los elementos de cada estrato y máxima heterogeneidad en los diferentes estratos. El utilizar muestreo estratificado tiene sus ventajas como son: aumento en la exactitud de los resultados. Al formar los estratos se debe buscar que los elementos de cada estrato sean lo más homogéneos entre sí y que haya marcadas diferencias entre un estrato y otro. para lo cual se aplican las mismas fórmulas del muestreo irrestricto aleatorio. Determinación del tamaño de la muestra . clases sociales dentro de una ciudad. Las muestras se seleccionan separadamente para cada estrato y las estimaciones se realizan separadamente para cada estrato y se ponderan para obtener una estimación combinada para la población. Así mismo estas estimaciones se combinan para obtener estimaciones válidas para toda la muestra. se pueden obtener estimaciones en cada uno de los estratos.

Cuando se utiliza muestreo estratificado se debe seleccionar al menos un elemento de muestreo de cada estrato. de Neyman y óptima.    Muestreo estratificado con asignación proporcional Muestreo estratificado con asignación de Neyman Muestreo estratificado con asignación óptima . Así que primero se determina el tamaño de la muestra y después se determina cuántos elementos se deben seleccionar de cada estrato. Dependiendo de los criterios que se tengan en cuenta para distribuir la muestra entre los estratos se tienen diferentes tipos de asignación o afijación y ellos son: proporcional.

entonces. se trabaja con muestreo estratificado con asignación proporcional. Este tipo de asignación se utiliza cuando los costos y las varianzas de los estratos no son muy diferentes.15 y una confiabilidad del 95 por ciento. Donde: B = error de estimación k = percentil que se halla en la tabla de la distribución normal y depende del nivel de confianza Una vez determinado el tamaño de la muestra. Tamaño de muestra para estimar el promedio aritmético con asignación proporcional .96: Para hallar el tamaño de muestra se utiliza la ecuación 6. Por un estudio realizado tiempo atrás se conocen las varianzas de las notas de administración diurna y nocturna.26 . Solución Considerando que las varianzas son similares. k = 1.96.15 y para una confiabilidad del 95 por ciento el valor correspondiente en la distribución normal es 1.Muestreo estratificado con asignación proporcional la muestra se reparte entre los estratos proporcionalmente a los tamaños de éstos.28.31 y 0. En la carrera diurna (estrato 1) hay 280 estudiantes y en la nocturna (estrato 2) hay 200 estudiantes. Determine el tamaño de muestra necesario para cumplir el objetivo con un error máximo de 0. las que respectivamente son: 0. El error (B) es 0. para repartirla proporcionalmente al tamaño de los estratos se utiliza la siguiente expresión: EJEMPLO Se desea estimar la nota promedio de los estudiantes de administración de empresas diurna y nocturna en una universidad.

halle el tamaño de muestra necesario para cumplir éste objetivo. con la ecuación 6. . particulares (1). se toma una muestra piloto.96. y una confiabilidad del 95 por ciento.000 galones . el valor de k en la distribución normal es 1. vehículos particulares 7. Los vehículos se clasificaron en tres grupos o estratos. se utiliza la expresión 6.El tamaño de la muestra es de 46 estudiantes. públicos 2.392 y oficiales 534. con la cual se obtienen las siguientes varianzas sobre el consumo semanal en galones: Asumiendo un error de estimación máximo de 15.000).27 Se deben seleccionar 27 estudiantes de administración de empresas diurna y 19 de la nocturna. Esta muestra se reparte proporcionalmente al tamaño de los estratos.627. públicos (2) y oficiales (3). Tamaño de muestra para estimar el total con asignación proporcional Para repartir la muestra entre los estratos.27 EJEMPLO Se desea hacer un estudio para estimar el consumo total de gasolina en una ciudad. Solución Como no se dispone de estudios similares. En la oficina de circulación y tránsito se obtuvo la siguiente información sobre los vehículos matriculados en la ciudad. (B = 15.

28 y para repartir la muestra en los estratos se usa la ecuación 6.Considerando que las varianzas en los tres estratos son similares.1. se puede disminuir el error máximo admisible. el gerente de personal de la empresa desea seleccionar una muestra de empleados de las tres plantas para estimar la proporción de trabajadores que prefieren la reducción de la semana de trabajo. se debe seleccionar una muestra de 255 autos repartida así: 184 autos particulares. una empresa textil pretende reducir el número de dial laborables por semana a cuatro.27 EJEMPLO Tomado de1 .3 Tamaño de muestra para estimar la proporción con asignación proporcional Una vez determinado el tamaño de la muestra. En vista de la recesión económica existente. se reparte entre los estratos utilizando la expresión 6. Para tener una idea de la opinión de los trabajadores.1. 58 públicos y 13 oficiales. Recuerde que si se desea.000 galones/semana.27 Para estimar el consumo total de gasolina con un error máximo de 15.6. Se estima que cerca del 75 por ciento de los de la planta tres están a favor de la reducción de la . se trabaja con muestreo estratificado con asignación proporcional.5. Otra alternativa consiste en clausurar una de sus tres plantas y despedir a los trabajadores. con un error de estimación máximo de 0. pero esto conlleva a un aumento en el tamaño de la muestra. 6. Para calcular el tamaño de la muestra se utiliza la ecuación 6. 65 en la planta 2 y 40 en la 3. La empresa emplea 150 personas en la planta 1.

96 (k=1. mientras que en las otras plantas este porcentaje parece corresponder al 50 por ciento.96).29 y se reparte en los estratos con la ecuación 6. se utiliza el muestreo estratificado con asignación proporcional. Solución Por la diferencia en el tamaño de las plantas.27 . Encuentre el tamaño de muestra y la asignación necesaria en cada estrato. el valor correspondiente en la distribución normal es 1. Para determinar el tamaño de la muestra se utiliza la ecuación 6. Asumiendo un nivel de confianza del 95 por ciento.semana de trabajo.

U. se dispone de la siguiente información: Determine el tamaño de muestra necesario para estimar la producción media de madera con un error máximo de 25. Tamaño de muestra para estimar la media con asignación de Neyman Para repartir la muestra entre los estratos se utiliza la siguiente expresión: EJEMPLO Tomado de 1. Hace 5 años se hizo un estudio similar en donde se estimó la desviación estándar de la producción (en miles de pies de tabla). Todos los aserraderos han sido agrupados en estratos. es recomendable utilizar la asignación de Neyman.Muestreo estratificado con asignación de Neyman Cuando existen marcadas diferencias en la variabilidad de las observaciones dentro de los estratos. De ésta manera se obtendrá una muestra más grande de aquellos estratos que sean más heterogéneos. ya que además de tener en cuenta el tamaño de los estratos se tiene en cuenta la dispersión de los datos dentro de cada estrato. de acuerdo con la producción. Por lo tanto.000 pies de tabla y una confiabilidad del 95 por ciento. . Se desea hacer un estudio sobre producción media de madera aserrada en los E.

Considerando la diferencia en el tamaño de los estratos y en las desviaciones estándar se trabaja con muestreo estratificado con la asignación de Neyman. Tamaño de muestra para estimar el total con asignación de Neyman .000. Se debe tomar una muestra de 1.31.30 y para repartir la muestra en los estratos se usa la ecuación 6. Se debe tomar una muestra de 1. es decir que B = 25. repartidos así: 360 en el estrato uno. por lo tanto se divide por 1.Solución El error máximo es de 25. 424 en el estrato dos y 690 en el estrato tres. 424 en el estrato dos y 690 en el estrato tres. repartidos así: 360 en el estrato uno.473 aserraderos.473 aserraderos. pero se debe tener en cuenta que la producción está dada en miles.000 pies . Para determinar el tamaño de la muestra se utiliza el ecuación 6.

se utiliza la ecuación 6. de la cual se utilizan las varianzas obtenidas que son: Teniendo en cuenta la gran diferencia presentada en las varianzas de los tres estratos y la diferencia en el tamaño de dichos estratos. La fórmula para calcular el tamaño de la muestra es la 6.7. el tipo de muestreo adecuado es el estratificado con asignación de Neyman.7 corresponde a una muestra piloto.000 tapas y una confiabilidad del 95 por ciento.La muestra se reparte entre los estratos utilizando la expresión 6. Solución Se considera que la información suministrada en el ejemplo 6.31 EJEMPLO La fábrica de tapas del ejemplo 6. con un error máximo de 90.32 y para repartirla en los estratos.31 . desea determinar el tamaño de muestra necesario para estimar la producción semanal total.

24 semiautomáticas y 30 automáticas.000 tapas y una confiabilidad del 95 por ciento. se debe seleccionar una muestra de 69 máquinas. Tamaño de muestra para estimar la proporción con asignación de Neyman Para repartir la muestra entre los estratos se utiliza la expresión: .Por lo tanto. para estimar la producción total con un error máximo de 90. repartidas así: 15 manuales.

utilizando la expresión 6.Muestreo estratificado con asignación óptima Cuando además de tener marcadas diferencias en la dispersión o variabilidad dentro de los estratos. el costo para obtener la información de un estrato a otro varía.36 Tamaño de muestra para estimar la proporción con asignación óptima . Con ésta asignación se tiene en cuenta el tamaño de los estratos. la dispersión o variabilidad dentro de ellos y el costo para recopilar la información. se reparte entre los estratos utilizando la siguiente expresión Donde: ch = costo de hacer una observación individual en el estrato h. Una vez obtenido el tamaño de la muestra. Tamaño de muestra para obtener la media con asignación óptima Donde: ch = costo de hacer una observación individual en el estrato h. Tamaño de muestra para obtener el total con asignación óptima La muestra se reparte entre los distintos estratos. se recomienda utilizar la asignación óptima.

utilizando la expresión 1 U. 37 .Donde: ch = costo de hacer una observación individual en el estrato h. p.C. Bureau of the Census: curso suplementario para un estudio de caso sobre encuestas y censos. 1971.S. Conferencias sobre muestreo. La muestra se reparte entre los distintos estratos. Washington D.

Para brindar estimaciones en las sub poblaciones o estratos más importantes. Tercero. poseer o no un cierto atributo. Las sub-muestras se eligen en forma independiente en cada estrato. Estos grupos se diferencian por tener distinta distribución geográfica. La sub-muestra de cada estrato se elige por MAS. separadas y no vacías (estratos). o presentar diversidad en los tamaños de las unidades que los conforman.MUESTREO ALEATORIO ESTRATIFICADO Fuente: http://www. La muestra total es la unión de las sub-muestras. Para lograr mayor precisión en los estimadores. Una muestra de n elementos de esta población es una muestra aleatoria estratificada (MAE) si se cumple que:    La muestra se compone de sub-muestras de todos y cada uno de los estratos Las sub-muestras se eligen en cada estrato por MAS S/R La selección de la sub-muestra en cada estrato es independiente de la selección en los restantes estratos. Cuarto. para obtener la parte proporcional de la muestra.html Es aquel en el que se divide la población en grupos en función de un carácter determinado y después se muestrea cada grupo aleatoriamente. Segundo. Algunas de las razones por la que se estratifica una muestra es:     Para lograr homogeneidad en los estratos y con ello disminuir la dispersión general de la variable en estudio. Es un método de muestreo que emplea información auxiliar del marco muestral para crear estratos o grupos homogéneos en una población que se sabe heterogénea. Este método se aplica para evitar que por azar algún grupo de animales este menos representado que los otros. Sea una población o universo dividido en clases. Ventajas del muestreo aleatorio estratificado .arqhys. En cada estrato se elige una sub-muestra. Para disminuir el tamaño de la muestra.com/general/muestreo-aleatorio-estratificado. ¿Cómo se selecciona una Muestra Aleatoria Estratificada? Primero. Cuando se requiere incrementar la eficiencia de la muestra por unidad de costo operativo.

respecto de las principales variables a investigar. La regla de homogeneidad dentro y heterogeneidad entre consiste en definir los estratos de manera que las varianzas dentro sean pequeñas. Desventajas del muestreo aleatorio estratificado      Necesidad de contar con un marco que tenga información auxiliar. En general en el MAE se utilizan estimadores ponderados. Permite reducir el tamaño de muestra (respecto del tamaño requerido en otros diseños) para una precisión o varianza dadas. La estratificación permite aumentar la eficiencia de los estimadores. Si cada estrato representa un dominio de estudio o éste se conforma con la unión de algunos estratos. Para determinar en forma óptima el tamaño de la muestra en cada estrato es necesario disponer de medidas de dispersión para cada estrato. Permite asignar el tamaño de la muestra en cada estrato atendiendo a su costo (al costo variable unitario). Dificultad para crear o formar los estratos. ¿Cuál es el número óptimo de estratos? Los estimadores no son tan simples (como en el caso del MAS). El método permite muestrear con distintas tasas de muestreo en las diferentes sub-poblaciones de interés (otorga flexibilidad al diseño muestral). El muestreo estratificado permite reducir el costo por varias vías:       Se pueden utilizar diferentes métodos de muestreo en cada estrato. a la vez que las medias de los estratos sean bien diferentes entre sí. entonces es seguro que la muestra proporcionará información de dicho dominio de estudio.   El método asegura que en la muestra habrá representantes de todos los estratos (incluso de los que representan pequeños grupos en la población). las unidades por estrato resultan homogéneas y los estratos resultan heterogéneos entre sí. Mayor eficiencia de los estimadores si. n .