Departamento de Ciencias Administrativas y Económicas

Ingeniería Comercial

Estadística e Introducción a la Econometría

I.- CONCEPTOS BÁSICOS DE MUESTREO

1) ¿Que entendemos por población?

Conjunto de sujetos o elementos sobre el que un estudio quiere conocer algo.

La población pueden ser individuos, familias, países, ciudades, empresas, instituciones,
productos, acciones, etc., etc.

2) ¿Qué entendemos por una muestra?

Es un subconjunto de la población sobre el que un estudio toma datos.

3) ¿Por qué utilizar muestras en vez de población?

Hay diversas razones, las más importantes o más comunes de escuchar son:

- Por razones económicas. Es más económico estudiar una muestra que toda la población.
- Por razones de tiempo. Estudiar toda la población requiere tiempo, y al aplicar el estudio,
la variable de interés puede sufrir cambios. Por ejemplo: la tasa de desempleo.

4) Cuando obtenemos una muestra, ¿qué podemos hacer con ella?

Con los datos podemos realizar una estadística descriptiva, que es resumir los datos de la
muestra, y una estadística inferencial, que es inferir datos de la población a raíz de los datos de
la muestra.

5) ¿Qué es un estimador?

Es un estadístico. Es un número que resume la información sobre la muestra (un promedio,
un porcentaje).
Un estimador se obtiene por medio de la estadística descriptiva de la muestra.

1
EIE 2017

TIPOS DE MUESTREO Una muestra debe ser representativa si va a ser usada para estimar las características de la población. a partir de los estimadores que son conocidos (que obtenemos por medio de una muestra). 1) Muestreo aleatorio simple (MAS) Cada elemento de la población tiene la misma probabilidad de ser escogido. que una muestra aleatoria simple cuando los elementos en la población están ordenados al azar. Existen diversos métodos para seleccionar una muestra representativa. Todas las posibles muestras del tamaño muestral escogido (n) tienen la misma probabilidad de ser escogidas. Ej: .Ej: Edad promedio de los encuestados en Osorno 6) ¿Qué es un parámetro? Es un número que resume la información sobre la población. pocas podemos aplicar este método con total aleatoriedad y se utilizan otros muestreos probabilísticos. Ej: Edad promedio de los osorninos. La manera de la selección depende del número de elementos incluidos en la población y el tamaño de la muestra. Por lo tanto. dependiendo del dinero y del tiempo disponible (y habilidad disponibles) para tomar una muestra y la naturaleza de los elementos individuales de la población. 2) Muestreo Sistemático Una muestra sistemática es obtenida cuando los elementos son seleccionados de una forma ordenada. los parámetros que son desconocidos).. Ejemplo: 2 EIE 2017 . Desafortunadamente. El primer elemento de la muestra es seleccionado al azar. cada centésimo o cada “ésimo” elemento en la población va a ser seleccionado. II. cada onceavo. Lo que debemos hacer en primer lugar es dividir el número de elementos en la población por el número deseado en la muestra. (Es decir. Todos los nombres de los estudiantes de la ULA (se seleccionan con números aleatorios) El MAS es el mecanismo ideal y la estadística inferencial se basa en este muestreo IDEAL. una muestra sistemática puede entregarnos la misma precisión de estimación acerca de la población. con la estadística inferencial estimamos. El resultado (el cociente) indicará si cada décimo.

por lo que nuestro error muestral será muy grande y no podremos hacer inferencia estadística ni podremos comparar resultados. los elementos de la muestra son seleccionados al azar (muestra aleatoria simple) o por un método sistemático de cada estrato. Sabemos que hay 4. Calculamos el número de encuestas que debemos aplicar a hombres y mujeres manteniendo la proporción. en el caso concreto de “este ejemplo”.Suponga que hemos calculado la muestra en 300 (es decir. Hay un tipo especial de muestreo aleatorio estratificado en el cual no se mantiene la proporción de los estratos.Una solución al problema anterior es obtener muestras iguales de los diferentes estratos (comunas en este caso). empresa.000 estudiantes . acción.Supongamos que aleatoriamente hemos escogido el elemento (persona. Las estimaciones de la población.Conocemos la proporción de hombres y mujeres estudiantes. Luego. y tenemos/calculamos una muestra de 500. . debemos escoger el primer elemento a “encuestar/estudiar” que deberá ser escogido aleatoriamente entre el 1 y el 30.. etc) número 12. y así sucesivamente. 3 EIE 2017 . medianas y grandes. necesitamos aplicar una encuesta a 300 estudiantes). 3) Muestreo Estratificado (o muestreo aleatorio estratificado) Si deseamos aplicar un muestreo aleatoria estratificado.000/500=30. El siguiente elemento a seleccionar es 12+30=42.Luego. pero sospechamos que son muy diferentes entre ellos respecto a la característica estudiada.Tenemos una población de 15. . seleccionaremos muy pocas personas de comunas pequeñas.Se desea hacer una encuesta entre los estudiantes de la ULA y sospechamos que el sexo influye en las respuestas.Si aplicamos un muestreo aleatorio simple. 180 deben ser varones y 120 deben ser mujeres.. Ejemplo: . . . . Ejemplo: . basadas en la muestra estratificada. que son más homogéneos que la población como un todo. primero debemos dividir la población en grupos ( llamados estratos). Es el llamado muestreo estratificado no proporcional. Este resultado se le conocer como FACTOR DE ELEVACIÓN. Hay un 60% de hombres y un 40% de mujeres. Se utiliza cuando se necesita hacer inferencias de grupos pequeños. Este tipo de muestreo lo utilizamos cuando sabemos que la población contiene grupos o subpoblaciones (estratos) que son homogéneos internamente. Así 15. usualmente tienen mayor precisión (o que es lo mismo: menor error muestral) que si la población entera muestreada mediante muestreo aleatorio simple.000. luego 42+30=72.Suponga que deseamos conocer la opinión de las personas del acceso a la calidad de la educación en personas que viven en comunas pequeñas. Es decir.

Requerimos hacer un estudio de los estudiantes universitarios chilenos.. Ejemplo de muestra de conglomerados: . que sea lo más parecido a la población. un MDC es solo un medio de tomar datos de forma económica y simple. Lo anterior hace que sea necesario que un conglomerado sea internamente lo más heterogéneo posible. etc. o un MAS.) Con MDC no nos interesa saber las diferencias entre conglomerados. Sin embargo. pocas veces puede ocurrir esto. Es decir. Bajo este método. . mujeres. Por ellos podemos indicar que la muestra es aleatoria. existen grupos heterogéneos de sujetos o conglomerados. etc. Sin embargo. . cada grupo tiene una igual probabilidad de ser seleccionado. tendríamos que obtener una muestra representativa de cada uno de ellos. aunque no todos los grupos son muestreados. se cuenta con el listado de las universidades chilenas y cada una de sus facultades o departamentos académicos. Para obtener una muestra de conglomerados. nos puede ayudar a conocer las diferencias entre estratos. especialmente. primero debemos dividir la población en grupos que son convenientes para el muestreo. es que usualmente produce un mayor error muestral (por lo que obtendremos un menor precisión de las estimaciones acerca de la población) que una muestra aleatoria simple del mismo tamaño cuando los elementos individuales dentro de cada conglomerado tienden usualmente a ser iguales. Un MDC es una solución muy práctica cuando los conglomerados están definidos geográficamente muy bien. por lo tanto.4) Muestreo de conglomerados. dado que no todas las áreas son muestreadas en este tipo de muestreo. para aplicar un muestreo de conglomerados hacemos: o Muestreo aleatorio simple (MAS) de universidades o Luego MAS de facultades o Luego MAS Carreras o Ya en las carreras hay listas y podemos aplicar seleccionar a todos los elementos. Luego debemos seleccionar una porción de los grupos al azar o por un método sistemático. edad. Por lo tanto. Por ejemplo la gente con altos ingresos vive generalmente en un mismo sector/barrio.Suponga que no tenemos el listado de los estudiantes ni tampoco tenemos información de estratos (hombres. (MDC) Muchas veces la aplicación de un muestreo aleatorio simple.Así. En este caso concreto. ya que hay. Dado que un conglomerado es heterogéneo. De esta forma podemos aplicar un muestreo aleatorio de conglomerados y podemos elegir todos los elementos o hacer un muestreo aleatorio simple. sistemático o estratificado no es posible ya que algunas veces se requieren listas (total y/o por cada estrato) las cuales no existen o no es posible acceder a ellas (por aspectos legales u otros). etc. mientras que la gente con ingresos tiende vivir en a vivir juntos en otras áreas. 4 EIE 2017 .) . la variación entre los elementos obtenidos de las áreas seleccionadas es.Sin embargo. Uno de los problemas que puede presentar una muestra de conglomerados. un ahorro muy grande en recursos (tiempo. viajes. Si quisiéramos conocer diferencias de dos conglomerados. dinero.

Solo un ejemplo: .Luego aplicamos un MAS de manzanas en cada estrato de cada municipio (muestreo estratificado por conglomerados).. que nos acercaremos cada vez más al valor poblacional). seleccionamos aleatoriamente. 2) Error muestral o error de muestreo La diferencia entre el resultado obtenido de una muestra (un estadístico) y el resultado el cual deberíamos haber obtenido de la población (el parámetro correspondiente) se llama el error muestral o error de muestreo. ya sea por tamaño de población. podemos pensar que las cuadras/manzanas son conglomerados. III. es llamada el error estándar de la proporción.Luego. en el muestreo de un estadístico (por ejemplo. se considerará el tamaño de muestra. En este caso. en cada manzana realizamos un muestreo sistemático de casas. extraídas de una población. la desviación estándar de las proporciones (una proporción puede también ser entendido en lenguaje coloquial. por ejemplo.Luego. un promedio). el error estándar tenderá a cero (lo que quiere decir. Un error de muestreo usualmente ocurre cuando no se lleva 5 EIE 2017 . . .Luego agrupamos las manzanas de cada comuna de la Región de Lo Lagos por niveles de renta (o cualquier otro indicador/criterio que establezcamos). Así. es llamada el error estándar de la media. . 5) Muestreo polietápico Es posible realizar una combinación de varios métodos de muestreo. un estadístico es una media. . Esto es especialmente útil para poblaciones complejas.Luego. (agrupar comunas que sean similares.Se realizará un estudio de las comunas de la Región de Los Lagos. la desviación estándar de las medias de todas la muestras posibles del mismo tamaño. hacemos un MAS de los individuos que viven en esa casa. etc). . como un porcentaje) de todas las muestras posibles del mismo tamaño. un número de comunas (en este caso estaríamos hablando de un muestreo estratificado de conglomerados). dentro de cada estrato. en cada casa. por actividad económica. extraídas de una población. . .Dentro de cada comuna (piense en cualquiera). La diferencia radica en que en esta ocasión.ERRORES ESTANDAR Y DE MUESTREO 1) Error Estándar La desviación estándar de una distribución. Si el tamaño de muestra tiende a infinito. Asimismo.usualmente mayor que la que podemos obtener si la población entera es muestreada mediante muestreo aleatorio simple.Luego podemos hacer estratos de conglomerados. las comunas puede ser consideradas que son conglomerados. pero heterogéneos entre si. es denominada el error estándar del estadístico.

se suele utilizar la varianza máxima. El error muestral es medido por el error estadístico. Cuando no conocemos la proporción de la población. bajo la curva normal.96 al cuadrado que corresponderá al 95% de confianza (recuerde que puede ser un 99% o un 90%). En este caso aplicaríamos la siguiente fórmula cuando conocemos el tamaño de a población: ? ∗ ?∝2 ∗ ? ∗ ? ?= 2 ? ∗ (? − 1) + ?∝2 ∗ ? ∗ ? y la siguiente fórmula cuando no conocemos el tamaño de la población: ?∝2 ∗ ? ∗ ? ?= ?2 Donde .Z2α = Nivel de confianza. será 1. se quiere decir por ejemplo: Queremos estudiar la presencia de adolescentes que fuman.3 en este ejemplo) . en términos de probabilidad.FÓRMULAS Para calcular un tamaño de la muestra. tenemos la proporción p=0.3.n= tamaño de muestra .5. mayor es la precisión de la estimación. Generalmente se utiliza entre 3% y 5%.((p*q) significa la varianza).7 . Por ejemplo.N= tamaño de la población . Por estudios sabemos que el 30% de los adolescentes fuman. aunque frente a una necesidad de mayor precisión (y/o mayor cantidad de recursos para aplicar el levantamiento de datos) se sugiere disminuir este valor. El resultado de la media indica la precisión de la estimación de la población basada en el estudio de la muestra. . Así. también la podríamos escribir como p*(1-p) .q= 1-p = 0. requerimos primero establecer qué es lo que queremos estudiar.d2= error muestral.p= proporción esperada.¿Nos enfocaremos en una proporción de “algo”? ¿o nos enfocaremos en la media del valor de “algo”? Estudiar la proporción de algo.. sino que se toma una muestra para estimar las características de la población. (0. IV. 6 EIE 2017 . que ocurre cuando p=0.a cabo la encuesta completa a la población. Mientras más pequeño el error muestral.

calcular el tamaño de muestra. Baptista. Por ejemplo será 1. Para ser rigurosos en el estudio. De esta muestra piloto.96 al cuadrado.Cuando deseamos determinar valores medios (valores promedios).S2= varianza A menos que tengamos estudios previos que nos puedan aproximar al valor de la varianza de la población. la varianza de las compras y/o ventas. R. 7 EIE 2017 . BIBLIOGRAFIA UTIL PARA ESTUDIOS EN CIENCIAS SOCIALES Hernández Sampieri. o lo que nos interese). generalmente NO CONOCEMOS LA VARIANZA de los valores medios. solo nos interesa la varianza de los datos. deberíamos hacer un estudio piloto para tener una aproximación de la varianza (por ejemplo. que corresponde al 95% de nivel de confianza) . C. (1998) Metodología de la Investigación.Z2α = nivel de confianza. como es aplicar un muestreo estratificado NO PROPORCIONAL o por conveniencia. Generalmente se utiliza entre 3% y 5% . Segunda Edición. P.d2= error muestral. costos. para luego. O utilizar la fórmula de tamaño de muestra para una proporción (considerando varianza máxima).n= tamaño de muestra .N= tamaño de la población . McGrawHill. Existen algunas alternativas para abordar este problema sin hacer la prueba piloto. Fernández. requieren aplicar la siguiente fórmula: ? ∗ ?∝2 ∗ ? 2 ?= ? 2 ∗ (? − 1) + ?∝2 ∗ ? 2 Donde: .

8 EIE 2017 .