Población y muestra

Métodos y Técnicas de Investigación Científica PD: Conjunto de unidades de
Población diana observación con características
comunes, sobre el cual se desearía
Población de estudio, sacar conclusiones
elegible o base PE: Subconjunto de unidades
disponibles para el estudio, definidos
por criterios de inclusión y exclusión

El diseño de la investigación: Muestra
POBLACIÓN Y MUESTRA

Muestra: Fracción obtenida
de la población de estudio

Prof. Dra. Silvina Berra

Un ejemplo :
Estudio de disfonías en docentes de la UNC Representatividad de la muestra
Propósito: Estimar la incidencia de disfonías en docentes de la UNC.
Tipo de estudio: …
La muestra se parece a la población, expresa
Descriptivo simple longitudinal
adecuadamente sus características.
Ámbito: Universidad Nacional de Córdoba
Población diana: …
Todos los docentes de la UNC
- Titulares, asociados, adjuntos, asistentes, adscriptos, ayudantes alumnos?
Población de estudio o elegible: …
Docentes con legajo en la UNC: 7405 docentes de grado; 786 docentes de
pregrado. Datos 2013, Secretaría académica de la UNC.
Muestra: …
(Supuesto) Se necesita estudiar a 660 docentes para calcular la incidencia
con suficiente precisión.

Porta M, ed. A dictionary of epidemiology. 2008

Mediante la estadística se busca estimar el verdadero valor del parámetro a través de un muestra estadístico. Definición de la población y la muestra 2. Control de calidad Marco muestral (lista de los elementos) Unidades elementales de la muestra Unidades de muestreo (unidades de agrupación) . Población y muestra Parámetros y estimadores Población diana Parámetro poblacional: es un valor numérico Población de estudio Inferencia estadística que caracteriza cierta población. estimadores o parámetros estadísticos Estimador o estadístico muestral: es un valor numérico que caracteriza cierta muestra. Método de selección Población diana Población de estudio 3. Aspectos importantes: • Cálculo del tamaño de la muestra • Errores aleatorios y sistemáticos Diseño de la muestra de un estudio Diseño de la muestra de un estudio 1. Definición de la población y la muestra 1. Cálculo del tamaño de la muestra Criterios de inclusión y exclusión 4.

Método de selección: UNC. Control de calidad Legajo de la UNC. Un ejemplo : Estudio de disfonías en docentes de la UNC Diseño de la muestra de un estudio Propósito: Estimar la incidencia de disfonías en docentes de la UNC. Definición de la población y la muestra Población de estudio o elegible: 7405 docentes de grado con legajo en la 2. Unidades elementales: Cada docente. Selección: Tipos de muestreo Probabilística /// Representativa Probabilísticos o No probabilísticos o Muestreo probabilístico: Todos los candidatos aleatorio determinísticos de la población en estudio tienen una Aleatorio simple Por conveniencia probabilidad conocida de ingresar a la Por juicio o sujetos clave muestra. Unidades de muestreo: Podría ser un listado único con todos los docentes o los listados proporcionados por cada facultad. Sistemático Por estratos Por cuotas Por conglomerados “Bola de nieve” Muestra representativa: Expresa adecuadamente las características de la población objetivo . Tipo de muestreo Muestra: 660 docentes. Identificación y localización de las personas Criterios de inclusión y exclusión: … 3. 2.La elección de cada unidad -Los elementos tienen una no es independiente de las El muestreo probabilístico tiende a garantizar una muestra probabilidad conocida de ser demás representativa seleccionados Pero pueden obtenerse muestras representativas por medio de muestreos no probabilísticos (aunque es difícil). Listados por facultades.Selección al azar . 1. Cálculo del tamaño de la muestra Marco muestral: … 4. Estrategias de contacto con las personas Exclusión: Docentes que en el inicio del estudio presenten disfonías… 3. . Tipo de estudio: Descriptivo simple longitudinal Población diana: Todos los docentes de la UNC 1.

Ej. Selección: Tipos de muestreo Conglomerados y estratos Población Probabilísticos o aleatorio Aleatorio simple Sistemático Por estratos Por conglomerados . Un ejemplo : Estudio de disfonías en docentes de la UNC Selección: Tipos de muestreo Propósito: Estimar la incidencia de disfonías en docentes de la UNC. 36. 47. etc. 58. 25. el 3. Tipo de estudio: Descriptivo simple longitudinal Probabilísticos o Población diana: Todos los docentes de la UNC aleatorio Población de estudio o elegible: 7405 docentes de grado con legajo UNC Aleatorio simple Muestra: 660 docentes. Elección del docente que ocupa la posición 3 y luego las posiciones 14. Sistemático Muestreo aleatorio simple: … Por estratos Selección al azar de 660 docentes Por conglomerados Muestreo aleatorio sistemático: 7405/660= 11 Elección aleatoria de un número entre el 1 y el 11.

Conglomerados Conglomerados y estratos Población Población Conglomerado Conglomerado Conglomerado Conglomerado Conglomerado Conglomerado Conglomerado Conglomerado 1 2 3 4 Estrato A Estrato B Estrato C Selección por conglomerados Selección por estratos Población Población Conglomerado Conglomerado Conglomerado Conglomerado 1 2 3 4 Muestra Estrato A Estrato B Estrato C .

Control de calidad . una fracción proporcional al tamaño de cada facultad. Tipo de estudio: Descriptivo simple longitudinal Población diana: Todos los docentes de la UNC 1. 1. Muestra: 660 docentes.) • Se seleccionan los grupos y Conglomerados: Facultades. alternativamente. etc. Estrategias de contacto con las personas 2) Selección aleatoria de 110 docentes de cada facultad. Tipo de estudio: Descriptivo simple longitudinal Por estratos Por conglomerados Población diana: Todos los docentes de la UNC • Los estratos se definen • Los conglomerados son Población de estudio o elegible: 7405 docentes de grado con legajo UNC por una característica grupos de las unidades de conocida de las unidades de observación (áreas. Identificación y localización de las personas 1) Selección aleatoria simple de 6 facultades (conglomerados) 3. • Se seleccionan elementos se suelen incluir todos sus de todas las subpoblaciones elementos Selección al azar de 6 facultades y luego selección aleatoria simple de 110 o estratos • Cada conglomerado docentes de cada facultad • Cada estrato es contiene diversidad de O. observación (nivel instituciones. Cálculo del tamaño de la muestra proporcionales de sus docentes por categorías (estratos) 4. en fracciones 3. homogéneo en aquella elementos Muestreo por estratos: … características Interesa tener suficiente proporción por las 4 categorías docentes. Definición de la población y la muestra Población de estudio o elegible: 7405 docentes de grado con legajo UNC 2. Método de selección: Muestra: 660 docentes. Tipo de muestreo Muestreo polietápico: … 2. 165 docentes de cada categoría x 4 categorías=660 Un ejemplo : Estudio de disfonías en docentes de la UNC Diseño de la muestra de un estudio Propósito: Estimar la incidencia de disfonías en docentes de la UNC. etc.) Muestreo por conglomerados: … socioeconómico. Un ejemplo : Muestreos por estratos y por Estudio de disfonías en docentes de la UNC conglomerados Propósito: Estimar la incidencia de disfonías en docentes de la UNC.

del Determinar un parámetro (media. proporción) tipo de estudio y del tipo de muestreo ¿Cuántos individuos es necesario estudiar para poder estimar un parámetro determinado con el grado de confianza deseado? Contrastar una hipótesis (diferencias) ¿Cuántos individuos es necesario estudiar para tener las mínimas garantías de detectar una diferencia entre los grupos de estudio. se sustenta en presunciones que pueden ser incorrectas . lo que depende inicialmente del carácter de la hipótesis. Definición de la población y la muestra correo 2. Método de selección teléfono 3. para: tamaño de la muestra. Cálculo del tamaño de la muestra hogar 4. Control de calidad en la unidad de muestreo … Directamente en un lugar en salas en la calle … Cálculo del tamaño de la muestra Tamaño de la muestra Cálculo del tamaño mínimo de la muestra Existen numerosas fórmulas de cálculo del necesaria. en el supuesto de que tal diferencia exista realmente? El resultado de los cálculos es orientativo.Selección: procedimientos de Diseño de la muestra de un estudio contacto Después de un muestreo probabilístico 1.

Tamaño muestral según precisión.40 0.99 Estimación de una media z= Valor del nivel de confianza 0.96 99% = 2.01 9.20 0.95 z2 .05 384 Sabulsky J 2006 Sabulsky J 2006 . δ2 0.95 z=0.96=95%) muestras.96 – 2.220 15926 p= Proporción estimada en la Variable cualititativa: población Influencia del valor de la proporción P precisión tamaño muestral Estimación de una proporción e= Error muestral admitido z=0.10 92 159 elegido (1. valor supuesto de Cálculo de la muestra una proporción y nivel de confianza para determinar un parámetro Influencia de la precisión y nivel de confianza P precisión tamaño muestral Variable cuantitativa: z=0.50 0.05 138 n = -------------.10 0.Cálculo del tamaño de la muestra Nivel de confianza en la estimación de para estimar un parámetro parámetros poblacionales Probabilidad de que una expresión sea Se debe decidir o averiguar anticipadamente: correcta Una idea aproximada del valor del parámetro Grado de confianza con el que afirmamos (proporción) o de la varianza (var.40 0.02 2. 0.ej: Si repetimos el estudio en muchas 1.05 369 637 n = -------------.58 Z: El nivel de confianza de la estimación (p.30 0.40 0.64 – 1. δ= Desvío estándar estimado 0. P (1-p) 0.05 246 e2 0. el parámetro estará dentro del intervalo de confianza en el (1-α)% de los intervalos que calculemos.305 3981 e2 en la población 0. cuantitativa) que un valor o intervalo calculado en una • p y q (1-p) en variables categóricas muestra estima el valor real en la población • δ en variables cuantitativas (desviación estándar) Valores estándar (z) según nivel de confianza e: Error muestral (cantidad máxima de desviación aceptable) 90% = 1.05 323 0.58) z2 .40 0.64 95% = 1.

o tienen soporte en Errores: de tipo I (α). d = Valor mínimo de la diferencia que se desea detectar (datos cuantitativos) Sabulsky J 2006 . p2 = Valor de la proporción en rechaza H0) Variable cualitativa: el grupo experimental.Cálculo del tamaño de la muestra Cálculo del tamaño de la muestra para para contrastar una hipótesis contrastar una hipótesis Se debe decidir o averiguar anticipadamente: Hipótesis estadística vs. de tipo II (β). poder estadístico las hipótesis del investigador? (1-β) Variabilidad de la medida Niveles de Confianza del 90%. 99% Magnitud de la diferencia a detectar. 95%. (hay diferencia. Hipótesis científica Hipótesis: H1 versus H0 ¿Las diferencias son debidas al azar. p = Media de las dos Diferencias entre dos proporciones proporciones p1 y p2 H0 S2 = Varianza de la variable cuantitativa que tiene el grupo (no hay diferencia) control o de referencia. estadística o ¿Con qué grado de confianza es posible desestimar clínicamente significativa diferencias casuales y no equivocarse en ello? Distribución de referencia o frecuencia basal del fenómeno que se estudia Errores alfa y beta Previsión de incumplimiento o pérdidas ¿Qué probabilidad existe de que cometamos errores de considerar reales diferencias que son casuales o casuales diferencias que son reales? Sabulsky J 2006 Errores estadísticos en las Cálculo de la muestra pruebas de hipótesis para contrastar hipótesis n = sujetos necesarios en cada Realidad Variable cuantitativa: una de las muestras Diferencias entre dos medias Za = Valor Z correspondiente Conclusión del H1 H0 al riesgo deseado Zb = Valor Z correspondiente estudio (diferencia) (no hay diferencia) al riesgo deseado p1 = Valor de la proporción en H1 el grupo de referencia.

001 3.50 0.14 Muestra 4 200 215 + 20 Sabulsky J 2006 Control de calidad Prestar atención y registrar: Personas elegibles (población de estudio) Personas no localizadas Rechazos Pérdidas Abandonos Retiros Composición de la muestra final . Definición de la población y la muestra Muestra 1 20 260 + 20 2. Control de calidad Colesterolemia n media + DE t p Muestra 3 200 218 + 20 1. Cálculo del tamaño de la muestra Muestra 2 20 220 + 20 4.Influencia de la magnitud de la diferencia sobre la significación estadística Diseño de la muestra de un estudio Colesterolemia n media + DE t p 1. Método de selección 6.32 <0.

el resultado se aleja del “valor real”. Silvina Berra • Errores aleatorios y sistemáticos Parámetros y estimadores Errores Siempre que se estudia una muestra existe la Parámetro poblacional: es un valor numérico posibilidad de que se produzca un error que caracteriza cierta población. mismo modo y desvía el resultado en un único sentido Entre los errores sistemáticos. aleatorios: por azar. el que puede producirse por un defecto del muestreo se llama sesgo de selección . por encima o por debajo de él sistemáticos o sesgos: por un defecto en el método En Estadística se busca estimar el verdadero de obtención de los datos. Dra. Se llama error a un resultado falso o equivocado Estimador o estadístico muestral: es un valor Los tipos de errores en una investigación: numérico que caracteriza cierta muestra.Universidad Nacional de Córdoba Facultad de Ciencias Médicas Licenciatura en Fonoaudiología Población y muestra Métodos y Técnicas de Investigación Científica Población diana Población de estudio Inferencia estadística estimadores o parámetros estadísticos El diseño de la investigación: VENTAJAS Y DESVENTAJAS DEL MUESTREO Los errores en el muestreo muestra Aspectos importantes: • Cálculo del tamaño de la muestra Prof. que ocurre siempre del valor del parámetro a través de un estadístico.

generalmente debida a la probabilidad. por lo que podrían ser beneficiarios de un programa de prevención. mayor la precisión. A dictionary of epidemiology. El sentido y la Menor tiempo magnitud del desplazamiento no pueden ser conocidos. La precisión de un estudio está dada por la posibilidad de evitar errores en la estimación debidos al azar del muestreo Porta M.Error aleatorio Inferencia estadística Variación de una medida (estimador) respecto del parámetro. las personas incluidas diferentes observadores pueden producir son diferentes en alguna característica a la variabilidad ajena a la de los participantes población base o teórica Un grupo relevante (variables principales) de la población tuvo mayor probabilidad de ser incluido Ese defecto en la selección puede producir un error en el resultado (diferencia estimador-parámetro) . retraso en el desarrollo del lenguaje en el año 2014. cuanto mayor sea el tamaño de la muestra. ed. con una probabilidad conocida y elegida por el investigador El error aleatorio puede disminuirse aumentando el tamaño de la muestra cuantificarse mediante el cálculo de intervalos de Estudio del desarrollo del lenguaje en niños de 12 a 36 meses confianza o el uso de pruebas de hipótesis El 7% (IC 95%: 5 – 9%) de los niños de 12 a 36 meses del área de en general. 2008 HTA Glossary Error sistemático: ¿Por qué estudiar una muestra? el sesgo de selección El sesgo es un error sistemático: se produce Ventajas del muestreo un desplazamiento artificial de la diferencia. Menor costo siempre en un sentido. menor cobertura del centro de salud nº 2 de la ciudad de Córdoba presenta un será el error aleatorio. es independiente de los efectos de los sesgos. Menos molestias a potenciales participantes Mayor fiabilidad de las mediciones En el sesgo de selección. Cálculo de un “intervalo de confianza” que contiene al valor del parámetro del universo.

muestral necesario. Un ejemplo : ¿Es óptimo estudiar una muestra? Estudio del desarrollo del lenguaje en niños de 12 a 36 meses Propósito: estimar el porcentaje de niños con retraso en el desarrollo Desventajas del muestreo del lenguaje. que podrían ser beneficiarios de un programa de prevención en el año 2014 Complejidad del muestreo Tipo de estudio: descriptivo simple. Riesgo de sesgo de selección Error sistemático producido (aparentemente) por el efecto de un factor que modifica la probabilidad de los individuos de ser incluidos en la muestra Un ejemplo para reflexionar: Estudio del desarrollo del lenguaje en niños de 12 a 36 meses Estudio del desarrollo del lenguaje en niños de 12 a 36 meses Propósito: estimar el porcentaje de niños con retraso en el desarrollo Población de estudio o elegible: niños de 12 a 36 meses del área de del lenguaje. que podrían ser beneficiarios de un programa de cobertura del centro de salud nº 2 de la ciudad de Córdoba (N=600) prevención en el año 2014 Muestra (ejemplo 1): se Muestra (ejemplo 2): Muestra (ejemplo 3): Tipo de estudio: descriptivo simple. de salud desde el 1/5/2014 ciudad de Córdoba. durante el año 2014. solicitando 2014 de los niños de 12 a 12 a 36 meses asistentes Población diana: niños de 12 a 36 meses del área de cobertura del que concurra al centro una 36 meses habitantes en el al control de niño sano al centro de salud nº 2 de la ciudad de Córdoba persona adulta con niños área de cobertura del centro de salud nº 2 de la Población de estudio o elegible: el equipo de salud no tiene un registro de 12 a 36 meses al centro centro de salud nº 2 de la ciudad de Córdoba. por datos censales. transversal invita mediante carteles y selección al azar a partir selección sistemática de radios locales a participar de un registro del año uno de cada tres niños de Ámbito: centro de salud nº 2 de la ciudad de Córdoba en el estudio. transversal En algunos casos son necesarios muestreos Ámbito: centro de salud nº 2 de la ciudad de Córdoba complejos Población diana: Menor precisión Población de estudio o elegible: Diferencia entre el estimador y el parámetro que no es sistemático generalmente debida a la probabilidad (azar). que podrían ser unos 600. de todos los niños que viven en el área de cobertura del centro pero hasta alcanzar el tamaño suponen. Cálculo de muestra necesaria: n=54 ¿Cómo se podría obtener una muestra representativa de esa población? ¿Qué diferencias hay entre unas y otras muestras? ¿Qué diferencias hay entre las muestras y la población del estudio? ¿Las diferencias entre muestra y población “debilitan” el estudio? .

estimador-parámetro) .Sesgo de selección Las personas incluidas son diferentes en alguna característica a la población base o teórica Muestra (ejemplo 1): se Estudio del desarrollo del lenguaje invita mediante carteles y en niños de 12 a 36 meses radios locales a participar en el estudio. solicitando Un grupo relevante (variables que concurra al centro de la población principales) una persona adulta con tuvo mayor probabilidad de niños de 12 a 36 meses al ser incluido centro de salud desde el Ese defecto en la selección 1/5/2014 hasta alcanzar el puede producir un error en el tamaño muestral resultado (diferencia necesario.