Professional Documents
Culture Documents
Análisis de Datos II
Análisis de Datos II
ENCUESTAS: Cuestionario
Muestra
Una encuesta es una investigación realizada sobre una muestra de sujetos representativa de un colectivo más Recursos humanos y materiales
amplio, que se lleva a cabo en el contexto de la vida cotidiana, utilizando procedimientos estandarizados de
interrogación, con el fin de obtener mediciones cuantitativas de una gran variedad de características objetivas y INFO EN LA ENCUESTA:
subjetivas de la población.
Preguntas
UTILIDAD: Respuestas
Variables
Exploratoria
Descriptiva TIPOS DE ENCUESTA:
Explicativa
Predictiva POR APLICACIÓN
Evaluativa Entrevista:
Personal
FASES DE LA INVESTIGACIÓN POR ENCUESTA (Escobar, 2004): Telefónica
Autoadministrada:
1. Formulación del problema de investigación Correo
2. Proyecto y presupuesto Internet
3. Coordinación En grupo
4. Contactos con entrevistadores POR MODO DE ADMINISTRACIÓN
5. Borrador de cuestionario Personal
6. Diseño de la muestra Teléfono
7. Plan de análisis Correo
8. Ensayo del cuestionario Internet
9. Versión definitiva del cuestionario En grupo
10. Planificación del trabajo de campo
11. Cursillos de entrevistadores CASO CONCRETO: ENCUESTAS ELECTORALES
12. Realización de entrevistas
13. Codificación de preguntas abiertas Presentan dificultades por sus propias características:
14. Libro de claves
15. Codificación de los cuestionarios Cambio en el voto
16. Programas de tabulación NS/NC
17. Grabación Proporción, algoritmos y leyes electorales
18. Tabulación y cálculos Efecto afinidad partidista
19. Preparación del informe Contingencias en elecciones concretas
20. Final de la investigación
21. Presentación de resultados CUESTIONARIO:
En realidad, estas fases se resumen en: Procedimiento estandarizado de interrogación que permite la obtención de mediciones cuantitativas de una gran
variedad de características objetivas y subjetivas de la población.
Formulación del problema de investigación
Proyecto y presupuesto No es simplemente una sucesión de preguntas
Contacto con entrevistadores Importa el orden y la estructura temática
Diseño de la muestra Importa la redacción de preguntas
Cursillos de entrevistadores
Pre-test
Planificación del trabajo de campo
Realización de entrevistas
Comprobación de que las entrevistas han tenido lugar CONTENIDO DEL CUESTIONARIO:
Codificación de preguntas abiertas
Presentación-introducción
Codificación de los cuestionarios
Preguntas sociodemográficas
ELEMENTOS BÁSICOS DE UNA ENCUESTA: Preguntas temáticas
Para el entrevistador (opcional) Empezar por el 1
En preguntas dicotómicas, seguir siempre las mismas pautas. Por ejemplo, 0-1 o 1-2
ALGUNAS NORMAS BÁSICAS PARA LA ESTRUCTURA: Homogeneizar (Por ejemplo, en escalas o en NS/NC)
Se recomienda empezar a codificar de lo más favorables/positivo a lo menos favorable/negativo, si
Las preguntas deben seguir un plan lógico bien depende de nuestro objetivo. EJ: salud autopercibida
No conviene empezar con preguntas personales Atención con NS/NC cuando hay ocho o más opciones de respuesta (98,99 en lugar de 8,9)
No conviene empezar con preguntas difíciles En las escalas numéricas, indicar claramente que significan los extremos
Secuencia de preguntas fácil, transiciones suaves
De lo general a lo concreto, de lo fácil a lo difícil LA FORMULACIÓN DE LAS PREGUNTAS AFECTA
Minimizar preguntas abiertas (o no ponerlas, directamente)
Hay que normalizar las interacciones, para que la entrevistadora sea lo más neutral posible y se estandarice con el
SESGOS POR resto de entrevistas. Las diferencias las marca la persona entrevistada, no la entrevistadora.
Lógica: Tipos:
Multi-respuesta
Filtro
Batería de preguntas
Con tarjetas CONSEJOS DE REDACCIÓN
Auto-cumplimentadas
De control/identificación Lo más importante, adaptar la redacción de la pregunta al tipo de administración del cuestionario: presencial,
Para el entrevistador telefónico u online.
Exhaustivas
Excluyentes
Atención a respuestas intermedias: regular, ni una ni otra....
NS/NC – depende de la pregunta
Objetivo general: realizar un perfil sociológico de los estudiantes universitarios pro y antinmigración Base: Teoría de la Competencia Económica Intergrupal
Ejemplos: “Antes era muy socorrido, hostelería y limpieza (…) que nos están quitando el trabajo
OE1: Medir el nivel de xenofobia de cada entrevistado porque ellos lo hacen más barato que nosotros” (GD7, trabajadores estables, Salamanca)
OE2: Medir algunas características individuales (clase social, ideología) Impacto cultural (percibido)
Las poblaciones objetivo y de estudio pueden diferir en cuanto a las variables que estudiamos.
Muestra: Parte de la población que se somete a estudio en representación del conjunto, con el
propósito de obtener resultados válidos para estimar información de toda la población de interés. El nivel económico en la población de estudio es mayor que en la objetivo,...
Los individuos que se eligen en la calle pueden ser de mayor edad (mayor frecuencia de jubilados
Marco muestral: Listado de unidades estadísticas a partir de las cuales obtenemos la muestra. p.ej.)…
En este caso, diremos que las muestras que se elijan estarán sesgadas. Al tipo de sesgo debido a
Población investigada o de estudio: No siempre se puede obtener información de todas las unidades diferencias sistemáticas entre población objetivo y población de estudio se denomina sesgo de
de la población, ya sea por inaccesibilidad, negativas a colaborar, limitaciones de los instrumentos de selección.
medida, etc.
Hay otras fuentes de error/sesgo
Censo: Estudio de todas las unidades de la población sobre la que estamos interesados en obtener
información. No respuesta a encuestas embarazosas
Consumo de drogas, violencia doméstica, prácticas poco éticas,…
Mentir en las preguntas “delicadas”.
Espacio muestral: Es el conjunto de muestras posibles obtenidas con un procedimiento de muestreo
dado. TÉCNICAS DE MUESTREO
Parámetro poblacional: Es cualquier medida de la población (de posición central, dispersión, ...) que Cuando elegimos individuo de una población de estudio para formar muestras podemos encontrarnos en las
estamos interesados en conocer. Los más usuales son la media, el total y la proporción. siguientes situaciones:
Muestreos probabilistas MUESTREO ESTRATIFICADO
Conocemos la probabilidad de que un individuo sea elegido para la muestra. Se aplica cuando sabemos que hay ciertos factores (variables, subpoblaciones o estratos) que pueden influir en el
Interesantes para usar estadística matemática con ellos. estudio y queremos asegurarnos de tener cierta cantidad mínima de individuos de cada tipo:
Hombres y mujeres,
En adelante vamos a tratar exclusivamente con muestreos con la menor posibilidad de sesgo Jovenes, adultos y ancianos…
(probabilistas): aleatorio simple, sistemático, estratificado y por grupos.
Se realiza entonces una m.a.s. de los individuos de cada uno de los estratos.
Muestreos no probabilistas
No se conoce la probabilidad. Al extrapolar los resultados a la población hay que tener en cuenta el tamaño relativo del estrato con respecto al
Son muestreos que seguramente esconden sesgos. total de la población.
No podemos calcular el error que cometemos a la hora de extraporlar los resultados a la
población Afijación uniforme, proporcional y óptima
Nota: para calcular los estimadores deben existir al menos dos unidades en cada uno de los estratos.
Donde “e” es el error muestral prefijado y PQ la variabilidad poblacional que hay que estimar
(mediante muestreo piloto, otro estudio similar o utilizando el caso más desfavorable que es P=0.5 y
Q=0.5)
OBSERVACIONES EN EL MUESTREO:
INFERENCIAS EN EL M.A.S
Para inferir datos sobre una población de la cual no tenemos todos los datos, a partir de los datos de una muestra,
que sí tenemos, utilizaremos la Estadística Inferencial.
Intervalos en el MAS:
El intervalo de confianza para la media y la proporción en un muestreo aleatorio simple, cuando la población es
finita, se determina:
Intervalo para la media:
ERRORES EN EL MUESTREO
En un muestreo podemos considerar tres tipos de errores:
1. El Sesgo del estimador (diferencia entre el valor esperado del estimador usado y el parámetro
poblacional)
Intervalo para la proporción: 2. Error de estimación (diferencia entre el valor real del parámetro poblacional y el valor que se obtiene
con el estimador)
3. Errores ajenos al muestreo:
Errores de cobertura
Falta de respuesta
Error de respuesta
Errores de edición, codificación y tabulación
Tamaño óptimo de muestra en el MAS:
Si deseamos estudiar una media:
Donde “e” es el error muestral prefijado y σ2 es la varianza poblacional que hay que estimar (mediante
la cuasivarianza muestral de otro estudio similar o un muestreo piloto)
1.INTRODUCCIÓN A LA INFERENCIA ESTADÍSTICA. ESTIMACIÓN PUNTUAL, POR INTERVALOS Y
CONTRASTES DE HIPÓTESIS
Si por ejemplo consideramos que X N(,3), con desconocido, mediante la Inferencia Estadística buscaremos
información sobre . Podemos hacerlo de diferentes formas:
A)Estimación puntual: aproximamos el parámetro mediante un valor puntual obtenido a partir de la muestra.
En el caso de la distribución normal, los estimadores más usuales de los parámetros son la media muestral para
y la cuasivarianza muestral para la varianza 2 .
B) Estimación por intervalos: calculamos un intervalo de forma que el verdadero valor del parámetro se
encuentra en él con una alta probabilidad (1-).
C) Contrastes de hipótesis: planteamos hipótesis o conjeturas sobre el valor del parámetro bajo estudio o sobre
la forma o expresión de su función de distribución. (H0 hipótesis nula).
Es el que estudiaremos en este tema en profundidad y en las prácticas, pero relacionaremos los intervalos de
confianza con éstos.
En los tres casos, para poder obtener estas informaciones, nos basaremos en un conjunto de observaciones o datos
experimentales, que denotaremos por muestra aleatoria.
El Objetivo del tema será saber deducir si se rechaza o no la hipótesis que planteamos .
Identificación de hipótesis
Existen dos tipos de hipótesis: Nula y Alternativa
Hipótesis nula = H0 Hipótesis Alternativa= H1
Es la hipótesis que contrastamos Niega a H0 (es lo contrario de H0).
Los datos pueden refutarla Los datos pueden mostrar evidencia a
No debería ser rechazada sin una buena favor
razón. No debería ser aceptada sin una gran
evidencia a favor.
Razonamiento básico
Resumen : , p y criterio de rechazo
Sobre Sobre p Sobre el criterio de rechazo
Es un número Es conocido tras Podemos usar dos criterios
pequeño, preelegido al realizar el experimento (equivalentes):
diseñar el experimento. Conocido p sabemos 1. Rechazamos si el valor de p es
Es la probabilidad de todo sobre el resultado menor que ó
rechazar H0 cuando es del experimento
2. Rechazamos si el estadístico
cierta. (rechazamos o no
elegido en la muestra se encuentra
Conocido sabemos rechazamos H0)
dentro de la
todo sobre la región región crítica.
crítica
Contraste para la comparación de dos medias. Prueba T de Student para dos muestras
independientes
Tipos de errores al contrastar hipótesis Esta prueba contrasta si la media de una variable con distribución normal, es la
(de forma general) misma en dos poblaciones distintas o difieren. Las hipótesis que se plantean
son las siguientes.
Nota: no se
puede
reducir a la
vez los dos
tipos de
errores. Lo
usual es siendo 1 y 2 las medias de la variable de interés en las dos poblaciones de estudio. Para aplicar
acotar la esta prueba, la variable de interés debe de seguir una distribución normal en ambas poblaciones y las
muestras estudiadas deben de ser seleccionadas de manera aleatoria e independientes. Deben tener
igual varianza (homocedásticas).
probabilidad de error de tipo I, tomando como posibles valores α= 0.10, 0.05 ó 0.01. Para
disminuir β hay que aumentar el tamaño muestral
Conclusiones
La prueba T contrasta si la media de una variable con distribución normal coincide con una
determinada constante o difiere. Las hipótesis que se contrastan son:
Las hipótesis para aplicar una prueba ANOVA son las siguientes:
siendo la media de la variable en la población y o la constante con la que se quiere comparar.
Las muestras deben de ser independientes .
Para aplicar esta prueba, la variable de interés debe de seguir una distribución normal y la muestra La variable debe seguir una distribución Normal en cada una de las poblaciones de estudio.
estudiada debe de ser seleccionada de manera aleatoria.
La muestras deben de ser seleccionadas de manera aleatoria.
La muestras deben de ser Homocedásticas (la varianza de la variable es la misma en todas
las poblaciones).
Cuando el p-value sea superior al 0,1 (0,05), no podremos rechazar H0, no pudiendo
afirmar que los datos no son normales, (con un nivel de confianza del 90% (o del 95%)).
En este caso, procederemos a calcular los intervalos de confianza tal y como hemos 2.- Contraste de aleatoriedad: Test de rachas de Wald-Wolfowitz
estudiado en el tema anterior, así como a aplicar contrastes para comparar medias.
TECNICAS MULTIVARIANTES
1) Métodos de dependencia
Suponen que las variables analizadas están divididas en dos grupos: las variables dependientes y las variables
independientes. El objetivo de los métodos de dependencia consiste en determinar si el conjunto de variables
independientes afecta al conjunto de variables dependientes y de qué forma.
2) Métodos de interdependencia
Estos métodos no distinguen entre variables dependientes e independientes y su objetivo consiste en identificar
qué variables están relacionadas, cómo lo están y porqué.
3) Métodos estructurales
Suponen que las variables están divididas en dos grupos: el de las variables dependientes y el de las
independientes. El objetivo de estos métodos es analizar, no sólo como las variables independientes afectan a las
3.- Contraste de comparación de dos poblaciones. Test de WilcoxonMann-Whitney variables dependientes, sino también cómo están relacionadas las variables de los dos grupos entre sí