You are on page 1of 14

TEMA 1: CUESTIONÁRIOS

ENCUESTAS:  Cuestionario
 Muestra
Una encuesta es una investigación realizada sobre una muestra de sujetos representativa de un colectivo más  Recursos humanos y materiales
amplio, que se lleva a cabo en el contexto de la vida cotidiana, utilizando procedimientos estandarizados de
interrogación, con el fin de obtener mediciones cuantitativas de una gran variedad de características objetivas y INFO EN LA ENCUESTA:
subjetivas de la población.
 Preguntas
UTILIDAD:  Respuestas
 Variables
 Exploratoria
 Descriptiva TIPOS DE ENCUESTA:
 Explicativa
 Predictiva  POR APLICACIÓN
 Evaluativa  Entrevista:
 Personal
FASES DE LA INVESTIGACIÓN POR ENCUESTA (Escobar, 2004):  Telefónica
 Autoadministrada:
1. Formulación del problema de investigación  Correo
2. Proyecto y presupuesto  Internet
3. Coordinación  En grupo
4. Contactos con entrevistadores  POR MODO DE ADMINISTRACIÓN
5. Borrador de cuestionario  Personal
6. Diseño de la muestra  Teléfono
7. Plan de análisis  Correo
8. Ensayo del cuestionario  Internet
9. Versión definitiva del cuestionario  En grupo
10. Planificación del trabajo de campo
11. Cursillos de entrevistadores CASO CONCRETO: ENCUESTAS ELECTORALES
12. Realización de entrevistas
13. Codificación de preguntas abiertas Presentan dificultades por sus propias características:
14. Libro de claves
15. Codificación de los cuestionarios  Cambio en el voto
16. Programas de tabulación  NS/NC
17. Grabación  Proporción, algoritmos y leyes electorales
18. Tabulación y cálculos  Efecto afinidad partidista
19. Preparación del informe  Contingencias en elecciones concretas
20. Final de la investigación
21. Presentación de resultados CUESTIONARIO:

En realidad, estas fases se resumen en: Procedimiento estandarizado de interrogación que permite la obtención de mediciones cuantitativas de una gran
variedad de características objetivas y subjetivas de la población.
 Formulación del problema de investigación
 Proyecto y presupuesto  No es simplemente una sucesión de preguntas
 Contacto con entrevistadores  Importa el orden y la estructura temática
 Diseño de la muestra  Importa la redacción de preguntas
 Cursillos de entrevistadores
 Pre-test
 Planificación del trabajo de campo
 Realización de entrevistas
 Comprobación de que las entrevistas han tenido lugar CONTENIDO DEL CUESTIONARIO:
 Codificación de preguntas abiertas
 Presentación-introducción
 Codificación de los cuestionarios
 Preguntas sociodemográficas
ELEMENTOS BÁSICOS DE UNA ENCUESTA:  Preguntas temáticas
 Para el entrevistador (opcional)  Empezar por el 1
 En preguntas dicotómicas, seguir siempre las mismas pautas. Por ejemplo, 0-1 o 1-2
ALGUNAS NORMAS BÁSICAS PARA LA ESTRUCTURA:  Homogeneizar (Por ejemplo, en escalas o en NS/NC)
 Se recomienda empezar a codificar de lo más favorables/positivo a lo menos favorable/negativo, si
 Las preguntas deben seguir un plan lógico bien depende de nuestro objetivo. EJ: salud autopercibida
 No conviene empezar con preguntas personales  Atención con NS/NC cuando hay ocho o más opciones de respuesta (98,99 en lugar de 8,9)
 No conviene empezar con preguntas difíciles  En las escalas numéricas, indicar claramente que significan los extremos
 Secuencia de preguntas fácil, transiciones suaves
 De lo general a lo concreto, de lo fácil a lo difícil LA FORMULACIÓN DE LAS PREGUNTAS AFECTA
 Minimizar preguntas abiertas (o no ponerlas, directamente)
Hay que normalizar las interacciones, para que la entrevistadora sea lo más neutral posible y se estandarice con el
SESGOS POR resto de entrevistas. Las diferencias las marca la persona entrevistada, no la entrevistadora.

Lógica: Tipos:

 Aquiescencia  No pueden desorientar al entrevistado


 Deseabilidad  No pueden ser ambiguas
 Debe ser exhaustivas (pero no demasiado)
Organización:  No pueden pedir información que el entrevistado no nos puede dar
 Sean demasiado sensibles
 Orden preguntas o bloques de preguntas
 Provoque que el entrevistado pueda engañar fácilmente
 Cuidar al entrevistado: fatiga, cansancio
Entrevistador:
TIPOS DE PREGUNTAS
 No hay que permitir que el entrevistado cambie libremente la formulación de la pregunta
Según el tema:
 No hay que dejar lugar a la (incorrecta) interpretación
 Sociodemográficas  No debe ser flexibles
 Creencias
Secuencia:
 Actitudes
 Opiniones  Cuidado: puede haber muchos temas
 Comportamientos  Debe haber transiciones lógicas
 Otros datos  Combinar preguntas temáticas + sociodemog + control + claridad
Según las posibilidades de respuesta: SESGOS POR EL DISEÑO DE LAS PREGUNTAS
 Abiertas  Evitar preguntas dicotómicas
 Cerradas  Cuidar escalas Likert (¿3,5,7 opciones?) ¿Par o impar?
 Cuidar orden de los ítems en las preguntas
OTROS TIPOS DE PREGUNTAS:

 Multi-respuesta
 Filtro
 Batería de preguntas
 Con tarjetas CONSEJOS DE REDACCIÓN
 Auto-cumplimentadas
 De control/identificación Lo más importante, adaptar la redacción de la pregunta al tipo de administración del cuestionario: presencial,
 Para el entrevistador telefónico u online.

 Estrategas KISS: Keep Items Simple and Short


 Uso de lenguaje sencillo
CODIFICACIÓN:  Concision: una sola idea
 No más de 5 alternativas (si más, tarjeta)
Procedimiento estandarizado de interrogación que permite la obtención de mediciones cuantitativas de una gran
 Sin ambigüedad
variedad de características objetivas y subjetivas de la población.
 Especificar muy bien el tiempo
Normas de codificación:  Evitar fases negativas
 Evitar preguntas tendenciosas
 Evitar palabras dobles
 Evitar palabras abstractas
 Evitar palabras técnicas, siglas, abreviaturas, ...
 Evitar temas delicados o sensibles
 Evitar deseabilidad social
 No fomentar el NS o NC
 Evitar la no respuesta

ORDEN DE LAS PREGUNTAS:

 Comenzar con preguntas que le hagan sentir cómodo


 Preguntas más complejas o personales, más adelante, aunque no es obligatorio.
 Cansancio vs. Interés
REDACCIÓN DE PREGUNTAS SOBRE EL IMPACTO DE LA INMIGRACIÓN
RESPUESTAS: CONSEJOS DE REDACCIÓN

 Exhaustivas
 Excluyentes
 Atención a respuestas intermedias: regular, ni una ni otra....
 NS/NC – depende de la pregunta

ENCUESTA SOBRE ESTUDIANTES UNIVERSITARIOS Y XENOFOBIA

Diseño del cuestionario: preguntas para medir la xenofobia

PREGUNTAS Y OBJETIVOS DE INVESTIGACIÓN


Impacto económico (percibido)
Pregunta: ¿Qué características diferencian a los estudiantes universitarios pro y antinmigración?

Objetivo general: realizar un perfil sociológico de los estudiantes universitarios pro y antinmigración  Base: Teoría de la Competencia Económica Intergrupal
 Ejemplos: “Antes era muy socorrido, hostelería y limpieza (…) que nos están quitando el trabajo
OE1: Medir el nivel de xenofobia de cada entrevistado porque ellos lo hacen más barato que nosotros” (GD7, trabajadores estables, Salamanca)

OE2: Medir algunas características individuales (clase social, ideología) Impacto cultural (percibido)

 Base: Teoría de la Identidad Social (“nosotros” vs ”ellos”)


 Ejemplos:
- Identidad nacional: “los inmigrantes van a acabar con la cultura española”
- Identidad religiosa/étnica: “la cultura musulmana es incompatible con la forma de vida española”
(católica/occidental)

Impacto sobre la seguridad


DEFINICIÓN DEL CONCEPTO
 Base: Teoría de la Amenaza Realista
XENOFOBIA  Ejemplos estereotipos:
- Sicarios de Europa del Este
 Definición amplia: actitud negativa hacía, o miedo de, individuos o grupos que son en algún sentido
(real o imaginario) diferentes del sujeto o su grupo de pertenencia (Hjerm, 1998) - Bandas latinas
 Definición estricta: xeno + phobia, rechazo hacia los “de fuera” (Jackson et al., 2001)
 Pero no sólo nos interesa la xenofobia OG: actitudes anti-inmigración y pro-inmigración
DIMENSIÓN/TEMA 2
INDICADOR DE ACTITUDES POR Y ANTINMIGRACIÓN
Antipatía o simpatía hacia personas migrantes

 No todas las personas migrantes son iguales: diferencias entre grupos


- P.e. estereotipos (europeas/os del Este y seguridad, musulmanes y cultura, personas subsaharianas
y trabajo)
 Las actitudes también pueden variar en función del origen de la persona migrante: preguntas sobre
distintos colectivos (máx. 5)

OPERACIONALIZACIÓN DE LAS ACTITUDES HACIA LA INMIGRACIÓN Y LOS INMIGRANTES


TEMA 2: INTRODUCCIÓN AL MUESTREO
 Estadístico: es una función cualquiera de los valores muestrales.
POBLACIÓN: Cualquier colección finita o infinita de individuos o elementos (no necesariamente seres vivos)
 Estimador: Es un estadístico que suministra información acerca de algún parámetro poblacional
CENSO: Enumeración completa de una población. desconocido. Toma distintos valores en cada una de las posibles muestras que podemos obtener de una
población.
Problemas:
MUESTREO: Procedimiento mediante el cual se obtienen una o más muestras de la población.
 Costo elevado
 Obtención de información lenta ¿Porqué un muestreo?
 Baja calidad de información por exhaustividad
 Transformación o destrucción de elementos de la población  Menor Costo
 Incapacidad de obtener toda la información  Mayor rapidez
 Mayor precisión al ser menor el nº de elementos a estudiar
Solución: Encuestas por muestreo  Destrucción (en todo caso) de un subconjunto de la población
MUESTRA: Parte de la población o subconjunto de unidades obtenidas con el fin de investigar las propiedades
de la población o conjunto de procedencia. Está formada por unidades de muestreo o unidades de estudio: Fijación de objetivos Métodos de obtención de la información
 Personas, células, familias, hospitales, países…  Definición de la población a muestrear  Observación directa
 Variables a observar (Nominal, Ordinal, De  Entrevista telefónica (CATI)
La población ideal que se pretende estudiar se denomina población objetivo. Escala, Razón)  Entrevista por correo
 Marco  Entrevista personal
 No es fácil estudiarla por completo. Aproximamos mediante muestras que den idealmente la misma  Unidades de muestreo
probabilidad a cada individuo de ser elegido.  Medios económicos
 Tampoco es fácil elegir muestras de la población objetivo:  Temporalidad
o Si llamamos por teléfono excluimos a los que no tienen.
o Si elegimos indiv. en la calle, olvidamos los que están trabajando...
 El grupo que en realidad podemos estudiar (ejem. los que tienen teléfono) se denomina población de ELABORACIÓN DEL CUESTIONARIO
estudio.
 Lenguaje sencillo y claro. Manejable
ELEMENTOS DEL MUESTREO  Respuestas fácilmente codificables
 Bien ordenadas por temas o dificultad
 Unidad estadística: Dato individual (persona, objeto, suceso, etc.) objeto de observación o estudio.  Ser objeto de ensayo (Pretest)
 Preguntas abiertas o cerradas
 Universo o Población objetivo: Conjunto de unidades estadística (personas, objetos, sucesos, ....) que  Filtros
tienen en común una o varias características observables que se desean estudiar.
FUENTES DE SESGO

Las poblaciones objetivo y de estudio pueden diferir en cuanto a las variables que estudiamos.
 Muestra: Parte de la población que se somete a estudio en representación del conjunto, con el
propósito de obtener resultados válidos para estimar información de toda la población de interés.  El nivel económico en la población de estudio es mayor que en la objetivo,...
 Los individuos que se eligen en la calle pueden ser de mayor edad (mayor frecuencia de jubilados
 Marco muestral: Listado de unidades estadísticas a partir de las cuales obtenemos la muestra. p.ej.)…
 En este caso, diremos que las muestras que se elijan estarán sesgadas. Al tipo de sesgo debido a
 Población investigada o de estudio: No siempre se puede obtener información de todas las unidades diferencias sistemáticas entre población objetivo y población de estudio se denomina sesgo de
de la población, ya sea por inaccesibilidad, negativas a colaborar, limitaciones de los instrumentos de selección.
medida, etc.
Hay otras fuentes de error/sesgo
 Censo: Estudio de todas las unidades de la población sobre la que estamos interesados en obtener
información.  No respuesta a encuestas embarazosas
 Consumo de drogas, violencia doméstica, prácticas poco éticas,…
 Mentir en las preguntas “delicadas”.
 Espacio muestral: Es el conjunto de muestras posibles obtenidas con un procedimiento de muestreo
dado. TÉCNICAS DE MUESTREO

 Parámetro poblacional: Es cualquier medida de la población (de posición central, dispersión, ...) que Cuando elegimos individuo de una población de estudio para formar muestras podemos encontrarnos en las
estamos interesados en conocer. Los más usuales son la media, el total y la proporción. siguientes situaciones:
 Muestreos probabilistas MUESTREO ESTRATIFICADO
 Conocemos la probabilidad de que un individuo sea elegido para la muestra. Se aplica cuando sabemos que hay ciertos factores (variables, subpoblaciones o estratos) que pueden influir en el
 Interesantes para usar estadística matemática con ellos. estudio y queremos asegurarnos de tener cierta cantidad mínima de individuos de cada tipo:
 Hombres y mujeres,
 En adelante vamos a tratar exclusivamente con muestreos con la menor posibilidad de sesgo  Jovenes, adultos y ancianos…
(probabilistas): aleatorio simple, sistemático, estratificado y por grupos.
Se realiza entonces una m.a.s. de los individuos de cada uno de los estratos.
 Muestreos no probabilistas
 No se conoce la probabilidad. Al extrapolar los resultados a la población hay que tener en cuenta el tamaño relativo del estrato con respecto al
 Son muestreos que seguramente esconden sesgos. total de la población.
 No podemos calcular el error que cometemos a la hora de extraporlar los resultados a la
población Afijación uniforme, proporcional y óptima

Afijación de la muestra (muestreo estratificado): Se llama afijación al reparto, asignación, adjudicación,


MUESTREO ALEATRORIO SIMPLE (M.A.S.)
adscripción o distribución del tamaño muestral n entre los diferentes estratos. Esto es, a la determinación de los
 Se eligen individuos de la población de estudio, de manera que todos tienen la misma probabilidad de valores nh que verifiquen: n1+n2+…+nL=n
aparecer, hasta alcanzar el tamaño muestral deseado.
 Se puede realizar partiendo de listas de individuos de la población, y eligiendo individuos Existen tres tipos de afijación más importantes:
aleatoriamente con un ordenador.  Afijación uniforme : asigna el mismo número de unidades muestrales a cada estrato, de forma que
 Normalmente tiene un coste bastante alto su aplicación. nh=n/L
 En general, las técnicas de inferencia estadística suponen que la muestra ha sido elegida usando m.a.s.,  Afijación proporcional: asigna a cada estrato el tamaño de muestra que resulta de repartir n
aunque en realidad se use alguna de las que veremos a continuación. proporcionalmente a la población. O sea nh= n (Nh/N)
 Afijación óptima: asigna a cada estrato un número de elementos muestrales proporcional al producto
Estimación en el M.A.S.: de su población por su cuasidesviación típica. (Nota: la cuasidesviación típica es igual que la
La finalidad del muestreo es, como ya hemos comentado, estimar unos parámetros de la población a través de la desviación típica pero dividiendo por n-1 en vez de por n).
muestra, y generalmente son estos tres:
Estimadores, sus varianzas y sus intervalos de confianza:
Utilizaremos el subíndice h para indicar el estrato y el subíndice i para la unidad dentro del estrato.
 Nh = número total de unidades en el estrato h
 nh = número de unidades de la muestra en el estrato h
 xih = valor obtenido en la unidad i del estrato h
 Wh = Nh / N ponderación o peso del estrato h
 fh = nh / Nh fracción de muestreo en el estrato h
 xh = media muestral del estrato h
 Sh = cuasivarianza poblacional del estrato h

Nota: para calcular los estimadores deben existir al menos dos unidades en cada uno de los estratos.

MUESTREO POR CONGLOMERADO


Se aplica cuando es difícil tener una lista de todos los individuos que forman parte de la población de estudio,
pero sin embargo sabemos que se encuentran agrupados naturalmente en grupos.
MUESTREO SISTEMÁTICO
Se tiene una lista de los individuos de la población de estudio. Si queremos una muestra de un tamaño dado, Se realiza eligiendo varios de esos grupos al azar, y ya elegidos algunos podemos estudiar a todos los individuos
elegimos individuos igualmente espaciados de la lista, donde el primero ha sido elegido al azar. de los grupos elegidos o bien seguir aplicando dentro de ellos más muestreos por grupos, por estratos, aleatorios
simples,…
Ejemplo: De una lista de 500 alumnos se pretende seleccionar un muestra de estudio. Para ello se elige entre los
diez primeros de la lista un individuo al azar y a partir de ese se toman aquellos que distan 20 posiciones en la  Para conocer la opinión de los médicos del sistema nacional de salud, podemos elegir a varias regiones
lista. Es decir, si el primer individuo seleccionado fue el de la posición 5, los siguientes serán los que presentan la de España, dentro de ellas varias comarcas, y dentro de ellas varios centros de salud, y…
posición 25, 45, 65, 85, 105,............., Al igual que en el muestreo estratificado, al extrapolar los resultados a la población hay que tener en cuenta el
tamaño relativo de unos grupos con respecto a otros.
CUIDADO: Si en la lista existen periodicidades, obtendremos una muestra sesgada.  Regiones con diferente población pueden tener probabilidades diferentes de ser elegidas, comarcas,
 Un caso real: Se eligió una de cada cinco casas para un estudio de salud pública en una ciudad donde hospitales grandes frente a pequeños,…
las casas se distribuyen en manzanas de cinco casas. Salieron con mucha frecuencia las de las esquinas,
que reciben más sol, están mejor ventiladas,… Diferencias entre el muestreo estratificado y por conglomerados
En el estratificado las unidades muestrales son internamente homogéneas y externamente heterogéneas.
En el muestreo por conglomerados es al contrario, heterogéneas internamente pero muy homogéneas
externamente.  Si deseamos estudiar una proporción:

Donde “e” es el error muestral prefijado y PQ la variabilidad poblacional que hay que estimar
(mediante muestreo piloto, otro estudio similar o utilizando el caso más desfavorable que es P=0.5 y
Q=0.5)

OBSERVACIONES EN EL MUESTREO:

INFERENCIAS EN EL M.A.S
Para inferir datos sobre una población de la cual no tenemos todos los datos, a partir de los datos de una muestra,
que sí tenemos, utilizaremos la Estadística Inferencial.

Como se vio en el tema anterior, en la estadística inferencial, podremos inferir mediante:

Estadístico o estimador puntual: Intervalo de confianza.

Intervalos en el MAS:
El intervalo de confianza para la media y la proporción en un muestreo aleatorio simple, cuando la población es
finita, se determina:
 Intervalo para la media:

ERRORES EN EL MUESTREO
En un muestreo podemos considerar tres tipos de errores:
1. El Sesgo del estimador (diferencia entre el valor esperado del estimador usado y el parámetro
poblacional)
 Intervalo para la proporción: 2. Error de estimación (diferencia entre el valor real del parámetro poblacional y el valor que se obtiene
con el estimador)
3. Errores ajenos al muestreo:
 Errores de cobertura
 Falta de respuesta
 Error de respuesta
 Errores de edición, codificación y tabulación
Tamaño óptimo de muestra en el MAS:
 Si deseamos estudiar una media:

Donde “e” es el error muestral prefijado y σ2 es la varianza poblacional que hay que estimar (mediante
la cuasivarianza muestral de otro estudio similar o un muestreo piloto)
1.INTRODUCCIÓN A LA INFERENCIA ESTADÍSTICA. ESTIMACIÓN PUNTUAL, POR INTERVALOS Y
CONTRASTES DE HIPÓTESIS

La Inferencia Estadística proporciona métodos o procedimientos para incre


mentar el conocimiento sobre poblaciones a partir de un conjunto de datos experimentales o muestra.

Si por ejemplo consideramos que X N(,3), con  desconocido, mediante la Inferencia Estadística buscaremos
información sobre . Podemos hacerlo de diferentes formas:

A)Estimación puntual: aproximamos el parámetro mediante un valor puntual obtenido a partir de la muestra.
En el caso de la distribución normal, los estimadores más usuales de los parámetros son la media muestral para 
y la cuasivarianza muestral para la varianza 2 .
B) Estimación por intervalos: calculamos un intervalo de forma que el verdadero valor del parámetro se
encuentra en él con una alta probabilidad (1-).

C) Contrastes de hipótesis: planteamos hipótesis o conjeturas sobre el valor del parámetro bajo estudio o sobre
la forma o expresión de su función de distribución. (H0 hipótesis nula).

Es el que estudiaremos en este tema en profundidad y en las prácticas, pero relacionaremos los intervalos de
confianza con éstos.

En los tres casos, para poder obtener estas informaciones, nos basaremos en un conjunto de observaciones o datos
experimentales, que denotaremos por muestra aleatoria.

¿Qué es un contraste de hipótesis?


 Un contraste de hipótesis es el procedimiento por el cuál se decide si una hipótesis o conjetura
realizada inicialmente sobre un parámetro o una distribución en la población es cierta.
 Se tratará de decidir en base a la observación muestral.
 En todo contraste de hipótesis podemos diferenciar dos hipótesis:
 Hipótesis nula: es la hipótesis que queremos contrastar. No será rechazada a no ser que los datos en la
muestra nos indiquen lo contrario. Se representa por H0.
 Hipótesis alternativa: Es lo contrario de la hipótesis nula. No será aceptada a no ser que los datos
muestrales indiquen evidencia de lo contrario. Se representa por H1
.
Contraste paramétricos y no paramétricos
Decimos que un contraste es paramétrico, cuando las hipótesis planteadas están referidas al valor de un parámetro
desconocido de la población

Decimos que un contraste es no paramétrico, cuando las hipótesis están


referidas a la forma de la distribución, a la aleatoriedad, a la localización, etc.
TEMA 3: INFERENCIA E INTRODUCCIÓN AL ANÁLISIS MULTIVARIANTE
¿Qué es una hipótesis?
 Es una creencia sobre la población, principalmente sobre sus parámetros: (media , varianza,
Proporción).
Ejemplo: Estamos estudiando los enfermos de alergia en la población universitaria de la U.P.O.
Podemos plantear la siguiente hipótesis:
- Creemos que el porcentaje de enfermos de alergia será el 5%. es decir, p=P(estar enfermo)=0.05
Ejemplo: Queremos estudiar la edad de los profesores que imparten clases en Ciencias ambientales.
Podemos plantear la siguiente hipótesis
- Creemos que la edad media de los profesores es de 40, es decir, =40

 El Objetivo del tema será saber deducir si se rechaza o no la hipótesis que planteamos .

Identificación de hipótesis
Existen dos tipos de hipótesis: Nula y Alternativa
Hipótesis nula = H0 Hipótesis Alternativa= H1
 Es la hipótesis que contrastamos  Niega a H0 (es lo contrario de H0).
 Los datos pueden refutarla  Los datos pueden mostrar evidencia a
 No debería ser rechazada sin una buena favor
razón.  No debería ser aceptada sin una gran
evidencia a favor.

Ejemplo: Edad de los profesores que imparten en la UPO

¿Cómo seleccionamos H0?


 H0 es una afirmación inicial sobre la distribución de una variable y que debe ser confirmada.
 Ejemplo: ¿La osteoporosis está relacionada con el género?
Si denotamos por P a la proporción de pacientes con osteoporosis que son hombres, entonces, la Región crítica y nivel de significación
pregunta anterior se traduce a ¿es P=0.5 (50%)? Región crítica Nivel de significación: 
 Región donde se rechaza H0.  Número pequeño: 1% , 5%
Proceso para seleccionar la hipótesis nula:  Es conocida antes de realizar el  Fijado de antemano por el investigador
 Traducir a lenguaje estadístico (que queremos contrastar?) : p=50% experimento: resultados experimentales  Es la probabilidad de rechazar H0cuando
 Establecer su opuesto: p 50% que refutarían H0 es cierta
 Seleccionar la hipótesis nula

Razonamiento básico
Resumen : , p y criterio de rechazo
Sobre  Sobre p Sobre el criterio de rechazo
 Es un número  Es conocido tras Podemos usar dos criterios
pequeño, preelegido al realizar el experimento (equivalentes):
diseñar el experimento.  Conocido p sabemos 1. Rechazamos si el valor de p es
 Es la probabilidad de todo sobre el resultado menor que  ó
rechazar H0 cuando es del experimento
2. Rechazamos si el estadístico
cierta. (rechazamos o no
elegido en la muestra se encuentra
 Conocido  sabemos rechazamos H0)
dentro de la
todo sobre la región región crítica.
crítica

Tipo de contrastes: unilateral y bilateral

Concepto de significación o p-valor (p) Riesgos al tomar decisiones


 La significación o p-valor es la probabilidad que tendría una región crítica que comenzase exactamente
en el valor del estadístico obtenido de la muestra.
 p es conocido después de realizar el experimento aleatorio, ya que debemos de saber cual es el valor
del estadístico obtenido en la muestra.
 El valor P nos da otra forma para decir cuando el contraste es no significativo(No rechazamos H0) o es
significativo (se rechaza H0).

Tipos de error al tomar una decisión


Cuando realizamos un contraste y
tomamos una decisión, es posible que
cometamos errores. En la siguiente tabla
se muestran las posibles situaciones que
pueden darse entre nuestra decisión y la
realidad.

 Contraste para la comparación de dos medias. Prueba T de Student para dos muestras
independientes
Tipos de errores al contrastar hipótesis Esta prueba contrasta si la media de una variable con distribución normal, es la
(de forma general) misma en dos poblaciones distintas o difieren. Las hipótesis que se plantean
son las siguientes.
Nota: no se
puede
reducir a la
vez los dos
tipos de
errores. Lo
usual es siendo 1 y 2 las medias de la variable de interés en las dos poblaciones de estudio. Para aplicar
acotar la esta prueba, la variable de interés debe de seguir una distribución normal en ambas poblaciones y las
muestras estudiadas deben de ser seleccionadas de manera aleatoria e independientes. Deben tener
igual varianza (homocedásticas).

probabilidad de error de tipo I, tomando como posibles valores α= 0.10, 0.05 ó 0.01. Para
disminuir β hay que aumentar el tamaño muestral

Conclusiones

 Las hipótesis no se plantean después de observar los datos, si no antes.


 En ciencia, las hipótesis nula y alternativa no tienen el mismo papel.
 α debe ser pequeño, para asegurar un error de tipo I mínimo.
 Rechazar una hipótesis consiste en observar si el estimador está en la región crítica o,
equivalentemente, si p< α.
 Rechazar una hipótesis no prueba que sea falsa. Podemos cometer error de tipo I
 No rechazar una hipótesis no prueba que sea cierta. Podemos cometer error de tipo II
 Si decidimos rechazar una hipótesis debemos mostrar la probabilidad de equivocarnos.
 Contraste para la comparación de más de dos medias. Prueba ANOVA.
2. Algunos contrastes particulares La prueba ANOVA contrasta si la media de una variable con distribución normal coincide en más de
A.- Contrastes paramétricos. dos poblaciones de estudio. Las hipótesis que se plantean son las siguientes.
 Contraste para la comparación de una media Prueba T de Student para una muestra

La prueba T contrasta si la media de una variable con distribución normal coincide con una
determinada constante o difiere. Las hipótesis que se contrastan son:

siendo i la media de la variable de estudio en la población de estudio i., para i=1,2,...k,

Las hipótesis para aplicar una prueba ANOVA son las siguientes:
siendo  la media de la variable en la población y o la constante con la que se quiere comparar.
 Las muestras deben de ser independientes .
Para aplicar esta prueba, la variable de interés debe de seguir una distribución normal y la muestra  La variable debe seguir una distribución Normal en cada una de las poblaciones de estudio.
estudiada debe de ser seleccionada de manera aleatoria.
 La muestras deben de ser seleccionadas de manera aleatoria.
 La muestras deben de ser Homocedásticas (la varianza de la variable es la misma en todas
las poblaciones).

Algunos contrastes particulares


Contraste de aleatoriedad: Test de rachas de Wald-Wolfowitz
Este test contrasta si los datos de una muestra se han obtenido de forma aleatoria
3.Algunos contrastes particulares no paramétricos o siguen un determinado criterio
Contraste de Normalidad: TEST DE SHAPIRO-WILKS
 Toda la teoría hasta ahora estudiada de muestreo, tiene como hipótesis fundamental, que la población
estudiada se distribuye según una
Normal de media  y varianza 2. Contraste de comparación de dos poblaciones. Test de Wilcoxon-MannWhitney
 Lo primero que debemos hacer a la hora de calcular un intervalo de confianza o realizar un contraste Cuando dos muestras no proceden de distribuciones normales, este test permite
de medias, es asegurarnos que los datos muestrales se distribuyen según una normal. contrastar si la procedencia de las dos muestras es de la misma población. Las
 Para ello vamos a utilizar el test de Shapiro-Wilks o el test chi-cuadrado de Pearson. hipótesis que se plantean son:
 El TEST DE SHAPIRO-WILK sólo es válido para estudiar la normalidad de nuestros datos.
 Realiza el contraste

 A la hora de la práctica, nosotros estudiaremos el valor del p-valor.


 Si es inferior a 0,1 (0,05), estaremos en la región crítica y rechazaremos H0, pudiendo
afirmar que los datos no son normales con un nivel de confianza del 90% (o del 95%).
En este caso, deberemos aplicar los test de hipótesis no paramétricos.

 Cuando el p-value sea superior al 0,1 (0,05), no podremos rechazar H0, no pudiendo
afirmar que los datos no son normales, (con un nivel de confianza del 90% (o del 95%)).
En este caso, procederemos a calcular los intervalos de confianza tal y como hemos 2.- Contraste de aleatoriedad: Test de rachas de Wald-Wolfowitz
estudiado en el tema anterior, así como a aplicar contrastes para comparar medias.

B.- Contrastes no paramétricos


1.- Contraste de Normalidad: TEST DE SHAPIRO-WILK o KOLMOGOROVSMIRNOV
datos analizado

TECNICAS MULTIVARIANTES
1) Métodos de dependencia
Suponen que las variables analizadas están divididas en dos grupos: las variables dependientes y las variables
independientes. El objetivo de los métodos de dependencia consiste en determinar si el conjunto de variables
independientes afecta al conjunto de variables dependientes y de qué forma.

2) Métodos de interdependencia
Estos métodos no distinguen entre variables dependientes e independientes y su objetivo consiste en identificar
qué variables están relacionadas, cómo lo están y porqué.

3) Métodos estructurales
Suponen que las variables están divididas en dos grupos: el de las variables dependientes y el de las
independientes. El objetivo de estos métodos es analizar, no sólo como las variables independientes afectan a las
3.- Contraste de comparación de dos poblaciones. Test de WilcoxonMann-Whitney variables dependientes, sino también cómo están relacionadas las variables de los dos grupos entre sí

4.- Contraste de comparación de varias poblaciones Test de KruskalWallis


Es una generalización del test de Wilconxon-Mann-Whitney para el caso en que se
tengan más de dos poblaciones. Es decir, contrasta si más de dos muestras
proceden de la misma población. Las hipótesis que se plantean son:

4. Introducción Análisis Multivariante.


¿QUÉ ES EL ANÁLISIS MULTIVARIANTE?
Es el conjunto de métodos estadísticos cuya finalidad es analizar simultáneamente
conjuntos de datos multivariantes en el sentido de que hay varias variables medidas
para cada individuo u objeto estudiado.
Su razón de ser radica en un mejor entendimiento del fenómeno objeto de estudio
obteniendo información que los métodos estadísticos univariantes y bivariantes son
incapaces de conseguir.

Objetivos del Análisis Multivariante


1) Proporcionar métodos cuya finalidad es el estudio conjunto de datos multivariantes
que el análisis estadístico uni y bidimensional es incapaz de conseguir

2) Ayudar al analista o investigador a tomar decisiones óptimas en el contexto en el


que se encuentre teniendo en cuenta la información disponible por el conjunto de

You might also like