You are on page 1of 85

ANLISIS MULTIVARIANTE

rea de Metodologa de las Ciencias del Comportamiento Facultad de Psicologa

Universidad de Santiago de Compostela Curso 2011-2012


Profesores: Jess Varela Mallou Antonio Rial Boubeta www.usc.es/psicom 1

TEMARIO
1. Contextualizacin y Revisin General de las Tcnicas Multivariantes 2. El Anlisis Preliminar de los Datos 3. Anlisis de Regresin Lineal Mltiple 4. Anlisis Conjunto 5. Anlisis de Regresin Logstica 6. Anlisis de Supervivencia Bibliografa Evaluacin
Anlisis Multivariante 2

Modelos Multivariantes

Modelos Multivariantes

Modelos Multivariantes

Modelos Multivariantes

Modelos Multivariantes

Modelos Multivariantes

Modelos Multivariantes

Anlisis Multivariante

TEMA 1 CONTEXTUALIZACIN Y REVISIN GENERAL DE LAS TCNICAS MULTIVARIANTES

Guin
Introduccin El mtodo cientfico Importancia de lo multivariante Modelos estadsticos El Modelo Lineal General Fases o etapas de una investigacin Algunos conceptos que debemos recordar Anlisis multivariante Lecturas obligatorias: Definicin Captulo 1 Clasificacin
Captulo 6 Modelos Multivariantes 11

LECTURA OBLIGATORIA del Tema 1

Algunas cuestiones previas. (2008). Estadstica Prctica para la Investigacin en Ciencias de la Salud. Corua: Netbiblo. Pginas 3-11. Introduccin al Anlisis Multivariante. (2008). Estadstica Prctica para la Investigacin en Ciencias de la Salud. Corua: Netbiblo. Pginas 189-199.

Anlisis Multivariante

12

INTRODUCCIN
El psiclogo es un CIENTFICO SOCIAL, por lo que debe desligarse de lo meramente especulativo La labor del cientfico no es fcil. Debe transformar las especulaciones, cbalas e hiptesis en verdades, eso s, en verdades probables .. (uso de la estadstica) Proveerse de un MTODO. No es tanto el contenido de la investigacin, sino el procedimiento de adquisicin e incorporacin de conocimientos, lo que define el territorio cientfico y lo distingue del no cientfico.

Anlisis Multivariante

13

EL MTODO CIENTFICO
El cientfico se plantea descubrir cmo se organizan los fenmenos, sus relaciones, las leyes que los regulan, aunque lo que caracteriza al cientfico no es tanto lo que hace sino cmo lo hace Mtodo Cientfico es el procedimiento mediante el cual podemos alcanzar un conocimiento riguroso y objetivo de la realidad (conjunto de reglas para investigar)
DOS CARACTERSTICAS Carcter emprico: tiene como primer y ltimo referente la experiencia, la observacin Carcter replicable: todos los pasos seguidos hasta llegar a l son susceptibles de ser repetidos de forma idntica
Anlisis Multivariante 14

EL MTODO CIENTFICO
TRES SUPUESTO o PRINCIPIOS La naturaleza es comprensible. Se estructura u organiza siguiendo algn tipo de leyes. Es posible detectar ciertas regularidades y relaciones entre los distintos elementos que la configuran, con el fin de poder catalogarlas y comprenderlas La naturaleza es uniforme. La existencia de las regularidades encontradas (y sus explicaciones) tienen carcter universal. Sin embargo, este principio no resulta del todo asumible para las ciencias sociales ya que existe una variabilidad intrnseca al comportamiento humano que hace necesario el uso de la estadstica para elaborar modelos del comportamiento (variables aleatorias vs. deterministas) La naturaleza tiene una causalidad finita. Los agentes que pueden estar originando un determinado fenmeno no slo son conocibles, sino que adems son limitados, finitos. De esta asuncin se deriva el conocido Principio de Parsimonia, que nos lleva a elegir siempre las explicaciones 15 ms simples para dar cuenta de los problemas

Importancia de lo MULTIVARIANTE
Nadie duda de que el comportamiento humano y el comportamiento de los grupos o de las organizaciones, es algo complejo y sobre el que confluyen multitud de factores Los investigadores del Comportamiento deben dotarse de herramientas estadsticas para poder comprobar cmo distintas variables se combinan para explicar los comportamientos objeto de estudio: Anlisis Multivariante La mejor forma de REPRESENTAR el conocimiento que poseemos de la realidad y de las leyes que la rigen es la ELABORACIN de MODELOS Su relativa uniformidad hace que dichos modelos (cuando se trata de explicar el comportamiento humano) tengan que ser Modelos Estadsticos Adems, dado el carcter finito de la causalidad, en su labor cotidiana el cientfico debe esforzarse siempre en el desarrollo de modelos lo ms parsimoniosos posible
Anlisis Multivariante 16

MODELOS
Qu es un MODELO? Una representacin formal, estructurada, concisa y
clara de la realidad, que permite recoger y explicar sus propiedades y las leyes que la rigen, posibilitando la realizacin de predicciones. TIPOS: Modelos icnicos. Son imgenes fsicas, normalmente tridimensionales y a escala, de algn objeto material o imaginario (Ej: las maquetas) Modelos analgicos. Objetos materiales o procesos pictricos destinados a reproducir en otro medio la estructura del objeto o situacin original (Ej. grficas de los polmetros, del sueo) Modelos teorticos. Una organizacin de ideas o estructura conceptual que ayuda a explicar el comportamiento o los fenmenos investigados. Estn basados en lenguajes especializados, como el lenguaje matemtico o la lgica.
Anlisis Multivariante 17

MODELOS TEORTICOS, 2 tipos:


1. Modelos Matemticos. Son formulaciones matemticas

de una situacin, que permiten hacer predicciones en torno a la distribucin de los acontecimientos Los MODELOS ESTADSTICOS son un tipo concreto de Modelos Matemticos 2. Modelos Informticos. Son modelos expresados en un lenguaje de programacin
Anlisis Multivariante 18

MODELOS ESTADSTICOS
Los MODELOS ESTADSTICOS contienen una parte sistemtica (S) y una parte aleatoria (A) La combinacin de ambos componentes debe ser capaz de reproducir el objeto de inters cientfico (Y)

Y =S+A
Aunque existen multitud de formas de vincular los dos elementos de un Modelo Estadstico, la primera tentativa y la ms recurrida, por su simplicidad, es la FORMA LINEAL, sumando ambos componentes
Anlisis Multivariante 19

MODELO LINEAL

Y =S+A
La parte aleatoria (A) se suele denominar trmino de error y acostumbra a representarse por la letra E La parte sistemtica (S) suele incluir ms de un elemento y, por ello, es frecuente que se desglose en varios componentes sistemticos f(Xi), que representen el efecto simultneo de diversas variables

Y = f ( Xi ) + E
Anlisis Multivariante 20

MODELO LINEAL GENERAL

Y = f ( X i) + E
f(Xi) representa una combinacin lineal de las variables explicativas donde f(Xi) = 1 X1 + 2 X2 + i Xi , siendo 1, 2 y i coeficientes que representan el peso, efecto o importancia relativa de cada variable explicativa de Y

Y = 0 + 1 X 1 + 2 X 2 + K + E
Anlisis Multivariante 21

En definitiva...
La estrategia habitual, cuando el problema de investigacin es relativamente simple, es la de intentar explicarlo a travs de un Modelo Lineal De no ser posible, para no encorsetar la realidad, se recurre a un nivel mayor de complejidad en la formulacin matemtica. Por ejemplo Modelos no lineales como los exponenciales, logartmicos, etc El investigador debe optar siempre por el modelo ms simple y parsimonioso de los plausibles. Es el mayor reto en el desarrollo de una INVESTIGACIN
Anlisis Multivariante 22

Fases o etapas de una INVESTIGACIN


Posible INVESTIGACIN: Me gustara conocer si los ingresos familiares se explican en funcin del nmero de miembros en el hogar y segn el tamao del municipio. Hiptesis: El nivel de ingresos de la unidad familiar apenas presenta diferencia con el nmero de miembros del hogar y el tamao del municipio de residencia, aunque la variabilidad de ingresos sea mayor en los municipios ms grandes

1. 2. 3. 4. 5. 6. 7. 8. 9. 10.

Planteamiento del Problema Formulacin de Objetivos y/o Hiptesis Diseo de investigacin Elaboracin de Cuestionario y procedimiento de administracin Diseo de la Muestra Seleccin de los Entrevistadores Trabajo de Campo y Supervisin Codificacin de preguntas y depuracin de la informacin Tabulacin y Anlisis de Datos Redaccin del Informe de Resultados
23

Anlisis Multivariante

Etapa 1: Planteamiento del Problema


"Problema" es una pregunta para la cual no tenemos respuesta, el punto de partida de toda investigacin cientfica Dejar de tratar problemas es dejar de investigar (Bunge, 1989). Requisitos:
Resoluble Contrastable empricamente Formulable operativamente Expresar una relacin entre variables Claro, sin ambigedades El problema condiciona los mtodos concretos y las tcnicas particulares a emplear para llegar a una respuesta vlida
Anlisis Multivariante 24

Etapa 2: Formulacin de Objetivos y Planteamiento de Hiptesis


Posible explicacin del problema. Primer intento para comprenderlo y solucionarlo
Requisitos:

Establecer una relacin entre dos o ms variables Contrastable empricamente

TIPOS:
A nivel estadstico Hiptesis nula e Hiptesis alternativa
Anlisis Multivariante 25

Etapa 2: Formulacin de Objetivos y Planteamiento de Hiptesis


Delimitar los objetivos nos permite identificar las variables y aspectos concretos EJEMPLO 1: Si deseamos analizar la influencia del nivel cultural en el consumo, debemos diseccionar el concepto nivel cultural en diferentes reas de contenido segn el nivel de estudios, (tipos) lectura de libros, (frecuencia) revistas, (criterios para elegir pelcula, conocimiento de actores y directores) cine, actos culturales. Estas podran ser las preguntas a incluir en un hipottico cuestionario EJEMPLO2: Elaborar un modelo explicativo del proceso de eleccin de un hotel urbano. Posibles variables: expectativas calidad, precio, beneficios buscados, variables situacionales vinculadas al desplazamiento, oferta gastronmica, personales (en compaa de quin), edad, nacionalidad, motivacin, etc.)

Delimitar los objetivos nos permite identificar las variables y aspectos concretos
Para practicar en grupos redactar posibles objetivos (y sus correspondientes variables operativas) para los siguientes casos prcticos de POSIBLES PROBLEMAS . Elaborar un Cuestionario Problema 1. El medio televisin: audiencia y planificacin de comunicacin Problema 2. Estudio seguimiento de la campaa con nome de muller de woman emprende da Universidad de Santiago Problema 3. Tolerancia al abandono del Sistema de Gratuidad de Libros de texto en primaria Problema 4. El mercado de los productos precocinados Problema 5. El perfil del internauta Problema 6. Equipamiento de los hogares. Observatorio de las TIC Problema 7. La moda de Espaa vista por los profesionales del sector Problema 8. Imagen de las cadenas nacionales de radio Problema 9. El poder prescriptor de las Revistas Problema 10. Movilidad de los Universitarios en Santiago y necesidades de transporte pblico

Etapa 3: Diseo de la Investigacin


El Diseo es un plan estructurado de accin. El plan a seguir por el investigador para abordar los objetivos planteados y someter a contraste las hiptesis Aspectos que intervienen: objetivos, naturaleza del problema y de las hiptesis, variables, unidades de muestreo, etc. Debe especificar la estrategia cientfica de partida: Experimental Cuasiexperimental

Selectivo o de Encuesta
Observacional
Modelos Multivariantes 28

Etapa 4: Elaboracin de cuestionario y procedimiento de administracin


Operacionalizacin de las variables de la etapa anterior En todo cuestionario debemos de responder, como mnimo a tres objetivos: 1. Estimar magnitudes 2. Describir a la poblacin 3. Verificar las hiptesis planteadas Decisin sobre la administracin: personal, telefnico, postal Recordar contemplar diferentes tipos de preguntas (abiertas, cerradas, mltiples, etc.) que permitan diferentes tipos de anlisis de datos
Modelos Multivariantes 29

Etapa 4: Elaboracin de cuestionario y procedimiento de administracin


PRUEBA DEL CUESTIONARIO Pre-test o prueba piloto:
para conocer su adecuacin a los objetivos de la investigacin Averiguar la pertinencia de las preguntas Si el orden es lgico El lenguaje es apropiado al target Probar con diferentes versiones de cuestionarios Preguntas abiertas o categoras de respuestas, etc.

El Pre-test tambin puede utilizarse para:


Comprobar la idoneidad de la seleccin muestral Conocer el tipo de muestreo Estimar el porcentaje de no-respuesta y posibles estrategias que la eviten La adecuacin de la forma de administrarlo, el momento y el lugar Planificar futuras instrucciones, estimar tiempo y formar entrevistadores

Etapa 5: Diseo de la Muestra


Localizacin de la poblacin o universo (target) Seleccin de informantes (muestra representativa) mediante procedimientos de la teora muestral La elaboracin previa del cuestionario que responda a los objetivos de la investigacin, es clave para determinar la necesaria representacin de diferentes submuestras o segmentos, y no tener que recurrir, posteriormente, a la ponderacin del fichero de datos

Etapa 6: Seleccin de los Entrevistadores

Para evitar sesgos en la administracin del cuestionario, los entrevistadores deben de trabajar de acuerdo con un protocolo previamente consensuado que garantice la mxima homogeneidad interentrevistadores. Las condiciones de la entrevista, a lo largo de la muestra, debe ser independiente del entrevistador Para ello: adecuacin, seleccin y formacin, acompaado de un buen briefing que reduzca la posible variabilidad

Etapa 7: Trabajo de campo y supervisin


Prevenir determinados errores puntuales y que no se conviertan en hbitos 3 tareas claves:
1. Revisin de los cuestionarios: datos de identificacin, % respuestas, codificacin preguntas, omisin preguntas, calidad respuestas, seguimiento preguntas filtro, amabilidad de la entrevista, etc. Incidencias en la recogida de los datos: hablar con los jefes de zona y equipo para posibles incidencias Comprobacin de las rutas aleatorias: comprobacin de las unidades ltimas del muestreo (completarlo adecuadamente)

2. 3.

Etapa 8: Codificacin de preguntas y depuracin de la informacin Durante el propio trabajo de campo, el supervisor de la red debe comprobar las preguntas, si se complet, posibles contradicciones lgicas en las respuestas, En el centro de la investigacin: categorizacin y codificacin de preguntas abiertas y considerar posibles re-clasificaciones (ej. preguntas mtricas en no mtricas) Creacin fichero de datos y grabacin: buscar inconsistencias, valores fuera de rango, respuestas de las preguntas filtro, transformacin de variables, cuantificar la no-respuesta, etc anlisis preliminar de los datos

Etapa 9: Tabulacin y Anlisis de Datos


Una vez preparada la informacin, ahora comienza el anlisis de los datos.
1. Conocer detalladamente cada una de las variables utilizadas en la investigacin: distribuciones de frecuencias, estadsticos univariantes y representaciones grficas El anlisis univariado ayuda a conocer y preparar los datos que puedan ser utilizados en las relaciones bivariantes o relaciones entre variables. Existen diferentes tcnicas en funcin de la escala en la que se ha medido cada variable (nominal, ordinal, intervalo, razn): diferencias de porcentajes, diferencia de medias, relacin significativa entre variables, .) El Anlisis Multivariado. Analizar conjuntamente + 2 variables En otras palabras..

2.

3.

ANLISIS de datos
La ESTADSTICA como un cuadro de herramientas. 3 niveles de anlisis:
Nivel 1: DESCRIPTIVO-UNIVARIADO. Resumir e ilustrar la informacin contenida en una matriz de datos Nivel 2:INFERENCIAL-BIVARIADO. Estimar parmetros, contrastar hiptesis, comparar el comportamiento de dos o ms grupos o analizar la relacin entre pares de variables Nivel 3: MODELIZACIN-MULTIVARIANTE. Elaborar modelos, ecuaciones o funciones que permitan explicar unas variables a partir de otras o identificar variables latentes para resumir la informacin Modelos Multivariantes 36

Interpretacin y Discusin de resultados


Aceptacin o rechazo de la hiptesis de trabajo En Ciencia no hay verdades absolutas: los resultados deben expresarse en trminos probabilsticos Margen de Error .......Nivel de Confianza Error Tipo I () y Error Tipo II () Deben relacionarse con la teora implicaciones tericas y prcticas) (inducir posibles

Significacin estadstica y prctica (relevancia cientfica)


Modelos Multivariantes 37

Generalizacin de resultados
Determinar a qu poblacin podemos aplicar nuestros resultados y ampliar los conocimientos (muestreo) Problema de la Representatividad de la muestra: * Sujetos * Contexto
.

Calidad del Diseo Experimental: Validez Interna, Validez Externa, Validez Ecolgica y Validez de Constructo

Modelos Multivariantes

38

Generalizacin de resultados
.

Validez Interna
Es el grado en que los cambios observados se pueden atribuir a la manipulacin experimental. Estudia hasta que punto una causa puede ser atribuida a un efecto. Ej.: Ensayo clnico: tiene el mximo grado de validez interna. 1. Experimentales autnticos: Verdaderos, puros, pues no tienen problemas de validez interna 2. Cuasiexperimentales: No se pueden descartar la presencia de variables confundidoras, pues no es posible eliminarlas todas. El investigador sabe que A es causa de B, pero no est seguro que A tambin pueda ser causa de otros factores como C D. 3. No experimentales: Estn cerca de los anteriores en cuanto a validez interna, aunque presentan ms variables confundidoras, pueden ser: 3.1 Longitudinales: (Prospectivo / Retrospectivo) 3.2 Transversales. AMENAZAS: Las variables confundidoras que afectan al diseo, forman parte de las AMENAZAS a la validez interna. Ejemplo. : Dar un curso de educacin sanitaria en un barrio de la ciudad, formo dos grupos : 1.- Con personas de la raza paya 2.- Con personas de la raza gitana A los payos les doy el curso y a los gitanos no les doy el curso Si posteriormente analizamos quien cumple mejor las reglas de higiene y nuestra hiptesis es que el curso ha servido para aumentar la higiene, tambin deberemos tener en cuenta que hay variables que han podido influir, tales como la raza y/o las diferencias en el poder adquisitivo o nivel econmico de los grupos. 39 - Cuando una variable hace que un grupo de partida sea diferente (por ej. raza) se les llama AMENAZA

Generalizacin de resultados
.

Amenazas a la Validez Interna


1. HISTORIA. Cuando hay acontecimientos externos que ocurren simultneamente con ste y que pueden alterar o influir. Ej. : Programa educativo. Al margen de este programa tenemos que se hace gimnasia y se sigue una dieta sana, estos factores influyen en los resultados. 2. SELECCIN. Cuando los grupos de estudio son diferentes. Ej. Raza, sexo, ... 3. MADURACION. Son los cambios producidos por evolucin natural. Tiene relevancia en salud y confunde el efecto del cambio de la variable con el de la causa. Ej. : Herida mejora hagamos o no hagamos nada, pero cunto depende la mejora de la herida de lo que hemos hecho sobre ella?. 4. EFECTOS RELATIVOS DEL PRE-TEST. Es la influencia que produce el pre-test. Ej.: Si medimos la higiene en los gitanos de un barrio y posteriormente aplicamos el programa y volvemos a medir. Cunto del cambio es por el programa y cunto por ser la primer a vez que se le mide la higiene? 5. MORTALIDAD. El que desaparezcan sujetos de los grupos de comparacin. No sabemos que sujetos se pierden, unos se mueren y otros se van. 6. INSTRUMENTACION. Uso de instrumentos no fiables ni validos. 7. REGRESION ESTADISTICA. Los sujetos seleccionados representan situaciones o puntuaciones en alguna variable. Cuando se usan sujetos extremos. Sucede cuando, para probar los efectos, se escogen a los sujetos ms extremos. Ej.: Para probar los efectos de una dieta seleccionamos a los ms gordos.

Generalizacin de resultados
.

Validez Externa
.

Es el grado en que los resultados de un estudio pueden ser generalizados a muestras o condiciones espacio-temporales diferentes. Ej. A causa B, pero seguira causando B con otros: * Sujetos *Contexto (Validez Ecolgica) * Momentos Los estudios descriptivos (encuestas) son los que ms se preocupan por la validez externa. La validez externa est afectada por los siguientes aspectos: * Por la variable independiente. Es el nivel de operacionalizacin de la Variable Independiente. Efecto Rosenthal: es el efecto derivado de las expectativas. Cuando algo se espera un efecto favorece que se produzca. Se reflejan en el otro sujeto * Efecto Hawthorne: son las expectativas que el sujeto tiene sobre si mismo, es el efecto de la autoexpectativa. Se refleja por el sujeto sobre s mismo * FIABILIDAD (Yin,1994): El criterio para demostrar que las caractersticas de una investigacin no condicionan los resultados. (Ej: La recogida de datos: Si repetimos el estudio obtendramos resultados similares. Grado de seguridad o consistencia. Objetivo minimizar los errores y los sesgos)

Generalizacin de resultados
.

Validez Ecolgica
Es aquella que se puede aplicar en distintos contextos. Ej. Los hospitales de EE.UU. no son iguales que los hospitales de Espaa, por lo tanto lo que all es vlido puede no serlo aqu

Validez de Constructo
Alude a la relacin existente entre la V. Independiente que se manipula y el constructo terico que se supone se manipula. Representa principalmente dos amenazas: 1. Problemas en la definicin operacional del constructo. 2. Poco desarrollo terico del constructo.
.
Modelos Multivariantes 42

Etapa 10: Redaccin del Informe


Presentacin de los hallazgos de la investigacin: Ttulo, resumen, introduccin, y describir los objetivos Tambin debe de recoger cmo se llegaron a todos los resultados: el proceso de la investigacin, mtodos y tcnicas utilizadas, as como la discusin o conclusiones, sin olvidarse de las referencias bibliogrficas (oportunidad de replicacin) Debe de perseguir reunir lo ms importante de esa lnea de investigacin e integrar los resultados en un marco terico, al tiempo que resaltar posibles lagunas y nuevos interrogantes. Existe una tendencia a comunicar slo los resultados que confirman la hiptesis
Cdigo deontolgico ESOMAR:. Antecedentes, Muestra (descripcin universo, tamao muestral, sustitucin y distribucin geogrfica proyectada y conseguida, mtodo de ponderacin, tasas de respuesta y posibles sesgos de la no respuesta, etc.), Recogida de los Datos (procedimiento del campo, personal, instrucciones, control de calidad, reclutamiento e incentivos, fecha, etc.) y Presentacin de los Resultados (bases de porcentajes, margen error estadstico, medias significacin de las diferencias, tec.)

Resumen etapas de una investigacin mediante encuesta

Algunos conceptos que debemos recordar.

VARIABLES
Toda caracterstica o dimensin de un sujeto (u objeto) susceptible de adoptar distintos valores o nombres. Por ello podemos hablar de medida en Psicologa Tipos de variables ...teniendo en cuenta: Su nivel de medida (Stevens, 1951): Nominales Ordinales Intervalo Razn Su papel en la investigacin Independientes (predictores) Dependientes (criterio)
Modelos Multivariantes 46

VARIABLE NOMINAL
Los nmeros no implican cantidad, sino cualidad, categoras, funcin identificadora (sexo, estado civil, etc.) Ejemplo: Cul es su estado civil?
* Soltero * Casado * Separado * Divorciado * Viudo (1) (2) (3) (4) (5)
47

Modelos Multivariantes

VARIABLE ORDINAL
Los nmeros reflejan cantidad Pueden establecerse relaciones de orden (mayor o menor) No existe una unidad de medida Ejemplo: En conjunto dira usted que se siente actualmente:
* Nada feliz * Poco feliz * Bastante feliz * Muy feliz * Totalmente feliz (1) (2) (3) (4) (5)
48

Modelos Multivariantes

VARIABLE de INTERVALO
Unidad de medida pero no cero absoluto o ausencia de... Ejemplos: el C.I., temperatura

VARIABLE de RAZN
Existencia de un cero absoluto
Ejemplo: INGRESOS ECONMICOS Niveles de medida dbiles y fuertes (ESCALA)
Modelos Multivariantes

49

Otras clasificaciones de Variables


Variables Cualitativas (nominales): Dicotmicas y politmicas (Sexo, raza, tipo de consumidor, etc.) Variables Cuantitativas (intervalo y razn): Peso, nmero de hermanos, ingresos, etc.). Discretas y continuas. Variables Cuasi-cuantitativas (ordinales): Clasificacin en una oposicin, Ordenamiento por preferencias, Prctica de deportes, etc. Variables categricas (codificables: nominales u ordinales)
Modelos Multivariantes 50

Algunos conceptos
Codificar es asignar cdigos numricos o alfabticos a las
diferentes categoras de una variable cualitativa u ordinal. Permite identificar las distintas categoras de una variable
Sexo : Hombre (0) Mujer (1) Hombre (H) Mujer (M)

Los datos missing representan la falta de respuesta. Es frecuente tener casos incompletos por diversas razones. El SPSS les asigna una coma
Modelos Multivariantes 51

Algunos conceptos
Tipos de Datos:
Longitudinales (evolucin de una variable a lo largo del tiempo. Variables clnicas) Transversales (distintos elementos en un mismo momento. Encuestas de opinin) De Panel (combinacin de los anteriores. Diversos elementos en diferentes momentos. Encuesta de Poblacin Activa) Datos de Perfil Datos de Preferencia Datos de Proximidad y/o Similaridad Datos de Distancia y/o Disimilaridad
Modelos Multivariantes 52

Ms conceptos
Datos mtricos y no mtricos Poblacin Muestra Parmetro Estadstico Error de muestreo Error tpico Distribucin muestral

Contraste estadstico Linealidad Residuo Grfico de dispersin Caso atpico

Anlisis Multivariante

53

MATRICES
1 . . Sujetos . . . . x m m1 Variables 1 . . . . . . . . . . . . . . . .n x11 x1n (xij)

xnm

Conjunto de nmeros reales ordenados en filas y columnas. El lugar donde se recoge la informacin de una investigacin
Modelos Multivariantes 54

ANLISIS MULTIVARIANTE: DEFINICIN Y CLASIFICACIN

ANLISIS MULTIVARIANTE
La Complejidad de los fenmenos sociales obliga a recoger gran cantidad de medidas. Se necesita una visin conjunta e integrada de la realidad: Anlisis Multivariante Por lo tanto, surge como una forma de hacer asimilable al entendimiento humano gran cantidad de datos que hay en una MATRIZ que represente la realidad, sintetizando los aspectos ms relevantes y perdiendo el mnimo de informacin posible. til porque permite descubrir estructuras, establecer relaciones o contrastar hiptesis globales, reflejando los mecanismos que actan para determinar la conducta humana de una manera ms adecuada, ya que est multideterminada. KENDALL lo define como una extensin del anlisis univariable y bivariable al anlisis simultneo de ms de dos variables en un muestreo de observaciones.

Anlisis Multivariante

56

ANLISIS MULTIVARIANTE
Razones de la expansin
1.Necesidades de investigacin. La complejidad de los fenmenos sociales requiere un tratamiento de datos multidimensional 2.El desarrollo de la informtica y los ordenadores. Posibilidad de realizar clculos complejos en pocos segundos 3.Utilidad en numerosos campos 4.Proliferacin de la investigacin de mercados y los estudios de opinin (ver www.usc.es/psicom) 5.Abundante bibliografa aplicada (artculos, manuales y series monogrficas)
Anlisis Multivariante 57

ANLISIS MULTIVARIANTE
PELIGROS: Fcil estimacin y difcil interpretacin Incluir demasiadas variables (vs. parsimonia) Olvido de la teora (modelizar por modelizar) PROBLEMAS: Incumplimiento de Supuestos Tamao muestral elevado Casos anmalos Relevancia conceptual y significacin estadstica
Anlisis Multivariante 58

Una primera aproximacin


Tcnicas o herramientas estadsticas que nos permiten analizar un conjunto de muchas variables, y poner a prueba distintos modelos para explicar las relaciones entre ellas, adoptando as un tratamiento de datos multidimensional Muy diversas
Regresin Lineal, Anlisis Discriminante, Regresin logstica, Anlisis de Varianza, Anlisis Conjunto, Anlisis de Supervivencia, Anlisis de Estructuras de Covarianza (Ecuaciones Estructurales), Anlisis Factorial, Anlisis de Correspondencias, Anlisis de Conglomerados, Escalamiento Multidimensional, Anlisis Log-Linear,

Multivariate Analysis
Anlisis multivariable: psicologa, sociologa y economa Anlisis multivariante: bioestadstica, biologa Anlisis multivariado: educacin

59

DEFINICIN
Sheth, 1968. Mtodos estadsticos que se preocupan por el anlisis de las mltiples medidas que se han hecho sobre un cierto nmero de objetos Kendall, 1975. El conjunto de tcnicas estadsticas que analizan simultneamente ms de dos variables en una muestra de observaciones Cuadras, 1991. Una rama de la estadstica que estudia, interpreta y elabora el material estadstico sobre la base de un conjunto de n>1 variables, que pueden ser de tipo cuantitativo, cualitativo o una mezcla de ambos Hair, 1998. Todos los mtodos estadsticos que analizan simultneamente medidas mltiples de cada individuo u objeto sometido a investigacin
Anlisis Multivariante 60

CLASIFICACIN
Los primeros desarrollos surgen en el mbito de la Psicologa con Spearman sobre el Anlisis Factorial Aunque, posteriormente, fue en Marketing donde ms se utilizaron. La primera clasificacin surge en el Vol. 35 del Journal of Marketing (Kinnear y Taylor, 1971; Sheth, 1971) Dos criterios para clasificar las tcnicas multivariantes:
a) b) En funcin de los objetivos analticos de la investigacin: Descriptivos y Explicativos Criterios tcnicos como el nmero y la relacin entre las variables: Dependencia e Independencia
Anlisis Multivariante 61

a) En funcin de los objetivos de la investigacin


1. Tcnicas Multivariantes DESCRIPTIVAS. Las que tratan de DESCRIBIR la realidad: Exploratorias, Descriptivas EXPLORATORIAS: Realizan un acercamiento a la realidad sin hiptesis previas. Buscan nuevos conocimientos. (Ejemplos: Anlisis factorial exploratorio, Anlisis de correspondencias, Escalamiento multidimensional y el Anlisis de conglomerados) DESCRIPTIVAS: Estudian la interdependencia entre todas las variables con el fin de reducir el nmero de variables necesarias para describir la informacin relevante incluida en las observaciones (parsimonia). Tcnicas Multivariantes EXPLICATIVAS . Las que tienen como fin EXPLICAR la realidad. Tambin denominadas Predictivas Parten de hiptesis extradas de un marco terico, y la investigacin trata de validarlas empricamente. (Ej. Anlisis de la varianza y covarianza, regresin mltiple, regresin logstica, anlisis discriminante y modelos log-lineales, MANOVA) Tambin se denominan PREDICTIVAS porque ayudan a comprender y explicar un fenmeno o VD, determinando las relaciones de dependencia respecto a un conjunto de VI. Esto es, se parte de una situacin a predecir (V.D.) y de un grupo de variables intervinientes o V.I. cuya influencia se desea mantener bajo control y observar su efecto

2.

b) En funcin del nmero, relacin y naturaleza de las variables


SHETH, 1971, 3 preguntas referidas a la relacin entre las variables: Cul es el nmero de variables dependientes que hay? Existencia o ausencia de variables dependientes e independientes: Son unas variables dependientes de otras? La escala de medida de cada variable. Variables cuantitativas (mtricas) y cualitativos (o mtricas como nominal y ordinal). Cules son las propiedades de los datos? 2 grandes tipos: Mtodos de Dependencia: Regresin, Discriminante, Anlisis de Varianza, Anlisis Conjunto. Kinnear y Taylor, 1971: incluye tambin el nivel de medida de las variables independientes Mtodos de Interdependencia: Cluster, Factorial, Correspondencias, Escalamiento
Anlisis Multivariante

63

Todas las tcnicas Multivariantes segn Sheth


Algunas de las variables son dependientes de otras?
S

NO

Reciben el nombre de

Reciben el nombre de

Tcnicas de Interdependencia
Se acercan a la realidad sin hiptesis especficas y tratan de describir la realidad sintetizando la informacin relevante: Tcnicas Descriptivas o Reductivas

Tcnicas de Dependencia
Detectan las relaciones de dependencia entre una (o varias) V.D y una (o varias) V.I. elaborando una hiptesis que se intenta validar empricamente: Tcnicas Explicativas o Predictivas
Anlisis de Regresin, Medicin Conjunta, Anlisis Discriminante, Anlisis de Varianza 64

Anlisis Factorial, Anlisis de Conglomerados, Escalamiento Multidimensional Analisis Multivariante

4. Anlisis Conjunto

Modelos Multivariantes

65

Hay que ser capaz de reproducirlo sin mirar !!!

Modelos Multivariantes

66

Modelos Multivariantes

67

REGRESIN LINEAL
OBJETIVO: Explicar o predecir una variable Criterio a partir de una o varias variables predictoras. Caso simple o mltiple Y = a + b1X1 + b2X2 ++ bnXn
(mtrica) (..mtricas.)

EJEMPLO: Predecir las ventas a partir de la inversin en publicidad, n de tiendas, descuento aplicado. La cuota de mercado en funcin de las preferencias de los consumidores y la estructura de los canales de distribucin, etc. CONDICIN: Predictores y Criterio cuantitativos Simple o Mltiple
Caso especial: predictores categricos (Regresin con variables ficticias: DUMMY) Anlisis Multivariante 68

REGRESIN (LINEAL) MLTIPLE


EN EL TEMA 3 estudiaremos Analiza la naturaleza de las relaciones entre un conjunto de variables con el objeto de hacer predicciones Tratando de conocer el influyo que una serie de V.Is. ejercen sobre V.D. Se hace ajustando una nube de puntos a una lnea utilizando el mtodo de los mnimos cuadrados Requerimientos: Que la V.D. sea mtrica y las V.Is. Mtricas (excepcionalmente categricas) Busca predecir los cambios en la V.D. cuantitativa en funcin de los cambios en varias V.I. cuantitativas Esta relacin no implica que una sea causa de otras. Los coeficientes calculados slo aportan informacin sobre el grado en que varias variables estn asociadas, y no es posible extraer de ellos leyes de causalidad Anlisis Multivariante 69

ANLISIS DISCRIMINANTE
OBJETIVO: Identificar funciones capaces de separar dos o ms grupos
de individuos segn sus puntuaciones en una serie de variables, con el fin de localizar las variables que contribuyen en mayor grado a discriminar a los sujetos de los diferentes grupos establecidos a priori. Tcnica de clasificacin.
Y = X1 + X2 + X3 + ... + Xn (no mtrica) (mtricas)

Obtener una funcin discriminante del tipo:


Zjk = a + W1X1+ W2X2 + ... + WjXk

EJEMPLO: Predecir el voto a partir de los ingresos econmicos, la edad CONDICIN: Predictores cuantitativos y Criterio categrico Simple o Mltiple (segn el criterio sea dicotmico politmico)
Anlisis Multivariante 70

ANLISIS DISCRIMINANTE
Cuando en los ejemplos anteriores la V.D. es cualitativa o categrica Su fin es localizar funciones capaces de separar dos o ms grupos de individuos a partir de sus respuestas en una serie de variables. con el fin de localizar las variables que ms contribuyen a discriminar a los sujetos en los diferentes grupos establecidos por la variable dependiente Se utiliza para determinar el grupo al que pertenece un individuo que no ha proporcionado parte de la informacin solicitada: Conocer la opcin poltica de personas que no responden a esa pregunta Conocer si un nio puede desarrollar un cuadro depresivo o no En qu se diferencian los consumidores que respondieron a una campaa de MKT de aquellos que no lo han hecho Estimar si un nuevo producto tendr xito en el mercado considerando la inversin en publicidad y el precio
Anlsiisi Multivariante 71

REGRESIN LOGSTICA
OBJETIVO: Pronosticar o explicar la pertenencia de los sujetos a un grupo, a partir de sus puntuaciones en una serie de variables independientes o predictores (similar al discriminante). Estimar la probabilidad de que se de un evento. EJEMPLO: Predecir si un alumno va a aprobar o no en funcin de las horas de estudio, frecuencia de asistencia a clase, estatus socioeconmico

Y =
(no-mtrica)

X1 + X2 + X3 + ... + Xn
(mtricas o no-mtricas)

CONDICIN: VD categrica y VI mtricas-no mtricas Permite trabajar con predictores cualitativos y/o categricos
Anlisis Multivariante 72

REGRESIN LOGSTICA
Caso particular de la Regresin Mltiple en el que la V.D. es cualitativa, y las V.I. pueden ser cuantitativas o cualitativas Ventaja de esta tcnica: tiene pocas restricciones sobre la distribucin de las V.I., estando ms libre de supuestos restrictivos que la regresin mltiple y el anlisis discriminante El principal objetivo es la prediccin pero ahora la V.D. es cualitativa Es til cuando queremos saber si ciertas caractersticas socioeconmicas (estado civil, ingresos, nivel de estudios, etc.) influyen en que un individuo compre un determinado coche, conocer las caractersticas demogrficas de los clientes habituales y de los clientes ocasionales, etc.
Anlisis Multivariante 73

ANLISIS CONJUNTO
OBJETIVO: Entender cmo conforman los individuos sus preferencias hacia los objetos o estmulos, estimando la importancia relativa que le conceden a cada uno de los atributos o caractersticas de ste. CONDICIN: VI categrica (atributos) y VD ordinal Muy utilizado en Marketing (diseo de nuevos productos, test de envases, elasticidad del precio, Identificacin del producto ideal, segmentacin de mercados, simulaciones, etc.) Basado en los Modelos Descomposicionales Compensatorios EJEMPLO: Explicar las preferencias de las amas de casa hacia las diferentes opciones de LECHE envasada
Anlisis Multivariante 74

ANLISIS CONJUNTO (AC)


EJEMPLO: Desarrollo de un nuevo modelo de automvil.
Dudamos entre tres niveles de potencia (60cv, 100cv, 125cv) (3niveles) Una carrocera de tres o cinco puertas (2niveles) Instalacin de una serie de extras en el modelo ms bajo de gama.. (2) Aire acondicionado de serie(2) Tres precios distintos(3)

TAREA EXPERIMENTAL: Se solicita la opinin de un grupo de consumidores que debern de valorar 72 productos resultantes de la combinacin de sus caractersticas objeto de anlisis (3x2x2x2x3) La tarea es complicada y no llega a ser realista; por eso el A.C. realiza una seleccin de todas las combinaciones posibles, mostrando al consumidor tan slo algunas de stas RESULTADOS: El investigador es capaz de valorar la importancia de todos los atributos y los niveles de cada uno, mientras los consumidores valoran nicamente los perfiles de unos pocos productos
75 Anlisis Multivariante

Y CMO SE HACE?
El principio bsico consiste en descomponer PREFERENCIAS manifestadas por los productos en UTILIDADES O IMPORTANCIAS por atributo (y nivel) desarrollando los siguientes pasos: 1) Identificacin y Seleccin de los atributos relevantes para esa categora de producto o servicio. Focus group o experiencia del equipo. Ej. Al desarrollar una botella de agua podemos definir el formato y color del envase, el tapn, el precio, la marca, 2) Definicin de niveles u opciones para cada atributo. Para el atributo tapn podemos pensar en rosca, click,. 3) Seleccin de la combinacin de atributos a ser evaluada con el fin de determinar cul de todas es la preferida (ideal) para los consumidores
Modelos Multivariantes 76

y cmo se hace?
4) Recoleccin de datos La recogida de datos o la evaluacin de los estmulos se puede realizar de diferentes maneras: a) alternativas de a pares, pidiendo que elija entre dos productos b) ordenando los productos en un ranking, pidiendo que los clasifique por orden de preferencia c) Valorando los productos en una escala de 0 a 10 5) Seleccin del mtodo para calcular los valores de utilidad * Elegir un mtodo para cuantificar los valores de utilidad percibida de cada combinacin de atributos * Tambin es conveniente integrar los valores de utilidad con un anlisis costo-beneficio porque muchas veces la opcin ms valorada no es la ms rentable
Modelos Multivariantes 77

ANLISIS DE SUPERVIVENCIA
OBJETIVO: Predecir o modelizar el tiempo que transcurre hasta que ocurre un evento, el RIESGO de EJEMPLO: Conocer la probabilidad de supervivencia de un grupo de pacientes de una determinada patologa en funcin del tratamiento recibido, edad, etc. CONDICIN (3 variables diferentes): DE RESPUESTA: Tiempo de registro o seguimiento (cuantitativa) DE CENSURA: Si ha ocurrido o no el evento (dicotmica) EXPLICATIVAS: cuantitativa o cualitativa (Edad, Tratamiento, )

Anlisis Multivariante

78

ANLISIS DE VARIANZA
OBJETIVO: Determinar e qu medida una VD est influenciada por una o varias VI. Comprobar si existe un efecto significativo de un Tratamiento EJEMPLO: Comprobar si existe un efecto significativo del consumo de alcohol sobre el rendimiento atencional CONDICIN: VI categrica (factores) y VD cuantitativa Ideal para experimentos Una o varias VAS (VI): ONEWAY ANOVA (Diseos factoriales) MANOVA (Anlisis Multivariante de la Varianza: varias VD) ..Hasta aqu, fueron tcnicas de Dependencia. ahora sern de Interdependencia
Anlisis Multivariante 79

ANLISIS FACTORIAL
OBJETIVO: Reduccin de datos. A partir de la relacin entre variables observadas identificar un nmero menor de variables resumen, FACTORES o variables latentes que resultan despus de eliminar las redundancias existentes entre el conjunto inicial de variables observadas EJEMPLO: Agrupar tems de una escala y etiquetarlos bajo una misma dimensin o factor de evaluacin CONDICIN: Variables cuantitativas Exploratorio (AFE): Componentes Principales Confirmatorio (AFC): LISREL, AMOS

Anlisis Multivariante

80

ANLISIS DE CORRESPONDENCIAS
OBJETIVO: Reduccin de datos. A partir de la relacin entre variables observadas identificar DIMENSIONES o variables latentes. Profundiza en las relaciones que se establecen entre dos o ms variables categricas EJEMPLO: Obtener un Mapa Perceptual de Posicionamiento que muestra la asociacin entre el objeto y un conjunto de caractersticas, por ejemplo, de los pases tursticos europeos, identificando las dimensiones subyacentes CONDICIN: Variables cualitativas. SIMPLE (entre las categoras de dos variables) o MLTIPLE (ms de dos) Un subtipo de Anlisis Factorial, ideal para tablas de asociacin (recogida de datos rpida) Muy utilizado en Marketing
Anlisis Multivariante 81

ANLISIS DE CONGLOMERADOS (cluster)


OBJETIVO: Identificar grupos homogneos de sujetos u objetos a partir de su puntuacin en una serie de variables. Estos grupos, a su vez, deben de ser muy diferentes entre s. Alta homogeneidad interna y elevada heterogeneidad entre los grupos EJEMPLO: identificar segmentos de jvenes en funcin de sus hbitos de consumo. Es decir, permite clasificar una poblacin en el menor nmero posible de grupos mutuamente exclusivos y exhaustivos, basndose en la similitud entre los casos CONDICIN: Variables medidas en la misma escala Tambin llamado Cluster Analysis Tcnica de Clasificacin Los grupos no son conocidos a priori
Anlisis Multivariante 82

ESCALAMIENTO MULTIDIMENSIONAL
OBJETIVO: Utilizar las proximidades entre objetos para realizar una representacin espacial de los mismos, identificando las dimensiones subyacentes EJEMPLO: Representacin espacial de las similitudes entre las distintas marcas de cerveza en Galicia, con el fin de conocer el posicionamiento relativo de cada una de ellas CONDICIN: Gran versatilidad en la recogida de datos (distintos tipos de tareas) Gran Utilidad en MKT e investigacin social Transforma los juicios de los consumidores, respecto a similitudes o preferencias, en distancias representadas en un espacio multidimensional
Anlisis Multivariante 83

OTRAS TCNICAS
Modelos de Ecuaciones Estructurales (SEM) o Anlisis de Estructuras de Covarianza Permite comprobar en qu medida un modelo terico se ajusta a los datos empricos En ocasiones se le llama tambin Path Analysis Variables cuantitativas Programas estadsticos: LISREL y AMOS Modelos Log-Lineales: Permite poner a pruebas modelos que postulan distinto tipo de relaciones entre dos o ms variables categricas.

Modelos Multivariantes

84

autoevaluacin
Crear una combinacin lineal de variables independientes para predecir de la mejor forma la variable dependiente. REGRESIN MLTIPLE Correlacionar una combinacin lineal de variables dependientes con una combinacin lineal de variables independientes CORRELACIN CANNICA Crear una combinacin lineal de variables para conocer la significacin de la diferencia entre grupos.. ANOVA, MANOVA Crear una combinacin lineal de variables independientes para maximizar la diferencia entre grupos, entre variables dependientes (prediccin de pertenencia a un grupo).. ANLISIS DISCRIMINANTE Crear una combinacin lineal de variables observadas que representen variables latentes.. COMPONENTES PRINCIPALES, ANLISIS FACTORIAL
Modelos Multivariantes 85

You might also like