You are on page 1of 84

Introducci´

on
Clustering
An´
alisis Discriminante
An´
alisis Factorial

An´alisis Multivariante con Stata
Diploma Avanzado en Metodolog´ıa de Investigaci´on en Ciencias
de la Salud
EVES. Valencia, Oct 2013

Francisco Garc´ıa Garc´ıa
fgarcia@cipf.es

Francisco Garc´ıa Garc´ıa

An´
alisis Multivariante son Stata

Introducci´
on
Clustering
An´
alisis Discriminante
An´
alisis Factorial

Indice

1

Introducci´
on

2

Clustering

3

An´
alisis Discriminante

4

An´
alisis Factorial

Francisco Garc´ıa Garc´ıa

An´
alisis Multivariante son Stata

Introducci´
on
Clustering
An´
alisis Discriminante
An´
alisis Factorial

An´
alisis Multivariante
An´
alisis Multivariante con Stata

Algunas preguntas...

1

¿De qu´
e forma se pueden agrupar a los pacientes que ingresan en un hospital
seg´
un los recursos que consumen?

2

¿Qu´
e criterios pueden ayudar a diagnosticar si una obstrucci´
on de v´ıas biliares
est´
a provocada por un tumor maligno o es de naturaleza benigna?

3

¿C´
omo se puede obtener un indicador de necesidad de servicios sanitarios en
distintas unidades geogr´
aficas?

Francisco Garc´ıa Garc´ıa

An´
alisis Multivariante son Stata

Introducci´
on
Clustering
An´
alisis Discriminante
An´
alisis Factorial

An´
alisis Multivariante
An´
alisis Multivariante con Stata

¿Qu´
e tienen en com´
un las preguntas anteriores?

Estas cuestiones tienen en com´
un que sus respuestas se basan en el an´
alisis
conjunto de muchas variables.
El An´
alisis Multivariante presenta m´
etodos que analizan conjuntamente varias
variables, medidas sobre un grupo de individuos u objetos.
Los resultados del An´
alisis Multivariante proporcionar´
a una informaci´
on interesante para la toma de decisiones del investigador.

Francisco Garc´ıa Garc´ıa

An´
alisis Multivariante son Stata

Introducci´ on Clustering An´ alisis Discriminante An´ alisis Factorial An´ alisis Multivariante An´ alisis Multivariante con Stata Clasificaci´on de m´etodos multivariantes: Francisco Garc´ıa Garc´ıa An´ alisis Multivariante son Stata .

Introducci´ on Clustering An´ alisis Discriminante An´ alisis Factorial An´ alisis Multivariante An´ alisis Multivariante con Stata An´alisis Multivariante con Stata Francisco Garc´ıa Garc´ıa An´ alisis Multivariante son Stata .

Introducci´ on Clustering An´ alisis Discriminante An´ alisis Factorial An´ alisis Multivariante An´ alisis Multivariante con Stata Nos centraremos en los siguientes m´ etodos: 1 An´ alisis Cl´ uster. 2 An´ alisis Discriminante. 3 An´ alisis Factorial. Francisco Garc´ıa Garc´ıa An´ alisis Multivariante son Stata .

A diferencia del An´ alisis Discriminante se desconoce el n´ umero y la composici´ on de dichos grupos. El An´ alisis de Clustering busca la formaci´ on de grupos mientras que el An´ alisis Discriminante predice la pertenencia a grupos ya prefijados.. 2 Agrupar diferentes frutas y verduras por sus caracter´ısticas nutricionales (energ´ıa.) Francisco Garc´ıa Garc´ıa An´ alisis Multivariante son Stata . prote´ınas. Ejemplos: 1 Detecci´ on de subgrupos de pacientes con c´ ancer de mama en funci´ on de variables cl´ınicas y gen´ eticas.. gl´ ucidos.Introducci´ on Clustering An´ alisis Discriminante An´ alisis Factorial Objetivos Tipos de clustering Clustering con Stata Ejercicios An´ alisis Cl´ uster Su objetivo es formar grupos de objetos (individuos) homog´ eneos respecto a una variedad de atributos que pueden ser tanto cualitativos como cuantitativos. l´ıpidos. de forma que las observaciones pertenecientes a un grupo sean muy similares entre s´ı y muy disimilares del resto.

Introducci´ on Clustering An´ alisis Discriminante An´ alisis Factorial Objetivos Tipos de clustering Clustering con Stata Ejercicios Los tipos de clustering variar´ an en funci´ on de 3 criterios: 1 ¿Jer´ arquico o no jer´ arquico? 2 ¿Qu´ e m´ etodo utilizamos para medir la similitud de los grupos? 3 ¿Qu´ e medida de distancia usaremos? Francisco Garc´ıa Garc´ıa An´ alisis Multivariante son Stata .

Jer´arquico vs.Introducci´ on Clustering An´ alisis Discriminante An´ alisis Factorial Objetivos Tipos de clustering Clustering con Stata Ejercicios 1. no jer´arquico Francisco Garc´ıa Garc´ıa An´ alisis Multivariante son Stata .

Francisco Garc´ıa Garc´ıa An´ alisis Multivariante son Stata .Introducci´ on Clustering An´ alisis Discriminante An´ alisis Factorial Objetivos Tipos de clustering Clustering con Stata Ejercicios 2. M´etodo para medir la similitud entre grupos.

Introducci´ on Clustering An´ alisis Discriminante An´ alisis Factorial Objetivos Tipos de clustering Clustering con Stata Ejercicios 2. Francisco Garc´ıa Garc´ıa An´ alisis Multivariante son Stata . M´etodo para medir la similitud entre grupos.

Tipo de medida de distancia utilizada.Introducci´ on Clustering An´ alisis Discriminante An´ alisis Factorial Objetivos Tipos de clustering Clustering con Stata Ejercicios 3. Distancia eucl´ıdea Francisco Garc´ıa Garc´ıa An´ alisis Multivariante son Stata .

Francisco Garc´ıa Garc´ıa An´ alisis Multivariante son Stata . Tipo de medida de distancia utilizada.Introducci´ on Clustering An´ alisis Discriminante An´ alisis Factorial Objetivos Tipos de clustering Clustering con Stata Ejercicios 3.

Introducci´ on Clustering An´ alisis Discriminante An´ alisis Factorial Objetivos Tipos de clustering Clustering con Stata Ejercicios Stata tiene implementado diversos m´etodos de an´alisis de clustering: Francisco Garc´ıa Garc´ıa An´ alisis Multivariante son Stata .

Introducci´ on Clustering An´ alisis Discriminante An´ alisis Factorial Objetivos Tipos de clustering Clustering con Stata Ejercicios Clustering en Stata Tambi´ en en Stata. escogeremos el m´ etodo de clustering que se ajuste a las contestaciones de las preguntas que ya comentamos: 1 ¿Jer´ arquico o no jer´ arquico? 2 ¿Qu´ e m´ etodo utilizamos para medir la similitud de los grupos? 3 ¿Qu´ e medida de distancia usaremos? Francisco Garc´ıa Garc´ıa An´ alisis Multivariante son Stata .

Francisco Garc´ıa Garc´ıa An´ alisis Multivariante son Stata . seguiremos varios pasos: 1 Generamos el objeto cl´ uster.Introducci´ on Clustering An´ alisis Discriminante An´ alisis Factorial Objetivos Tipos de clustering Clustering con Stata Ejercicios Clustering en Stata Independientemente del m´ etodo elegido. 3 Extraemos informaci´ on de los grupos detectados. 2 Visualizamos el dendrograma o ´ arbol de cl´ uster (para algunos m´ etodos no est´ a implementado).

Francisco Garc´ıa Garc´ıa An´ alisis Multivariante son Stata . Generamos un objeto cl´uster.Introducci´ on Clustering An´ alisis Discriminante An´ alisis Factorial Objetivos Tipos de clustering Clustering con Stata Ejercicios 1.

Introducci´ on Clustering An´ alisis Discriminante An´ alisis Factorial Objetivos Tipos de clustering Clustering con Stata Ejercicios 2. Visualizamos el clustering mediante un dendrograma. Francisco Garc´ıa Garc´ıa An´ alisis Multivariante son Stata .

Introducci´ on Clustering An´ alisis Discriminante An´ alisis Factorial Objetivos Tipos de clustering Clustering con Stata Ejercicios 3. Extraemos informaci´on sobre los grupos detectados Francisco Garc´ıa Garc´ıa An´ alisis Multivariante son Stata .

Para este primer ejemplo contamos con una informaci´ on extra. El objetivo es determinar grupos parecidos de personas seg´ un las actividades dom´ esticas que realicen. Por supuesto. no ser´ a habitual que dispongamos de esta informaci´ on al comienzo del estudio! Francisco Garc´ıa Garc´ıa An´ alisis Multivariante son Stata . El investigador nos proporciona previamente a qu´ e grupo pertenece cada individuo. seg´ un sus criterios (est´ a recogido en la variable 61 del dataset).dta que describe la realizaci´ on de tareas dom´ esticas de un grupo de 30 personas. Esta referencia ser´ a interesante para evaluar como est´ a trabajando nuestro clustering. La matriz de datos tiene una dimensi´ on de 30 filas y 61 columnas.Introducci´ on Clustering An´ alisis Discriminante An´ alisis Factorial Objetivos Tipos de clustering Clustering con Stata Ejercicios Ejemplo de an´alisis de clustering con Stata: Empezamos trabajando con el dataset homework. Cada fila es una persona y cada variable representa si esa persona realiza o no cada una de las 60 tareas valoradas (variables binarias).

Francisco Garc´ıa Garc´ıa An´ alisis Multivariante son Stata .Introducci´ on Clustering An´ alisis Discriminante An´ alisis Factorial Objetivos Tipos de clustering Clustering con Stata Ejercicios Ejemplo de an´alisis de clustering con Stata: Leemos los datos desde Stata. Insertando en la ventana de comandos: use http://www. Recuperando el dataset del repositorio de datos de Stata: File / Example Datasets / Stata 12 Manual Datasets / Multivariate Statistics Reference Manual 3.com/data/r12/homework. siempre habr´ a que realizar un descriptivo que nos permita conocer nuestros datos: Statistics / Summaries.dta 2. Tenemos varias posibilidades: 1. Otra opci´ on es directamente desde File / Open y seleccionamos el fichero de datos en la carpeta donde lo tengamos almacenado. Graphics / Scatterplot matrix. tables and tests. En cualquier an´ alisis estad´ıstico que hagamos.stata-press.

hgt (id. ord.Introducci´ on Clustering An´ alisis Discriminante An´ alisis Factorial Objetivos Tipos de clustering Clustering con Stata Ejercicios Ejemplo de an´alisis de clustering con Stata: Paso 1. observaremos que tenemos 3 nuevas variables: id. orden y altura). Son variables que proporcionan info sobre la construcci´ on del clustering. Generamos el objeto cluster: Statistics / Multivariate Analysis / Cluster Analysis / Cluster Data Si vamos al editor. Francisco Garc´ıa Garc´ıa An´ alisis Multivariante son Stata .

Introducci´ on Clustering An´ alisis Discriminante An´ alisis Factorial Objetivos Tipos de clustering Clustering con Stata Ejercicios Ejemplo de an´alisis de clustering con Stata: Paso 2. Representamos el dendrograma o ´ arbol cl´ uster: Statistics / Multivariate Analysis / Cluster Analysis / Postclustering / Dendrograms Francisco Garc´ıa Garc´ıa An´ alisis Multivariante son Stata .

Introducci´ on Clustering An´ alisis Discriminante An´ alisis Factorial Objetivos Tipos de clustering Clustering con Stata Ejercicios Ejemplo de an´alisis de clustering con Stata: Paso 2. Representamos el dendrograma o ´ arbol cl´ uster: Statistics / Multivariate Analysis / Cluster Analysis / Postclustering / Dendrograms Francisco Garc´ıa Garc´ıa An´ alisis Multivariante son Stata .

Esta informaci´ on quedar´ a incorporada en una nueva variable que se crear´ a. Francisco Garc´ıa Garc´ıa An´ alisis Multivariante son Stata . podemos decidir el n´ umero de clusters con el que queremos trabajar. Extracci´ on de informaci´ on de los grupos generados: Statistics / Multivariate Analysis / Cluster Analysis / Postclustering / Summary variables from cluster analysis Tras la visualizaci´ on del dendrograma.Introducci´ on Clustering An´ alisis Discriminante An´ alisis Factorial Objetivos Tipos de clustering Clustering con Stata Ejercicios Ejemplo de an´alisis de clustering con Stata: Paso 3. Hemos escogido 3 y conoceremos que sujetos pertenecen a cada uno de ellos.

Extracci´ on de informaci´ on de los grupos generados: Statistics / Summaries. indicamos la variable que establece los grupos.Introducci´ on Clustering An´ alisis Discriminante An´ alisis Factorial Objetivos Tipos de clustering Clustering con Stata Ejercicios Ejemplo de an´alisis de clustering con Stata: Paso 3. tables and tests / Summary and descriptive statistics / Summary statistics En la pesta˜ na by if in . Francisco Garc´ıa Garc´ıa An´ alisis Multivariante son Stata .

tables and tests / Summary and descriptive statistics / Summary statistics Francisco Garc´ıa Garc´ıa An´ alisis Multivariante son Stata .Introducci´ on Clustering An´ alisis Discriminante An´ alisis Factorial Objetivos Tipos de clustering Clustering con Stata Ejercicios Ejemplo de an´alisis de clustering con Stata: Paso 3. Extracci´ on de informaci´ on de los grupos generados: Statistics / Summaries.

Extracci´ on de informaci´ on de los grupos generados: Statistics / Summaries.Introducci´ on Clustering An´ alisis Discriminante An´ alisis Factorial Objetivos Tipos de clustering Clustering con Stata Ejercicios Ejemplo de an´alisis de clustering con Stata: Paso 3. podemos evaluar como ha realizado nuestro clustering la agrupaci´ on de individuos: los resultados son coincidentes! Francisco Garc´ıa Garc´ıa An´ alisis Multivariante son Stata . tables and tests /Table / Table of summary statistics Como ten´ıamos la asignaci´ on “real” de sujetos a sus grupos iniciales.

Francisco Garc´ıa Garc´ıa An´ alisis Multivariante son Stata . Extracci´ on de informaci´ on de los grupos generados: Statistics / Multivariate Analysis / Cluster Analysis / Postclustering / Detailed listing of clusters Nos informa de las caracter´ısticas del clustering utilizado.Introducci´ on Clustering An´ alisis Discriminante An´ alisis Factorial Objetivos Tipos de clustering Clustering con Stata Ejercicios Ejemplo de an´alisis de clustering con Stata: Paso 3.

Francisco Garc´ıa Garc´ıa An´ alisis Multivariante son Stata .Introducci´ on Clustering An´ alisis Discriminante An´ alisis Factorial Objetivos Tipos de clustering Clustering con Stata Ejercicios Matrices de similitud/disimilitud El an´ alisis de clustering tambi´ en se puede realizar sobre una matriz de similitud / disimilitud.

Para cada sujeto se determinaron 4 cuantificaciones a lo largo del d´ıa y las 4 fueron efectuadas por el mismo t´ ecnico. Francisco Garc´ıa Garc´ıa An´ alisis Multivariante son Stata .dta disponible en File / Example Datasets / Stata 12 Manual Datasets / Multivariate Statistics Reference Manual Los datos representan un par´ ametro cl´ınico medido en 50 pacientes.Introducci´ on Clustering An´ alisis Discriminante An´ alisis Factorial Objetivos Tipos de clustering Clustering con Stata Ejercicios Ejercicio 1: clustering jer´arquico Trabajaremos con el dataset labtech. El objetivo del estudio es determinar si hay grupos homog´ eneos de pacientes considerando las medidas realizadas del par´ ametro cl´ınico. De modo que nuestra matriz dispone de 50 filas (pacientes) y 5 columnas (una para cada una de las 4 mediciones realizadas y una quinta columna con el nombre del t´ ecnico). Decidimos arbitrariamente elegir el clustering single-linkage con la distancia eucl´ıdea que aparece por defecto.

3 ¿Hay alguna agrupaci´ on clara en el ´ arbol del cluster? ¿Detectas algo extra˜ no en el dendrograma? ¿Alguna explicaci´ on?. 2 Realiza el an´ alisis de clustering de las muestras obteniendo el correspondiente dendrograma. Explora gr´ aficamente la relaci´ on entre las 4 mediciones mediante gr´ aficos de dispersi´ on. Pista: cuando hagas el dendrograma cambia la variable que se utiliza para dar nombre a las muestras y elige “labtech” que es el nombre de los t´ ecnicos de laboratorio. Francisco Garc´ıa Garc´ıa An´ alisis Multivariante son Stata . El an´ alisis de clustering tambi´ en constituye una buena herramienta de exploraci´ on de los datos.Introducci´ on Clustering An´ alisis Discriminante An´ alisis Factorial Objetivos Tipos de clustering Clustering con Stata Ejercicios Ejercicio 1: clustering jer´arquico Plan de trabajo: 1 Realiza una descripci´ on de los datos.

dta disponible en File / Example Datasets / Stata 12 Manual Datasets / Multivariate Statistics Reference Manual Los datos recogen la informaci´ on de velocidad. para optimizar la formaci´ on y asignaci´ on de recursos dirigidos a estos sujetos. fuerza y flexibilidad de 80 personas que participan en un programa de rehabilitaci´ on.Introducci´ on Clustering An´ alisis Discriminante An´ alisis Factorial Objetivos Tipos de clustering Clustering con Stata Ejercicios Ejercicio 2: clustering no jer´arquico Trabajaremos con el dataset physed. Francisco Garc´ıa Garc´ıa An´ alisis Multivariante son Stata . Tenemos como objetivo determinar 4 grupos homog´ eneos seg´ un los atributos f´ısicos medidos.

vamos a conocer mejor los grupos detectados. ¿Alg´ un problema? 4 Tras la realizaci´ on del an´ alisis de cl´ uster. 3 Realiza el an´ alisis de clustering no jer´ arquico de las muestras utilizando el m´ etodo kmeans. ¿Hay alg´ un tipo de relaci´ on entre las variables? ¿A partir de este descriptivo detectas la existencia de grupos de pacientes?. Intenta realizar el correspondiente dendrograma. Contesta la siguientes preguntas: Francisco Garc´ıa Garc´ıa An´ alisis Multivariante son Stata .Introducci´ on Clustering An´ alisis Discriminante An´ alisis Factorial Objetivos Tipos de clustering Clustering con Stata Ejercicios Ejercicio 2: clustering no jer´arquico Plan de trabajo: 1 Leemos los datos en Stata. Para empezar un resumen de estad´ısticos descriptivos y un gr´ afico de dispersi´ on de las 3 variables estar´ıa bien. 2 Realiza un an´ alisis descriptivo que nos permita conocer los datos con los que estamos trabajando.

mejor si indicamos que aparezca el n´ umero del grupo al que pertenece cada sujeto. m´ınimo y m´ aximo de los atributos evaluados para cada grupo y as´ı confirmaremos si realmente est´ an bien diferenciados.Introducci´ on Clustering An´ alisis Discriminante An´ alisis Factorial Objetivos Tipos de clustering Clustering con Stata Ejercicios Ejercicio 2: clustering no jer´arquico Plan de trabajo: ¿Cu´ antas personas est´ an incluidas en cada uno de los 4 grupos? Nos gustar´ıa conocer la media. representa de nuevo los datos utilizando los gr´ aficos de dispersi´ on pero esta vez en lugar de que aparezcan puntos. Comenta los resultados. as´ı visualizaremos la relaci´ on entre las variables incorporando esta informaci´ on. Por u ´ltimo. Francisco Garc´ıa Garc´ıa An´ alisis Multivariante son Stata .

Introducci´ on Clustering An´ alisis Discriminante An´ alisis Factorial Objetivos Tipos de clustering Clustering con Stata Ejercicios Ejercicio 2: clustering no jer´arquico Resultados: Francisco Garc´ıa Garc´ıa An´ alisis Multivariante son Stata .

Introducci´ on Clustering An´ alisis Discriminante An´ alisis Factorial Objetivos Tipos de clustering Clustering con Stata Ejercicios Ejercicio 2: clustering no jer´arquico Resultados: Francisco Garc´ıa Garc´ıa An´ alisis Multivariante son Stata .

Introducci´ on Clustering An´ alisis Discriminante An´ alisis Factorial Objetivos Tipos de clustering Clustering con Stata Ejercicios Ejercicio 2: clustering no jer´arquico Resultados: Francisco Garc´ıa Garc´ıa An´ alisis Multivariante son Stata .

Introducci´ on Clustering An´ alisis Discriminante An´ alisis Factorial Objetivos Tipos de clustering Clustering con Stata Ejercicios Ejercicio 2: clustering no jer´arquico Resultados: Francisco Garc´ıa Garc´ıa An´ alisis Multivariante son Stata .

etc. 2 En planificaci´ on y gesti´ on sanitaria tambi´ en se presentan problemas de discriminaci´ on. Ejemplos: 1 Determinar las variables cl´ınicas que permitan discriminar mejor entre pacientes de alto/no alto riesgo en una Unidad de Medicina Intensiva. Francisco Garc´ıa Garc´ıa An´ alisis Multivariante son Stata .Introducci´ on Clustering An´ alisis Discriminante An´ alisis Factorial Objetivos Tipos de An´ alisis Discriminante An´ alisis Discriminante con Stata Ejercicios An´ alisis Discriminante Esta t´ ecnica presenta reglas de clasificaci´ on o ´ptimas de nuevas observaciones de las que se desconoce su grupo de procedencia bas´ andose en la informaci´ on proporcionada los valores que en ella toman las variables independientes. la gravedad de los s´ıntomas. responsables de la elecci´ on de m´ edico? Las encuestas de salud proporcionan informaci´ on de base suficiente para contestar a estas preguntas con ayuda del An´ alisis Discriminante.. ¿C´ omo se explican las diferencias entre los usuarios de la sanidad p´ ublica y la privada?. ¿hasta qu´ e punto son el nivel de renta.

4 K th-Nearest-Neighbor Discriminant Analysis. 3 Logistic Discriminant Analysis.Introducci´ on Clustering An´ alisis Discriminante An´ alisis Factorial Objetivos Tipos de An´ alisis Discriminante An´ alisis Discriminante con Stata Ejercicios Tipos de An´ alisis Discriminante: 1 Linear Discriminant Analysis (LDA). 2 Quadratic Discriminant Analysis (QDA). Francisco Garc´ıa Garc´ıa An´ alisis Multivariante son Stata .

Introducci´ on Clustering An´ alisis Discriminante An´ alisis Factorial Objetivos Tipos de An´ alisis Discriminante An´ alisis Discriminante con Stata Ejercicios Tipos de An´ alisis Discriminante: Francisco Garc´ıa Garc´ıa An´ alisis Multivariante son Stata .

2 Estimaci´ on del modelo. 3 Evaluaci´ on del modelo y predicci´ on.Introducci´ on Clustering An´ alisis Discriminante An´ alisis Factorial Objetivos Tipos de An´ alisis Discriminante An´ alisis Discriminante con Stata Ejercicios ¿C´omo realizamos el An´alisis Discriminante en Stata? Varios pasos: 1 Descripci´ on de los datos. Francisco Garc´ıa Garc´ıa An´ alisis Multivariante son Stata .

Introducci´ on Clustering An´ alisis Discriminante An´ alisis Factorial Objetivos Tipos de An´ alisis Discriminante An´ alisis Discriminante con Stata Ejercicios ¿C´omo realizamos el An´alisis Discriminante en Stata? Francisco Garc´ıa Garc´ıa An´ alisis Multivariante son Stata .

Francisco Garc´ıa Garc´ıa An´ alisis Multivariante son Stata . La primera establece dos grupos y las variables x.Introducci´ on Clustering An´ alisis Discriminante An´ alisis Factorial Objetivos Tipos de An´ alisis Discriminante An´ alisis Discriminante con Stata Ejercicios Ejemplo de An´alisis Discriminante con Stata: Empezamos trabajando con el dataset twogroups.dta que incluye 30 observaciones y tres variables. y son las que discriminan la pertenencia a un determinado grupo.

Introducci´
on
Clustering
An´
alisis Discriminante
An´
alisis Factorial

Objetivos
Tipos de An´
alisis Discriminante
An´
alisis Discriminante con Stata
Ejercicios

Ejemplo de An´alisis Discriminante con Stata:
Paso 1. Descripci´
on de los datos: Graphs / Twoways graph: scatter

Francisco Garc´ıa Garc´ıa

An´
alisis Multivariante son Stata

Introducci´
on
Clustering
An´
alisis Discriminante
An´
alisis Factorial

Objetivos
Tipos de An´
alisis Discriminante
An´
alisis Discriminante con Stata
Ejercicios

Ejemplo de An´alisis Discriminante con Stata:
Paso 1. Descripci´
on de los datos: Graphs / Twoways graph: scatter

Francisco Garc´ıa Garc´ıa

An´
alisis Multivariante son Stata

Introducci´
on
Clustering
An´
alisis Discriminante
An´
alisis Factorial

Objetivos
Tipos de An´
alisis Discriminante
An´
alisis Discriminante con Stata
Ejercicios

Ejemplo de An´alisis Discriminante con Stata:
Paso 1. Descripci´
on de los datos: Graphs / Twoways graph: scatter

Francisco Garc´ıa Garc´ıa

An´
alisis Multivariante son Stata

Introducci´
on
Clustering
An´
alisis Discriminante
An´
alisis Factorial

Objetivos
Tipos de An´
alisis Discriminante
An´
alisis Discriminante con Stata
Ejercicios

Ejemplo de An´alisis Discriminante con Stata:
Paso 2. Estimaci´
on del modelo:
Statistics / Multivariate Analysis / Discriminant Analysis / DLA

Francisco Garc´ıa Garc´ıa

An´
alisis Multivariante son Stata

Introducci´ on Clustering An´ alisis Discriminante An´ alisis Factorial Objetivos Tipos de An´ alisis Discriminante An´ alisis Discriminante con Stata Ejercicios Ejemplo de An´alisis Discriminante con Stata: Paso 2. Estimaci´ on del modelo: Statistics / Multivariate Analysis / Discriminant Analysis / DLA Francisco Garc´ıa Garc´ıa An´ alisis Multivariante son Stata .

Estimaci´ on del modelo: Statistics / Multivariate Analysis / Discriminant Analysis / DLA Francisco Garc´ıa Garc´ıa An´ alisis Multivariante son Stata .Introducci´ on Clustering An´ alisis Discriminante An´ alisis Factorial Objetivos Tipos de An´ alisis Discriminante An´ alisis Discriminante con Stata Ejercicios Ejemplo de An´alisis Discriminante con Stata: Paso 2.

Estimaci´ on del modelo: Statistics / Multivariate Analysis / Discriminant Analysis / DLA Francisco Garc´ıa Garc´ıa An´ alisis Multivariante son Stata .Introducci´ on Clustering An´ alisis Discriminante An´ alisis Factorial Objetivos Tipos de An´ alisis Discriminante An´ alisis Discriminante con Stata Ejercicios Ejemplo de An´alisis Discriminante con Stata: Paso 2.

Francisco Garc´ıa Garc´ıa An´ alisis Multivariante son Stata .Introducci´ on Clustering An´ alisis Discriminante An´ alisis Factorial Objetivos Tipos de An´ alisis Discriminante An´ alisis Discriminante con Stata Ejercicios Ejemplo de An´alisis Discriminante con Stata: Paso 3. Evaluaci´ on y predicci´ on del modelo: Postestimation / Reports and statistics Descripci´ on de los datos por grupos.

Francisco Garc´ıa Garc´ıa An´ alisis Multivariante son Stata . Evaluaci´ on y predicci´ on del modelo: Postestimation / Reports and statistics Descripci´ on de los datos por grupos.Introducci´ on Clustering An´ alisis Discriminante An´ alisis Factorial Objetivos Tipos de An´ alisis Discriminante An´ alisis Discriminante con Stata Ejercicios Ejemplo de An´alisis Discriminante con Stata: Paso 3.

Introducci´ on Clustering An´ alisis Discriminante An´ alisis Factorial Objetivos Tipos de An´ alisis Discriminante An´ alisis Discriminante con Stata Ejercicios Ejemplo de An´alisis Discriminante con Stata: Paso 3. Evaluaci´ on y predicci´ on del modelo: Postestimation / Reports and statistics Descripci´ on de los datos por grupos. Francisco Garc´ıa Garc´ıa An´ alisis Multivariante son Stata .

Introducci´ on Clustering An´ alisis Discriminante An´ alisis Factorial Objetivos Tipos de An´ alisis Discriminante An´ alisis Discriminante con Stata Ejercicios Ejemplo de An´alisis Discriminante con Stata: Paso 3. Evaluaci´ on y predicci´ on del modelo: Postestimation / Reports and statistics Descripci´ on de los datos por grupos. Francisco Garc´ıa Garc´ıa An´ alisis Multivariante son Stata .

Evaluaci´ on y predicci´ on del modelo: Postestimation / Reports and statistics Evaluaci´ on del modelo: tasa de error por grupos. Francisco Garc´ıa Garc´ıa An´ alisis Multivariante son Stata .Introducci´ on Clustering An´ alisis Discriminante An´ alisis Factorial Objetivos Tipos de An´ alisis Discriminante An´ alisis Discriminante con Stata Ejercicios Ejemplo de An´alisis Discriminante con Stata: Paso 3.

Francisco Garc´ıa Garc´ıa An´ alisis Multivariante son Stata .Introducci´ on Clustering An´ alisis Discriminante An´ alisis Factorial Objetivos Tipos de An´ alisis Discriminante An´ alisis Discriminante con Stata Ejercicios Ejemplo de An´alisis Discriminante con Stata: Paso 3. Evaluaci´ on y predicci´ on del modelo: Postestimation / Reports and statistics Evaluaci´ on del modelo: tasa de error por grupos.

Francisco Garc´ıa Garc´ıa An´ alisis Multivariante son Stata .Introducci´ on Clustering An´ alisis Discriminante An´ alisis Factorial Objetivos Tipos de An´ alisis Discriminante An´ alisis Discriminante con Stata Ejercicios Ejemplo de An´alisis Discriminante con Stata: Paso 3. Evaluaci´ on y predicci´ on del modelo: Postestimation / Reports and statistics Evaluaci´ on del modelo: sujetos mal clasificados.

Francisco Garc´ıa Garc´ıa An´ alisis Multivariante son Stata .Introducci´ on Clustering An´ alisis Discriminante An´ alisis Factorial Objetivos Tipos de An´ alisis Discriminante An´ alisis Discriminante con Stata Ejercicios Ejemplo de An´alisis Discriminante con Stata: Paso 3. Evaluaci´ on y predicci´ on del modelo: Postestimation / Reports and statistics Evaluaci´ on del modelo: sujetos mal clasificados.

Evaluaci´ on y predicci´ on del modelo: Postestimation / Predictions and errors Predicci´ on para un nuevo caso o sujeto.Introducci´ on Clustering An´ alisis Discriminante An´ alisis Factorial Objetivos Tipos de An´ alisis Discriminante An´ alisis Discriminante con Stata Ejercicios Ejemplo de An´alisis Discriminante con Stata: Paso 3. Francisco Garc´ıa Garc´ıa An´ alisis Multivariante son Stata .

Introducci´ on Clustering An´ alisis Discriminante An´ alisis Factorial Objetivos Tipos de An´ alisis Discriminante An´ alisis Discriminante con Stata Ejercicios Ejercicio 1: An´alisis Discriminante Lineal (DLA) Trabajaremos con el dataset lawnmower2 disponible en File / Example Datasets / Stata 12 Manual Datasets / Multivariate Statistics Reference Manual Tenemos 24 individuos con informaci´ on correspondiente a tres variables: owner que establece los dos grupos que hay en el dataset (propietario y no propietario). income y lotsize son las dos variables que discriminan si un sujeto pertenece a un grupo u a otro. Francisco Garc´ıa Garc´ıa An´ alisis Multivariante son Stata .

Introducci´ on Clustering An´ alisis Discriminante An´ alisis Factorial Objetivos Tipos de An´ alisis Discriminante An´ alisis Discriminante con Stata Ejercicios Ejercicio 1: An´alisis Discriminante Lineal (DLA) Francisco Garc´ıa Garc´ıa An´ alisis Multivariante son Stata .

¿Crees que est´ an bien diferenciados los sujetos pertenecientes a cada grupo? 2 Realiza un an´ alisis de discriminante DLA y pide la tabla de clasificaci´ on Leaveone-out. . .Introducci´ on Clustering An´ alisis Discriminante An´ alisis Factorial Objetivos Tipos de An´ alisis Discriminante An´ alisis Discriminante con Stata Ejercicios Ejercicio 1: An´alisis Discriminante Lineal (DLA) Plan de trabajo: 1 Realiza una descripci´ on de los datos. 3 Vamos a acercarnos un poco m´ as a nuestros datos y al modelo que hemos generado: . Interpreta esta tabla.Por grupos: ¿cu´ al es el grupo que presenta una probabilidad de error m´ as alta? Francisco Garc´ıa Garc´ıa An´ alisis Multivariante son Stata .Desde el men´ u de Postestimation realiza un descriptivo por grupos para ver como se comportan las variables. Explora gr´ aficamente los datos mediante un diagrama de dispersi´ on. . Describe con detalle el funcionamiento de las matrices de confusi´ on: significado de los valores que est´ an en la diagonal. ¿es un buen clasificador el modelo que hemos escogido?.Por sujetos: lista aquellos sujetos mal clasificados y comenta los resultados que nos ofrece STATA. . en los extremos.

El An´ alisis Factorial supone que existe un factor com´ un subyacente a todas las variables. Por su parte el An´ alisis Factorial busca factores que expliquen la mayor parte de la varianza com´ un. El An´ alisis de Componentes Principales trata de hallar componentes (factores) que sucesivamente expliquen la mayor parte de la varianza total. An´ alisis de Componentes Principales: El An´ alisis Factorial y el An´ alisis de Componentes Principales est´ an muy relacionados. An´ alisis Factorial vs. Francisco Garc´ıa Garc´ıa An´ alisis Multivariante son Stata . Algunos autores consideran el segundo como una etapa del primero.Introducci´ on Clustering An´ alisis Discriminante An´ alisis Factorial Objetivos An´ alisis Factorial con Stata An´ alisis Factorial Se utiliza para analizar interrelaciones entre un n´ umero elevado de variables cuantitativas explicando dichas interrelaciones en t´ erminos de un n´ umero menor de variables que se denominan factores o componentes principales. el An´ alisis de Componentes Principales no hace tal asunci´ on.

Francisco Garc´ıa Garc´ıa An´ alisis Multivariante son Stata . 2 Determinaci´ on de indicadores que midan las necesidades en los servicios sociales de una ciudad a partir de datos de indicadores socioecon´ omicos y demogr´ aficos. An´ alisis de Componentes Principales.Introducci´ on Clustering An´ alisis Discriminante An´ alisis Factorial Objetivos An´ alisis Factorial con Stata Ejemplos: 1 Si un psic´ ologo quiere determinar los factores que caracterizan la inteligencia de un individuo a partir de sus respuestas a un test de inteligencia. utilizar´ıa para resolver este problema un An´ alisis Factorial.

Introducci´ on Clustering An´ alisis Discriminante An´ alisis Factorial Objetivos An´ alisis Factorial con Stata An´alisis Factorial con Stata Francisco Garc´ıa Garc´ıa An´ alisis Multivariante son Stata .

2 Elecci´ on y realizaci´ on del tipo de an´ alisis: Factorial / Componentes Principales. Francisco Garc´ıa Garc´ıa An´ alisis Multivariante son Stata .Introducci´ on Clustering An´ alisis Discriminante An´ alisis Factorial Objetivos An´ alisis Factorial con Stata An´alisis Factorial con Stata Varios pasos: 1 Descripci´ on de los datos. 3 Post-estimaci´ on: evaluaci´ on de resultados.

Introducci´ on Clustering An´ alisis Discriminante An´ alisis Factorial Objetivos An´ alisis Factorial con Stata Ejemplo de An´alisis de Componentes Principales con Stata: Disponemos del set de datos audiometric.dta que incluye mediciones audiom´ etricas de ni˜ nos de 9 a˜ nos. Francisco Garc´ıa Garc´ıa An´ alisis Multivariante son Stata . Se midieron 4 intensidades diferentes para el o´ıdo derecho y el izquierdo. As´ı por ejemplo la variable lft1000 hace reference al o´ıdo izquierdo en la frecuencia 1000 Hz.

and tests / Summary and descriptive statistics / Correlations and covariances La matriz de correlaciones de todas las variables nos proporciona una informaci´ on interesante sobre la relaci´ on existente entre ellas. Descripci´ on de los datos: correlaciones Statistics / Summaries. tables.Introducci´ on Clustering An´ alisis Discriminante An´ alisis Factorial Objetivos An´ alisis Factorial con Stata Ejemplo de An´alisis de Componentes Principales con Stata: Paso 1. Francisco Garc´ıa Garc´ıa An´ alisis Multivariante son Stata .

Francisco Garc´ıa Garc´ıa An´ alisis Multivariante son Stata .Introducci´ on Clustering An´ alisis Discriminante An´ alisis Factorial Objetivos An´ alisis Factorial con Stata Ejemplo de An´alisis de Componentes Principales con Stata: Paso 2. An´ alisis de Componentes Principales Statistics / Multivariate Analysis / Factor and Principal Component Analysis / PCA Seleccionamos las variables sobre las que realizaremos el an´ alisis factorial.

Introducci´ on Clustering An´ alisis Discriminante An´ alisis Factorial Objetivos An´ alisis Factorial con Stata Ejemplo de An´alisis de Componentes Principales con Stata: Paso 2. Francisco Garc´ıa Garc´ıa An´ alisis Multivariante son Stata . En este caso PCA (Principal Component Factor). An´ alisis de Componentes Principales Statistics / Multivariate Analysis / Factor and Principal Component Analysis / PCA Elegimos el m´ etodo de an´ alisis factorial.

An´ alisis de Componentes Principales Statistics / Multivariate Analysis / Factor and Principal Component Analysis / PCA Descripci´ on de las variables.Introducci´ on Clustering An´ alisis Discriminante An´ alisis Factorial Objetivos An´ alisis Factorial con Stata Ejemplo de An´alisis de Componentes Principales con Stata: Paso 2. Francisco Garc´ıa Garc´ıa An´ alisis Multivariante son Stata .

Introducci´ on Clustering An´ alisis Discriminante An´ alisis Factorial Objetivos An´ alisis Factorial con Stata Ejemplo de An´alisis de Componentes Principales con Stata: Paso 2. Francisco Garc´ıa Garc´ıa An´ alisis Multivariante son Stata . An´ alisis de Componentes Principales Statistics / Multivariate Analysis / Factor and Principal Component Analysis / PCA Lista de valores propios y la proporci´ on de variabilidad explicada.

Introducci´ on Clustering An´ alisis Discriminante An´ alisis Factorial Objetivos An´ alisis Factorial con Stata Ejemplo de An´alisis de Componentes Principales con Stata: Paso 2. Francisco Garc´ıa Garc´ıa An´ alisis Multivariante son Stata . An´ alisis de Componentes Principales Statistics / Multivariate Analysis / Factor and Principal Component Analysis / PCA Componentes principales para cada variable.

Gr´ afico de los valores propios. Francisco Garc´ıa Garc´ıa An´ alisis Multivariante son Stata .Introducci´ on Clustering An´ alisis Discriminante An´ alisis Factorial Objetivos An´ alisis Factorial con Stata Ejemplo de An´alisis de Componentes Principales con Stata: Post-estimaci´ on: evaluaci´ on de resultados. Statistics / Multivariate Analysis / Factor and Principal Component Analysis / Postestimation Screeplot.

Francisco Garc´ıa Garc´ıa An´ alisis Multivariante son Stata . Statistics / Multivariate Analysis / Factor and Principal Component Analysis / Postestimation Screeplot.Introducci´ on Clustering An´ alisis Discriminante An´ alisis Factorial Objetivos An´ alisis Factorial con Stata Ejemplo de An´alisis de Componentes Principales con Stata: Post-estimaci´ on: evaluaci´ on de resultados. Gr´ afico de los valores propios.

Statistics / Multivariate Analysis / Factor and Principal Component Analysis / Postestimation Representaci´ on gr´ afica de las variables mediante sus dos primeras componentes principales.Introducci´ on Clustering An´ alisis Discriminante An´ alisis Factorial Objetivos An´ alisis Factorial con Stata Ejemplo de An´alisis de Componentes Principales con Stata: Post-estimaci´ on: evaluaci´ on de resultados. Francisco Garc´ıa Garc´ıa An´ alisis Multivariante son Stata .

Introducci´ on Clustering An´ alisis Discriminante An´ alisis Factorial Objetivos An´ alisis Factorial con Stata Ejemplo de An´alisis de Componentes Principales con Stata: Post-estimaci´ on: evaluaci´ on de resultados. Statistics / Multivariate Analysis / Factor and Principal Component Analysis / Postestimation Representaci´ on gr´ afica de las variables mediante sus dos primeras componentes principales. Francisco Garc´ıa Garc´ıa An´ alisis Multivariante son Stata .

Statistics / Multivariate Analysis / Factor and Principal Component Analysis / Postestimation Representaci´ on de las observaciones mediante las puntuaciones en sus dos primeras componentes principales.Introducci´ on Clustering An´ alisis Discriminante An´ alisis Factorial Objetivos An´ alisis Factorial con Stata Ejemplo de An´alisis de Componentes Principales con Stata: Post-estimaci´ on: evaluaci´ on de resultados. Francisco Garc´ıa Garc´ıa An´ alisis Multivariante son Stata .

Introducci´ on Clustering An´ alisis Discriminante An´ alisis Factorial Objetivos An´ alisis Factorial con Stata Ejemplo de An´alisis de Componentes Principales con Stata: Post-estimaci´ on: evaluaci´ on de resultados. Francisco Garc´ıa Garc´ıa An´ alisis Multivariante son Stata . Statistics / Multivariate Analysis / Factor and Principal Component Analysis / Postestimation Representaci´ on de las observaciones mediante las puntuaciones en sus dos primeras componentes principales.

Editores SG. Francisco Garc´ıa Garc´ıa An´ alisis Multivariante son Stata . Aplicaci´ on al ´ ambito sanitario. Beatriz Gonz´ alez L´ opezValc´ arcel.Introducci´ on Clustering An´ alisis Discriminante An´ alisis Factorial Objetivos An´ alisis Factorial con Stata Referencias bibliogr´ aficas: An´ alisis Multivariante. Manual de Stata. versi´ on 12.

Introducci´ on Clustering An´ alisis Discriminante An´ alisis Factorial Francisco Garc´ıa Garc´ıa Objetivos An´ alisis Factorial con Stata An´ alisis Multivariante son Stata .