UNIVERSIDAD

AUTÓNOMA
DEL CARMEN
ESTADISTICA
MULTIVARIANTE

DR. NANCY PEREZ
MORGAN

ANALISIS DE COMPONENTES PRINCIPALES * TECNICAS DE EIGENVALORESEIGENVECTORES • MAR PONCE ANA BEATRIZ • ACOSTA ARELLANO ARELI PAULINA • CARRILLO CONCILION FERNANDO ARTURO .

ANÁLISIS DE COMPONENTES PRINCIPALES  Introducción  ¿Qué es?  ¿Cuál es el objetivo de ACP?  Conceptos Básicos  Metodología para encontrar los componentes  Resultado al que llega ACP  Limitantes  Conclusión .

.INTRODUCCIÓN Un problema central en el análisis de datos multivariantes es la reducción de la dimensionalidad: si es posible describir con precisión los valores de p variables por un pequeño subconjunto r < p de ellas. se habrá reducido la dimensión del problema a costa de una pequeña pérdida de información.

¿QUÉ ES? El análisis de componentes principales es una técnica estadística de síntesis de la información. . o reducción de la dimensión (número de variables).

¿CUÁL ES EL OBJETIVO? El análisis de componentes principales tiene este objetivo: dadas n observaciones de p variables. . se analiza si es posible representar adecuadamente esta información con un número menor de variables construidas como combinaciones lineales de las originales.

dan lugar a un múltiplo escalar de sí mismo.j) los correspondientes coeficientes de correlación rij .CONCEPTOS BÁSICOS Matriz de correlación • La matriz de correlación R es una matriz cuadrada constituida por los  coeficientes de correlación  de cada pareja de variables. y en los elementos no diagonales (i. diferente del vector cero. x tal que: • Ax=λx • Son los vectores o nulos que. de manera que tendrá unos en su diagonal principal. cuando son transformados por un operador lineal. un número real λ se dice que es un valor propio de A si existe un vector. Valor propio (EigenValor): Vector propio (EigenVector): • Sea A una matriz cuadrada. con lo que no cambian su dirección. Matriz de varianzacovarianza: • Es una matríz cuadrada que contiene las varianzas y covarianzas asociadas con diferentes variables. .

ENFOQUE S Enfoque Descriptivo Enfoque estadístico Enfoque geométrico .

cuyas varianzas vayan decreciendo progresivamente.METODOLOGÍA (CÁLCULO DE LOS COMPONENTES) Se considera una serie de variables sobre un grupo de objetos o individuos y se trata de calcular. Del mismo modo se eligen el resto de variables incorreladas entre sí. y1n esté incorrelada con y1. un nuevo conjunto de variables incorreladas entre sí. sujeta a la restricción de que a’1 a1=1 El segundo componente principal se calcula obteniendo a2 de modo que la variable obtenida. El primer componente se calcula eligiendo a a1 de modo que y1 tenga la mayor varianza posible. de manera que las variables aleatorias obtenidas vayan teniendo cada vez menor varianza . a partir de ellas.

Entonces Cuya solución es : .  de maximizaremos esta expresión de la forma habitual derivando Y respecto a los componentes de e igualando a cero.

Habitualmente.IDENTIFICACIÓN DE LOS COMPONENTES Uno de los objetivos del cálculo de componentes principales es la identificación de los mismos. se conservan sólo aquellos componentes que recogen la mayor parte de la variabilidad. .

Una técnica donde la muestra es la finalidad. . la cual intenta buscar la representación de una muestra de individuos de los que tenemos muchas variables de interés.¿A QUÉ RESULTADO LLEVA ACP? Es una técnica esencialmente descriptiva. La técnica consigue crear unos objetos matemáticos (las componentes) que nos podrían permitir establecer relaciones entre las variables.

LIMITANTES DE ACP La limitación mas critica de ambas técnicas es la interpretabilidad. La interpretación y selección de los factores. depende del significado de la combinación particular de variables observadas las cuales están altamente correlacionadas con cada factor No existe un criterio de las variables contra el cual comprobar o contrastar la solución Es sensible a la hora de graficar puede ser ligeramente diferente de rotación a rotación. .

CONCLUSIONES .