You are on page 1of 53

Instituto Nacional de Estadística e Informática

Escuela Nacional de Estadística e Informática

Especialización en Estadística Aplicada


ANÁLISIS MULTIVARIADO

Lic. Patricia Vásquez Sotero

Campus: https://webinei.inei.gob.pe/enei/campus/
Instituto Nacional de Estadística e Informática
Escuela Nacional de Estadística e Informática

Sesión 1

ANÁLISIS MULTIVARIADO

Algebra de matrices
Manejo de datos

Campus: https://webinei.inei.gob.pe/enei/campus/
Instituto Nacional de Estadística e Informática
Escuela Nacional de Estadística e Informática

ANÁLISIS MULTIVARIADO

Contenido

Generalidades

Análisis multivariado
• Definición y objetivos
• Clasificación
Algebra de matrices
• Vectores
• Matrices
• Valores y autovectores
Normal multivariada
Descripción de datos

3
Campus: https://webinei.inei.gob.pe/enei/campus/
Instituto Nacional de Estadística e Informática
Escuela Nacional de Estadística e Informática

GENERADLIDADES

Objetivos del curso

General

Proporcionar a los participantes los conceptos teóricos y prácticos de


las principales técnicas multivariantes, para el análisis simultáneo de
conjuntos de datos multivariantes.

Específicos

Analizar varias variables de forma simultánea.


Proporcionar una idea general de algunos métodos que podemos
utilizar para analizar este tipo de datos.
Resumir los datos mediante un pequeño conjunto de nuevas
variables con la mínima pérdida de información.

4
Campus: https://webinei.inei.gob.pe/enei/campus/
Instituto Nacional de Estadística e Informática
Escuela Nacional de Estadística e Informática

GENERADLIDADES

Evaluación

La participación en clase es un factor de evaluación constante.


La asistencia mínima aceptable es de 80% y se contabilizan faltas
justificadas e injustificadas.
Práctica calificada: consiste en la presentación de ejercicios de
aplicación de las técnicas multivariadas. Fecha: 06.04.2016.
Examen final: consiste en una prueba escrita. Fecha: 11.04.2016.
La nota mínima aprobatoria es 14, calculada como promedio de
prácticas, trabajos y examen final.
Es muy recomendable repasar los conceptos relacionados con el
álgebra lineal. En especial, todo lo relacionado con vectores y matrices.

5
Campus: https://webinei.inei.gob.pe/enei/campus/
Instituto Nacional de Estadística e Informática
Escuela Nacional de Estadística e Informática

GENERALIDADES

Bibliografía

Johnson, R.A. y Wichern, D.W. (1992). Applied Multivariate Statistical


Analysis. Editorial Prentice–Hall.
Lattin, J.M., Carroll, J.D. y Green, P.E. (2003). Analyzing multivariate
data. Thomson Brooks/Cole.
Peña, D. (2002). Análisis de datos multivariantes. McGraw Hill.
Uriel Jiménez, E. y Aidás Manzano. (2005). Análisis Multivariante
Aplicado. Editorial Paraninfo Cengage Learning.
López, C. Técnicas de análisis multivariantes de datos. Aplicaciones
con SPSS. Editorial Pearson-Prentice-Hall.

6
Campus: https://webinei.inei.gob.pe/enei/campus/
Instituto Nacional de Estadística e Informática
Escuela Nacional de Estadística e Informática

ANÁLISIS MULTIVARIADO

Introducción

Toda investigación científica se inicia en la explicación de un fenómeno de


WEFWEF
la realidad y dependiendo de la complejidad del fenómeno bajo estudio, el
investigador requiere recolectar información sobre un número grande de
características, las cuales pueden incluirse o retirarse del estudio.

La medición de dichas características del objeto bajo estudio, genera


una serie de datos que necesitan ser analizados simultáneamente.

Los métodos multivariados, han probado completamente su eficiencia


en el estudio de grandes masas de información, debido a que analizan
simultáneamente características múltiples de cada objeto sometido a
investigación, permitiendo una visión en conjunto de los problemas.

7
Campus: https://webinei.inei.gob.pe/enei/campus/
Instituto Nacional de Estadística e Informática
Escuela Nacional de Estadística e Informática

ANÁLISIS MULTIVARIADO

Definición

El análisis multivariado son los métodos estadísticos que analizan simultáneamente


medidas múltiples de objetos sometidos a investigación.
WEFWEF

Estudio Visión
Relaciones conjunta del
Simultáneo
fenómeno

La descripción de una realidad compleja donde existen muchas variables se


simplifica mediante la construcción de uno o varios índices o indicadores que la
resumen. Por ejemplo, el crecimiento de los precios en una economía se resume
en un índice de precios.

8
Campus: https://webinei.inei.gob.pe/enei/campus/
Instituto Nacional de Estadística e Informática
Escuela Nacional de Estadística e Informática

ANÁLISIS MULTIVARIADO

Objetivo

El análisis de datos multivariantes tienen por objeto el estudio


WEFWEF
estadístico de varias variables medidas en elementos de una población.
Pretende los siguientes objetivos.

1. Resumir el conjunto de variables en una pocas nuevas variables,


construidas como transformaciones de las originales, con la mínima
pérdida de información.
2. Encontrar grupos en los datos si existen.
3. Clasificar nuevas observaciones en grupos definidos.
4. Relacionar dos conjuntos de variables.

9
Campus: https://webinei.inei.gob.pe/enei/campus/
Instituto Nacional de Estadística e Informática
Escuela Nacional de Estadística e Informática

ANÁLISIS MULTIVARIADO

Aplicaciones

1. Administración de Empresas: Construir tipologías de clientes.


WEFWEF
2. Biometría: Identificar los factores que determinan la forma de un
organismo vivo.
3. Educación: Investigar la efectividad del aprendizaje a distancia.
4. Economía: Identificar las dimensiones del desarrollo económico.
5. Geología: Clasificar sedimentos.
6. Historia: Determinar la importancia relativa de los factores que
caracterizan los periodos pre-revolucionarios.
7. Ingeniería: Transmitir óptimamente señales por canales digitales.
8. Medicina: Identificar tumores mediante imágenes digitales.
9. Psicología: Determinar los factores que componen la inteligencia humana
10. Sociología y Ciencia Política: Construir tipologías de los votantes de un
partido.

10
Campus: https://webinei.inei.gob.pe/enei/campus/
Instituto Nacional de Estadística e Informática
Escuela Nacional de Estadística e Informática

ANÁLISIS MULTIVARIADO

Clasificación

 Para alcanzar los objetivos planteados, una herramienta importante


WEFWEF
es entender la estructura de dependencia entre las variables, ya que
las relaciones entre las variables son las que permiten resumirlas en
variables indicadoras, encontrar grupos no aparentes por las
variables individuales o clasificar en casos complejos.

 Un problema distinto es relacionar dos conjuntos de variables.

Por ejemplo, podemos disponer de un conjunto de variables de


capacidad intelectual y otros de resultados profesionales y
queremos relacionar ambos conjuntos de variables. En particular,
los dos grupos de variables pueden corresponder a las mismas
variables medidas en dos momentos distintos en el tiempo o en el
espacio y queremos ver la relación entre ambos conjuntos.

11
Campus: https://webinei.inei.gob.pe/enei/campus/
Instituto Nacional de Estadística e Informática
Escuela Nacional de Estadística e Informática

ANÁLISIS MULTIVARIADO

Clasificación

WEFWEF

12
Campus: https://webinei.inei.gob.pe/enei/campus/
Instituto Nacional de Estadística e Informática
Escuela Nacional de Estadística e Informática

ANÁLISIS MULTIVARIADO

Clasificación

- Regresión
Dependiente - Supervivencia
Métrica - MANOVA
- Correlación Canónica
Métodos de
Dependencia
- Discriminante
Dependiente
- Regresión Logística
No Métrica
- Análisis Conjoint

- A. Componentes Principales
- Análisis Factorial
Datos Métricos - Escalas Multidimensionales
Métodos de - Análisis Cluster
Interdependencia
- Análisis de Correspondencias
Datos - Modelos Log-Lineales
No Métricos - Escalas Multidimensionales
- Análisis Cluster
Métodos Estructurales

13
Campus: https://webinei.inei.gob.pe/enei/campus/
Instituto Nacional de Estadística e Informática
Escuela Nacional de Estadística e Informática

ANÁLISIS MULTIVARIADO

Clasificación

El análisis de datos multivariante puede plantearse a dos


niveles:

Queremos extraer la información que contienen los datos


disponibles ⇒ EXPLORACIÓN DE DATOS (o minería de
datos)

Buscamos obtener conclusiones sobre la población que ha


generado los datos lo que requiere construir un modelo
que explique su obtención y permita prever valores
futuros ⇒ INFERENCIA

14
Campus: https://webinei.inei.gob.pe/enei/campus/
Instituto Nacional de Estadística e Informática
Escuela Nacional de Estadística e Informática

ANÁLISIS MULTIVARIADO

Clasificación

15
Campus: https://webinei.inei.gob.pe/enei/campus/
Instituto Nacional de Estadística e Informática
Escuela Nacional de Estadística e Informática

ANÁLISIS MULTIVARIADO

Clasificación

Métodos de dependencia: El objetivo consiste en determinar si el conjunto de variables


independientes afecta al conjunto de variables dependientes y de qué forma. Se
pueden clasificar en dos grandes subgrupos según que la variable(s) dependiente(s)
sea (n) cuantitativas o cualitativas.

Variable dependiente métrica Algunas de las técnicas que se pueden aplicar son las
siguientes:

 Análisis de Regresión Es la técnica adecuada si en el análisis hay una o varias


variables dependientes métricas cuyo valor depende de una o varias variables
independientes métricas. Por ejemplo, intentar predecir el gasto anual en cine de
una persona a partir de su nivel de ingresos, nivel educativo, sexo y edad.

 Análisis de Supervivencia Es similar al análisis de regresión pero con la diferencia


de que la variable independiente es el tiempo de supervivencia de un individuo ú
objeto. Por ejemplo, intentar predecir el tiempo de permanencia en el desempleo
de un individuo a partir de su nivel de estudios y de su edad.

16
Campus: https://webinei.inei.gob.pe/enei/campus/
Instituto Nacional de Estadística e Informática
Escuela Nacional de Estadística e Informática

ANÁLISIS MULTIVARIADO

Clasificación

Variable dependiente métrica Algunas de las técnicas que se pueden aplicar son las
siguientes:

 Análisis de la varianza Se utilizan en situaciones en las que la muestra total está


dividida en varios grupos basados en una o varias variables independientes no
métricas y las variables dependientes analizadas son métricas. Su objetivo es
averiguar si hay diferencias significativas entre dichos grupos en cuanto a las
variables dependientes se refiere. Por ejemplo, ¿hay diferencias en el nivel de
colesterol por sexos? ¿afecta, también, el tipo de ocupación?.

 Correlación Canónica Su objetivo es relacionar simultáneamente varias variables


métricas dependientes e independientes calculando combinaciones lineales de
cada conjunto de variables que maximicen la correlación existente entre los dos
conjuntos de variables. Por ejemplo, analizar cómo están relacionadas el tiempo
dedicado al trabajo y al ocio de una persona con su nivel de ingresos, su edad y su
nivel de educación.

17
Campus: https://webinei.inei.gob.pe/enei/campus/
Instituto Nacional de Estadística e Informática
Escuela Nacional de Estadística e Informática

ANÁLISIS MULTIVARIADO

Clasificación

Variable dependiente no métrica Algunas de las técnicas que se pueden aplicar son
las siguientes:

 Análisis Discriminante. Esta técnica proporciona reglas de clasificación óptimas de


nuevas observaciones de las que se desconoce su grupo de procedencia basándose en
la información proporcionada los valores que en ella toman las variables independientes.
Por ejemplo, determinar los ratios financieros que mejor permiten discriminar entre
empresas rentables y poco rentables.

 Modelos de Regresión Logística. Son modelos de regresión en los que la variable


dependiente es no métrica. Se utilizan como una alternativa al análisis discriminante
cuando no hay normalidad.

 Modelos Conjoint. Analiza el efecto de variables independientes no métricas sobre


variables métricas o no métricas. La diferencia con el Análisis de la Varianza radica en
dos hechos: las variables dependientes pueden ser no métricas y los valores de las
variables independientes no métricas son fijadas por el analista. En otras disciplinas se
conoce con el nombre de Diseño de Experimentos.

18
Campus: https://webinei.inei.gob.pe/enei/campus/
Instituto Nacional de Estadística e Informática
Escuela Nacional de Estadística e Informática

ANÁLISIS MULTIVARIADO

Clasificación

Métodos de interdependencia: No distinguen entre variables dependientes e


independientes y su objetivo consiste en identificar qué variables están relacionadas,
cómo lo están y por qué. Se pueden clasificar en dos grandes grupos según que el
tipo de datos que analicen sean métricos o no métricos.

Si los datos son métricos se pueden utilizar, entre otras, las siguientes técnicas:

Análisis Factorial y Análisis de Componentes Principales. Se utiliza para analizar


interrelaciones entre un número elevado de variables métricas explicando dichas
interrelaciones en términos de un número menor de variables denominadas factores
(si son inobservables) o componentes principales (si son observables). Por ejemplo,
si un psicólogo quiere determinar los factores que caracterizan la inteligencia de un
individuo a partir de sus respuestas a un test de inteligencia, utilizaría para resolver
este problema un Análisis Factorial

19
Campus: https://webinei.inei.gob.pe/enei/campus/
Instituto Nacional de Estadística e Informática
Escuela Nacional de Estadística e Informática

ANÁLISIS MULTIVARIADO

Clasificación

Si los datos son métricos se pueden utilizar, entre otras, las siguientes técnicas:

Escalas Multidimensionales. Su objetivo es transformar juicios de semejanza o


preferencia en distancias representadas en un espacio multidimensional. Como
consecuencia se construye un mapa en el que se dibujan las posiciones de los
objetos comparados de forma que aquéllos percibidos como similares están
cercanos unos de otros y alejados de objetos percibidos como distintos. Por
ejemplo, analizar, en el mercado de refrescos, las percepciones que un grupo de
consumidores tiene acerca de una lista de refrescos y marcas con el fin de estudiar
qué factores subjetivos utiliza un consumidor a la hora de clasificar dichos
productos.

Análisis Cluster. Su objetivo es clasificar una muestra de entidades (individuos o


variables) en un número pequeño de grupos de forma que las observaciones
pertenecientes a un grupo sean muy similares entre sí y muy disimilares del resto. A
diferencia del Análisis Discriminante se desconoce el número y la composición de
dichos grupos. Por ejemplo, clasificar grupos de alimentos (pescados, carnes,
vegetales y leche) en función de sus valores nutritivos.
20
Campus: https://webinei.inei.gob.pe/enei/campus/
Instituto Nacional de Estadística e Informática
Escuela Nacional de Estadística e Informática

ANÁLISIS MULTIVARIADO

Clasificación

Si los datos son no métricos se pueden utilizar, además de las Escalas


Multidimensionales y el Análisis Cluster, las siguientes técnicas:

Análisis de Correspondencias. Se aplica a tablas de contingencia multidimensionales


y persigue un objetivo similar al de las escalas multidimensionales pero
representando simultáneamente las filas y columnas de las tablas de contingencia.
Por ejemplo, analizar el paro en Aragón teniendo en cuenta la provincia, sexo, edad
y nivel de estudios del parado.

Modelos Log-Lineales. Se aplican a tablas de contingencia multidimensionales y


modelizan relaciones de dependencia multidimensional de las variables observadas
que buscan explicar las frecuencias observadas.

21
Campus: https://webinei.inei.gob.pe/enei/campus/
Instituto Nacional de Estadística e Informática
Escuela Nacional de Estadística e Informática

ANÁLISIS MULTIVARIADO

Clasificación

Métodos Estructurales: El objetivo es analizar como las variables independientes


afectan a las variables dependientes y las relaciones de las variables de los dos
grupos entre sí. Analizan las relaciones existentes entre un grupo de variables
representadas por sistemas de ecuaciones simultáneas en las que se suponen que
algunas de ellas (denominadas constructos) se miden con error a partir de otras
variables observables denominadas indicadores.

Los modelos utilizados constan, por lo tanto, de dos partes: un modelo estructural
que especifica las relaciones de dependencia existente entre las constructos latentes y
un modelo de medida que especifica como los indicadores se relacionan con sus
correspondientes constructos.

Por ejemplo, analizar cómo se relacionan los niveles de utilización de los servicios de
una empresa con las percepciones que sus clientes tienen de ella.

22
Campus: https://webinei.inei.gob.pe/enei/campus/
Instituto Nacional de Estadística e Informática
Escuela Nacional de Estadística e Informática

ANÁLISIS MULTIVARIADO

Etapas en el análisis multivariado

DISEÑO DEL
ANÁLISIS

23
Campus: https://webinei.inei.gob.pe/enei/campus/
Instituto Nacional de Estadística e Informática
Escuela Nacional de Estadística e Informática

ANÁLISIS MULTIVARIADO

Etapas en el análisis multivariado

1. Definir el problema que se está investigando (modelo conceptual)


- Análisis conceptual de su objeto de estudio
- Identificar las relaciones fundamentales que se van a abordar
- Elección de la técnica a aplicar

2. Desarrollo del plan de análisis


Aplicar adecuadamente el método seleccionado,
- Seleccionar el tamaño muestral mínimo para el método seleccionado
- Las escalas de las variables a analizar son las correctas para el
método seleccionado

3. Condiciones de aplicabilidad del método seleccionado


Conocer los supuestos e hipótesis en las cuales se basa el método
seleccionado, algunos métodos requieren normalidad, linealidad,
homocedasticidad.

24
Campus: https://webinei.inei.gob.pe/enei/campus/
Instituto Nacional de Estadística e Informática
Escuela Nacional de Estadística e Informática

ANÁLISIS MULTIVARIADO

Etapas en el análisis multivariado

4. Desarrollo del método, estimación del modelo, ajuste global.


Aplique el método seleccionado, compruebe que el nivel de ajuste es el
adecuado, de no ser así se debe incorporar o eliminar variables.

5. Interpretación de los resultados


Luego de alcanzar el nivel de ajuste aceptado interprete el modelo, examine
coeficientes, cargas factoriales, correlaciones, varianza, efectos de variables
individuales, etc.
Interpretar el modelo global. Se puede volver a re-especificar el modelo.
- La interpretación retroalimenta al paso 4.

6. Validación del modelo.


Técnicas de diagnóstico que permitan generalizar los resultados a la
población. Repetición del modelo en muestras aleatorias del conjunto de
datos

25
Campus: https://webinei.inei.gob.pe/enei/campus/
Instituto Nacional de Estadística e Informática
Escuela Nacional de Estadística e Informática

ÁLGEBRA DE MATRICES

Introducción

La información de partida en el análisis multivariante es una tabla de datos


WEFWEF
correspondiente a distintas variables medidas en los elementos de un
conjunto. La manipulación de estos datos se simplifica mucho utilizando el
concepto de matriz y su propiedades. Cuando los sistemas de ecuaciones
lineales son extensos, mayormente se utiliza matrices por su facilidad de
manejo.

Las matrices son ordenamientos de datos y se usan no solo en la resolución


de sistemas de ecuaciones (lineales), sino además en el cálculo numérico, en
la resolución de sistemas de ecuaciones diferenciales y de derivadas parciales.
Además las matrices también aparecen de forma natural en geometría,
estadística, economía, informática, física, etc.

26
Campus: https://webinei.inei.gob.pe/enei/campus/
Instituto Nacional de Estadística e Informática
Escuela Nacional de Estadística e Informática

ÁLGEBRA DE MATRICES

Definiciones

Definiremos el vector x como el segmento orientado que une el origen de


coordenadas con el punto x. La dirección es importante, porque no es lo mismo el
WEFWEF
vector x que el −x. Con esta correspondencia, a cada punto del espacio en Rn le
asociamos un vector.

En la figura, se representa dos vectores en


el plano (Rn): el vector y el vector
. La suma z (o diferencia) de dos
vectores x, y, ambos en Rn, se define como
un nuevo vector con componentes iguales
a la suma (diferencia ) de los componentes
de los sumandos.

Se llamará norma o longitud de un vector x, a la raíz cuadrada del producto escalar


x’x. Se escribe,

27
Campus: https://webinei.inei.gob.pe/enei/campus/
Instituto Nacional de Estadística e Informática
Escuela Nacional de Estadística e Informática

ÁLGEBRA DE MATRICES

Definiciones

Se llama matriz de orden m×n a todo conjunto rectangular de elementos aij


dispuestos en m líneas horizontales (filas) y n verticales (columnas) de la forma:
WEFWEF

Filas de la matriz A

Columnas de la matriz A

Abreviadamente suele expresarse en la forma A = [aij], con i=1, 2,..., m; j=1, 2, ..., n.
Los subíndices indican la posición del elemento dentro de la matriz, el primero
denota la fila (i) y el segundo la columna (j). Por ejemplo el elemento a23 será el
elemento de la fila 2 y columna 3.

28
Campus: https://webinei.inei.gob.pe/enei/campus/
Instituto Nacional de Estadística e Informática
Escuela Nacional de Estadística e Informática

ÁLGEBRA DE MATRICES

Tipos de matrices

Describiremos algunos tipos de matrices que aparecen con frecuencia debido a su


utilidad, y de los que es conveniente recordar su nombre.
WEFWEF
1. Según la forma

Matriz columna: Es una matriz que solo tiene una columna, es decir, n=1 y por
tanto es de orden m x 1. Ejemplo,

Matriz fila: Es una matriz que solo tiene una fila, es decir m=1 y por tanto es de
orden 1x n. Es decir, A=(a11 a12 ... a1n). Ejemplo:

29
Campus: https://webinei.inei.gob.pe/enei/campus/
Instituto Nacional de Estadística e Informática
Escuela Nacional de Estadística e Informática

ÁLGEBRA DE MATRICES

Tipos de matrices

Matriz cuadrada: Es aquella que tiene el mismo número de filas que de


columnas, es decir m = n. En estos casos se dice que la matriz cuadrada es de
WEFWEF
orden n, y no n x n (aunque es lo mismo).

Los elementos aij con i = j, o sea aij forman la llamada diagonal principal de la
matriz cuadrada, y los elementos aij con i + j = n +1 la diagonal secundaria.

En la matriz

La diagonal principal está formada por [ 1 1 9 ] y la diagonal secundaria


por [ 0 1 3 ]

30
Campus: https://webinei.inei.gob.pe/enei/campus/
Instituto Nacional de Estadística e Informática
Escuela Nacional de Estadística e Informática

ÁLGEBRA DE MATRICES

Tipos de matrices

Matriz transpuesta: Dada una matriz A, su matriz se representa por At, la cual se
obtiene cambiando filas por columnas. La primera fila de A es la primera
WEFWEF
columna de At, la segunda fila de A es la segunda columna de At y así
sucesivamente. De la definición se deduce que si A es de orden m x n, entonces
At es de orden n x m. Ejemplo,

entonces

Matriz simétrica: Una matriz cuadrada A es simétrica si A = At, es decir, si aj= aj.
Ejemplo,

(Comprobar que A = At )

31
Campus: https://webinei.inei.gob.pe/enei/campus/
Instituto Nacional de Estadística e Informática
Escuela Nacional de Estadística e Informática

ÁLGEBRA DE MATRICES

Tipos de matrices

Matriz antisimétrica: Una matriz cuadrada A es simétrica si A = -At, es decir, si


aj= -aj. Ejemplo,
WEFWEF

(Comprobar que A = At )

2. Según los elementos

Matriz nula: es aquella que todos sus elementos son 0 y se representa por 0.
Ejemplo,

32
Campus: https://webinei.inei.gob.pe/enei/campus/
Instituto Nacional de Estadística e Informática
Escuela Nacional de Estadística e Informática

ÁLGEBRA DE MATRICES

Tipos de matrices

Matriz diagonal: Es una matriz cuadrada, en la que todos los elementos no


pertenecientes a la diagonal principal son nulos. Ejemplo,
WEFWEF

Matriz escalar: Es una matriz diagonal (y en consecuencia, una matriz cuadrada)


con todos los elementos de la diagonal iguales. Ejemplo,

33
Campus: https://webinei.inei.gob.pe/enei/campus/
Instituto Nacional de Estadística e Informática
Escuela Nacional de Estadística e Informática

ÁLGEBRA DE MATRICES

Tipos de matrices

Matriz identidad o unidad: Es una matriz escalar con los elementos de la diagonal principal
iguales a 1. Se denota por el símbolo I o In. Ejemplo,
WEFWEF

Matriz triangular: Es una matriz cuadrada que tiene nulos todos los elementos que están a
un mismo lado de la diagonal principal. Pueden ser de dos tipos: (i) Triangular Superior: Si
los elementos que están por debajo de la diagonal principal son todos nulos; aj=0, i<j. (ii)
Triangular Inferior: Si los elementos que están por encima de la diagonal principal son todos
nulos; aj=0, j < i. Ejemplos,

34
Campus: https://webinei.inei.gob.pe/enei/campus/
Instituto Nacional de Estadística e Informática
Escuela Nacional de Estadística e Informática

ÁLGEBRA DE MATRICES

Operaciones y propiedades de matrices

1. Inversa de una matriz Dada una matriz cuadrada A se dice que B es la inversa
de A si AB = I = BA. Nota: No toda matriz cuadrada tiene inversa. Solo admiten
WEFWEF
inversa las matrices cuadradas con determinante distinto de cero.

2. Determinante de una matriz cuadrada Un determinante es un número real o


escalar asociado a una matriz y su cálculo depende del orden de la matriz
cuadrada en análisis.

35
Campus: https://webinei.inei.gob.pe/enei/campus/
Instituto Nacional de Estadística e Informática
Escuela Nacional de Estadística e Informática

ÁLGEBRA DE MATRICES

Operaciones y propiedades de matrices

WEFWEF

36
Campus: https://webinei.inei.gob.pe/enei/campus/
Instituto Nacional de Estadística e Informática
Escuela Nacional de Estadística e Informática

ÁLGEBRA DE MATRICES

Valores y vectores propios

Sea A una matriz cuadrada, un número real se dice que es un valor propio (o un
eigenvalor o un valor característico) de A si existe un vector v, diferente del vector cero,
WEFWEF
tal que: Av = λv

Es decir, si v es un vector que al transformarlo mediante la multiplicación por A el vector


resultante mantiene su dirección, posiblemente sólo su longitud y/o sentido se
modifique. El vector v se llama vector propio (o eigenvector) asociado al valor propio λ.

Ejemplo: Sea la matriz A, ¿v es un vector propio de A?

v es vector propio de A asociado al valor propio -1.

37
Campus: https://webinei.inei.gob.pe/enei/campus/
Instituto Nacional de Estadística e Informática
Escuela Nacional de Estadística e Informática

ÁLGEBRA DE MATRICES

Operaciones con matrices en SPSS

Comentario general
WEFWEF
En SPSS todos los comandos de operaciones con matrices deben ser colocados
entre los comandos "MATRIX" y "END MATRIX".

Creando matrices en SPSS

Para escribir una matriz, encerrar los elementos de la matriz entre llaves { }
Los elementos de una fila están separadas por comas. (El número de columnas
está implícito en el número de elementos en cada fila.)
Cada una filas deben estar separadas por punto y coma.
Por ejemplo, A={2,4,3,7;1,5,3,1} es una matriz rectangular de dimensión 2x4 que
se muestra como:

2 4 3 7
1 5 3 1

38
Campus: https://webinei.inei.gob.pe/enei/campus/
Instituto Nacional de Estadística e Informática
Escuela Nacional de Estadística e Informática

ÁLGEBRA DE MATRICES

Operaciones con matrices en SPSS

Las matrices se pueden definir de forma explícita como el anterior o leer en el


WEFWEF
procesador con el comando READ o GET.

Por ejemplo, si la matriz anterior se ha creado usando un procesador de textos y


se guarda como un archivo ASCII o TXT con el nombre "MATRIX.TXT“ y se
puede leer directamente en SPSS (elegir Archivo de tipo: Texto)

Para visualizar los resultados definidos en una matriz A utilizar el siguiente


comando: PRINT A.

39
Campus: https://webinei.inei.gob.pe/enei/campus/
Instituto Nacional de Estadística e Informática
Escuela Nacional de Estadística e Informática

ÁLGEBRA DE MATRICES

Operaciones con matrices en SPSS

Comando para el manejo de matrices en SPSS


WEFWEF
Comando Significado

COMPUTE C = {A,B}. Concatena (junta) A y B verticalmente. A y B son matrices o


vectores (A y B deben tener el mismo número de filas).

COMPUTE C = {A;B}. Concatena (junta) A y B horizontalmente. A y B son matrices o


vectores (A y B deben tener el mismo número de columnas).

COMPUTE A = MAKE (#1, #2, #3). Crea matriz rectangular de #1 (fila) por #2 (columna) con valor #3
(escalar) en todos los elementos.
COMPUTE I = IDENT (#1). Crea una matriz identidad con #1 fila/columna.

COMPUTE A = MDIAG (#1). Crea una matriz cuadrada con valores de un vector V como
diagonal principal, en otro lugar
COMPUTE NR = NROW (A). Encuentra el número de filas de la matriz A.

COMPUTE NC = NCOL (A). Encuentra el número de columnas de la matriz A.

40
Campus: https://webinei.inei.gob.pe/enei/campus/
Instituto Nacional de Estadística e Informática
Escuela Nacional de Estadística e Informática

ÁLGEBRA DE MATRICES

Operaciones con matrices en SPSS

Comando para el manejo de matrices en SPSS


WEFWEF

Comando Significado

COMPUTE C = A + B. Suma las matrices A y B.

COMPUTE C = A * B. Multiplica las matrices A y B.

COMPUTE AT = T (A). Encuentra la transpuesta de la matriz A.

COMPUTE INVA = INV (A). Calcula la inversa de la matriz A.

COMPUTE DETA = DET (A). Calcula el determinante de la matriz A.

COMPUTE EIGA = EVAL (A). Calcular los valores propios de A y los coloca en un vector
columna.
COMPUTE RANKA = RANK (A). Encuentra el rango de la matriz A.

41
Campus: https://webinei.inei.gob.pe/enei/campus/
Instituto Nacional de Estadística e Informática
Escuela Nacional de Estadística e Informática

NORMAL MULTIVARIADA

Distribución normal univariada

  E( X )
X ~ N ( ,  2 ), donde
 2  V (X )

1 ( x )2
1 
con función de densidad: f ( x)  e 2 2

 2
x

2 0

42
Campus: https://webinei.inei.gob.pe/enei/campus/
Instituto Nacional de Estadística e Informática
Escuela Nacional de Estadística e Informática

NORMAL MULTIVARIADA

Distribución normal multivariada Np

 1 
 
X ~ N p ( , ), donde     ;  definida positiva, Σ = Cov(X)
 
 p

El vector aleatorio X= (X1, ..., Xp) tiene distribución Np(µ, Σ) si su densidad es de la


forma:

1  1 
f ( x)  exp  ( X   )'  1
( X   ) 
(2 )   
p/2 1/ 2
2
x p

43
Campus: https://webinei.inei.gob.pe/enei/campus/
Instituto Nacional de Estadística e Informática
Escuela Nacional de Estadística e Informática

NORMAL MULTIVARIADA

Distribución normal multivariada Np

Ejemplo: p = 2 (variables)

 1    11  12   12
   ;   
  ; 12 
 2    12  22   11 22

Desarrollar f ( x1 , x2 )

 1    11  12 
X ~ N 2 ( , ), donde    ;    ,
 2    12  22 
función de densidad:

44
Campus: https://webinei.inei.gob.pe/enei/campus/
Instituto Nacional de Estadística e Informática
Escuela Nacional de Estadística e Informática

NORMAL MULTIVARIADA

Distribución normal multivariada Np

Ejemplo: p = 2 (variables)

Representación gráfica

45
Campus: https://webinei.inei.gob.pe/enei/campus/
Instituto Nacional de Estadística e Informática
Escuela Nacional de Estadística e Informática

NORMAL MULTIVARIADA

Distribución normal multivariada Np

Ejemplo: p = 2 (variables)

Representación gráfica

f ( x1 , x2 )  c 2  ( x   )' 1 ( x   )  c 2
 1,  2 autovalores de 
e1 , e2 autovectores de 

46
Campus: https://webinei.inei.gob.pe/enei/campus/
Instituto Nacional de Estadística e Informática
Escuela Nacional de Estadística e Informática

NORMAL MULTIVARIADA

Distribución normal multivariada Np

Generalizando,
El vector aleatorio X = (X1, ..., Xp) tiene distribución Np si ⩝a∊Rp, at X ~ N1 (es decir, si
toda combinación lineal de sus componentes es normal univariante)

 a1 
 
(i ) X ~ N p (  , ) ; a    . Entonces :
Propiedad
es a 
 p

a' X ~ N1 (a'  , a'  a)


a   p , a' X normal  X normal p - variante

47
Campus: https://webinei.inei.gob.pe/enei/campus/
Instituto Nacional de Estadística e Informática
Escuela Nacional de Estadística e Informática

DESCRIPCIÓN DE DATOS

Tipos de datos

El análisis descriptivo debe ser siempre un primer paso para comprender la estructura
de los datos.

48
Campus: https://webinei.inei.gob.pe/enei/campus/
Instituto Nacional de Estadística e Informática
Escuela Nacional de Estadística e Informática

MANEJO DE DATOS

Tipos de datos

Escalas de medida

49
Campus: https://webinei.inei.gob.pe/enei/campus/
Instituto Nacional de Estadística e Informática
Escuela Nacional de Estadística e Informática

MANEJO DE DATOS

Matriz de datos

Supongamos que se ha observado p variables cuantitativas en un conjunto de n


objetos o individuos. Los datos se expresarán mediante una matriz X de
dimensiones nxp, llamada matriz de datos, de elementos xij, con i=1,...,n que
representan el individuo y j=1,...,p que representan las variables.

La matriz de datos, X, puede representarse de dos formas distintas. Por filas, como:

donde cada variable x’i es un vector fila, p×1, que representa los valores de las
p variables sobre el individuo i.

50
Campus: https://webinei.inei.gob.pe/enei/campus/
Instituto Nacional de Estadística e Informática
Escuela Nacional de Estadística e Informática

MANEJO DE DATOS

Matriz de datos

Alternativamente, podemos representar la matriz X por columnas:

donde ahora cada variable x(j) es un vector columna, n×1, que representa la
variable escalar xj medida en los n elementos de la población.

Llamaremos x = (x1, ..., xp)’ a la variable multivariante formada por las p variables
escalares que toma los valores particulares x1, ..., xn, en los n elementos
observados.

51
Campus: https://webinei.inei.gob.pe/enei/campus/
Instituto Nacional de Estadística e Informática
Escuela Nacional de Estadística e Informática

MANEJO DE DATOS

Datos atípicos

Son aquellos que parecen observados de forma distinta al resto (por


errores de medida, cambio de instrumentos o heterogeneidad de los
elementos.

Es frecuente entre 1-3% en experimentos controlados y alrededor


de un 5% en experimentos incontrolados

Las consecuencias de un dato atípico pueden ser graves:

distorsionan medias y desviaciones típicas


enmascaran las relaciones existentes entre ellas

52
Campus: https://webinei.inei.gob.pe/enei/campus/
Instituto Nacional de Estadística e Informática
Escuela Nacional de Estadística e Informática

Correo de la Dirección Técnica de la ENEI


Sr. Eduardo Villa Morocho (eduardo.villa@inei.gob.pe)

Coordinación Académica
Sr. Alejandro Vílchez de los Ríos(alejandro.vilchez@inei.gob.pe)

Correo de la Escuela del INEI


enei@inei.gob.pe

Área de Educación Virtual


Sr. Gonzalo Anchante (gonzalo.anchante@inei.gob.pe)

Campus: https://webinei.inei.gob.pe/enei/campus/

You might also like