Professional Documents
Culture Documents
Anlisis de Correspondencias.
Anlisis de correspondencias intrabloques ponderado. Mayerli Valero Jeisson Prez
DEPARTAMENTO DE ESTADSTICA. FACULTAD DE CIENCIAS. UNIVERSIDAD NACIONAL DE COLOMBIA.
Noviembre 23 de 2010 1
Tabla de Contenido
Anlisis de Correspondencias. Mayerli Valero Jeisson Prez Introduccin Anlisis de correspondencias intrabloques
Modelo de independencia El ACIB como ACP ponderado Propiedades del ACIB
Modelo de independencia El ACIB como ACP ponderado Propiedades del ACIB 3 Anlisis de correspondencias intrabloques ponderado Estructura biparticionada: Modelo general Estructura de particin sobre una dimensin Estructura biparticionada: Modelo general Calculo iterativo de reponderaciones la y columna Estructura biparticionada: Modelo de independencia intrabloques Propiedades del ACIBP 4 Ejemplo de aplicacin Planteamiento y datos
Particin de las ramas (columnas):
Objetivos Metodologa
Introduccin
Anlisis de Correspondencias. Mayerli Valero Jeisson Prez Introduccin Anlisis de correspondencias intrabloques
Modelo de independencia El ACIB como ACP ponderado Propiedades del ACIB
Los modelos descriptivos, que utilizan Tablas de Contingencia como herramienta principal, se han desarrollado en base a los problemas que las mismas tablas proponen. Uno de estos es la estructura de doble particin. Un pionero en este campo, fue cazes-88 quien introdujo este modelo, en el Anlisis de Correspondencias Interno (ACI), el cual introduce la particin para las y columnas en un ejemplo Ardeche, pero no tiene en cuenta las interacciones que pueda generar la particin, brindando algunas luces sobre el particular.
Introduccin
Anlisis de Correspondencias. Mayerli Valero Jeisson Prez Introduccin Anlisis de correspondencias intrabloques
Modelo de independencia El ACIB como ACP ponderado Propiedades del ACIB
En la primera parte de este trabajo, se explican algunas generalidades para abordar el tema de manera ecaz, como notacin bsica, planteamiento de la estructura del modelo general, propiedades, entre otras. En la segunda parte se hace una breve exposicin del mtodo principal de este trabajo y nalmente se muestra una aplicacin del mtodo mostrando la particin del PIB en sectores de la economa y ramas de atividad econmica (columnas), y regiones y departamentos (las), para los aos 2003, 2005 y 2007 en Colombia.
Generalidades
ACIB
Anlisis de Correspondencias. Mayerli Valero Jeisson Prez Introduccin Anlisis de correspondencias intrabloques
Modelo de independencia El ACIB como ACP ponderado Propiedades del ACIB
Partiendo de la tabla de contingencias, con I las y K columnas, el ACIB muestra una doble particin que genera que la TC quede dividida en L J bloques, donde L corresponde al nmero de particiones de las las y J el de las columnas. Con lo anterior, se construye una tabla F de frecuencias relativas, que es la base para el desarrollo del mtodo. El bloque (l, j) tiene Il las y Kj columnas. Las marginales la j l y columna de la tabla F sern fi y fk respectivamente. Las marginales la y columna de un bloque Flj son:
lj fi = kKj lj y su frecuencia total es: f = lj fik
lj fk = iIl lj fik .
lj fik
iIl
kKj
Tabla F
Particin en las y columnas
Anlisis de Correspondencias. Mayerli Valero Jeisson Prez Introduccin Anlisis de correspondencias intrabloques
Modelo de independencia El ACIB como ACP ponderado Propiedades del ACIB
Modelo de independencia
Anlisis de Correspondencias. Mayerli Valero Jeisson Prez Introduccin Anlisis de correspondencias intrabloques
Modelo de independencia El ACIB como ACP ponderado Propiedades del ACIB
En el modelo de independencia intrabloques notado con la matriz B, no se contemplan las interacciones que las variables e individuos que se encuentren en el interior del mismo bloque. Como se aprecia en la gura 1, el esquema del bloque Flj tiene B modelo de independencia con termino general: blj = ik
lj lj fi fk lj f
En General, tendremos que para un bloque Blj las marginales la y columna sern iguales a las marginales la y columna del lj lj bloque Flj . Es decir que blj = fi y blj = fk . De manera similar i k se cumple para la tabla B. 7
El anlisis de correspondencias intrabloques de F, (ACIB(F)) puede ser visto como un ACP(X,M,D), donde M y D son las mismas mtricas de un ACS de la tabla F.
j M = diag(fk ) l D = diag(fi )
lj lj lj lj fik f fi fk j l lj fk fi f
La nube Nk con k puntos, se encuentra cetrada puesto que se tiene que las marginales de la tabla B y F son iguales. Luego cada una de las subnubes NKj , Kj puntos asociados a los pesos 1
j f kKj
j f j fk
.
lj lj lj lj fik f fi fk j l lj fk fi f
j fk
1
j f kKj
lj lj fik f l lj fi f
lj lj fi fk l lj fi f
1
j f
lj fi f lj i l l fi fi
=0 9
10
Las formulas de transicin las cuales nos permiten la representacion simultanea son: 1 Fs (l, i) = s 1 Gs (j, k) = s
lj lj lj lj fik f fi fk j,k l lj fi f lj lj lj lj fik f fi fk l,i j lj fk f
Gs (j, k) Fs (l, i)
11
Una columna de ceros: si los valores de una columna (j, k) correspondientes a una banda la l de la tabla de contingencia son todos cero, el punto parcial asociado est lj en el origen. Luego, se tiene que fik = 0; i Il de donde lj fk , entonces el termino general de X. Una la de ceros: en este caso el punto parcial est tambien en el origen. Bloque de ceros: Cuando tiene ceros en todas sus celdas, lleva a valores indeterminados, pues el denominador es cero, pero redene a cero el modelo.
12
El proposito fundamental de este mtodo es generalizar el AFMTC de [?] considerando la doble estructura de particin y haciendo casi equivalentes las inuencias de las bandas las y columnas. En el AFMTC se trabaja en un anlisis de correspondecias intra tablas, en el cual las ponderaciones de las y de columnas son como en un AFM. cepardot propone una generalizacin de la ponderacin, la cual busca equilibrar la inuencia simultaneamnente de las bandas columnas y las. Las siglas ACIBP denotar el AC, en el cual se utilizarn las nuevas ponderaciones simultneas sobre un ACIB.
13
En el caso de un AFMTC solo se considera un particin sobre la tabla F.Por ejemplo si se considera un analisis entre las bandas columnas, el AFMTC para este caso estandariza la inercia de la banda j en 1 como en el AFM. El peso de la k-sima columna del j grupo j es la marginal fk dividida por j , el cual corresponde 1 al primer valor propio del anlisis de correspondencia ponderado sobre la banda columna del grupo j. luego las matrices de metricas correspondientes son:
l D = diag(fi )
j Mj = diag(fk )
con k Kj . 14
La estructura de doble particin puede ser visto como el ACP(X,M,D), seleccionando las matrices adecuadamente. Lo primero es escoger un modelo A para el trmino general de X, como sigue: xlj ik =
lj fik alj ik l j fi fk
15
j fk
responde al primer valor propio del ACP (Xj , Mj , D) y Mj es la restriccin de M a Rkj . Para conservar las realizaciones de transicin entre los anlisis de las las y las columnas, la mtrica en el espacio de las columnas debe ser la matriz diagonal de pesos en el espacio de las las y viceversa. En el AFMTC para el caso de las columnas presentado en estructuras de un particin, la propiedad de que la suma de los pesos de las las y las columnas es igual a 1 no se cumple, ya que se tiene que:
j 1
16
traza(M ) = sumj
j f
j 1
Luego para recuperar esta propiedad se imponen 2 condiciones: traza(M ) = 1 y traza(D) = 1 Los AFM de las bandas la y columna cambian los pesos de las y columnas, respectivamente.Al repetir los AFM con los nuevos pesos, los resultados sern diferentes.Sin embargo al realizar un proceso iterativo alternando los dos AFM se tiene una convergencia de los pesos de las y columnas, los cuales generarn las matrices de mtricas y de pesos. 17
l D = diag(l fi ) 1 l 1
Si se considera las bandas la en el AFMTC se tiene que l = y en el AFMTC para bandas columna j =
1 . j 1
18
El criterio del AFM, inercia axial mxima igual para las subnubes bandas columna y para las subnubes bandas la, se consigue mediante el proceso que se muestra a continuacin.El nmero de la etapa se indica anteponiendo un subndice a cada uno de los smbolos cuyos valores cambian durante el proceso iterativo.Los trminos mj y dl correponden a los elementos de la diagonal de i k las matrices M y D, respectivamente. j l ETAPA O: Pesos iniciales 0 mj = fk y 0 dl = fi . i k
19
ETAPA 1: Primeros anlisis separados Se realizan los ACP (Xj ,0 Mj ,0 D).El primer valor propio de cada ACP se nota 1 j y se calculan los nuevos pesos de 1 las columnas: j j 0 mk 0 m j 1 mk = j / j 1 1 j 1 1
Se realizan los ACP (Xl ,0 Dl ,1 M ). El primer valor propio de cada ACP se nota 1 l y se calculan los nuevos pesos de 1 las las: l l 0 di 0 d l / 1 di = l l 1 1 l 1 1
20
Se realizan los ACP (Xj ,(t1) Mj ,(t1) D).El primer valor propio de cada ACP se nota t j y se calculan los nuevos 1 pesos de las columnas:
j t mk
j (t1) mk / j t 1 j
j (t1) m j t 1
Se realizan los ACP (Xl ,(t1) Dl ,t M ). El primer valor propio de cada ACP se nota t l y se calculan los nuevos pesos 1 de las las: l l (t1) di (t1) d l / t di = l l t 1 t 1 l
21
Anlisis de Correspondencias. Mayerli Valero Jeisson Prez Introduccin Anlisis de correspondencias intrabloques
Modelo de independencia El ACIB como ACP ponderado Propiedades del ACIB
Criterio de parada: tanto la suma de cuadrados de las diferencias entre los pesos de las las como de las columnas en dos iteraciones consecutivas inferior a un valor dado :
L l=1 iNl J j=1 kNj
(t dl (t1) dl )2 < i i
(t mj (t1) mj )2 < k k
22
Obteniendo los primeros valores propios iguales para todos los ACP separados de bandas la y columna se logra el criterio del AFM.
23
El ACIBP no es mas que el ACIB descrito anteriormente, con las matrices de pesos denidas mediante el proceso iterativo del AFMTC. Luego equivale al ACP (X,M,D) donde X es la matriz de termino general: xlj = ik y
j M = diag(j fk ) l D = diag(l fi ) lj fik
blj ik l f j fi k
lj fik
lj lj fi fk lj
l j fi fk
24
Las propiedades son similares a las de la seccin 2, pero se hace nfasis en las reponderaciones calculadas mediante el proceso iterativo. Como esta vez, la particion a tener en cuenta es doble sobre la tabla F, las particiones de la y columna quedan de la siguiente manera:
j L subnubes NIl en RK (las) y J nubes parciales NI en RK (columnas) l L nubes parciales NK en RI (las) y J subnubes NKj en I R
25
Anlisis de Correspondencias. Mayerli Valero Jeisson Prez Introduccin Anlisis de correspondencias intrabloques
Modelo de independencia El ACIB como ACP ponderado Propiedades del ACIB
26
l
iIl
27
Estas formulas de transicin incluyen los factores l , que modifican los pesos de las coordenadas de las las de acuerdo con las bands la a las q pertenecen: 1 Gs (j, k) = s l
l iIl lj lj lj lj fik f fi fk j lj fk f
Fs (l, i)
28
Introduccin
Anlisis de Correspondencias. Mayerli Valero Jeisson Prez Introduccin Anlisis de correspondencias intrabloques
Modelo de independencia El ACIB como ACP ponderado Propiedades del ACIB
El PIB tiene la estructura que hace posible el Anlisis de Correspondencias Intrabloques, es decir, buscar la manera de agrupar en una tabla de contingencias las variables en grupos y los individuos, buscando una doble particin, que es posible en este caso en los sectores productivos de la economa y los 8 aos que se consideran para este estudio.
29
Segn [?], la clasicacin Industrial Internacional Uniforme de todas las variables econmicas (CIIU) indica que la mejor calsicacin para optimizar el sistema de cuentas nacionales, sin embargo, para el caso colombiano se logra generalizar y enfocar en algunos productos, esto sin cambiar la estructura dada por el organismo internacional. En la 1 se ilustra mejor la particin de las 34 ramas.
30
Rama de Actividad Productos de caf, agricultura, animales vivos y productos animales, silvicultura y madera, pesca. Carbon, petroleo, minerales metalicos, minerales no metlicos, industria de alimentos, resto de la industria, energa. Suministros de agua, gas y energa, construccin, comercio y servicio de reparacin, hoteles y restaurantes, transporte, almacenamiento y comunicaciones, servicios nancieros y no nancieros, administracin pblica, servicios de enseanza, salud, alcantarillado, saneamiento y domesticos y derechos e impuestos sobre importaciones.
31
Los departamentos se agruparon en 4 regiones creadas mediante el mtodo de clasicacin [?] con los datos del indice de Gini, para los aos 2002 a 2009, esto no incluia a los nuevos departamentos (Amazonas, Arauca, Casanare, Guainia, Guaviare, Putumayo, San Andres y Providencia, Vaupes y Vichada), sin embargo esta es una clase aparte que completa la quinta regin en la que se dividio el pas. Los grupos resultantes quedaron de la siguiente manera en la tabla 2:
32
Regin 5 (9)
Departamentos Sucre, Cesar, Magdalena, Bolivar y Guajira Santander, Bogot y Cundinamarca Norte de Santander, Huila, Boyaca, Nario y Antioquia Tolima, Caldas, Valle, Caqueta, Atlantico, Meta, Cordoba, Risaralda, Choco, Quindio y Cauca Amazonas, Arauca, Casanare, Guainia, Guaviare, Putumayo, San Andres y Providencia, Vaupes y Vichada
33
Anlisis de Correspondencias. Mayerli Valero Jeisson Prez Introduccin Anlisis de correspondencias intrabloques
Modelo de independencia El ACIB como ACP ponderado Propiedades del ACIB
0.0020
0.0015
0.0010 Indexes 0.0005 0.0000 NTE_stder Guajira Santander Quindo Bolvar Magdalena Antioquia Bogot Cesar Cundi Narino Caquet Caldas Atlantico Cordoba Boyaca Risaralda Cauca Sucre Meta choco Huila
Estructura biparticionada: Modelo general Estructura de particin sobre una dimensin Estructura biparticionada:
34
Tolima
Valle
Objetivos
Anlisis de Correspondencias. Mayerli Valero Jeisson Prez Introduccin Anlisis de correspondencias intrabloques
Modelo de independencia El ACIB como ACP ponderado Propiedades del ACIB
Asociar departamentos a ramas de actividad econmica segn el PIB. Identicar diferencias en la evolucin productiva de los departamentos de los aos 2003, 2005 y 2007, segn el PIB por ramas.
35
Metodologa
Rutina en [?]
Anlisis de Correspondencias. Mayerli Valero Jeisson Prez Introduccin Anlisis de correspondencias intrabloques
Modelo de independencia El ACIB como ACP ponderado Propiedades del ACIB
Utilizando el paquete [?], que tiene programado el mtodo ACIBP, se consolidan las nubes parciales y el proceso descrito es anlogo para los aos 2003 y 2005. La rutina es para el ao 2007.
col.blo<-c(5,7,22) row.blo<-c(5,3,5,11,9) a<-read.table("pibgini07.txt",header=T) deptos<-a[,1] row.names(a)<-deptos a<-a[,-1] pib07<-a dudi07<-dudi.coa(pib07,scannf=F,nf=4) acibppib07<-witwit.model(dudi07,scannf=F,nf=4,row.blocks=row.blo, col.blocks=col.blo,model="B",weight="mfa") plot(acibppib07,xy=c(1,3),ucal=25,main="Plano 1-3 PIB07",Trow=T) partialp ib07 < partial.wwm(acibppib07, dil = F )plot(partialpib07, xy = c(3, 4))
36
Planos factoriales
Histograma y comparacin de planos
Anlisis de Correspondencias. Mayerli Valero Jeisson Prez Introduccin Anlisis de correspondencias intrabloques
Modelo de independencia El ACIB como ACP ponderado Propiedades del ACIB
Plano 23 PIB07 1.0 0.5 Factor 3: 0.0266 (12%) 0.0 0.5 1.0 CES07 1.5 2.0 GJA07 CARB 0.5 0.0 0.5 1.0 1.5 2.0 PES AMA07 SILyMAD CHO07 1.5
Plano 12 PIB07
META COR07 CAQ07 VIC07 ACUA ANIM BOY07 ARA07 MET07 CIVIL SDER07 CAS07 BOG07 RES_IND ENER ALCAN PETR CAL07 VAL07 HUI07 AEREO SAYP07 CAF AMA07 PES 2 1 0 1 2
0.4
0.0
0.1
0.2
0.3
Plano 34 PIB07
CAF PESAEREO
Estructura biparticionada: Modelo general Estructura de particin sobre una dimensin Estructura biparticionada:
37
BOL07 IMPUE SDER07 RES_IND ACUA VIC07 ARA07 ANIM BOY07 COR07 CAQ07 META BOG07 A_PUBLI
ANT07 RES_IND BOG07 IMPUEBOL07 SDER07 A_PUBLI ENSE CUN07 COM_TRA NAR07 GUA07
Planos factoriales
Planos factoriales 1-2
Anlisis de Correspondencias. Mayerli Valero Jeisson Prez Introduccin Anlisis de correspondencias intrabloques
Modelo de independencia El ACIB como ACP ponderado Propiedades del ACIB
1 2 2 META AMA05 COR07 1 Factor 2: 0.0333 (15%) 1 Factor 2: 0.0285 (14.3%) Factor 2: 0.0325 (15.6%) CAQ07 VIC07 ACUA ANIM BOY07 ARA07 0 HUI07 CAF AEREO SAYP07 AMA07 1 PES META 2 2 MET07 CIVIL SDER07 CAS07 PETR CAL07 BOG07 RES_IND ENER ALCAN VAL07 1 CAF HUI05 PETR 0 TOL05 MET05 CAS05 CIVIL SAYP05 AEREO VAL05 ENER ALCAN ALQUI RES_IND ANT05 BOY05 ARA05 ANIM VIC05 COR05 CAF CAL03 HUI03 0 RIS03 VAL03 PETR ALCAN ALQUI AGUA SEGU ENER RES_IND BOG03 TELE CAS03 SDER03 CIVIL MET03 ARA03 ANIM BOY03 VIC03 CAQ03 META COR03 SAYP03 AEREO AMA03 PES PES Plano 12 PIB07 Plano 12 PIB05 Plano 12 PIB03
1.0
0.5
0.0
0.5
1.0
1.0
0.5
0.0
0.5
1.0
1.0
0.5
0.0
0.5
1.0
1.5
38
Planos factoriales
Planos factoriales 1-3
Anlisis de Correspondencias. Mayerli Valero Jeisson Prez Introduccin Anlisis de correspondencias intrabloques
Modelo de independencia El ACIB como ACP ponderado Propiedades del ACIB
1 1 1 ALCAN ALQUI ANT03 DOMES AGUA SER_EMP RES_IND SEGU CIVILCAS03 SDER03 BOG03 TELE 0 ENER PETR M HUI03 ET03 AEREO ENSE HOTE SAYP03 NAR03 1 GUA03 SILyMAD PES CHO03 AMA03 2 2 2 BOL05 IMPUE SDER05 ANT05 CIVIL RES_IND VAL05 ALQUI ALCAN CAS05 BOG05 ENER AEREO SAYP05 ENSE A_PUBLI NAR05 CES05 1 GUA05 BOL07 Plano 13 PIB03 Plano 13 PIB05 Plano 13 PIB07
IMPUE SDER07 RES_IND CIVIL CAS07 BOG07 MET07 ENER PETR CAF SEGU HUI07
SAYP07 AEREO
1 CES07
GJA05 CARB
GJA07 CARB
1.0
0.5
0.0
0.5
1.0
1.5
1.0
0.5
0.0
0.5
1.0
1.0
0.5
0.0
0.5
1.0
39
Planos factoriales
Planos factoriales 2-4
Anlisis de Correspondencias. Mayerli Valero Jeisson Prez
2 Plano 24 PIB03 4 2 Plano 24 PIB05 Plano 24 PIB07
CAF
1 CES03
CAF
1.5
1.0
0.5
0.0
0.5
1.0
1.5
1.5
1.0
0.5
0.0
0.5
1.0
1.5
40
Planos factoriales
Nubes parciales
Anlisis de Correspondencias. Mayerli Valero Jeisson Prez Introduccin Anlisis de correspondencias intrabloques
Modelo de independencia El ACIB como ACP ponderado Propiedades del ACIB
2.0
20 8
1.5
14 2
COR07 1.0 Factor 2: 0.0333 (15%) GJA07 0.5 CAQ07 VIC07 CHO07
0.0
21 9 CES07 16 4 BOY07 ARA07 GVRE07 CUN07 VAU07 13 1 18 6 MET07 3 SDER07 15 NTE07 PUT07 SUC07 GUA07 QUI07 ANT07 ATL07 CAS07 BOG07 NAR07 TOL07 RIS07
23 11 19 7
CAL07 0.5
17 5
HUI07
SAYP07
22 10
AMA07
1.0
24 12
41
Planos factoriales
Nubes parciales
Anlisis de Correspondencias. Mayerli Valero Jeisson Prez Introduccin Anlisis de correspondencias intrabloques
Modelo de independencia El ACIB como ACP ponderado Propiedades del ACIB
1
17 5 14 2
GJA07 0
CES07
VIC07 ARA07 VAL07 ATL07 ANT07 CAS07 13 1 BOG07 16 BOY07 TOL07 MET07 4 NTE07 QUI07 11 MAG07 SDER07 BOL07 23 15 3 SUC07 CAL07 HUI07 18 6RIS07 VAU07 PUT07 CUN07 24 CAQ07 12 GVRE07 CAU07 SAYP07 COR07 NAR07 GUA07
21 9 20 8 AMA07
CHO07
19 7 22 10
42
Anlisis de Correspondencias. Mayerli Valero Jeisson Prez Introduccin Anlisis de correspondencias intrabloques
Modelo de independencia El ACIB como ACP ponderado Propiedades del ACIB
Se observa que los departamentos de Guajira y Cesar estn directamete asociados al segundo grupo de actividad mayoritariamente, sin embargo, Cesar tambien cuenta con inuencia en el sector primario (produccion animal). El departamento de San Andres y Providencia, muestra una obvia relacin con el sector aereo (terciario), pero una fuerte inclinacin a la explotacion de recursos maritimos (pesca y transporte acuatico) Los departamentos tradicionalmente cafeteros pierden participacin en el total de esta rama.
43
Anlisis de Correspondencias. Mayerli Valero Jeisson Prez Introduccin Anlisis de correspondencias intrabloques
Modelo de independencia El ACIB como ACP ponderado Propiedades del ACIB
El sector servicios (terciario), a pesar de la diversicacin de actividades no muestra gran inuencia, ni en la generacion de impuestos, ni en servicios. La seguridad democratica implementada a partir del ao 2002, inuye bastante en la representacin del carbon en sectores tradicionalmente rurales.
44