You are on page 1of 22
Capitulo 2 Anidlisis Factorial de Correspondencias 2.1 Los datos, las notaciones, la hipétesis de indepen- dencia En suo el Analisis Factorial de Correspondencias (AFC) fue concebido para estudia as tablas denominada blas de contingencia (o tablas ern: de tablas de ef obtenidos cruzando én de n in oustituida por un conjunto modalidades de dos variab pob juos. En el ejemplo comenta le individuos qu que ocupaban un empleo en 19) y su categoria de empleo Se habla indiferentemente de la modalidad i (por ejemplo el bachillerato) o de la clase te ndlividuos seen In modalidad i (por ejemplo alumnos de studio de una tabla de contingencia. Sin embar que In mayor ps s nociones introduc y los resultados s pueden ser an estrictamente de este tipo. El ea tratado en un capitulo pa El ‘dn de este capitulo da al diferentes de las tablas de contingenci so muy importan Anilisis de Corres ativa comple les, La de referencia sobre la aplic Modalidades de ls segunda variable Modalidades de 1a primera vanable Se Figura 12. La tabla de datos originales 1: Conjunto de filas y niimero de fas de estudios) J: conjumto de cohumnas y nimero de colunmas | (9 categorias de empleo) se: miomero de individuos que poseen ala ve= la ‘modalidad i de la primera variable ¥ la modal- dad j de (a segunda, (ed. que tienen el nivel de estudios i y que ocupan un empleo de la cate goriaj) E,E,ky = (niimero roral de individos) considera frecuentemente la tabla de frecuencias relativas F, obtenida dividiendo cada efectivo ky por el efectivo total n, Esta nueva tabla define una medida de probabilidad sobre el conjunto producto J x J. Sus marginales, o probabilidades marginales, tienen pos término general f, 0 f, (ef. Figura 13), t i 1 Matgnal Marginal a 013, La table P de fr ecuencias relativas y sus marginales Una tat mente, par todo iy pa Existe diferente dé contrario, § hipétesis dé La ind filas. En ef La cant 3, mientras modalidad modalidade variable co reeiproco ¢ marginal f aque las fa el punto de Observe Juegan un | ‘manera sob siguiente: Baiste i fies decir, end iidad dos variables eualitativas. Clisien- encia cuando para Una tabla de contingencia expresa la relacién ent mente, para una. medida de probabilidad, se dice que existe indepe! todo i y para todo j se cumple Ia igualdad: fy = Fibs Existe relacién entre las dos variables cuando en algunas casillas de la tabla fi es diferente del producto f, f;. Si fi; es superior a este producto, las modalidades iy j se asocian més que en la hipétesis de independencia: se dice que i y j se atraen. Por el contrario, si f,; es inferior al producto de las marginales, hipdtesis de independecia: se dice que existe una repulsion entre estas dos modalidades, yj se asocian menos que en la La independencia se expresa también considerando la tabla como un conjunto de filas. En efecto, la igualdad anterior es equivalente a la igualdad: fs fi La cantidad f, representa el porcentaje de la poblacién total que posee Ia modalidad j, mientras que 4i representa este mismo porcentaje en In subpoblacién 4 tmodalidad i Cusido existe independencia, las T subpoblaciones caracterizadas por Ins rodalidades é de In primera variable se reparten segin las J modalidades de la segund taviable con los mismos porcentajes. ‘Todas las Alas son entonces proporcionales. El reciproco et cierto: cuando todas laa flan son proporcionales, #on proporc Tharginel f, y lus dos variables son independientes. Existe, por tanto, relacién siempre aque las fad no sean todas proporcioneles a la marginal y cuando no sean idénticas desde al punto de vista de su asociacién con cl conjunto de colurnas posee la males a Ia Observemos, para terminar, que en una tabla de contingencia las filas y las columnas juegan un papel absolutamente simétrico y que la independencia se expresa de la m ‘manera sobre el conjunto de columnas. Las dos igualdades anteriores son equivalentes a la siguiente: fy Existe independencia cuando todos los porcentajes en columnas son iguales a la marginal cs decir, cttando las columnas son proporcionales. Existe relacién cuando no lo son, fi 2.2 Los objetivos Aunque Ia tabla estudiada sea de naturaleza muy diferente de la que se estudi6 en ACP, los objetivos del AFC se pueden expresar de manera totalmente anéloga a los del ACP: se intenta obtener tna tipologia de las fils, una tipologia de las columnas y relacionar estas dos tipologias entre si pero Ia nocién de semejanza entre dos filas, 0 entre dos eolumnas, es diferente de la del ACP. En una tabla de contingeneia, la semejanza entre dos filas, por una parte, y entre dos columnas, por otra parte, se expresa de manera totalmente simétrica. Dos filas se conside- ran prdximas si se asocian del mismo modo al conjunto de las colummnas, es decir, si ellas se asocian demasiado (0 demasiado poco) a las mismas columnas; considerando “demasiado” ¥ “demasiado poco” con sespecto a la situacién de independencia. Simétricamente, dos ‘olumnas estén proximas si se asocian del mismo modo al conjunto de las filas. Esquematicamente, el estudio del conjunto de las filas consiste en poner de manifiesto ‘una tipologia en la cual se busen: las filas euya distribucién se desvia més de la del conjunto de la poblacién, aquéllas que se asemejan entre si (en el sentido precisado anteriormente) y las que se oponen. Para relacionar la tipologia de las filas con el conjunto de las columnas, se caracteriza cada grupo de filas por las columnas a las que este grupo se asocia demasiado © demasiado poco, El estudio del conjunto de las columnas es totalmente andlogo. Esti claro que esta aproximaciéa, gracias a la nocién de semejanza utilizada, permite estudiar la relacién entre las dos variables, es decir, la desviacidn de la tabla de la hipstesis de independencia. El anélisis de esta relacién es el objetivo fundamental del AFC. ‘Una aproximacién, complementaria de Ia precedente, hace intervenir simultdneamente al conjunto de filas y al de columnas no dando privilegio ni a uno ni a otro. ‘Tomemos el ejemplo de la tabla que cruza las eategorias de empleo y los niveles de estudios. El conjunto de estudios esté ordenado por la duracién de los mismos, mientras que el de categorias de ‘empleo lo esté por el salario medio. La relacién entre estas dos ordenaciones, (um salario ‘levado corzesponde generalmente a un nivel de estudios superior), explica cléramente una buona parte de Ia relacidn entre empleos y estudios. Pero esta relacidn no se limita a este tinico aspecto; pueden existir otros fenémenos como la asociacién casi exclusiva de algunos estudios con ciertos empleos. El objetivo del AFC consiste en descomponer la relacién entre dos variables en una suma (o una superposicién) de tendencias simples interpretables como las que acaban de ser citadas y de medlir su importancia relativa, lo que permite ordenatlas Para terminar, es necesario sefialar que el AFC, como todo Anélisis Factorial, se u- tiliza también para reducir la dimensién de los datos conservando la mayor informacién 30 posible, Con discriminant 2.3 La En AFClat datos se tran La nueva fila objetivo que entre los por de dos filas| cfectivos ma centre las fil los efectivos El nim la categoria probabilida Debido namiento a 14.) re dos las se indo” e, dos ifiesto junto ate) y esis mente mos el njunto ins de salario teuna nita a iva de ner la ples iva, lo posible, Con vistas a un tratamiento estadistico ulterior (clasificacién, regresién, andlisis, diseriminente ...) 0 a una transmisién de informacién, 2.3 Las transformaciones de los datos en perfiles En AFC la tabla original no se analiza directamente. En el estudio de las filas, In tabla de atos se transforma dividiendo cada término fi; de la fila i por la marginal fi, de esta fila i a nueva fila se denomina perfil-fla (ef. Figura 14), Esta transformacién se desprende del objetivo que trata de estudiar la relacién entre las dos variables por medio de la desviacién ‘entre los porcentajes en filas, Se justifica también de manera directa ya que la comparacién de dos filas de la tabla original tiene el riesgo de estar influida principalmente por sus efectivos marginales. Asi, en la tabla. que cruza empleos y niveles de estudios, la diferencia ‘entze las filas “Bac Técnico” y “Bae General” expresa esencialmente una diferencia entre los efectivos globales de estos dos niveles de estudios. igura 14. Las nociones de perfl-fila y de perfil-colummna. El nvimero # vepresenta, en nuestro ejemplo, ta probabilidad de ocupar un empleo de la categoria j sabiendo que posee el nivel de estudios i. El perfil-fla i no es més que la probabilidad condicionada definida por i sobre el conjunto de eolumnas. Debido al papel simétrico jugado por las filas y las columnas, puede hacerse un razo namiento andlogo para las columnas, Ello lleva a la nocién de perfil-columna. (cf. Figura 4.) Asi, en AFC segiin lo que interese, las filas o Ins columnas, no se considera la misma tabla transformada, Sin embargo, las dos transformaciones en perfiles poscen el mismo sig- nificado respecto a los objetos a los que se refieren. Estas transformaciones son interesantes por si mismas independientemente de todo el contexto del andlisis factorial. Cuando se comenta una tabla cruzada, casi siempre se presenta en forma de porcentajes con respecto a las filas 0 a las columnas segtin los aspectos que se intenten poner de manifiesto. 2.4 La semejanza entre perfiles: la distancia y” En AFG, la semejanza entre dos filas o entre dos columnnas est definida por una distancia entre sus perfiles. Esta distancia es conocida con el nombre de distancia y?. Esta definida de manera aniloge para las fils y para las eolumnas. Sea dy2 (perfil-fila 4, perfil-fila yey ida— fp Thich fi 4 (penn jection 2 = Ff = En estas relaciones, la distancia entre dos filas depende esencialmente de las diferencias término a término entre los dos perfiles. Esta distancia es una suma ponderada de los cuadrados de las citadas diferencias. La ponderacién 7 equilibra la infh columnas sobre la distancia entre las filas: aumenta los términos, a priori mis débiles, referentes a las modalidades raras, Juega también un papel anslogo al de la divisién de la desviacién tipica en el caso de las variables numéricas. icin de Tas La distancia x? goza de una propiedad fundamental denominada equivalencia dis- tribucional, Segiin esta propiedad, si dos eolumnas proporcionales de una tabla se acu- ‘mulan en una sola, Ia distancia entre los perfilesfila no se altera. El caso de una propor cionalidad perfecta entre dos columnas apenas se encuentra en la préctica, pero constituye una situacién limite de la que se puede estar bastante préximo. La propiedad matemitica es entonces utilizada bajo la forma de una regla pragmtica: scemplazar dos columnas 6 dos filas casi proporcionales por su suma no modifica sensiblemente los resultados de un AFC. Se hace referencia a esta regia sobre todo cuando son posibles varios conjuntos de modalidades para definir una misma variable (por ejemplo: Ia variable “categoria de empleo” puede estar mas o menos detallada, las categorias obreros cualificados y obreros no cualifieados pueden ser reagrupados en una sola categoria, pero Ia eleccidn entre las dos soluciones no es absolutamente fundamental ya que los AFC de las dos tablas llevan a resultados anélogos) 2.6) 7) 2.5.1 Interesar las J dim aque defi distancia a asignat perfil Figura | Ea J peso iu individy Elb ig: los Ins la las 2.5 Las dos nubes 2. 1 La nube de perfiles-filas Interesarse por las modalidades de como una yuxtaposicién de perfiles-flas. Cada perfil-fila es un conjunto de J valores numéricos y puede ser representado por un punto del espacio RY en el que cada una de las J dimensiones esta asociada a una modalidad de la segunda variable. La distancia y* que define la semejanza entre perfiles-filas (cf. seceién 4) pos la primera variable lleva a considerar las variables las propiedades de una distancia eucliden y conflere aR’ Ia estructura de espacio enclideo. Eata distancia conduce perfifila vale 1; resultando que In nube Ny pertenece a un hiperplano denotado Hf (ct. Figura 15) * dimensién de R? el peso 75. La suma de las coordenadas de cada fila De El punto i tiene por coordenada sobre el eje j SO hierplane Hy fill Su peso es f, x La distancia entre dos perfiles es la distancia olumnaj El baricentro G, de la nube N, tiene por coorde- nada sobre el eje j la frecuencia marginal f, La nube N; pertenece a un hiperplano denotado | Hy | Figura 15. La nube N; de perfiles-flas en R! En AFC los pesos de cada punto de la nube vienen impuestos. El punto i tiene un peso igual a la frecuencia marginal f, (este peso es proporcional al efectivo de la clase de individuos que representa El baricentro de los puntos de NV; dotados de estos pesos se denota Gy. Su j-“™ coordenada es igual a la frecuencia marginal f, fs fi = LAE Se interpreta como un perfil medio, En el ejemplo de Ia tabla que eruza los niveles de estudios y las categorias de empleo, G, es el perfil de las eategorias de empleos del conjunto de la poblacién, considerando todos los niveles de esturdios acumulados. Sirve constantemente de referencia en el estudio de las filas de Ia tabla. Asi, estudiar en qué medida y de qué manera una clase de individuos i difiere del conjunto de In poblacién conduce a estudiar la desviacién entre el perfil de esta clase y el perfil medio. Estudiar la dispersién de la nube alrededor de su baricentro leva a estudiar la desviacién entre los, perfiles de las filas y la marginal, por tanto, la relacién entre las dos variables (ef. seccién 1). 2.5.2 La nube de perfiles-columnas Teniendo en cuenta el papel simétrico jugado por las filas y las columnas en el AFC, la construccidn de la nube de perfiles-columnas se efectia segiin un procedimiento estricta- mente idéntico al de la nube de perfiles-filas. Su descripcidn, sin embargo, seré itil para fijar las notaciones. Interesarse por las modalidades de Ia segunda variable conduce a considerar los datos como una yuxtaposicién de perfles-columnas. Cada perfil-eolumna es un conjunto de I valores numéricos y puede ser representado por tun punto del espacio RT en el que cada. una de las dimensiones se asocia a una modalidad de la primera variable. R! esta dotado de una estructura euckidea por Ia distancia x’: la i~“i"* dimensién esta afectada por el peso 2 (cf. Figura 16). El punto G, representa la marginal {f /i = 1,..,1}; es el baricentro de Ny cuando se dota a cada perfil-columna del peso f,; como perfil medio, sirve constantemente de referencia en el estudio de Ny 2.6 El 2.6.1 El En RY, el a aube Ny. D ortogonales s méxima Ia i jes ya encor Las imég imagen se as es completan implica que origen de los En la au punto cuya expresa la d iveles os del Sieve qué lacién tudiar ire los FC, la tsicta I para datos ode I ° cada jotado por el uando nte de “| Et pnt tie por coreada sire oe} peel. golumna k hiperlano Hf) Su peso es fy perll-columna j El baricentro G, de la nube N; tiene por coorde- nada sobre el eje ila frecuencia marginal f, | La nube N, pertenece a un hiperplano denotado Hy, a Figura 16. La nube N, de perfiles-columnas en I 2.6 El ajuste de las dos nubes 2.6.1 El ajuste de la nube de perfiles-filas En R, el ajuste trata de obtener un conjunto de imégenes planas aproximadas de la nube N;. Del mismo modo que el ACP, el AFC consiste en buscar un conjunto de ejes ortogonales sobre los que sera proyectada la nube Nj. Cada eje posee la propiedad de hacer miixima Ia inercia proyectada de In nube N, con la restriccién de ortogonalidad entre los ejes ya encontrados, Las imégenes planas de N, deben ser tales que las distancias entre los puntos de la imagen se asemejen lo més posible a las distancias entre los puntos de N;. Este objetivo ‘es completamente andlogo al del ajuste de la nube de individuos en el ACP: en la préctica, implica que In nube analizada sea centrada, es decir, que su baricentro sea elegido como origen de los ejes (ef. capitulo 1, seceién 5). En la nube centrada, la clase definida por la modalidad i est representada por un punto cuya coordenada sobre el j-!#™ eje vale: fu/fi, — f4- La posicién de este punto expresa la diferencia entre la distribucién de la clase i y la de la poblacién total sobre 35 el conjunto de las modalidades de la segunda variable. Asi, buscar las direcciones de la inercia maxima de la nube centrada conduce a poner de manifiesto las clases que mis se desvian del perfil del conjunto de la poblacién, Cada perfil esta dotado de un peso igual a su frecuencia marginal f,.. Este peso inter viene, en primer lugar, en el céleulo del centro de gravedad de In nube. También interviene en Ia inercia y, por tanto, en el criterio de ajuste de los ejes (of. Figura 17). &: punto asociado al perfil-fila i. tu: vector unitario del primer eje factorial 1H; proyeecin det sobre uy 1 hace maximo E,f, (OH) Figura 17. Ajuste en R? de la nube de perfilesflas, Debido a la introduecidn de pesos en el criterio de ajuste, cada modalidad posee una importancia proporcional a la poblacién que representa. Asi, a igual disparidad de perfil, los ejes ponen més bien de manifesto los fenémenos que conciernen a tina fraccién im: portante de In poblacién total. Segtin otro punto de vista, las modalidades de efectivos Aébiles, para las cuales los perfiles corren el riesgo de ser menos fiables, intervienen menos en la construccién de los ejes. En resumen, el ajuste de la nube NV; en AFC es andlogo al de la nube de individuos en ACP. Difiere en tres puntos: « Las filas intervienen a través de sus perfiles La distancia entre los perfiles es Ia distancia x? # Cada elemento i est afectado del peso f, 36 2.6.2 El Debido al pa plantea en le © Las imi tados s deriva cia tol diferent # Cada ¢ notaci unitari anilog 2.6.3 Us Desde el pun del primer f el andlisis de Cuando s l primer eje + Uned # Tenien contien © La iner Natural cada punto d factor trivi fl 2.6.2 El ajuste de la nube de perfiles-columnas Debido al papel simétrico que juegan las filas y las columnas en AFC, el ajuste en R! se Plantea en los mismos términos y posee las mismas propiedades que el ajuste en R?. En Las imagenes planas de N, deben ser tales que las distancias entre los perfiles proyec tados se asemejen lo més posible a las distancias entre los perfiles en R’. De aht se deriva la necesidad de analizar la nube Ny con relacién a su baricentro G,. La incr. ia total de Ny con respecto a G, proviene de las diferencias entre los perfiles de las diferentes clases y el perfil del conjunto de la poblacién, * Cada columna j esta afectada de un peso igual a su efectivo marginal (f,). Con notaciones andlogas a las de la Fi ‘igura 17,al ser H; la proyeceién sobre v, (vector unitario del primer eje factorial) del punto j asociado al perfil-columna j. vy hace nudxima la cantidad: SD; f,(OH,)?. La justificacién de este peso es estrictamente aniloga a la desarrollada a propésito de los perfiles-filas. 2.6.3 Un aspecto técnico del centrado en AFC. Desde el punto de vista téenico se puede mostrar (ef. capitulo 4, necesario eentrar explicitamente la nube N; antes de su andlisis. En efecto, prescindiendo dll primer factor, el andlisis de la nube con respecto a O leva a los mismos factores que cl anilisis de la nube centrada. seccién 5) que no es Cuando se realiza el AFC de Ja nube N; no centrada (es decir, con respecto al origen), el primer eje factorial posee la propiedades siguientes (ef. Figura 18): * Une el origen O al baricentro G, de la nube Ny * Teniendo en cuenta la métsica utilizada, este eje es ortogonal al hiperplano H; que contiene la nube N; * La inereia proyectada de N, en esta direccién vale 1. Naturalmente, este eje no presenta interés en sf mismo: In proyeccién sobre OG, de cada punto de N; se confunde con G;, Esta proyeecién de N, sobre el eje OG; se denomina factor trivial o factor constante. Estas propiedades estén resumidas en la Figura 18 37 0G, es el primer eje factorial. 0G; es ortogonal al hiperplano H, sobre 0G; vale I La inercia proyectada de } Figura 18. El primer eje factorial de la nube N; no centrada es el factor trivial, La ortogonalidad del primer eje OG, con el hiperplano H, presenta una consecuencia Fig importante. Al ser los siguientes ejes, por definicién, ortogonales a OG, el anélisis puede ser realizado indiferentemente con respecto a O 0 a G, (ef. Figura 19). 2.7.1 El 2.7 La dualidad ‘Cuando se través de dos con la ayuda la. desviacién Las dos nubes N; y N, constituyen dos representaciones de una misma tabla, una a través de sus perfiles-filas y In otra a través de sus perfiles-columnas. De donde se deduce que Jos anélisis de estas dos nubes no son independientes: las relaciones entre estos dos andlisis son cominmente reagrupadas bajo el término de dualidad. media si las Esta dualidad es mis fundamental y mas riea en AFC que en ACP ya que las filas y las columnas representan objetos de la misma naturaleza, no ocurriendo esto en ACP. Elestadi su basieentre con respecto we] puede través sue los nilisis| 14. primer ee factorial de la nube N, cuando el drigen de los ejes estd en O. tts segundo ef factorial de ta nube N, cuando | tforgen de los jes esti en O (ortogonal au). | "1 primer efe factorial de a nube N, cuando et | origen de los ejes estd en Gy, Las proyecciones de N, sobre us y w son idérti- ee Figura 19. Andlisis con respecto al baricentro y con respecto al origen. 2.7.1 El estadistico \* y la inercia de las dos nubes y Cuando se estudia una tabla de contingencia, es decit, una poblacién de n individuos a travds de dos variables cualitativas, es eorriente medir Ia relacién entre estas dos variables con la ayuda del estadistico y?. Aplicado a una tabla de efectivos, este estadistico mide desviacién entre los efectivos observados y los efectivos tesricos que se obtendrian en media si las dos variables fueran independientes. Se escribe = (elect tesricos)t _ ~(nfy =nfif,)" a cfectivos tesricos SSCS Fy observados — efectiv. El estadistico x? es igual, excepto por el coeficiente m, a la inercia total con respecto a su baricentro de una w otra de las nubes N, y Ny. En efecto, en R?, la inereia total de Ny con respecto a G; se eseribe: Inercia(Ny) = 3 Inereia(i) =f, D4 2 Ay 39 [Inereia(iNs)] = n [Inercia(N,)] De esta doble igualdad se deduce que la inercia total de cada una de las dos nubes Ny xy Ny representa bajo dos formas diferentes el mismo fendmeno: la relacién entre las dos variables. 2.7.2 Dualidad de los factores sobre I y sobre J Como en ACP, se denomina factor al conjunto de coordenadas de las proyecciones de los puntos de una nube sobre uno de sus ejes factoriales; los factores sobre las filas son por tanto las proyecciones de Nr y los factores sobre las columnas las proyecciones de N,. El rango de un factor es el rango del eje factorial correspondiente. Ademés de su inercia total idéntica, las nubes NV; y NV) poseen una propiedad destacable: sus ajustes llevan a dos conjuntos de factores “duales”. De forma més precisa, nosotros demostramos en el capitulo 4 que: © Las inercias asociadas a los ejes de un mismo rango en cada una de las nubes son iguales. + Los factores del mismo rango sobre las filas y sobre las columnas estan relacionados por las relaciones de transicién (permiten pasar de R! a RY y vieeversa). Los dos pérrafos siguientes detallan esta duatidad cuya consecuencia esencial es Ia siguiente: los factores sobre I'y sobre J del mismo rango deben ser interpretados con- juntamente ya que ponen de manifiesto la misma parte de relacién expresada por tno en términos de perfiles-filas y por el otro en términos de perfiles-columnas, Relaciones de transicién Las formulas de transicién permiten precisar Ins relaciones entre los puntos que repre sentan por una parte las filas y por otra las columnas. Con las notaciones siguientes: © Fj): proyeccién de la fila i sobre el eje de rango s de Ny © G,(j): proyeceién de la columna j sobre el eje de rango s de Ny © Aj: valor comin de la inercia asociada a cada uno de estos ees. 40 Las dos rela Estas do de los result todo, dan s Repres: baricéntric La repre tas dos nub niubes. Sobi ¥ de los pu excepto por de las proy expresién d Jos clement mis elevad aman par Se encuent con las que os posible i justifica La form columnas. regla de i Esta do muestra qu sobre las fi Ddariecéntrie La repr caso del A\ pubes e las dos evan a ubes son sionados jal es la Hos con. e repre- tes: Las dos relaciones de transicién se escriben: 1 fi my Go) Fe Estas dos propiedades que expresan los resultados del anélisis de una nube en fancién de Jos resultados del anilisis de la otra nube, llevan a una economia de céleulo. Pero sobre todo, dan sentido a una representacién simultdnea de las fas y de las columnas. Representacién simulténea de las filas y de las columnas y relaciones baricéntricas La representacién simulténea se obtiene superponiendo las proyecciones de eada wna de las dos nubes 1 y N, sobre os planos engendrados por los ejes de igual rango para las dos niubes. Sobre los gréficos asf obtenidos, las relaciones entre Ia posieiSn de los puntos filas ¥ de los puntos columnas debidas a las relaciones de transicién pueden ser deseritas a excepto por el coeficiente (1/V3,), Ia proyeccidn de lala i sobre el eje s es el baricentro de las proyeeciones de las colummnas j, al estar cada columna j dotada del peso fy (esta expresién de una férmula de transicién se denomina propiedad baricéntrica). Al atraer los elementos “pesados” al baricentzo, una columna j atrae tanto mas a una fila i cuanto mis elevado sea el valor de fy. Sobre los planos factoriales, los puntos alejados del origen aman particularmente la atencién, ya. que son los perfiles mas diferentes del perfil medio. Se encuentran, por tanto, sobre un factor, del mismo Indo que una fila ¢ las eolumnas j con las que mas se asocia y, en el lado opuesto, aquéllas con las que menos se asocia. Ast ¢s posible interpretar la posicién de una fla con respecto al conjunto de eolumnas, lo que justifiea el interés préctico de la representacién simaltinen La formulacién simétrica es valida, al invertir los papeles jugados por las filas y las columnas. De ahi el nombre de doble propiedad baricéntriea dada a lo que es la principal regla de interpretacién de los grificos del AFC. Esta doble propiedad no es solamente especifiea del AFC, pero le caracteriza: se de- muestra que se encuentran los factores del AFC tratando de construir funciones definidas sobre las filas y las columnas de una tabla de contingencia tales que la doble propiedad baricéntrica sea verificada, La representacién simultdnea en AFC es universalmente adoptada, no siendo asi en el caso del ACP. En efecto: ‘¢ Mientras en ACP, las filas y las columnas representan objetos de naturaleza bien diferente (individuos y variables), las filas y las columnas, en el AFC de una tabla de contingencia, son de la misma naturaleza, a saber, clases de individuos, Segiin este simple punto de vista, no es nada escandaloso ver aparecer todas estas clases sobre ‘un mismo gréfico. «¢ Bxisten otras presentaciones del AFC en las que las clases de individuos que cons- tituyen las filas y las columnas de una tabla de contingencia estan situadas en un mismo espacio, lo que hace su representacién simultéinea completamente natural. En resumen, sobre los gréficos de representacién simultdnea de las filas y las columnas, la posicién relativa de dos puntos de un mismo conjunto (filas o columnas) se interpreta en términos de distancia, mientras que la posicién de un punto de un conjunto y de todos los puntos del otro conjunto se interpreta en términos de baricentro, La proximidad de una fila y de una columna no tiene sentido en sf misma. 2.7.3 Interpretacién de la inercia de los ejes La inercia de un punto (0 de una nube de puntos) en un espacio euclideo se descompone sobre toda base ortogonal: es la suma de sus inercias sobre cada uno de los cjes de esta base. El ajuste de las nubes N; y Ny descompone su inercia segtin las direeciones privilegiadas: debido a la ortogonalidad de los ejes, la suma de las inercias de una nube sobre cada uno de los ejes es igual a la inercia total de In nube. Contratiamente al caso del ACP, en el que la inercia de las nubes es igual al méimero de variables, en el AFC esta inercia expresa Ie estructura de Ia tabla: Ia inercia de cada una de las dos nubes de perfiles-filas y de perfiles-columnas es igual al estadistico x? (ef, seecién 17-1). EL AFC es por tanto una descomposicién de este estaclistico y enda factor representa tuna parte de Ia relacién entre las variables. La inercia de un factor tiene por tanto un significado, en términos absolutos, y no solamente como tun porcentaje de la inercia total Ge la nube: mide la importancia de la parte de la relacién que él representa. Nosotros ddamos la interpretacién de los dos valores limites entre los que se puede situar. Cuando una tabla verifica las relaciones de independencia, las nubes se concentran en un punto (su baricentro): todos los perfilesfilas son idénticos e iguales a la marginal {sid = lsd} y todos los perfles-columnas son idénticos ¢ iguales a la marginal {f.5i = 1,22}. La inercia de las mubes N; y Ny respecto a su centro de gravedad es nula y el AFC no da ningiin factor (o mejor dicho todos los factores tienen una inercia nula). Se demuestra que la inercia asociada a un eje factorial vale como maximo 1. Se de- 42 muestra tam! situacién “de como el dela mis que a tu En este caso, elementos de columnas cot Un inerei Himite: exist a una clase ¢ Cuando se pueden ¢ La situacié sélo poser cada eje de ste bre muestra también que cuando esta inercia vale 1, el eje factorial pone de manifiesto una situacién “de extrema dependencia” en el siguiente sentido: el conjunto de las filas, ast como el de las columnnas, puede ser dividido en dos grapos; eada grupo de filas no se azocia ins que a un grupo de columnas (y reciprocamente) segsin el esquema de la Figura 20 En este caso, los factores definidos por estas ejes tienen los iismos valores para todos los clementos de un mismo grupo de filas, as{ como para todos los clementos del grupo de columnas con las que se asocian. Un inercia préxima a 1 indica que la estructura de la tabla esté préximaa esta situacién limite: existe una particién de Jy J tal que cada clase de I'se asocia casi exclusivamente a.una clase de J y reeiprocamente. Distribuciones de las files y de las columnas puestas de manifesto por un eje factorial aso- 1 ciado a una inereia igual a 1. Todos los efectivos de las subtablas Ty: y T2, son nulos. "| Figura 20. Caso de una inercia igual « 1 Cuando los ejes factoriales tiene una inercia igual a 1 las filas y Ins columnas de la tabla se pueden dividir en tres grupos que se asocian a un solo grupo del otro conjunto, ete La situacién de més extrema dependencia entre dos variables cualitativas que presentan el misino ntimero de modalidades es aquélla en la que cada modalidad de una de Ins variables se asocia con una séla de las modalidades de la otra, En este caso, la tabla de contingencia sélo posee efectivos no nulos en la diagonal. Resulta, de lo que precede, que en este caso cada eje del APC esta asociado a una inercia de 1 2.7.4 Férmula de reconstruccién de los datos ‘A ln descomposicién de la inercia se puede asociar una descomposicién de la propia tabla, En efecto, se puede demostrar que: fr f= hLDA Esta formula, denominada formula de reconstruccién de los datos, permite recalcular los valores de la tabla inicial en funcién de Ins marginales y de los factores. Cuando se examinan los resultados de un AFC, se limita generalmente la interpretacion a los primeros factores. Esto conduce a considerar no la tabla de datos sino su aproximacién obtenida con Ia aytida de los primeros términos de la suma anterior. Esta relacién pone de manifiesto una descomposicién de la desviacién de Ia table, con relacién a la hipdtesis de independencia, en una suma de tablas de las cuales cada una depende de un par de factores (F,,G,) del mismo rango. Formaliza el aspecto del objetivo anunciado: descomposicién de la relacién en elementos simples. En efecto, cada tabla de término general f, ;F,(i)G,(j) expresa una relacién simple ya que el término de la casilla (ij) no depende més que de la fila i y de la columna j. Si los valotes de F,(i) y de G,(j) son del mismo signo, este caso expresa una atraccidn entre i y j, en el caso contrario expresa una repulsién tanto mas importante cuanto més grandes sean F,(i) y G,(f) en valor absoluto. lustramos esta descomposicién en el capitulo 8 a propésito del ejemplo tratado. 2.8 Ayudas a la interpretacién y elementos suplemen- tarios Los indices de ayuda a Ia interpretacién (calidad de representacidn de un elemento por wn je 0 un plano y contribucién de un elemento a la inercia de un ¢je) definidos en el ACP (cf. capitulo 1, seccién 9) son vilidos para una nube cualquiera. Se aplican por tanto en el AFC. Observemos que si en ACP, en general, los pesos de todos los elementos son Jguales, este no es el caso en el AFC; ahora bien, éstos pesos intervienen en la conteibucién de un punto a la inercia de un ee En AFC, como en ACP, se utiliza casi sistemdticamente la técnica de los elementos suplementarios, que consiste en proyectar sobre los ejes factoriales los perfiles de filas © de columnas que no intervienen en el efleulo de estos ejes. Una fila suplementaria esta “4 relacionad columna s Estos elem dimensién del bariee 2.9 Resumim (cf. Figu 1. Lo de variab 2. Es {fifiel By: estudiar tablas. U disteibuc 5. U TE direccio sobre es -llanad proyect alargan respect ja tabla aleular srimeros sbtenida bla, con ada una objetivo da tabla no de la men- 0 por un 1 el ACP or tanto tribucién lementos de filas 0 aria esti relacionada con las columns activas por la férmula barieéntrica, De la misma forma, una Columns suplementaria esté relacionada con las filas activas por la formula baricéntrica Gatos clementos sirven muy a menudo de ayuda a la interpretacién; en las tablas de gran Gimensién por ejemplo, es snuy préetico conocer la posicién y la calidad de representacion del baricentro de varias filas o de varias columnas. 2.9 Esquema general del AFC Resumimos los principales resultados de lo expuesto antesiormente en un esquema general (cf, Figura 21). Los nsimeros siguientes refiejan este esquema. 1. Los datos originales. Filas y columnas juegan papeles simétricos: son modalidades de variables, ‘2, Esta tabla intermediaria hace aparecer los datos bajo la forma de ley de probabilidad. (Uc/i ED) y (f3/5 € J} son las probabilidades marginales, By 4. Para estudiar las filas de In tabla, se las transforma en perfilesfilas. Para Jorma en perfiles-columna. Se dispone por tanto de dos estudiar las columnas, se las transf tablas, Un perfil se interpreta como una probabilidad condicionada. Bl perfil medio es In distribucidn marginal asociada a la tabla 2. +. Un perfilfilaes un conjunto de J mimeros y puede ser representado por tn punto de Ri. La nube N; de perfilesfilas, pertenece al hiperplano H, de vectores cuya suma de las componentes vale 1. Cad perfilfila i esté afectado del peso f,; 18 nube Ny asf ponderadn (ene por baricentzo el perfil medio Gy. En la nube 1, interesa la semejanza entre los perfiles medida a través de la distancia x7. 6. La representacién de los perfiles-columnas en R’ requiere unos comentarios estric tamente anélogos a los de la representacién de los perfiles -filas en R? ‘7. Bl Anélisis Factorial (AF) de una nube consiste en poner de manifiesto una serie de direeciones ortogonales tales que la inereia, con respecto a O, de la proyeccién de la nube cbne estas direceiones sea maxima. Aplicado a N7, el AF produce una primera direccién ‘Iamada trivial: que une O a G ¥ es ortogonal a Hy. Paralas direeciones siguientes, Gy se proyecta en el origen de los ejes: estas direcciones siguientes son las direcciones de maximo Elagamiento de NV. Es por tanto equivalente realizar el andlisis eon respecto a Q 0 con respecto a Gy

You might also like