You are on page 1of 22
Capitulo 2 Anidlisis Factorial de Correspondencias 2.1 Los datos, las notaciones, la hipétesis de indepen- dencia En suo el Analisis Factorial de Correspondencias (AFC) fue concebido para estudia as tablas denominada blas de contingencia (o tablas ern: de tablas de ef obtenidos cruzando én de n in oustituida por un conjunto modalidades de dos variab pob juos. En el ejemplo comenta le individuos qu que ocupaban un empleo en 19) y su categoria de empleo Se habla indiferentemente de la modalidad i (por ejemplo el bachillerato) o de la clase te ndlividuos seen In modalidad i (por ejemplo alumnos de studio de una tabla de contingencia. Sin embar que In mayor ps s nociones introduc y los resultados s pueden ser an estrictamente de este tipo. El ea tratado en un capitulo pa El ‘dn de este capitulo da al diferentes de las tablas de contingenci so muy importan Anilisis de Corres ativa comple les, La de referencia sobre la aplic Modalidades de ls segunda variable Modalidades de 1a primera vanable Se Figura 12. La tabla de datos originales 1: Conjunto de filas y niimero de fas de estudios) J: conjumto de cohumnas y nimero de colunmas | (9 categorias de empleo) se: miomero de individuos que poseen ala ve= la ‘modalidad i de la primera variable ¥ la modal- dad j de (a segunda, (ed. que tienen el nivel de estudios i y que ocupan un empleo de la cate goriaj) E,E,ky = (niimero roral de individos) considera frecuentemente la tabla de frecuencias relativas F, obtenida dividiendo cada efectivo ky por el efectivo total n, Esta nueva tabla define una medida de probabilidad sobre el conjunto producto J x J. Sus marginales, o probabilidades marginales, tienen pos término general f, 0 f, (ef. Figura 13), t i 1 Matgnal Marginal a 013, La table P de fr ecuencias relativas y sus marginales Una tat mente, par todo iy pa Existe diferente dé contrario, § hipétesis dé La ind filas. En ef La cant 3, mientras modalidad modalidade variable co reeiproco ¢ marginal f aque las fa el punto de Observe Juegan un | ‘manera sob siguiente: Baiste i fies decir, end iidad dos variables eualitativas. Clisien- encia cuando para Una tabla de contingencia expresa la relacién ent mente, para una. medida de probabilidad, se dice que existe indepe! todo i y para todo j se cumple Ia igualdad: fy = Fibs Existe relacién entre las dos variables cuando en algunas casillas de la tabla fi es diferente del producto f, f;. Si fi; es superior a este producto, las modalidades iy j se asocian més que en la hipétesis de independencia: se dice que i y j se atraen. Por el contrario, si f,; es inferior al producto de las marginales, hipdtesis de independecia: se dice que existe una repulsion entre estas dos modalidades, yj se asocian menos que en la La independencia se expresa también considerando la tabla como un conjunto de filas. En efecto, la igualdad anterior es equivalente a la igualdad: fs fi La cantidad f, representa el porcentaje de la poblacién total que posee Ia modalidad j, mientras que 4i representa este mismo porcentaje en In subpoblacién 4 tmodalidad i Cusido existe independencia, las T subpoblaciones caracterizadas por Ins rodalidades é de In primera variable se reparten segin las J modalidades de la segund taviable con los mismos porcentajes. ‘Todas las Alas son entonces proporcionales. El reciproco et cierto: cuando todas laa flan son proporcionales, #on proporc Tharginel f, y lus dos variables son independientes. Existe, por tanto, relacién siempre aque las fad no sean todas proporcioneles a la marginal y cuando no sean idénticas desde al punto de vista de su asociacién con cl conjunto de colurnas posee la males a Ia Observemos, para terminar, que en una tabla de contingencia las filas y las columnas juegan un papel absolutamente simétrico y que la independencia se expresa de la m ‘manera sobre el conjunto de columnas. Las dos igualdades anteriores son equivalentes a la siguiente: fy Existe independencia cuando todos los porcentajes en columnas son iguales a la marginal cs decir, cttando las columnas son proporcionales. Existe relacién cuando no lo son, fi 2.2 Los objetivos Aunque Ia tabla estudiada sea de naturaleza muy diferente de la que se estudi6 en ACP, los objetivos del AFC se pueden expresar de manera totalmente anéloga a los del ACP: se intenta obtener tna tipologia de las fils, una tipologia de las columnas y relacionar estas dos tipologias entre si pero Ia nocién de semejanza entre dos filas, 0 entre dos eolumnas, es diferente de la del ACP. En una tabla de contingeneia, la semejanza entre dos filas, por una parte, y entre dos columnas, por otra parte, se expresa de manera totalmente simétrica. Dos filas se conside- ran prdximas si se asocian del mismo modo al conjunto de las colummnas, es decir, si ellas se asocian demasiado (0 demasiado poco) a las mismas columnas; considerando “demasiado” ¥ “demasiado poco” con sespecto a la situacién de independencia. Simétricamente, dos ‘olumnas estén proximas si se asocian del mismo modo al conjunto de las filas. Esquematicamente, el estudio del conjunto de las filas consiste en poner de manifiesto ‘una tipologia en la cual se busen: las filas euya distribucién se desvia més de la del conjunto de la poblacién, aquéllas que se asemejan entre si (en el sentido precisado anteriormente) y las que se oponen. Para relacionar la tipologia de las filas con el conjunto de las columnas, se caracteriza cada grupo de filas por las columnas a las que este grupo se asocia demasiado © demasiado poco, El estudio del conjunto de las columnas es totalmente andlogo. Esti claro que esta aproximaciéa, gracias a la nocién de semejanza utilizada, permite estudiar la relacién entre las dos variables, es decir, la desviacidn de la tabla de la hipstesis de independencia. El anélisis de esta relacién es el objetivo fundamental del AFC. ‘Una aproximacién, complementaria de Ia precedente, hace intervenir simultdneamente al conjunto de filas y al de columnas no dando privilegio ni a uno ni a otro. ‘Tomemos el ejemplo de la tabla que cruza las eategorias de empleo y los niveles de estudios. El conjunto de estudios esté ordenado por la duracién de los mismos, mientras que el de categorias de ‘empleo lo esté por el salario medio. La relacién entre estas dos ordenaciones, (um salario ‘levado corzesponde generalmente a un nivel de estudios superior), explica cléramente una buona parte de Ia relacidn entre empleos y estudios. Pero esta relacidn no se limita a este tinico aspecto; pueden existir otros fenémenos como la asociacién casi exclusiva de algunos estudios con ciertos empleos. El objetivo del AFC consiste en descomponer la relacién entre dos variables en una suma (o una superposicién) de tendencias simples interpretables como las que acaban de ser citadas y de medlir su importancia relativa, lo que permite ordenatlas Para terminar, es necesario sefialar que el AFC, como todo Anélisis Factorial, se u- tiliza también para reducir la dimensién de los datos conservando la mayor informacién 30 posible, Con discriminant 2.3 La En AFClat datos se tran La nueva fila objetivo que entre los por de dos filas| cfectivos ma centre las fil los efectivos El nim la categoria probabilida Debido namiento a 14.) re dos las se indo” e, dos ifiesto junto ate) y esis mente mos el njunto ins de salario teuna nita a iva de ner la ples iva, lo posible, Con vistas a un tratamiento estadistico ulterior (clasificacién, regresién, andlisis, diseriminente ...) 0 a una transmisién de informacién, 2.3 Las transformaciones de los datos en perfiles En AFC la tabla original no se analiza directamente. En el estudio de las filas, In tabla de atos se transforma dividiendo cada término fi; de la fila i por la marginal fi, de esta fila i a nueva fila se denomina perfil-fla (ef. Figura 14), Esta transformacién se desprende del objetivo que trata de estudiar la relacién entre las dos variables por medio de la desviacién ‘entre los porcentajes en filas, Se justifica también de manera directa ya que la comparacién de dos filas de la tabla original tiene el riesgo de estar influida principalmente por sus efectivos marginales. Asi, en la tabla. que cruza empleos y niveles de estudios, la diferencia ‘entze las filas “Bac Técnico” y “Bae General” expresa esencialmente una diferencia entre los efectivos globales de estos dos niveles de estudios. igura 14. Las nociones de perfl-fila y de perfil-colummna. El nvimero # vepresenta, en nuestro ejemplo, ta probabilidad de ocupar un empleo de la categoria j sabiendo que posee el nivel de estudios i. El perfil-fla i no es més que la probabilidad condicionada definida por i sobre el conjunto de eolumnas. Debido al papel simétrico jugado por las filas y las columnas, puede hacerse un razo namiento andlogo para las columnas, Ello lleva a la nocién de perfil-columna. (cf. Figura 4.)

You might also like