You are on page 1of 14

Universidad Nacional Agraria La Molina

Dpto. de Estadística e Informática


Estadística Aplicada a la Economía y los Negocios II Introducción
„ El AC es una técnica desarrollada por
Benzecri en 1973
„ El AC permite analizar variables nominales y
Unidad III ordinales que dan lugar a una tabla de
contingencia.
„ Cuando el análisis es de dos variables se

Análisis de Correspondencias denomina AC Simple.


„ Si el análisis es de tres o más variables se
denomina AC Múltiple.
„ Permite obtener mapas perceptuales.
Mg.
Mg. Jesú
Jesús Salinas Flores jsalinas@lamolina.edu.pe 2

Ejemplo de Aplicación Nº 1
Materiales y métodos
„ Se quiere determinar el posicionamiento
del mercado cervecero en los estudiantes
de la Universidad Nacional Agraria La ATRIBUTOS
MARCAS Sabor Precio Presentación Publicidad Calidad
Molina entre las edades de 18 a 28 años. Cristal
Pilsen
Cusqueña
Brahma
Barena
Dorada

3 4
Tabla de Datos Prueba de Independencia
H0: El atributo preferido es independiente de la
Atributo
Marca marca de cerveza
Sabor Precio Presentación Publicidad Calidad Total H1: El atributo preferido es dependiente de la
Cristal 32 5 14 49 23 123 marca de cerveza
Pilsen 22 28 25 31 17 123
Cusqueña 51 4 24 10 34 123
Brahma 9 61 12 33 8 123
Barena 15 29 34 40 5 123 Chi Square Sig.

Dorada 10 91 11 11 0 123
Total 139 218 120 174 87 738
332.527 .000a

5 6

Finalidad del ACS (Uriel, 2005)


Variable 2

CALIDAD A B C D E

Variable 1
1
Tabla de
SABOR PRECIO 2
3
4
contingencia

PRESENTACION
1 D
A

2 B

C 4

PUBLICIDAD 3 E

7 8
Metodologí
Metodología del Aná
Análisis de Correspondencias
(Pedret,
Pedret, 2000)
Definición del AC DISEÑO DEL ANÁLISIS
¿Cómo deben ser las variables?

„ Es un modo de representación gráfica de ¿En qué escala deben medirse?

las tablas de contingencia.


TRANSFORMACIÓN DE LA MATRIZ DE DATOS INICIALES
„ Dicho análisis trata de evidenciar en uno o EN TABLAS DE FRECUENCIAS CONDICIONADAS
varios gráficos la mayor cantidad posible
de información contenida en una tabla,
fijándose no en los valores absolutos, sino CÁLCULO DE LAS MATRICES DE DISTANCIAS

en las correspondencias entre las


características, es decir, en los valores OBTENCIÓN DE LOS EJES FACTORIALES

relativos
DETERMINACIÓN DEL NÚMERO DE EJES FACTORIALES A CONSERVAR

INTERPRETACIÓN DE RESULTADOS
9

Ejemplo de Aplicación Nº 2 (Renom, 1997) Tabla de Datos


„ Parte de una tabla de contingencia que
contiene dos variables, con sus diversas
modalidades, y cada casilla recoge la
frecuencia en que se presentan.
1 ........ j ..... p Total fila
1 k1.
.
.
i kij ki.
.
.
n kn.
Total columna k.1 k.j k.p k

kij Número de individuos/casos que poseen a la vez la modalidad “i”


de la primera variable y la modalidad “j” de la segunda variable
11 12
Consideraciones generales… …Consideraciones generales
„ El AC trata de determinar la posición
„ Lo que en AF se denomina autovalores en
que tienen los distintos niveles de las AC se denomina inercia.
variables y relacionarlos entre sí en „ La inercia va a determinar la cantidad de
unas coordenadas a las que información o variancia que conseguimos
denominamos dimensiones. explicar de las relaciones existentes entre
las variables.
„ Éstas dimensiones tienen mucha
similaridad con lo que en el análisis
factorial se denominaban factores.

13 14

…Consideraciones generales Ejemplo de Aplicación Nº 3 (Luque, 2000)

„ La inercia total va a ser igual al valor que „ Se pretende buscar la relación entre el
en las chi-cuadrado de las tablas de poder económico de la persona y la
contingencia dividido por el número total opinión que tiene sobre el sistema
de individuos. Esta inercia total va a ser sanitario público.
posteriormente repartida entre las distintas „ Se recogen para ello opiniones de 500
dimensiones. personas.
„ Si en el AF extraía factores, en AC se
„ En cuanto al nivel de renta se han
extraen dimensiones o componentes. El dividido a las personas entrevistadas en
número máximo de éstas será igual al cuatro niveles según distintos tramos de
mínimo del número de filas o del número renta.
de columnas menos uno.
15 16
Pertinencia del AC
Tabla de datos „ Se debe realizar previamente la prueba
chi-cuadrado de independencia
Opinión sobre el sistema
sanitario público Tabla de contingencia Nivel de Renta * Opinión sobre el sistema sanitario público

Opinión sobre el sistema sanitario


público
Nivel de renta Bueno Malo Regular Total Bueno Malo Regular Total
Bajo 75 40 35 150 Nivel de
Renta
Bajo Recuento
Frecuencia esperada
75 40 35 150
51.0 51.0 48.0 150.0
Medio 60 50 70 180 Medio Recuento 60 50 70 180
Frecuencia esperada 61.2 61.2 57.6 180.0
Alto 20 40 30 90 Alto Recuento 20 40 30 90

Muy Alto 15 40 25 80 Muy Alto


Frecuencia esperada
Recuento
30.6
15
30.6
40
28.8
25
90.0
80
Total 170 170 160 500 Frecuencia esperada 27.2 27.2 25.6 80.0
Total Recuento 170 170 160 500
Frecuencia esperada 170.0 170.0 160.0 500.0

17 18

Prueba chi-cuadrado de independencia

Pruebas de chi-cuadrado

Sig. asintótica
Valor gl (bilateral)
Chi-cuadrado de Pearson 40.049a 6 .000
Razón de verosimilitudes 39.693 6 .000
Asociación lineal por
14.525 1 .000
lineal
N de casos válidos 500
a. 0 casillas (.0%) tienen una frecuencia esperada inferior a 5.
La frecuencia mínima esperada es 25.60.
Datos – Ponderar casos…
casos…

19
22

Tabla de Datos Perfiles Fila


Tabla de correspondencias Perfiles de fila
Opinión sobre el sistema sanitario público Opinión sobre el sistema sanitario público
Nivel de Renta Bueno Malo Regular Margen activo Nivel de Renta Bueno Malo Regular Margen activo
Bajo 75 40 35 150 Bajo .500 .267 .233 1.000
Medio 60 50 70 180 Medio .333 .278 .389 1.000
Alto Alto .222 .444 .333 1.000
20 40 30 90
Muy Alto .188 .500 .313 1.000
Muy Alto 15 40 25 80
Masa .340 .340 .320
Margen activo 170 170 160 500

23 24
Perfiles Columna
Perfiles de columna
Resumen
Opinión sobre el sistema sanitario público
Confianza para el Valor
Nivel de Renta Bueno Malo Regular Masa Proporción de inercia propio

Bajo .441 .235 .219 .300 Desviación Correlación


Dimensión Valor propio Inercia Chi-cuadrado Sig. Explicada Acumulada típica 2
Medio .353 .294 .438 .360 1 .255 .065 .813 .813 .043 .078
Alto .118 .235 .188 .180 2 .122 .015 .187 1.000 .045
Total .080 40.049 .000a 1.000 1.000
Muy Alto .088 .235 .156 .160 a. 6 grados de libertad

Margen activo 1.000 1.000 1.000

25 26

Interpretación de los resultados… …Interpretación de los resultados


„ En la práctica suelen ser suficientes dos o „ Si dos filas (columnas) tienen una
tres componentes para estudiar la estructura semejante, su situación será
relación entre líneas y columnas. próxima sobre el plano (no siempre es
„ Es posible obtener una visión global cierto lo inverso; dependerá de la calidad
bastante buena si se representan de representación de los puntos).
simultáneamente los puntos fila y „ La situación cercana de un punto fila “i”
columna sobre el plano formado por los y un punto columna “j” sólo se puede
dos primeros componentes, que recoge la interpretar si están alejados del origen.
mayor cantidad de información. „ Cuando una línea tiene un perfil próximo
al perfil medio, tiene un comportamiento
medio, se encontrará próxima al origen.
27 28
Ayudas a la interpretación Interpretación de los componentes…
„ Contribución Absoluta (CA)
… Expresa la participación que tiene el elemento “i” en la inercia „ Se buscan aquellos puntos i (j) de mayor CA
explicada por el componente α.
… λα. es la inercia explicada por el componente α. „ Dentro de éstos se separan los puntos que
f i Fα2 (i) se proyectan del lado positivo de los que
CAα (i ) =
λα intervienen del lado negativo, que estarán
en oposición.
„ Contribución Relativa (CR)
… Recoge la participación del componente α en la explicación del
elemento “i”.
… Mide la calidad de representación de “i” sobre el eje α

Fα2 (i )
CR α (i ) =
d 2 (i, G )
, ∑
α
CR α (i) = 1
29 30

Examen de los puntos de filaa

…Interpretación de los componentes Puntuación en la


dimensión Contribución

Se estudia la calidad de representación CR


De los puntos a la
„ inercia de la
dimensión
De la dimensión a la inercia del
punto

de estos puntos. Si un punto tiene un CR Nivel de Renta


Bajo
Masa
.300
1
-.637
2
-.302
Inercia
.034
1
.477
2
.223
1
.903
2
.097
Total
1.000
Medio
pequeño es de suponer que tenga un papel
.360 -.053 .458 .009 .004 .616 .027 .973 1.000
Alto .180 .530 -.122 .013 .198 .022 .975 .025 1.000
Muy Alto .160 .716 -.326 .023 .322 .139 .909 .091 1.000

importante sobre otro eje, y para su Total activo 1.000


a. Normalización Simétrica
.080 1.000 1.000

estudio sería necesario considerar el


conjunto de los ejes. Examen de los puntos columnaa

Puntuación en la

„ Se buscan aquellos puntos i (j) que si bien dimensión


De los puntos a la
inercia de la
Contribución

De la dimensión a la inercia del

no contribuyen a la formación del factor, Opinión sobre el sistema


sanitario público Masa 1 2 Inercia 1
dimensión
2 1
punto
2 Total

si se encuentran bien representados (CR


Bueno .340 -.682 -.121 .041 .619 .041 .985 .015 1.000
Malo .340 .501 -.342 .027 .335 .325 .817 .183 1.000
Regular .320 .192 .493 .013 .046 .634 .240 .760 1.000

alto). Estos puntos son ilustrativos de la Total activo


a. Normalización Simétrica
1.000 .080 1.000 1.000

significación del eje. 31


Interpretación
Notación
Categorías Componente 1 Componente 2
Proporción, frecuencia de la
Masa Bajo CA ( - )
clase en el total de datos
Puntuació
Puntuación en la Coordenadas principales de las Medio CA ( + )
Dimensió
Dimensión filas (columnas)
Contribución de cada fila
Alto CR ( + )
Contribució
Contribución de los
puntos a la inercia de la
(columna) a la inercia del Muy Alto CA ( + )
componente.
dimensió
dimensión
Contribución Absoluta Bueno CA ( - )
Contribució
Contribución de la Contribución del componente a Malo CA ( + )
dimensió
dimensión a la inercia la inercia de la fila (columna).
del punto Contribución Relativa Regular CA ( + )
33 34

Mapa Perceptual
Ejemplo de Aplicación Nº 4
„ Se les pide a los encuestados que
marque con una cruz el atributo que
más identifica a cada supermercado

Atributos
Tiendas
Confiabilidad Sofisticación Amabilidad Competitividad Eficiencia Sinceridad Acogedor Tradición
Jumbo
Líder
Tiendas por dpto
Home Center
Easy
Home Depot
Grandes Ferreterías

36
Tabla de datos Perfiles Fila
Perfiles de fila
Tabla de correspondencias
Atributos
Atributos
Competiti
Competiti Tiendas Confiabilidad Sofisticación Amabilidad vidad Eficiencia Sinceridad Acogedor Tradición Margen activo
Tiendas Confiabilidad Sofisticación Amabilidad vidad Eficiencia Sinceridad Acogedor Tradición Margen activo Jumbo .198 .128 .113 .107 .138 .057 .116 .143 1.000
Jumbo 121 78 69 65 84 35 71 87 610
Líder .148 .088 .130 .278 .175 .051 .088 .042 1.000
Líder 49 29 43 92 58 17 29 14 331
Tiendas por dpto .169 .152 .090 .154 .107 .052 .114 .163 1.000
Tiendas por dpto 90 81 48 82 57 28 61 87 534
Home Center .184 .094 .120 .142 .167 .077 .091 .125 1.000
Home Center 119 61 78 92 108 50 59 81 648
Easy .183 .081 .171 .232 .159 .077 .057 .041 1.000
Easy 45 20 42 57 39 19 14 10 246
Home Depot .184 .094 .097 .289 .130 .079 .090 .036 1.000
Home Depot 51 26 27 80 36 22 25 10 277
Grandes Ferreterías .162 .071 .129 .091 .133 .116 .091 .207 1.000
Grandes Ferreterías 39 17 31 22 32 28 22 50 241
Masa .178 .108 .117 .170 .143 .069 .097 .117
Margen activo 514 312 338 490 414 199 281 339 2887

37 38

Perfiles Columna
Resumen

Perfiles de columna Confianza para el Valor


Proporción de inercia propio
Atributos
Competiti Correlación
Tiendas Confiabilidad Sofisticación Amabilidad vidad Eficiencia Sinceridad Acogedor Tradición Masa
Desviación
Jumbo .235 .250 .204 .133 .203 .176 .253 .257 .211 Dimensión Valor propio Inercia Chi-cuadrado Sig. Explicada Acumulada típica 2
Líder .095 .093 .127 .188 .140 .085 .103 .041 .115
1 .233 .054 .711 .711 .017 .004
Tiendas por dpto .175 .260 .142 .167 .138 .141 .217 .257 .185 2 .117 .014 .179 .891 .018
Home Center .232 .196 .231 .188 .261 .251 .210 .239 .224 3 .069 .005 .063 .953
Easy .088 .064 .124 .116 .094 .095 .050 .029 .085 4 .043 .002 .024 .978
Home Depot .099 .083 .080 .163 .087 .111 .089 .029 .096 5 .038 .001 .019 .997
Grandes Ferreterías .076 .054 .092 .045 .077 .141 .078 .147 .083 6 .016 .000 .003 1.000
Margen activo 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000
Total .076 219.953 .000a 1.000 1.000
a. 42 grados de libertad

39 40
Examen de los puntos de filaa

Puntuación en la
dimensión Contribución
De los puntos a la
inercia de la De la dimensión a la inercia del
dimensión punto
Tiendas Masa 1 2 Inercia 1 2 1 2 Total
Jumbo .211 -.369 .114 .009 .124 .024 .775 .037 .812
Líder .115 .750 .082 .016 .277 .007 .935 .006 .940
Tiendas por dpto .185 -.343 .495 .011 .093 .388 .457 .479 .936
Home Center .224 -.089 -.259 .003 .008 .129 .149 .639 .788
Easy .085 .638 -.365 .011 .149 .097 .767 .126 .893
Home Depot .096 .735 .208 .014 .223 .036 .847 .034 .881
Grandes Ferreterías .083 -.594 -.670 .013 .127 .321 .532 .340 .872
Total activo 1.000 .076 1.000 1.000
a. Normalización Simétrica

a
Examen de los puntos columna

Puntuación en la
dimensión Contribución
De los puntos a la
inercia de la De la dimensión a la inercia del
dimensión punto
Atributos Masa 1 2 Inercia 1 2 1 2 Total
Confiabilidad .178 -.052 -.005 .001 .002 .000 .084 .000 .084
Sofisticación .108 -.254 .612 .007 .030 .347 .242 .707 .949
Amabilidad .117 .148 -.392 .004 .011 .154 .154 .541 .694
Competitividad .170 .797 .225 .027 .463 .074 .923 .037 .960
Eficiencia .143 .163 -.280 .004 .016 .096 .236 .349 .585
Sinceridad .069 -.055 -.636 .005 .001 .238 .010 .677 .687
Acogedor .097 -.250 .328 .003 .026 .090 .465 .402 .868
Tradición .117 -.945 -.047 .025 .451 .002 .959 .001 .960
Total activo 1.000 .076 1.000 1.000
a. Normalización Simétrica 42

Ejemplo de Aplicación Nº 5
„ Se pretende buscar si existe una relación entre Tabla de Datos
los principales candidatos a la presidencia para
el periodo 2011-2016 y los atributos que más
identifican a estos. Tabla de correspondencias

Grado Atributo
Plan de Partido Cercanía de Candidato a la Plan de Partido Cercania Grado de
Candidatos Experiencia Liderazgo Simpatía Sexo Valores presidencia Gobierno Politico al Pueblo Experiencia Liderazgo instruccion Simpatia Sexo Valores Margen activo
Gobierno político al pueblo instruc
Lourdes Flores 23 10 3 7 7 12 7 28 3 100
ción Keyko Fujimori 1 37 29 3 5 3 18 4 0 100
Castañeda Locio 15 13 13 39 3 4 12 0 1 100
Loudes
Ollanta Humala 5 27 37 6 8 10 2 3 2 100
Flores
Alejandro Toledo 25 4 11 25 8 25 1 0 1 100
Keyko Mercedes Cabañillas 4 21 6 19 8 16 6 14 6 100
Fujimori Margen activo 73 112 99 99 39 70 46 49 13 600

Luis
Castañeda
Ollanta
Humala
Alejandro
Toledo
Mercedes
Cabañillas

43 44
Perfiles Fila Perfiles Columna

Perfiles de fila Perfiles de columna

Atributo Atributo
Candidato a la Plan de Partido Cercania Grado de Candidato a la Plan de Partido Cercania Grado de
presidencia Gobierno Politico al Pueblo Experiencia Liderazgo instruccion Simpatia Sexo Valores Margen activo presidencia Gobierno Politico al Pueblo Experiencia Liderazgo instruccion Simpatia Sexo Valores Masa
Lourdes Flores .230 .100 .030 .070 .070 .120 .070 .280 .030 1.000 Lourdes Flores .315 .089 .030 .071 .179 .171 .152 .571 .231 .167
Keyko Fujimori .010 .370 .290 .030 .050 .030 .180 .040 .000 1.000 Keyko Fujimori .014 .330 .293 .030 .128 .043 .391 .082 .000 .167
Castañeda Locio .150 .130 .130 .390 .030 .040 .120 .000 .010 1.000 Castañeda Locio .205 .116 .131 .394 .077 .057 .261 .000 .077 .167
Ollanta Humala .050 .270 .370 .060 .080 .100 .020 .030 .020 1.000 Ollanta Humala .068 .241 .374 .061 .205 .143 .043 .061 .154 .167
Alejandro Toledo .250 .040 .110 .250 .080 .250 .010 .000 .010 1.000 Alejandro Toledo .342 .036 .111 .253 .205 .357 .022 .000 .077 .167
Mercedes Cabañillas .040 .210 .060 .190 .080 .160 .060 .140 .060 1.000 Mercedes Cabañillas .055 .188 .061 .192 .205 .229 .130 .286 .462 .167
Masa .122 .187 .165 .165 .065 .117 .077 .082 .022 Margen activo 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000

45 46

Examen de los puntos de filaa


Resumen
Puntuación en la
Confianza para el Valor dimensión Contribución
Proporción de inercia propio De los puntos a la
inercia de la De la dimensión a la inercia del
Desviación Correlación Candidato a la dimensión punto
Dimensión Valor propio Inercia Chi-cuadrado Sig. Explicada Acumulada típica 2 presidencia Masa 1 2 Inercia 1 2 1 2 Total
1 .513 .263 .464 .464 .032 .140 Lourdes Flores .167 -.764 1.036 .131 .190 .436 .380 .560 .939
2 .410 .168 .297 .761 .033 Keyko Fujimori .167 1.130 .198 .123 .415 .016 .888 .022 .909
3 .283 .080 .141 .902 Castañeda Locio .167 -.175 -.871 .087 .010 .308 .030 .600 .630
4 .202 .041 .072 .974 Ollanta Humala .167 .766 -.026 .080 .191 .000 .625 .001 .626
5 .122 .015 .026 1.000 Alejandro Toledo .167 -.744 -.684 .102 .180 .190 .462 .313 .775
Total .567 340.220 .000a 1.000 1.000 Mercedes Cabañillas .167 -.214 .347 .044 .015 .049 .090 .190 .279
a. 40 grados de libertad Total activo 1.000 .567 1.000 1.000
a. Normalización Simétrica

47 48
Examen de los puntos columnaa

Puntuación en la
dimensión Contribución
De los puntos a la
inercia de la De la dimensión a la inercia del
dimensión punto
Atributo Masa 1 2 Inercia 1 2 1 2 Total
Plan de Gobierno .122 -.926 -.163 .073 .204 .008 .734 .018 .752
Partido Politico .187 .786 .222 .065 .225 .023 .902 .058 .960
Cercania al Pueblo .165 .928 -.218 .092 .277 .019 .791 .035 .826
Experiencia .165 -.529 -.906 .098 .090 .330 .242 .569 .811
Liderazgo .065 -.088 .170 .006 .001 .005 .046 .140 .187
Grado de instruccion .117 -.580 -.079 .048 .077 .002 .423 .006 .429
Simpatia .077 .526 .091 .045 .041 .002 .244 .006 .249
Sexo .082 -.699 1.720 .123 .078 .589 .166 .804 .969
Valores .022 -.444 .672 .018 .008 .024 .125 .229 .353
Total activo 1.000 .567 1.000 1.000
a. Normalización Simétrica

49 50

Consideraciones al ACS (Pedret, 2000)


„ El método se aplica a matrices de valores Adultos NSE A/B Auto Total
absolutos (obtenidas por simple conteo).
„ Es necesario que los márgenes de filas y Marca 1 25 35 10 70
columnas tengan un sentido; es decir, la
suma de cada fila y columna debe Marca 2 30 30 5 65

poderse interpretar. Marca 3 35 20 15 70


„ De no cumplirse, el análisis puede
realizarse, pero se corre el riesgo de que Marca 4 40 15 20 75

los resultados que se obtengan no Marca 5 25 10 15 50


reflejen la estructura del fenómeno que
se está analizando, sino que más bien Total 155 110 65 330
estén reflejando el método que hayamos
utilizado para recoger los datos 51
Bibliografía Bibliografía
1. Luque, Teodoro & otros. “Técnicas de 4. Pérez, César. “Técnicas de Análisis
análisis de datos en investigación de Multivariante de Datos”. Aplicaciones con
mercados”. Ediciones Pirámide. 2000. SPSS. Pearson Prentice Hall. 2004.
España España.
2. Pedret, Ramón & otros. “Herramientas 5. Renom Pinsach, Jordi. “Tratamiento
para segmentar mercados y posicionar informatizado de datos”. Editorial
productos: análisis de información Masson. 1997. España.
cuantitativa en investigación comercial”. 6. Uriel, Ezequiel & Aldas, Joaquín. “Análisis
Ediciones Deusto. 2000. España. Multivariante Aplicado. Aplicaciones al
marketing, investigación de mercados,
economía, dirección de empresas y
turismo”. Editorial Thomson. 2005.
53 España. 54

You might also like