ANALIZA CORESPONDENTELOR MULTIPLE

Analiza Corespondenţelor Multiple
Analiza corespondenţelor multiple conduce la găsirea unei soluţii în care cazurile din aceeaşi categorie sunt grupate împreună, iar instanţele din categorii diferite sunt grupate separat. Astfel, categoriile împart obiectele (cazurile) în subgrupe omogene. Variabilele sunt considerate a fi omogene atunci când clasifică obiectele din aceeaşi categorie în aceleaşi subgrupe. Pentru o soluţie unidimensională, analiza multiplă a corespondenţelor atribuie valori “optimal scale” (cuantificări ale categoriilor) fiecărei categorii a variabilei astfel încât, per ansamblu, în medie, categoriile să aibă împrăştiere maximă. Pentru o soluţie bidimensională, această analiză găseşte un al doilea set de cuantificări ale categoriilor fiecărei variabile, fără vreo legătură cu primul set, încercând din nou să determine o împrăştiere maximă şamd. Întrucât categoriile variabilei primesc atâtea scoruri câte dimensiuni are soluţia, variabilele din analiză sunt presupuse a fi nominale multiple la nivel de “optimal scaling”. De asemenea, analiza corespondenţelor multiple atribuie scoruri şi cazurilor astfel încât cuantificările categoriei reprezintă mediile (sau centroizii) scorurilor obiectelor din acea categorie. Analiza corespondenţelor multiple mai poartă denumirea de analiza omogenităţii sau dual scaling. Ea conduce la rezultate comparabile, dar nu identice celor de la analiza corespondenţelor cu două variabile. Analiza corespondenţelor determină un output unic care reproduce conformitatea şi calitatea reprezantării soluţiei. O altă diferenţă între cele două proceduri este aceea că datele de intrare pentru analiza corespondenţelor multiple sunt sub forma unei matrici în care rândurile reprezintă obiecte, iar coloanele sunt variabile; în cazul analizei corespondenţelor datele de intrare pot să fie sub forma aceleiaşi matrici, a unei matrici de proximitate sau a unui tabel de contingenţă, care este o matrice agregată în care rândurile şi coloanele reprezintă categorii ale variabilelor. Consideraţii asupra datelor. Valorile variabilelor nominale sunt întotdeauna convertite în numere întregi pozitive, crescător, în ordine alfanumerică. Prezumţii. Datele trebuie să conţină cel puţin trei cazuri valide. Analiza se bazează pe date întregi pozitive. Opţiunea de discretizare va acţiona automat asupra unei variabile cu valori fracţionale grupându-le în categorii cu o distribuţie apropiată de cea normală şi va converti valorile nominale în numere întregi pozitive. Se pot însă specifica şi alte scheme de discretizare.

1

Z-lighter pack low. soft pack. no menthol 72. iar după un anumit număr de dimensiuni volumul asociaţiilor suplimentare devine neglijabil. Un număr mai mic de dimensiuni este mai uşor de interpretat. Urmatorul tabel cuprinde variabilele analizate: Numele variabilei brand category flavor pack type price menthol length Eticheta brand category flavor pack type price menthol length Valori A. medium.B. rar se utilizează numărul maxim de dimensiuni. regular size full flavor. De obicei se utilizează soluţii cel mult tri-dimensionale. 73. 84. ultra lights hinge lid box. 2 . premium menthol.ANALIZA CORESPONDENTELOR MULTIPLE Pentru exemplificare am aplicat analiza corepondentelor multiple asupra unui set de date care contine informatii despre tigari. 100 Din meniul SPSS alegem Optimal Scaling. round corner box. Numărul maxim de dimensiuni este egal fie cu numărul categoriilor minus numărul variabilelor fără date missing. king size.C. lights. Analiza omogenităţii poate să determine câte o soluţie pentru mai multe dimensiuni. Totuşi. 85. super lights. fie cu numărul observaţiilor minus unu (se alege valoarea cea mai mică).D 100’s.

982 2. Mean Cronbach's Alpha is based on the mean Eigenvalue. Ideal ar fi ca obiectele din aceeaşi categorie să se situeze aproape unele de altele (adică ar trebui să aibă scoruri similare).886 . 3 . obiectele vor fi aproape de categoriile la care aparţin.1% în cea de-a doua.893 .501 2. Soluţia explică aproape toata varianţa din date astfel: 50.491 Dimension 1 2 Total Mean Cronbach's Alpha . Pentru fiecare variabilă în parte s-a realizat câte un grafic în care etichetele reprezintă valorile variabilei.801 . iar categoriile diferitelor variabile vor fi “vecine” dacă aparţin aceloraşi obiecte (adică.ANALIZA CORESPONDENTELOR MULTIPLE Model Summary Variance Accounted For Total (Eigenvalue) Inertia 3.784 .947 . respectiv 48.1% în prima dimensiune.793a a. Cele două dimensiuni împreună furnizează o interpretare în termeni de distanţe.481 5.007 . Dacă o variabilă discriminează bine. două obiecte care au scoruri similare pentru o variabilă ar trebui să se asocieze şi în raport cu alte variabile din soluţie).

Variable Principal Normalization. iar cea de-a doua dimensiune se afla in legatura cu variabila category. Pentru fiecare variabila se calculeaza niste masuri de discriminare care reprezinta varianta in acea dimensiune. 4 . Dimpotrivă. Acesta corespunde celei mai frecvente Cases Weighted by Weight variabilă.ANALIZA CORESPONDENTELOR MULTIPLE Object Points Labeled by BRAND A 0 B B C D D D Dimension 2 -5 C -10 C C C -2 0 2 4 6 8 10 Dimension 1 Distanţa unui obiect faţă de origine reflectă variaţia de la pattern-ul comun de răspuns. In continuare putem urmari cum se comporta variabilele in raport cu cele doua dimensiuni. Obiectele cu categorii pentru fiecare multe caracteristici care corespund celor mai frecvente categorii se regăsesc aproape de origine. Variabilele length si pack type au valori mari pentru ambele dimensiuni => indica o buna discriminare in ambele cazuri. prima dimensiune se gaseste in legatura cu variabila flavor. B si C de brandul D. Cea de-a doua dimensiune nu discrimineaza atat de bine brandurile. Asadar. deci nu au deloc putere de discriminare. obiectele cu caracteristici unice sunt localizate departe de origine. Analizand graficul de mai sus se poate observa ca prima dimensiune separa brandurile A. Variabilele menthol si price sunt situate aproape de origine.

ANALIZA CORESPONDENTELOR MULTIPLE Discrimination Measures 1.0 Dimension 1 Variable Principal Normalization.0 CATEGORY LENGTH PACK TYPE 0.4 0.2 0.8 FLAVOR 1.6 0.0 0.8 Dimension 2 0.4 0.0 PRICE MENTHOL 0.6 0. 5 .2 0.

ANALIZA CORESPONDENTELOR MULTIPLE Gradul de imprastiere a categoriilor pentru fiecare variabila reflecta varianta. respective cat de bine variabila este discriminata pe dimensiuni. 6 . De asemenea. Joint Plot of Category Points 2 CATEGORY LOW MEDIUM BOX 85 HINGESIZE KING LIGHTSLID 100 MENTHOL 0 ULTRA LIGHTS 84 FLAVOR LENGTH MENTHOL PACK TYPE PRICE 100'S SOFT NO MENTHOL PREMIUM FULL FLAVORPACK ROUND CORNER BOX SUPER LIGHTS -2 Dimension 2 -4 72 -6 -8 -10 REGULAR SIZE -12 73 Z-LIGHTER PACK -14 -2 0 2 4 6 8 10 Dimension 1 Variable Principal Normalization. o variabila ale carei categorii sunt mai indepartate are o putere de discriminare mai mare decat o variabila cu categorii apropiate.

Similar. Cases Weighted by Weight 7 .ANALIZA CORESPONDENTELOR MULTIPLE Graficul privind variabila length arata ca dimensiunea 2 separa obiectele cu lungime mica de cele cu lungime mare. se poate observa pe urmatoarele grafice modul in care se grupeaza obiectele in functie de categoriile fiecarei variabile. Object Points Labeled by LENGTH 85 85 0 85 85 84 84 84 Dimension 2 -5 72 -10 73 73 73 -2 0 2 4 6 8 10 Dimension 1 Variable Principal Normalization.

Cases Weighted by Weight 8 .ANALIZA CORESPONDENTELOR MULTIPLE Object Points Labeled by CATEGORY KING SIZE 0 KING SIZE KING SIZE KING SIZE KING SIZE KING SIZE Dimension 2 -5 REGULAR SIZE -10 REGULAR SIZE REGULAR SIZE -2 0 2 4 6 8 10 Dimension 1 Variable Principal Normalization.

Cases Weighted by Weight 9 .ANALIZA CORESPONDENTELOR MULTIPLE Object Points Labeled by PACK TYPE HINGE LID BOX 0 HINGE LID BOX ROUND CORNER BOX ROUND CORNER BOX Dimension 2 -5 HINGE LID BOX -10 Z-LIGHTER PACK Z-LIGHTER PACK -2 0 2 4 6 8 10 Dimension 1 Variable Principal Normalization.

Cases Weighted by Weight 10 .ANALIZA CORESPONDENTELOR MULTIPLE Object Points Labeled by FLAVOR FULL FLAVOR 0 FULL FLAVOR FULL FLAVOR ULTRA LIGHTS ULTRA LIGHTS ULTRA LIGHTS Dimension 2 -5 LIGHTS -10 FULL FLAVOR FULL FLAVOR -2 0 2 4 6 8 10 Dimension 1 Variable Principal Normalization.

Cases Weighted by Weight 11 .ANALIZA CORESPONDENTELOR MULTIPLE Asa cum am precizat deja. variabila price nu reuseste sa separe prea bine obiectele pe niciuna dintre dimensiuni. Object Points Labeled by PRICE LOW LOW MEDIUM 0 PREMIUM PREMIUM PREMIUM PREMIUM Dimension 2 -5 PREMIUM -10 PREMIUM PREMIUM -2 0 2 4 6 8 10 Dimension 1 Variable Principal Normalization.

Cases Weighted by Weight 12 .ANALIZA CORESPONDENTELOR MULTIPLE Aceeasi este si situatia variabilei menthol (asemenea variabilei price). Object Points Labeled by MENTHOL NO MENTHOL 0 NO MENTHOL NO MENTHOL NO MENTHOL NO MENTHOL Dimension 2 -5 NO MENTHOL -10 NO MENTHOL NO MENTHOL -2 0 2 4 6 8 10 Dimension 1 Variable Principal Normalization.