Professional Documents
Culture Documents
Multidimenzionalno skaliranje
Seminarski rad
1. Uvod
"There is no statistical tool that is as powerful as a well-chosen graph"
- Chambers, 1983
2. Multidimenzionalni postupci
U prirodnim situacijama postoji mnoštvo varijabli koje su međusobno povezane.
Govorimo o multidimenzionalnosti pojava, tj. o pojavama (događajima ili stanjima) koje
su opisane s velikim brojem varijabli. Pritom je svaka varijabla posebna manifestna
(mjerljiva) dimenzija. Primjereno je poželjeti te varijable (zbog dinamičkog ekvilibrija u
kojem se nalaze) analizirati sve zajedno (kao entitet u cjelini) i istovremeno, a ne jednu
po jednu ili par po par jer tako varijable bivaju izvučene iz njihovog realnog konteksta
(Kujundžić Tiljak i Ivanković, 2011). Manje je, dakle, prirodno razbijati cjelinu na
dijelove i promatrati ih neovisno od drugih varijabli. Analitičke postupke kojima
analiziramo više varijabli istovremeno nazivamo multivarijatnim ili multidimenzionalnim
analitičkim postupcima.
2. Matrica sličnosti
gdje je n broj sudionika, a q broj zavisnih varijabli. Dakle xij predstavlja vrijednost j-te
varijable i i-tog sudionika.
(X i Yi ) 2
D (X,Y) =
V1 V2 V3 Udaljenost
(D)
X 6 2 3
Y 4 2 5
X-Y 2 0 2
(X-Y)2 4 0 4 8 2.828
U prikazanoj formuli, dij predstavlja stvarnu udaljenost među točkama, a xij udaljenost
predviđenu MDS modelom. U svom originalnom radu o multidimenzionalnom
skaliranju, Kruskal (1964) iznosi da stress vrijednost manja od 0,2 znači dobro slaganje
podataka prikazanih MDS-om i stvarnih, promatranih podataka:
4. Shepard dijagram
Shepardov dijagram sučeljava transformirane udaljenosti na ordinati (y) s originalnim
sličnostima na apscisi (x).
Slika 1 Primjer Shepard dijagrama
5. Broj dimenzija
Općenito gledajući, što se više dimenzija koristi za reprodukciju stvarnih udaljenosti,
veća je korespondentnost stvarnih i transformiranih udaljenosti (i sukladno tome, manja
je stress funkcija). Međutim, cilj MDS-a je reducirati danu matricu podataka kako bi se
lakše donosili zaključci. Dakle, izbor dvije ili tri dimenzije optimalan je jer omogućava
vizualizaciju dijagrama što bitno pojednostavljuje interpretaciju. Uobičajeni način
odlučivanja koliko dimenzija uzeti naziva se scree test. Scree test je dijagram koji
sučeljava broj dimenzija s pripadajućim stress vrijednostima. Cilj je pronaći točku u kojoj
se blagi pad stress vrijednosti "izravnava", odnosno točku nakon koje se ne događa
značajan pad (metoda "lakta").
Stress vrijednost
Broj dimenzija
Izbor između udaljenosti i bliskosti nije od tolikog značaja u klaster analizi, dok je
u MDS-u udaljenost primarni koncept. To znači da iako se počne s matricom sličnosti ili
razlike, vjerojatno će se morati pretvoriti u matricu udaljenosti. Pravilnom primjenom i
dobrim razumijevanjem kako multidimenzionalnog skaliranja tako i klaster analize,
velika količina podatka se može lako obrađivati, i potom koristiti u razne svrhe. Od
marketinga, koji iziskuje obradu velikog broja podataka zbog targetiranja, pa sve do
medicine gdje je veoma važno imati prave klasifikacije i podatake o samim grupama
lijekova ili bolesti.
9. Primjer korištenja MDS-a u psihologijskim istraživanjima
10. Literatura
Klikom ''OK'' izbacuje se matrica udaljenosti (Slika 5). Tek na dobivenoj matrici se može
primijeniti multidimenzionlano skaliranje. Sljedeći korak jest označavanje dobivene
matrice udaljenosti te odabir u XLSTAT Analyzing data, Multidimenzional scaling
(MDS) (Slika 6).
Slika 8
Kako bi se dobila još bolja kvaliteta prikaza, koristili smo XLSTAT -3DPlot za prikaz
podataka u tri dimenzije. Za navedeno se trebaju odabrati podaci konfiguracije za tri
dimenzije i kliknuti Visualizing data/ XLSTAT-3DPlot (Slika 13). Kao što je moguće
vidjeti, čokoladice su u trodimenzionalnom prikazu prikazane različitim bojama. Da bi se
mogle raspoznati kojom su bojom koje čokoladice prikazane, potrebno je pogledati
tablicu konfiguracija na kojom smo napravili trodimenzionalni prikaz. Crvenom bojom je
označena čokoladica Milky way, žutom bojom Bounty, svijetlozelenom Twix,
tamnozelenom Snickers te plavom bojom Mars (Slika 13, Slika 14). Da bi se odredilo o
kojim se točno dimenzijama radi na temelju kojih su ispitanici razlikovali navedene
čokoladice potrebno bi bilo daljnje istraživanje te veće znanje o pojedinim čokoladicama
(koliki je udio kakaa, lješnjaka itd.).
Slika 13 Prikaz odabira trodimen<zionalnog prikaza
Slika 14 Trodimenzionalni prikaz za tri dimenzije