You are on page 1of 8

 Klaster analiza je multivarijaciona analiza koja

ima za cilj formiranje grupa elemenata uzorka


(ili obeležja) sličnih po vrednostima na
odgovarajućim obeležjima (ili na elementima
uzorka).
Sličnost se određuje na osnovu vrednosti
rastojanja između dve tačke .
A(x1,x2,...,xn)
B(y1,y2,...,yn)
 Čebiševljevo rastojanje
d Ch ( A, B) = max( xi − yi )

 Euklidsko rastojanje
d E ( A, B) = x −y
2
i i

 Manhattan (city-block) rastojanje


d CB ( A, B ) =  xi − yi
 Rastojanje Minkowskog
d M ( A, B) = x −y
p p
i i

 Mahalonubisovo rastojanje
d SqE ( A, B) =  xi − yi
2
 Metodi za određivanje rastojanja između klastera

metod prosečnih rastojanja (aritmetička sredina svih


rastojanja elemenata dva klastera)
metod najbližih suseda (rastojanje između dva njabliža
elementa koja pripadaju različitim klasterima)
metod najdaljih suseda (analogno)
metod centroida (rastojanje između centroida dva klastera;
centroid je tačka čije su koordinate aritmetičke sredine
koordinata svih tačaka jednog klastera)
 Dva algoritma:
hijerarhijski klaster
klaster k-sredina (k-mean)

 Hijerarhijski klaster
U početnom trenutku, svaki tačka je poseban klaster. U svakom koraku
se spajaju dva najbliža klastera. Spajanje traje dok se ne dostigne
željeni broj klastera ili dok klasteri koji se spajaju ne postanu suviše
daleki.
 Klaster k sredina
U početnom trenutku se bira k tačaka koje će predstavljati “centroide”.
Zatim se vrši grupisanje svih ostalih tačaka oko ovih k tačaka. Onda se
određuju pravi centroidi i opet se vrši grupisanje. Ovaj korak se
ponavlja dok ne prestanu da se dobijaju drugačiji klasteri.
 Hijerarhijski klaster

d <- dist(mydata, method = "euclidean") # distance matrix


fit <- hclust(d, method="ward")
plot(fit) # display dendogram
groups <- cutree(fit, k=5) # cut tree into 5 clusters
# draw dendogram with red borders around the 5 clusters
rect.hclust(fit, k=5, border="red")

method: "single", "complete", "average“, "centroid"


Klaster k sredina
fit <- kmeans(mydata, number_of_clusters)

You might also like