You are on page 1of 6

I 1

v

ii

Co n te n ts
P a ge

A UT H O R D E CL A R A T I ON B IO D A T A O F A U T H O R
ii

A C K N O W L E D GE M E NT
i ii
A B ST RA K

A B ST R A CT
V 11

M UL A K H KH A S A L BA HT H
Vl

CO N T E N T PA G E
v

L I ST O F T A B L ES
x

i ii
i

L I ST O F F I G U R E S
xv

A B B R EV I A T I O N
xx

ii

C H A PT E R I : I N T R O D U C T I ON
1 0 I n t r o du c t i o n
1 1 Pr o b l e m 1 2 Re se a r c h
s ta te m e n t

7

qu e s t i o n s

11
::

1 3 Ob j e c t i v e s
1 4 M o t i v a ti o n s

-1
1 5 Sc o p e
o

f t he

r e se a r c

h 12

1 6 Si g n i f i c a n c e

o f t he r e s e a r c h
o

13 14

1 7 O rg a n i z a t i o n
1 8 Su m
m ary

f t he

r e se a rc

h

C H A PT E R I I : L I T E R A T U R E R E V I E W
2 0 I n t r o du c t i o n
17 2 1An
o v e r v ie w o

f da ta

m in in g

17

2 2 D ata

m i n i n g m e t ho ds

20
20
s

2 2 1 C l a s s i f ic a t i o n
2 2 I I C l a s s i f ic a t i o n A l o r i t h m g
2 2 2 R e gr e s s i o n

20 23

2 2 3 C l u s te r in g

23
s

2 2 3 1 C l u s t e r i n g A l go r i t h m

24

Vi i i

2 3 Da t a

m i n i n g a ppl i c a t i o n

25
26 27

2 3 ] M e d ic a l
2 3 2 En g i n e e Dn g 2 3 3 Bu s i n e ss
an d

n

n ane c

29

2 3 4 Ed u c a t i o n a l 2 4 V i s u a l i z a t io n

33

36
38
46

2 5 V i s u a l i z a t i o n t e c hn i u e s q
2 6 V i s u a l da t a
2 7 Tree
m in in g

49
tr ee s

2 7 1 So m e T e r m i n o l o i e s a b o u t t h e g 2 7 2 Bi n a r y Se a r c h T r e e (B ST ) 2 7 2 I O pe r a t i o n s
on

50
51

B i n a r y Se a r c h T r æ (B SD

52
52

2 7 2 I I Se a r c h i n g

2 7 2 1 2 T he M a x im

u m an d

the M i n i m

um

53
54

2 7 2 1 3 In se r t io n
2 7 2 1 4 T he Su c c e s s o r
2 7 2 1 5 D e le t i o n
a n d the

Pr e de c e s s o r

54

2 7 3 Tra v ersai
2 7 4 Se l f - b a l a n c i n b i n a r g y 2 7 4 1 A V L tr e e
se ar c

56
h tree
57

57
on

2 7 4 1 1 O pe r a t i o n s

A V L tr e e

58

2 7 4 I 1 1 I n se r tio n 2 7 4 1 1 2 D e le t i o n 2 7 4 1 2 Ru n n in g Tim
es

58

6] 62
62 64

fo r A V L T r e e s

2 8 Tree 2 9 Su m

v i s u a li z a t i o n

m a ry

C H A PT E R 【 11: H I E R A R C H I C A L C L UST E R I NG A L G O R I T H M
3 0 I n t r o du c t io n
3 1 C l u s t e r i n g a l go r i t h m
s

65 66
s
s

3 2 H i e r a r c hi c a l Cl u s t e r i n g A l g o r i t h m

67
79

3 2 ] D e v e l o p m e n t o f h i e r a r c h i c a l c l u s t e Dn g a l o r i t h m g

3 2 1 1 A gg l o m

e r a tiv e

N e s t i n g ( A G N E S)

80

M

3 2 1 2 Dv h ; v c A 11N y s h i ( D I A N A )
3 2 1 3 B n l : 1i 1c c [ l h c m t i v c Rc d u c i n g
u s in g
iul

80 d C 1u S t c >i n g

l l i e i a r c hi c s ( B IRC I I )

8] 83
84

3 2 I 4 C l u s t e r i n g U s i n R E r e s e n t : t t i v c s (C U RE ) g p

3 2 I 5 C l I A M E I EO N
3 2 I 6 ROb u s t C l u s tc t i n g
u sin g

l i n K s ( RO C K )
o >

84

3 2 I 7 p c l I Dr n l : i n e c g u a r a n t e e s 3 3 Co
m pl e x i t y o

h i c 1:: i r c h i c l l l

cl ust erng

84
85
89

r h i e l a >c hi c a l

c l u s te r in g

3 4 Su n i n i m y

C H A PT E R 1v
4 0 I n tm d u c t i o n

:

R E SE A R C I I M 1 ( T 11O I ) O L O G Y 91
ew o rk

4 I R e s e a r c h pr o c e s s f r a m
4 1 1 Pr o c e s s s t e s p
o

f

r e se a rc

h pr o c e s s f r a m

ew ork

95

4 1 1 1 U n d e r s t a n d i n t he r o b l e m g p 4 1 1 2 B idir e c t io n a l
c l u s t e r in

95
hi e r a r c hi c a l

a gg l o m e r a t i v e

g

a l go r i th m

96
96

4 1 1 3 D a ta se t 4 1 1 4 D a ta
m i n i n g a lgo r i t hm

97 97 98
98

4 1 1 5 Ev a l u a tio n 4 1 1 6 K n o w le d e g
4 1 I 7 V i s u a l i z e t he k n o w l e d e g
4 1 1 8 E v a l u a t e t he i n te r a t e d g

98
99

4 2 Pr o p o s e d

c o n c e pt u a l an

fr a m

ew ork

4 3 O v e r a l l pha s e s

d

o b ec tiv e s w

j

i th

c o n c e pt u a l

fr am

ew o rk

10 ] 10 3

4 4 Su m

m ary

C H A PT E R v

:

D E V E L O PM E NT O F B I D I R EC T I O N A L

A G G L O M E R A T I V E H I E R A R C H I C A L C L U ST E R I N G A L G O RIT H M 5 0 I n tr o d u c t i o n 5 1 A gg l o m
e r a tiv e

10 4

hi e r a r c h i c a l c l u s t e r i n g
e r a tiv e

u sin

g s in gl e l in k

m e tho

d
m e tho

10 4

5 1 1 A ggl o m

h i e r a r c hi c a l

c l u ste r i n g u s in

g s i n gl e l i n k

d:
105

T he A l g o r i t h m

5 I 2 C o m pl e x i t y
l in k
m e t ho

o

f a ggl o m

c r a ti v c

hi c >a r c h i c a l c l u s t e r i n g

u s i n g s i n g le

d
c x a ni

10 6

5 I 2 I An

pl c

10 7

5 2 B i d i r e c t i o n a l a gg l o m
1Tre

c r a t iv e

hi e r a r c hi c a l c l u s t e r i n g

u s in g s in g le

lin k 12 5

t ho d

5 2 I B idi r c c t i o n a l

a gg l o m c r a t i v e

h ie r a r c h i c a l c l u s t e r i n g

u s in g s in gle

lin k

n l e tho

d: t 1 1c

a l go r i t h n i

126
cra

5 2 2 Co
lin k

m pl e x i t y o

f a gg l o m

tiv e

hi c e a r c h i c a l c l u s t e r i n g

u s in

g s i n g le
127

m c tho

d
exam

5 2 2 I An

p le

12 9

5 3 D isc u s s io n
5 4 Su m
m ary

13 7
138

C H A P T E R V 1: 1AI D 1R E C T I O N A L

A

GG L OM ERA T IV E

H 1E R A R C I l l C A L C L U ST E R 1N G A L G O R 1T H M P E R F O R M A N C E

E V A L I *A T I O N

6 0 I n t r o du c t i o n
6 1 B i di r e c t i o n a l
of

139

A gglo m

e r a tiv e

H ie r a r c hic a l
139

C lu s te r in g A 1 g o r i t h m Si m

u l a t io n

6 1 1 M a i n Pr o t o t e Pa e yp g

14 0
14 1

6 1 2 L o a d D a t a Pa e g
6 1 3 Si m i l a r i t y M e a s u r e
6 1 4 E x e c u t io n
an
o

an

d C l u s t e r i n g M e t h o d Pa g e
H ie r a r c hi c a l C l u s te r i n g A lgo r i t h m

14 3

f A gg l o m

e r a tiv e

d B i d i r e c t i o n a l A gg l o m

e r a tiv e

H i e r a r c hi c a l C l u s t e r i n g A l g o r. I t h m

14 5

6 2 B i d i r e c t i o n a ] A gg l o m
E v a l u a t io n

e r a t iv e

H i e r a r c hi c a l C l u s t e r i n A l o r i t h m g g
14 5

6 2 1 E x pe r i m 6 2 2 E x pe r im

e n ta

l Da ta

an

d En v iro n m

en t

14 6
14 9

e n ta l v a

l i da t io n
Pa r a m e t e r
e

6 2 2 1 Pe r f o r m

ance

14 9
15 0

6 2 2 I I Ex e c u tio n T im
6 2 2 1 2 N u m be r
o

f C l u st e r

158

6 3 D i sc u s s i o n
6 4 Su m
m ar

] 72
180

y

x

i

C H A P T E R V I I : E V A L U A T E V I S U A L B 1D I R E C T 1O N A L
A G G L O \ 1E R

T I V E H I E R A R C H I C A L C L U ST E R I N G A L G O R I T H M

W IT H A V L T REE

7 0 I n tr o d u c t i o n
7 1 V is u a l iz a t io n B idir e c t io n a l
o

18 1

f A gg l o m

e r ativ e

H i e r a r c hi c a l C l u s t e r i n g 18 2

A l go r i th m

7 2 Re su lt

o

f V i s u a l i z a t i o n Pr o t o t y p e E v a l u a t i o n

18 8

7 2 1 R e s p o n d e n t Pr o f i l e

18 9
o

7 2 2 U s a bi l i t y t e s t f o r V i s u a l i z a ti o n Pr o t o t e yp
A g gl o m
e r a tiv e

f B id i r e c t i o n a l

o

f
18 9 19 0

H i e r a r c hi c a l Cl ust e i n g A l g o r i t h m (B A H C A )

7 2 3 D ata

a n a lysis

7 2 3 1 D e sc r ipt iv e

a n a lys is

19 0

7 2 3 1 1 O v e r a l l Sa t i s f a c t i o n

19 3
o

7 2 3 1 1 1 Pe r c e i v e d

f U se f u ln e s s
o

19 3

7 2 3 1 1 2 Pe r c e i v e d E a s e

f U se

20 0
204
209 2 13

7 2 3 1 1 3 U s e r Sa ti s f a c t i o n 7 2 3 1 1 4 A t tr i bu t e
o

f U s a b il i t y

7 3 D is c u s s io n
7 4 Su m
m ary

2 14

C H A PT E R V I I I : C O N C L U S I O N 8 1 I n t r o d u c ti o n
8 2 T he
ac

2 16
e n ts o

hi e v e m
an

f t he

stu

dy

'

s o

bje c t i v e s

2 16 2 18 2 19

8 3 Co n s t r a i n ts

d lim i ta ti o n s

8 4 Co n tr ibu t io n

o

f s tu dy
w o rk

8 5 Rec o m

m en

da tio n s f o r f u t u r e
e r a t iv e

2 19
c l u ste r in

8 5 1 A gg l o m

h ie r ar c h i c a l

g da ta

m

i n i n g a l go r ith m

220

8 5 2 V is u a l iz a tio n 8 5 3M 8 6 Su m
m ary
e t ho

2 20
22 ] 22 ]

do l o g y