You are on page 1of 2

39 6A 99 D CD 52 4C 3F 9E 31

39 6A1 199 6D9 9CD 52F F4C 3FB B9E 311 1E4D
6 6
96 A19 996 D9C CD5 52F4 4C3 3FB 9E3 311E E4D 8D
A1 96 D9 D 2F C FB 9E 11 4D 8D 3D
A1 996 D9 CD 52F 4C 3FB 9E 311 E4D 8D 3D 396
9 C 5 4 3 3 E 3 A
19 96DD9C D5 2F4 C3F FB9 9E31 11E 4D8 8D3 3D3 96A 199
96 9C D5 2F C3 B E3 1E 4D D D3 96 19 6D
99 D9 D 2 4C FB 9E 11 4 8D 3D 9 A1 96 9
6 F D 6
16-May-19

96 D9C CD5 52F 4C3 3FB 9E3 311E E4D 8D 3D3 396 A19 996DD9C CD5
Intelligence

D9 D 2F 4C FB 9E 11 4 8D 3D 96 A1 96 9 D 2F
D9 CD 52F 4C 3FB 9E 311 E4 D8D 3D 396 A1 996 D9 CD 52F 4C
C 5 3 3 E D 3 9 D C 5 4 3

69039
9C D5 2F4 4C3 FB9 9E3 11E 4D 8D3 3D3 96AA19 96D 9C D52 2F4 C3F FB9
2 F 1 8 9 9 D C E
CDD52 F4C C3F B9E E31 1E4 4D8 D3DD39 6A1 199 6D9 9CD 52F F4C 3FB B9E 311
F B 1 D D 6 6 C 5 3 3 E

clusters
D5 52F4 4C3 3FB 9E3 311E E4D 8D 3D3 396AA19 996DD9C D5 2F4 4C3 FB9 9E3 11E 4D
69039

2F C3 FB 9E3 11 4D 8D 3D 96 19 96 9C D5 2F4 C3 FB E3 11E 4D 8D


4C FB 9E 11 E4 8D 3D 39 A1 96 D9 D 2F C FB 9E 11 4D 8D 3D
3F 9E 31 E4 D8 3D 39 6A 99 D9 CD 52 4C 3FB 9E 311 E4 8D 3D 39
B9 31 1E D D3 3 6A 19 6D C 52 F4 3F 9 31 E4 D8 3 39 6A
E3 1E 4D 8D D3 96A 19 96D 9C D5 F4 C3 B9 E3 1E D D3 D3 6A 19
11 4D 8D 3D 96 1 96 9C D5 2F C3 FB E3 11E 4D 8D D3 96 19 96D

association rules.
E4 8 3D 39 A1 99 D9 D 2F 4C FB 9E 11 4 8D 3D 96 A1 96 9

Confusion Matrix
D8 D3 39 6A 99 6D CD 52 4C 3F 9E 31 E4 D8 3D 39 A 99 D9 CD
D3 D3 6A 19 6D 9C 52 F4 3F B9 31 1E D8 D3 39 6A 199 6D CD 52
D3 96A 19 96D 9C D5 F4 C3 B9 E3 1E 4D D3 D3 6A 19 6D 9C 52 F4

F
E
B

D
C
A
96 19 96 9C D5 2F4 C3 FB E3 11E 4D 8D D3 96A 19 96D 9C D5 F4 C3F

No
Yes
A1 96 D9 D 2F C FB 9E 11 4D 8D 3D 96 1 96 9 D 2F C3 B

Total
99 D9 CD 52 4C 3FB 9E 311 E4 8D 3D 39 A1 996 D9 CD 52F 4C FB 9E

Classes
Cancer
6D C 52 F4 3F 9 31 E D8 3 39 6A 99 D CD 52 4C 3F 9E 31
9C D5 F4 C3 B9 E3 1E 4D D3 D3 6A 19 6D 9C 52 F4 3F B9 31 1E4
D5 2F4 C3 FB E3 11E 4D 8D D3 96A 19 96D 9C D5 F4 C3 B9 E3 1E D
NB: 1. Question no. 1 is compulsory.

2F C3 FB 9E3 11 4D 8D 3D 96 19 96 9C D5 2F4 C3 FB E3 11E 4D 8D


4C FB 9E 11 E4 8D 3D 39 A1 96 D9 D 2F C FB 9E 11 4D 8D 3D
3F 9E 31 E4 D8 3D 39 6A 99 D9 CD 52 4C 3FB 9E 311 E4 8D 3D 39
B9 31 1E D D3 3 6A 19 6D C 52 F4 3F 9 31 E4 D8 3 39 6A
E3 1E 4D 8D D3 96A 19 96D 9C D5 F4 C3 B9 E3 1E D D3 D3 6A 19

900
800
700
600
500
400
300
200
100
Tid
(d) What is noisy data? How to handle it?
11 4D 8D 3D 96 1 96 9C D5 2F C3 FB E3 11E 4D 8D D3 96 19 96D

3
4
3
5
1
X

1.5
E4 8 3D 39 A1 99 D9 D 2F 4C FB 9E 11 4 8D 3D 96 A1 96 9

and draw dendrogram for the given data.


D8 D3 39 6A 99 6D CD 52 4C 3F 9E 31 E4 D8 3D 39 A 99 D9 CD

(c) What are the major issues in data mining?


90 210

D3 D3 6A 19 6D 9C 52 F4 3F B9 31 1E D8 D3 39 6A 199 6D CD 52
3. Assume data, if missing, with justification.

D3 96A 19 96D 9C D5 F4 C3 B9 E3 1E 4D D3 D3 6A 19 6D 9C 52 F4
96 19 96 9C D5 2F4 C3 FB E3 11E 4D 8D D3 96A 19 96D 9C D5 F4 C3F
A1 96 D9 D 2F C FB 9E 11 4D 8D 3D 96 1 96 9 D 2F C3 B
(3 Hours)

99 D9 CD 52 4C 3FB 9E 311 E4 8D 3D 39 A1 996 D9 CD 52F 4C FB 9E


6D C 52 F4 3F 9 31 E D8 3 39 6A 99 D CD 52 4C 3F 9E 31

Page 1 of 2
300
2. Answer any three out of the remaining questions.

140 9560 9700

9C D5 F4 C3 B9 E3 1E 4D D3 D3 6A 19 6D 9C 52 F4 3F B9 31 1E4
Yes No Total

230 9770 10000

D5 2F4 C3 FB E3 11E 4D 8D D3 96A 19 96D 9C D5 F4 C3 B9 E3 1E D


2F C3 FB 9E3 11 4D 8D 3D 96 19 96 9C D5 2F4 C3 FB E3 11E 4D 8D

4
4
5
1
Y
4C FB 9E 11 E4 8D 3D 39 A1 96 D9 D 2F C FB 9E 11 4D 8D 3D

3.5
1.5
3F 9E 31 E4 D8 3D 39 6A 99 D9 CD 52 4C 3FB 9E 311 E4 8D 3D 39

1,3
1,5
3,5
2,5
B9 31 1E D D3 3 6A 19 6D C 52 F4 3F 9 31 E4 D8 3 39 6A

1,2,3
2,3,5
1,3,4
Items
E3 1E 4D 8D D3 96A 19 96D 9C D5 F4 C3 B9 E3 1E D D3 D3 6A 19

1,2,3,5
1,2,3,5
11 4D 8D 3D 96 1 96 9C D5 2F C3 FB E3 11E 4D 8D D3 96 19 96D

(b) Explain Regression. Explain linear regression with example.


E4 8 3D 39 A1 99 D9 D 2F 4C FB 9E 11 4 8D 3D 96 A1 96 9
D8 D3 39 6A 99 6D CD 52 4C 3F 9E 31 E4 D8 3D 39 A 99 D9 CD

4D8D3D396A1996D9CD52F4C3FB9E311E
D3 D3 6A 19 6D 9C 52 F4 3F B9 31 1E D8 D3 39 6A 199 6D CD 52
D3 96A 19 96D 9C D5 F4 C3 B9 E3 1E 4D D3 D3 6A 19 6D 9C 52 F4
96 19 96 9C D5 2F4 C3 FB E3 11E 4D 8D D3 96A 19 96D 9C D5 F4 C3F
A1 96 D9 D 2F C FB 9E 11 4D 8D 3D 96 1 96 9 D 2F C3 B
99 D9 CD 52 4C 3FB 9E 311 E4 8D 3D 39 A1 996 D9 CD 52F 4C FB 9E

(b) What is an outlier? Describe methods that are used for outlier analysis.
6D C 52 F4 3F 9 31 E D8 3 39 6A 99 D CD 52 4C 3F 9E 31
9C D5 F4 C3 B9 E3 1E 4D D3 D3 6A 19 6D 9C 52 F4 3F B9 31 1E4
D5 2F4 C3 FB E3 11E 4D 8D D3 96A 19 96D 9C D5 F4 C3 B9 E3 1E D
2F C3 FB 9E3 11 4D 8D 3D 96 19 96 9C D5 2F4 C3 FB E3 11E 4D 8D
4C FB 9E 11 E4 8D 3D 39 A1 96 D9 D 2F C FB 9E 11 4D 8D 3D
3F 9E 31 E4 D8 3D 39 6A 99 D9 CD 52 4C 3FB 9E 311 E4 8D 3D 39
B9 31 1E D D3 3 6A 19 6D C 52 F4 3F 9 31 E4 D8 3 39 6A
E3 1E 4D 8D D3 96A 19 96D 9C D5 F4 C3 B9 E3 1E D D3 D3 6A 19
Paper / Subject Code: 88982 / Data Mining and Business Intelligence

11 4D 8D 3D 96 1 96 9C D5 2F C3 FB E3 11E 4D 8D D3 96 19 96
E4 8 3D 39 A1 99 D9 D 2F 4C FB 9E 11 4 8D 3D 96 A1 96
D8 D3 39 6A 99 6D CD 52 4C 3F 9E 31 E4 D8 3D 39 A 99 D9
Q.2.(a) Consider the transaction database given in table below. Apply Apriori Algorithm with

D3 D3 6A 19 6D 9C 52 F4 3F B9 31 1E D8 D3 39 6A 199 6D
(b) Explain Confusion Matrix. Calculate Accuracy, Precision and Recall for the following

minimum support of 50% and confidence of 50%. Find all frequent itemsets and all the

D3 96A 19 96D 9C D5 F4 C3 B9 E3 1E 4D D3 D3 6A 19 6D 9C
96 19 96 9C D5 2F4 C3 FB E3 11E 4D 8D D3 96A 19 96D 9C
Q.1.(a) Apply K-means Algorithm to divide the given set of values {2,3,6,8,9,12,15,18,22} into 3

A1 96 D9 D 2F C FB 9E 11 4D 8D 3D 96 1 96 9 D

Q.3.(a) Suppose we have five objects with name A, B, C, D and E. Apply single linkage clustering
99 D9 CD 52 4C 3FB 9E 311 E4 8D 3D 39 A1 996 D9 CD
6D C 52 F4 3F 9 31 E D8 3 39 6A 99 D CD 5
9C D5 F4 C3 B9 E3 1E 4D D3 D3 6A 19 6D 9C 52
D5 2F4 C3 FB E3 11E 4D 8D D3 96A 19 96D 9C D5
2F C3 FB 9E3 11 4D 8D 3D 96 19 96 9C D5 2F4

[10]
[10]
[10]
[10]
[05]
[05]
[05]
[05]

4C FB 9E 11 E4 8D 3D 39 A1 96 D9 D 2F
3F 9E 31 E4 D8 3D 39 6A 99 D9 CD 52 4C
[Total Marks:80]

B9 31 1E D D3 3 6A 19 6D C 52 F4
E3 1E 4D 8D D3 96A 19 96D 9C D5 F4 C3
11 4D 8D 3D 96 1 96 9C D5 2F C3
E4 8 3D 39 A1 99 D9 D 2F 4C F
1T01226 - T.E. (INFORMATION TECHNOLOGY) (Sem VI) (Choice Based) / 88982 - Data Mining and Business

D8 D3 39 6A 99 6D CD 52 4C 3F
D D 1 6 9 F B
39 6A 99 D CD 52 4C 3F 9E 31
39 6A1 199 6D9 9CD 52F F4C 3FB B9E 311 1E4D
6 6
96 A19 996 D9C CD5 52F4 4C3 3FB 9E3 311E E4D 8D
A1 96 D9 D 2F C FB 9E 11 4D 8D 3D
A1 996 D9 CD 52F 4C 3FB 9E 311 E4D 8D 3D 396
9 C 5 4 3 3 E 3 A
19 96DD9C D5 2F4 C3F FB9 9E31 11E 4D8 8D3 3D3 96A 199
96 9C D5 2F C3 B E3 1E 4D D D3 96 19 6D
99 D9 D 2 4C FB 9E 11 4 8D 3D 9 A1 96 9
6 F D 6
96 D9C CD5 52F 4C3 3FB 9E3 311E E4D 8D 3D3 396 A19 996DD9C CD5
D9 D 2F 4C FB 9E 11 4 8D 3D 96 A1 96 9 D 2F
D9 CD 52F 4C 3FB 9E 311 E4 D8D 3D 396 A1 996 D9 CD 52F 4C
C 5 3 3 E D 3 9 D C 5 4 3

69039
9C D5 2F4 4C3 FB9 9E3 11E 4D 8D3 3D3 96AA19 96D 9C D52 2F4 C3F FB9
2 F 1 8 9 9 D C E
CDD52 F4C C3F B9E E31 1E4 4D8 D3DD39 6A1 199 6D9 9CD 52F F4C 3FB B9E 311
F B 1 D D 6 6 C 5 3 3 E
D5 52F4 4C3 3FB 9E3 311E E4D 8D 3D3 396AA19 996DD9C D5 2F4 4C3 FB9 9E3 11E 4D

No
No
No
No
No
No
2F C3 FB 9E3 11 4D 8D 3D 96 19 96 9C D5 2F4 C3 FB E3 11E 4D 8D

Yes
Yes
Yes
Yes
4C FB 9E 11 E4 8D 3D 39 A1 96 D9 D 2F C FB 9E 11 4D 8D 3D
3F 9E 31 E4 D8 3D 39 6A 99 D9 CD 52 4C 3FB 9E 311 E4 8D 3D 39
B9 31 1E D D3 3 6A 19 6D C 52 F4 3F 9 31 E4 D8 3 39 6A
E3 1E 4D 8D D3 96A 19 96D 9C D5 F4 C3 B9 E3 1E D D3 D3 6A 19
11 4D 8D 3D 96 1 96 9C D5 2F C3 FB E3 11E 4D 8D D3 96 19 96D
E4 8 3D 39 A1 99 D9 D 2F 4C FB 9E 11 4 8D 3D 96 A1 96 9

examples for each.


D8 D3 39 6A 99 6D CD 52 4C 3F 9E 31 E4 D8 3D 39 A 99 D9 CD
D3 D3 6A 19 6D 9C 52 F4 3F B9 31 1E D8 D3 39 6A 199 6D CD 52

(in increasing order):


D3 96A 19 96D 9C D5 F4 C3 B9 E3 1E 4D D3 D3 6A 19 6D 9C 52 F4
96 19 96 9C D5 2F4 C3 FB E3 11E 4D 8D D3 96A 19 96D 9C D5 F4 C3F
A1 96 D9 D 2F C FB 9E 11 4D 8D 3D 96 1 96 9 D 2F C3 B
99 D9 CD 52 4C 3FB 9E 311 E4 8D 3D 39 A1 996 D9 CD 52F 4C FB 9E
6D C 52 F4 3F 9 31 E D8 3 39 6A 99 D CD 52 4C 3F 9E 31

Single
Single
Single

9C D5 F4 C3 B9 E3 1E 4D D3 D3 6A 19 6D 9C 52 F4 3F B9 31 1E4

Married
Married
Married
Married
Married

Divorced
Divorced

v) Show box plot of the data.


D5 2F4 C3 FB E3 11E 4D 8D D3 96A 19 96D 9C D5 F4 C3 B9 E3 1E D

iii)What is mid-range of data?


2F C3 FB 9E3 11 4D 8D 3D 96 19 96 9C D5 2F4 C3 FB E3 11E 4D 8D
4C FB 9E 11 E4 8D 3D 39 A1 96 D9 D 2F C FB 9E 11 4D 8D 3D
3F 9E 31 E4 D8 3D 39 6A 99 D9 CD 52 4C 3FB 9E 311 E4 8D 3D 39
B9 31 1E D D3 3 6A 19 6D C 52 F4 3F 9 31 E4 D8 3 39 6A

(b) Explain Business Intelligence issues.


E3 1E 4D 8D D3 96A 19 96D 9C D5 F4 C3 B9 E3 1E D D3 D3 6A 19
11 4D 8D 3D 96 1 96 9C D5 2F C3 FB E3 11E 4D 8D D3 96 19 96D
E4 8 3D 39 A1 99 D9 D 2F 4C FB 9E 11 4 8D 3D 96 A1 96 9
D8 D3 39 6A 99 6D CD 52 4C 3F 9E 31 E4 D8 3D 39 A 99 D9 CD
D3 D3 6A 19 6D 9C 52 F4 3F B9 31 1E D8 D3 39 6A 199 6D CD 52
D3 96A 19 96D 9C D5 F4 C3 B9 E3 1E 4D D3 D3 6A 19 6D 9C 52 F4

iv) Give the five- point summary of the data.


96 19 96 9C D5 2F4 C3 FB E3 11E 4D 8D D3 96A 19 96D 9C D5 F4 C3F
A1 96 D9 D 2F C FB 9E 11 4D 8D 3D 96 1 96 9 D 2F C3 B

(b) Explain Market-Basket analysis with example.


99 D9 CD 52 4C 3FB 9E 311 E4 8D 3D 39 A1 996 D9 CD 52F 4C FB 9E
6D C 52 F4 3F 9 31 E D8 3 39 6A 99 D CD 52 4C 3F 9E 31

Page 2 of 2
2
3
3
2
4
2
4
5
4
3

9C D5 F4 C3 B9 E3 1E 4D D3 D3 6A 19 6D 9C 52 F4 3F B9 31 1E4

i) What is mean of data? What is median of data?


D5 2F4 C3 FB E3 11E 4D 8D D3 96A 19 96D 9C D5 F4 C3 B9 E3 1E D
2F C3 FB 9E3 11 4D 8D 3D 96 19 96 9C D5 2F4 C3 FB E3 11E 4D 8D
4C FB 9E 11 E4 8D 3D 39 A1 96 D9 D 2F C FB 9E 11 4D 8D 3D

ii) What is mode of data? Comment on data's modality.


3F 9E 31 E4 D8 3D 39 6A 99 D9 CD 52 4C 3FB 9E 311 E4 8D 3D 39

*************
B9 31 1E D D3 3 6A 19 6D C 52 F4 3F 9 31 E4 D8 3 39 6A

Q5. (a) What is data mining? Explain KDD process with diagram.
E3 1E 4D 8D D3 96A 19 96D 9C D5 F4 C3 B9 E3 1E D D3 D3 6A 19
11 4D 8D 3D 96 1 96 9C D5 2F C3 FB E3 11E 4D 8D D3 96 19 96D
E4 8 3D 39 A1 99 D9 D 2F 4C FB 9E 11 4 8D 3D 96 A1 96 9
Homeowner Marital Status Job experience (in years)
<Homeowner: No, Marital Status: Married, Job experience:3>

D8 D3 39 6A 99 6D CD 52 4C 3F 9E 31 E4 D8 3D 39 A 99 D9 CD

4D8D3D396A1996D9CD52F4C3FB9E311E
D3 D3 6A 19 6D 9C 52 F4 3F B9 31 1E D8 D3 39 6A 199 6D CD 52
D3 96A 19 96D 9C D5 F4 C3 B9 E3 1E 4D D3 D3 6A 19 6D 9C 52 F4
96 19 96 9C D5 2F4 C3 FB E3 11E 4D 8D D3 96A 19 96D 9C D5 F4 C3F
A1 96 D9 D 2F C FB 9E 11 4D 8D 3D 96 1 96 9 D 2F C3 B
99 D9 CD 52 4C 3FB 9E 311 E4 8D 3D 39 A1 996 D9 CD 52F 4C FB 9E
6D C 52 F4 3F 9 31 E D8 3 39 6A 99 D CD 52 4C 3F 9E 31
No
No
No
No
No
No
No

9C D5 F4 C3 B9 E3 1E 4D D3 D3 6A 19 6D 9C 52 F4 3F B9 31 1E4
Yes
Yes
Yes

D5 2F4 C3 FB E3 11E 4D 8D D3 96A 19 96D 9C D5 F4 C3 B9 E3 1E D


2F C3 FB 9E3 11 4D 8D 3D 96 19 96 9C D5 2F4 C3 FB E3 11E 4D 8D
Defaulted

4C FB 9E 11 E4 8D 3D 39 A1 96 D9 D 2F C FB 9E 11 4D 8D 3D
3F 9E 31 E4 D8 3D 39 6A 99 D9 CD 52 4C 3FB 9E 311 E4 8D 3D 39
B9 31 1E D D3 3 6A 19 6D C 52 F4 3F 9 31 E4 D8 3 39 6A
E3 1E 4D 8D D3 96A 19 96D 9C D5 F4 C3 B9 E3 1E D D3 D3 6A 19
Paper / Subject Code: 88982 / Data Mining and Business Intelligence

11 4D 8D 3D 96 1 96 9C D5 2F C3 FB E3 11E 4D 8D D3 96 19 96
E4 8 3D 39 A1 99 D9 D 2F 4C FB 9E 11 4 8D 3D 96 A1 96
13,15,16,16,19,20,20,21,22,22,25,25,25,25,30,33,33,35,35,35,35,36,40,45,46,52,70
D8 D3 39 6A 99 6D CD 52 4C 3F 9E 31 E4 D8 3D 39 A 99 D9
Q6. (a) What are multiple level and multidimensional association rules? Explain with suitable

D3 D3 6A 19 6D 9C 52 F4 3F B9 31 1E D8 D3 39 6A 199 6D
D3 96A 19 96D 9C D5 F4 C3 B9 E3 1E 4D D3 D3 6A 19 6D 9C
96 19 96 9C D5 2F4 C3 FB E3 11E 4D 8D D3 96A 19 96D 9C
A1 96 D9 D 2F C FB 9E 11 4D 8D 3D 96 1 96 9 D
Q4.(a) Using the given training dataset classify the following tuple using Naïve Bayes Algorithm:

99 D9 CD 52 4C 3FB 9E 311 E4 8D 3D 39 A1 996 D9 CD


6D C 52 F4 3F 9 31 E D8 3 39 6A 99 D CD 5
9C D5 F4 C3 B9 E3 1E 4D D3 D3 6A 19 6D 9C 52
D5 2F4 C3 FB E3 11E 4D 8D D3 96A 19 96D 9C D5
2F C3 FB 9E3 11 4D 8D 3D 96 19 96 9C D5 2F4
(b) Suppose that data for analysis includes the attribute age. The age values for data tuples are [10]
[10]
[10]
[10]
[10]
[10]

4C FB 9E 11 E4 8D 3D 39 A1 96 D9 D 2F
3F 9E 31 E4 D8 3D 39 6A 99 D9 CD 52 4C
B9 31 1E D D3 3 6A 19 6D C 52 F4
E3 1E 4D 8D D3 96A 19 96D 9C D5 F4 C3
11 4D 8D 3D 96 1 96 9C D5 2F C3
E4 8 3D 39 A1 99 D9 D 2F 4C F
D8 D3 39 6A 99 6D CD 52 4C 3F
D D 1 6 9 F B

You might also like