You are on page 1of 5

Bài 1: Cho cơ sở dữ liệu giao dịch sau:

Transaction ID Items

T1 A, B, C

T2 A, B

T3 A, D, E

T4 E, D

T5 E, C

T6 A, D, E

a) Hãy áp dụng thuật toán Apriori để tìm ra tập mục phổ biến từ CSDL giao dịch

trên, với ngưỡng min_support = 3

b) Xây dựng tập luật kết hợp mạnh từ tập luật phổ biến được xác định ở phần a.

c) Lập trình bằng ngôn ngữ python để giải quyết yêu cầu ý a và b.

d) Hãy áp dụng thuật toán Fp-Growth để tìm ra tập mục phổ biến từ CSDL giao

dịch trên, với ngưỡng min_support = 3

e) Xây dựng tập luật kết hợp mạnh từ tập luật phổ biến được xác định ở phần d.

f) Lập trình bằng ngôn ngữ python để giải quyết yêu cầu ý d và e.

Giải

a,

Ta có C1 = {A,B,C,D,E}

Sup(A) = 4, Sup(B) = 2 (loại), Sup(C) = 2 (loại), Sup(D) = 3, Sup(E) = 4

 F1 = {A,D,E}

Có C2 = {AD, AE, DE)}

Sup(AD) = 2 (loại), Sup(AE) = 2 (loại), Sup(DE) = 3

 F2 = {DE}

=>Tập phổ biến là X = {A, D, E, DE}

b,

¿ ⁡(DEA ) 2
conf(DE -> A) = = = 66.66% vì chưa biết minconf nên k thể kết luận
¿ ⁡( DE ) 3
¿ ⁡(DEA ) 2
conf(A -> DE) = = = 50% vì chưa biết minconf nên k thể kết luận
¿ ⁡( A) 4

d,

Đầu tiên tìm các item mức 1 có sup. ≥ 3, và sắp xếp theo thứ tự giảm dần:

A 4
D 3
E 4

Tiếp theo sắp xếp các mục phổ biến mức 1 vừa tìm được theo thứ tự giảm dần trong mỗi giao dịch:

T1 A, B, C A
T2 A, B A
T3 A, D, E A, E, D
T4 E, D E, D
T5 E, C E
T6 A, D, E A, E, D

Duyệt các Items phổ biến của mỗi giao dịch để xây dựng FP-Tree:

Item Cơ sở mẫu FP-Tree điều kiện Các mẫu phổ biến


D {AE:2, E:1} {E:3}-D D, DE
E {A:2} Ø E
A Ø Ø A
Bài 2: Cho tập dữ liệu đầu vào gồm 9 điểm như sau:

a) Hãy áp dụng thuật toán phân cụm K-Means để phân tập điểm trên thành 2

cụm, trong đó:

+ Cho trước 2 tâm cụm ban đầu: C1 = P2 = (3,1), C2 = P8 = (8,4).

+ Sử dụng độ đo Euclid để tính khoảng cách giữa các điểm

b) Lập trình bằng ngôn ngữ python để giải quyết yêu cầu ý a.

c) Hãy áp dụng thuật toán phân cụm K-Means để phân 9 điểm trên thành 3

cụm, trong đó:

+ Tâm cụm được chọn bất kỳ (sinh viên tùy chọn)

+ Sử dụng độ đo Euclid để tính khoảng cách giữa các điểm.

d) Lập trình bằng ngôn ngữ python để giải quyết yêu cầu ý c.

Giải
a, Có C1 = (3,1), C2 = (8,4)

d(P1,C1) = √ 5, d(P1,C2) = √ 37 => P1 thuộc cụm 1

d(P3,C1) = 1, d(P3,C2) = 2 √5 => P3 thuộc cụm 1

d(P4,C1) = 4 √5 , d(P4,C2) = √ 10 => P4 thuộc cụm 2

d(P5,C1) = 3 √ 10, d(P5,C2) = 4 => P5 thuộc cụm 2

d(P6,C1) = √ 106, d(P6,C2) = 2 √ 5 => P6 thuộc cụm 2

d(P7,C1) = 4 √ 2 , d(P7,C2) = √ 2 => P7 thuộc cụm 2

d(P9,C1) = 5 √ 2, d(P9,C2) = 2 => P9 thuộc cụm 2

 Trọng tâm cụm C1 = (3, 2)


29
 Trọng tâm cụm C2 = ( , 5)
3

d(P1,C1) = √ 2, d(P1,C2) = 7.9 => P1 thuộc cụm 1

d(P2,C1) = 1, d(P2,C2) = 7.8 => P2 thuộc cụm 1

d(P3,C1) = 1, d(P3,C2) = 6.4=> P3 thuộc cụm 1

d(P4,C1) = √ 73, d(P4,C2) = 4/3 => P4 thuộc cụm 2

d(P5,C1) = √ 85, d(P5,C2) = 2.5 => P5 thuộc cụm 2

d(P6,C1) = √ 97 , d(P6,C2) = 2.5 => P6 thuộc cụm 2

d(P7,C1) = 5, d(P7,C2) = 8/3 => P7 thuộc cụm 2

d(P8,C1) = √ 29, d(P8,C2) = 1.9 => P8 thuộc cụm 2

d(P9,C1) = √ 41, d(P9,C2) = 1.9 => P9 thuộc cụm 2

 Trọng tâm cụm C1 = (3, 2)


29
 Trọng tâm cụm C2 = ( , 5)
3

b,
c, chọn 3 tâm cụm ban đầu: C1 = P2 = (3,1), C2 = P5 = (12,4), C3 = P8 = (8,4).

d(P1,C1) = √ 5, d(P1,C2) = √ 101, d(P1,C3) = √ 37 => P1 thuộc cụm 1

d(P3,C1) = 1, d(P1,C2) = 3 √ 10, d(P3,C3) = 2 √ 5 => P3 thuộc cụm 1

d(P4,C1) = 4 √5 , d(P1,C2) = √ 2, d(P4,C3) = √ 10 => P4 thuộc cụm 2

d(P6,C1) = √ 106, d(P1,C2) = 2, d(P6,C3) = 2 √ 5 => P6 thuộc cụm 2

d(P7,C1) = 4 √ 2 , d(P1,C2) = √ 26, d(P7,C3) = √ 2 => P7 thuộc cụm 3

d(P9,C1) = 5 √ 2, d(P1,C2) =2 √5 , d(P9,C3) = 2 => P9 thuộc cụm 3

 Trọng tâm cụm C1 = (3,2)


35
 Trọng tâm cụm C2 = ( ,5)
3
23
 Trọng tâm cụm C3 = ( ,5)
3

d(P1,C1) = √ 2, d(P1,C2) = 9.9, d(P1,C3) = 6 => P1 thuộc cụm 1

d(P2,C1) = 1, d(P1,C2) = 9.5, d(P2,C3) = 6.1 => P2 thuộc cụm 1

d(P3,C1) = 1, d(P1,C2) = 8.2, d(P3,C3) = 4.7=> P3 thuộc cụm 1

d(P4,C1) = √ 73, d(P1,C2) = 2/3, d(P4,C3) = 10/3 => P4 thuộc cụm 2

d(P5,C1) = √ 85, d(P1,C2) = 1.1, d(P5,C3) = 4.4 => P5 thuộc cụm 2

d(P6,C1) = √ 97 , d(P1,C2) = 1.1, d(P6,C3) = 4.4 => P6 thuộc cụm 2

d(P7,C1) = 5, d(P1,C2) = 14/3, d(P7,C3) = 2/3 => P7 thuộc cụm 3

d(P8,C1) = √ 29, d(P1,C2) = 3.8, d(P8,C3) = 1.1 => P8 thuộc cụm 3

d(P9,C1) = √ 41, d(P1,C2) = 3.8, d(P9,C3) = 1.1 => P9 thuộc cụm 3

 Trọng tâm cụm C1 = (3,2)


35
 Trọng tâm cụm C2 = ( ,5)
3
23
 Trọng tâm cụm C3 = ( ,5)
3

You might also like