Professional Documents
Culture Documents
Transaction ID Items
T1 A, B, C
T2 A, B
T3 A, D, E
T4 E, D
T5 E, C
T6 A, D, E
a) Hãy áp dụng thuật toán Apriori để tìm ra tập mục phổ biến từ CSDL giao dịch
b) Xây dựng tập luật kết hợp mạnh từ tập luật phổ biến được xác định ở phần a.
c) Lập trình bằng ngôn ngữ python để giải quyết yêu cầu ý a và b.
d) Hãy áp dụng thuật toán Fp-Growth để tìm ra tập mục phổ biến từ CSDL giao
e) Xây dựng tập luật kết hợp mạnh từ tập luật phổ biến được xác định ở phần d.
f) Lập trình bằng ngôn ngữ python để giải quyết yêu cầu ý d và e.
Giải
a,
Ta có C1 = {A,B,C,D,E}
F1 = {A,D,E}
F2 = {DE}
b,
¿ (DEA ) 2
conf(DE -> A) = = = 66.66% vì chưa biết minconf nên k thể kết luận
¿ ( DE ) 3
¿ (DEA ) 2
conf(A -> DE) = = = 50% vì chưa biết minconf nên k thể kết luận
¿ ( A) 4
d,
Đầu tiên tìm các item mức 1 có sup. ≥ 3, và sắp xếp theo thứ tự giảm dần:
A 4
D 3
E 4
Tiếp theo sắp xếp các mục phổ biến mức 1 vừa tìm được theo thứ tự giảm dần trong mỗi giao dịch:
T1 A, B, C A
T2 A, B A
T3 A, D, E A, E, D
T4 E, D E, D
T5 E, C E
T6 A, D, E A, E, D
Duyệt các Items phổ biến của mỗi giao dịch để xây dựng FP-Tree:
a) Hãy áp dụng thuật toán phân cụm K-Means để phân tập điểm trên thành 2
b) Lập trình bằng ngôn ngữ python để giải quyết yêu cầu ý a.
c) Hãy áp dụng thuật toán phân cụm K-Means để phân 9 điểm trên thành 3
d) Lập trình bằng ngôn ngữ python để giải quyết yêu cầu ý c.
Giải
a, Có C1 = (3,1), C2 = (8,4)
b,
c, chọn 3 tâm cụm ban đầu: C1 = P2 = (3,1), C2 = P5 = (12,4), C3 = P8 = (8,4).