Professional Documents
Culture Documents
bài tập thực hành
bài tập thực hành
Bài 2:g thuật toán Apriori với ngưỡng min_support = 3, ta có bảng tần suất của từng mục và tậục:
Mục Tần suất
A 4
B 2
C 2
D 3
E 4
Tập hai mục Tần suất
{A,B} 2
{A,C} 1
{A,D} 3
{A,E} 3
{B,C} 1
{D,E} 2
Sau đó, loại bỏ các tập không đáp ứng ngưỡng min_support, ta có tập mục phổ biến sau:
Tập mục Tần suất
{A} 4
{B} 2
{C} 2
{D} 3
{E} 4
{A,D} 3
{A,E} 3
{D,E} 2
Do đó, tập mục phổ biến được xác định ở phần a là: {A}, {B}, {C}, {D}, {E}, {A,D}, {A,E}, {D,E}
b)
Tập luật kết hợp mạnh có độ tin cậy min_confidence = 0.5 là các luật có dạng X -> Y sao cho X và Y
cùng thuộc tập mục phổ biến ở phần a và độ tin cậy của luật này không thấp hơn ngưỡng
min_confidence = 0.5.
Sử dụng thuật toán tạo tập luật kết hợp mạnh trên tập dữ liệu giao dịch:
Luật Tần suất của X và Y Tần suất của X Độ tin cậy
{A} -> {D} 3 4 0.75
{A} -> {E} 3 4 0.75
{D} -> {A} 3 3 1.0
{D} -> {E} 2 3 0.67
Luật Tần suất của X và Y Tần suất của X Độ tin cậy
{E} -> {A} 3 4 0.75
{E} -> {D} 2 4 0.5
Loại bỏ các luật không đạt ngưỡng min_confidence = 0.5, ta có tập luật kết hợp mạnh sau:
Luật Tần suất của X và Y Tần suất của X Độ tin cậy
{A} -> {D} 3 4 0.75
{A} -> {E} 3 4 0.75
{D} -> {A} 3 3 1.0
{E} -> {A} 3 4 0.75