You are on page 1of 4

Bài 1:

a) Sử dụng thuật toán Apriori để tìm các tập phổ biến:


 Bước 1: Tạo bảng đếm 1-itemset:
Item Count
a 4
b 3
c 3
d 4
e 3
 Bước 2: Tạo các 2-itemset từ 1-itemset để tìm frequent 2-itemset:
Itemset Count
ac 3
ad 4
ae 2
bc 2
bd 2
cd 2
de 3
 Bước 3: Tạo các 3-itemset từ 2-itemset để tìm frequent 3-itemset:
Itemset Count
acd 2
ade 1
bcd 1
bde 2
 Bước 4: Tạo các 4-itemset từ 3-itemset để tìm frequent 4-itemset:
Không có frequent 4-itemset
 Vậy các frequent itemset với ngưỡng minsupp=0.3 là: {a}, {b}, {c}, {d}, {e}, {ad}, {ac}, {de}, {ae}, {bd},
{cd}, {bde}, {acd}.
b) Tìm các luật kết hợp từ tập frequent itemset với ngưỡng minconf=1.0:
 Từ frequent itemset ta tạo được các luật sau với min_conf=1.0:
{a} -> {d}
{d} -> {a}
{c} -> {a}
{d} -> {e}
{e} -> {d}
{b} -> {d}
{d} -> {b}
{b} -> {e}
{e} -> {b}
{c} -> {d}
{d} -> {c}
{b, d} -> {e}
{e, b} -> {d}
{a, d} -> {c}
{d, c} -> {a}
{a, c} -> {d}
{d, a} -> {c}
{a, c} -> {d}
{c, a} -> {d}
{c, d} -> {a}
{d, c} -> {a}
{a, d} -> {e}
{d, e} -> {a}
{a, e} -> {d}
{d, a} -> {e}
{a, e} -> {d}
{e, a} -> {d}
{e, d} -> {a}
{d, e} -> {a}
{b, e} -> {d}
{e, d} -> {b}
{d, b} -> {e}
{d, e} -> {b}
{e, b} -> {d}
{b, d} -> {e}
{a, c, d} -> {e}
{c, d, e} -> {a}
{d, e, a} -> {c}
{a, d, c} -> {e}
{c, a, e} -> {d}
{a, e, d} -> {c}
{a, b, d} -> {e}
{b, d, e} -> {a}
{d, e, a} -> {b}
{a, d, b} -> {e}
{b, a, e} -> {d}
{a, e, d} -> {b}
{a, e, b} -> {d}
{b, e, d} -> {a}
{e, d, a} -> {b}
{a, d, e} -> {b}
{d, e, b} -> {a}
{e, b, a} -> {d}
{a, b, e} -> {d}
{e, d, b} -> {a}
{a, d, b, e} -> {c}
{a, c, b, e} -> {d}
{a, c, d, e} -> {b}
{b, d, c, e} -> {a}
{a, b, d, e} -> {c}
{a, b, c, e} -> {d}
{a, b, c, d} -> {e}

Bài 2:g thuật toán Apriori với ngưỡng min_support = 3, ta có bảng tần suất của từng mục và tậục:
Mục Tần suất
A 4
B 2
C 2
D 3
E 4
Tập hai mục Tần suất
{A,B} 2
{A,C} 1
{A,D} 3
{A,E} 3
{B,C} 1
{D,E} 2
Sau đó, loại bỏ các tập không đáp ứng ngưỡng min_support, ta có tập mục phổ biến sau:
Tập mục Tần suất
{A} 4
{B} 2
{C} 2
{D} 3
{E} 4
{A,D} 3
{A,E} 3
{D,E} 2
Do đó, tập mục phổ biến được xác định ở phần a là: {A}, {B}, {C}, {D}, {E}, {A,D}, {A,E}, {D,E}
b)
Tập luật kết hợp mạnh có độ tin cậy min_confidence = 0.5 là các luật có dạng X -> Y sao cho X và Y
cùng thuộc tập mục phổ biến ở phần a và độ tin cậy của luật này không thấp hơn ngưỡng
min_confidence = 0.5.
Sử dụng thuật toán tạo tập luật kết hợp mạnh trên tập dữ liệu giao dịch:
Luật Tần suất của X và Y Tần suất của X Độ tin cậy
{A} -> {D} 3 4 0.75
{A} -> {E} 3 4 0.75
{D} -> {A} 3 3 1.0
{D} -> {E} 2 3 0.67
Luật Tần suất của X và Y Tần suất của X Độ tin cậy
{E} -> {A} 3 4 0.75
{E} -> {D} 2 4 0.5
Loại bỏ các luật không đạt ngưỡng min_confidence = 0.5, ta có tập luật kết hợp mạnh sau:
Luật Tần suất của X và Y Tần suất của X Độ tin cậy
{A} -> {D} 3 4 0.75
{A} -> {E} 3 4 0.75
{D} -> {A} 3 3 1.0
{E} -> {A} 3 4 0.75

You might also like