You are on page 1of 3

Bài tập: Association Rule

TI
D Itemset
T1 M2, M3, M4, M6
T2 M1, M4, M5
T3 M2, M4, M5, M6
T4 M2, M3, M4, M5
M1, M2, M4, M5,
T5 M6

minsup=60%

conf=80%

Bài làm
Đầu tiên, lập tập ứng viên 1-items. Đếm sự xuất hiện của nó trong dữ liệu. Có được tập ứng viên
candidate C1:

Item support
M1 40%
M2 80%
M3 40%
M4 100%
M5 80%
M6 60%

So sánh và chỉ chọn những items nào >=minsup, mà ta có minsup=60%. Nên chỉ lấy item nào
>=60%, và ta có được tập phổ biến L1:

Item support
M2 80%
M4 100%
M5 80%
M6 60%

Khi có tập phổ biến L1 tiếp tục tìm tập ứng viên C2 bằng cách kết (join) các items lại với nhau.
Ta có tập ứng viên C2:
2- suppo
Itemset rt
M2,M4 80%
M2,M5 60%
M2,M6 60%
M4,M5 80%
M4,M6 60%
M5,M6 40%

Chúng ta sẽ so sánh và chỉ chọn những 2-itemset nào >=minsup, mà ta có minsup=60%. Nên ta
chỉ lấy items nào >=60%, và ta có được tập phổ biến L2:

2- suppo
Itemset rt
M2,M4 80%
M2,M5 60%
M2,M6 60%
M4,M5 80%
M4,M6 60%

Khi có tập phổ biến L2 tiếp tục tìm tập ứng viên C3 bằng cách kết (join) các items lại với nhau.
Ta có tập ứng viên C3:

suppor
3-itemset t
M2,M4,M
5 60%
M2,M4,M
6 60%

Không thể tìm được tập ứng viên C4 vì vậy C4=∅. Tới đây thuật toán dừng. Ta có được các tập 3
- items là {M2,M4,M5}; {M2,M4,M6}
Conf({M2->M4})=sup({M2}∪ {M 4 })/sup{M2}=80%/80%=100%
Tương tự cách tính, ta có những luật kết hợp sau:

Confide
Luật kết hợp nce
M2 ->M4 100%
M2 ->M5 75.00%
M2 ->M6 100%
M2-> {M4,M5} 75.00%
M2-> {M4,M6} 75.00%
{M5,M4}->M2 75.00%
{M6,M4}->M2 100%
{M2,M4}->M5 75.00%
{M2,M4}->M6 75.00%
{M2,M5}->M4 100%
{M2,M6}->M4 100%
M4 ->M2 80.0%
M4 ->M5 80.0%
M4 ->M6 60.0%
M4-> {M2,M5} 60.0%
M4-> {M2,M6} 60.0%
M5->M2 75.00%
M5->M4 100%
M5-> {M2,M4} 75.00%
M6->M2 100%
M6->M4 100%
M6-> {M2,M4} 100%

Từ frequent item + minconf=80% ta có 11 luật kết hợp (màu vàng) như trên.

You might also like