Professional Documents
Culture Documents
(DATA MINING)
Itemsets:
Item: I4
{I1, I2, I5},
{I2, I3}, …
Transaction: T800
Pre- Post-
processing
Relationships processing
Mining
among
Raw Data Items of Interest Items User
(Rules)
Transactional/ Association
Items
Relational Data Rules
22
UV1 TX1
TID Items Itemset Support Itemset Support
100 134 {1} 3 {1} 3
200 235 {2} 3 {2} 3
300 1235 {3} 4 {3} 4
400 25 {4} 1 {5} 4
500 135 {5} 4
23
UV2 TX2
TID Items Itemset Support Itemset Support
100 134 {1, 2} 1 {1, 3} 3
200 235 {1, 3} 3 {1, 5} 2
300 1235 {1, 5} 2 {2, 3} 2
400 25 {2, 3} 2 {2, 5} 3
500 135 {2, 5} 3 {3, 5} 3
{3, 5} 3
TX1
Itemset Support
{1} 3
{2} 3
{3} 4
{5} 4 Khai phá dữ liệu - ĐHSPHN
Apriori … Step 3 Minimum suport count = 2
24
UV3 UV3
TID Items Itemset Support Itemset In TX2?
100 134 {1, 2, 3} {1, 2, 3}
No
200 235 {1, 2, 5} {1, 2}; {1, 3}; {2, 3}
Tập mục con của một tập mục thường xuyên thì cũng phải là tập mục thường xuyên!
Apriori … Step 4 Minimum suport count = 2
25
UV4 TX4
TID Items Itemset Support Itemset Support
100 134 {1, 2, 3, 5} 1 Empty
200 235
UV4
300 1235
Itemset In TX3?
400 25
{1, 2, 3, 5}
500 135 {1, 2, 3}; {1, 2, 5}; No
{1, 3, 5}; {2, 3, 5}
TX3
Itemset Support
{1, 3, 5} 2
{2, 3, 5} 2
Tập mục con của một tập mục thường xuyên thì cũng phải là tập mục thường xuyên!
Apriori
26
Sinh ra tất cả các tập mục con khác rỗng của mỗi tập
mục thường xuyên 𝐼
Với 𝐼 = *1, 3, 5+ → *1, 3+; *1, 5+; *3, 5+; *1+; *3+; *5+
Với 𝐼 = *2, 3, 5+ → *2, 3+; *2, 5+; *3, 5+; *2+; *3+; *5+