You are on page 1of 6

 Khai phá luật kết hợp với Weka

(Association Rule Mining with WEKA )


Nguyễn Văn Chức – chucnv@ud.edu.vn

Trong lĩnh vực Data Mining, mục đích của luật kết hợp (Association Rule - AR) là tìm ra các mối kết hợp (Association) hay tương quan
(Correlation) giữa các đối tượng trong khối lượng lớn dữ liệu. Ứng dụng của luật kết hợp rất phổ biến trong nhiều lĩnh vực, nhất là trong kinh
doanh như Market Basket Analysis (Cross selling, Product placement, Affinity promotion, Customer behavior Analysis). Xem bài ứng dụng luật
kết hợp trong Market Basket Analysis tại http://bis.net.vn/forums/t/382.aspx

Bài viết này minh họa việc sử dụng thuật toán Apriori để phát hiện các luật kết hợp trên phần
mềm Weka. (Xem chi tiết về thuật toán Apriori tại đây)

Dữ liệu được dùng trong ví dụ này là dữ liệu về khách hàng ngân hàng (bank.arff) gồm 11 thuộc
tính và 600 khách hàng (samples, instances, patterns). Cấu trúc file bank.arff như sau: (Download
file dữ liệu bank.arff tại đây)
Dữ liệu về một số khách hàng trong file bank.arff như sau

Nạp dữ liệu (nạp file bank.arff)

Chọn tab Association và chọn thuật toán Apriori


Thiết lập các tham số (numRules, Support, Confidence,…)

Giải thích một số tham số chính của thuật toán Apriori sinh luật kết hợp
lowerBoundMinSupport: Cận dưới của minimum support.

metricType: Có 4 loại metricType là Confidence, Lift , Leverage và Conviction.

Minimum metric score: Chỉ quan quan đến các luật có metric score cao hơn giá trị này.

numRules: Số luật muốn tìm (các luật sẽ được sắp xếp theo thứ tự giảm dần của metric score.

significanceLevel: Mức ý nghĩa (chỉ dùng khi metricType là confidence).

upperBoundMinSupport: Cận trên của minimum support (bắt đầu lặp lại việc giảm minimum
support từ upperBoundMinSupport đến lowerBoundMinSupport).

Các luật kết hợp thu được

10 luật tốt nhất được sinh ra bởi thuật toán Apriori trên dữ liệu bank.arff như sau (sắp xếp giảm
dần theo confidence):

1. income=43759_max 80 ==> save_act=YES 80 conf:(1)

2. age=52_max income=43759_max 76 ==> save_act=YES 76 conf:(1)


3. income=43759_max current_act=YES 63 ==> save_act=YES 63 conf:(1)

4. age=52_max income=43759_max current_act=YES 61 ==> save_act=YES 61 conf:(1)

5. children=0 save_act=YES mortgage=NO pep=NO 74 ==> married=YES 73 conf:(0.99)

6. sex=FEMALE children=0 mortgage=NO pep=NO 64 ==> married=YES 63 conf:(0.98)

7. children=0 current_act=YES mortgage=NO pep=NO 82 ==> married=YES 80 conf:(0.98)

8. children=0 mortgage=NO pep=NO 107 ==> married=YES 104 conf:(0.97)

9. income=43759_max current_act=YES 63 ==> age=52_max 61 conf:(0.97)

10. income=43759_max save_act=YES current_act=YES 63 ==> age=52_max 61 conf:(0.97)

Luât kết hợp số 1 cho biết rằng nếu thu nhập (income) lớn hơn hoặc bằng 43759 thì khách hàng
có tài khoản tiết kiệm (save_act =YES) với độ tin cậy là 1.

PS. All comments please send to chucnv@ud.edu.vn. Thank you and Welcome!

Từ khóa đại diện: BI, Business Intelligence, Data Mining, Weka, Association Rule, machine
Learning, Khai phá dữ liệu, Tin học quản lý, Management Information Systems

 Điểm chủ đề: 65


01-05-2011 06:48 AM trả lời
 hoangnh3 Re: Khai phá luật kết hợp với Weka

Trả lời Liên hệ


Anh Chức ah,


Weka nó không hỗ trợ sinh luật kết hợp âm anh nhỉ. Em tìm mãi mà
 Tham gia 01-01- ko có :(
2011 

 Điểm 55  Điểm chủ đề: 35


01-05-2011 10:58 AM trả lời
 chucnv Re: Khai phá luật kết hợp với Weka

Trả lời Liên hệ


Các Data Mining Software hiện nay chỉ triển luật kết hợp Dương (Positive
Association Rule Dạng X=>Y chứ chưa triển khai các luật kết hợp âm
(Negative Association Rule) dạng như X => Not(Y) (Khách hàng mua sản
phẩm A thường KHÔNG mua sản phẩm B). Theo anh biết thì Weka cũng
 không triển khai luật kết hợp âm.
 Chúc em thành công,
 Tham gia 12-
05-2008 

 Điểm 4,615  Điểm chủ đề: 35


04-23-2011 09:42 PM trả lời
 dingo1 Re: Khai phá luật kết hợp với Weka



 Tham gia 04-23-2011

 Điểm 55

You might also like