Professional Documents
Culture Documents
2
➢ GIỚI THIỆU VỀ WEKA
➢Lọc dữ liệu:
➢ Tiền xử lý dữ liệu trên weka
Số mẫu
phân
lớp sai
Các thông số
khác
Giới thiệu về phân lớp dữ liệu
❖ Phân cụm rõ: các điểm dữ liệu được chia vào các cụm, trong đó
mỗi điểm dữ liệu thuộc vào chính xác một cụm.
❖ Phân cụm mờ: các điểm dữ liệu có thể thuộc vào nhiều hơn một
cụm với độ thuộc tương ứng.
Giới thiệu về phân cụm dữ liệu
ÑÞnh nghÜa 4:Ta gäi luËt X → Y lµ cã ®é tin cËy c (Confidence) trªn tËp
giao t¸c D,
Ký hiÖu: c= Conf(X → Y) = Supp(X →Y)/Supp(X)
NhËn xÐt: C¸c x¸c nhËn vµ ®é tin cËy chÝnh lµ c¸c x¸c suÊt sau:
Supp(X → Y)= P(XY) : X¸c suÊt cña XY trong D
Conf(X → Y) = P(Y/X): X¸c suÊt cã ®iÒu kiÖn
ÑÞnh nghÜa 5: Cho tríc Min_Supp=s0 vµ Min_Conf=c0
Ta gäi luËt X → Y lµ xaû ra nÕu tháa:
Supp(X → Y) > s0 vµ Conf(X → Y)>c0
➢ Giới thiệu về luật kết hợp
Trong đó:
là hệ số chặn; là độ dốc (hệ số hồi quy)
i là một biến số theo luật phân phối
chuẩn
Giới thiệu về Hồi quy dữ liệu
➢ Trong mô hình:
49