You are on page 1of 3

Câu 2: Sử dụng phương pháp phân loại dữ liệu của Bayesian để xác định một ngày

trời nắng, nhiệt độ trung bình, độ ẩm cao và gió mạnh thì người ta có chơi(YES) hay
không chơi(No) tenis?

Da Outloo Temperat Humidi Win Play


y k ure ty d Tennis
Stro
D1 Sunny Cold Normal ng No
Stro
D2 Rain Mild Normal ng Yes
Stro
D3 Sunny Hot Hight ng Yes
Wea
D4 Sunny Hot Hight k Yes
Wea
D5 Sunny Cold Normal k No
Stro
D6 Sunny Mild Hight ng No
Wea
D7 Rain Mild Hight k No
Overca Stro
D8 st Hot Hight ng Yes
Wea
D9 Rain Cold Hight k Yes
D1 Wea
0 Sunny Hot Hight k Yes
D1 Stro
1 Rain Hot Hight ng No
D1 Stro
2 Rain Hot Hight ng Yes
D1 Overca Stro
3 st Cold Normal ng Yes
D1 Stro
4 Rain Mild Hight ng No
D1 Wea
5 Sunny Mild Hight k Yes
Giải
 Biểu diễn bài toán phân loại
z = ( Outlook = Sunny, Temperature = Mild, Humidity = Hight, Wind = Strong )
Có 2 phân lớp có thể: c1(“Có chơi”) và c2(“Không chơi”)
 Giá trị xác xuất cho mỗi phân lớp
P(c1) = 9/15
P(c2) = 6/15

 Giá trị xác xuất của mỗi giá trị thuộc tính đối với mỗi phân lớp

P(Outlook = Sunny | c1) = 4/9 P(Outlook = Sunny | c2) = 3/6


P(Temperature = Mild | c1) = 2/9 P(Temperature = Mild | c2) = 3/6
P(Humidity = Hight | c1) = 7/9 P(Humidity = Hight | c2) = 4/6
P(Wind = Strong | c1) = 5/9 P(Wind = Strong | c2) = 4/6

 Xác xuất xảy ra z đối với mỗi phân lớp


Đối với phân lớp c1
P( z | c1 ) = P(Outlook = Sunny | c1) . P(Temperature = Mild | c1) .
P(Humidity = Hight | c1) . P(Wind = Strong | c1)
= 4/9 . 2/9 . 7/9 . 5/9 = 0,0427
Đối với phân lớp c2
P( z | c2 ) = P(Outlook = Sunny | c2) . P(Temperature = Mild | c2) .
P(Humidity = Hight | c2) . P(Wind = Strong | c2)
= 3/6 . 3/6 . 4/6 . 4/6 = 0,1111
 Xác định phân lớp có thể nhất
Đối với phân lớp c1
P(c1) . P( z | c1 ) = 9/15 . 0,0427 = 0.0256
Đối với phân lớp c2
P(c2) . P( z | c2 ) = 6/15 . 0,1111 = 0.0444
 Kết luận: Một ngày trời nắng, nhiệt độ trung bình, độ ẩm cao và gió mạnh thì người
ta không chơi tenis!

You might also like