Câu 2: Sử dụng phương pháp phân loại dữ liệu của Bayesian để xác định một ngày
trời nắng, nhiệt độ trung bình, độ ẩm cao và gió mạnh thì người ta có chơi(YES) hay không chơi(No) tenis?
Da Outloo Temperat Humidi Win Play
y k ure ty d Tennis Stro D1 Sunny Cold Normal ng No Stro D2 Rain Mild Normal ng Yes Stro D3 Sunny Hot Hight ng Yes Wea D4 Sunny Hot Hight k Yes Wea D5 Sunny Cold Normal k No Stro D6 Sunny Mild Hight ng No Wea D7 Rain Mild Hight k No Overca Stro D8 st Hot Hight ng Yes Wea D9 Rain Cold Hight k Yes D1 Wea 0 Sunny Hot Hight k Yes D1 Stro 1 Rain Hot Hight ng No D1 Stro 2 Rain Hot Hight ng Yes D1 Overca Stro 3 st Cold Normal ng Yes D1 Stro 4 Rain Mild Hight ng No D1 Wea 5 Sunny Mild Hight k Yes Giải Biểu diễn bài toán phân loại z = ( Outlook = Sunny, Temperature = Mild, Humidity = Hight, Wind = Strong ) Có 2 phân lớp có thể: c1(“Có chơi”) và c2(“Không chơi”) Giá trị xác xuất cho mỗi phân lớp P(c1) = 9/15 P(c2) = 6/15
Giá trị xác xuất của mỗi giá trị thuộc tính đối với mỗi phân lớp
Đối với phân lớp c1 P( z | c1 ) = P(Outlook = Sunny | c1) . P(Temperature = Mild | c1) . P(Humidity = Hight | c1) . P(Wind = Strong | c1) = 4/9 . 2/9 . 7/9 . 5/9 = 0,0427 Đối với phân lớp c2 P( z | c2 ) = P(Outlook = Sunny | c2) . P(Temperature = Mild | c2) . P(Humidity = Hight | c2) . P(Wind = Strong | c2) = 3/6 . 3/6 . 4/6 . 4/6 = 0,1111 Xác định phân lớp có thể nhất Đối với phân lớp c1 P(c1) . P( z | c1 ) = 9/15 . 0,0427 = 0.0256 Đối với phân lớp c2 P(c2) . P( z | c2 ) = 6/15 . 0,1111 = 0.0444 Kết luận: Một ngày trời nắng, nhiệt độ trung bình, độ ẩm cao và gió mạnh thì người ta không chơi tenis!