Professional Documents
Culture Documents
BaiTap-Ontap Hoc May
BaiTap-Ontap Hoc May
Câu 1: Cho bảng dữ liệu ảnh hưởng dùng thuốc với việc bị rám nắng như sau.
Yêu cầu: Sử dụng các mô hình dự đoán đã học để dự đoán cho test set.Vẽ ma trận
nhầm lẫn, Tính độ chính xác (accuracy), precision, recall và F1-score.
Câu 2:
Câu 3. Cho tập dữ liệu S ghi lại những ngày mà một người chơi (không chơi) tennis
Day Outlook Temperature Humidity Wind Play
Tennis
D1 Sunny Hot High Weak No
D2 Sunny Hot High Strong No
D3 Overcast Hot High Weak Yes
D4 Rain Mild High Weak Yes
D5 Rain Cool Normal Weak Yes
D6 Rain Cool Normal Strong No
D7 Overcast Cool Normal Strong Yes
D8 Sunny Mild High Weak No
D9 Sunny Cool Normal Weak Yes
D10 Rain Mild Normal Weak Yes
D11 Sunny Mild Normal Strong Yes
D12 Overcast Mild High Strong Yes
D13 Overcast Hot Normal Weak Yes
D14 Rain Mild High Strong No
D15 Sunny High High Weak ?
D16 Rain Mild Normal Strong ?
D17 Overcast Cool Normal Strong ?
D18 Rain Cool High Weak ?
Áp dụng thuật toán phân lớp Naïve Bayes.
Train data = {D1,… , D14}
Test data = {D15, .., D16}
a. Dự đoán kết quả cho mẫu D15, D16, D17, D18
b. Lập ma trận nhằm lẫn (confusion matrix), tính accuracy, error, precision, recall, F1-
score của kết quả dự đoán trên.
Câu 5: Thực hiện lại Câu 4 với khoảng cách Manhattan thay cho Euclid.