You are on page 1of 5

Tên: Nguyễn Phúc Tín

MSSV: 31221020150

BÀI TẬP CÁ NHÂN


KHOA HỌC DỮ LIỆU
Sử dụng phần mềm Orange, Lưu kết quả phân tích thành tập tin:
Phanlop_HoTenSV
Bài tập phân lớp: sử dụng dữ liệu từ file: SalesData.xlsx, thực hiện các
yêu cầu sau:
A. Bỏ biến qua “KhachHang”, “ChucVu”, ghi lý do tại sao bỏ hai biến
này

B. Sử dụng 3 phương pháp: hồi qui logistic, svm, cây quyết định tiến
hành phân lớp theo “LoaiKhachHang”. Đánh giá các phương pháp. Lưu
ý thể hiện quan sát dữ liệu theo dạng bảng hoặc biều đồ.
Chụp lại các màn hình kết quả và giải thích các lựa chọn
Mô hình:
Các phương pháp và ma trận nhầm lẫn:
 Sai lầm nghiêm trọng nhất: dự báo là thường nhưng thực tế là VIP
vì sẽ mất khách hàng VIP, nghiêm trọng hơn trường hợp còn lại chỉ
tốn một phần nhỏ chi phí để phụ vụ khách hàng thường
 NN = 28.2% > LR = SVM = 26.9%
 Chọn phương pháp NN để thực hiện Test & Score
Dựa vào Test & Score cho NN:

Dựa vào Test & Score, có AUC của NN = 0.973 lớn nhất. Vậy nên
dùng phương pháp NN để thực hiện dự báo

a. Sử dụng mô hình tốt nhất để dự báo “LoaiKhachHang” cho


khách hàng trong file: ForecastData.xlsx
Chụp màn hình kết quả dự báo:

You might also like