1. Từ file dữ liệu cho sẳn ThuNhap_HoGiaDinh.xlsx tách làm 2 file excel riêng: a. ThuNhap_HoGiaDinh_data.xlsx: chiếm 70% dữ liệu b. ThuNhap_HoGiaDinh_forecast.xlsx: 30% dữ liệu dùng để dự báo. Và bỏ đi dữ liệu cột biến phụ thuộc (Vay Vốn)
Lab 2 – Phân lớp dữ liệu
1. Sử dụng 3 phương pháp: hồi qui logistic, svm, cây quyết định tiến hành phân lớp theo “Vay Vốn”. Đánh giá các phương pháp. Lưu ý thế hiện quan sát dữ liệu theo dạng bảng hoặc biều đồ a. Chụp màn hình xây dựng mô hình: b. Chụp màn hình đánh giá các phương pháp và Ma trận nhầm lẫn 2. Sử dụng mô hình tốt nhất để dự báo “Vay Vốn” cho khách hàng trong file: ThuNhap_HoGiaDinh_forecast.xlsx a. Chụp màn hình xây dựng mô hình: b. Chụp màn hình kết quả dự báo: