Professional Documents
Culture Documents
Bài Tập Xử Lý Dữ Liệu - Nhóm 2
Bài Tập Xử Lý Dữ Liệu - Nhóm 2
1. y: Biến target (biến mục tiêu), đây là biến mà bạn muốn dự đoán hoặc phân
loại. Trong mô tả bạn đã cung cấp, nó có thể liên quan đến việc dự đoán xem
khách hàng có đăng ký khoản tiền gửi có kỳ hạn (term deposit) hay không.
2. age: Tuổi của khách hàng.
3. job: Nghề nghiệp của khách hàng.
4. marital: Tình trạng hôn nhân của khách hàng.
5. education: Trình độ học vấn của khách hàng.
6. default: Tình trạng tín dụng (nợ) của khách hàng.
7. housing: Tình trạng sở hữu nhà (housing loan) của khách hàng.
8. loan: Tình trạng khoản vay cá nhân (personal loan) của khách hàng.
9. contact: Hình thức liên lạc với khách hàng.
10. month: Tháng của cuộc gọi điện thoại cuối cùng.
11. day_of_week: Ngày trong tuần của cuộc gọi điện thoại cuối cùng.
12. duration: Thời lượng của cuộc gọi điện thoại cuối cùng (đơn vị: giây).
13. campaign: Số lần liên lạc đã thực hiện đối với khách hàng trong chiến dịch
này.
14. pdays: Số ngày kể từ khi khách hàng được liên hệ lần cuối đến lúc thực hiện
chiến dịch.
15. previous: Số lần liên lạc đã thực hiện đối với khách hàng trước chiến dịch.
16. poutcome: Kết quả của chiến dịch tiếp thị trước đó.
17. emp.var.rate: Tỷ lệ biến động của tỷ lệ thất nghiệp.
18. cons.price.idx: Chỉ số giá tiêu dùng.
19. cons.conf.idx: Chỉ số sự tin tưởng của người tiêu dùng.
20. euribor3m: Tỷ lệ lãi suất tham chiếu Euribor 3 tháng.
21. nr.employed: Số lượng người làm việc.
Mục tiêu: Bộ dữ liệu này chứa thông tin về khách hàng và các thông tin liên quan
đến các cuộc gọi tiếp thị trực tiếp của một ngân hàng và dự đoán xem một khách
hàng có đăng ký một khoản tiền gửi có kỳ hạn (term deposit) hay không dựa trên
thông tin về hồ sơ của khách hàng.
2) Tiền xử lý
Nhận xét: Bảng trên có 4.8% dữ liệu bị mất. Dữ liệu bị mất này đều nằm ở cột
pdays (Số ngày kể từ khi khách hàng được liên hệ lần cuối đến lúc thực hiện chiến
dịch.)