Professional Documents
Culture Documents
THỐNG KÊ MÔ TẢ
THỐNG KÊ MÔ TẢ
(Hiện tại chỉ làm phần tiền xử lí số liệu cho missing_data, sau khi phân tích
xong dirty_data sẽ gộp lại và phân tích lại)
Ta không chọn các biến “order_id”, “customer_id” vì mỗi giá trị của
chúng là riêng biệt và không có ý nghĩa thống kê. Biến
“latest_customer_review” ở định dạng string (character) và không có quy luật
nên ta cũng bỏ biến này.
1.
THỐNG KÊ MÔ TẢ
1 Dữ liệu thô
1st Qu.:2019-04-05 00:00:00.00 1st Qu.: 7095 1st Qu.: 66.38 1st Qu.:-37.82
3rd Qu.:2019-10-07 12:00:00.00 3rd Qu.: 19423 3rd Qu.: 83.87 3rd Qu.:-37.81
1st Qu.:145.0 1st Qu.: 5.00 1st Qu.: 6477 1st Qu.: 0.7431
3rd Qu.:145.0 3rd Qu.:15.00 3rd Qu.: 17367 3rd Qu.: 1.3979
990 10 3 990 10 4
is_happy_customer
a Dữ liệu khuyết