Professional Documents
Culture Documents
NHÓM 4
THÀNH VIÊN NHÓM
Đỗ Thanh Ngân
Huỳnh Diễm My
THU NHẬP VÀ
01 GIỚI THIỆU 02 LÀM SẠCH DỮ
LIỆU
XÂY DỰNG VÀ
03 HUẤN LUYỆN
MÔ HÌNH
04 Ý NGHĨA MÔ
HÌNH
01
GIỚI THIỆU
TỔNG QUAN ĐỀ TÀI
• Hiện nay, điện thoại thông minh (Smart Phone) ngày càng trở
thành 1 một thiết bị điện tử không thể thiếu đối với nhân loại
• Theo Statista (trang web thống kê doanh số điện thoại thông
minh được bán ra) số lượng điện thoại bán ra đến tay người
dùng là 1,395.25 triệu chiếc trong năm 2022
• Dự án để dự đoán xem những chiếc điện thoại thông minh có
số lượt bán cao thì sẽ có những thông số như thế nào, những
công nghệ gì và điểm số đánh giá ra sao.
• Chúng em mong muốn rằng có thể hỗ trợ các nhà sản xuất đưa
ra những ý tưởng về 1 chiếc điện thoại sở hữu những thông số,
công nghệ phù hợp với người sử dụng, từ đó làm tăng doanh số
bán hàng
MỤC ĐÍCH ĐỀ TÀI
Để đạt được mục đích này, dự án tập trung thực hiện các nhiệm vụ sau:
• Sử dụng bộ dữ liệu thu thập được từ GSMarena và mô tả tổng
quát về bộ dữ liệu này.
• Nghiên cứu các yếu tố có khả năng thỏa mãn nhu cầu về điện
thoại của người dùng.
• Lựa chọn và xây dựng mô hình phù hợp nhất cho việc dự đoán
các yếu tố về những chiếc điện thoại phù hợp với người dùng
• Kiểm định độ chính xác của mô hình dự báo đã lựa chọn.
• Mong muốn ứng dụng mô hình vào thực tiễn cuộc sống để hỗ
trợ hãng sản xuất mau chóng bắt kịp xu thế yêu cầu về điên
thoại của người dùng từ đó tạo ra những sản phẩm phù hợp
02
THU NHẬP VÀ
LÀM SẠCH
DỮ LIỆU
Hình 2.1:Bảng dữ liệu thu thập được
SƠ LƯỢC CÁC THUỘC TÍNH LỰA CHỌN ĐƯA
Bao gồm 13 thuộc tính:
VÀO MÔ HÌNH
• Tên • Dung lượng pin từ 3500 MAh trở lên
• Hãng • Màn hình từ 6.0 inch trở lên
• Dùng chipset Snapdragon • Điểm Antutu
• Màn hình AMOLED trở lên • Giá cả hợp lí
• Tần số quét 120 Hz trở lên • Bán chạy trên thị trường
• Phiên bản Android là 12 trở lên
• Độ phân giải camera chính từ 48 MP trở lên
• Độ phân giải camera selfie từ 12MP trở lên
03
KIỂM ĐỊNH
MÔ HÌNH
Sau khi có bộ dữ liệu hoàn chỉnh, nhóm sẽ tiến hành
bước kiểm định mô hình. Đây là bảng dữ liệu đầu
vào, thuộc tính “Hãng” sẽ bị bỏ qua vì thuộc tính ấy
không có tác động đến kết quả tìm kiếm điện thoại
thông minh dung hệ điều hành Android phù hợp
với người dùng. Và trong mô hình này, nhóm sẽ
chọn biến “Bán chạy trên thị trường” là biến mục
tiêu (target)
Hình 3.1: dữ liệu vào
Hình 3.2: Bảng dữ liệu
Nhóm sẽ kiểm định 3 phương pháp
Tree, Logistic Regression và SVM