Professional Documents
Culture Documents
Khoa Học Dữ Liệu (Kthp)
Khoa Học Dữ Liệu (Kthp)
NHÓM 4
THÀNH VIÊN NHÓM
Đỗ Thanh Ngân
Huỳnh Diễm My
XÂY DỰNG VÀ
03 HUẤN LUYỆN
MÔ HÌNH
04 Ý NGHĨA MÔ
HÌNH
01
GIỚI THIỆU
TỔNG QUAN ĐỀ TÀI
Hiện nay, điện thoại thông minh (Smart Phone) ngày càng trở
thành 1 một thiết bị điện tử không thể thiếu đối với nhân loại
Theo Statista (trang web thống kê doanh số điện thoại thông
minh được bán ra) số lượng điện thoại bán ra đến tay người
dùng là 1,395.25 triệu chiếc trong năm 2022
Dự án để dự đoán xem những chiếc điện thoại thông minh có
số lượt bán cao thì sẽ có những thông số như thế nào, những
công nghệ gì và điểm số đánh giá ra sao.
Chúng em mong muốn rằng có thể hỗ trợ các nhà sản xuất đưa
ra những ý tưởng về 1 chiếc điện thoại sở hữu những thông số,
công nghệ phù hợp với người sử dụng, từ đó làm tăng doanh số
bán hàng
MỤC ĐÍCH ĐỀ TÀI
Để đạt được mục đích này, dự án tập trung thực hiện các
nhiệm vụ sau:
Sử dụng bộ dữ liệu thu thập được từ GSMarena và mô tả tổng
quát về bộ dữ liệu này.
Nghiên cứu các yếu tố có khả năng thỏa mãn nhu cầu về điện
thoại của người dùng.
Lựa chọn và xây dựng mô hình phù hợp nhất cho việc dự đoán
các yếu tố về những chiếc điện thoại phù hợp với người dùng
Kiểm định độ chính xác của mô hình dự báo đã lựa chọn.
Mong muốn ứng dụng mô hình vào thực tiễn cuộc sống để hỗ
trợ hãng sản xuất mau chóng bắt kịp xu thế yêu cầu về điên
thoại của người dùng từ đó tạo ra những sản phẩm phù hợp
02
THU NHẬP VÀ
LÀM SẠCH
DỮ LIỆU
Hình 2.1:Bảng dữ liệu thu thập được
SƠ LƯỢC CÁC THUỘC TÍNH LỰA CHỌN ĐƯA
Bao gồm 13 thuộc tính:
VÀO MÔ HÌNH
Tên Dung lượng pin từ 3500 MAh trở lên
Hãng Màn hình từ 6.0 inch trở lên
Dùng chipset Snapdragon Điểm Antutu
Màn hình AMOLED trở lên Giá cả hợp lí
Tần số quét 120 Hz trở lên Bán chạy trên thị trường
Phiên bản Android là 12 trở lên
Độ phân giải camera chính từ 48 MP trở lên
Độ phân giải camera selfie từ 12MP trở lên
03
KIỂM ĐỊNH
MÔ HÌNH
Sau khi có bộ dữ liệu hoàn chỉnh, nhóm sẽ tiến
hành bước kiểm định mô hình. Đây là bảng dữ liệu
đầu vào, thuộc tính “Hãng” sẽ bị bỏ qua vì thuộc
tính ấy không có tác động đến kết quả tìm kiếm điện
thoại thông minh dung hệ điều hành Android phù
hợp với người dùng. Và trong mô hình này, nhóm sẽ
chọn biến “Bán chạy trên thị trường” là biến mục
tiêu (target)
Hình 3.1: dữ liệu vào
Hình 3.2: Bảng dữ liệu
Nhóm sẽ kiểm định 3 phương
pháp Tree, Logistic Regression
và SVM