Professional Documents
Culture Documents
Nhóm 3
Nhóm 3
DỮ LIỆU BÁN LẺ VÀ
PHÂN KHÚC KHÁCH HÀNG
Đỗ Tiến Đạt
Lê Lam Quỳnh
Phan Hồ Xuân Hương
Hồ Mai Thảo Nguyên
01 Giới thiệu bài thuyết trình
Nội dung
02 Thống kê mô tả
05 Kết luận
I. Giới thiệu bài thuyết trình
• Giới thiệu về data
• Kích thước dữ liệu: 2241 hàng x 29 cột ( tương đương 2240 bản ghi)
A. XỬ LÝ DỮ LIỆU:
• Dữ liệu trùng lặp (0)
• Xử lý dữ liệu bị thiếu
• Kiểm tra và loại bỏ outliers (1)
• Chọn các biến quan trọng
• Tách tập dữ liệu huấn luyện và kiểm tra
B. THỐNG KÊ MÔ TẢ:
• Đưa ra những đặc điểm nổi bật và khái quát về dữ liệu
C. PHÂN TÍCH RFM:
Là một mô hình phân tích và phân khúc khách hàng theo các đặc điểm hành vi tiêu dùng dựa trên các dữ liệu
giao dịch trong lịch sử. RFM là viết tắt của ba chỉ số quan trọng trong phân tích khách hàng:
• Recency (R): Đo khoảng thời gian từ giao dịch gần nhất của khách hàng đến thời điểm hiện tại. Khoảng thời
gian này càng lớn thì khả năng khách hàng rời bỏ công ty càng cao, ngược lại càng nhỏ thì khả năng tiếp cận
và bán hàng lại càng cao.
• Frequency (F): Đo tần suất mua sắm của khách hàng. Khách hàng mua hàng thường xuyên có khả năng cao
hơn để phản hồi với các chiến dịch của thương hiệu và trở thành khách hàng trung thành.
• Monetary (M): Đo tổng số tiền khách hàng đã chi tiêu cho thương hiệu trong một khoảng thời gian cụ thể.
Mức độ chi tiêu này cho biết khả năng chi tiêu của khách hàng và có thể dự đoán được mức giá trung bình của
mỗi giao dịch của họ.
3. Trình tự và phương pháp phân tích dữ liệu
D. PHÂN NHÓM ( CLASSIFICATION):
• Xây dựng một mô hình dự đoán và phân loại khách hàng dựa trên thu nhập/trình độ học vấn/tình trạng hôn
nhân/phương thức mua hàng và dựa trên mô hình đã phân cụm (clustering theo RFM)
=>Tên gọi (nhãn) của từng nhóm khách hàng dựa trên những dữ kiện trước đó.
=> Từ đó dễ dàng đưa ra được các chiến lược nhằm tối ưu hóa được nguồn lực trong kinh doanh một cách
nhanh chóng.
• Tuy nhiên những nhóm thu nhập từ 50k-70k và từ 70k-165k có xu hướng quay lại mua hàng
nhiều hơn lần lượt có trung bình số lần quay lại là xấp xỉ 16 lần và 19 lần.
II. Thống kê mô tả:
2. Phần riêng:
2.3. Phân tích theo Education
A. Theo thu nhập và số lượng:
• Từ 2 bảng số liệu trên ta thấy số lượng
khách hàng có tỉ lệ tương đương với thu
nhập của chính họ và người có trình độ
Graduation chiếm khoảng 50% về tổng thu
nhập cũng như số lượng.
2.3. Phân tích theo Education
B. Theo GDP:
• Những người lao động phổ thông có trình độ Basic có thu nhập thấp hơn hẳn so với tổng thu nhập bình quân
đầu người.
III. Phân cụm khách hàng:
• CHỌN SỐ CỤM BẰNG PHƯƠNG PHÁP ELBOW
• Để sử dụng được phương pháp phân cụm k-Means, chúng ta cần biết được số cụm.
• Phương pháp Elbow - được xem là phương pháp xác định số lượng cụm tối ưu trong thuật toán
gom cụm như k-Means.
• Bản chất của phương pháp của này là tìm một giá trị K sao cho sau giá trị đó, sự gia tăng tổng bình
phương khoảng cách giữa các điểm dữ liệu và trung tâm cụm trở nên ít đáng kể hơn.
Dựa vào Elbow để xác định số cụm như thế nào?
Chọn số K mà khi tăng K lên 1 đơn vị, Distortion giảm đi nhỏ hơn hẳn, do đó nên lựa số cụm K=4.
III. Phân cụm khách hàng:
Nhóm KH có khả năng rời bỏ: 659 chiếm 30% Nhóm KH VIP: 443 chiếm 20%
Nhóm KH trung thành: 740 chiếm 33% Nhóm KH gần đây: 373 chiếm 17%
• Lấy ví dụ: Nếu bạn có 4 triệu KH và bạn muốn chạy quảng
IV. Mô hình dự đoán cáo dịch vụ trên SMS để giữ chân họ,
• Có thể thấy rằng chi phí này (chỉ riêng SMS) là một con số
cực kỳ lớn cho 1 chiến dịch, chưa kể đến quà tặng, chi phí
vận hàng,..
• Do đó, vấn đề đặt ra là phải giữ chân được các nhóm khách
hàng có khả năng rời bỏ bằng cách tìm được đúng phân
khúc khách hàng có nguy cơ rời bỏ cao để tiếp cận trước.
• Mô hình Classification: Dự đoán được
khách hàng rời bỏ hay quay lại dựa
trên thu nhập/trình độ học vấn/tình
trạng hôn nhân/tần suất mua hang ở
các phương thức khác nhau.
• 87% khách hàng trong nhóm này thuộc nhóm có thu nhập trung bình thấp (<50k ):
Những yếu tố có thể thu hút họ: giá cả cạnh tranh, khuyến mãi và ưu đãi đặc biệt khi mua hàng, hình ảnh
truyền thông gần gũi và tạo ra nội dung giá trị (tạo ra nội dung chất lượng mà nhóm KH này có thể tận dụng, bao
gồm hướng dẫn sử dụng sản phẩm và dịch vụ, cách tiết kiệm tiền và các thông tin hữu ích khác).
• Đối mặt hàng được mua rượu và thịt và những mặt hàng có giá trị và là nguồn lợi nhuận chính của siêu thị.
Ưu đãi kết hợp ở 2 mặt hàng này như mua rượu được chiết khấu giá mua thịt và ngược lại hoặc mua rượu
được tặng thịt hoặc là giảm giá song song hoặc từng loại ở cả 2 mặt hàng.
• CHÍNH SÁCH ĐỀ XUẤT:
B. Nhóm khách hàng trung thành:
• Mặc dù đây là nhóm KH khó rời đi, tuy nhiên khoảng thời gian giữa các lần mua hàng của họ
thường ở mức trung bình. Và để cải thiện điều này, cần đề ra những ưu đãi đặc biệt: Chương trình
khách hàng thân thiết và tri ân khách hàng là một gợi ý.
C. Nhóm khách hàng VIP:
• 85% khách hàng thuộc nhóm khách hàng VIP có thu nhập thuộc nhóm thu nhập cao (50.000 - 170.000) và 44%
trong số khách hàng VIP đã lựa chọn phương thức mua hàng tại cửa hàng.
Nên có những ưu tiên nhất định khi họ quay lại mua hàng, sự tiếp đãi chu đáo, cẩn thận, ….
Phải để khách hàng VIP cảm thấy giá trị của họ.
• Lắng nghe những đóng góp và phản hồi, có các chiến lược để níu kéo họ: đem đến nhiều ưu đãi đặc biệt cho
khách hàng VIP: tổ chức các chương trình khách hàng thân thiết, tích điểm nhận quà, … để tiếp tục thu hút họ,
duy trì sự mua hàng.
• Tận dụng các kênh tốt nhất: email, SMS và quảng cáo nhắm mục tiêu tạo trải nghiệm khách hàng VIP.
• Có các chiến lược quảng cáo, liên tục cập nhật để giới thiệu đến cho mọi người biết cửa hàng con có các phương
thức mua hàng khác như: mua hàng qua Web, qua Catalog.
• CHÍNH SÁCH ĐỀ XUẤT:
D. Nhóm khách hàng gần đây:
• Nhóm khách hàng gần đây thuộc nhóm thu nhập thấp, 70% có
thu nhập từ 4.000-40.000 và 65% có gia đình. Chính sách được
đề xuất là:
Trong 4 cụm KH này, nhóm KH trung thành chiếm tỉ lệ tương đối cao. Cho thấy được mô hình kinh
doanh bán lẻ vẫn giữ vững được một lượng khách hàng nhất định. Tuy nhiên, bên cạnh đó cần lưu ý lượng
khách hàng có khả năng rời bỏ cũng chiếm khoảng 30%
• Phân nhóm khách hàng (classification) thành hai nhóm: khách hàng có khả năng rời bỏ và nhóm khách
hàng có khả năng quay lại.
+ Qua nhiều lần thử và lựa chọn các phương pháp, mô hình Cây quyết định giúp dự đoán khách
hàng với độ chính xác cao nhất ( hơn 90% ).
+ Duy trì và cải thiện dịch vụ giữ chân khách hàng. Cần có thêm các chương trình KH thân thiết và tri
ân khách hàng.
+ Thúc đẩy việc làm thẻ thành viên để khuyến khích người tiêu dùng mua hàng=> tích điểm=> đổi
thưởng.
Cảm ơn các bạn đã
lắng nghe !!!