You are on page 1of 39

PHÂN TÍCH

DỮ LIỆU BÁN LẺ VÀ
PHÂN KHÚC KHÁCH HÀNG

Nhóm thực hiện: Nhóm 3


Thành viên

Văng Công Vũ Thanh

Nguyễn Thị Mỹ Quỳnh

Đỗ Tiến Đạt

Nguyễn Đức Minh

Lê Lam Quỳnh
Phan Hồ Xuân Hương
Hồ Mai Thảo Nguyên
01 Giới thiệu bài thuyết trình
Nội dung
02 Thống kê mô tả

03 Phân cụm khách hàng

04 Mô hình dự đoán khách hàng rời bỏ

05 Kết luận
I. Giới thiệu bài thuyết trình
• Giới thiệu về data

• Kích thước dữ liệu: 2241 hàng x 29 cột ( tương đương 2240 bản ghi)

• Nguồn dữ liệu: Kaggle


• Mô tả dữ liệu:
+ID: Mã số định danh cho từng khách hàng hoặc cá nhân.
+Year_Birth: Năm sinh
+Education: Trình độ học vấn
+Marital_Status: Tình trạng hôn nhân
+Income: Thu nhập hàng năm của khách hàng
+Kidshome: Số lượng trẻ em trong gia đình của khách hàng.
+Teenhome: Số lượng thiếu niên trong gia đình của khách hàng.
+Dt_Customer: Ngày khách hàng trở thành khách hàng của công ty.
+Recency: Số ngày kể từ lần giao dịch gần nhất của khách hàng.
+MntWines, MntFruits, MntMeat, MntFish, Sweet, Gold: Số tiền đã chi tiêu trên các sản phẩm
+NumDealsPurchases, NumWebPurchases, NumCatalogPurchases, NumStorePurchases: Số lượng mua hàng thông
qua các kênh khác nhau như các ưu đãi, trang web, catalog, và cửa hàng.
+NumWebVisitsMonth, AcceptedCmp1,2,3,4,5,Complain, Response, Z_CostContact, Z_Revenue.
I. Giới thiệu bài thuyết trình
2. Mô tả chung

• Dữ liệu sử dụng để phân tích và dự đoán hành vi của khách hàng.


• Bên cạnh đó, là phân cụm, phân nhóm khách hàng để đưa ra những chiến dịch marketing cụ thể
và thiết thực để tối đa hóa nguồn lực.
3. Trình tự và phương pháp phân tích dữ liệu

A. XỬ LÝ DỮ LIỆU:
• Dữ liệu trùng lặp (0)
• Xử lý dữ liệu bị thiếu
• Kiểm tra và loại bỏ outliers (1)
• Chọn các biến quan trọng
• Tách tập dữ liệu huấn luyện và kiểm tra

B. THỐNG KÊ MÔ TẢ:
• Đưa ra những đặc điểm nổi bật và khái quát về dữ liệu
C. PHÂN TÍCH RFM:

Là một mô hình phân tích và phân khúc khách hàng theo các đặc điểm hành vi tiêu dùng dựa trên các dữ liệu
giao dịch trong lịch sử. RFM là viết tắt của ba chỉ số quan trọng trong phân tích khách hàng:

• Recency (R): Đo khoảng thời gian từ giao dịch gần nhất của khách hàng đến thời điểm hiện tại. Khoảng thời
gian này càng lớn thì khả năng khách hàng rời bỏ công ty càng cao, ngược lại càng nhỏ thì khả năng tiếp cận
và bán hàng lại càng cao.

• Frequency (F): Đo tần suất mua sắm của khách hàng. Khách hàng mua hàng thường xuyên có khả năng cao
hơn để phản hồi với các chiến dịch của thương hiệu và trở thành khách hàng trung thành.

• Monetary (M): Đo tổng số tiền khách hàng đã chi tiêu cho thương hiệu trong một khoảng thời gian cụ thể.
Mức độ chi tiêu này cho biết khả năng chi tiêu của khách hàng và có thể dự đoán được mức giá trung bình của
mỗi giao dịch của họ.
3. Trình tự và phương pháp phân tích dữ liệu
D. PHÂN NHÓM ( CLASSIFICATION):
• Xây dựng một mô hình dự đoán và phân loại khách hàng dựa trên thu nhập/trình độ học vấn/tình trạng hôn
nhân/phương thức mua hàng và dựa trên mô hình đã phân cụm (clustering theo RFM)
=>Tên gọi (nhãn) của từng nhóm khách hàng dựa trên những dữ kiện trước đó.
=> Từ đó dễ dàng đưa ra được các chiến lược nhằm tối ưu hóa được nguồn lực trong kinh doanh một cách
nhanh chóng.

4. Mục tiêu bài thuyết trình


• Thông qua mô hình RFM, phân cụm(clustering), phân nhóm (classification) được các nhóm khách hàng và
đưa ra chiến lược phù hợp nhằm tối đa hóa nguồn lực kinh doanh
II. Thống kê mô tả:
• Phần chung:
A. So sánh các mặt hàng:
• Tổng số tiền khách hàng bỏ ra để mua
Wines chiếm hơn 50% tổng số tiền
(Monetary) mà khách hàng đã chi tiêu.
• Tổng số tiền khách hàng bỏ ra để mua
Meat Products chiếm khoảng 28% tổng số
tiền (Monetary) mà khách hàng đã chi
tiêu.
=> Wines, Meat Products là 2 mặt hàng được
ưa chuộng nhất.
• Phần chung:
B. Phương thức mua hàng:
• Khách hàng lựa chọn phương thức mua hàng
thông qua Catalog chỉ chiếm khoảng 21.27% trên
tổng số.
• Trong khi đó, phương thức mua hàng ở Store
chiếm tỉ trọng hơn gấp đôi (khoảng 46.2%) trên
tổng số các lựa chọn phương thức mua hàng, cũng
là phương thức được ưa chuộng nhất.
=> Mua ở Store > Mua qua web > Mua thông qua
Catalog
II. Thống kê mô tả:
2. Phần riêng:
2.1. Phân tích theo Marital Status:
A. Số lượng:

• Nhóm khách hàng chủ yếu: Married, Together,


Single - chiếm lần lượt 39%, 26%, 21% trên
tổng số khách hàng . Ba nhóm khách hàng này
cũng chính là nhóm khách hàng chủ yếu mang
lại nguồn Monetary ( 38%, 26%, 21% )
B. So sánh mặt hàng:
• Nhóm khách hàng Married
đều chi tiêu số tiền lớn nhất
trên tất cả các mặt hàng
(Wines, Fruits, Meat, Fish,
Sweet Products, Gold
Products) - chiếm khoảng
36%-39% trên tổng số mỗi
loại.

• Rượu là mặt hàng được nhóm khách hàng


Married ưa chuộng nhất.
II. Thống kê mô tả:
2. Phần riêng:
2.2. Phân tích theo Income:
A. Theo mặt hàng:
• Mặt hàng Wines, Meat products là mặt hàng mà các nhóm thu nhập ưa chuộng nhất lần lượt là 46%(1k-50k),
57%(50k-70k), 47%(70k-165k) đối với mặt hàng Wines và 23%(1k-50k), 22%(50k-70k), 32%(70k-165k) đối với
mặt hàng Meat Products.
• Các mặt hàng như Sweet Products, Fruits chiếm tỷ trọng khá nhỏ so với các mặt hàng khác trong các nhóm thu
nhập: 5%(1k-50k), 4%(50k-70k), 4%(70k-165k) đối với mặt hàng Fruits.
• Đặc biệt, nhóm thu nhập từ 50k-70k có số lượng mua Gold products cao nhất trong 3 nhóm thu nhập, cho thấy nhu
cầu của nhóm thu nhập này đối với mặt hàng Gold products là rất lớn.
II. Thống kê mô tả:
2. Phần riêng:
2.2. Phân tích theo Income:
B. Theo phương thức mua hàng:
• Việc mua hàng tại cửa hàng có xu hướng được ưa chuộng nhất đối với các nhóm thu nhập lần lượt là 46%(1k-
50k), 51%(50k-70k), 43%(70k-165k).
• Tuy nhiên hình thức mua sắm trên catalog đối với 2 nhóm thu nhập (1k-50k), (50k-70k) vẫn chiếm tỷ trọng khá ít
so với 2 hình thức còn lại lần lượt là 20%(1k-50k), và 11%(50k-70k). Nhóm có thu nhập cao từ 70k-165k mua
hàng bằng hình thức trên catalog có số lượng lớn hơn.
C. Theo Frequency:
• Nhóm thu nhập từ 1k-50k thường có xu hướng ít quay lại mua hàng hơn có trung bình số
lần quay lại mua hàng xấp xỉ khoảng 7 lần.

• Tuy nhiên những nhóm thu nhập từ 50k-70k và từ 70k-165k có xu hướng quay lại mua hàng
nhiều hơn lần lượt có trung bình số lần quay lại là xấp xỉ 16 lần và 19 lần.
II. Thống kê mô tả:
2. Phần riêng:
2.3. Phân tích theo Education
A. Theo thu nhập và số lượng:
• Từ 2 bảng số liệu trên ta thấy số lượng
khách hàng có tỉ lệ tương đương với thu
nhập của chính họ và người có trình độ
Graduation chiếm khoảng 50% về tổng thu
nhập cũng như số lượng.
2.3. Phân tích theo Education
B. Theo GDP:

• Những người lao động phổ thông có trình độ Basic có thu nhập thấp hơn hẳn so với tổng thu nhập bình quân
đầu người.
III. Phân cụm khách hàng:
• CHỌN SỐ CỤM BẰNG PHƯƠNG PHÁP ELBOW

• Để sử dụng được phương pháp phân cụm k-Means, chúng ta cần biết được số cụm.

• Phương pháp Elbow - được xem là phương pháp xác định số lượng cụm tối ưu trong thuật toán
gom cụm như k-Means.

• Bản chất của phương pháp của này là tìm một giá trị K sao cho sau giá trị đó, sự gia tăng tổng bình
phương khoảng cách giữa các điểm dữ liệu và trung tâm cụm trở nên ít đáng kể hơn.
Dựa vào Elbow để xác định số cụm như thế nào?
Chọn số K mà khi tăng K lên 1 đơn vị, Distortion giảm đi nhỏ hơn hẳn, do đó nên lựa số cụm K=4.
III. Phân cụm khách hàng:

2. SỬ DỤNG THUẬT TOÁN


PHÂN CỤM:
III. Phân cụm khách hàng:
3. GỌI TÊN CÁC NHÓM KHÁCH HÀNG:
Bảng dưới đây là giá trị R-F-M tương ứng của khách hàng được phân theo các cụm từ
0-3:
Hình ảnh 3 chiều trực quan về phân nhóm khách hàng:

• Nhóm 0 ( xanh dương ): R lớn, F nhỏ ,


M nhỏ.
→ Khách hàng có khả năng rời bỏ.
• Nhóm 1 ( tím ): R lớn, F lớn, M lớn.
→ Khách hàng trung thành.
• Nhóm 2 ( cam ): R nhỏ, F lớn, M lớn.
→ Khách hàng VIP.
• Nhóm 3 ( vàng ): R nhỏ, F nhỏ, M nhỏ.
→ Khách hàng gần đây.
4. PHẦN TRĂM CÁC NHÓM KHÁCH HÀNG:
• Số lượng và tỉ lệ của từng nhóm khách hàng trên tổng thể:

Nhóm KH có khả năng rời bỏ: 659 chiếm 30% Nhóm KH VIP: 443 chiếm 20%
Nhóm KH trung thành: 740 chiếm 33% Nhóm KH gần đây: 373 chiếm 17%
• Lấy ví dụ: Nếu bạn có 4 triệu KH và bạn muốn chạy quảng
IV. Mô hình dự đoán cáo dịch vụ trên SMS để giữ chân họ,

khách hàng rời bỏ: Tổng chi phí SMS là:

800 x 4M=3,2 tỷ VND

• Có thể thấy rằng chi phí này (chỉ riêng SMS) là một con số
cực kỳ lớn cho 1 chiến dịch, chưa kể đến quà tặng, chi phí
vận hàng,..

• Do đó, vấn đề đặt ra là phải giữ chân được các nhóm khách
hàng có khả năng rời bỏ bằng cách tìm được đúng phân
khúc khách hàng có nguy cơ rời bỏ cao để tiếp cận trước.
• Mô hình Classification: Dự đoán được
khách hàng rời bỏ hay quay lại dựa
trên thu nhập/trình độ học vấn/tình
trạng hôn nhân/tần suất mua hang ở
các phương thức khác nhau.

• Thử nghiệm trên 3 phương pháp:


Decision Tree, SVM và Logistic
Regression

• Decision Tree có độ chính xác đối với


nhóm KH quay lại là 98% và nhóm
KH rời bỏ là 96,3%.
• Từ mô hình dự đoán này, ta đã
có thể xác định trước nhóm
khách hàng có nguy cơ từ bỏ
sản phẩm và dịch vụ, từ đó đưa
ra những giải pháp và chiến
dịch phù hợp.
• CHÍNH SÁCH ĐỀ XUẤT:
A. Nhóm khách hàng có khả năng rời bỏ:
• Việc mua trực tiếp ở cửa hàng là phương pháp phổ biến và hiệu quả nhất (thể hiện ở số lần quay lại và số khách
hàng lớn nhất).
Từ đó cần phải tạo ra những trải nghiệm mua sắm độc đáo ở cửa hàng như: tạo ra nhiều quầy sản
phẩm dùng thử, nhân viên tư vấn sản phẩm tại quầy, những bảng quảng cáo thú vị nhằm thu hút khách hàng
hoặc những quà tặng đi kèm khi mua hàng.

• 87% khách hàng trong nhóm này thuộc nhóm có thu nhập trung bình thấp (<50k ):
Những yếu tố có thể thu hút họ: giá cả cạnh tranh, khuyến mãi và ưu đãi đặc biệt khi mua hàng, hình ảnh
truyền thông gần gũi và tạo ra nội dung giá trị (tạo ra nội dung chất lượng mà nhóm KH này có thể tận dụng, bao
gồm hướng dẫn sử dụng sản phẩm và dịch vụ, cách tiết kiệm tiền và các thông tin hữu ích khác).

• Đối mặt hàng được mua rượu và thịt và những mặt hàng có giá trị và là nguồn lợi nhuận chính của siêu thị.
Ưu đãi kết hợp ở 2 mặt hàng này như mua rượu được chiết khấu giá mua thịt và ngược lại hoặc mua rượu
được tặng thịt hoặc là giảm giá song song hoặc từng loại ở cả 2 mặt hàng.
• CHÍNH SÁCH ĐỀ XUẤT:
B. Nhóm khách hàng trung thành:

• Duy trì chất lượng sản phẩm và dịch vụ


• Lắng nghe những đóng góp và phản hồi
• Giải quyết vấn đề nhanh chóng
• Xây dựng môi quan hệ cá nhân với khách hang

• Mặc dù đây là nhóm KH khó rời đi, tuy nhiên khoảng thời gian giữa các lần mua hàng của họ
thường ở mức trung bình. Và để cải thiện điều này, cần đề ra những ưu đãi đặc biệt: Chương trình
khách hàng thân thiết và tri ân khách hàng là một gợi ý.
C. Nhóm khách hàng VIP:
• 85% khách hàng thuộc nhóm khách hàng VIP có thu nhập thuộc nhóm thu nhập cao (50.000 - 170.000) và 44%
trong số khách hàng VIP đã lựa chọn phương thức mua hàng tại cửa hàng.

Nên có những ưu tiên nhất định khi họ quay lại mua hàng, sự tiếp đãi chu đáo, cẩn thận, ….
Phải để khách hàng VIP cảm thấy giá trị của họ.

• Khoảng 40% khách hàng VIP thuộc nhóm đã có gia đình.


=> Đưa ra các combo bán hàng để đánh vào sự chú ý của nhóm khách hàng này.

• Lắng nghe những đóng góp và phản hồi, có các chiến lược để níu kéo họ: đem đến nhiều ưu đãi đặc biệt cho
khách hàng VIP: tổ chức các chương trình khách hàng thân thiết, tích điểm nhận quà, … để tiếp tục thu hút họ,
duy trì sự mua hàng.

• Tận dụng các kênh tốt nhất: email, SMS và quảng cáo nhắm mục tiêu tạo trải nghiệm khách hàng VIP.

• Có các chiến lược quảng cáo, liên tục cập nhật để giới thiệu đến cho mọi người biết cửa hàng con có các phương
thức mua hàng khác như: mua hàng qua Web, qua Catalog.
• CHÍNH SÁCH ĐỀ XUẤT:
D. Nhóm khách hàng gần đây:

• Nhóm khách hàng gần đây thuộc nhóm thu nhập thấp, 70% có
thu nhập từ 4.000-40.000 và 65% có gia đình. Chính sách được
đề xuất là:

+ Giá cả hợp lí và chương trình giảm giá


+ Bán hàng theo combo/hàng tặng kèm hữu ích
+ Chương trình thẻ thành viên tích điểm và đổi thưởng
+ Chính sách thanh toán linh hoạt
V. Kết luận
• Một số đặc điểm của doanh nghiệp bán lẻ:

+ Các sản phẩm được mua nhiều nhất là rượu và thịt


+ Phương thức mua hàng trực tiếp ở cửa hàng là hiệu quả nhất
+ Nhóm khách hàng đa dạng về học vấn, thu nhập. Gần 90% lượng khách hàng có trình độ từ
Graduation trở lên và thu nhập của họ cũng cao hơn vượt trội so với nhóm còn lại
• Phân cụm khách hàng thành 4 nhóm dựa trên mô hình RFM.

+ Khách hàng có khả năng rời bỏ


+ Khách hàng trung thành
+ Khách hàng VIP
+ Khách hàng gần đây

Trong 4 cụm KH này, nhóm KH trung thành chiếm tỉ lệ tương đối cao. Cho thấy được mô hình kinh
doanh bán lẻ vẫn giữ vững được một lượng khách hàng nhất định. Tuy nhiên, bên cạnh đó cần lưu ý lượng
khách hàng có khả năng rời bỏ cũng chiếm khoảng 30%
• Phân nhóm khách hàng (classification) thành hai nhóm: khách hàng có khả năng rời bỏ và nhóm khách
hàng có khả năng quay lại.

+ Qua nhiều lần thử và lựa chọn các phương pháp, mô hình Cây quyết định giúp dự đoán khách
hàng với độ chính xác cao nhất ( hơn 90% ).

• Chính sách đề xuất:


+ Đặt nhiều ưu đãi ở mặt hàng rượu(wine) và thịt (meat).

+ Duy trì và cải thiện dịch vụ giữ chân khách hàng. Cần có thêm các chương trình KH thân thiết và tri
ân khách hàng.

+ Thúc đẩy việc làm thẻ thành viên để khuyến khích người tiêu dùng mua hàng=> tích điểm=> đổi
thưởng.
Cảm ơn các bạn đã
lắng nghe !!!

You might also like