You are on page 1of 42

NGHIÊN CỨU MARKETING

XỬ LÝ VÀ
PHÂN TÍCH DỮ LIỆU

1
Mục tiêu:
• Hiểu được các khái niệm về xử lý dữ liệu
• Phác thảo các giai đoạn của quá trình xử lý dữ liệu
• Hiểu được bản chất của phân tích và giải thích dữ
liệu
• Xác định và mô tả được các phương pháp phân tích
dữ liệu
• Lựa chọn được các kỹ thuật xử lý dữ liệu

2
Nội dung chương

10.1 Xử lý dữ liệu

10.2 Phương pháp phân tích và giải thích dữ liệu

3
10.1. Xử lý dữ liệu

4
Khái niệm

 Xử lý dữ liệu là công việc diễn ra sau


quá trình thu thập dữ liệu
 Nhiệm vụ của việc xử lý dữ liệu là
chuyển các dữ liệu dưới dạng thô
thành dữ liệu tinh

5
Quá trình chuyển hóa dữ liệu

Dữ liệu Dữ liệu
thô tinh

6
Quy trình xử lý dữ liệu

1. Giá trị hóa dữ liệu

2. Mã hóa các câu trả lời

3. Hiệu chỉnh dữ liệu

4. Phân tích dữ liệu

5. Giải thích dữ liệu

7
Công việc chuẩn bị dữ liệu

 Kiểm tra tính hợp lệ của dữ liệu


 Hiệu chỉnh dữ liệu

8
Kiểm tra tính hợp lệ của dữ liệu

 Kiểm tra bảng câu hỏi đã được trả lời:


tính đầy đủ của bảng câu hỏi, việc ghi chép câu
trả lời…
 Kiểm tra tính logic của các câu trả lời
 Xem xét những chỉ dẫn về thủ tục phỏng vấn
 Kiểm tra tính trung thực của các câu trả lời

9
Hiệu chỉnh dữ liệu

 Liên hệ trực tiếp phỏng vấn viên để làm


sáng tỏ vấn đề: các câu trả lời không đọc
được, không rõ ý…
 Gặp và phỏng vấn lại đáp viên
 Suy luận từ các câu trả lời khác
 Loại bỏ toàn bộ bản câu hỏi và tiến hành
phỏng vấn lại

10
Mã hóa dữ liệu
 Mã hóa dữ liệu (coding) là quá trình chuyển đổi
các trả lời thành dạng mã số để nhập và xử lý
dễ dàng

 Được thực hiện trước hoặc sau khi phỏng vấn

 Các ký hiệu mã hóa cho các biến và các trả lời


được trình bày trong một sổ mã (code book)

 Dữ liệu mã hóa xong được nhập vào máy dưới


dạng một ma trận gọi là ma trận dữ liệu

11
Mã hóa dữ liệu trên bảng câu hỏi

Mã hóa câu hỏi đóng Mã hóa câu hỏi mở


• Gán các con số cho • Nhóm các câu trả lời có
các câu trả lời được cùng ý nghĩa
liệt kê sẵn trên bảng • Gán các con số cho các
câu hỏi nhóm trả lời

12
Mã hóa dữ liệu trên bảng câu hỏi
Câu hỏi một lựa chọn (SA)
• Thực hành ví dụ:
 Bạn đánh giá mức thu nhập hiện
nay của bạn như thế nào?
 quá thấp
 thấp
 trung bình
 cao
 rất cao
 không trả lời

13
Danh bạ mã hóa
hay sổ mã hóa
• Biến các trả lời thành các mã số, ký hiệu
mà máy tính hiểu được
• Giúp cho việc nhập liệu dễ dàng hơn
• Giúp nhà nghiên cứu trong việc phân tích
và diễn giải dữ liệu

14
Nội dung trong danh bạ mã hóa
• Số thứ tự của câu hỏi.
• Vấn đề của câu hỏi (thường là tóm tắt nội dung câu hỏi).
• Tên của biến số phát sinh từ câu hỏi
• Nhãn của biến số (variable label)
• Các giá trị mã hóa: là các giá trị mà biến số có thể nhận
được để biểu diễn thông tin được trả lời
• Nhãn giá trị mã hoá (Value Label) thường dùng để mô tả ý
nghĩa của các giá trị mã hóa.

15
STT Vấn đề Tên Mô tả Các giá trị Mô tả các giá trị mã
câu câu hỏi biến số biến số mã hóa hóa
hỏi
1 Vùng REGI Vùng địa lý 1 Hà Nội
phỏng vấn 2 Đà Nẵng
3 TP.HCM
4 Cần Thơ
2 Có sử dụng USE 1 Có
sữa rửa 2 Không
mặt không
3 Sử dụng BRAND Nhãn hiệu 1 Pond’s
nhãn hiệu đang dùng 2 Hazeline
nào?
3 Biore
4 Lana
5 Nivea
6 Naco
7 Loại khác
4 Sử dụng TIME Thời điểm 1 Sáng sớm khi thức dậy
sữa rửa sử dụng 2 Buổi sáng
mặt vào khi 3 Buổi trưa
nào?
4 Buổi chiều
5 Tối trước khi ngủ 16
Câu hỏi Ý nghĩa câu hỏi Giá trị Mô tả giá trị mã hóa
(biến) mã hóa

Q1 Giới tính đáp viên 1 Nam


2 Nữ
Q2 Nghề nghiệp đáp viên 1 Bác sĩ
2 Giáo viên
3 Nhân viên văn phòng
4 Công nhân
5 Hưu trí
6 Học sinh-sinh viên
7 Khác-----
----------- ----------------- ----------- ------------------------------

Q22a Đánh giá về bao bì 1 Kém


sản phẩm 2 Trung bình
Q20b Đánh giá về chất 3 Tốt
lượng sản phẩm 17
Ma trận dữ liệu
– Cột: là nơi quản lý các biến (các câu hỏi có trong
bảng câu hỏi)
– Loại câu hỏi một trả lời: chỉ cần một cột chứa các
giá trị trả lời
– Loại biến nhiều trả lời: nhiều cột chứa nhiều giá trị
trả lời có thể có
– Dòng: là nơi quản lý tất cả các quan sát (bằng kích
cỡ mẫu)
– Ô giao nhau giữa cột và dòng: là nơi chứa đựng giá
trị trả lời của một câu hỏi trong một quan sát cụ thể.

18
19
Các phương pháp xử lý dữ liệu
 Phương pháp thủ công

- Phương pháp kiểm đếm (Tallying)

- Phương pháp lựa ra và đếm (Sorting


and Counting)
 Phương pháp xử lý bằng máy tính

- SPSS
- Excel
Ưu & nhược điểm??? 20
10.2. Phương pháp phân tích và giải
thích dữ liệu

21
Phân tích Phân tích thống kê
thống kê sử dụng nhiều biến
miêu tả số

Thực hiện qua Phân tích thống


hai giai đoạn kê đơn biến
Thực hiện thủ Phân tích thống
công/phần mềm kê hai biến
máy tính
Lập bảng tần suất, Phân tích thống
bảng so sánh chéo kê nhiều biến

Phương pháp phân tích dữ liệu


Thống kê mô tả ( Descriptive Stactistics):

• Lập bảng tần suất và tính tỷ lệ phần trăm

• Đánh giá xu hướng hội tụ (Tính các đại lượng thống


kê mô tả)
• Lập bảng so sánh chéo
• Chuyển dịch dữ liệu về dạng thích hợp

23
Bảng tần số đơn giản
• Dùng để đếm tần số về các biểu hiện của một
thuộc tính
• Được thực hiện với cả biến định tính và định lượng
• Cần tiến hành gom biến trước khi lập bảng tần số
với các biến định lượng có nhiều giá trị

24
Bảng tần số về tuổi đáp viên
Cumulative 36 8 1.6 59.6
Frequency Percent Percent
Valid
37 6 1.2 60.8
18 9 1.8 1.8
38 16 3.2 64.0
19 8 1.6 3.4
39 14 2.8 66.8
20 16 3.2 6.6
40 18 3.6 70.4
21 19 3.8 10.4
41 10 2.0 72.4
22 22 4.4 14.8
42 16 3.2 75.6
23 26 5.2 20.0
43 7 1.4 77.0
24 29 5.8 25.8
44 6 1.2 78.2
25 21 4.2 30.0
45 10 2.0 80.2
26 15 3.0 33.0
46 12 2.4 82.6
27 13 2.6 35.6
28 19 3.8 39.4 47 7 1.4 84.0

29 16 3.2 42.6 48 8 1.6 85.6

30 17 3.4 46.0 49 8 1.6 87.2

31 10 2.0 48.0 50 12 2.4 89.6

32 18 3.6 51.6 51 3 .6 90.2

33 8 1.6 53.2 52 7 1.4 91.6


53 4 .8 25
92.4
34 9 1.8 55.0
54 10 2.0 94.4
Bảng tần số về độ tuổi đã được mã hóa lại

Cumulative
Frequency Percent Valid Percent Percent
Độ tuổi
18-25 150 30.0 30.0 30.0

58.0
26-35 140 28.0 28.0

80.2
36-45 111 22.2 22.2

100.0
46-60 99 19.8 19.8

Total 500 100.0 100.0


26
Tính các đại lượng thống kê

 Các đại lượng đo lường độ tập trung phổ biến

• Mean: Trung bình cộng

• Mode: Giá trị có tần số quan sát lớn nhất

• Median: Xu hướng trung tâm

• Minimum: Giá trị nhỏ nhất

• Maximum: Giá trị lớn nhất 27


Ví dụ:
Biết điểm số của 9 học sinh như sau:
75, 69, 88, 93, 95, 54, 87, 88, 27
Tìm:
+ Giá trị trung bình (mean)?
+ Giá trị trung vị (median)?
+ Giá trị mode?
+ GTLN (max)?
+ GTNN (min)? 28
29
Phương pháp phân tích thống
kê đơn biến

30
Khái quát về kiểm định giả
thuyết
Các bước thực hiện kiểm định giả thuyết:

Giả thiết thay


thế: H1

Giả thiết (6) Rút ra các kết luận liên quan đến giả thuyết “không”: bác bỏ
“không”: H0 hay chấp nhận giả thuyết này 31
Phương pháp kiểm định giả thiết

32
Phương pháp phân tích thống
kê đa biến

33
Phân tích thống kê hai biến

34
Phân tích thống kê nhiều biến

35
Để đánh giá mối liên hệ biến số độc lập và biến
số phụ thuộc nhà nghiên cứu thường …….

A. Kiểm định khi bình phương

B. Kiểm định phân phối Z trong so sánh hai tỷ lệ

C. Kiểm định phân phối t với so sánh hai trung


bình mẫu

D. Phân tích phương sai

E. Phân tích hồi quy


36
F. Kiểm định sự khác biệt
Củng cố
Unilever tiến hành điều tra mức độ hiểu biết về kem
đánh răng P/S trên một mẫu 550 người, với câu hỏi
Ông (bà) có biết về kem đánh răng P/S không? đã có
200/300 nữ giới và 180/250 nam giới biết về kem
đánh răng P/S.

Câu hỏi:
1. Lập bảng tần suất, lập bảng so sánh chéo giới
tính và hành vi mua sắm, tính tỷ lệ phần trăm các
câu trả lời theo giới tính.
2. Kiểm định giả thuyết mức độ hiểu biết về kem
đánh răng P/S với các nhóm giới tính khác nhau với
mức ý nghĩa α = 0,05 (Kiểm định khi bình phương).
37
Gợi ý
- Lập bảng tần suất
Trả lời Tần suất
Biết 380
Không biết 170
Tổng số 550
- Lập bảng so sánh chéo giới tính và hành vi
mua sắm
Biết Không biết Tổng số
Nam 180 70 250
Nữ 200 100 300
Tổng số 380 170 550
38
Gợi ý
-Tính tỷ lệ phần trăm các câu trả lời theo giới
tính
+ Theo dòng
Biết Không biết Tổng số
Nam 72% 28% 100%
Nữ 66,7% 33,3% 100%
+ Theo cột
Biết Không biết
Nam 47,4% 41,2%
Nữ 52,6% 58,8%
Tổng số 100% 100%
39
Gợi ý
2. Kiểm định giả thuyết mức độ hiểu biết về kem
đánh răng P/S với các nhóm giới tính khác nhau
với mức ý nghĩa α = 0,05.

b1. Giả thuyết Ho cho rằng mức độ hiểu biết về


kem đánh răng P/S phụ thuộc vào giới tính của
người được phỏng vấn. Giả thuyết thay thế, Hi là
không có sự phụ thuộc của mức độ hiểu biết về
kem đánh răng P/S vào giới tính.
b2. Chọn mức ý nghĩa a = 0,05
b3. Độ tự do (d.f) = (2-1) x (2-1) =1
40
Gợi ý
b4. Tính số thống kê kiểm định:
E11 = 380 x 300/100 = 1140;
E12 = 380 x 250/100 = 950;
E21 = 170 x 300/100 = 510;
E22 = 170 x 250/100 = 425
X2 = (200-1140)2/1140 + (180-950)2/950 + (100-
510)2/510 +(70-425)2/425 = 1944,6
b5. Từ bảng tính sẵn, với mức ý nghĩa a =0,05 và
độ tự do d.f =1 tra được trị số tới hạn bằng 3,84.
Như vậy, giả thuyết Ho bị loại. Mức độ hiểu biết
về kem đánh răng P/S không phụ thuộc vào giới
tính của người trả lời.
41
42

You might also like