Professional Documents
Culture Documents
KHOA KINH TẾ
CHƯƠNG 6
ĐO LƯỜNG VÀ THU THẬP DỮ LIỆU ĐỊNH LƯỢNG
1
1
Ý thức và mức độ
STT MSSV Họ và tên Nhiệm vụ
đóng góp
1
2
PowerPoint &
9 0021410970 Nguyễn Minh Trọn 100%
chỉnh sữa
2
3
MỤC LỤC
1. Tổng quan........................................................................................................................4
2. Đo lường và cấp độ thang đo trong nghiên cứu............................................................5
2.1. Cấp độ thang đo.......................................................................................................5
2.1.1. Thang đo cấp định danh....................................................................................6
2.1.2. Thang đo cấp thứ tự..........................................................................................7
2.1.3. Thang đo cấp quãng..........................................................................................8
2.1.4. Thang đo cấp tỉ lệ.............................................................................................11
2.2. Cấp thang đo và độ mạnh của chúng...................................................................13
2.3 Ưu và nhược điểm của từng loại thang đo............................................................14
2.3.1 Thang đo cấp định danh...................................................................................14
2.3.2. Thang đo thứ tự...............................................................................................14
2.3.3. Thang đo cấp quãng........................................................................................15
2.3.4 Thang đo cấp quãng.........................................................................................16
2.3.4. Thang đo cấp tỉ lệ.............................................................................................17
3. Công cụ thu thập dữ liệu..............................................................................................18
3.1. Bảng câu hỏi...........................................................................................................18
3.2. Qui trình thiết kế bảng câu hỏi.............................................................................19
4. Tổ chức thu thập dữ liệu định lượng...........................................................................28
4.1. Tuyển chọn nhân viên phỏng vấn.........................................................................28
4.2. Huấn luyện và hướng dẫn nhân viên phỏng vấn.................................................28
4.3. So sánh bảng câu hỏi giữa nghiên cứu định lượng và nghiên cứu định tính....29
5. Hiệu chỉnh dữ liệu........................................................................................................30
5.1 Kiểm tra và giám sát quá trình thu thập dữ liệu................................................31
5.1.1. Nguyên nhân gây sai sót trong thu thập dữ liệu...........................................31
5.1.2. Các bước hiệu chỉnh........................................................................................32
6. Chuẩn bị dữ liệu............................................................................................................33
6.1. Mã dữ liệu...............................................................................................................33
6.2. Ma trận dữ liệu.......................................................................................................34
6.3. Làm sạch dữ liệu....................................................................................................35
6.3.1. Ô trống..............................................................................................................35
3
4
4
5
1. Tổng quan
Phần tổng quan cho chương bài học về đo lường và thu thập dữ liệu định lượng nên bao
gồm các yếu tố sau:
- Giới thiệu chung về đo lường và thu thập dữ liệu định lượng: Mô tả về ý nghĩa và vai
trò của việc đo lường và thu thập dữ liệu định lượng trong nghiên cứu khoa học và
trong thực tế.
- Mục tiêu của chương: Trình bày mục tiêu cụ thể mà chương này nhằm đạt được, bao
gồm việc hiểu về các phương pháp đo lường và thu thập dữ liệu định lượng, cũng như
khả năng áp dụng chúng vào các nghiên cứu và ứng dụng thực tiễn.
- Các phương pháp đo lường định lượng: Mô tả về các phương pháp phổ biến được sử
dụng để đo lường các biến số định lượng trong nghiên cứu, bao gồm phương pháp
thang đo cấp thứ tự, thang đo cấp quãng và thang đo cấp tỉ lệ. Trong phần này, cần
trình bày cụ thể về cách thức áp dụng từng phương pháp, ưu và nhược điểm của
chúng.
- Quy trình thu thập dữ liệu định lượng: Đưa ra một cái nhìn tổng quan về quy trình thu
thập dữ liệu định lượng, bao gồm việc lựa chọn phương pháp thu thập, xây dựng câu
hỏi nếu áp dụng cho phương pháp khảo sát, và quy trình thực hiện thu thập dữ liệu một
cách chính xác và đáng tin cậy.
- Công cụ và kỹ thuật đo lường: Trình bày các công cụ và kỹ thuật thường được sử
dụng trong việc đo lường và thu thập dữ liệu định lượng, bao gồm các loại bảng câu
hỏi, kỹ thuật đo lường vật lý, máy móc hoặc phần mềm đo lường.
- Xử lý và phân tích dữ liệu: Đưa ra một cái nhìn tổng quan về quy trình xử lý và phân
tích dữ liệu định lượng sau khi thu thập, bao gồm các phương pháp thống kê cơ bản và
phân tích dữ liệu bằng các công cụ phân tích thống kê phổ biến.
- Ví dụ và ứng dụng: Cung cấp các ví dụ và ứng dụng thực tiễn để minh họa việc sử
dụng các phương pháp và kỹ thuật đo lường và thu thập dữ liệu định lượng trong các
tình huống khác nhau, từ nghiên cứu học thuật đến ứng dụng trong thực tiễn công
nghiệp hoặc quản lý.
5
6
- Tóm tắt và kết luận: Tổng kết lại những điểm chính và nhấn mạnh vào ý nghĩa của
việc hiểu và áp dụng các phương pháp đo lường và thu thập dữ liệu định lượng trong
nghiên cứu và thực tiễn.
6
7
cấp thích hợp cho từng biến. Vì vậy khi dùng cấp thang đo nào chúng ta cần chú ý đến
phương pháp phân tích theo sau.
2.1.1. Thang đo cấp định danh
- Thang đo định danh dùng số đo để tượng trưng cho một nhãn, nhằm phân loại đối tượng
đo. Số của thang đo này tượng trưng cho một tên nên không thể dùng một giá trị để biểu
diễn 2 đối tượng khác nhau cũng như không thể phân tích thống kê cho dữ liệu thu thập
bởi kiểu thang đo này. Các dạng thường gặp của thang đo cấp định danh là:
- Câu hỏi một lựa chọn là các câu hỏi trong đó người trả lời dùng chỉ được chọn một trong
các trả lời (single answer) cho sẵn. Ví dụ, trong các câu hỏi và thang đo trả lời sau đây:
Bạn thích học các nghành nào trong các ngành sau?
Marketing 1
Quản trị 2
Kế toán 3
Tài chính 4
Kinh tế 5
Trong các loại chất đốt dưới đây, loại chất đốt nào bạn sử dụng thường xuyên nhất?
Gas 1
Điện 2
Than 3
Củi 4
Pepsi 1
7
8
Tribeco 2
Coke 3
Sprite 4
7 up 5
Pepsi ...
Tribeco ...
Coke ...
Sprite ...
7 up ...
Fanta ...
... ...
Bạn vui lòng xếp thứ tự theo sở thích của bạn các thương hiệu nước ngọt sau theo cách
thức sau đây: (1) thích nhất, (2) thích thứ nhì, vv.
- Câu hỏi so sánh cặp (paired comparison) Trong các câu hỏi so sánh cặp người trả lời
được yêu cầu chọn một trong một cặp, chẳng hạn như chọn một thương hiệu thích nhất
trong hai thương hiệu, chọn một bao bì thích nhất trong hai dạng bao bì, vv. Ví dụ, trong
câu hỏi và thang đo trả lời sau: Trong từng cặp thương hiệu nước ngọt dưới đây, xin bạn
vui lòng đánh số 1 vào thương hiệu bạn thích hơn trong một cặp?
Coke ... Pepsi ...
8
9
Hãy cho biết thái độ của bạn trong phát biểu: “Nước rữa chén nên có màu vàng tranh”
- Thang đo Likert được thường được dùng để đo lường một tập các phát biểu của một
khái niệm. Số đo của khái niệm là tổng các điểm của từng phát biểu. Một cách chính xác,
chúng ta chỉ được phép lấy tổng khi nó có tính đơn nguyên (unidimensionality; Gerbing
& Anderson 1988; chúng ta sẽ xem xét chi tiết hơn về vấn đề này trong chương sau). Vì
vậy thang đo Likert còn được gọi là thang đo lấy tổng (summated scale). Đây là thang đo
phổ biến nhất trong đo lường các khái niệm nghiên cứu trong ngành kinh doanh. Ví dụ để
đo lường tính vị chủng của người tiêu dùng chúng ta phỏng vấn họ bằng cách hỏi với
thang đo trả lời sau:
- Hãy cho biết mức độ đồng ý của bạn đối với các phát biểu sau đây:
Hoàn
Hoàn toàn
Phát biểu Phản đối Trung dung toàn đồng
phản đối Đồng ý
ý
Chuộng mua hàng nhập
ngoại không là hành vi
1 2 3 4 5
đúng đắn của người
Việt Nam
Ủng hộ mua hàng nhập
ngoại là góp phần làm
1 2 3 4 5
một số người Việt bị
mất việc làm
Người Việt Nam chân
chính luôn mua hàng 1 2 3 4 5
sản xuất tại Việt Nam
Mua hàng nhập ngoại
chí giúp cho người 1 2 3 4 5
nước ngoài làm giàu
10
11
- Về mặt lý thuyết, thang đo Likert là thang đo thứ tự và đo lường mức độ đồng ý của đối
tượng nghiên cứu. Nghĩa là biến thiên của các trả lời từ hoàn toàn phản đối (không đồng
ý) đến hoàn toàn đồng ý. Tuy nhiên, nếu số đo từ năm điểm trở lên thì kết quả kiểm định
thực tiễn cho thấy thang đo Likert có tính năng như thang đo quãng (Dunn-Rankin 1983).
Vì vậy, trong thực tiễn nghiên cứu, thang đo Likert được xem như là thang đo quãng. Nếu
thiết kế trả lời chỉ ở hai cực dùng để đo lường mức độ đồng ý của đối tượng nghiên cứu
thì nó cũng được gọi là thang đo Likert hay dạng Likert (Likert-type scale). Ví dụ, thang
đo thành phần Lạc quan (optimism) trong thang đo Năng lực tâm lý của nhân viên
marketing (Nguyen & Nguyen 2012) như sau:
11
12
- Chú ý cách xây dựng thang đo dạng quãng này, chúng ta nhận thấy sự tương đồng với
thang đo nhiệt độ (C) trong khoa học tự nhiên: lấy điểm đầu, vd, 1 và điểm cuối, vd, 5 rồi
chia chúng ra làm bốn khoảng đều nhau.
- Thang đo đối nghĩa (Semantic Differential) tương tự thang đo Likert nhưng nhà nghiên
cứu chỉ dùng hai nhóm từ ở hai cực có ý nghĩa trái ngược nhau trong mục hỏi nên còn
được gọi là "thang đo tĩnh từ cực". Khi dùng các cặp từ như thuận lợi – không thuận lợi,
dễ chịu – không dễ chịu thì gọi là tĩnh từ cực đơn, và khi dùng cặp từ như thuận lợi – bất
lợi, hiện đại – lỗi thời thì gọi là tĩnh từ cực cặp. Ví dụ, trong câu hỏi với thang đo trả lời
sau:
Xin bạn vui lòng cho biết thái độ của bạn đối với thương hiệu sữa đặc có đường Ông Thọ:
- Thang đo Stapel là thang đo kết hợp của thang đo cặp tĩnh từ cực với số đo, trong đó
nhà nghiên cứu chỉ dùng một phát biểu ở trung tâm thay vì hai phát biểu đối nghịch nhau
ở hai cực.
- Ví dụ câu hỏi với thang đo Stapel như sau: Hãy cho biết đánh giá của bạn đối với thái
độ nhân viên bán hàng (mức độ thân thiện) ở cửa hàng bán thức ăn nhanh. Chọn số dương
nếu bạn nghĩ phát biểu mô tả đúng thái độ của bạn. Chọn số âm nếu bạn nghĩ phát biểu
không mô tả đúng thái độ của bạn, số càng âm mức độ không đúng càng tăng.
Hãy cho biết đánh giá của bạn đối với thái độ nhân viên bản hàng ở cửa hàng XYZ:
so sánh sự khác biệt của đối tượng đo. Thang đo tỷ lệ không chỉ cho biết sự khác biệt giữa
2 và 5 bằng sự khác biệt giữa 14 và 17 mà nó còn cho biết ung 14 thì gấp 7 lần của 2 vì
biết giá trị gốc 0.
- Một dạng khác của thang đo tỉ lệ là thang đo tổng hằng số không đổi. Với thang đo này,
câu trả lời được yêu cầu chia một số điểm theo một vài thuộc tính để cho biết mối quan hệ
nào là quan trọng. Dạng này cũng được ung để đánh giá tầm quan trọng của thuộc tính
như được trình bày ở câu hỏi sau đây.
- Hãy phân bổ 100 điểm đánh giá cho các đặc điểm của dịch vụ phân phối tại một công ty
giao nhận.
Hóa đơn chính xác ______ điểm.
Uy tín ______ điểm.
Giá cả phải chăng ______ điểm.
- Ví dụ trong câu hỏi và trả lời (sau khi phỏng vấn một người tiêu dùng và số đo nhận
được) sau: Hãy chia 100 điểm cho các thương hiệu sau đây theo đánh giá của ban.
Thương hiệu A B C D
Điểm 30 25 35 10
Thứ tự Thứ tự các con số (0 < 1 < 2 < … < Thái độ Xếp loại
2
9) Sở thích Số trung vị
Khoảng Đẳng thức về hiệu số hay các khác Thái độ Dữ liệu thu được có thể xử
3
biệt bằng nhau (2 – 1 = 7 – 6 = 1) Chỉ số lý, phân tích thống kê.
13
14
Tỉ lệ Đẳng thức về tỉ lệ hay bằng nhau Chi phí Dữ liệu thu được có thể xử
giữa các tỉ số (2/4 = 4/8 = 0.5) Số khách hàng lý, phân tích thống kê.
4
Doanh số
- Như vậy, chúng ta đã chuyển đổi số đo trong thang đo cấp tỉ lệ sang số đo trong thang
đo cấp quãng. Chú ý là số đo sau khi chuyển đôi có giá trị từ 1 đến 7. Điều này có nghĩa
là những người có thu nhập từ 2 triệu đồng/tháng đến <4 triệu đồng/tháng sẽ có số đo mới
trong thang đo cấp quãng là 1. Tương tự như vậy, những người có thu nhập từ 4 triệu
đồng/tháng đến < 6 triệu đồng/tháng sẽ có số đo mới trong thang đo cấp quãng là 2, vv.
2.3 Ưu và nhược điểm của từng loại thang đo
2.3.1 Thang đo cấp định danh
Thang đo cấp định danh là một phương pháp để xác định các yếu tố hoặc đặc điểm của
một đối tượng hoặc hệ thống thông qua việc gán cho chúng một danh tính duy nhất. Dưới
đây là một số ưu và nhược điểm của thang đo cấp định danh:
Ưu điểm:
- Dễ quản lý: Mỗi đối tượng có một danh tính duy nhất, điều này giúp dễ dàng quản lý
và theo dõi thông tin về chúng.
- Truy cập dữ liệu nhanh chóng: Khi một đối tượng được xác định bằng một cấp định
danh duy nhất, việc truy cập dữ liệu liên quan đến đối tượng đó trở nên nhanh chóng và
hiệu quả.
- Đảm bảo tính nhất quán: Mỗi đối tượng đều có một danh tính duy nhất, giúp đảm bảo
tính nhất quán trong quá trình xử lý dữ liệu.
- Bảo mật dữ liệu: Thang đo cấp định danh có thể được sử dụng để bảo vệ thông tin cá
nhân bằng cách giữ danh tính của đối tượng ẩn danh.
Nhược điểm:
- Sự trùng lặp: Đôi khi có thể xảy ra sự trùng lặp danh tính, đặc biệt khi hệ thống phát
triển lớn và phức tạp.
- Khó khăn trong việc quản lý độc đáo: Quản lý các danh tính độc đáo có thể trở nên
phức tạp, đặc biệt khi có nhiều hệ thống hoặc đối tượng phức tạp.
15
16
- Khả năng xâm phạm quyền riêng tư: Nếu thông tin danh tính không được quản lý một
cách an toàn, có thể dẫn đến việc xâm phạm quyền riêng tư của người dùng.
- Giới hạn trong việc mở rộng: Thang đo cấp định danh có thể gặp khó khăn trong việc
mở rộng đối với các hệ thống lớn hoặc có sự phát triển nhanh chóng.
2.3.2. Thang đo thứ tự
Thang đo cấp thứ tự là một phương pháp đo lường hoặc xếp hạng các yếu tố theo thứ tự
tăng dần hoặc giảm dần của chúng. Dưới đây là một số ưu và nhược điểm của phương
pháp này:
Ưu điểm:
- Dễ hiểu và sử dụng: Phương pháp cấp thứ tự dễ hiểu và sử dụng, vì người đánh giá
chỉ cần xếp hạng các yếu tố theo thứ tự ưu tiên hoặc quan trọng của họ.
- Tính linh hoạt: Cấp thứ tự cho phép người đánh giá tập trung vào việc so sánh và xếp
hạng các yếu tố một cách linh hoạt, mà không cần phải đo lường chính xác.
- Thích ứng với sự biến đổi: Phương pháp này có thể dễ dàng thích ứng với sự biến đổi
trong các tiêu chí đánh giá, do đó thích hợp cho các tình huống mà các yếu tố có thể
thay đổi theo thời gian.
- Đánh giá toàn diện: Bằng cách xếp hạng các yếu tố theo thứ tự, phương pháp này có
thể cung cấp cái nhìn tổng quan về sự quan trọng hoặc ưu tiên của mỗi yếu tố trong
một tập hợp.
Nhược điểm:
- Không đo lường chính xác: Phương pháp này không cung cấp thông tin về mức độ
khác biệt giữa các yếu tố hoặc mức độ ảnh hưởng của chúng đối với kết quả cuối cùng.
- Tính chủ quan: Xếp hạng các yếu tố có thể phụ thuộc vào quan điểm cá nhân của
người đánh giá, dẫn đến tính chủ quan trong kết quả.
- Giới hạn trong việc so sánh: Phương pháp này không cho phép so sánh chính xác
giữa các yếu tố, đặc biệt là khi có sự khác biệt lớn về mức độ giữa chúng.
- Khó khăn trong việc xác định mức độ khác biệt: Đôi khi có thể khó khăn để xác định
mức độ khác biệt giữa các yếu tố khi chúng được xếp hạng, đặc biệt là khi các yếu tố
có sự tương đồng lớn về mức độ quan trọng.
16
17
- Không đo lường được mức độ sự khác biệt: Việc sắp xếp các giá trị theo thứ tự không
cho phép đo lường mức độ sự khác biệt giữa chúng. Điều này làm giảm tính chính xác
của quá trình đánh giá.
- Khó khăn trong việc thực hiện các phép toán: Vì không có thông tin về khoảng cách
giữa các giá trị, việc thực hiện các phép toán như trung bình hay phương sai trở nên
khó khăn hoặc vô nghĩa.
18
19
- Sự hiểu lầm trong việc so sánh: Mặc dù có thể so sánh vị trí tương đối của các yếu tố,
nhưng không có đủ thông tin để đảm bảo rằng sự khác biệt giữa chúng là như nhau.
Điều này có thể dẫn đến sự hiểu lầm khi so sánh các giá trị.
2.3.4. Thang đo cấp tỉ lệ
Thang đo cấp tỉ lệ là một phương pháp đo lường hoặc đánh giá các yếu tố theo tỉ lệ so
sánh với một tiêu chuẩn cụ thể. Dưới đây là một số ưu và nhược điểm của phương pháp
này:
Ưu điểm:
- Dễ hiểu và sử dụng: Phương pháp cấp tỉ lệ dễ hiểu và sử dụng, vì nó dựa trên việc so
sánh với một tiêu chuẩn hoặc mức độ cụ thể.
- Tính linh hoạt: Cấp tỉ lệ cho phép so sánh và đánh giá các yếu tố khác nhau trong
một phạm vi rộng lớn, từ các yếu tố kỹ thuật đến các yếu tố chất lượng hoặc hiệu suất.
- Tính khách quan: Khi sử dụng cùng một tiêu chuẩn để đo lường, phương pháp cấp tỉ
lệ có thể giúp tạo ra các kết quả khách quan, giúp dễ dàng so sánh giữa các đối tượng
hoặc hệ thống khác nhau.
- Dễ dàng so sánh: Phương pháp này cho phép dễ dàng so sánh giữa các yếu tố khác
nhau trong cùng một hệ thống hoặc giữa các hệ thống khác nhau.
Nhược điểm:
- Phụ thuộc vào tiêu chuẩn: Kết quả của phương pháp cấp tỉ lệ phụ thuộc mạnh vào tiêu
chuẩn được sử dụng để so sánh, và việc lựa chọn tiêu chuẩn có thể ảnh hưởng đến tính
chính xác của kết quả.
- Khả năng đo lường hạn chế: Phương pháp này không phản ánh được mọi khía cạnh
của một đối tượng hoặc hệ thống, và có thể bỏ sót các yếu tố quan trọng nếu không
được chú ý đến.
- Khả năng chủ quan: Việc đánh giá và so sánh các yếu tố dựa trên tiêu chuẩn có thể bị
ảnh hưởng bởi quan điểm cá nhân của người đánh giá, dẫn đến tính chủ quan trong kết
quả.
19
20
- Khó khăn trong việc xác định tỉ lệ chính xác: Đôi khi có thể khó khăn trong việc xác
định tỉ lệ chính xác của các yếu tố so với tiêu chuẩn, đặc biệt là khi các yếu tố không
thể đo lường hoặc đánh giá một cách chính xác.
20
21
thông tin cần cho dự án và dữ liệu sẽ được thu thập. Như vậy, khi thiết kế bảng câu hỏi
chúng ta phải dựa vào vấn đề nghiên cứu và nhu cầu thông tin đã xác định để thiết kế
các câu hỏi cho việc thu thập các dữ liệu này.
Bước 2. Xác định dạng phỏng vấn
- Có bốn dạng phỏng vấn chính dùng trong nghiên cứu, đó là phỏng vấn (1) trực diện
(2) qua điện thoại (3) bằng cách gửi thư, và (4) thông qua mạng Internet (bao gồm thư
điện tử e-mail).
- Như chúng ta đã biết, phỏng vấn trực diện là dạng phỏng vấn mà nhà nghiên cứu dùng
nhân viên phỏng vấn đến nhà đối tượng phỏng vấn hay mời họ đến một địa điểm nhất
định để phỏng vấn. Phỏng vấn trực diện có nhiều ưu điểm. Do phỏng vấn viên tiếp xúc
trực tiếp với người trả lời nên họ có thể kích thích sự trả lời, giải thích các câu hỏi mà
người trả lời chưa hiểu hay hiểu sai. Như vậy, suất trả lời (response rate) và suất hoàn
tất của bảng câu hỏi sẽ cao (cao nhất trong ba dạng phỏng vấn).
- Tuy nhiên, dạng phỏng vấn này cũng có một số nhược điểm. Một là sự hiện diện của
phỏng vấn viên có thể làm ảnh hưởng đến các trả lời của đối tượng phỏng vấn. Hai là
chi phí cho dạng phỏng vấn này rất cao. Hơn nữa nếu việc quản lý thu thập dữ liệu tại
hiện trường không chặt chẽ thì sẽ xuất kiện khả năng phỏng vấn viên tự điền3 vào bảng
câu hỏi. Khi thiết kế bảng câu hỏi, dạng phỏng vấn này không đòi hỏi mức độ chi tiết
cao như dạng phỏng vấn bằng điện thoại hay bằng thư. Hơn nữa, dạng phỏng vấn này
cho phép phỏng vấn viên sử dụng các trợ vấn cụ khi cần thiết.
- Phỏng vấn thông qua điện thoại giúp giảm chi phí phỏng vấn hơn so với dạng phỏng
vấn trực diện. Tuy không trực tiếp tiếp xúc với người trả lời như trong dạng phỏng vấn
trực diện nhưng phỏng vấn viên vẫn có khả năng giải thích, kích thích sự hợp tác của
người trả lời mà ít làm ảnh hưởng đến các trả lời của họ.
- Suất trả lời và suất hoàn tất ở dạng phỏng vấn bằng điện thoại tuy không bằng dạng
phỏng vấn trực diện nhưng cũng khá cao. Tuy nhiên, trong những thị trường mà đối
tượng nghiên cứu không có điện thoại thì không thể dùng dạng phỏng vấn này. Bảng
câu hỏi cho dạng phỏng vấn qua điện thoại đòi hỏi mức độ chi tiết cao hơn so với dạng
21
22
phỏng vấn trực tiếp. Phỏng vấn viên chỉ có thể giải thích bằng lời chú không thể dùng
các trợ vấn cụ.
- Phỏng vấn bằng cách gửi thư đến đối tượng nghiên cứu để họ tự đọc các câu hỏi và trả
lời chúng đòi hỏi cao nhất về mức độ chi tiết và rõ ràng của bảng câu hỏi. Nếu bảng câu
hỏi không rõ ràng, chi tiết và dễ hiểu, người trả lời sẽ không hiểu hoặc hiểu sai câu hỏi.
- Suất trả lời và hoàn tất trong dạng phỏng vấn này rất thấp và thời gian thu thập thường
kéo dài nên ít được dùng trong nghiên cứu ứng dụng (nghiên cứu để ra quyết định kinh
doanh như nghiên cứu thị trường). Tuy nhiên, đây là dạng phỏng vấn phổ biến trong
nghiên cứu khoa học hàn lâm vì nó có một số ưu điểm. Một là nếu suất trả lời cao thì
chi phí sẽ thấp. Hơn nữa, các trả lời không bị tác động bởi sự hiện diện của phỏng vấn
viên cũng như tránh được hiện tượng tự diễn trả lời của phỏng vấn viên.
- Trợ vấn cụ là các công cụ trợ giúp cho việc phỏng vấn dễ dàng và hiệu quả hơn.
Chúng có nhiều dạng khác nhau, có thể là hình ảnh, mẫu, vv.
- Trong nghiên cứu tại thị trường quốc tế, nhà nghiên cứu cũng cần chú ý đến việc
phỏng vấn bằng điện thoại. Có những thị trường việc phỏng vấn bằng điện thoại là điều
không thể được, ví dụ như tại Nhật và Hàn Quốc.
- Phỏng vấn thông qua mạng Internet có ưu điểm là nhanh và ít tốn kém. Tuy nhiên hiện
nay phương pháp này chưa được phổ biến, suất trả lời còn rất thấp, ngay cả tại những
nước đã phát triển (Simsex & Veiga 2000). Hơn nữa, chúng ta rất khó kiểm tra đối
tượng khảo sát để họ có thuộc vào thị trường nghiên cứu của chúng ta không? (có thể
có nhiều trả lời của đối tượng không thuộc vào thị trường chúng ta nghiên cứu nhưng
chúng ta không biết để loại bỏ các trả lời này).
Bước 3. Đánh giá nội dung câu hỏi
- Nội dung của câu hỏi ảnh hưởng đến khả năng hợp tác của người trả lời: tạo điều kiện
cho họ mong muốn tham gia và trả lời trung thực. Cần chú ý là người trả lời không
được chuẩn bị trước về vấn đề chúng ta muốn hỏi và họ thường hay quên. Hơn nữa, có
những dữ liệu người trả lời rất miễn cưỡng cung cấp như tuổi tác, thu nhập, vv, chúng
ta cần có cách hỏi thích hợp nhưng thỏa mãn mục tiêu nghiên cứu của mình. Để đánh
giá nội dung các câu hỏi, nhà nghiên cứu phải tự trả lời các câu hỏi sau:
22
23
< 18 tuổi 1
18 - 25 tuổi 2
26 - 35 tuổi 3
>35 tuổi 4
- Khi hỏi đối tượng nghiên cứu thuộc nhóm tuổi nào, chúng ta dễ dàng nhận được sự
hợp tác của họ hơn là hỏi tuổi chính xác của họ. Hơn nữa, chúng ta chỉ cần biết họ
thuộc nhóm tuổi nào chú không cần biết chính xác là họ bao nhiêu tuổi.
Bước 4. Xác định hình thức trả lời
- Có hai hình thức trả lời chính (1) trả lời cho các câu hỏi đóng (closed—end questions)
và (2) trả lời cho các câu hỏi mở (open-ended questions).
- Câu hỏi đóng là các câu hỏi có các trả lời cho sẵn và người trả lời sẽ chọn một hay
nhiều trả lời trong các trả lời đó. Có nhiều dạng câu hỏi đóng như:
1. Dạng câu hỏi đề nghị người trả lời chọn một trong hai: có hoặc không
(dichotomous). Ví dụ trong câu hỏi và thang đo trả lời như
sau: Bạn có dùng đầu gội đầu trị gàu không?
Có 1
Không 2
2. Dạng câu hỏi đề nghị người trả lời xếp thứ tự (ranking).
Ví dụ trong câu hỏi và trả lời như sau: Hãy xếp thứ tự múc độ ảnh hưởng đến quyết
định mua hàng của bạn của các yếu tố sau đây: (yếu tố nào quan trọng nhất đánh số 1,
kém hơn đánh số 2, vv, và ít quan trọng nhất đánh số 5)
23
24
Rejoice ...
Pantene ...
Spring ...
Fresh bồ kết ...
Sunsilk ...
Vv... ...
- Câu hỏi mở là các câu hỏi không có câu trả lời sẵn. Người trả lời hoàn toàn tự do
diễn đạt các trả lời của mình. Lấy ví dụ: Lý do nào bạn thích sử dụng dầu gội 2 trong
1? Trả lời ... [đây là dạng câu hỏi mở này thường được gọi là câu hỏi cho câu trả lời tự
do (free response)].
- So với câu hỏi đóng, câu hỏi mở có ưu điểm cơ bản là người trả lời được tự do diễn
đạt hành vi, thái độ của mình, không bị ràng buộc bởi những trả lời cho sẵn như trong
câu hỏi đóng mà nhiều khi họ cảm thấy chưa thật phù hợp với mình. Điều này có thể
dẫn đến tình trạng miễn cưỡng chấp nhận các trả lời đã cho sẵn. Thông thường, nhà
nghiên cứu định lượng thường sử dụng các nghiên cứu khám phá định tính để xác định
các trả lời cho câu hỏi đóng dễ dàng và phù hợp hơn.
24
25
- Như vậy, dữ liệu thu thập được từ câu hỏi mở thường phong phú hơn so với dữ liệu
thu thập được từ câu hỏi đóng. Hơn nữa, các câu hỏi mở ở dạng đào sâu sẽ giúp nhà
nghiên cứu thu được những thông tin ‘bên trong của người đối tượng nghiên cứu. Tuy
nhiên, câu hỏi mở cũng có những nhược điểm so với câu hỏi đóng. Một là, các trả lời
cho các câu hỏi mở thường bị chệch do phỏng vấn viên tóm tắt các trả lời hơn là ghi
đầy đủ những gì người trả lời diễn đạt. Hơn nữa, việc phỏng vấn, hiệu chỉnh và mã dữ
liệu cho các câu hỏi mở tốn kém nhiều thời gian, công sức hơn là các câu hỏi đóng. Vì
vậy, câu hỏi mở được dùng chủ yếu trong nghiên cứu định tính (Chương 3) và câu hỏi
đóng được tận dụng trong nghiên cứu định lượng (Chương 4). Cũng cần chú ý là trong
nghiên cứu định lượng câu hỏi sử dụng chính là các câu hỏi đóng, có cấp độ đo rõ ràng
và được xác định trước. Tuy nhiên, nhà nghiên cứu cũng sử dụng một số (hạn chế) câu
hỏi mở để khám phá thêm một vài điểm nào đó (một dạng nghiên cứu hỗn hợp).
Bước 5. Xác định cách dùng thuật ngữ
Khi sử dụng thuật ngữ trong các câu hỏi cần chú ý những nguyên tắccơ bản sau:
1. Dùng từ đơn giản và quen thuộc cho các câu hỏi trong bảng câu hỏi. Phải sử dụng
thuật ngữ phù hợp với từng thị trường nghiên cứu. Nhiều vùng khác nhau trong một
quốc gia cũng thường hay sử dụng những từ khác nhau cho cùng một sự việc hay đồ
vật nên chúng ta cần chú ý dùng những từ mà vùng đó quen thuộc nhất, vv.
2. Tránh câu hỏi dài dòng, từ ngữ càng chi tiết, cụ thể và rõ ràng càng tốt. Không nên
lạm dụng các câu hỏi quá dài, tối nghĩa. Khi dùng một từ cần xem xét nó có nghĩa nào
khác có thể làm người trả lời hiểu nhầm.
3. Tránh câu hỏi cho hai hay nhiều trả lời cùng một lúc (double-barreled question). Ví
dụ khi chúng ta hỏi: Kem Kido's có ngon và bổ dưỡng không? thì hai trả lời sẽ xuất
hiện cùng một lúc cho một mức trả lời. Đây là hai câu hỏi được ghép lại và trong
trường hợp này chúng ta nên tách ra làm hai câu hỏi:
Ngon và bổ dưỡng 1
Ngon nhưng không bổ dưỡng 2
Không ngon nhưng bổ 3
25
26
4. Tránh câu hỏi gợi ý (leading question) kích thích người trả lời phản xạ theo hướng
đã dẫn trong câu hỏi. Ví dụ khi chúng ta hỏi: Bạn có đồng ý là sữa đặc có đường
thương hiệu Cô Gái Hà Lan là loại sữa có chất lượng cao nhất không? Trong câu hỏi
này nhà nghiên cứu đã dẫn ý cho người trả lời về quan điểm chất lượng của thương
hiệu.
5. Tránh câu hỏi có thang trả lời không cân bằng (loaded question). Ví dụ, khi chúng ta
hỏi: Bạn có thích sữa đậu nành Tribeco không? với thang trả lời dưới đây sẽ làm chệch
thái độ của người trả lời về hướng thích:
6. Tránh câu hỏi bắt người trả lời phải ước đoán. Ví dụ, khi chúng ta hỏi: Bạn mua bao
nhiêu cục xà bông tắm trong năm qua? thì người trả lời không thể nào nhớ được dữ liệu
họ có. Như vậy họ phải ước đoán cho trả lời của họ.
26
27
- Chúng ta xếp các phần của bảng câu hỏi theo thứ tự nếu trên vì do mục đích và tính
chất của chúng trong đo lường. Một là, phần gạn lọc luôn luôn phải được đặt đầu tiên vì
mục đích của nó là gan lọc đúng đối tượng phỏng vấn để thu thập dữ liệu trong các phần
tiếp theo. Nếu đối tượng phỏng vấn không đáp ứng được yêu cầu thì chúng ta cần phải
ngưng phỏng vấn để tránh lãng phí thời gian (nếu chúng ta tiếp tục phỏng vấn rồi loại nó
trong quá trình hiệu chỉnh) cho nhân viên phỏng vấn cũng như đối tượng phỏng vấn.
Lấy ví dụ, chúng ta cần phỏng vấn trưởng phòng marketing của doanh nghiệp nhưng đối
tượng chúng ta tiếp cận được lại là một nhân viên marketing, hoặc chúng ta cần phỏng
vấn người ra quyết định chính trong mua hàng trong gia đình, nhưng đối tượng tiếp cận
được lại chỉ là một thành viên trong gia đình, không phải là người ra quyết định chính
trong mua mặt hàng chúng ta đang nghiên cứu.
- Hai là, phần thông tin cá nhân của đối tượng phỏng vấn là phần tế nhị trong thu thập.
Vì vậy, nếu chúng ta phỏng vấn trước, người trả lời có thể sẽ từ chối vì họ không muốn
cung cấp thông tin các nhân của họ (vd, tuổi Thu nhập). Hoặc là, họ vẫn tham gia nhưng
rất miễn cưỡng. Vì vậy, thông tin họ cũng cấp sẽ bị chệch. Vì vậy, phần này luôn phải
xếp ở phần cuối cùng, nếu nó không phải là thông tin dùng để gạn lọc.
- Ba là, chúng ta cần chú ý thứ tự của các phần trong bảng câu hỏi với thứ tự các câu hỏi
trong từng phần, đặc biệt là trong phần chính của bảng câu hỏi. Trong thực tiễn nghiên
cứu, chúng ta cần thay đổi thứ tự các câu hỏi (hay phát biểu) trong phần này. Cách tốt
nhất là sắp xếp ngẫu nhiên các phát biểu (hoặc câu hỏi) trong các thang đo lường các
khái niệm nghiên cứu để tránh hiện tượng CMV trong đo lường (xem Chương 8).
- Hơn nữa, chúng ta cũng không nên sử dụng một dạng thang do giống nhau (vd, thang
do Likert) để đo lường tất cả các khái niệm trong một nghiên cứu mà nên kết hợp nhiều
dạng thang đo khác nhau, đặc biệt là không nên đo lường biến phụ thuộc và biến độc lập
cùng dạng thang đo. Chúng ta có thể sử dụng nhiều dạng thang đo khác nhau để đo
lường các khái niệm khác nhau (vd, kết hợp thang đo Likert với thang đo Osgood, vv).
- Giả sử chúng ta muốn đo lường ba khái niệm nghiên cứu Y, và X2 sau đây, chúng ta có
thể kết hợp thang đo Likert và Osgood:
Y: Xu hướng tiêu dùng (biến phụ thuộc);
27
28
28
29
- Hình thức của bảng câu hỏi cũng góp phần cho sự thành công của việc thu thập dữ
liệu. Bảng câu hỏi có hình thức đẹp đẽ sẽ kích thích sự hợp tác của người trả lời. Hơn
nữa, các phần nên được trình bày phân biệt (thường phân biệt bằng cách dùng màu giấy
khác nhau cho những phần khác nhau) để hỗ trợ phỏng vấn viên trong quá trình phỏng
vấn. Nếu là thông tin gạn lọc (bắt buộc phải để đầu tiên) chúng ta cần thay đổi dạng trả
lời. Lấy ví dụ, chúng ta cần gạn lọc độ tuổi để nghiên cứu (thị trường mục tiêu nghiên
cứu chi trong một nhóm tuổi nào đó, ví dụ từ 18 đến 30 tuổi, chúng ta thay dổi dạng trả
lời bằng cách hỏi nhóm tuổi, thay vì hỏi tuổi trực tiếp.
Bước 8. Thủ lần thứ nhất → sửa chữa – bản nháp cuối cùng
- Để có được một bảng câu hỏi đạt chất lượng cao thì bảng câu hỏi sau khi thiết kế xong
phải qua nhiều lần thử và sửa chữa để hoàn chỉnh trước khi nó được dùng để phỏng vấn.
Lần thử đầu tiên (pretest hay còn gọi là ở test) được thực hiện thông qua việc phỏng
vấn, tham khảo ý kiến một số thành viên nghiên cứu khác trong đơn vị và điều chỉnh lại.
Sau khi sửa chữa bảng câu hỏi này được gọi là bản nháp cuối cùng (final draft
questionnaire).
- Bản nháp cuối cùng này lại được qua lần thử thứ hai (còn gọi là B test). Trong lần thủ
này chúng ta sẽ phỏng vấn đối tượng nghiên cứu thực sự trong đám đông nghiên cứu.
Tuy nhiên, mục đích của cuộc phỏng vấn này không phải để thu thập dữ liệu mà là để
đánh giá bảng câu hỏi (đối tượng nghiên cứu có hiểu đúng câu hỏi không? họ có thông
tin không? hỏi như vậy, họ có chịu cung cấp thông tin không? thông tin họ cung cấp có
đúng là thông tin cần thiết không?). Hơn nữa, lần thử này còn nhằm kiểm tra khả năng
phỏng vấn của phỏng vấn viên. Các nghiên cứu này nằm trong các nghiên cứu sơ bộ
(pilot study) của một dự án nghiên cứu định lượng. Sau khi điều chỉnh ở lần thử thứ hai
này chúng ta có bảng câu hỏi hoàn chỉnh (final questionnaire) sẵn sàng cho công việc
phỏng vấn.
30
31
- Tùy thuộc vào loại nhân viên được tuyển chọn lần đầu hay nhân viên cũ mà nội dung và
thời gian đào tạo huấn luyện có thể thay đổi. Công việc huấn luyện sẽ bao gồm hai phần:
Lý thuyết và thực hành.
4.3. So sánh bảng câu hỏi giữa nghiên cứu định lượng và nghiên cứu định tính
- Bảng câu hỏi giữa định lượng và định tính thường được thiết kế để thu thập thông tin
theo hai phương pháp nghiên cứu khác nhau: định lượng (quantitative) và định tính
(qualitative). Dưới đây là một so sánh giữa chúng:
- Định lượng (Quantitative):
+ Mục tiêu chính: Thu thập dữ liệu số lượng cụ thể để đo lường và phân tích mối quan
hệ giữa các biến số.
+ Phương pháp: Sử dụng câu hỏi có thể đo lường, thường là những câu hỏi đóng (có
thể chọn các phương án trả lời từ danh sách cho trước).
+ Thống kê: Dữ liệu thường được phân tích bằng các phương pháp thống kê như phân
tích tần số, phân tích biến thể, hồi quy và kiểm định giả thuyết.
+ Mục đích: Thường được sử dụng để xác định mức độ và tần suất của một hiện tượng
trong một mẫu lớn, và để kiểm tra giả thuyết nghiên cứu.
- Định tính (Qualitative):
+ Mục tiêu chính: Thu thập dữ liệu về ý kiến, niềm tin, trải nghiệm và quan điểm của
người tham gia một cách sâu sắc và mô tả.
Phương pháp: Sử dụng câu hỏi mở, khuyến khích người tham gia miêu tả ý kiến và trải
nghiệm của họ.
+ Phân tích: Dữ liệu thường được phân tích thông qua việc tóm tắt, phân loại, và tìm
kiếm các mẫu chung, thường sử dụng phương pháp phân tích nội dung.
+ Mục đích: Tập trung vào việc hiểu sâu sắc về các quan điểm, niềm tin và trải nghiệm
của cá nhân hoặc nhóm, thường được sử dụng để tạo ra các lý thuyết mới hoặc làm sâu
sắc hơn về các vấn đề phức tạp.
- Tóm lại, mặc dù cả hai phương pháp đều có giá trị trong nghiên cứu, chúng có các mục
tiêu, phương pháp thu thập và phân tích dữ liệu khác nhau để đáp ứng các nhu cầu nghiên
cứu khác nhau.
31
32
5.1 Kiểm tra và giám sát quá trình thu thập dữ liệu
Chúng ta, có thể thực hiện việc giám sát dưới hai hình thức: trực tiếp và gián tiếp.
- Giám sát trực tiếp: Là hình thức giám sát theo đó nhân viên giám sát trực tiếp tham
dự vào các cuộc phỏng vấn nhưng không thực hiện các tác nghiệp phỏng vấn vai trò
của người giám sát trong trường hợp này có thể ngụy trang dưới dạng nhân viên trợ
giúp.
- Giám sát gián tiếp: Là hình thức được áp dụng phổ biến, các nhân viên giám sát bằng
việc kiểm tra các ghi chép và các bảng câu hỏi đã hoàn thành để phát hiện những lỗi
ghi chép hoặc đánh giá mức độ hoàn thành các câu hỏi. Nhân viên giám sát cũng thực
hiện kiểm tra giám sát các cuộc phỏng vấn qua điện thoại thông qua tổng đài trung tâm
tin nhắn. Giám sát gián tiếp giúp tiết kiệm chi phí và thời gian thực hiện nhưng không
cho kết quả chính xác và không thể kiểm tra đánh giá nhiều khía cạnh của hoạt động
phỏng vấn như giám sát trực tiếp. Vì vậy, tùy mức quan trọng, độ tin cậy, thời gian, chi
phí thực hiện mà các giám sát viên sẽ chọn cho mình hình thức giám sát phù hợp.
5.1.1. Nguyên nhân gây sai sót trong thu thập dữ liệu
- Có nhiều nguyên nhân làm giảm chất lượng của dữ liệu được thu thập. Trong khâu thu
thập dữ liệu, chúng ta có thể chia thành ba nguyên nhân chính gây ra sai lệch:
1. Thiết kế bảng câu hỏi không đạt yêu cầu, đặc biệt là sử dụng thuật ngữ gây nhầm
lẫn; câu hỏi không rõ ràng, hình thức trình bày không thống nhất, dễ gây nhầm lẫn cho
phỏng vấn viên, vv, là nguyên nhân đầu tiên gây nên sai lệch trong khâu thu thập dữ
liệu. Vì vậy, chúng ta cần phải kiểm tra kỳ lưỡng trong hai lần thử để điều chỉnh để
giúp giảm sai sót trong thiết kế.
2. Hướng dẫn phỏng vấn viên không kỹ lưỡng, đặc biệt là tính chủ quan, không kiểm
tra lại phỏng vấn viên để xác định họ đã hiểu tất cả các câu hỏi và trả lời trong bảng
câu hỏi, đã nắm vững kỹ thuật phỏng vấn, các dùng các trợ vấn cụ, vv, cũng là một
trong các nguyên nhân chính tạo nên sai lệch trong khâu thu thập dữ liệu.
3. Kỹ thuật phỏng vấn kém do phỏng vấn viên thiếu kinh nghiệm trong công tác phỏng
vấn, chủ quan, không chịu rèn luyện kỹ năng phỏng vấn là nguyên nhân thứ ba tạo nên
sai lệch trong khâu thu thập dữ liệu.
33
34
- Khâu huấn luyện và cho phỏng viên thực tập trước khi phỏng vấn thực thụ đóng vai trò
quan trọng trong việc làm giảm thiểu sai sót do phỏng vấn viên. Hướng dẫn và kiểm tra
kỹ năng phỏng vấn của phỏng vấn viên trước khi tiến hành phỏng vấn thực thụ là một
công việc cần thiết để đảm bảo chất lượng dữ liệu trong quá trình thu thập.
- Tương tự như việc kiểm tra bảng câu hỏi sau khi thiết kế, kiểm tra kỹ năng phỏng vấn
của phỏng vấn viên cũng được tiến hành hai bước. Trước tiên, sau khi được hướng dân
xong phỏng vấn viên phải tiến hành phỏng vấn giám sát viên. Nếu phát hiện có những sai
sót trong việc hiểu các câu hỏi, kỹ thuật phỏng vấn, vv, thì cần phải điều chỉnh (hướng
dẫn) lại (debriefing).
- Sau khi đã được hướng dẫn lại, các phỏng viên sẽ thực tập phỏng vấn đối tượng nghiên
cứu. Lần phỏng vấn này cũng nhằm vào mục đích kiểm tra kỹ năng phỏng vấn của phỏng
vấn viên. Trong lần phỏng vấn này, các giám sát viên cần theo dõi chặt chẽ quá trình
phỏng vấn nhằm phát hiện các sai sót, kỹ năng phỏng vấn của phỏng vấn viên để có
những biện pháp điều chỉnh kịp thời.
5.1.2. Các bước hiệu chỉnh
- Như đã đề cập trên đây, dữ liệu thu thập xong cần phải hiệu chỉnh chúng. Hiệu chỉnh là
một công việc không thể thiếu trong thu thập dữ liệu. Công việc hiệu chỉnh dữ liệu được
chia thành hai bước (1) hiệu chỉnh tại hiện trường (field editing) và (2) hiệu chỉnh tại
trung tâm (central editing).
- Công việc hiệu chỉnh tại hiện trường do bộ phận thu thập dữ liệu thực hiện. Trước tiên
phỏng vấn viên phải hiệu chỉnh ngay khi kết thúc phỏng vấn. Phỏng vấn viên phải kiểm
tra lại thật nhanh tỉnh hoàn tất của bảng câu hỏi do mình phỏng vấn. Nếu phát hiện có
những câu hỏi bị bỏ sót thì cần phải phỏng vấn lại ngay các câu hỏi nếu phát hiện chúng
bị bỏ sót (trong lúc có mặt của đối tượng phỏng vẩn). Sau đó, phỏng vấn viên cần phải
hoàn chỉnh các phần viết tắt, ký hiệu, và những gì chưa diễn kịp. Nếu phỏng viên không
thực hiện nghiêm túc công việc hiệu chỉnh này thì sẽ gây khó khăn cho chính phỏng vấn
viên và cho các khẩu hiệu chỉnh tiếp theo. Lý do là nếu bỏ sót câu hỏi hay quên phần viết
tắt của mình thì họ phải đến tiếp xúc với đối tượng phỏng vấn đề phỏng vấn lại. Công
34
35
việc này sẽ tốn thời gian và chi phí và đôi khi là nguyên nhân dẫn đến việc phỏng vấn
điền vào nếu họ không được giám sát chặt chẽ.
- Sau khi hiệu chỉnh xong các bảng câu hỏi do mình phỏng vấn, phỏng vấn viên đem nộp
các bảng câu hỏi này cho giám sát viên của mình. Giám sát viên thực hiện việc hiệu chỉnh
tiếp theo cho tất cả các bảng câu hỏi đã được các phỏng vấn viên do mình giám sát hiệu
chỉnh xong. Giám sát viên chịu trách nhiệm trong việc kiểm tra:
1. Tính hoàn tất của các bảng câu hỏi
2. Tính hợp lý giữa các câu hỏi trong từng bảng câu hỏi và giữa các bảng câu hỏi của
phỏng vấn viên do mình giám sát phỏng vấn
3. Tính rõ ràng của các trả lời, nhất là các trả lời cho các câu hỏi mở
4. Tính nghiêm túc trong phỏng vấn của phỏng vấn viên
- Bước hiệu chính tại trung tâm do bộ phận xử lý dữ liệu thực hiện trước khi nhập dữ
liệu cho việc xử lý. Mục đích của công việc hiệu chỉnh tại trung tâm là để kiểm tra toàn
bộ các lỗi và nhất là tỉnh hợp lý giữa các câu hỏi trong n (kích thước mẫu) bảng câu
hỏi.
6. Chuẩn bị dữ liệu
Dữ liệu sau khi thu thập, nhà nghiên cứu cần chuẩn bị dữ liệu, bao gồm: mã hóa dữ liệu,
thiết lập ma trận dữ liệu và làm sạch dữ liệu.
6.1. Mã dữ liệu
- Mã dữ liệu (coding) là quá trình chuyển đổi các trả lời thành dạng mã số để nhập và xử
lý. Mã hoá được thực hiện trước (precoding) và sau khi phỏng vấn (postcoding). Đối với
các câu hỏi đóng, việc mã hóa được thực hiện một lần trước khi tiến hành thu thập dữ
liệu. Tuy nhiên, các câu hỏi mở thường phải mã hóa hai lần:
1. Tạo mã trước khi phỏng vấn thông qua việc dự đoán trước các trả lời sẽ xuất hiện
2. Điều chỉnh mà nếu có sai lệch sau khi phỏng vấn xong
- Một trả lời khi mã hoá sẽ thể hiện bằng hai số: số thứ nhất chỉ số biến và số thứ hai chỉ
số trả lời (số đo). Ví dụ, trong câu hỏi có mã biến (cột) là 2 (ký hiệu là C. 2), và thang đo
trả lời năm điểm như sau: Bạn có thích sữa chua Yomilk không? (C2)
35
36
- Sau khi phỏng vấn đối tượng nghiên cứu thứ nhất của mẫu chúng ta nhận được trả lời là
“thích” thì mã của trả lời là 2 (trả lời có số đo là 2). Tương tự như vậy, giả sử cùng câu
hỏi trên (biến 2) chúng ta phỏng vấn người tiêu dùng thứ 2 và họ trả lời là “tạm được” thì
mã của trả lời 3, vv. Các mã này được nhập vào ma trận dữ liệu trình bày ở phần tiếp theo
dưới đây. Các ký hiệu mã cho các biến và các trả lời được trình bày trong một số mã
(code book), sổ này có dạng trình bày trong Bảng 1.
2 Nữ
4 Ghét
5 Rất ghét
Bảng 1.Số mã
6.2. Ma trận dữ liệu
- Bảng câu hỏi sau khi đã phỏng vấn, hiệu chỉnh và mã các dữ liệu thì công việc tiếp theo
là nhập dữ liệu vào máy. Dữ liệu được nhập và chuyển sang các phần mềm tương ứng cho
việc xử lý và phân tích. Dữ liệu /sau khi nhập xong ở dạng một ma trận được gọi là ma
trận dữ liệu (data matrix). Các phần mềm xử lý dữ liệu trong thống kê (rất thường dùng để
36
37
xử lý dữ liệu trong nghiên cứu thị trường) như SPSS, SAS, vv, đều cần dữ liệu ở dạng ma
trận.
- Ma trận dữ liệu chứa dựng tất cả các trả lời đã được mã hóa của toàn bộ các bảng câu
hỏi (toàn bộ mẫu). Cột của ma trận dữ liệu biểu thị mã của các biến và dòng của nó biểu
thị kích thước mẫu. Mỗi cột của ma trận dữ liệu chứa đựng dữ liệu của n phần tử (ví dụ
người tiêu dùng) của mẫu về một biến dữ liệu nào đó mà chúng ta cần thu thập. Mỗi dòng
chứa đựng dữ liệu (các trả lời) của một phần tử mẫu của tất cả các biến cần thu thập
(Bảng 2).
Kích thước mẫu (số dòng): từ 1 đến n Các biến (số cột): từ 1 đến k
1 2 3 ... k
37
38
6.3.1. Ô trống
- Các ô trống là các ô của ma trận không chứa đựng dữ liệu trả lời. Nguyên nhân của các
ô trống này do:
1. Sai sót trong quá trình thu thập dữ liệu: sai sót này có thể do đối tượng nghiên cứu
không trả lời hoặc phỏng vấn viên quên phỏng vấn, hay có phỏng vấn nhưng quên ghi
kết quả.
2. Sai sót do nhập dữ liệu: trong bảng câu hỏi hoàn tất có chứa dữ liệu này, nhưng khi
nhập, người nhập dữ liệu bỏ sót.
Để phát hiện các khoảng trống này chúng ta chỉ cần tính tổng theo cột (tỉnh kích thước
thực tế của mẫu cho từng biến). Lấy ví dụ trong một nghiên cứu một mẫu có kích
thước n = 200 và 20 biến, ký hiệu , lấy ví dụ, từ X 01 đến X20. Sau khi nhập dữ liệu và
tính kích thước mẫu cho các biến, chúng ta thấy ở biển X 12, X18, và X20 có kích thước
mẫu theo thứ tự là 178, 186, và 198. Các biến còn lại đều có kích thước mẫu là 200.
Như vậy, ba biển X12, X18, và X20 có ô trống: biến X12 có 22 ô, biển X18 có 14 ô và biển
X20 có hai ô. Để hiệu chỉnh sai sót này chúng ta cần kiểm tra lại bảng câu hỏi:
+ Nếu bảng câu hỏi có số đo, nhưng sai sót trong quá trình nhập, chỉ cần nhập lại số
đo đã có.
+ Nếu sai sót do phỏng vấn viên quên phỏng vấn, cách giải quyết là phỏng vấn viên
phải phỏng vấn lại. Cách này thường ít khả thi. Các thông thường là nếu ô trống của
biến đó ít, chúng ta loại các trả lời đó đi (giảm kích thước mẫu) hoặc lấy trung bình:
thay giá trị của ô trống bằng trung bình của một số hay của tất các trả lời còn lại. Đây
là cách làm phổ biến và SPSS cho phép chúng ta làm việc này rất nhanh. Tuy nhiên,
cũng cần chú ý là trong xử lý thống kê có nhiều phương pháp để xử lý cho các dữ liệu
không hoàn chỉnh (incompleted data).
6.3.2. Trả lời không hợp lệ
- Trả lời không hợp lệ là các trả lời có dữ liệu không nằm trong thang đo đã thiết kế. Để
phát hiện các trả lời không hợp lệ chúng ta chỉ cần tính tần số theo cột. Ví dụ ở biển Xi là
dữ liệu cho câu hỏi sau và trả lời sau: Xin vui lòng mức độ đồng ý của bạn trong phát biểu
“ Tôi rất thích sữa chua Yo Most”
38
39
- Sau khi tính tần số theo cột (biến) Xis. Chúng ta phát hiện có hai dòng có số đo theo thứ
tự là 7 và 33. Như vậy, hai trả lời này không hợp lệ vì thang đo chỉ có số đo từ 1 đến 5.
- Sai sót cho trả lời không hợp lệ chủ yếu là do nhập dữ liệu. Khi nhập dữ liệu, người
nhập đã nhập nhầm số. Lấy ví dụ số do thực trong bảng câu hỏi có thể là 3 nhưng lại nhập
vào 7. Cũng có thể là do lỗi của người nhập: nhập vào là 3 như đè phím máy tính hai lần
nên dữ liệu biến thành 33 (trường hợp này rất thường xảy ra). Để hiệu chỉnh sai sót, chỉ
cần kiểm tra lại bảng câu hỏi và nhập lại các ô này.
6.4. Ý nghĩa của việc đo lường và thu thập dữ liệu định lượng
- Việc hiểu và áp dụng các phương pháp đo lường và thu thập dữ liệu định lượng có ý
nghĩa rất lớn trong cả nghiên cứu và thực tiễn vì các lý do sau:
+ Cung cấp dữ liệu chính xác và đáng tin cậy: Bằng cách áp dụng các phương pháp đo
lường và thu thập dữ liệu định lượng, chúng ta có thể thu thập thông tin chính xác và
đáng tin cậy từ nguồn dữ liệu, giúp nâng cao tính chính xác và độ tin cậy của kết quả
nghiên cứu hoặc quyết định thực tiễn.
+ Phân tích mối quan hệ và tương tác: Dữ liệu định lượng cho phép chúng ta phân tích
mối quan hệ và tương tác giữa các biến số một cách số học, giúp hiểu rõ hơn về các
mối liên hệ và ảnh hưởng giữa chúng.
+ Đưa ra quyết định và dự đoán: Dữ liệu định lượng cung cấp cơ sở chính xác để đưa
ra quyết định và dự đoán trong thực tế. Việc sử dụng dữ liệu này giúp các nhà quản lý,
nhà nghiên cứu và các quyết định viên có thể tối ưu hóa hiệu suất và đưa ra các quyết
định dựa trên số liệu cụ thể.
+ Tạo ra thông tin hữu ích cho quản lý và đánh giá kết quả: Dữ liệu định lượng cung
cấp thông tin cụ thể và đo lường về các biến số, giúp quản lý hiểu rõ hơn về tình hình
và đánh giá được kết quả đạt được.
+ Thúc đẩy sự tiến bộ trong nghiên cứu và phát triển công nghệ: Sử dụng các phương
pháp đo lường và thu thập dữ liệu định lượng giúp khuyến khích sự tiến bộ trong lĩnh
39
40
vực nghiên cứu và phát triển công nghệ, bằng cách cung cấp dữ liệu và thông tin cụ thể
để nghiên cứu và phát triển.
- Tóm lại, việc hiểu và áp dụng các phương pháp đo lường và thu thập dữ liệu định lượng
không chỉ giúp cải thiện chất lượng của nghiên cứu mà còn hỗ trợ quyết định và hành
động trong thực tiễn, từ đó đóng góp vào sự phát triển và tiến bộ của xã hội và ngành
công nghiệp.
- Bảng câu hỏi sau khi phỏng vấn xong cần phải được hiệu chỉnh các sai sót để tăng chất
lượng của chúng. Công việc hiệu chỉnh dữ liệu được được thực hiện (1) tại hiện trường và
(2) tại trung tâm. Dữ liệu sau khi thu thập, nhà nghiên cứu cần chuẩn bị dữ liệu, bao gồm
cách mã, thiết lập ma trận dữ liệu và làm sạch dữ liệu để sẵn sàng cho phân tích.
41