Professional Documents
Culture Documents
Chuong 2 Lay Mau Khao Sat Trong Nghien Cuu Mar
Chuong 2 Lay Mau Khao Sat Trong Nghien Cuu Mar
LẤU MẪU
Nội dung
5. Mã hóa dữ liệu
6. Mô tả dữ liệu
2-2
Qui trình lấy mẫu
• Vì sao phải lấy mẫu?
Để thu thập thông tin tổng thể
Thời gian
Chi phí
Khi không thể nghiên cứu tổng thể.
Sự chính xác
Chi phí
2-3
Qui trình lấy mẫu
1. Xác
4. Lựa
định tổng 6. Lựa
2. Xác 3. Xác chọn 5. Xác 7. Tiến
thể đối chọn sơ
định đơn định cấu phương định kích hành chọn
tượng đồ chọn
vị lấy mẫu trúc mẫu pháp chọn cỡ mẫu mẫu
nghiên mẫu
mẫu
cứu
2-4
Qui trình lấy mẫu
Kết quả tính toán từ dữ liệu Kết quả tính toán từ dữ liệu
tổng thể được gọi là tham số mẫu được gọi là thuộc tính.
Tên của tất cả cử tri đi bầu Tổng thể
Thu nhập của tất cả các gia đình sống ở Thành phố Tổng thể
Mẫu ngẫu nhiên là một quá trình, trong đó mẫu phải được chọn
ngẫu nhiên.
2-6
Qui trình lấy mẫu
2. Đơn vị lấy mẫu: Một hay nhóm các phần tử để từ đó thực
hiện việc lấy mẫu. Ví dụ: Hộ gia đình.
3. Cấu trúc mẫu: Danh sách các đơn vị lấy mẫu phục vụ
việc lấy mẫu.
2-7
Qui trình lấy mẫu
2-8
Qui trình lấy mẫu
Mẫu xác suất
- Biết trước xác suất xuất hiện của các phần tử trong mẫu.
- Quá trình chọn mẫu tuân theo quy luật toán, không thể tự ý
thay đổi.
- Các thông số của mẫu có thể dùng để ước lượng hoặc kiểm
định thông số tổng thể.
2-9
Qui trình lấy mẫu
2-10
Qui trình lấy mẫu
2-11
Qui trình lấy mẫu
Mẫu phi xác suất chưa chắc đã rẻ, nhưng thường tồn tại nhiễu.
2-12
Qui trình lấy mẫu
2-13
Qui trình lấy mẫu
4. Mẫu theo mầm (snow ball)
+ Chọn ngẫu nhiên những người được phỏng vấn ban đầu,
những người tiếp theo được chọn theo lời giới thiệu của
những người phỏng vấn trước đó.
+ Sử dụng thích hợp khi tổng thể ít hoặc khó nhận ra đối
tượng cần thu thập thông tin.
2-14
Qui trình lấy mẫu
1. Mẫu ngẫu nhiên (xác suất)
Lấy mẫu ngẫu nhiên dựa trên việc đã biết phân bố của tổng thể.
Phần tử được chọn vào tập mẫu có xác suất như nhau và biết
trước.
Qui trình
Phát số ngẫu nhiên
+ Rút thăm, thẻ ngẫu nhiên
+ Dùng bảng số ngẫu nhiên nếu tổng thể lớn
+ Dùng hàm: Rand().
+…
Kiểm định giả thuyết.
Ưu điểm: Đơn giản nếu đã có khung lấy mẫu đầy đủ
Nhược điểm: Không khả thi khi tổng thể lớn. 2-15
Qui trình lấy mẫu
Rút thăm
2-16
Qui trình lấy mẫu
684257954125632140
582032154785962024
362333254789120325
985263017424503686
2-17
Qui trình lấy mẫu
2-18
Qui trình lấy mẫu
Ngẫu nhiên phân tổ
2-19
Qui trình lấy mẫu
3. Ngẫu nhiên phân vùng
Vùng 1 Vùng 2
Vùng 3
Vùng 5
Vùng 4
2-20
Qui trình lấy mẫu
2-21
Qui trình lấy mẫu
2-22
Qui trình lấy mẫu Vậy theo yêu cầu thì tỷ lệ chọn toàn thể
là: (1/b).(1/h) = 1/b.h = 1/40; m.k = 100.
Các phương án lấy mẫu
2-24
Cỡ mẫu
2-25
Cỡ mẫu
Sample size
Quantitative Qualitative
Z π(1 π)
2
Zs
2
n n
x E 2
2-26
Cỡ mẫu
Chất lượng (qualitative)
• Mức độ biến động của dữ liệu: V = (1 – ) tỷ lệ thuận với
cỡ mẫu. là tỷ lệ xuất hiện của các phần tử trong đơn vị lấy
mẫu đúng như mục tiêu chọn mẫu (0 1)
• Độ tin cậy liên hệ với giá trị Z (90%, 95%)
• Tỷ lệ sai số ước lượng E (nếu điều tra toàn bộ tổng thể thì E
= 0)
Công thức
2-27
Cỡ mẫu
[0.3(1 0.3)]1.962
n 2
504.21 ~ 505
(0.04)
2-29
Qui trình lấy mẫu
Ví dụ
• Mức ý nghĩa = 5% (độ tin cậy 95%)
• Mức độ xuất hiện tham số tổng thể ở mẫu: = 0.05
• Sai số ước lượng trung bình D = 5%
(D được cho trong trường hợp này được thay thế E)
Tính cỡ mẫu?
Lời giải
α = 0.05 Z = 1.96 (Tra bảng Chuẩn)
1 Z2 /2
n
D2
0.05 1 0.05 1.962
n 2
73
0.05
Qui trình lấy mẫu
Công thức
2
Zs
n=
αx
2
Zs
n=
E
Độ lệch chuẩn S
Ví dụ
Nghiên cứu tham số của một tổng thể với độ lệch chuẩn tổng thể
= 46. Với sai số khi lấy mẫu D = 4 vẫn được chấp thuận. Hãy xác
định kích thước mẫu ở độ tin cậy 99%?
Lời giải
Z 2 2
n
D2
2.582 x 46 2
n 880.3 ~ 881
42
2-34
Qui trình lấy mẫu
Xác định cỡ mẫu trong chọn mẫu phi xác suất
Quyết định cỡ mẫu trong chọn mẫu phi xác suất thường được
thực hiện một cách chủ quan.
Yếu tố quyết định then chốt trong việc chọn mẫu là chi phí và
thời gian.
2-35
Qui trình lấy mẫu
Sơ đồ lấy mẫu
• Trường hợp địa bàn rộng
• Cần quản lý chặt chẽ nhóm nghiên cứu
• Vẽ phác họa sơ đồ khu vực chọn mẫu, đánh dấu các số nhà
trên địa bàn
• Chia nhỏ các ô trên bản đồ Thành phố, đánh số thứ tự các ô,
chọn ngẫu nhiên 100 ô để xác định các hộ gia đình, cửa
hàng được chọn làm mẫu.
2-36
Dữ liệu cho nghiên cứu
2-37
Dữ liệu cho nghiên cứu
Dữ liệu
Dữ liệu Dữ liệu
thứ cấp sơ cấp
Cần nghiên
Sẵn sàng Tài liệu đã Cơ sở dữ
cứu Khách hàng
sử dụng xuất bản liệu
sâu
2-38
Dữ liệu thứ cấp
So sánh dữ liệu Thứ cấp vs. Sơ cấp
2-39
Dữ liệu thứ cấp
Tài liệu đã được xuất bản
Hướng Thư mục Danh mục Dữ liệu Trung tâm Nguồn chính
dẫn thống kê dữ liệu phủ khác
2-40
Dữ liệu thứ cấp
Cơ sở dữ liệu
Cơ sở dữ liệu
(máy tính)
2-41
Dữ liệu thứ cấp
Khách hàng
Hộ gia đình /người
tiêu dùng
Audits
Có
Có Không
Sử Dữ liệu thứ cấp có
dụng tin cậy không? Dừng
2-44
Dữ liệu sơ cấp
Mô tả Nhân quả
Projective
Techniques
Phỏng vấn nhóm Phỏng vấn sâu
•Phương pháp
• Interviewing: Phỏng vấn khách hàng và chuyên gia về lĩnh vực liên
quan.
• Questionnaires: Bảng câu hỏi.
• Observation: Quan sát.
• Background reading: Nghiên cứu tài liệu tổ chức và tài liệu hệ
thống thông tin (phần mềm) đang tồn tại.
• Phỏng vấn nhóm.
2-48
Phỏng vấn
Người phỏng vấn Doanh nghiệp
Ghi nhận
Kiểm tra và đánh giá kết quả Bổ sung hoặc xác nhận kết
quả
Tìm kiếm các quan điểm
khác 2-49
Phỏng vấn – các loại câu hỏi
•Câu hỏi mở: có phạm vi trả lời tự do, kết quả không tuân theo một
vài tình huống cố định
•Ví dụ: Ưu điểm của hệ thống phân phối của công ty bạn đang làm
việc?
•Câu hỏi đóng: là câu hỏi mà sự trả lời là việc chọn lựa một hoặc
nhiều trong những tình huống xác định trước.
• Ví dụ: Ưu điểm của hệ thống thông tin công ty bạn đang sử dụng
(chỉ chọn một)?
• Có dễ dàng truy cập đến tất cả dữ liệu
• Thời gian phản hồi nhanh
• Khả năng chạy đồng thời với các ứng dụng khác.
2-50
Phỏng vấn
•Ví dụ
2-53
Bảng câu hỏi - Questionnaires
•Nhằm đạt được thông tin từ nhiều người và kết quả có thể phân tích
thống kê.
•Đặc điểm
• Bảng câu hỏi có thể được gởi qua thư, email, hoặc dựa web
• Dùng thu thập ý kiến hoặc dữ kiện.
• Bảng câu hỏi phải được thiết kế tốt và dễ trả lời
•Các loại câu hỏi
• Câu hỏi mở: câu trả lời có thể không đoán trước được.
• Câu hỏi đóng: Câu trả lời được chọn từ danh sách cung cấp trước.
• Có thể dùng câu hỏi đóng và hạn chế câu hỏi mở
• Các câu hỏi đóng có thể:
• Multi-choice questions: Câu hỏi nhiều chọn lựa
• Rating questions: Câu hỏi đánh giá từ yếu tới mạnh
• Ranking questions: Câu hỏi xếp hạng. từ 1 – 10 hoặc tỉ lệ %
2-54
Bảng câu hỏi
•Yêu cầu
• Trình bày mục đích của việc điều tra
• Hướng dẫn điền câu trả lời.
• Thời hạn gởi câu trả lời.
• Hình thức bảng câu hỏi phải tiện dụng cho nạp vào máy tính.
• Chừa đủ chỗ để trả lời
• Có chỗ để nhận xét
• Trong bảng câu hỏi cần ghi rõ họ tên/ký tên xác nhận trách nhiệm
thông tin của người trả lời để tiện việc liên lạc, trao đổi.
2-55
Nghiên cứu tài liệu
Tài liệu Tài liệu bổ sung: bảng hỏi, phiếu thu thập,…
làm tiếp Tài liệu nghiên cứu: báo cáo nghiên cứu,…
Tài liệu chuẩn bị: cuộc họp, máy tính,…
=> Cung cấp người phân tích khung tổng quát về hệ thống thông tin;
hỗ trợ phát hiện những điểm thiếu chính xác, thiếu chặt chẽ của hệ
thống hiện tại. 2-56
Observation - Quan sát hiện trường
Quan sát trực tiếp tại nơi làm việc, hiện trường xem xét quy
trình làm việc thực tế của tổ chức nhằm tìm kiếm điều thực sự
xảy ra, không phải điều người ta nói.
Quan sát người ta thực hiện xử lý công việc như thế nào và
điều gì xảy ra để biết được thực trạng luân chuyển thông tin
trong tổ chức.
Quan sát thụ động: Quan sát các hoạt động mà không bị dừng ngang hoặc
không tham gia trực tiếp dùng camera
Quan sát chủ động: Tham gia trực tiếp vào các hoạt động.
2-57
Quan sát hiện trường
− Tham gia trực tiếp vào một bước hay cả quy trình
nghiệp vụ => ghi nhận, nắm bắt những thông tin cần
thiết.
− Đạt được các dữ liệu định lượng để làm cơ sở cho các
cải tiến được cung cấp bởi hệ thống mới.
Biện pháp này bổ sung thêm những kết quả khảo sát của
những biện pháp khác.
2-58
Kiểm tra hiệu chỉnh dữ liệu
• Kiểm tra thực địa: xác định tính trung thực và chính xác
của dữ liệu
• Chỉnh lý dữ liệu: bổ sung thiếu sót và hiệu chỉnh các sai sót
2-59
Kiểm tra hiệu chỉnh dữ liệu
2-60
Kiểm tra hiệu chỉnh dữ liệu
2-61
Kiểm tra hiệu chỉnh dữ liệu
2-62
Mã hóa dữ liệu
Nguyên tắc mã hóa
• Tính phù hợp
Cách phân loại/nhóm phải phù hợp với mục tiêu nghiên cứu.
Ví dụ: phân loại theo độ tuổi.
• Tính toàn diện
Mã số phải bảo phủ hết dữ liệu nghiên cứu, tiểu mục khác
nên chiếm tỷ trọng nhỏ.
• Tính loại trừ lẫn nhau
Mỗi trả lời chỉ tương ứng với một mã số.
• Tính đơn nguyên
Mỗi trả lời chỉ tương ứng với một nghĩa, một câu không được
có 2 ý. 2-63
Mã hóa dữ liệu
Là quá trình gán mã số (số hoặc nhãn) cho các biến và các câu
trả lời.
Các bước mã hóa
Đặt tên biến cho các câu hỏi
Chuyển tập các lựa chọn trả lời thành tập số/nhãn phù hợp, có
ý nghĩa
Lưu ý câu hỏi mở, câu hỏi có lựa chọn “khác”, câu hỏi có câu
trả lời “không biết”.
2-64
Thực hiện trên SPSS
hoặc Excel
Phương pháp nghiên cứu Marketing
2-65
Mã hóa dữ liệu
Tạo biến mới
Mục đích: Tạo ra các biến trung gian, biến mới từ tập dữ liệu
gốc
Thực hiện (phần mềm SPSS Ver. 18 trở về sau)
Transform Compute Variables
Đưa biến cần mã hóa vào ô Numeric Expression và chọn công
thức tính toán thích hợp.
Đặt tên biến mới ở ô Target Variable.
Sau khi có biến mới Quay lại màn hình khai báo biến để gán
các nhãn cho biến mới.
Ví dụ: Tính toán biến lại biến thâm niên của người lao động ở
một doanh nghiệp bằng nhân đôi thâm niên.
2-66
Mã hóa dữ liệu
Tạo biến mới
2-67
Mã hóa dữ liệu
Mã hóa lại dữ liệu
Mục đích: Tạo ra các biến mới từ dữ liệu gốc.
Thủ tục (phần mềm SPSS ver. 18)
Transform Recode Different Variables
Đưa biến cần mã hóa vào ô Numeric Expression Output
Variable.
Đặt tên biến mới ở ô Name và gán nhãn ở ô Label.
Sau đó vào ô Old – New value để mã hóa lại dữ liệu
Khi có biến mới, quay lại màn hình khai báo biến để gán nhãn cho
các giá trị mới được tạo ra
Sau khi có biến mới Quay lại màn hình khai báo biến để gán
các nhãn cho biến mới.
2-68
Mã hóa dữ liệu
Ví dụ: Mã hóa lại biến thâm niên của người lao động, thay giá
trị gốc 15 bằng giá trị mới: 15.5.
2-69
Mô tả dữ liệu
Thống kê mô tả
Mục đích: Biểu diễn các tham số thống kê cơ bản của tổng thể,
mẫu
(1) Mức độ tập trung
• Trung bình (mean)
• Số mode
• Trung vị (Median)
(2) Mức độ phân tán
• Phương sai hay độ lệch chuẩn (Var/St.d)
• Khoảng biến thiên (Range)
• Hệ số biến động (C.V)
2-70
Mô tả dữ liệu
Cửa sổ lệnh descriptives
2-71
Mô tả dữ liệu
1. Từ menu Analyze Descriptive Statistics
Descriptives…, xuất hiện hộp thoại
2. Chọn 1 hay nhiều biến (định lượng) muốn tính điểm trung
bình đưa vào khung Variable(s).
3. Click vào ô Options… để xuất hiện hộp thoại Descriptive
Options. Chọn các đại lượng thống kê muốn tính toán bằng
cách click vào ô vuông cần thiết.
4. Chọn cách sắp xếp kết quả tính toán theo thứ tự danh sách
biến (Variable list), thứ tự Alphabetic của nhãn biến, thứ tự
tăng dần (Ascending list), và thứ tự giảm dần (Descending
list).
5. Click Continue để trở về hộp thoại Descriptive Ok để
thực hiện lệnh.
2-72
Mô tả dữ liệu
2-73
Mô tả dữ liệu
2-74
Mô tả dữ liệu
Phân tích tần số
Mục đích: Tìm ra cấu trúc của hiện tượng nghiên cứu
Ứng dụng: Thường được sử dụng cho các trường hợp sau.
• Đếm tần số xuất hiện ở dữ liệu đầu vào
• Phân tích tỷ trọng, phân bố của các thành phần trong tổng
thể
• Biểu thị sự chọn lựa nhãn hiệu, sản phẩm được ưa thích.
2-75
Mô tả dữ liệu
2-76
Mô tả dữ liệu
Màn hình sẽ xuất hiện hộp thoại sau
2. Chọn biến muốn tính tần số (biến tham nien[TN]) bằng cách
nhấp chuột vào tên biến rồi đưa sang khung Variable(s).
2-77
Mô tả dữ liệu
3. Click Ok. Trường hợp muốn vẽ biểu đồ thực hiện thêm bước
4 trước khi click Ok.
2-78
Tài liệu tham khảo
[1] TS. Nguyễn Đình Thọ, Nguyễn Thị Mai Trang, “Nghiên cứu
marketing”, NXB. Đại học Quốc gia TP. HCM 2007.
[2] TS. Đinh Bá Hùng Anh, “Nghiên cứu khoa học trong Kinh tế - Xã
hội”, NXB. Kinh tế Tp. HCM 2016.
[3] Bài giảng của giảng viên.
2-79