Professional Documents
Culture Documents
Ky Thuat Chon Mau PDF
Ky Thuat Chon Mau PDF
???
2
SƠ ĐỒ NGHIÊN CỨU
Chọn dân số
Chọn mẫu
3
CÁC KHÁI NIỆM
Câu hỏi:
1. Mẫu NC được rút ra trên nhóm người nào?
2. Cần bao nhiêu người trong mẫu NC?
3. Những người này được chọn như thế nào?
4
CÁC KHÁI NIỆM
Kỹ thuật chọn mẫu là cách rút chọn 1 đối
tượng/đơn vị nghiên cứu trong dân số vào
mẫu.
Mẫu
7
Tham số Thống kê
CÁC KHÁI NIỆM (tt)
Các thành phần:
• Đơn vị nghiên cứu (study unit): đơn vị cơ bản, nhỏ
nhất cung cấp những giá trị của biến số
8
Tất cả đối tượng
được quan tâm
Giá Trị Bên Trong
Mẫu Mẫu
kiểm
Chọn lọc
? soát
Đối tượng sai
với một số đặc Đo lường số
tính cụ thể
??
Xác suất Mẫu ngẫu nhiên phân tầng (stratified random sampling)
11
CHỌN MẪU THUẬN TIỆN
12
PHÂN BỔ QUOTA
Là sự phân bổ số đơn vị cần điều tra cho từng đơn vị được
chia hoàn toàn theo kinh nghiệm chủ quan của người
nghiên cứu
VD: Nghiên cứu về tỷ lệ tăng huyết áp trên 400 người từ 40
tuổi trở lên tại 1 thành phố A, tiến hành như sau:
- Phân đơn vị theo giới tính và tuổi:
200 người (100 nam và 100 nữ) từ 40 – 60 tuổi,
200 người (100 nam và 100 nữ) từ 60 tuổi trở lên.
- Điều tra viên có thể chọn những người gần nhà hay thuận
lợi cho việc điều tra để dễ nhanh chóng hoàn thành công
việc.
13
QUẢ BÓNG TUYẾT (SNOWBALL)
14
Các pp chọn mẫu xác suất phổ biến
1. Mẫu ngẫu nhiên đơn (simple random sampling)
sampling)
3. Mẫu ngẫu nhiên phân tầng (stratified random
sampling)
4. Mẫu cụm (cluster sampling)
16
17
Bảng số ngẫu nhiên
34735 78219 18131 92594 94235 11721
35621 57344 02606 21961 07539 71006
78629 40478 63628 13640 82315 41919
08462 33570 21715 90409 33199 71764
24014 71381 58732 29417 32050 89880
37124 23597 73007 26705 94330 45206
92775 68533 86784 28870 61590 99165
26426 54602 71259 56747 36957 82629
21487 46012 10948 49446 32178 50727
17745 94929 23861 66784 15825 39009
Chọn 384 đối tượng trong khung mẫu?
19
ƯU – KHUYẾT ĐIỂM: NGẪU NHIÊN ĐƠN
ƯU ĐIỂM:
Đơn giản, chọn đơn vị NC thông qua 1 giai đoạn
Có đủ cơ sở tính xác suất (biết rõ xác xuất)
KHUYẾT ĐIỂM:
Cần khung mẫu chính xác kém khả thi
Mẫu được chọn có thể phân tán khó thu thập
Có cơ hội bỏ sót vài nhóm trong dân số (cơ hội)
20
MẪU NGẪU NHIÊN HỆ THỐNG (Systematic Sampling)
21
VÍ DỤ: NGẪU NHIÊN HỆ THỐNG
22
HÌNH MINH HỌA
23
24
ƯU – KHUYẾT ĐIỂM: Ngẫu nhiên hệ thống
ƯU ĐIỂM:
Thay ngẫu nhiên đơn khi không có khung mẫu chính
xác
Có tính đại diện hơn ngẫu nhiên đơn
KHUYẾT ĐIỂM:
Khung mẫu được thiết lập có tính chu kỳ = k mẫu
có thể bị sai lệch
Nội 30 (30:100) x 30 9
Ngoại 30 (30:100) x 30 9
Sản 20 (20:100) x 30 6
Nhi 10 (10: 100) x 30 3
YHDP 10 (10: 100) x 30 3
ƯU ĐIỂM:
Số thống kê từ mẫu phân tầng có độ chính xác
cao hơn kết quả tương ứng từ mẫu ngẫu nhiên
đơn
Có thể biết được hình ảnh của từng tầng
Về mặt quản lý, mẫu phân tầng dễ hơn ngẫu
nhiên đơn
KHUYẾT ĐIỂM:
Cần thiết lập khung mẫu chi tiết của từng tầng.
29
CHỌN MẪU CỤM
CHỌN MẪU CỤM(Cluster sampling): phương pháp chọn
ngẫu nhiên nhiều cụm (được gọi là đơn vị lấy mẫu bậc 1 –
PSU: primary sampling units). Nếu qua 2 giai đoạn: cụm lấy
mẫu bậc 2 (SSU: secondary sampling units) Lấy mẫu qua
nhiều giai đoạn.
ƯU ĐIỂM:
Chỉ cần khung mẫu chi tiết cho bước kế chót tiết
kiệm thời gian, công sức
Trong cộng đồng, mẫu cụm có tính kinh tế và khả thi
cao.
KHUYẾT ĐIỂM:
Với cùng một cỡ mẫu, những số thống kê tính được
từ mẫu cụm kém chính xác so với những số tương
ứng từ mẫu ngẫu nhiên đơn.
Khắc phục: cỡ mẫu lớn hơn -> n*design effect
33
CHỌN MẪU NHIỀU BẬC (Multistage sampling)
Là sự kết hợp nhiều phương pháp lấy mẫu
Ví dụ:
Khảo sát TCMR trong học sinh 1 tỉnh, gồm các bước:
- B1: chọn m huyện trong tổng M huyện của tỉnh
- B2: chọn n xã trong tổng N xã của 1 huyện
- B3: chọn p trường học trong tổng P trường học 1 xã
- B4: chọn q lớp học trong số Q lớp của 1 trường học
- B5: Khảo sát tất cả học sinh trong lớp đã chọn.
35
Sai lệch chọn lựa
36
MẤT MẪU
37
TIÊU CHÍ CHỌN MẪU
Mẫu NC < dân số tính đại diện tiêu chí chọn mẫu:
Tiêu chí đưa vào: thể hiện những đặc tính (who,
where, when) mà căn cứ vào đó đối tượng được chọn
vào NC.
Tiêu chí loại ra: thuộc tính không phù hợp đưa vào
mẫu.
38
Sai lệch chọn lựa trong chọn mẫu
Các sai lệch khác:
Nghiên cứu người tình nguyện
Lấy mẫu những bệnh nhân đăng kí
Sai lệch do mùa (SXH)
…
Đạo đức:
Trung thực trong báo cáo khoa học nếu lấy mẫu
không đại diện
39
Biện pháp khắc phục sai lệch chọn mẫu
Lọai sai số Biện pháp hạn chế sai số
Sai số lựa chọn •Chọn khung mẫu phù hợp, cỡ mẫu cho từng
tầng trong nhóm NC.
•Tập huấn kỹ thuật chọn mẫu cho GSV.
•Áp dụng chọn ngẫu nhiên và liệt kê sẵn danh
sách, tiêu chuẩn chọn vào nhóm NC….
40
Kết luận
Việc chọn lựa một kỹ thuật lấy mẫu phụ thuộc
vào nhiều yếu tố bao gồm: mục tiêu nghiên
cứu, thiết kế nghiên cứu và các nguồn lực sẵn
có
Chi phí và lợi ích của từng phương pháp cần
được cân nhắc kỹ lưỡng
Trên thực tế, các nhà điều tra thường phối
hợp 2 hay nhiều chiến lược với nhau
41
BÀI TẬP KHẢO SÁT HỘ GIA ĐÌNH
Bộ câu hỏi Chỉ tiêu/ 1 học Đối tượng hỏi Ghi chú
viên
BCH phỏng vấn Khoảng 100 hộ Chủ hộ hay thành Ủy quyền trả lời
hộ gia đình của gia đình viên trong hộ từ thay:
WHO 18 tuổi trở lên
BCH phỏng vấn n = 1.5 x 384 = Hỏi tất cả thành Cha mẹ: trả lời thay
cá nhân về tình 576 600 người viên từ trẻ đến già trẻ em dưới 15 tuổi.
hình sức khỏe
của WHO Người chăm sóc
trực tiếp: trả lời
BCH Healthy Khoảng 100 hộ Những người từ thay người đang
Days GĐ (mỗi HGĐ 18 tuổi trở lên trong tình trạng sức
trung bình khoảng trong HGĐ khỏe không cho
2 người ≥ 18 tuổi phép trả lời: câm,
<==> 200 người) điếc, bệnh nặng…
42
CÁCH CHỌN MẪU PPS/1 học viên
43
CÁCH CHỌN MẪU PPS
Bước 1. Tính khoảng cách mẫu (Sampling Interval (SI))
= Tổng dân số tích lũy/tổng số cụm khảo sát
SI = 82.956/30 = 2765,2 ~ 2765
45
Các dãy số của các cụm còn lại
Cụm 6. 14825 Cụm 18. 48005
Cụm 7. 17590 Cụm 19. 50770
Cụm 8. 20355 Cụm 20. 53535
Cụm 9. 23120 Cụm 21. 56300
Cụm 10. 25885 Cụm 22. 59065
Cụm 11. 28650 Cụm 23. 61830
Cụm 12. 31415 Cụm 24. 64595
Cụm 13. 34180 Cụm 25. 67360
Cụm 14. 36945 Cụm 26. 70125
Cụm 15. 39710 Cụm 27. 72890
Cụm 16. 42475 Cụm 28. 75655
Cụm 17. 45240 Cụm 29. 78420
Cụm 30. 81185
46
CÁCH CHỌN MẪU PPS
Cụm 1. RS = 1000 (tổ 4, ấp 1, Xã Tân Long)
Cụm 2. RS + SI = 1000 + 2765 = 3765 (tổ 4, ấp 3, Xã TL)
1000
47
3765
BÀI TẬP KHẢO SÁT HỘ GIA ĐÌNH
Số người trong 1 cụm = 576/30 = 19.2 ~ 20 người
49