Professional Documents
Culture Documents
Nội dung 7
Chọn mẫu điều tra
Chương III Nội dung 6
Soạn thảo bảng hỏi
Nội dung 5
THIẾT KẾ MẪU ĐIỀU TRA Chọn phương pháp thu thập thông tin
Nội dung 4
Xác định nội dung điều tra
Nội dung 3
Xác định phạm vi,
đối tượng và đơn vị điều tra
Nội dung 2
Xác định mục
1 đích nghiên cứu 2
Nội dung 1
1.6. Chọn mẫu điều tra (1) Khái niệm về tổng thể và mẫu (1)
Tại sao phải tiến hành chọn mẫu? • Tổng thể là một tập hợp bao gồm toàn bộ các đối
tượng nghiên cứu.
•Đối tượng của các nghiên cứu xã hội học thường có phạm
• Tổng số đơn vị tổng thể được kí hiệu là N
vi (quy mô) rất lớn
• Xác định đúng tổng thể nghiên cứu rất quan trọng. Việc
•Nên thường phải tiến hành chọn ra một mẫu để nghiên xác định sai sẽ rất đến kết quả tính toán trên mẫu bị
cứu chệch và dẫn đến sai số phi chọn mẫu (sẽ đề cập ở phần
sau)
•Nếu mẫu đảm bảo tính đại diện thì kết quả của mẫu có thể
Tổng điều tra là thu thập thông tin của tất cả các đơn
dùng để phản ánh cho tổng thể vị thuộc tổng thể
– Điều tra tất cả các hộ gia đình của Việt Nam
– Điều tra tất cả các sinh viên của NEU
3 4
5 6
1
Từ tổng thể đến mẫu Lý do tiến hành điều tra chọn mẫu
• Tổng điều tra cung cấp bức tranh đầy đủ về tổng thể
nhưng nhìn chung không thể thực hiện được do
TỔNG THỂ
– Tổng điều tra tốn rất nhiều thời gian và kinh phí
– Mẫu với quy mô nhỏ hơn so với tổng thể cho phép thu thập
được nhiều thông tin chi tiết hơn
Dàn chọn mẫu – Mẫu được rút ra từ tổng thể không phản ánh được bức tranh
đầy đủ về tổng thể. Tuy nhiên với cách lấy mẫu chính xác và
(danh sách tất cả các một cỡ mẫu đủ lớn sẽ cho bức tranh rõ ràng về tổng thể đủ
đơn vị thuộc đối
tượng nghiên cứu)
phục vụ cho mục đích ra quyết định
Vậy một cỡ mẫu như thế nào là đủ lớn? Phải sử dụng các công
thức tính toán trên cơ sở am hiểu đặc trưng của tổng thể (đề
cập ở phần sau)
MẪU
7
8
Các cách tiến hành chọn mẫu Các phương pháp chọn mẫu ngẫu nhiên
• Chọn mẫu ngẫu nhiên: là đảm bảo cho tất cả các
đơn vị của tổng thể được chọn vào mẫu một cách • Chọn ngẫu nhiên đơn giản
ngẫu nhiên, không phụ thuộc vào ý muốn chủ quan • Chọn ngẫu nhiên hệ thống (chọn máy móc)
của người chọn mẫu
• Chọn mẫu phân tổ (phân loại)
• Chọn mẫu phi ngẫu nhiên: là các đơn vị được chọn
• Chọn mẫu phân tầng (nhiều cấp)
vào mẫu phụ thuộc vào ý muốn chủ quan của người
đứng ra chọn mẫu (xem chi tiết giáo trình) • Chọn mẫu chùm (cả khối)
• Chọn theo tỉ lệ với xác suất PPS
9 10
Chọn mẫu ngẫu nhiên đơn giản (RS) Chọn mẫu ngẫu nhiên đơn giản (RS)
• RS được coi là xuất phát điểm của các phương Phương pháp chính thức: sử dụng bảng số ngẫu
pháp chọn mẫu nhiên => áp dụng cho tổng thể có quy mô lớn. Năm
bước áp dụng phương pháp này
• Đặc điểm của phương pháp: tất cả các đơn vị
của tổng thể có xác suất được chọn vào mẫu i. Xây dựng dàn chọn mẫu: liệt kê tất cả các đơn vị của tổng
thể
bằng nhau
ii. Đánh số các đơn vị tổng thể bắt đầu từ 1
Phương pháp phi chính thức: chọn ngẫu nhiên iii. Xác định cỡ mẫu
các đơn vị. Cách làm khá đơn giản => áp dụng
cho các tổng thể có quy mô nhỏ iv. Xác định số kí tự trong bảng số ngẫu nhiên sử dụng để chọn
mẫu
v. Chọn vào mẫu các đơn vị tổng thể phù hợp với các số ngẫu
nhiên được lựa chọn
11 12
2
Bài tập tình huống 1 Khi nào thì áp dụng RS
• Đọc tài liệu được phân phát và tiến hành chọn • Khi có dàn chọn mẫu đầy đủ và chính xác
mẫu ngẫu nhiên 10 người từ dàn chọn mẫu
• Khi tổng thể tập trung theo khu vực địa lý => giảm
thiểu chi phí đi lại
• Nhược điểm của phương pháp RS
– Không phải lúc nào cũng có sẵn dàn chọn mẫu
– Chi phí đi lại tăng
13 14
15 16
Ưu nhược điểm của chọn ngẫu nhiên hệ thống Chọn mẫu phân tổ (phân loại)
• Ưu điểm: • Chọn mẫu phân tổ cho mẫu có tính đại biểu cao hơn
và như vậy kết quả suy rộng từ mẫu cho tổng thể sẽ
– Cách chọn mẫu đơn giản hơn
chính xác hơn
– Giảm đáng kể thời gian và công sức so với RS
• Tuy nhiên thủ tục chọn mẫu sẽ phức tạp hơn
• Nhược điểm
– Tương tự RS
– Sai số hệ thống có thể xảy ra do cách chọn mẫu
17 18
3
Các bước tiến hành chọn mẫu phân tổ Một ví dụ về chọn mẫu phân tổ (1)
• Lấy mẫu 100 doanh nghiệp từ tổng thể 2000 doanh
• Chọn biến phân tổ nghiệp trên địa bàn TP. Hà Nội
• Phân tổ tổng thể theo biến phân tổ • Phân tổ tổng thể theo hình thức sở hữu:
• Áp dụng chọn mẫu hệ thống hoặc ngẫu nhiên để – Doanh nghiệp nhà nước (SOEs): 500
chọn mẫu trong mỗi tổ – Doanh nghiệp tư nhân trong nước (PEs): 1200
– Doanh nghiệp có vốn đầu tư nước ngoài (FIEs): 300
• Thường thì cỡ mẫu ở mỗi tổ được chọn tỉ lệ với quy
mô của tổ nhưng cũng có thể không theo tỉ lệ với • Yêu cầu: Chọn mẫu tỉ lệ với quy mô tổng thể ở mỗi
quy mô tổ
19 20
Yêu cầu khi tiến hành chọn mẫu phân tổ Ưu nhược điểm của chọn mẫu phân tổ
• Tỉ lệ qui mô của mỗi tổ so với tổng thể Wh cần • Ưu điểm: cho mẫu có tính đại biểu cao hơn
được biết trước • Nhược điểm:
• Việc chọn mẫu phải được thực hiện riêng biệt ở – Một số nhược điểm giống như RS
mỗi tổ – Thủ tục chọn mẫu phức tạp hơn
• Mức độ đồng nhất về thông tin của các đơn vị
nghiên cứu trong mỗi tổ càng cao, độ chính xác
của ước lượng càng cao
23 24
4
Chọn mẫu phân tầng (chọn nhiều cấp) Chọn mẫu phân tầng: ví dụ
• Tương tự như chọn mẫu phân tổ nhưng liên quan đến • Chọn mẫu 100 doanh nghiệp theo nhiều giai đoạn - các bước
nhiều giai đoạn tiến hành
i. Chia Hanoi ra thành các khu vực địa lý nhỏ (quận/huyện) - Đơn vị chọn
• Phương pháp này được áp dụng khi biến động của mẫu cấp 1 (PSU)
các đơn vị nghiên cứu ở các giai đoạn khác nhau là ii. Nếu quan tâm đến thành thị/nông thôn thì chia các quận theo 2 nhánh
cao hoặc để giảm kinh phí điều tra do các đơn vị thành thị/nông thôn
nghiên cứu không tập trung về mặt địa lý iii.Phân bổ số quận/huyện được lựa chọn cho mỗi nhánh dựa vào tỉ lệ
quận/huyện trong tổng thể
• Ví dụ về chọn mẫu 100 doanh nghiệp. iv.Dùng phương pháp chọn mẫu ngẫu nhiên hoặc ngẫu nhiên hệ thống để
chọn quận/huyện
– Giả sử các doanh nghiệp có vị trí địa lý rất rải rác v. Xây dựng dàn chọn mẫu cho mỗi quân/huyện được chọn
vi.Phân tổ dàn chọn mẫu theo hình thức sở hữu
– Kinh phí điều tra lớn
vii.Phân bổ số doanh nghiệp được chọn cho mỗi tầng
– Giải pháp: chọn mẫu phân tầng viii.Dùng phương pháp chọn mẫu ngẫu nhiên hoặc ngẫu nhiên hệ thống để
chọn doanh nghiệp – đơn vị chọn mẫu cấp cuối cùng
25 26
Sơ đồ mô phỏng chọn mẫu phân tầng Các vấn đề cần xem xét khi sử dụng chọn
mẫu phân tầng
SOEs
• Số lượng các đơn vị chọn mẫu cấp 1,2
District A PEs
Urban
• Nguyên tắc: tối đa hóa đơn vị chọn mẫu cấp 1,2,..
FIEs
District K
và tối thiểu hóa đơn vị chọn mẫu ở cấp cuối cùng
District 1
• Quy luật bù trừ giữa tính đại biểu của mẫu và kinh
Rural
phí điều tra
District N
27 28
Chọn mẫu chùm (cả khối) Chọn mẫu chùm và chọn nhiều giai đoạn
Trong chọn mẫu chùm trước hết tổng thể chung • Nguyên tắc chọn: Đầu tiên một số cụm lớn được lựa
được chia thành các khối sau đó chọn ngẫu nhiên chọn, và cứ tiếp tục chọn các cụm nhỏ hơn cho đến
một số khối để điều tra. Các đơn vị mẫu không khi các đơn vị nghiên cứu được chọn ra từ các cụm ở
phải là từng đơn vị lẻ tẻ mà từng khối đơn vị giai đoạn cuối cùng.
(chùm). • Ví dụ: Để điều tra sinh viên trong một tỉnh. Đầu tiên
ta chọn một số trường. Từ các trường này chọn ra một
số lớp rồi điều tra tất cả các sinh viên của các lớp
được chọn.
29 30
5
Đặc điểm của chọn mẫu chùm Chọn mẫu với xác suất chọn tỷ lệ
với quy mô tổng thể (PPS)
• Ưu điểm: tổ chức gọn nhẹ, giảm được chi phí; • Tương tự như chọn mẫu nhiều giai đoạn
• Nhược điểm: do số đơn vị được chọn chỉ tập • Các đơn vị ở các cấp trước cấp cuối cùng được chọn
trung vào một số khối nên có thể dẫn đến sai số vào mẫu với xác suất chọn tỉ lệ với quy mô của tổng
lớn nếu giữa các khối có sự khác biệt nhau thể
• Đơn vị chọn mẫu cuối cùng thường được chọn theo
nhiều;
phương pháp ngẫu nhiên hay ngẫu nhiên hệ thống
• Điều kiện vận dụng: Chỉ nên áp dụng trong • Nếu muốn X/S chọn mỗi đơn vị ở cấp cuối cùng như
trường hợp giữa các đơn vị trong một khối có sự nhau thì số lượng đơn vị chọn mẫu ở cấp cuối cùng
khác nhau đáng kể song giữa các khối lại giống phải bằng nhau.
nhau về bản chất 31 32
• Giả sử cần chọn một mẫu gồm 21 căn hộ trong một • Để cho đơn giản, lấy ví dụ về chọn mẫu 2 giai đoạn.
tổng thể có 9 khu nhà gồm 315 căn hộ Giai đoạn 1 chọn ra các khu nhà x và giai đoạn 2
• Tổng thể được mô tả trong bảng sau chọn các căn hộ y trong khu nhà x
• Giả sử giai đoạn 1 chọn 3 khu nhà (xác định trước)
1 2 3 4 5 6 7 8 9 Tổng • Cỡ mẫu được xác định là 21 căn hộ không phụ thuộc
20 100 50 15 18 43 20 36 13 315 vào khu nhà nào được chọn
1 2 3 4 5 6 7 8 9 Tổng
20 100 50 15 18 43 20 36 13 315
33 34
6
Quyền số chọn mẫu Quyền số: Ví dụ
• Quyền số chọn mẫu = 1/xác suất chọn • Tính quyền số chọn mẫu cho các căn hộ được
Nếu chọn mẫu nhiều giai đoạn, quyền số chọn mẫu chọn ở khu nhà số 2 ở ví dụ trên
là: 1 P(x,y) = P(x) x P(y|x)
i k
Xác sut chn khu nhà x là:
pj j1
P(x) = Bx/105; B(x) là quy mô ca khu nhà c chn
Xác sut chn cn h trong khu nhà x là:
P(y|x) = 7/Bx
=> P(xy) = Bx/105 x 7/Bx = 7/105 = 1/15 ~ 21/315
quyn s = 1: 1/15 = 15
38
41 42
7
Quy mô mẫu trong trường hợp ước Xác định quy mô mẫu trong trường hợp
lượng số trung bình ước lượng tỉ lệ
• Tương tự trường hợp ước lượng số trung bình, áp
• Từ định lý giới hạn trung tâm, ta có:
dụng CLT:
Trong đó: α là sai số; là phạm vi sai số chọn • Trong đó: z là mức độ tin cậy của ước lượng; p là tỉ lệ
mẫu. Nếu giả định biết phương sai, sẽ tính được cỡ ước đoán của tổng thể theo một tiêu chí cụ thể nào
mẫu đó; (f-p) là phạm vi sai số chọn mãu hay độ chính xác
của ước lượng. Nó cho biết giả định về chêch lệch
giữa giá trị thật của tổng thể và giá trị ước lượng từ
mẫu. 44
Xác định quy mô mẫu: ví dụ Sai số chọn mẫu và sai số phi chọn mẫu
• Sai số chọn mẫu:
• Dự án: nghiên cứu tình trạng suy dinh dưỡng của trẻ – Xảy ra do chỉ tiến hành điều tra một phần của tổng thể
em dưới 5 tuổi ở vùng dự án tỉnh Cao Bằng năm nghiên cứu
2014. – Sai số chọn mẫu là khác biệt giữa kết quả tính toán trên mẫu
và kết quả tính toán trên tổng thể
• Ước đoán tỉ lệ suy dinh dưỡng là 30%. Hãy xác định
cỡ mẫu khi giả định chêch lệch giữa giá trị thật của
Ví dụ: chênh lệch giữa trung bình mẫu
tổng thể
x và trung bình
tổng thể và giá trị ước lượng từ mẫu là 5%. • Sai số phi chọn mẫu:
– Là chênh lệch giữa giá trị thực và giá trị thu được qua điều
tra của đối tượng điều tra.
– Sai số này xảy ra ở tất cả các giai đoạn của quá trình điều tra
do rất nhiều nguyên nhân
45 46
47