You are on page 1of 8

1.

XÂY DỰNG PHƯƠNG ÁN ĐIỀU TRA THỐNG KÊ

Lập kế hoạch tổ chức và tiến hành điều tra

Nội dung 7
Chọn mẫu điều tra
Chương III Nội dung 6
Soạn thảo bảng hỏi
Nội dung 5
THIẾT KẾ MẪU ĐIỀU TRA Chọn phương pháp thu thập thông tin

Nội dung 4
Xác định nội dung điều tra

Nội dung 3
Xác định phạm vi,
đối tượng và đơn vị điều tra
Nội dung 2
Xác định mục
1 đích nghiên cứu 2
Nội dung 1

1.6. Chọn mẫu điều tra (1) Khái niệm về tổng thể và mẫu (1)
Tại sao phải tiến hành chọn mẫu? • Tổng thể là một tập hợp bao gồm toàn bộ các đối
tượng nghiên cứu.
•Đối tượng của các nghiên cứu xã hội học thường có phạm
• Tổng số đơn vị tổng thể được kí hiệu là N
vi (quy mô) rất lớn
• Xác định đúng tổng thể nghiên cứu rất quan trọng. Việc
•Nên thường phải tiến hành chọn ra một mẫu để nghiên xác định sai sẽ rất đến kết quả tính toán trên mẫu bị
cứu chệch và dẫn đến sai số phi chọn mẫu (sẽ đề cập ở phần
sau)
•Nếu mẫu đảm bảo tính đại diện thì kết quả của mẫu có thể
 Tổng điều tra là thu thập thông tin của tất cả các đơn
dùng để phản ánh cho tổng thể vị thuộc tổng thể
– Điều tra tất cả các hộ gia đình của Việt Nam
– Điều tra tất cả các sinh viên của NEU

3 4

Khái niệm về tổng thể và mẫu (2) Kỹ thuật chọn mẫu


• Mẫu là một tập hợp con được rút ra từ tổng thể • Kỹ thuật chọn mẫu là cách lấy mẫu từ tổng thể chung
nghiên cứu  Một yêu cầu quan trọng: mẫu phải đảm bảo tính đại
• Tổng số đơn vị của mẫu được kí hiệu là n diện cho tổng thể. Điều này có nghĩa là mẫu phải giống
tổng thể ở một hoặc một vài đặc trưng nào đó
 Điều tra chọn mẫu là thu thập thông tin từ các đơn
vị trong mẫu  Ví dụ: muốn mẫu các sinh viên được chọn của NEU
giống với tổng thể theo tiêu chí nào: giới tính, khu vực
– Điều tra một bộ phận các hộ gia đình của Việt Nam địa lý, giàu/nghèo,...
– Điều tra một bộ phận các sinh viên của NEU  Điều cốt lõi là phải hiểu được đặc trưng của tổng thể để
lựa chọn phương pháp chọn mẫu thích hợp

5 6

1
Từ tổng thể đến mẫu Lý do tiến hành điều tra chọn mẫu
• Tổng điều tra cung cấp bức tranh đầy đủ về tổng thể
nhưng nhìn chung không thể thực hiện được do
TỔNG THỂ
– Tổng điều tra tốn rất nhiều thời gian và kinh phí
– Mẫu với quy mô nhỏ hơn so với tổng thể cho phép thu thập
được nhiều thông tin chi tiết hơn
Dàn chọn mẫu – Mẫu được rút ra từ tổng thể không phản ánh được bức tranh
đầy đủ về tổng thể. Tuy nhiên với cách lấy mẫu chính xác và
(danh sách tất cả các một cỡ mẫu đủ lớn sẽ cho bức tranh rõ ràng về tổng thể đủ
đơn vị thuộc đối
tượng nghiên cứu)
phục vụ cho mục đích ra quyết định
 Vậy một cỡ mẫu như thế nào là đủ lớn? Phải sử dụng các công
thức tính toán trên cơ sở am hiểu đặc trưng của tổng thể (đề
cập ở phần sau)
MẪU
7
8

Các cách tiến hành chọn mẫu Các phương pháp chọn mẫu ngẫu nhiên
• Chọn mẫu ngẫu nhiên: là đảm bảo cho tất cả các
đơn vị của tổng thể được chọn vào mẫu một cách • Chọn ngẫu nhiên đơn giản
ngẫu nhiên, không phụ thuộc vào ý muốn chủ quan • Chọn ngẫu nhiên hệ thống (chọn máy móc)
của người chọn mẫu
• Chọn mẫu phân tổ (phân loại)
• Chọn mẫu phi ngẫu nhiên: là các đơn vị được chọn
• Chọn mẫu phân tầng (nhiều cấp)
vào mẫu phụ thuộc vào ý muốn chủ quan của người
đứng ra chọn mẫu (xem chi tiết giáo trình) • Chọn mẫu chùm (cả khối)
• Chọn theo tỉ lệ với xác suất PPS

9 10

Chọn mẫu ngẫu nhiên đơn giản (RS) Chọn mẫu ngẫu nhiên đơn giản (RS)
• RS được coi là xuất phát điểm của các phương  Phương pháp chính thức: sử dụng bảng số ngẫu
pháp chọn mẫu nhiên => áp dụng cho tổng thể có quy mô lớn. Năm
bước áp dụng phương pháp này
• Đặc điểm của phương pháp: tất cả các đơn vị
của tổng thể có xác suất được chọn vào mẫu i. Xây dựng dàn chọn mẫu: liệt kê tất cả các đơn vị của tổng
thể
bằng nhau
ii. Đánh số các đơn vị tổng thể bắt đầu từ 1
 Phương pháp phi chính thức: chọn ngẫu nhiên iii. Xác định cỡ mẫu
các đơn vị. Cách làm khá đơn giản => áp dụng
cho các tổng thể có quy mô nhỏ iv. Xác định số kí tự trong bảng số ngẫu nhiên sử dụng để chọn
mẫu
v. Chọn vào mẫu các đơn vị tổng thể phù hợp với các số ngẫu
nhiên được lựa chọn

11 12

2
Bài tập tình huống 1 Khi nào thì áp dụng RS

• Đọc tài liệu được phân phát và tiến hành chọn • Khi có dàn chọn mẫu đầy đủ và chính xác
mẫu ngẫu nhiên 10 người từ dàn chọn mẫu
• Khi tổng thể tập trung theo khu vực địa lý => giảm
thiểu chi phí đi lại
• Nhược điểm của phương pháp RS
– Không phải lúc nào cũng có sẵn dàn chọn mẫu
– Chi phí đi lại tăng

13 14

Chọn mẫu ngẫu nhiên hệ thống Bài tập tình huống 2


• Tương tự RS nhưng đơn giản hơn
• Tiến hành chọn mẫu ngẫu nhiên hệ thống 5 người
• Các bước tiến hành chọn mẫu ngẫu nhiên hệ thống từ dàn chọn mẫu trong tài liệu được phân phát
– Xây dựng dàn chọn mẫu
– Xác định quy mô tổng thể
– Xác định quy mô mẫu
– Tính khoảng cách chọn mẫu bằng cách lấy quy mô tổng
thể chia cho quy mô mẫu
– Chọn ngẫu nhiên điểm bắt đầu
– Sử dụng khoảng cách chọn mẫu để chọn các đơn vị tiếp
theo

15 16

Ưu nhược điểm của chọn ngẫu nhiên hệ thống Chọn mẫu phân tổ (phân loại)
• Ưu điểm: • Chọn mẫu phân tổ cho mẫu có tính đại biểu cao hơn
và như vậy kết quả suy rộng từ mẫu cho tổng thể sẽ
– Cách chọn mẫu đơn giản hơn
chính xác hơn
– Giảm đáng kể thời gian và công sức so với RS
• Tuy nhiên thủ tục chọn mẫu sẽ phức tạp hơn
• Nhược điểm
– Tương tự RS
– Sai số hệ thống có thể xảy ra do cách chọn mẫu

17 18

3
Các bước tiến hành chọn mẫu phân tổ Một ví dụ về chọn mẫu phân tổ (1)
• Lấy mẫu 100 doanh nghiệp từ tổng thể 2000 doanh
• Chọn biến phân tổ nghiệp trên địa bàn TP. Hà Nội
• Phân tổ tổng thể theo biến phân tổ • Phân tổ tổng thể theo hình thức sở hữu:
• Áp dụng chọn mẫu hệ thống hoặc ngẫu nhiên để – Doanh nghiệp nhà nước (SOEs): 500
chọn mẫu trong mỗi tổ – Doanh nghiệp tư nhân trong nước (PEs): 1200
– Doanh nghiệp có vốn đầu tư nước ngoài (FIEs): 300
• Thường thì cỡ mẫu ở mỗi tổ được chọn tỉ lệ với quy
mô của tổ nhưng cũng có thể không theo tỉ lệ với • Yêu cầu: Chọn mẫu tỉ lệ với quy mô tổng thể ở mỗi
quy mô tổ

19 20

Một ví dụ về chọn mẫu phân tổ (2) Sơ đồ mô phỏng chọn mẫu phân tổ


• Các kí hiệu
– h: tổ thứ h h
N   Nh SOEs (500) 25
– Nh : quy mô của tổng thể ở tổ h => 1
h

– nh : số đơn vị mẫu được chọn ở tổ h => n  n


1
h PEs (1200) 60
Nh
– Wh 
N
là tỉ lệ quy mô các đơn vị trong tổ h so với tổng thể
FIEs (300)
h 15
=>  W h  1
1

• Mẫu được chọn ở mỗi tổ bao gồm nh  n Wh =>


500
» SOEs: 1 0 0   25 • Biến phân tổ: hình thức sở hữu
2000
1200
» PEs: 100   60
2000

» FIEs: 100  300  15


2000
21 22

Yêu cầu khi tiến hành chọn mẫu phân tổ Ưu nhược điểm của chọn mẫu phân tổ

• Tỉ lệ qui mô của mỗi tổ so với tổng thể Wh cần • Ưu điểm: cho mẫu có tính đại biểu cao hơn
được biết trước • Nhược điểm:
• Việc chọn mẫu phải được thực hiện riêng biệt ở – Một số nhược điểm giống như RS
mỗi tổ – Thủ tục chọn mẫu phức tạp hơn
• Mức độ đồng nhất về thông tin của các đơn vị
nghiên cứu trong mỗi tổ càng cao, độ chính xác
của ước lượng càng cao

23 24

4
Chọn mẫu phân tầng (chọn nhiều cấp) Chọn mẫu phân tầng: ví dụ
• Tương tự như chọn mẫu phân tổ nhưng liên quan đến • Chọn mẫu 100 doanh nghiệp theo nhiều giai đoạn - các bước
nhiều giai đoạn tiến hành
i. Chia Hanoi ra thành các khu vực địa lý nhỏ (quận/huyện) - Đơn vị chọn
• Phương pháp này được áp dụng khi biến động của mẫu cấp 1 (PSU)
các đơn vị nghiên cứu ở các giai đoạn khác nhau là ii. Nếu quan tâm đến thành thị/nông thôn thì chia các quận theo 2 nhánh
cao hoặc để giảm kinh phí điều tra do các đơn vị thành thị/nông thôn
nghiên cứu không tập trung về mặt địa lý iii.Phân bổ số quận/huyện được lựa chọn cho mỗi nhánh dựa vào tỉ lệ
quận/huyện trong tổng thể
• Ví dụ về chọn mẫu 100 doanh nghiệp. iv.Dùng phương pháp chọn mẫu ngẫu nhiên hoặc ngẫu nhiên hệ thống để
chọn quận/huyện
– Giả sử các doanh nghiệp có vị trí địa lý rất rải rác v. Xây dựng dàn chọn mẫu cho mỗi quân/huyện được chọn
vi.Phân tổ dàn chọn mẫu theo hình thức sở hữu
– Kinh phí điều tra lớn
vii.Phân bổ số doanh nghiệp được chọn cho mỗi tầng
– Giải pháp: chọn mẫu phân tầng viii.Dùng phương pháp chọn mẫu ngẫu nhiên hoặc ngẫu nhiên hệ thống để
chọn doanh nghiệp – đơn vị chọn mẫu cấp cuối cùng

25 26

Sơ đồ mô phỏng chọn mẫu phân tầng Các vấn đề cần xem xét khi sử dụng chọn
mẫu phân tầng
SOEs
• Số lượng các đơn vị chọn mẫu cấp 1,2
District A PEs

Urban
• Nguyên tắc: tối đa hóa đơn vị chọn mẫu cấp 1,2,..
FIEs
District K
và tối thiểu hóa đơn vị chọn mẫu ở cấp cuối cùng

District 1
• Quy luật bù trừ giữa tính đại biểu của mẫu và kinh
Rural
phí điều tra
District N

27 28

Chọn mẫu chùm (cả khối) Chọn mẫu chùm và chọn nhiều giai đoạn

Trong chọn mẫu chùm trước hết tổng thể chung • Nguyên tắc chọn: Đầu tiên một số cụm lớn được lựa
được chia thành các khối sau đó chọn ngẫu nhiên chọn, và cứ tiếp tục chọn các cụm nhỏ hơn cho đến
một số khối để điều tra. Các đơn vị mẫu không khi các đơn vị nghiên cứu được chọn ra từ các cụm ở
phải là từng đơn vị lẻ tẻ mà từng khối đơn vị giai đoạn cuối cùng.
(chùm). • Ví dụ: Để điều tra sinh viên trong một tỉnh. Đầu tiên
ta chọn một số trường. Từ các trường này chọn ra một
số lớp rồi điều tra tất cả các sinh viên của các lớp
được chọn.
29 30

5
Đặc điểm của chọn mẫu chùm Chọn mẫu với xác suất chọn tỷ lệ
với quy mô tổng thể (PPS)

• Ưu điểm: tổ chức gọn nhẹ, giảm được chi phí; • Tương tự như chọn mẫu nhiều giai đoạn
• Nhược điểm: do số đơn vị được chọn chỉ tập • Các đơn vị ở các cấp trước cấp cuối cùng được chọn
trung vào một số khối nên có thể dẫn đến sai số vào mẫu với xác suất chọn tỉ lệ với quy mô của tổng
lớn nếu giữa các khối có sự khác biệt nhau thể
• Đơn vị chọn mẫu cuối cùng thường được chọn theo
nhiều;
phương pháp ngẫu nhiên hay ngẫu nhiên hệ thống
• Điều kiện vận dụng: Chỉ nên áp dụng trong • Nếu muốn X/S chọn mỗi đơn vị ở cấp cuối cùng như
trường hợp giữa các đơn vị trong một khối có sự nhau thì số lượng đơn vị chọn mẫu ở cấp cuối cùng
khác nhau đáng kể song giữa các khối lại giống phải bằng nhau.
nhau về bản chất 31 32

Phương pháp PPS: ví dụ (1) Phương pháp PPS: ví dụ (2)

• Giả sử cần chọn một mẫu gồm 21 căn hộ trong một • Để cho đơn giản, lấy ví dụ về chọn mẫu 2 giai đoạn.
tổng thể có 9 khu nhà gồm 315 căn hộ Giai đoạn 1 chọn ra các khu nhà x và giai đoạn 2
• Tổng thể được mô tả trong bảng sau chọn các căn hộ y trong khu nhà x
• Giả sử giai đoạn 1 chọn 3 khu nhà (xác định trước)
1 2 3 4 5 6 7 8 9 Tổng • Cỡ mẫu được xác định là 21 căn hộ không phụ thuộc
20 100 50 15 18 43 20 36 13 315 vào khu nhà nào được chọn

1 2 3 4 5 6 7 8 9 Tổng
20 100 50 15 18 43 20 36 13 315

33 34

Phương pháp PPS: ví dụ (3) Phương pháp PPS: ví dụ (4)


• Khoảng cách chọn mẫu là s=315/3=105
• Dùng phương pháp ngẫu nhiên hệ thống chọn 1 số bất kỳ • Sau khi chọn được các khu nhà, liệt kê danh sách
trong khoảng 1-105. Giả sử chọn số a=40, khu nhà số 2
được chọn vào mẫu. Các khu nhà tiếp theo được chọn là
các hộ trong những khu nhà được chọn vào các
a+s, a+2s,…tương ứng với khu nhà số 3 và số 7 danh sách riêng rẽ (xây dựng dàn chọn mẫu cho
• Kết quả mô tả ở bảng sau: đơn vị chọn mẫu cấp 2)
Số hộ trong mỗi Khoảng cách Khu nhà • Tiến hành chọn ngẫu nhiên 7 hộ trong mỗi khu
STT khu nhà
1
khu nhà
20
Số hộ tích lũy
20
chọn mẫu
105
được chọn nhà một cách độc lập
2 100 120 x
3 50 170 40+105 x
4 15 185
5 18 203
6 43 246
7 20 266 40+105*2 x
8 36 302
9 13 315
Tổng 315 15

6
Quyền số chọn mẫu Quyền số: Ví dụ
• Quyền số chọn mẫu = 1/xác suất chọn • Tính quyền số chọn mẫu cho các căn hộ được
 Nếu chọn mẫu nhiều giai đoạn, quyền số chọn mẫu chọn ở khu nhà số 2 ở ví dụ trên
là: 1 P(x,y) = P(x) x P(y|x)
i  k
Xác sut chn khu nhà x là:
 pj j1
P(x) = Bx/105; B(x) là quy mô ca khu nhà c chn
Xác sut chn cn h trong khu nhà x là:

P(y|x) = 7/Bx
=> P(xy) = Bx/105 x 7/Bx = 7/105 = 1/15 ~ 21/315
quyn s = 1: 1/15 = 15
38

Xác suất chọn hộ: ví dụ


Mẫu dự phòng
• Xác suất chọn hộ được tính theo công thức:
• Cần phải lấy mẫu dự phòng cho những tình huống
P ( xy )  P ( x )  P ( y | x )
không trả lời
trong do: P ( x) la xac suat chon khu nha x;
– Nếu ước lượng tỉ lệ không trả lời thấp thì lấy mẫu dự phòng
P ( y | x) la xac suat chon ho y trong khu nha x
ít
21 1
P ( xy )   – Nếu ước lượng tỉ lệ không trả lời cao hoặc dàn chọn mẫu
315 15
7 có độ chính xác không cao thì phải lấy mẫu dự phòng nhiều
P( y | x)  voi Bx la qui mo cua khu nha x
Bx
1 7 B

15
 P ( x) 
Bx
 P ( x)  x
105
• Mẫu dự phòng nên xác định từ trước ở giai đoạn
P ( xy ), P ( x), P ( y | x) la can cu quan trong de tinh quyen so lấy mẫu hay lấy trực tiếp khi đi điều tra?
1
w la mot bien quan trong de suy rong ket qua tu mau cho tong the
P ( xy )

Xác định quy mô mẫu Xác định quy mô mẫu


• Mức độ tin cậy của ước lượng từ cuộc điều tra: VD:
• Quy mô mẫu phụ thuộc vào các yếu tố sau:
95% => Sai số 5%
– Mức độ tin cậy của các ước lượng từ cuộc điều tra (1)
• Tính đồng nhất của các đơn vị tổng thể: phương sai
– Tính đồng nhất (homogeneity) của các đơn vị tổng thể (2)
của tổng thể chung
– Chất lượng của số liệu thu thập được từ cuộc điều tra (3)
– Thời gian và kinh phí cho cuộc điều tra (4) • Chất lượng của số liệu thu thập được từ cuộc điều
tra: độ chính xác của ước lượng (phạm vi sai số
chọn mẫu: chêch lệch giữa các thống kê tính từ mẫu
và tham số của tổng thể chung)
• Thời gian và kinh phí cho cuộc điều tra

41 42

7
Quy mô mẫu trong trường hợp ước Xác định quy mô mẫu trong trường hợp
lượng số trung bình ước lượng tỉ lệ
• Tương tự trường hợp ước lượng số trung bình, áp
• Từ định lý giới hạn trung tâm, ta có:
dụng CLT:

Trong đó: α là sai số; là phạm vi sai số chọn • Trong đó: z là mức độ tin cậy của ước lượng; p là tỉ lệ
mẫu. Nếu giả định biết phương sai, sẽ tính được cỡ ước đoán của tổng thể theo một tiêu chí cụ thể nào
mẫu đó; (f-p) là phạm vi sai số chọn mãu hay độ chính xác
của ước lượng. Nó cho biết giả định về chêch lệch
giữa giá trị thật của tổng thể và giá trị ước lượng từ
mẫu. 44

Xác định quy mô mẫu: ví dụ Sai số chọn mẫu và sai số phi chọn mẫu
• Sai số chọn mẫu:
• Dự án: nghiên cứu tình trạng suy dinh dưỡng của trẻ – Xảy ra do chỉ tiến hành điều tra một phần của tổng thể
em dưới 5 tuổi ở vùng dự án tỉnh Cao Bằng năm nghiên cứu
2014. – Sai số chọn mẫu là khác biệt giữa kết quả tính toán trên mẫu
và kết quả tính toán trên tổng thể
• Ước đoán tỉ lệ suy dinh dưỡng là 30%. Hãy xác định
cỡ mẫu khi giả định chêch lệch giữa giá trị thật của
 Ví dụ: chênh lệch giữa trung bình mẫu
tổng thể 
x và trung bình

tổng thể và giá trị ước lượng từ mẫu là 5%. • Sai số phi chọn mẫu:
– Là chênh lệch giữa giá trị thực và giá trị thu được qua điều
tra của đối tượng điều tra.
– Sai số này xảy ra ở tất cả các giai đoạn của quá trình điều tra
do rất nhiều nguyên nhân

45 46

Các nguyên nhân của sai số phi chọn mẫu


• Sai số do xác định mục đích nghiên cứu
• Sai số do xác định đối tượng điều tra
• Sai số do thiếu định nghĩa rõ ràng cho tiêu thức điều tra
• Sai số phát sinh trong thiết kế bảng hỏi và hướng dẫn cách ghi
phiếu
• Sai số trong chuẩn bị địa bàn điều tra
• Sai số do tuyển chọn và tập huấn ĐTV
• Sai số trong lựa chọn phương pháp điều tra
• Sai số do đơn vị điều tra không trả lời
• Các loại sai số khác

47

You might also like