You are on page 1of 49

MẪU VÀ PHƯƠNG PHÁP

CHỌN MẪU
Mục tiêu học tập
1. Xác định được quần thể đích, quần
thể nghiên cứu, đơn vị mẫu
2. Lựa chọn được phương pháp chọn
mẫu thích hợp
3. Dự kiến được các loại sai số trong
quá trình chọn mẫu và các biện pháp
khắc phục.
4. Tính được cỡ mẫu cho một nghiên
cứu 2
Khái niệm

? ?
Quần thể Quần thể Chọn
đích
Mẫu
NC

3
Đơn vị lấy mẫu, khung mẫu
Đơn vị lấy mẫu: là đơn vị của quần thể
được chọn vào mẫu
Khung mẫu: Danh sách các đơn vị mẫu
hoặc bản đồ phân bố mẫu.
Đơn vị nghiên cứu: là một chủ thể mà
sự quan sát hoặc đo lường sẽ được
thực hiện trên chủ thể (người hoặc vật
thí nghiệm)
4
Nghiên cứu về sử dụng hố xí tại xã X

Danh sách Chọn PV Chủ hộ


Các hộ Đại diện
gia đình 200 hộ
hgđ
trong xã

Đơn vị Đơn vị
Khung
lấy mẫu NC
mẫu 5
Lý do chọn mẫu
Không đủ kinh phí
Sai số trong điều tra toàn thể
Mẫu đủ lớn sẽ ngoại suy ra toàn quần
thể

6
CÁC PHƯƠNG PHÁP CHỌN MẪU

7
Các phương pháp chọn mẫu
 Chọn mẫu có xác suất
Ngẫu nhiên đơn
Ngẫu nhiên hệ thống
Phân tầng
Mẫu cụm
Nhiều giai đoạn
 Chọn mẫu không xác suất
Thuận tiện
Chỉ tiêu
Mục đích
8
Chọn mẫu ngẫu nhiên đơn

9
Chọn mẫu ngẫu nhiên đơn
Là mẫu mà tất cả các thể trong quần
thể có cùng cơ hội để chọn vào mẫu.
Cách chọn:
Lập danh sách toàn bộ những đơn vị
mẫu trong quần thể
Sử dụng phương pháp “bốc thăm” hoặc
sử dụng bảng số ngẫu nhiên để chọn
đơn vị mẫu
10
Chọn mẫu ngẫu nhiên đơn
Ưu điểm:
Cách làm đơn giản, tính đại diện cao
Có thể lòng vào các kỷ thuật chọn mẫu
khác
Hạn chế:
Cần phải có khung mẫu
Các cá thể được chọn vào mẫu có thể
phân bố tản mạn.
11
Chọn mẫu ngẫu nghiên hệ
thống

Sampling interval’s width is determined


and individuals selected.
12
Chọn mẫu ngẫu nghiên hệ thống
Những cá thể được chọn theo một
khoảng cách đều đặn
Cách chọn
Ghi một danh sách đơn vị mẫu
Xác định khoảng cách mẫu k=N/n
Chọn một số ngẫu nhiên (i) giữa 1 và k.
Các cá thể có số thứ tự i + 1k, i + 2k,
i + 3k... sẽ được chọn vào mẫu
13
Chọn mẫu phân tầng

14
Chọn mẫu phân tầng
 Là việc phân chia các cá thể của quần thể
nghiên cứu thành các nhóm riêng lẽ
 Lý do phân tầng: Có sự khác biệt về đặc tính
nghiên cứu của các cá thể ở các tầng
 Tầng có thể phân chia theo: Khu vực địa lý,
giới, tuổi, nghề nghiệp…
 Ví dụ: Để khảo sát các yếu tố nguy cơ gây
bệnh Đái tháo đường tại thành phố CT, nhà
nghiên cứu có thể phân chia tầng theo thành
thị và nông thôn 15
Cách chọn mẫu tầng

Thành phố CT

Nông thôn Thành thị

Xã Phường

16
Cluster sample

Chọn mẫu chùm (cụm)

17
Chọn mẫu chùm (cụm)
 Do không có khung mẫu hoặc nghiên cứu
trên địa bàn rộng
 Có được các nhóm của các đơn vị nghiên
cứu có sẵn (các làng, các trường học)
 Việc chọn những nhóm các đơn vị nghiên
cứu (các cụm) thay cho việc chọn cá nhân
những đơn vị nghiên cứu.

18
Chọn mẫu chùm (cụm)
Các cụm thường là những đơn vị địa lý
(xã, ấp/khu vực) hoặc những đơn vị tổ
chức (các phòng khám, trường học…).
Số lượng cụm, tuỳ vào số cụm. Nên
chọn 30
Ví dụ: Chọn mẫu cụm trong xác định tỷ
lệ bao phủ tiêm chủng trẻ dưới 5 tuổi
của tỉnh X
19
Chọn mẫu chùm (cụm)

Dân số Mẫu cụm Mẫu cụm


chọn mẫu bậc 1 bậc 2

20
Chọn mẫu PPS – Xác suất tỷ lệ với kích
cỡ của quần thể
 Sử dụng khi nghiên cứu trên cộng đồng
lớn, kích thước các cộng đồng không đều
nhau
 Các bước thực hiện
1. Liệt kê các cụm và dân số
2. Xếp các cụm theo một trình tự và cộng dồn
3. Chọn khoảng cách mẫu k = Dscd/số cụm
4. Chọn ngẫu nhiên con số i nào đó, chọn
cụm đầu tiên có dân số cộng dồn lớn hơn
hoặc bằng i
5. Các cụm kế tiếp tính bằng cách lấy i + k
21
Ví dụ
Một nghiên cứu về tình trạng sâu răng
của học sinh tiểu học tại quận Ninh kiều
TPCT.
Cỡ mẫu: 300 học sinh
Số lượng trường tiểu học là 10
Số lượng trường tiểu học cần chọn là 4
Các bước chọn theo PPS?
22
Tên trường và số lượng học sinh
Tên
Trường Số lượng
1 400
2 700
3 800
4 1200
5 1800
6 300
7 800
8 900
9 1100
10 1000
Tổng 9000

23
Cộng dồn
Tên
Trường Số lượng Cộng dồn
1 400 400
2 700 1100
3 800 1900
4 1200 3100
5 1800 4900
6 300 5200
7 800 6000
8 900 6900
9 1100 8000
10 1000 9000
Tổng 9000

24
Tính khoảng cách k
Tên Khoảng
Trường Số lượng Cộng dồn cách k
1 400 400 2250
2 700 1100
3 800 1900
4 1200 3100
5 1800 4900
6 300 5200
7 800 6000
8 900 6900
9 1100 8000
10 1000 9000
Tổng 9000

25
Chọn số ngẫu nhiên i <= k
Tên Khoảng Chọn
Trường Số lượng Cộng dồn cách cụm
1 400 400 2250
2 700 1100 679
3 800 1900
4 1200 3100
5 1800 4900
6 300 5200
7 800 6000
8 900 6900
9 1100 8000
10 1000 9000
Tổng 9000

26
Chọn các cụm còn lại
Tên Khoảng Chọn
Trường Số lượng Cộng dồn cách cụm
1 400 400 2250
2 700 1100 679
3 800 1900
4 1200 3100 2929
5 1800 4900
6 300 5200 5179
7 800 6000
8 900 6900
9 1100 8000 7429
10 1000 9000
Tổng 9000

27
Tính tổng học sinh của các trường được chọn
Tên Khoảng Chọn
Trường Số lượng Cộng dồn cách cụm Mẫu
1 400 400 2250
2 700 1100 679
3 800 1900
4 1200 3100 2929
5 1800 4900
6 300 5200 5179
7 800 6000
8 900 6900
9 1100 8000 7429
10 1000 9000
Tổng 9000 3300 0

28
Tính cỡ mẫu cho các trường ni= (n x Ni)/N
Tên Khoảng Chọn
Trường Số lượng Cộng dồn cách cụm Mẫu
1 400 400 2250
2 700 1100 679 64
3 800 1900
4 1200 3100 2929 109
5 1800 4900
6 300 5200 5179 27
7 800 6000
8 900 6900
9 1100 8000 7429 100
10 1000 9000
Tổng 9000 3300 300

29
Chọn mẫu nhiều giai đoạn
Trong những quần thể rất lớn và rải
khắp mẫu có thể được tiến hành theo
hai hoặc nhiều giai đoạn
Thường là những nghiên cứu dựa trên
cộng đồng, trong đó người được phỏng
vấn thuộc những làng khác nhau, và
những làng này đã được chọn từ những
khu vực khác nhau
30
Ví dụ
 Ví dụ: ĐBSCL có 13 tỉnh, mỗi tỉnh có nhiều
huyện, mỗi huyện có nhiều xã...
 Giai đọan 1: Chọn ngẫu nhiên 3 tỉnh;
 Giai đọan 2: Chọn ngẫu nhiên 2 huyện từ
các tỉnh đã được chọn ở giai đoạn 1
 Giai đọan 3: Chọn ngẫu nhiên 2 xã từ các
huyện đã được chọn ở giai đoạn 2,...
 Giai đoạn 4: Chọn ngẫu nhiên 2 ấp từ xã
 Giai đoạn 5: Chọn ngẫu nhiên 30 cá thể từ
mỗi ấp
31
Chọn mẫu không xác xuất
Chọn mẫu thuận tiện
Đạt được trên cơ sở các cá thể có sẵn
khi thu thập số liệu.
Ví dụ: Tất cả các bệnh nhân đến khám
tại phòng khám hằng ngày.
Đây là cách chọn mẫu hay gặp trong
nghiên cứu lâm sàng.

32
Chọn mẫu không xác xuất
Chọn mẫu chỉ tiêu
Là phương pháp đảm bảo rằng một số
nhất định các đơn vị mẫu từ các loại
khác nhau của quần thể nghiên cứu với
các tính đặc trưng sẽ có mặt trong mẫu.

33
Chọn mẫu không xác xuất
Chọn mẫu mục đích
Nhà nghiên cứu đã xác định trước các
nhóm quan trọng để tiến hành thu thập
số liệu.
Các nhóm khác nhau sẽ có tỷ lệ mẫu
khác nhau.
Đây là cách hay dùng trong các điều tra
thăm dò, phỏng vấn sâu.
34
Các sai số thường gặp trong chọn mẫu

 Sự không đáp ứng


 Nghiên cứu với người tình nguyện
 Sai số do mùa
 Sai số do đường xá

35
Sự không đáp ứng
 Là hiện tượng các cá thể từ chối tham gia nghiên
cứu.
 Thường hay gặp trong thử nghiệm lâm sàng
 Cách khắc phục:
Chuẩn hoá phương pháp thu thập số liệu
Giải thích các đối tượng trước khi thu thập số liệu
Nếu vằng mặt thì người điều tra phải quay lại gặp
cho bằng được.
Nếu đối tượng không muốn hợp tác thì phải xem xét
lại đối tượng này để tìm ra các đặc điểm khác với
những đối tượng tham gia.
Có thể chọn thêm đối tượng vào mẫu để thay thế
những người không tham gia.
36
CỠ MẪU

37
Các yếu tố ảnh hưởng đến cỡ
mẫu
Loại thiết kế nghiên cứu
Phương pháp chọn mẫu
Độ lớn của tham số được nghiên cứu
Mức độ sai lệch tham số mẫu và tham
số quần thể
Khả năng thực thi

38
Cỡ mẫu cho việc ước tính tỷ lệ trong
quần thể

Cỡ mẫu Hệ số tin cậy Tỷ lệ ước đoán

p × (1 − p)
n= Z 2
1− α / 2 2
d
Mức ý nghĩa 0,05 Khoảng 0,1
thống kê 0,01 sai lệch 0,05

39
Giá trị Z
Giá trị Z thu được từ bằng cách tra
bảng Z
Với α = 0,1 ; Z = 1,645
Với α = 0,05; Z = 1,96
Với α = 0,01; Z= 2,58

40
Ví dụ
Trưởng phòng y tế huyện muốn xác định
tỷ lệ SDD của trẻ dưới 5 tuổi trong
huyện hiện tại là bao nhiêu. Giả sử rằng
bạn sử dụng kỷ thuật chọn mẫu ngẫu
nhiên, hãy tính cỡ mẫu cần thiết cho
cuộc điều tra này. Biết rằng tỷ lệ SDD
chung của quốc gia là 30%, độ tin cậy là
95%, khoảng sai lệch 5%.

41
Cách tính cỡ mẫu nghiên cứu đối
với ước tính một tỷ lệ trong QT
Cỡ mẫu Hệ số tin cậy Tỷ lệ ước đoán 0,3
1,96
323
p × (1 − p)
n= Z 2
1− α / 2 2
d
Mức ý nghĩa 0,05 Khoảng 0,05
thống kê sai lệch

42
VD: Muốn ước lượng tỷ lệ hộ gia đình có
người mắc bệnh A, dựa vào tài liệu của
một số nghiên cứu trước chúng ta biết
tỷ lệ này là 35%. Nếu chúng ta sử dụng
độ chính xác là 99% , sai số tuyệt đối là
5% thì cỡ mẫu cần thiết là bao nhiêu?
Quần thể hữu hạn
N×P
N hc =
N+P

P là kích thước của dân số đích và


Nhc là cỡ mẫu sau khi đã hiệu chỉnh
Với ví dụ trên, dân số trẻ dưới 5 tuổi
trong huyện là 1000 thì số trẻ cần cho
nghiên cứu? 44
Cỡ mẫu trong nghiên cứu đối
với giá trị trung bình

σ 2
n=Z 2
1−α / 2 2
d
n: là cỡ mẫu nghiên cứu cần có
σ: Độ lệch chuẩn quần thể

45
VD:
Nhà nghiên cứu muốn ước lượng cân
nặng trung bình của trẻ em mới sinh ra
trong cộng đồng. Có một báo cáo từ
một nghiên cứu khác ở địa bàn tương
tự cộng đồng này đã cho biết độ lệch
chuẩn là 600gr. Người nghiên cứu cần
có một mẫu trong đó độ rộng khoảng tin
cậy dao động không quá 60gr với độ tin
cậy là 99%. Vậy cỡ mẫu nghiên cứu là
bao nhiêu?
Hiệu lực thiết kế (Design Effect): D

 Sử dụng trong nhiều trường hợp chọn


mẫu: mẫu cụm, chọn mẫu nhiều giai
đoạn.
 Đễ đảm bảo tính chính xác của mẫu,
nhà nghiên cứu thường nhân cỡ mẫu
với một hệ số gọi là hiệu lực thiết kế
(ký hiệu D).
 Giá trị của D: 1,5 - 2…Thông thường
chọn D = 2. 47
Một nghiên cứu nhằm khảo sát tỷ lệ hút
thuốc lá của sinh viên nam tại trường Đại
học Tây Đô. Theo một số nghiên cứu khác
cho thấy tỷ lệ Hút thuốc lá trong Nam sinh
viên của các trường Đại học là 30%.
a) Tính cỡ mẫu cho nghiên cứu
b) Giả sử số liệu các lớp sinh viên trong
trường theo bảng, hãy sử dụng phương
pháp chọn mẫu thích hợp chọn ra học sinh
(Phương pháp chọn, cách chọn, lớp được
chọn, học sinh trong lớp được chọn....)
Lớ
p D1 D2 D3 D4 D5 D6 D7
Số
sv 270 232 278 300 250 130 120
CT CT
Lớ ĐD ĐD ĐD ĐD D D
p D8 1 2 3 4 2 3
Số
sv 67 150 105 76 54 86 67

You might also like