You are on page 1of 5

Machine Translated by Google

PEOD6

Xác định Cỡ mẫu1


Glenn D. Israel2

Có lẽ câu hỏi thường gặp nhất liên quan đến việc lấy Mức độ tin cậy
mẫu là "Tôi cần mẫu cỡ nào?" Câu trả lời cho câu hỏi này
Mức độ tin cậy hoặc rủi ro dựa trên các ý tưởng được bao
bị ảnh hưởng bởi một số yếu tố, bao gồm mục đích của
hàm trong Định lý giới hạn trung tâm. Ý tưởng quan trọng
nghiên cứu, quy mô dân số, nguy cơ chọn mẫu “xấu” và sai
encom được thông qua trong Định lý giới hạn trung tâm là
số lấy mẫu cho phép.
khi một hàm phổ biến được lấy mẫu nhiều lần, giá trị trung
Độc giả quan tâm có thể thảo luận chi tiết hơn về mục
bình của thuộc tính thu được bởi các mẫu đó bằng giá trị
đích của nghiên cứu và quy mô dân số trong Lấy mẫu Bằng
tổng thể thực. Hơn nữa, các giá trị thu được bởi các mẫu
chứng về Tác động của Chương trình Mở rộng, PEOD-5 (Israel,
này được phân phối bình thường về giá trị thực, với một số
1992). Bài báo này xem xét các tiêu chí để xác định cỡ mẫu
mẫu có giá trị cao hơn và một số có điểm thấp hơn giá trị
và trình bày một số chiến lược để xác định cỡ mẫu.
dân số thực. Trong phân phối bình thường, khoảng 95% giá
trị mẫu nằm trong khoảng hai độ lệch chuẩn của giá trị tổng
thể thực (ví dụ: giá trị trung bình).
Tiêu chí về kích thước mẫu
Ngoài mục đích của nghiên cứu và quy mô dân số, ba tiêu chí
Nói cách khác, điều này có nghĩa là nếu mức độ tin cậy 95%
thường sẽ cần được chỉ định để xác định cỡ mẫu thích hợp:
được chọn, 95 trong số 100 mẫu sẽ có giá trị phổ biến thực
mức độ chính xác, mức độ tin cậy hoặc rủi ro và mức độ thay
sự trong phạm vi độ chính xác được chỉ định trước đó (Hình
đổi của các thuộc tính được đo lường ( Miaoulis và Michener,
1). Luôn có khả năng là mẫu bạn thu được không đại diện
1976).
Mỗi người trong số này được xem xét dưới đây. cho giá trị dân số thực. Các mẫu có giá trị cực đoan như
vậy được thể hiện bằng các vùng bóng mờ trong Hình 1. Nguy
cơ này được giảm đối với các mức độ tin cậy 99% và tăng
Mức độ chính xác
lên đối với các mức độ tin cậy 90% (hoặc thấp hơn).
Mức độ chính xác, đôi khi được gọi là sai số lấy mẫu,
là phạm vi mà giá trị thực của tổng thể được ước tính.
Mức độ thay đổi
Phạm vi này thường được thể hiện bằng điểm phần trăm (ví
Tiêu chí thứ ba, mức độ thay đổi của các thuộc tính được
dụ: ± 5 phần trăm) giống như cách mà các kết quả của các
đo lường, đề cập đến sự phân bố của các thuộc tính trong
cuộc thăm dò chiến dịch chính trị được báo chí đưa tin. Do
tổng thể. Một tập hợp càng không đồng nhất, thì kích thước
đó, nếu một nhà nghiên cứu nhận thấy rằng 60% nông dân
mẫu cần thiết càng lớn để đạt được mức độ chính xác nhất
trong mẫu đã áp dụng phương pháp được khuyến nghị với tỷ
lệ chính xác ± 5%, thì người đó có thể kết luận rằng từ định. Tỷ lệ popula tion càng ít thay đổi (càng đồng nhất)
thì kích thước mẫu càng nhỏ. Lưu ý rằng tỷ lệ 50% cho thấy
55% đến 65% nông dân trong dân số đã áp dụng phương pháp này. .
mức độ thay đổi lớn hơn 20%

1. Tài liệu này là PEOD6, một trong số loạt tài liệu của Phòng Truyền thông và Giáo dục Nông nghiệp, Chương trình Khuyến nông UF / IFAS. Ngày xuất bản ban đầu
Tháng 11 năm 1992. Sửa đổi vào tháng 4 năm 2009. Đã xem xét vào tháng 6 năm 2013. Truy cập trang web của EDIS tại http://edis.ifas.ufl.edu.

2. Glenn D. Israel, phó giáo sư, Sở Giáo dục và Truyền thông Nông nghiệp, và chuyên gia Khuyến nông, Đánh giá Chương trình và
Phát triển tổ chức, Viện Khoa học Nông nghiệp và Thực phẩm (IFAS), Đại học Florida, Gainesville, FL 32611.

Viện Khoa học Nông nghiệp và Thực phẩm (IFAS) là một Tổ chức Cơ hội Bình đẳng chỉ được phép cung cấp nghiên cứu, thông tin giáo dục và các dịch vụ khác cho các cá
nhân và tổ chức hoạt động không phân biệt đối xử về chủng tộc, tín ngưỡng, màu da, tôn giáo, tuổi tác, khuyết tật , giới tính, khuynh hướng tình dục, tình trạng hôn
nhân, nguồn gốc quốc gia, quan điểm chính trị hoặc đảng phái. Bộ Nông nghiệp Hoa Kỳ, Dịch vụ Mở rộng Hợp tác, Đại học Florida, IFAS, Chương trình Mở rộng Hợp tác
Đại học Florida A&M, và Hội đồng các Ủy viên Hợp tác của Quận. Nick T. Place , trưởng khoa
Machine Translated by Google

Hình 1. Phân phối phương tiện cho các mẫu lặp lại.

hoặc 80%. Điều này là do 20% và 80% chỉ ra rằng phần lớn không hoặc (ví dụ: 200 hoặc ít hơn). Điều tra dân số loại bỏ lỗi lấy mẫu và

có tương ứng, có thuộc tính quan tâm. Vì tỷ lệ .5 biểu thị mức độ cung cấp dữ liệu về tất cả các cá thể trong quần thể. Ngoài ra, một

biến thiên tối đa trong tổng thể, nên nó thường được sử dụng để xác số chi phí như thiết kế bảng câu hỏi và phát triển khung lấy mẫu là

định cỡ mẫu thận trọng hơn, tức là cỡ mẫu có thể lớn hơn nếu độ biến “cố định”, nghĩa là chúng sẽ giống nhau đối với các mẫu 50 hoặc 200.

thiên thực của thuộc tính dân số được sử dụng. Cuối cùng, hầu như toàn bộ dân số sẽ phải được lấy mẫu trong các

quần thể nhỏ để đạt được một mức độ chính xác đáng mơ ước.

Các chiến lược xác định cỡ mẫu Sử dụng cỡ mẫu của một nghiên cứu tương tự
Một cách tiếp cận khác là sử dụng cùng cỡ mẫu với cỡ mẫu của các

nghiên cứu tương tự như nghiên cứu mà bạn lập kế hoạch. Nếu không
Có một số cách tiếp cận để xác định cỡ mẫu. Chúng bao gồm sử dụng xem xét các quy trình được áp dụng trong các nghiên cứu này, bạn có
điều tra dân số cho các nhóm dân số nhỏ, bắt chước cỡ mẫu của các thể có nguy cơ lặp lại các lỗi đã được thực hiện khi xác định cỡ mẫu
nghiên cứu tương tự, sử dụng các bảng đã xuất bản và áp dụng công cho một nghiên cứu khác. Tuy nhiên, việc xem xét tài liệu trong
thức để tính cỡ mẫu. chuyên ngành của bạn có thể cung cấp hướng dẫn về kích thước mẫu
Mỗi chiến lược được thảo luận dưới đây. "điển hình" được sử dụng.

Sử dụng Điều tra Dân số Nhỏ Sử dụng các bảng đã xuất bản
Một cách tiếp cận là sử dụng toàn bộ dân số làm mẫu.
Cách thứ ba để xác định cỡ mẫu là dựa vào các bảng đã xuất bản, bảng
Mặc dù việc cân nhắc về chi phí khiến điều này không thể thực hiện được đối với các nhóm
này cung cấp cỡ mẫu cho một tập cri teria nhất định. Bảng 1 và Bảng 2
dân số lớn, nhưng một cuộc điều tra dân số rất hấp dẫn đối với các nhóm dân số nhỏ
trình bày các cỡ mẫu sẽ là

Xác định Cỡ mẫu 2


Machine Translated by Google

cần thiết cho sự kết hợp nhất định của độ chính xác, mức độ tin Bảng 1. Cỡ mẫu cho các mức độ chính xác ± 3%, ± 5%, ± 7% và
cậy và độ biến thiên. Hãy lưu ý hai điều. Thứ nhất, các cỡ mẫu ± 10% trong đó Mức độ tin cậy là 95% và P = 0,5.

này phản ánh số lượng câu trả lời thu được và không nhất thiết Quy mô dân số Cỡ mẫu (n) cho Độ chính xác (e) của:

là số lượng cuộc khảo sát được gửi qua thư hoặc các cuộc phỏng ± 3% ± 5% ± 7% ± 10%

vấn được lên kế hoạch (con số này thường được tăng lên để bù đắp 500 một 222 145 83
cho những người không trả lời). Thứ hai, các cỡ mẫu trong Bảng 2 600 một 240 152 86
giả định rằng các thuộc tính đang được đo lường được phân phối
700 một 255 158 88
bình thường hoặc gần như vậy. Nếu giả thiết này không thể đáp ứng
800 một 267 163 89
được thì có thể cần phải khảo sát toàn bộ dân số.
900 một 277 166 90

1.000 286 169 91


Sử dụng công thức để tính cỡ mẫu
một

2.000 714 333 185 95


Mặc dù các bảng có thể cung cấp một hướng dẫn hữu ích để xác định
3.000 811 353 191 97
kích thước mẫu, bạn có thể cần phải tính toán kích thước mẫu cần
4.000 870 364 194 98
thiết cho sự kết hợp khác nhau của các mức preci sion, độ tin cậy
5.000 909 370 196 98
và độ biến thiên. Cách tiếp cận thứ tư để xác định cỡ mẫu là áp
6.000 938 375 197 98
dụng một trong một số công thức (Công thức 5 được sử dụng để tính

cỡ mẫu trong Bảng 1 và Bảng 2). 7.000 959 378 198 99

8.000 976 381 199 99

9.000 989 383 200 99


Công thức tính toán mẫu cho tỷ lệ 385 200 99
10.000 1.000

15.000 1,034 390 201 99

Đối với các quần thể lớn, Cochran (1963: 75) đã chọn Công 20.000 1,053 392 204 100

thức 1 để đưa ra một mẫu đại diện cho các tỷ lệ. 394 204 100
25.000 1,064

50.000 1.087 397 204 100

100.000 1,099 398 204 100

> 100.000 1.111 400 204 100

a = Giả định dân số bình thường là nghèo (Yamane, 1967). Toàn bộ


dân số nên được lấy mẫu.
Phương trình 1.

Giá trị này hợp lệ trong đó n0 là cỡ mẫu, Z2 là abscissa của đường Bảng 2. Cỡ mẫu cho các mức độ chính xác ± 5%, ± 7% và ± 10%
cong thông thường cắt một vùng α ở các phần đuôi (1 - α bằng mức trong đó Mức độ tin cậy là 95% và P = 0,5.

độ tin cậy mong muốn, ví dụ: 95%) 1 , e là mức mong muốn


chínhcủa
xác,
độ p Quy mô dân số Cỡ mẫu (n) cho Độ chính xác (e) của:

là tỷ lệ ước tính của một thuộc tính có trong tổng thể và q là 1- ± 5% ± 7% ± 10%

p. 100 81 67 51
Giá trị của Z được tìm thấy trong các bảng thống kê chứa diện tích
125 96 78 56
dưới đường cong thông thường.
150 110 86 61

175 122 94 64
Để minh họa, giả sử chúng tôi muốn đánh giá một chương
200 134 101 67
trình Khuyến nông toàn tiểu bang, trong đó nông dân được khuyến
225 144 107 70
khích áp dụng một phương pháp mới. Giả sử có một số lượng lớn
250 154 112 72
dân số nhưng chúng ta không biết sự thay đổi về tỷ lệ sẽ áp

dụng thực hành; do đó, giả sử p = .5 (độ biến thiên tối đa của 275 163 117 74

mẹ). Hơn nữa, giả sử chúng ta mong muốn mức độ tin cậy 95% và 300 172 121 76

độ chính xác ± 5%. Kích thước mẫu thu được được thể hiện trong 325 180 125 77

Công thức 2. 350 187 129 78

375 194 132 80

400 201 135 81

425 207 138 82

450 212 140 82


Phương trình 2.

Xác định Cỡ mẫu 3


Machine Translated by Google

Chỉnh sửa dân số hữu hạn cho các tỷ lệ Công thức cho kích thước mẫu cho trung bình

Việc sử dụng các bảng và công thức để xác định kích thước mẫu

Nếu dân số nhỏ thì kích thước mẫu có thể giảm đi một chút. trong cuộc thảo luận ở trên đã sử dụng các tỷ lệ giả định một

Điều này là do một cỡ mẫu nhất định cung cấp nhiều thông phản ứng lưỡng phân cho các thuộc tính được đo lường.

tin hơn cho một nhóm nhỏ so với một nhóm lớn. Cỡ mẫu (n0 ) Có hai phương pháp để xác định cỡ mẫu cho các biến là đa

có thể được điều chỉnh bằng cách sử dụng Công thức 3. nguyên hoặc liên tục. Một phương pháp là kết hợp các câu trả lời

thành hai loại và sau đó sử dụng cỡ mẫu dựa trên tỷ lệ (Smith,

1983). Phương pháp thứ hai là sử dụng công thức cho cỡ mẫu cho

giá trị trung bình. Công thức của cỡ mẫu cho giá trị trung bình

tương tự như công thức của tỷ lệ, ngoại trừ thước đo độ biến

thiên. Công thức cho giá trị trung bình sử dụng σ2 thay vì (pxq),

như được hiển thị trong Công thức 7.

Phương trình 3.

Trong đó n là cỡ mẫu và N là cỡ dân số.

Giả sử đánh giá của chúng tôi về việc nông dân áp dụng phương Phương trình 7.

pháp mới chỉ ảnh hưởng đến 2.000 nông dân. Cỡ mẫu bây giờ cần

thiết được thể hiện trong Công thức 4.

Trong đó n0 là kích thước mẫu, z là abscissa của đường cong


thông thường cắt một vùng σ ở các phần đuôi, e là mức chính xác

mong muốn (trong cùng một đơn vị đo với phương sai) và σ2 là

phương sai của một thuộc tính trong quần thể.

Nhược điểm của cỡ mẫu dựa trên giá trị trung bình là ước tính
Phương trình 4.
“tốt” về phương sai tổng thể là điều cần thiết. Thông thường,

một ước tính không có sẵn. Hơn nữa, kích thước mẫu có thể rất

Như bạn có thể thấy, sự điều chỉnh này (được gọi là hiệu chỉnh dân khác nhau từ thuộc tính này sang thuộc tính khác vì mỗi thuộc

số hữu hạn) về cơ bản có thể làm giảm đáng kể kích thước mẫu cần tính có thể có một phương sai khác nhau. Vì những vấn đề này,

thiết cho các quần thể nhỏ. kích thước mẫu cho tỷ lệ thường được ưu tiên2 .

Một công thức đơn giản hóa cho tỷ lệ

Yamane (1967: 886) cung cấp một công thức đơn giản hóa để Những ý kiến khác
tính kích thước mẫu. Công thức này được sử dụng để tính toán
Khi hoàn thành cuộc thảo luận về xác định cỡ mẫu này, có ba vấn
kích thước mẫu trong Bảng 2 và 3 và được hiển thị bên dưới. Mức
đề bổ sung. Đầu tiên, các cách tiếp cận trên để xác định cỡ mẫu đã
độ tin cậy 95% và P = 0,5 được giả định cho Phương trình
giả định rằng một mẫu ngẫu nhiên đơn giản là thiết kế lấy mẫu. Các
5.
thiết kế phức tạp hơn, ví dụ, các mẫu ngẫu nhiên phân tầng, phải

tính đến các phương sai của các quần thể con, các tầng hoặc các

cụm trước khi có thể đưa ra ước tính về sự thay đổi trong tổng thể.

Phương trình 5.

Một cân nhắc khác với kích thước mẫu là số lượng cần thiết
Trong đó n là cỡ mẫu, N là cỡ dân số và e là mức độ chính xác.
cho việc phân tích dữ liệu. Nếu số liệu thống kê mô tả được sử
Khi áp dụng công thức này cho mẫu trên, chúng ta nhận được Công
dụng, ví dụ, trung bình, tần số, thì gần như bất kỳ cỡ mẫu nào
thức 6.
cũng đủ. Mặt khác, một mẫu cỡ tốt, ví dụ, 200-500, là cần thiết

cho hồi quy bội, phân tích phương sai hoặc phân tích log-tuyến

tính, có thể được thực hiện để đánh giá tác động trạng thái nghiêm

ngặt hơn. Cỡ mẫu phải phù hợp với quá trình phân tích đã được lên

kế hoạch.
Phương trình 6.

Xác định Cỡ mẫu 4


Machine Translated by Google

Ngoài ra, có thể cần điều chỉnh cỡ mẫu để phù hợp với Chú thích
phân tích so sánh giữa các nhóm phụ (ví dụ như đánh giá
1. Khu vực tương ứng với các khu vực bóng mờ trong mẫu
người tham gia chương trình với những người không tham gia).
phân bố trong Hình 1.
Sudman (1976) gợi ý rằng cần tối thiểu 100 phần tử cho mỗi
nhóm chính hoặc nhóm con trong mẫu và đối với mỗi nhóm con
2.Việc sử dụng mức độ biến thiên tối đa (P = 0,5) trong tính
nhỏ, một mẫu gồm 20 đến 50 phần tử là cần thiết. Tương tự,
toán cỡ mẫu cho tỷ lệ nói chung sẽ tạo ra cỡ mẫu thận trọng
Kish (1965) nói rằng 30 đến 200 phần tử là đủ khi thuộc tính
hơn (tức là cỡ lớn hơn) so với cỡ mẫu được tính bằng cỡ mẫu
có mặt từ 20 đến 80 phần trăm thời gian (tức là, phân phối
của các
tiếp cận chuẩn mực). Mặt khác, phân bố lệch có thể dẫn đến bần tiện.

sự khác biệt nghiêm trọng so với bình thường ngay cả đối với
các mẫu có kích thước vừa phải (Kish, 1965: 17).
NGƯỜI GIỚI THIỆU
Sau đó, một mẫu lớn hơn hoặc một cuộc điều tra dân số được yêu cầu. Cochran, WG 1963. Kỹ thuật lấy mẫu, 2nd Ed., New York: John
Wiley and Sons, Inc.
Cuối cùng, công thức kích thước mẫu cung cấp số lượng
phản hồi cần thu được. Nhiều nhà nghiên cứu thường thêm Israel, Glenn D. 1992. Lấy mẫu Bằng chứng về Tác động của
10% vào cỡ mẫu để bù đắp cho những người mà nhà nghiên cứu Chương trình Khuyến nông. Đánh giá Chương trình và Phát
không thể liên lạc được. Cỡ mẫu cũng thường được tăng lên 30% triển Tổ chức, IFAS, Đại học Florida. PEOD-5.
Tháng Mười.
để bù đắp cho các nhà tài trợ không chính thức. Do đó, số
lượng các cuộc điều tra qua thư hoặc các cuộc phỏng vấn theo
kế hoạch có thể lớn hơn đáng kể so với số lượng cần thiết để Kish, Leslie. 1965. Khảo sát Lấy mẫu. New York: John Wiley

đạt được mức độ tin cậy và độ chính xác mong muốn. và Sons, Inc.

Miaoulis, George và RD Michener. 1976. Một tion giới thiệu


để lấy mẫu. Dubuque, Iowa: Công ty xuất bản Kendall / Hunt.

Smith, MF 1983. Cân nhắc lấy mẫu trong đánh giá các chương
trình khuyến nông hợp tác. Bản tin Dịch vụ Mở rộng Hợp tác
Florida PE-1. Viện Khoa học Nông nghiệp và Thực phẩm. Đại

học Florida.

Sudman, Seymour. 1976. Lấy mẫu ứng dụng. New York: Báo
chí Học thuật.

Yamane, Taro. 1967. Thống kê: Phân tích Giới thiệu, Lần xuất
bản thứ 2, New York: Harper và Row.

Xác định Cỡ mẫu 5

You might also like