Professional Documents
Culture Documents
2 - Glenn D. Israel - Determining Sample Size
2 - Glenn D. Israel - Determining Sample Size
PEOD6
Có lẽ câu hỏi thường gặp nhất liên quan đến việc lấy Mức độ tin cậy
mẫu là "Tôi cần mẫu cỡ nào?" Câu trả lời cho câu hỏi này
Mức độ tin cậy hoặc rủi ro dựa trên các ý tưởng được bao
bị ảnh hưởng bởi một số yếu tố, bao gồm mục đích của
hàm trong Định lý giới hạn trung tâm. Ý tưởng quan trọng
nghiên cứu, quy mô dân số, nguy cơ chọn mẫu “xấu” và sai
encom được thông qua trong Định lý giới hạn trung tâm là
số lấy mẫu cho phép.
khi một hàm phổ biến được lấy mẫu nhiều lần, giá trị trung
Độc giả quan tâm có thể thảo luận chi tiết hơn về mục
bình của thuộc tính thu được bởi các mẫu đó bằng giá trị
đích của nghiên cứu và quy mô dân số trong Lấy mẫu Bằng
tổng thể thực. Hơn nữa, các giá trị thu được bởi các mẫu
chứng về Tác động của Chương trình Mở rộng, PEOD-5 (Israel,
này được phân phối bình thường về giá trị thực, với một số
1992). Bài báo này xem xét các tiêu chí để xác định cỡ mẫu
mẫu có giá trị cao hơn và một số có điểm thấp hơn giá trị
và trình bày một số chiến lược để xác định cỡ mẫu.
dân số thực. Trong phân phối bình thường, khoảng 95% giá
trị mẫu nằm trong khoảng hai độ lệch chuẩn của giá trị tổng
thể thực (ví dụ: giá trị trung bình).
Tiêu chí về kích thước mẫu
Ngoài mục đích của nghiên cứu và quy mô dân số, ba tiêu chí
Nói cách khác, điều này có nghĩa là nếu mức độ tin cậy 95%
thường sẽ cần được chỉ định để xác định cỡ mẫu thích hợp:
được chọn, 95 trong số 100 mẫu sẽ có giá trị phổ biến thực
mức độ chính xác, mức độ tin cậy hoặc rủi ro và mức độ thay
sự trong phạm vi độ chính xác được chỉ định trước đó (Hình
đổi của các thuộc tính được đo lường ( Miaoulis và Michener,
1). Luôn có khả năng là mẫu bạn thu được không đại diện
1976).
Mỗi người trong số này được xem xét dưới đây. cho giá trị dân số thực. Các mẫu có giá trị cực đoan như
vậy được thể hiện bằng các vùng bóng mờ trong Hình 1. Nguy
cơ này được giảm đối với các mức độ tin cậy 99% và tăng
Mức độ chính xác
lên đối với các mức độ tin cậy 90% (hoặc thấp hơn).
Mức độ chính xác, đôi khi được gọi là sai số lấy mẫu,
là phạm vi mà giá trị thực của tổng thể được ước tính.
Mức độ thay đổi
Phạm vi này thường được thể hiện bằng điểm phần trăm (ví
Tiêu chí thứ ba, mức độ thay đổi của các thuộc tính được
dụ: ± 5 phần trăm) giống như cách mà các kết quả của các
đo lường, đề cập đến sự phân bố của các thuộc tính trong
cuộc thăm dò chiến dịch chính trị được báo chí đưa tin. Do
tổng thể. Một tập hợp càng không đồng nhất, thì kích thước
đó, nếu một nhà nghiên cứu nhận thấy rằng 60% nông dân
mẫu cần thiết càng lớn để đạt được mức độ chính xác nhất
trong mẫu đã áp dụng phương pháp được khuyến nghị với tỷ
lệ chính xác ± 5%, thì người đó có thể kết luận rằng từ định. Tỷ lệ popula tion càng ít thay đổi (càng đồng nhất)
thì kích thước mẫu càng nhỏ. Lưu ý rằng tỷ lệ 50% cho thấy
55% đến 65% nông dân trong dân số đã áp dụng phương pháp này. .
mức độ thay đổi lớn hơn 20%
1. Tài liệu này là PEOD6, một trong số loạt tài liệu của Phòng Truyền thông và Giáo dục Nông nghiệp, Chương trình Khuyến nông UF / IFAS. Ngày xuất bản ban đầu
Tháng 11 năm 1992. Sửa đổi vào tháng 4 năm 2009. Đã xem xét vào tháng 6 năm 2013. Truy cập trang web của EDIS tại http://edis.ifas.ufl.edu.
2. Glenn D. Israel, phó giáo sư, Sở Giáo dục và Truyền thông Nông nghiệp, và chuyên gia Khuyến nông, Đánh giá Chương trình và
Phát triển tổ chức, Viện Khoa học Nông nghiệp và Thực phẩm (IFAS), Đại học Florida, Gainesville, FL 32611.
Viện Khoa học Nông nghiệp và Thực phẩm (IFAS) là một Tổ chức Cơ hội Bình đẳng chỉ được phép cung cấp nghiên cứu, thông tin giáo dục và các dịch vụ khác cho các cá
nhân và tổ chức hoạt động không phân biệt đối xử về chủng tộc, tín ngưỡng, màu da, tôn giáo, tuổi tác, khuyết tật , giới tính, khuynh hướng tình dục, tình trạng hôn
nhân, nguồn gốc quốc gia, quan điểm chính trị hoặc đảng phái. Bộ Nông nghiệp Hoa Kỳ, Dịch vụ Mở rộng Hợp tác, Đại học Florida, IFAS, Chương trình Mở rộng Hợp tác
Đại học Florida A&M, và Hội đồng các Ủy viên Hợp tác của Quận. Nick T. Place , trưởng khoa
Machine Translated by Google
Hình 1. Phân phối phương tiện cho các mẫu lặp lại.
hoặc 80%. Điều này là do 20% và 80% chỉ ra rằng phần lớn không hoặc (ví dụ: 200 hoặc ít hơn). Điều tra dân số loại bỏ lỗi lấy mẫu và
có tương ứng, có thuộc tính quan tâm. Vì tỷ lệ .5 biểu thị mức độ cung cấp dữ liệu về tất cả các cá thể trong quần thể. Ngoài ra, một
biến thiên tối đa trong tổng thể, nên nó thường được sử dụng để xác số chi phí như thiết kế bảng câu hỏi và phát triển khung lấy mẫu là
định cỡ mẫu thận trọng hơn, tức là cỡ mẫu có thể lớn hơn nếu độ biến “cố định”, nghĩa là chúng sẽ giống nhau đối với các mẫu 50 hoặc 200.
thiên thực của thuộc tính dân số được sử dụng. Cuối cùng, hầu như toàn bộ dân số sẽ phải được lấy mẫu trong các
quần thể nhỏ để đạt được một mức độ chính xác đáng mơ ước.
Các chiến lược xác định cỡ mẫu Sử dụng cỡ mẫu của một nghiên cứu tương tự
Một cách tiếp cận khác là sử dụng cùng cỡ mẫu với cỡ mẫu của các
nghiên cứu tương tự như nghiên cứu mà bạn lập kế hoạch. Nếu không
Có một số cách tiếp cận để xác định cỡ mẫu. Chúng bao gồm sử dụng xem xét các quy trình được áp dụng trong các nghiên cứu này, bạn có
điều tra dân số cho các nhóm dân số nhỏ, bắt chước cỡ mẫu của các thể có nguy cơ lặp lại các lỗi đã được thực hiện khi xác định cỡ mẫu
nghiên cứu tương tự, sử dụng các bảng đã xuất bản và áp dụng công cho một nghiên cứu khác. Tuy nhiên, việc xem xét tài liệu trong
thức để tính cỡ mẫu. chuyên ngành của bạn có thể cung cấp hướng dẫn về kích thước mẫu
Mỗi chiến lược được thảo luận dưới đây. "điển hình" được sử dụng.
Sử dụng Điều tra Dân số Nhỏ Sử dụng các bảng đã xuất bản
Một cách tiếp cận là sử dụng toàn bộ dân số làm mẫu.
Cách thứ ba để xác định cỡ mẫu là dựa vào các bảng đã xuất bản, bảng
Mặc dù việc cân nhắc về chi phí khiến điều này không thể thực hiện được đối với các nhóm
này cung cấp cỡ mẫu cho một tập cri teria nhất định. Bảng 1 và Bảng 2
dân số lớn, nhưng một cuộc điều tra dân số rất hấp dẫn đối với các nhóm dân số nhỏ
trình bày các cỡ mẫu sẽ là
cần thiết cho sự kết hợp nhất định của độ chính xác, mức độ tin Bảng 1. Cỡ mẫu cho các mức độ chính xác ± 3%, ± 5%, ± 7% và
cậy và độ biến thiên. Hãy lưu ý hai điều. Thứ nhất, các cỡ mẫu ± 10% trong đó Mức độ tin cậy là 95% và P = 0,5.
này phản ánh số lượng câu trả lời thu được và không nhất thiết Quy mô dân số Cỡ mẫu (n) cho Độ chính xác (e) của:
là số lượng cuộc khảo sát được gửi qua thư hoặc các cuộc phỏng ± 3% ± 5% ± 7% ± 10%
vấn được lên kế hoạch (con số này thường được tăng lên để bù đắp 500 một 222 145 83
cho những người không trả lời). Thứ hai, các cỡ mẫu trong Bảng 2 600 một 240 152 86
giả định rằng các thuộc tính đang được đo lường được phân phối
700 một 255 158 88
bình thường hoặc gần như vậy. Nếu giả thiết này không thể đáp ứng
800 một 267 163 89
được thì có thể cần phải khảo sát toàn bộ dân số.
900 một 277 166 90
Đối với các quần thể lớn, Cochran (1963: 75) đã chọn Công 20.000 1,053 392 204 100
thức 1 để đưa ra một mẫu đại diện cho các tỷ lệ. 394 204 100
25.000 1,064
Giá trị này hợp lệ trong đó n0 là cỡ mẫu, Z2 là abscissa của đường Bảng 2. Cỡ mẫu cho các mức độ chính xác ± 5%, ± 7% và ± 10%
cong thông thường cắt một vùng α ở các phần đuôi (1 - α bằng mức trong đó Mức độ tin cậy là 95% và P = 0,5.
là tỷ lệ ước tính của một thuộc tính có trong tổng thể và q là 1- ± 5% ± 7% ± 10%
p. 100 81 67 51
Giá trị của Z được tìm thấy trong các bảng thống kê chứa diện tích
125 96 78 56
dưới đường cong thông thường.
150 110 86 61
175 122 94 64
Để minh họa, giả sử chúng tôi muốn đánh giá một chương
200 134 101 67
trình Khuyến nông toàn tiểu bang, trong đó nông dân được khuyến
225 144 107 70
khích áp dụng một phương pháp mới. Giả sử có một số lượng lớn
250 154 112 72
dân số nhưng chúng ta không biết sự thay đổi về tỷ lệ sẽ áp
dụng thực hành; do đó, giả sử p = .5 (độ biến thiên tối đa của 275 163 117 74
mẹ). Hơn nữa, giả sử chúng ta mong muốn mức độ tin cậy 95% và 300 172 121 76
độ chính xác ± 5%. Kích thước mẫu thu được được thể hiện trong 325 180 125 77
Chỉnh sửa dân số hữu hạn cho các tỷ lệ Công thức cho kích thước mẫu cho trung bình
Việc sử dụng các bảng và công thức để xác định kích thước mẫu
Nếu dân số nhỏ thì kích thước mẫu có thể giảm đi một chút. trong cuộc thảo luận ở trên đã sử dụng các tỷ lệ giả định một
Điều này là do một cỡ mẫu nhất định cung cấp nhiều thông phản ứng lưỡng phân cho các thuộc tính được đo lường.
tin hơn cho một nhóm nhỏ so với một nhóm lớn. Cỡ mẫu (n0 ) Có hai phương pháp để xác định cỡ mẫu cho các biến là đa
có thể được điều chỉnh bằng cách sử dụng Công thức 3. nguyên hoặc liên tục. Một phương pháp là kết hợp các câu trả lời
1983). Phương pháp thứ hai là sử dụng công thức cho cỡ mẫu cho
giá trị trung bình. Công thức của cỡ mẫu cho giá trị trung bình
tương tự như công thức của tỷ lệ, ngoại trừ thước đo độ biến
thiên. Công thức cho giá trị trung bình sử dụng σ2 thay vì (pxq),
Phương trình 3.
Giả sử đánh giá của chúng tôi về việc nông dân áp dụng phương Phương trình 7.
pháp mới chỉ ảnh hưởng đến 2.000 nông dân. Cỡ mẫu bây giờ cần
Nhược điểm của cỡ mẫu dựa trên giá trị trung bình là ước tính
Phương trình 4.
“tốt” về phương sai tổng thể là điều cần thiết. Thông thường,
một ước tính không có sẵn. Hơn nữa, kích thước mẫu có thể rất
Như bạn có thể thấy, sự điều chỉnh này (được gọi là hiệu chỉnh dân khác nhau từ thuộc tính này sang thuộc tính khác vì mỗi thuộc
số hữu hạn) về cơ bản có thể làm giảm đáng kể kích thước mẫu cần tính có thể có một phương sai khác nhau. Vì những vấn đề này,
thiết cho các quần thể nhỏ. kích thước mẫu cho tỷ lệ thường được ưu tiên2 .
Yamane (1967: 886) cung cấp một công thức đơn giản hóa để Những ý kiến khác
tính kích thước mẫu. Công thức này được sử dụng để tính toán
Khi hoàn thành cuộc thảo luận về xác định cỡ mẫu này, có ba vấn
kích thước mẫu trong Bảng 2 và 3 và được hiển thị bên dưới. Mức
đề bổ sung. Đầu tiên, các cách tiếp cận trên để xác định cỡ mẫu đã
độ tin cậy 95% và P = 0,5 được giả định cho Phương trình
giả định rằng một mẫu ngẫu nhiên đơn giản là thiết kế lấy mẫu. Các
5.
thiết kế phức tạp hơn, ví dụ, các mẫu ngẫu nhiên phân tầng, phải
tính đến các phương sai của các quần thể con, các tầng hoặc các
cụm trước khi có thể đưa ra ước tính về sự thay đổi trong tổng thể.
Phương trình 5.
Một cân nhắc khác với kích thước mẫu là số lượng cần thiết
Trong đó n là cỡ mẫu, N là cỡ dân số và e là mức độ chính xác.
cho việc phân tích dữ liệu. Nếu số liệu thống kê mô tả được sử
Khi áp dụng công thức này cho mẫu trên, chúng ta nhận được Công
dụng, ví dụ, trung bình, tần số, thì gần như bất kỳ cỡ mẫu nào
thức 6.
cũng đủ. Mặt khác, một mẫu cỡ tốt, ví dụ, 200-500, là cần thiết
cho hồi quy bội, phân tích phương sai hoặc phân tích log-tuyến
tính, có thể được thực hiện để đánh giá tác động trạng thái nghiêm
ngặt hơn. Cỡ mẫu phải phù hợp với quá trình phân tích đã được lên
kế hoạch.
Phương trình 6.
Ngoài ra, có thể cần điều chỉnh cỡ mẫu để phù hợp với Chú thích
phân tích so sánh giữa các nhóm phụ (ví dụ như đánh giá
1. Khu vực tương ứng với các khu vực bóng mờ trong mẫu
người tham gia chương trình với những người không tham gia).
phân bố trong Hình 1.
Sudman (1976) gợi ý rằng cần tối thiểu 100 phần tử cho mỗi
nhóm chính hoặc nhóm con trong mẫu và đối với mỗi nhóm con
2.Việc sử dụng mức độ biến thiên tối đa (P = 0,5) trong tính
nhỏ, một mẫu gồm 20 đến 50 phần tử là cần thiết. Tương tự,
toán cỡ mẫu cho tỷ lệ nói chung sẽ tạo ra cỡ mẫu thận trọng
Kish (1965) nói rằng 30 đến 200 phần tử là đủ khi thuộc tính
hơn (tức là cỡ lớn hơn) so với cỡ mẫu được tính bằng cỡ mẫu
có mặt từ 20 đến 80 phần trăm thời gian (tức là, phân phối
của các
tiếp cận chuẩn mực). Mặt khác, phân bố lệch có thể dẫn đến bần tiện.
sự khác biệt nghiêm trọng so với bình thường ngay cả đối với
các mẫu có kích thước vừa phải (Kish, 1965: 17).
NGƯỜI GIỚI THIỆU
Sau đó, một mẫu lớn hơn hoặc một cuộc điều tra dân số được yêu cầu. Cochran, WG 1963. Kỹ thuật lấy mẫu, 2nd Ed., New York: John
Wiley and Sons, Inc.
Cuối cùng, công thức kích thước mẫu cung cấp số lượng
phản hồi cần thu được. Nhiều nhà nghiên cứu thường thêm Israel, Glenn D. 1992. Lấy mẫu Bằng chứng về Tác động của
10% vào cỡ mẫu để bù đắp cho những người mà nhà nghiên cứu Chương trình Khuyến nông. Đánh giá Chương trình và Phát
không thể liên lạc được. Cỡ mẫu cũng thường được tăng lên 30% triển Tổ chức, IFAS, Đại học Florida. PEOD-5.
Tháng Mười.
để bù đắp cho các nhà tài trợ không chính thức. Do đó, số
lượng các cuộc điều tra qua thư hoặc các cuộc phỏng vấn theo
kế hoạch có thể lớn hơn đáng kể so với số lượng cần thiết để Kish, Leslie. 1965. Khảo sát Lấy mẫu. New York: John Wiley
đạt được mức độ tin cậy và độ chính xác mong muốn. và Sons, Inc.
Smith, MF 1983. Cân nhắc lấy mẫu trong đánh giá các chương
trình khuyến nông hợp tác. Bản tin Dịch vụ Mở rộng Hợp tác
Florida PE-1. Viện Khoa học Nông nghiệp và Thực phẩm. Đại
học Florida.
Sudman, Seymour. 1976. Lấy mẫu ứng dụng. New York: Báo
chí Học thuật.
Yamane, Taro. 1967. Thống kê: Phân tích Giới thiệu, Lần xuất
bản thứ 2, New York: Harper và Row.