You are on page 1of 67

SAMPLE SIZE

Lilik Zuhriyah, SKM, MKes


28 September 2012
Sub Topic
The importance of Sample Size
Calculation
Review of Statistical Concept
Sample Size for Observational Study
Sample Size for Randomized Clinical
Trial
Sampel Size for Experimental Study
Sampel Size for Qualitative Study
Why do we worry about Sample Size
and Power ?
Sample size too big; too much power
wastes money & resources on extra
subjects without improving statistical
results
Sampel size too small; having too little
power to detect meaningful differences
Improving your research design
Improving chances for funding
Why do we worry about Sample Size
and Power ?

Important requirement for generalization


or inferential
Representativeness of population
Statistical Analysis
Important thing for Sample Size
Research Design
Objective of study/ Analysis Method
Number of group
Technical Sampling
Measurement Scale/ Type of data
Review of Statistical Concept
Hypothesis Testing : Example
Ho : Diabetes is not associated with endometrial cancer
in postmenopausal women
Ha :
Diabetes is associated with endometrial cancer;
direction of association is not specified (two-sided
test)
Women with diabetes have an increased risk of
developing endometrial cancer (one-sided test)
Women with diabetes have a decreased risk of
developing endometrial cancer (one-sided test)
Review of Statistical Concept
Truth in the Population
Association No Association

Reject Ho A B
Correct Type I Error
Study (True positive) ()
Results (False Positive)
Fail to reject C D
Ho Type II error (ß) Correct
(False negative) (True Negative)

Comparison of Study Results and Truth


Review of Statistical Concept

P values :
Measure of a Type I error (random error)
Probability that you have obtained your
study results by chance alone, given that
your null hypothesis is true
If p=0,05, there is just 5% chance that an
observed association in your sample is
due to random error
Review of Statistical Concept
Power :
Power = 1 – ß
If ß = .20 then power = .80; we will
accept a 20% chance of missing an
association of a particular size between an
exposure and an outcome if one really
exists
Review of Statistical Concept
Power ≈ sensitivitas pada uji diagnostik
Kemampuan penelitian untuk
mendapatkan beda yg secara statistik
bermakna, bila dlm populasi perbedaan
tersebut ada
Kekuatan untuk menolak Ho pada data
penelitian, bila dalam populasi terdapat
perbedaan hasil klinis

Sastroasmoro, 2002
Review of Statistical Concept
Power = 80% berarti penelitian tersebut
mempunyai peluang sebesar 80% untuk
mendeteksi perbedaan hasil klinis (dalam
sampel penelitian) bila perbedaan tersebut
dalam populasi memang ada.
Nilai ß ditetapkan oleh peneliti
Power 80% → zß= 0,842; Power 90% →
zß=1,282
Makin besar power makin kecil ß atau makin
besar zß dan makin besar sampel
Sastroasmoro, 2002
Review of Statistical Concept
 and ß Level
Usually range from 0.01 – 0.1 () and
from 0.05 – 0.2 (ß)
Convention  = 0.05 and ß = 0.20
Use low alpha’s to avoid false positives
Use low beta’s to avoid false negatives
Increased sample size will reduce type I
and type II error
JENIS PENELITIAN

OBSERVASIONAL E
K
S
P
ESTIMASI UJI HIPOTESIS E
R
I
KOMPARASI K M
O E
R
1 POPULASI 2 POPULASI 1 POPULASI 2 POPULASI N
E
L
T
A A
K P K P K P
SI L
SIMPLE/ STRA. CLUST.
SYST. R.S. R.S. R.S.

K P K P K P

CROSS CASE CO- CROSS CASE CO-


SECT CTRL HORT SECT CTRL HORT
Besar Sampel
pada
Penelitian Observasional
SATU POPULASI
(Estimasi)

Simple random sampling atau systematic


random sampling
- data kontinyu (populasi infinit)

Z21-/2 2
n = -------------
d2
SATU POPULASI
(Estimasi)

n = besar sampel minimum


Z1-/2 = nilai distribusi normal baku
(tabel Z) pada  tertentu
2 = harga varians di populasi
d = kesalahan (absolut) yang dapat
ditolerir
SATU POPULASI
(Estimasi)
Contoh :
Suatu penelitian bertujuan untuk mengetahui rerata
kadar Hb ibu hamil trimester III. Jika dari penelitian
sebelumnya diketahui simpangan baku kadar Hb ibu
hamil trimester III sebesar 2,0 berapa besar sampel
ibu hamil yang dibutuhkan sehingga rerata kadar Hb
yang diduga bisa berada dalam interval 0,5 di atas
dan di bawah mean yang sesungguhnya dengan
tingkat kepercayaan 95% ?
SATU POPULASI
(Estimasi)

Penyelesaian :
1,962 22
n = -------------
0,52
n = 61,47 = 62 ibu hamil
SATU POPULASI
(Estimasi)
Simple random sampling atau systematic
random sampling
- data kontinyu (populasi finit)

N Z21-/2 2
n = --------------------------
(N-1) d2 + Z21-/2 2
N = besar populasi
SATU POPULASI
(Estimasi)

Jika populasi ibu hamil = 1000 orang, maka

1000 . 1,962 . 22
n = -------------------------------
(1000-1) 0,52 + 1,962 . 22
n = 57,96 = 58 ibu hamil
SATU POPULASI
(Estimasi)

Simple random sampling atau systematic


random sampling
- data proporsi (populasi infinit)

Z21-/2 P (1-P)
n = --------------------
d2
SATU POPULASI
(Estimasi)

n = besar sampel minimum


Z1-/2 = nilai distribusi normal baku
(tabel Z) pada  tertentu
P = harga proporsi di populasi
d = kesalahan (absolut) yang dapat
ditolerir
SATU POPULASI
(Estimasi)
Contoh :
Ingin diketahui proporsi penduduk miskin di
suatu kabupaten. Jika dari literatur jumlah
penduduk miskin di suatu daerah diperkirakan
20%, berapa besar sampel keluarga yang
dibutuhkan sehingga proporsi yang diduga
bisa berada dalam interval 5% di atas dan di
bawah proporsi yang sesungguhnya dengan
tingkat kepercayaan 95% ?
SATU POPULASI
(Estimasi)

Penyelesaian :

1,962 . 0,2 . 0,8


n = -------------------
0,052

n = 245,86 = 246 keluarga


SATU POPULASI
(Estimasi)

Simple random sampling atau systematic


random sampling
- data proporsi (populasi finit)
N Z21-/2 P (1-P)
n = -------------------------------
(N-1) d2 + Z21-/2 P (1-P)
N = besar populasi
SATU POPULASI
(Estimasi)

Jika jumlah keluarga di seluruh kabupaten


= 10.000 keluarga, maka

10.000 . 1,962 . 0,2 . 0,8


n = ------------------------------------------
(10.000-1) 0,052 + 1,962 . 0,2 . 0,8
n = 239,99 = 240 keluarga
SATU POPULASI
(Estimasi)
Stratified random sampling
- data kontinyu
SATU POPULASI
(Estimasi)

n = besar sampel minimum


N = besar populasi
Z1-/2 = nilai distribusi normal baku (tabel Z)
pada  tertentu
2h = harga varians di strata-h
d = kesalahan (absolut) yang dapat ditolerir
W h = fraksi dari observasi yang dialokasi pada
strata-h = N h/N
Jika digunakan alokasi setara, W = 1/L
L = jumlah seluruh strata yang ada
SATU POPULASI
(Estimasi)
Stratified random sampling
- data proporsi
SATU POPULASI
(Estimasi)

n = besar sampel minimum


N = besar populasi
Z1-/2 = nilai distribusi normal baku (tabel Z) pada 
tertentu
Ph = harga proporsi di strata-h
d = kesalahan (absolut) yang dapat ditolerir
W h = fraksi dari observasi yang dialokasi pada
strata-h = N h/N
Jika digunakan alokasi setara, W = 1/L
L = jumlah seluruh strata yang ada
SATU POPULASI
(Estimasi)
Cluster random sampling
- data kontinyu

N Z21-/2 2
n = ----------------------------------
(N-1) d2 (N/C) 2 + Z21-/2 2
SATU POPULASI
(Estimasi)
n = besar sampel (jumlah cluster)
minimum
N = besar populasi
Z1-/2= nilai distribusi normal baku (tabel
Z) pada  tertentu
2 = harga varians di populasi
d = kesalahan (absolut) yang dapat
ditolerir
C= jumlah seluruh cluster di populasi
SATU POPULASI
(Estimasi)
Cluster random sampling
- data proporsi

N Z21-/2 2
n = ----------------------------------
(N-1) d2 (N/C) 2 + Z21-/2 2
SATU POPULASI
(Estimasi)
n = besar sampel (jumlah cluster) minimum
N = besar populasi
Z1-/2 = nilai distribusi normal baku (tabel Z) pada 
tertentu
d = kesalahan (absolut) yang dapat ditolerir
C = jumlah seluruh cluster di populasi
2 = (ai – mi P)2/(C’-1) dan P = ai /mi
ai = banyaknya elemen yang masuk kriteria pada
cluster ke-i
mi = banyaknya elemen pada cluster ke-i
C’ = jumlah cluster sementara
SATU POPULASI
(Uji Hipotesis)

Data kontinyu

2 (Z1-/2 + Z1-) 2
n = ---------------------
(0- a)2
SATU POPULASI
(Uji Hipotesis)

n = besar sampel minimum


Z1-/2 = nilai distribusi normal baku (tabel Z)
pada  tertentu
Z1- = nilai distribusi normal baku (tabel Z)
pada  tertentu
2 = harga varians di populasi
0-a = perkiraan selisih nilai mean yang
diteliti dengan mean di populasi
SATU POPULASI
(Uji Hipotesis)

Data proporsi

{Z1-/2 P0 (1-P0) + Z1- Pa (1-Pa)}2


n = -------------------------------------------
(Pa- P0)2
SATU POPULASI
(Uji Hipotesis)
n = besar sampel minimum
Z1-/2 = nilai distribusi normal baku (tabel Z)
pada  tertentu
Z1- = nilai distribusi normal baku (tabel Z)
pada  tertentu
P0 = proporsi di populasi
Pa = perkiraan proporsi di populasi
Pa-P0 = perkiraan selisih proporsi yang
diteliti dengan proporsi di populasi
DUA POPULASI
(Estimasi)

Data kontinyu

Z21-/2 (22 )
n = ---------------
d2
DUA POPULASI
(Estimasi)

 Data proporsi
- Cross sectional

Z21-/2 [P1 (1-P1) + P2 (1-P2)]


n = -----------------------------------
d2
DUA POPULASI
(Estimasi)

 Data proporsi
- Cohort

Z21-/2 1-P1 1-P2


n = ------------- ------ + ------
[log (1-)]
faktor koreksi
e : 1/(1-f) P1
2
P2
DUA POPULASI
(Estimasi)

Data proporsi
- Case control

Z21-/2 1 1
n = ------------- -------------- + -------------
[loge(1-)]2 P*1 (1-P*1) P*2 (1-P*2)
DUA POPULASI
(Uji Hipotesis)

Data kontinyu

22 (Z1-/2 + Z1- )2


n = -------------------------
(1- 2)2
DUA POPULASI
(Uji Hipotesis)

 Data proporsi
- Cross sectional

{Z1 / 2 2 P(1  P)  Z1  P1 (1  P1 )  P2 (1  P2 )}2


n
( P1  P2 ) 2

P  1 / 2( P1  P2 )
DUA POPULASI
(Uji Hipotesis)
 Data proporsi
- Cohort

Z1 / 2 2 P(1  P)  Z1  P1 (1  P1 )  P2 (1  P2 )}2


n
( P1  P2 ) 2
P1 x (1  P 2 ) ORxP2
OR  P1 
P 2 x (1  P1 ) (1  P2 )  (ORxP2 )

P1
P2  P  1 / 2( P1  P2 )
OR(1  P1 )  P1

faktor koreksi : 1/(1-f)


DUA POPULASI
(Uji Hipotesis)
 Data proporsi
- Case-control
{Z 1 / 2 2 P2 (1  P2 )  Z1  P1 (1  P1 )  P2 (1  P2 )}2
n
( P1  P2 ) 2

faktor koreksi rasio kasus : kontrol


(r+1)/(2.r)
UJI KORELASI

(Z1-/2 + Z1- ) 2
n = --------------------- + 3
0,5 ln [(1+r)(1-r)]
SAMPLE SIZE FOR
RANDOMIZED CLINICAL
TRIAL
Data Proporsi
2
 z 2c (1  c )  z t (1  t )  c (1  c ) 
n 
 t  c 
n = the number of subjects for each treatment group

c,t = the proportion of patients who develop disease in


control group and treatment group

z, z = the values that include alphe in the two tails and
beta in the lower tail of the standardnormal
distribution
Data Kontinyu
2
 ( z  z ) 
n  2 
 1   2 
n = The number of subjects for each treatment group
µ = The detectable difference between the means of the
two group
 =The common standard deviation of each group
z ,z
  = the values that include alphe in the two tails and beta
in the lower tail of the standardnormal distribution
BESAR SAMPEL
PADA
PENELITIAN
EKSPERIMENTAL
Sederhana (Rancangan acak lengkap,
rancangan acak kelompok, rancangan
faktorial) :
(t-1) (r-1)  15
t = banyak perlakuan
r = jumlah replikasi
Data kontinyu

22 (Z1-/2 + Z1- )2


r  -------------------------
2
Data Proporsi
{Z1-/2 2 P (1-P) + Z1-P1 (1-P1) + P2 (1-P2)}2
r  ----------------------------------------------------------
(P1- P2)2
SAMPEL SIZE FOR
QUALITATIVE STUDY
Prinsip Pengambilan Sampel
Kesesuaian (Appropiateness)
◦ Snowball sampling dari key informan
Kecukupan (Adequacy)
◦ Jumlah sampel tidak menjadi faktor penentu
utama, yang penting adalah kelengkapan data.
◦ Adanya variasi umur, pendidikan, pendapatan,
agama, suku bangsa, dll
Sample Size & Power Software
EpiInfo
Sample Size Determination in Health
Studies
Power and Sample Size Calculation
Stata
nQuery
LATIHAN 1

a. Suatu penelitian bertujuan untuk mengetahui rerata


kadar Hb ibu hamil trimester III. Jika dari penelitian
sebelumnya diketahui simpangan baku kadar Hb ibu
hamil trimester III sebesar 2,0 , berapa besar sampel
ibu hamil yang dibutuhkan sehingga rerata kadar Hb
yang diduga berada dalam interval 0,5 di atas dan di
bawah mean yang sesungguhnya dengan tingkat
kepercayaan 95% ?

b. Jika populasi ibu hamil = 1000 orang, berapa besar


sampel yang dibutuhkan ?
LATIHAN 2

a. Ingin diketahui proporsi penduduk miskin di suatu


kabupaten. Jika dari literatur jumlah penduduk miskin
di suatu daerah diperkirakan 20%, berapa besar
sampel keluarga yang dibutuhkan sehingga proporsi
yang diduga berada dalam interval 5% di atas dan di
bawah proporsi yang sesungguhnya dengan tingkat
kepercayaan 95% ?

b. Jika populasi = 10.000 keluarga, berapa besar sampel


yang dibutuhkan ?
LATIHAN 3
Suatu survei dilakukan di 3 kota (urban, suburban dan rural)
untuk mengetahui proporsi remaja 10-12 tahun yang pernah
nonton film biru. Dari hasil penelitian sebelumnya diketahui
bahwa proporsi remaja yang pernah nonton film biru di 3
kota tersebut berturut-turut 0,4 , 0,3 dan 0,2. Jika jumlah
remaja di 3 kota tersebut berturut-turut 5000, 6000 dan 3000,
dengan interval kepercayaan 95% dan presisi 5% serta
diinginkan alokasi setara, berapa besar sampel yang
dibutuhkan di masing-masing kota ?

Berapa besar sampel di masing-masing kota jika diinginkan


alokasi proporsional ?
LATIHAN 4

Seorang dosen ingin mengetahui apakah ada


perbedaan IQ antara mahasiswa kelas reguler dengan
kelas ekstensi. Untuk menjawab masalah tersebut
dilakukan penelitian terhadap mahasiswa di suatu
perguruan tinggi. Jika rerata IQ mahasiswa kelas
reguler dan kelas ekstensi dari penelitian sebelumnya
berturut-turut 112 dan 104, dan simpangan baku IQ di
populasi adalah 10, dengan tingkat kepercayaan 95%
dan kuat uji 80%, berapakah besar sampel yang
dibutuhkan untuk penelitian tersebut ?
LATIHAN 5

Masyarakat mengeluh bahwa kadar caffein suatu minuman


suplemen merk XYZ diduga lebih tinggi dari kadar standard
yang ditetapkan (50 mg/botol). Jika sebelumnya diketahui
bahwa rerata kadar caffein minuman suplemen adalah 40
mg/botol dan simpangan baku 10 mg, dengan tingkat
kepercayaan 95% dan kuat uji 80%, berapa botol minuman
suplemen merk XYZ harus diperiksa untuk membuktikan
keluhan masyarakat tersebut ?
LATIHAN 6

Ingin diketahui apakah suatu metode pelatihan lebih


efektif dibandingkan metode pelatihan konvensional
dalam meningkatkan partisipasi masyarakat dalam
penanggulangan masalah HIV/AIDS. Jika selama ini
dengan metode konvensional partisipasi masyarakat
sebesar 30%, dan diperkirakan dengan metode yang baru
partisipasi masyarakat adalah 70%, dengan tingkat
kepercayaan 95% dan kuat uji 80%, berapa besar sampel
masing-masing kelompok perlakuan (metode pelatihan
baru dan konvensional) yang dibutuhkan untuk penelitian
tersebut ?
LATIHAN 7
Seorang teknisi ingin mengetahui apakah gangguan
kompresi pada mobil disebabkan oleh penggunaan bahan
bakar tertentu (X). Untuk itu akan diteliti sejumlah mobil
yang mengalami gangguan kompresi dibandingkan dengan
mobil yang tidak mengalami gangguan kompresi dan
ditanyakan kepada pemilik mobil jenis bahan bakar yang
digunakan. Jika dari literatur diketahui gangguan kompresi
akibat penggunaan bahan bakar tsb 50% sedangkan
akibat penggunaan bahan bakar lain 20%, dengan tingkat
kepercayaan 95% dan kuat uji 80%, berapa mobil yang
mengalami gangguan kompresi dan tidak mengalami
gangguan kompresi yang harus diteliti ?
LATIHAN 8

Diduga pencemaran bahan tertentu pada air sungai oleh


industri di sekitarnya berpengaruh terhadap terjadinya
kerusakan insang (hiperplasia atau nekrosis) pada ikan.
Untuk itu akan diteliti ikan yang ada di sungai tersebut
dibandingkan dengan ikan dari sungai lain yang tidak
tercemar dan dilihat ada tidaknya kerusakan insang. Jika
diperkirakan terjadinya kerusakan insang yang hidup di
sungai yang tercemar adalah 60%, sedangkan yang hidup
di sungai tidak tercemar 20%, dengan tingkat kepercayaan
95% dan kuat uji 80%, berapa besar sampel ikan yang
harus diambil dari masing-masing sungai ?
LATIHAN 9

Seorang peneliti ingin mengetahui pengaruh akupunktur


terhadap penurunan kadar asam urat darah. Dilakukan
penelitian terhadap hewan coba di mana sebelumnya
hewan coba dibuat sedemikian rupa sehingga memiliki
kadar asam urat darah yang tinggi. Ada 3 jenis perlakuan
yang akan diberikan (akupunktur dosis 1, akupunktur
dosis 2, dan kontrol). Jika variasi nilai asam urat darah
sebesar 1,5 mg/dl dan selisih penurunan asam urat darah
akibat akupunktur dibandingkan kelompok kontrol
diperkirakan 1 mg/dl, dengan tingkat kepercayaan 95%
dan kuat uji 80%, berapa replikasi untuk masing-masing
kelompok perlakuan ?
Referensi
Sudarti Kresno, dkk. Aplikasi Penelitian Kualitatif
dalam Pencegahan dan Pemberantasan Penyakit
Menular. FKM UI – Depkes RI
Greenberg, et al. 1996. Meddical Epidemiology.
Appleton & Lange
Murti, Bhisma. 2003. Prinsip dan Metode Riset
Epidemiologi. Gajah Mada University Press
LPPM Unair. 2005. Materi Pelatihan Tehnik
Sampling dan Penghitungan Besar Sampel
Sastroasmoro, Sudigdo. 2002. Dasar-dasar
Metodologi Penelitian Klinis. Jakarta : Sagung Seto

You might also like