You are on page 1of 79

oleh:

dr. Evy Luciana, MEpid


Klasifikasi Studi Epidemiologi
1. Eksperimental vs Observasional

2. Unit observasi: Individual vs Agregat

3. Pengukuran: Longitudinal vs Cross-


sectional

4. Cohort vs Case-control sampling


Desain Penelitian

Experimental Observasional

Field Trial Deskriptif Analitik

Community Trial Case Report / Study Cohort

Clinical Trial Case Series Case Control

Correlational Study Cross Sectional

Survey
Experimental Observational
 Experimental/interven  Observational studies
tion studies involve an allow nature to take
active attempt to its course
change a disease  The investigator
determinant measures but does
(exposure/behaviour/ not intervene
progress of a
disease) through
treatment
Deskriptif Analitik
• Menjelaskan • Studi mengenai
frekuensi & distribusi determinants dari
masalah kesehatan masalah kesehatan
terutama berdasarkan
faktor orang, tempat • Menggunakan
dan waktu kelompok
pembanding untuk
melihat hubungan
kausalitas (sebab-
akibat)
SIKLUS PENELITIAN
PENELITIAN DESKRIPTIF
• A descriptive study is limited to a description of the
occurrence & distribution of a disease in a population
• Often the 1st step in epidemiological investigation
• Limited descriptive information in which the
characteristics of a no. of patients with a specific disease
are described but are NOT compared with those of a
reference population  makes no attempt to analyze the
links between exposure & effect
• Identifies non-random variations in the distribution of
disease to enable an investigator to generate testable
hypotheses regarding etiology
Studi Cross-sectional
• Tujuan:
– mempelajari angka kejadian suatu
penyakit/masalah kesehatan
– mempelajari hubungan antara suatu faktor
risiko dengan angka kejadian suatu penyakit
• Unit analisa: individual
• Faktor risiko/exposure dan status
penyakit/masalah kesehatan diukur pada saat
yang sama
PENELITIAN KASUS KELOLA
• Begins with selection of cases

• Continue with selection of controls:


– Matched: frequency/group, individual
– un-matched

• Look backward in time to search for a possible cause


(exposure)

• The occurrence of a “cause” is compared between cases


and controls

• Types of Case-Control:
 Hospital-Based
 Population based
Case-Control
Mulai dari kasus/disease (OUTCOME) dulu

Exposure (+)

exposure
Cases (D+)
Exposure (-)
vs
Exposure (+)
Controls (D-)
Exposure (-)

ditelusuri ke belakang
timeline 1999 2009
PENELITIAN KOHORT
 Begin with a group of people FREE of disease but
classify them into sub-groups:
• Exposed
• Not exposed

 Follow up to see the development of new cases of


disease

 The occurrence of cases (diseases) were compared


between groups with or without exposure

 Types of Cohort:
 Prospective / Concurrent
 Retrospective / Historical / Non-concurrent
JENIS PENELITIAN KOHORT

1. CONCURENT (Prospective)
 Investigator identifies the original population at
the beginning of study
 Exposure & non-exposure are ascertained as
they occur during the study
 Outcome is ascertained in the future

2. NON CONCURENT (Retrospective/Historical)


 Population is identified on the basis of records
of previous exposures
 All the exposure and effect (disease) data have
been collected before the actual study begins
 Begin the study with pre-existing population to
reduce the duration
Cohort Prospektif
Mulai dari EXPOSURE

Disease (+)
Exposed (E)

outcome
Disease (-)
vs
Disease (+)
Non-exposed (NE)
Disease (-)

dilihat ke depan
timeline 2009 2019
Cohort Retrospektif
Tetap mulai dari EXPOSURE dulu

Disease (+)

outcome
Exposed (E)
Disease (-)
vs
Disease (+)
Non-exposed (NE)
Disease (-)

dilihat ke depan
timeline 1999 2009
Cohort Prospektif

E(+) E(-)
Cohort Retrospektif

E(+) E(-)

Case - Control

D(+) D(-)

Cross Sectional
Exposure & Outcome
Dilihat pd saat b’samaan
D(+) D(-)
E (+) E (-)

1999 2009 2019


timeline
Jenis Pilihan Info Info
Penelitian Subjek Exposure Disease
Cross- - Current Current
Sectional
Case- Disease Past Current
Control
Cohort Exposure Current Future
Prospektif
Cohort Exposure Past Current
Retrospektif
B IA S
(Error in measurement)

• Random error
• Individual biological variation
• Sampling error (chance variation)

• Systematic error
• Selection bias
• Measurement/Observation/Information
bias
Effect of Bias
• A true association may be partially masked

• A spurious association found

• Under/Over-estimation of association
Controlling Bias
1. Selection Bias:
 Minimize DO/LTFU/non-participant
 Same diagnostic criteria

2. Observation bias:
 Standardized procedures
 Objective measurement of exposures/outcomes
 Blinding / masking: single, double, triple
Blinding / Masking
• A study technique by which subject(s) /
researcher / statistical analyst does not
know :
– the group to which the subject(s) have
been allocated
– Status of exposure / outcome
– Hypothesis of the study
CONFOUNDING
Faktor lain yang juga berpengaruh pada faktor
penyebab maupun akibat yang sedang diteliti,
sehingga dapat mengacaukan hasil penelitian
Bivariat vs Multivariat
(confounding)

P’gunaan spermisida pra-konsepsi


Down Control Total >35 Down Control Total
Syndr
Yes 1 5 6
Usia 4 91 95
ibu >35
No 3 86 89
Usia 12 1163 1175
ibu <35 Total 4 91 95
Total 16 1254 1270
<35 Down Control Total
OR crude = 4,26 Yes 3 104 107

OR >35 thn = 5,73 No 9 1059 1068

Total 12 1163 1175


OR <35 thn = 3,39
Penelitian Analitik
• Ingin dibuktikan apakah ada hubungan kausalitas
(sebab – akibat)
1. Asosiasi statistik: uji statistik untuk menguji
hipotesa apakah p-value < 0,05
2. Asosiasi epidemiologi: Hill’s criteria
• Bermakna/tidaknya suatu uji statistik tergantung
jumlah sampel
• Kuat/tidaknya suatu asosiasi epidemiologik
tergantung besar/kecilnya bias (internal validity)
Both Cohort and Case-Control
studies are designed to determine
whether there is excess risk or a
reduced risk of a certain disease in
association with a certain exposure
or characteristic
How do we determine whether an
excess risk is associated?
1. By calculating the ratio of the attack rate
or incidence rate Disease risk in exposed
Disease risk in non-exposed

2. By calculating the difference in the risks


or in the incidence rates

Disease risk Disease risk


in exposed in non-exposed
CASE - CONTROL

To determine if the 2 groups differ in proportion of


being exposed to a specific factor

DISEASE compared to NO – DISEASE

Exposed Not Exposed Exposed Not Exposed

Compare prevalence of exposure in a/(a+c) with b/(b+d)


disease no disease
COHORT

To determine differences in rate at which disease develops


in relation to exposure factor

EXPOSED compared to NOT – EXPOSED

Disease No Disease Disease No Disease

Compare prevalence of disease in a/(a+b) with c/(c+d)


exposed not exposed
RELATIVE RISK
Probability of Exposed in Disease (Ie)
RR = -------------------------------------------------------
Probability of Not Exposed in Disease (I0)

a / (a+b)
RR = -------------
c / (c+d)

Ie = E(+) pada D(+)


Io = E(-) pada D(+)
ARTI RELATIVE RISK

• Mereka yang terpapar pada faktor risiko


mempunyai kemungkinan relatif untuk
menderita penyakit sekian kali lebih besar
dibandingkan mereka yang tidak terpapar
• Menunjukkan adanya hubungan sebab akibat
• Menunjukkan besaran dari hubungan
tersebut
• Penting dalam menetapkan adanya
hubungan etiologis
PEMAHAMAN RR
• Bila RR = 1 maka risiko antara yg terpapar dan tidak
terpapar untuk medapat penyakit tidak berbeda (sama)

• Bila RR > 1 maka yg terpapar mempunyai risiko yg lebih


besar untuk mendapat penyakit daripada yg tidak terpapar
– Asosiasi positif bersifat harmful
– Asosiasi kuat apabila RR>2
– Asosiasi sedang apabila RR >1,5 – 2
– Asosiasi lemah apabila RR >1 - <1,5

• Bila RR < 1 maka keterpaparan memberikan efek


perlindungan terhadap penyakit (menguntungkan)
– Asosiasi negatif bersifat protektif
Calculating RR in COHORT
First select subjects based on exposure

Then follow to see whether


Disease Disease TOTAL
develops(+) doesn’t’
develop (-)
Exposed (+) a b a+b

Non- c d c+d
Exposed (-)
TOTAL a+c b+d n
Example RR in COHORT
CHD(+) CHD (-) TOTAL

Smoking 84 2916 3000


Don’t smoke 87 4913 5000
TOTAL 171 7829 8000

• Incidence in exposed = 84/3000 = 28.0/1000


• Incidence in non-exposed = 87/5000 = 17,4/1000
• Therefore RR = 28,0/17,4 = 1,61
• Mrk yg merokok mpy risiko 1,61x > dr mrk yg tdk
100

Levels of risk
Incidence due
to exposure
50
Incidence not Background
due to exposure risk
0
Exposed Not Exposed

• In NE persons, although they aren’t exposed, they have some risk of


disease  the risk of disease is not zero
• This is called background risk

• Therefore:
Total risk of disease = Background risk + Additional risk
in E person due to exposure
ATTRIBUTABLE RISK

• AR = Ie – I0

• Ie = Insidens t’papar; I0 = Insidens tdk t’papar

b (r - 1)
• AR = ----------------
b (r – 1) + 1
b = proporsi populasi terpapar
r = resiko relatif
ARTI ATTRIBUTABLE RISK
• Memperkirakan besarnya kontribusi suatu
faktor risiko/keterpaparan dalam
menimbulkan penyakit atau mencegah
penyakit itu bila faktor risiko tersebut
dihilangkan
• Menunjukkan besarnya kontribusi suatu
faktor tertentu terhadap timbulnya penyakit
• Disebut juga Risk Difference (RD)
• Penting dalam praktek klinik maupun
kesehatan masyarakat
Pemahaman Attributable Risk

• Bila AR = 0 maka kontribusi risiko suatu


faktor tertentu terhadap timbulnya penyakit
antara yg terpapar dan tidak terpapar adalah
sama
• Bila AR > +0 maka kontribusi risiko suatu
faktor tertentu terhadap timbulnya penyakit
adalah terpapar > tidak terpapar
• Bila AR < -0 maka kontribusi risiko suatu
faktor tertentu terhadap timbulnya penyakit
adalah tidak terpapar > terpapar (disbt
Preventive Fraction)
CHD (+) CHD (-) Total

Smoking 84 2916 3000

Don’t smoke 87 4913 5000

• Incidence among smokers = 84/3000 = 28,0 per 1000


• Incidence in non-smokers = 87/5000 = 17,4 per 1000

• AR = 28,0 – 17,4 = 10,6 per 1000


 by stop smoking, 10,6 out of 28,0 incident cases of
CHD are prevented
Comparison of RR and RR
Annual Mortality Rate per 100.000
Lung Cancer CHD
Cigarette smokers 140 669
Non-smokers 10 413

 RR for Lung CA = 140/10 = 14


 RR for CHD = 669/413 = 1,6
 AR for Lung CA = 140 – 10 = 130/100.000
 AR for CHD = 669 – 413 = 256/100.000
 There is much stronger association for smoking-Lung CA
than for smoking-CHD
 But elimination of cigarettes would prevent more deaths
among smokers from CHD than from lung CA
ODDS RATIO
(= Estimated Relative Risk)

 Mrpk rasio dari 2 Odds


 Dipakai bila frekuensi penyakit jarang (< 10%)
 Kasus yang dikumpulkan mewakili semua kasus
yang ada
 Kontrol mewakili seluruh populasi umum
OR in “Unmatched” Case-Control
• OR is defined as the ratio of:
Odds that the cases were exposed
Odds that the controls were exposed

• Therefore OR = a/c = ad
b/d bc
• Bila angka kejadian penyakit kecil sehingga
“a” sangat kecil dibandingkan “b” maka dpt
dianggap (a+b)≈b mis (5+100)≈100
• Demikian pula lebih sedikit dijumpai orang yg
tidak terpapar yg menderita penyakit itu,
sehingga dapat dianggap (c+d)≈d
a a
• Maka RR ≈ OR a+b b ad
=  
c c bc
c+d d
Example where OR ≈ RR
Disease No Disease Total

Exposed 200 9800 10000

Not Exposed 100 9900 10000

• RR = (200/10000) : (100/10000) = 2

• OR = (200 x 9900) (9800 x 100) = 2,02


EXPERIMENTAL STUDY
• When the investigator controls the assignment of
subjects to the independent variables, after the
participants are identified & non-participants
eliminated

• In human populations  only to reduce risk of


disease/death
– Prophylactic trial
– Therapeutic trial
PROSEDUR PENELITIAN
EKSPERIMENTAL
RANDOMIZATION
(random allocation)
 Suatu prosedur untuk menempatkan subyek
penelitian ke dalam kelompok perlakuan atau
kelompok pembanding secara acak (random)

 To ensure the groups being compared are


equivalent  comparable at the start of an
investigation ie. any difference is due to
chance & unaffected by biases
BUKU RUJUKAN

1. Gordis L. Epidemiology, third edition.


Philadelphia: Elsevier Saunders, 2004:
115-176, 177-190.
2. Beaglehole R, Bonita R, Kjellstrom T.
Basic epidemiology, reprinted. Geneva:
WHO, 1994: 31-52.
3. Rothman KJ. Epidemiology an
introduction. New York: Oxford University
Press, 2002: 8-23, 94-129
oleh:
dr. Evy Luciana, MEpid
Biostatistik
• Unsur utama statistik  data (kumpulan
angka)

• Data harus akurat :


1. Realibilitas  kekonsistensian (presisi)
2. Validitas  ketepatan (akurasi)
Populasi

Sample

Populasi  seluruh unit yang diteliti

Sample  bagian dari populasi yang dapat mewakiliki populasi tersebut


Variable menurut SKALA
1. Nominal  antar nilai sederajat
2. Ordinal  ada gradasi / tingkatan
3. Interval  ada selisih / jarak yg terukur
4. Ratio  ada kelipatan

Skala yang lebih tinggi dapat diubah


menjadi skala yang lebih rendah
VARIABEL MENURUT SIFAT

1. Kategorik / Kualitatif / Non-parametrik:


hasil dari pengklasifikasian

2. Numerik / Kuatitatif / parametrik:


 Diskrit (bilangan bulat): hasil penghitungan
 Kontinu: hasil pengukuran
Latihan
Variable Skala Sifat
Agama
Denyut nadi
Berat Badan
Status Gizi
Jenis Kelamin
Suhu tubuh
Tingkat pendidikan
Latihan
• Kadar Hb < 8 gr/dL
• Kadar Hb 8 – 10 gr/dL
• Kadar Hb > 10 gr/dL

Termasuk skala apakah ?


Tahapan Statistik
1. Pengumpulan data :
 Data apa, cara ukur, alat ukur, siapa
2. Pengolahan data:
 Editing: memeriksa data
 Coding: diberi kode sesuai klasifikasi
 Processing: entry data ke komputer
 Cleaning: check hasil entry data
3. Analisis data  memberi makna data (peran statistik)
4. Penyajian data : tekstular, tabular, grafikal (tidak boleh
duplikasi)
Tabel
Harus ada:
• Nomor tabel
• Judul: what, who, where, when
• Isi:
– kolom & baris
– Varibel
– Jumlah
– Persentase (%)
• Narasi yg menyimpulkan
Macam-macam Grafik
1. Katagorik :
i. Bar diagram : menunjukkan jumlah
ii. Pie diagram : menunjukkan proporsi (%)
iii. Pareto : menunjukkan besar masalah

2. Numerik :
i. Histogram : data kontinu
ii. Frekuensi poligon : > 2 kelompok data
iii. Ogive : data kumulatif (cakupan)
iv. Line diagram : tren, unsur waktu, diskrit
Bar Diagram
90
80
70
60
50 East
40 West
North
30
20
10
0
1st Qtr 2nd Qtr 3rd Qtr 4th Qtr
Pie Diagram

1st Qtr
2nd Qtr
3rd Qtr
4th Qtr
Line Diagram
100
90
80
70
60 East
50 West
40 North
30
20
10
0
1st Qtr 2nd Qtr 3rd Qtr 4th Qtr
Ukuran Tengah
Ukuran ringkasan yang dapat mewakili data yang
diukur atau disurvei
• Data Katagorik : proporsi (%)
• Data Numerik :
i. Mean x (rata2) : terpengaruh nilai ekstrim
• Arithmetic (rata-rata hitung)
• Geometric (rata-rata ukur)
ii. Mode : nilai yang paling sering muncul
iii. Median : nilai tengah yang membagi data menjadi 2
bagian yang sama
Ukuran Tengah Var.Numerik
• Mean = 62,14 kg No BB (kg)
Total / n  435/7 1 65

• Mode = 65 kg 2 60
3x  65 kg 3 55
4 65
• Median = 65
5 65
Urutkan dulu:
6 70
55,55,60,65,65,65,70
7 55
Ukuran Variasi
• Untuk melihat seberapa jauh data menyebar :
homogen / heterogen
• Katagorik : proporsi (%)
• Numerik :
i. Range (rentang) : max - min
ii. Varians (S2)
iii. Standard deviasi (S)
iv. Koefisien variasi (S/x)
Pengambilan Sample
1. Non-random:
i. Convenient
ii. Consecutive
iii. Judgmental/Purposive
iv. Accidental
v. Quota

2. Random:
i. Simple Random Sampling (SRS)
 Undi / tabel / komputer (epitable)
ii. Stratified sampling
iii. Cluster Sampling
iv. Multistage
v. PPS (Probability Proportionate to Size)
POPULASI

Stratified
Sampling

S
T
Strata 1 R
A
T
I Antar strata Heterogen
Strata 2
F Dalam strata homogen
I
K
A
Strata 3 S
I
POPULASI

Cluster
Sampling

Cluster 1 Cluster 2 Cluster 3


Antar cluster Homogen
Dalam cluster heterogen

CLUSTER
Contoh pemilihan secara PPS:
Misalnya 1 Desa terdiri dari 6 RW (45 RT) dimana:
• RW 01 = 10 RT; RW 02 = 8 RT; RW 03 = 6 RT;
RW 04 = 9 RT; RW 05 = 7 RT; RW 06 = 5 RT

Jika ingin dipilih 30 RT dari 45 RT secara PPS maka


• Dari RW 01 terpilih: 10/45 x 30 cluster = 6,6 ≈ 7 RT
• Dari RW 02 terpilih: 8/45 x 30 = 5,3 ≈ 5 RT
• Dari RW 03 terpilih: 6/45 x 30 = 4 RT
• Dari RW 04 terpilih: 9/45 x 30 = 6 RT
• Dari RW 05 terpilih: 7/45 x 30 = 4,6 ≈ 5 RT
• Dari RW 06 terpilih: 5/45 x 30 = 3,3 ≈ 3 RT
Var. bebas  Var. t’gantung
1. Var. bebas:
• = Var. independent
• = Exposure untuk penelitian observasional
• = Intervensi untuk penelitian eksperimental
• Mrpk fk risiko atau sesuatu yg diduga sbg penyebab

2. Var. tergantung:
• = Var. dependent
• = Outcome
• Mrpk penyakit atau sesuatu yg diduga sbg akibat
Penelitian
Var. independent  Var. dependent
(sebab/exposure) akibat/outcome

Contoh:
Kebiasaan merokok  CA Paru

CA Paru Tdk CA Paru

Merokok a b

Tdk Merokok c d
Uji statistik utk analisis bivariat
Var. Dep Var. Dep
Katagorik Numerik

Var. Indep Chi – Square t – test /


Katagorik Anova

Var. Indep t – test / Korelasi (Pearson)


Numerik Anova / Regresi
Latihan
• Apakah ada hubungan antara tingkat kepuasan
pasien (Y/T) dengan jenis kelamin pasien ?
• Apakah ada hubungan antara kebiasaan ibu
merokok (Y/T) dengan berat bayi yang
dilahirkannya ?
• Apakah ada hubungan antara penghasilan per
bulan dengan tingkat pendidikan responden
(rendah, sedang, tinggi) ?
• Apakah ada hubungan antara frekuensi
kunjungan ANC bumil dengan kadar Hb-nya ?
Contoh Perhitungan c2
460 orang ikut percobaan efektifitas vaksin
Hepatitis B : 240 org mdp vaksin sdgkan 220 org
lainnya mdp plasebo.

20 org pd klmpk yg mdp vaksin dan 80 org pd


klmpk yg mdp plasebo kmd diket menderita
Hepatitis B.

Apakah tdp asosiasi statistik antara vaksinasi


Hepatitis B dan kejadian Hepatitis B?
Vaksinasi Skt Hep B Tdk Hep B Total
Placebo 80 (a) 140 (b) 220 (a+b)
Hepatitis B 20 (c) 220 (d) 240 (c+d)
Total 100 (a+c) 360 (b+d) 460 (N)

• H0: Tidak ada hubungan yang bermakna antara


vaksinasi Hep B dengan kejadian Hepatitis B

• df = (b-1) (k-1) = (2-1) (2-1) = 1

• Pada df = 1 dgn tingkat kemaknaan a = 0,05 maka batas


penolakan c2 = 3,841 (lihat tabel c2)

• Maka H0 ditolak jk c2 >3,841 (p-value <0,05) atau


H0 gagal ditolak jk c2 <3,841 (p-value >0,05)
Rumus perhitungan Chi-Square
(O – E) 2 N (ad – bc) 2
c2 = S c2 =
E (a+b)(c+d)(a+c)(b+d)

Dengan Koreksi Yate


{ l O – E l – 0,5 }2
c2 = S
E

N { l ad – bc l – 0,5N }2
c2 =
(a+b)(c+d)(a+c)(b+d)
Set O E (O – E)2/E

1 (a) 80 (80+20)(80+140)/460 (80 – 47,83)2 / 47,83


= 47,83 = 21,64
2 (b) 140 360 x 220 / 460 = 6,01
172,17
3 (c) 20 100 x 240 / 460 = 19,84
52,17
4 (d) 220 360 x 240 / 460 = 5,51
187,83
S 460 c2 = 53,00

Karena c2 = 53 > batas penolakan (c2 = 3,841) maka H0 ditolak


Terdapat hubungan yang bermakna (p-value < 0,0005)
antara vaksinasi Hep B dgn kejadian Hepatitis B
Macam Statistik
1. Deskriptif  menjelaskan variable yang diteliti
tanpa melakukan generalisasi ke populasi

2. Analitik / Induktif / Inferensial


 menyimpulkan secara umum.
Syaratnya :
 Sample harus representatif
 Jumlah harus cukup
 Tehnik pengambilan sample harus benar
Statistik Analitik
Uji Hipotesis :
i. Menetapkan hipotesis :
i. Ho : “TIDAK ada hub / p’bedaan yg b’makna”
ii. Ha  dalam proposal penelitian yg ditulis adalah
Ha tapi yg diuji adalah Ho
ii. Memilih uji statistik : mencari p-value
iii. Menentukan batas kemaknaan (level of
significance) : a = 0,05
iv. Keputusan : bandingkan p-value dgn a
 p-value < a : Ho ditolak
 p-value > a : Ho gagal ditolak (diterima)
Pertimbangan adanya kausalitas
1. Asosiasi statistik
Uji hipotesis (p-value)
Bermakna/tidaknya suatu uji statistik tergantung
jumlah sampel

2. Asosiasi epidemiologik
Hill’s Criteria of Causality
Kuat/tidaknya suatu asosiasi epidemiologik
tergantung besar/kecilnya bias (internal validity)

 Statistical representativeness based on sampling vs


biological representativeness based on scientific
knowledge
BUKU RUJUKAN

1. Budiarto E. Biostatistika, untuk kedokteran


dan kesehatan masyarakat. EGC, 2001.

2. Sastroasmoro S, Ismael S. Dasar-dasar


metodologi penelitian klinis. Edisi ke-3.
Jakarta: Binarupa Aksara, 2008.