You are on page 1of 283

I

Beberapa Pengertian Dasar Biostatistika


dalam
Penelitian Kesehatan

Abstrak
Ketidak tepatan penggunaan statistik dalam artikel-artikel penelitian pada umumnya
disebabkan kekurang fahaman terhadap metode statistik yang umum dipakai. Para
dokter praktisi yang merupakari pengguna hasil penelitian dan terutama dokter peneliti
atan dokter akademisi diharapkan menggunakan dan menginterpretasikan statiatik
dengan benar.
Demikian pula majalah-majalah kedokteran dan kesehatan di Indonesia diharapkan lebih
memperhatikan penggunaan statistik yang tepat pada artikel-artikel penelitian yang
dimuatnya selain tetap memperhatikan validitas desain serta substansi keilmuannya.
Untuk hal tersebut diatas perlu secara bertahap dipahami hal hal yang mendasar secara
agak mendalam yang sering digunakan didalam penelitian antara lain
1. Standard deviasi,
2. Standard error,
3. Nilai p
4. Confidence interval.

1. Pendahuluan
Peningkatan penggunaan metode statistik dalam penelitian kedokteran tidak seiring
dengan ketepatan penggunaannya. Beberapa survei yang pernah di lakukan
terhadap artikel-artikel penelitian di beberapa majalah kedokteran terkenal,
menunjukan masih adanya penggunaan statistik yang tidak tepat, walaupun corak

metode analisis statistik yang digunakan berubah menjadi semakin lebih
kompleks. Diperkirakan ada 27% artikel yang dimuat menggunakan analisis re-
gresi logistik don analisis regresi Cox pads tahun 1990 dibandingkan 1% pada
sepuluh tahun sebelumnya.

Salah satu kemungkinan penyebab ketidak-tepatan penggunaan statistik adalah
ketidak-tahuan para peneliti kedokteran maupun pengguna hasil penelitian pade
metode statistik.
Pada survei yang dilakukan penulis pada 28 peserta program Doktor bidang
kesehatan Universitas Indonesia 1992, yang aedang mengikuti kursus singkat analisis
statistik multivariat, menunjukan hanya 42.9% yang menyatakan mengerti istilah-
istilah atatistik seperti standard deviasi, standard error, nilai p, dan confidence
interval. Pernyataan tersebut ditunjang dengan masih rendahnya persentase yang
memberikan jawaban benar terhadap pertanyaan pertanyaan yang berkaitan dengan
istilah-istilah atatistik tersebut, yaitu hanya berkisar. antara 10.7% sampai 57.1% yang
menjawab benar.
Survei yang lama juga dilakukan pada para peserta kursus Epidemiologi Klinik FK
Unpad bulan Februari 1992, menunjukan bahwa peserta yang mengerti tentang
istilah-istilah statistik tersebut berkisar antara 14.3% sampai 39.3%. Hasil tersebut
cukup memprihatinkan karena survei tersebut dilakukan pada akhir minggu pertama
kursus, artinya selama 5 hart mereka telah memperoleh pengetahuan dasar
atatistik dan mahir menggunakan kalkulator untuk menghitungnya.
Survei lain yang dilakukan pads para dokter di Denmark pada tahun 1987 (59% dart
250 dokter) dengan menggunakan kuesioner yang sejenis menunjukan hasil bahwa
aebagian besar hanya menjawab benar sekitar 2 sampai 4 item pertanyaan dart 9
item pertanyaan.
Sedangkan pada sampel lain menunjukan hasil yang lebih baik yaitu pada peserta
kursus metode Riset dan Biostatistik di Denmark menujukkan nilai median 4 yang

menjawab benar dart 9 item pertanyaan.
2
,
Pengertian Statistik

Dalam mempelajari aplikasi statistik dalam dunia kedokteran, maka beberapa
konsep kunci yang perlu difahami ialah tentang:

1. Variabilitas, yaitu adanya variasi pendapat (experts variation) dan variasi
atau fluktuasi yang bersifat random.
2. Komparabilitas, yaitu apakah dua kelompok tersebut memang sebanding?.
Dalam penelitian eksperimental klinik dikenal proses randomisasi dalam
mencapai dua kelompok yang sebanding.
3. Generalisasi, yaitu sejauh mana temuan yang diperoleh dapat disimpulkan
pada populasi yang lebih luas. Dalam penelitian klinik kedokteran sangat
ditentukan kriteria eksklusi dan kriteria inklusi.
Langkah awal yang balk untuk mengaplikasikan statistik dengan tepat ialah
mcngenal dan mcnghayati konsep variabilitas. Pencliti ketika mcnyusun proposal
sudah mcmulai merumuskan variabel yang akan diukurnya, diamatinya. Peneliti
menyadari bahwa fcnornena yang ingin dipelajari akan bervariasi dari satu unit
pengamatan ke unit pengamatan yang lain, disebut sebagai variabel.
Peneliti melakukan pengamatan atau pengukuran fenomena yang sifatnya bervariasi
atau mempunyai sifat variabilitas. Variabilitas dapat terjadi sejak pengukuran, yang
dikenal dengan intra observer variation dan inter observer variation. Bagaimana
peneliti mengatasi masalah variabilitas tersebut yang mungkin dapat mengancam
validitas internal hasil penelitiannya?.
Pada umumnya konsep variabiltas dalam dunia penelitian kedokteran, dibagi dalam:
1. Variasi akibat beda jenis pengobatan atau perlakuan.
2. Variasi karena bias.
3. Variasi stokastik atau random.
Kepentingan penggunaan statistik antara lain adalah untuk mengetahui sejauh mana
variasi temuan yang terjadi disebabkan bias, atau karena variasi yang random, atau

memang disebabkan oleh beda perlakuan, adanya beda karakteristik kelompok. Untuk
memahami statistik dengan baik atau memahami hasil penelitian dengan baik maka
konsep variasi atau variabilitas harus mendasari mendasari pemikiran penelitian yang
dilakukan.
Berikut akan dibahas beberapa pengertian statistik yang dasar dan umum ditemukan
pada artikel-artikel penelitian yang dimuat dalam majalah-majalah kedokteran.
Pendekatan yang dilakukan ialah melalui pembahasan kasus-kasus yang terjadi pads
aplikasi statistik tersebut.


3. Pengertian Standard Deviasi
Setelah data penelitian diperoleh, maka akan dilakukan proses reduksi data atau
peringkasan untuk menghasilkan informasi, seperti nilai-nilai tengah, dikenal
dengan mean, median atau modus. Selain itu dilihat juga ingin diketahui pola
sebarannya, dapat menggunakan interquantile range, standard deviasi, atau varians.
Bagaimana varians data penelitian tersebut ? Atau bagaimana variasi nilai-nilai
individual dibandingkan dengan nilai mean (varians)?
(xi - x)
2
Suatu varian didefinisikan sebagai: varians = --------------

( n-1 )

Sedangkan standard deviasi merupakan akar varians: SD = \ varians

Kasus 1
Pada suatu artikel penelitian klinik, dilaporkan bahwa karakteristik pasien: umur 26
5 tahun (mean standard deviasi). Apa artinya?
Bahasan
Peneliti menggunakan standard deviasi (SD) untuk mendeskripsikan variasi observasi
mereka.
Interval : Rerata 1 SD mencakup sekitar 68% nilai-nilai observasi individual.
Interval : Rerata 2 SD mencakup sekitar 95% nilai-nilai observasi individual.
Interval : Rerata 3 SD mencakup sekitar 99% nilai-nilai observasi individual.

Standard deviasi sangat berkaitan dengan distribusi simetris atau normal, karena itu
harus diinterpretasi dengan hati-hati. Peneliti menginterpretasikan SD dengan asumsi
adanya distribusi yang simetris. Pada kenyataannya data biologik jarang
terdistribusi secara simetris, sehingga seringkali interpretasi SD tidak tepat. Bila ingin
tetap dipakai maka peneliti harus membuktikan terlebih dulu bahwa data yang
dianalisanya adalah normal dengan memakai uji normalitas.
Seringkali peneliti melaporkan variasi data mereka dengan mean 1SD atau mean
2SD walaupun dasar distribusinya bersifat Non Gaussian; misalnya distribusinya
menceng atau skewness, atau distribusi bimodal, terutama pada data yang tersensor.
Dalam keadaan seperti itu interpretasi interval tidak berlaku sebagaimana mestinya
dan pembaca atau pengguna hasil penelitian seringkali tidak menyadari adanya
kesimpulan yang secara serius menyimpang.
Kasus 2
Suatu penelitian eksperimental klinik pengobatan diare akut pada bayi yang
dirawat di suatu rumah sakit dengan membandingkan pemberian secara lebih
dini makanan yang terbuat dart kedelai yang bebas laktosa pada pasien bayi.
Dilaporkan bahwa umur mereka adalah 5.4 3.4 bulan dan jumlah hari diare
sebelum masuk ke rumah sakit adalah 2.5 1.5 (mean SD). (Pediatrics
1985;76:292) Apa interpretasi saudara?
Bahasan

Kisaran nilai umur yang disebut dalam artikel tcrsebut dapat diartikan adanya diare
pada bayi yang belum lahir. Interval umur pada 95 % mengimplikasikan bahwa ada
pengamatan di bawah nilai 0. Kita akan bertambah terkejut dengan laporan dalam
artikel tersebut bahwa lama diare pads bayi laki-laki adalah 87 59 jam dan total
keluaran cairan diare selama sakit adalah 299 319 ml/kg. Terlihat bahwa dalam
95% variasl terdapat nilai-nilai yang negatif.
Kesalahan interpretasi tersebut disebabkan distribusi data tidak simetris, karena
adanya nilai-nilai yang ekstrim rendah atau tinggi. Median adalah salah satu pilihan

jenis statistiknya.
.Kasus 3
Penelitian berikut mempelajari efek pengurangan nyeri pada anak yang menjalani
sirkumsisi. Distribusi pads kelompok placebo (12 orang) 2.5 1.4 tahun (mean
SD) (Anaesthesiology 1985;62:519)
Bahasan I
Adakah sirkumsisi yang dilakukan pada janin intrauterin ? Karena bila melihat
hasil analisis untuk confidence interval 95 % terdapat bayi yang belum dilahirkan
ikut teranalisis.
Kasus 4
Pengukuran sperma yang dilakukan pada tahun 1975-1978 pada 10 lelaki yang
dilahirkan antara 1940-1945 adalah 66.0 78.5 (mean SD). (Andrologia
1984;16:175)
Suatu penggunaan metode kontrasepsi yang sangat efektif, karena dijumpai adanya
jumlah sperma yang negatif bukan saja nol.

4. Standard Error dan Confidence Interval
Masih sering terjadi kerancuan antara standard error dan Standard dcviasi. Padahal
keduanya memiliki konsep yang sangat berbeda. Standard dcviasi digunakan untuk
menggambarkan variasi individual sekitar mean. Standard error digunakan untuk
menggambarkan variasi berbagai kemungkinan mean eampel dengan mean yang
sesungguhnya atau mean populasi yang tak diketahui. Pengetian mean tidak terbatas
pada mean, melainkan juga estimasi titik lainnya seperti proporsi, koefisien regresi,
rasio risiko dan sebagainya. Ekspresi standard error merupakan ekspresi teoritis
tentang variasi random mean sampel bila pengambilan sampel dilakukan berulangkali
sampai semua kemungkinan sampel yang ada . SE adalah SD suatu distribusi
mean sampel yang diperoleh pada repeated sampel suatu populasi.
Peneliti menggunakan standard error (SE) untuk mengkuantifikasi variasi suatu
distribusi, misalnya distribusi mean sampel.

Interval Rerata 1 SE mencakup sekitar 68% mean sampel, atau 68% Confidence
Interval mean sampel.
Interval Rerata 2 S
E
mencakup sekitar 95% mean sampel, atau 95% Confidence
Interval mean sampel.
Peran S
D
dan S
E
jelas berbeda, keterkaitan yang mereka miliki terlihat pada rumus
matematik yaitu SE _ S.
Suatu survei yang dilakukan pada dua majalah Anestesi terbitan Amerika yang
dipublikasikan pada tahun 1981 dan 1983 ternyata ada 157 dart 243 artikel yang
menggunakan SE untuk menjelaskan deskripsi data mereka. Penggunaan SE yang
tidak tepat tersebut karena kebanyakan peneliti melihat nilai SE yang selalu lebih
kecil dibandingkan SD maka digunakan untuk mendeskripsikan data agar terkesan
sebarannya lebih minimal.

Kasus 5

Penelitian tentang obat pada 216 relawan menginformasikan bahwa kadar plasma
darah setelah 1 jam pemberian obat 10 mg per oral adalah 188 10 mg/ml (mean
S
E
). Apa interpretasi saudara?
Interpretasi yang tepat ialah:
Diperkirakan bahwa 95% nilai mean yang sesungguhnya (mean populasi) terletak
antara 168 sampai 208 ng/ml.
Standard error (S
E
) mempunyai arti yang berbeda dengan standard deviasi.
Pendugaan interval digunakan S
E
bukan SD; rerata 2S
E
, adalah 95% confidence
interval untuk mean (95 dari 100 kasus, mean populasi terletak dalam interval
tersebut).
Standard error juga sangat berkaitan dengan distribusi normal, karena itu harus
diinterpretasikan dengan hati-hati. Interpretasi S
E
berasumsikan suatu distribusi
Gauss, bukan suatu observasi individual, melainkan mean teoritis yang berdasarkan
pengamatan sampel yang berulang. Asumsi tersebut akan dipenuhi bila jumlah sampel cukup besar.
Jadi tidak tepat kalau mencantumkan pada sampel yang sangat kecil.

Nilai P

Kalau peneliti ingin membandingkan efek suatu pengobatan baru dibandingkan
pengobatan baku melalui desain penelitian eksperimental klinik terandomisasi dengan
kontrol dan double blind, maka peneliti akan melakukan uji hipotesa atau uji statistik
untuk mengetahui sejauh mana variasi yang terjadi pada kedua kelompk tersebut
memang berbeda.
Hasil uji statistik akan menghasilkan suatu nilai p. Berdasarkan nilai p tersebut
kemudian di tarik kesimpulan apakah peneliti akan menolak atau menerima hipotesis
nol
Hipotesis nol adalah suatu hipotesis teroritis yang menyatakan tidak ada efek pada
suatu respon atau outcome tertentu. Pada umumnya hipotesis statistik berbeda
dengan hipotesis penelitian dan tidak perlu dicantumkan dalam protokol penelitian.
Pengujian hipotesis nol merupakan dasar untuk melakukan Uji-statistik terhadap
perbedaan yang terobservasi. Dengan asumsi hipotesis nol benar kemudian peneliti
memilih jenis metode statistik yang tepat (Chi-square test,Uji t,Uji F dll) dan akan
diperoleh nilai p.
Nilai p ada1ah suatu probabilitas atau peluang perolehan suatu hasil atau lebih
ekstrim dibandingkan dengan yang diobservasi jika perbedaan atau disimilaritas
disebabkan oleh variasi respon semata.
Pengertian nilai p juga ditentukan oleh pengukuran, dan arah.
Pengukuran. Perhitungan nilai p ditentukan bagaimana kita mengukur fenomena
yang kita pelajari apakah pengukuran fenomena secara menghitung atau mengukur
(kontinyu atau kategorikal), bersifat independen atau tidak.
Arah. Apakah kita akan melakukan pengujian satu sisi atau dua sisi? Arah ini
ditentukan bagaimana perumusan hipotesis alternatif atau hipotesis penelitian.
Jika nilai p lebih kecil dibandingkan suatu nilai tertentu (secara konvensi ditetapkan
sebesar 0.05), maka ada cukup alasan untuk menolak hipotesia nol. Bila gagal
menolak hipotesis nol berarti variasi random bukan menjadi penyebab adanya

perbedaan yang teramati. Nilai 0.05 disebut sebagai ambang atau kesalahan tipe
I yaitu kesalahan dalam menolak hipotesia nol. Semakin kecil nilai p, maka akan
semakin kecil kemungkinan kesalahan tipe I. Perlu diperhatikan bahwa < 0.05
mungkin berarti p = 0.04 atau p = 0.000002, keduanya mempunyai ,pengertian yang
berbeda.

Kasus 6
Penelitian eksperimental klinik dengan menggunakan kontrol untuk mempelajari suatu
pengobatan baru menyimpulkan bahwa pengobatan tersebut lebih baik dibandingkan
dengan placebo: p < 0.05. Apa arti nilai p tersebut?
Bahasan
Interpretasi yang tepat adalah jika pengobatan tersebut tidak efektif (hipotesis nol
benar), maka hanya kurang dari 5 persen kemungkinau memperoleh hasil tersebut.
Interpretasi penelitian eksperimental klinik tersebut akan tepat bila pembaca mengerti
tentang arti nilai p. Nilai p < 0.05 dapat diartikan sebagai berikut: Jika pada
kenyataan nya tidak ada beda efek antara obat dan placebo, maka besar peluang
temuan tersebut, adalah kurang dari 5 persen.
Dokter praktisi atau pengguna hasil penelitian harus menyadari bahwa nilai p yang
rendah bukan dasar untuk memilih obat tersebut. Juga bukan untuk
menyimpulkan atau memutuskan bahwa obat tersebut memang lebih baik: sehingga
mulai menggantikan obat yang lama. Bukti lain, seperti besar efek, pengetahuan
fisiologik, efek samping, harga obat dan temuan-temuan penelitian lain harus
dipertimbangkan pula.
Banyak peneliti mengartikan secara keliru bahwa nilai p < 0.05 sebagai peluang
bahwa efek pengobatan tersebut sama (hipotesis nol benar) adalah sebesar kurang
dari 5 persen.
Kasus -7
Ada kelompok peneliti yang mempelajari apakah pemberian suatu obat dapat

menurunkan kadar magnesium plasma. Ada dua puluh tiga relawan yang menelan
obat tersebut, ternyata didapat penurunan magnesium yang tidak cukup berarti
(p > 0.05). Apa artinya?
Bahasan
Ada lebih dari 5% kemungkinan memperoleh hasil tersebut jika obat tidak
menurunkan kadar magnesium plasma. Hal yang sama dengan p > 0.05 berarti bahwa
jika dua pengobatan mempunyai efek yang sama, maka peluang perolehan adanya
suatu perbedaan atau pcrbedaan yang lebih besar dibandingkan perbedaan yang
terobservasi karena variasi random semata adalah lebih dari 5 persen.

Dengan menganggap tidak ada pengaruh faktor lain, pembaca yang kritis akan
menginterpretasikan temuan p > 0.05 sebagai pertanyaan akan kekuatan uji statistik
pada besar sampel tersebut, atau kemungkinan kesalahan tipe II.
Kasus 8
Ada sejenis obat baru yang dinilai secara independen pada dua penelitian
eksperimental klinik dengan randomisasi dan kontrol. Kedua. penelitian ekeperimental
klinik tersebut dianggap sebanding (comparable) den melibatkan jumlah pasien yang
sarna. Penelitian eksperimental klinik pertama menyimpulkan bahwa obat tersebut
efektif (p < 0.05), sedangkan
.
yang kedua menyimpulkan bahwa obat tersebut tidak
efektif (p > 0.05).
Nilai p yang sesungguhnya adalah 0.041 dan 0.097. Ape. interpretasi saudara?
Bahasan
Sebaiknya kita tidak boleh percaya terhadap pentingnya perbedaan antara kedua
nilai p yang kecil. Variasi atau perbedaan yang terjadi dapat disebabkan oleh
variasi random (due to chance). Pada kedua penelitian eksperimental klinik yang
sebanding mungkin memberikan temuan yang tak banyak berbeda, terlihat adanya
perbedaan nilai p tidak begitu besar.


6 , Confidence Interval atau Nilai P
Walaupun nilai p mengindikasikan adanya perbedaan, tetapi hal ini tidak mengukur
besar efek atau perbedaan yang penting. Dua ukuran statistik yang mengukur
suatu estimasi besar perbedaan efek pada populaai ialah estimasi titik (misal mean)
dan confidence interval. Maka dianjurkan agar melaporkan hasil temuan dengan
menggunakan kedua ukuran tersebut selain nilai p.
Sebelum tahun 1980 jarang ditemukan artikel penelitian di majalah-majalah
kedokteran yang menggunakan confidence interval. Ada semacam perubahan yang
cukup radikal dalam penggunaan confidence interval. Dilaporkan ada 42% dari 80
artikel penelitian ekeperimental klinik menggunakan CI
Seringkali ada pertanyaan apakah nilai p atau CI ataukah keduanya penting
dicantumkan dalam melaporkan hasil penelitian. Untuk membahas secara jelas
berikut ringkasan 4 hasil penelitian:
Table 1: Rangkuman Hasil 4 Penelitian Eksperimental Klinik
NO OBAT A OBAT B NILAI P BEDA RESPONS 95% CI
1 480/ 800=60 % 416 /800 = 52 % 0.001 8 % 3-13 %
2 15/ 25=60 % 13 /25 = 52 % 0.57 8 % -19 -35 %
3 15/ 25=60 % 9 /25=36 % 0.09 24 % -3 0 -51 %
4 240/400=60 % 144 /400=36% < 0.001 24 % 17 0-31 %

Penelitian eksperimental klinik dengan membandingkan antara obat A dan obat B pada
suatu penyakit.

1. Penelitian 1. Hasil penelitian multi-senter menunjukan bahwa ada 60%
yang respon terhadap pengobatan A (obat baru) dan ada 52% yang re-
spon terhadap pengobatan B (obat standar). Hasil uji statistik dilaporkan
nilai p=0.001, peluang perolehan karena variasi random. Besar perbedaan
efek obat A dibandingkan obat B sebesar 8% dan estimasi interval 95%
ialah 3% dan 31%. Pertanyaan yang perlu diajukan adakah perbedaan 8%
tersebut juga memberikan kemaknaan secara klinik. Kalau kita berasumsi
kemaknaan klinik bila memberikan efek sebesar 15%, maka pada peneli-
tian ini dianggap secara klinik obat A kurang bermakna dibandingkan
obat B, walaupun secara statistik sering disebut sebagai bermakna.

2. Penelitian 2,. Pada penelitian selanjutnya dengan menggunakan sampel
yang lebih kecil (1/32 sampel penelitian pertama) didapatkan hasil yang
lama: 60% responsif terhadap obat A dan 52% responsif terhadap obat B.

Hasil uji statistik menghasilkan nilai p=0.57. Hasil estimasi beda efek adalah
8% dan 95% CI adalah -19% dan 35%.

3. Penelitian 3. Pada penelitian lain menunjukan hasil 15/25 (60%) responsif
terhadap obat A dan 13/25 (36%) responsif terhadap obat B. Hasil uji
statistik menunjukan nilai p=0.09. Estimasi besar efek adalah sebesar 24%
dan 95% CI -3% dan 51%. Terlihat bahwa secara klinik besar perbedaan
efek 24% dapat dikatakan bermakna. Mendasari bahwa estimasi interval
juga mencakup besar efek yang dianggap bermakna (lebih 15%) dan tidak
bermakna secara klinik (lebih kecil dari 15%)

dan mencakup nilai hipotesis
nul yaitu 0%, maka tidak dipcroleh kesimpulan yang konklusif.

4. Penelitian 4. Pada penelitian multi-senter lain diperolch hasil 240/400 (60%)
responsif terhadap obat A dan 144/400 (36%) responsif terhadap obat B.
Besar efeknya adalah 24% dan 95% CI adalah 17%-31%. Hasil uji statistik
diperoleh nilai p < 0.0001.
Walaupun sebenarnya nilai p, estimasi titik dan confidence interval mern-
berikan pengcrtian yang bcrbcda, kita tetap dapat rncnggeneralisasikan hasil
pengamatan sampel ke suatu populasi. Diharapkan estimasi titik seperti besar
efek dapat merupakan informasi data sampel yang cukup penting. Tetapi bila
asumsi-asumsi statistik yang penting seperti besar sampel pengamatan dan
upaya randomiaasi tidak terpenuhi maka penggunaan statistik inferensial
seperti nilai p dan confidence interval sekalipun perlu diinterpretasi secara
berhati-hati. Walaupun confidence interval dapat memberikan informasi
secara tidak langsung untuk menilai kemaknaan secara statistik tetapi perlu
diperhatikan bahwa ini bukanlah pengganti uji statistik dan bukan uji statistik,
sehingga jangan melaporkan Confidence interval seperti pelaporan uji
statistik. Confidence interval memberikan informasi tentang variasi estimasi
atau uncertainty suatu estimasi. Pelaporan nilai p yang sesungguhnya bukan
sekadar p < 0.05 atau p > 0.05 saja`akan tetapi disertai laporan yang lebih
informatif. Walaupun penggunaan confidence interval sudah mulai
membudaya, tetapi ketidaktepatan penggunaanya juga mulai meningkat.

Survei pada tahun 1990 melaporkan masih ada yang menggunakan CI yang tidak
tepat, antara lain:
Confidence interval yang tak mencakup nilai estimasi titik
Confidence interval untuk proporsi suatu kelompok dengan nilai bawah negatif.
Kalau CI untuk beda efek antara dua proporsi dimungkinkan dengan interpretasi
yang berbeda.
Confidence interval satu sisi.

Sementara itu obsesi untuk hanya mengandalkan nilai p < 0.05 sebagai pilihan analisis
statistik diperkirakan akan tetap ada dalam bentuk yang berbeda, antara lain:
Melaporkan hasil-hasil yang signifikan, bukannya temuan-temuan penting (terutama
dalam abstrak).



Penggunaan uji statistik pads situasi yang tidak tepat, misalnya membandingkan dua
metode pengukuran atau dua observer)
Menyimpulkan secara otomatis bahwa statistik signifikan sama saja dengan
signifikan secara klinis.
Merancang suatu penelitian dengan tujuan agar tercapai signifikan statistik atau agar
tak tercapai signifikan statistik ,

7 . Penutup

Pembahasan makalah ini diharapkan membuka wawasan kita terhadap pengertian
statistik yang umum digunakan dalam penelitian kedokteran.
Ketidaktepatan penggunaan statistik berpangkal pada pengertian yang terbatas atau
bahkan keliru terhadap metode tersebut.
Kalau ada pakar statistik yang menyimpulkan bahwa Bad Statistics is Bad Ethics,
maka perlu ada perubahan sikap pada dokter praktisi maupun dokter peneliti di
Indonesia agar dapat menggunakan dan menyimpulkan statistik secara benar. Hal ini
diperlukan terutama karena sikap kritis diperlukan dalam membaca hasil-hasil
penelitian walaupun laporan atau artikel penelitian tersebut dimuat pada majalah-
majalah kedokteran terkenal.
Siapkah kita berubah?















II
BAB I
PENELITIAN DAN STATISTIK

A. Pengertian Penelitian
Penelitian merupakan cara ilmiah untuk mendapatkan data dengan tujuan dan kegunaan tertentu.
Berdasarkan pengertian tersebut terdapat empat hal yang perlu difahami lebih lanjut yaitu: cara
ilmiah, data, tujuan dan kegunaan.
Penelitian merupakan cara ilmiah, berarti penelitian itu didasarkan pada ciri-ciri keilmuan
yaitu, rasional, empiris dan sistematis. Rasional artinya kegiatan penelitian itu dilakukan dengan
cara-cara yang masuk akal sehingga terjangkau oleh penalaran manusia. Empiris artinya cara-cara
yang digunakan dalam penelitian itu teramati oleh indera manusia, sehingga orang lain dapat
mengamati dan mengetahui cara-cara yang akan digunakan. (Bedakan cara yang tidak ilmiah, misalnya
mencari data hilangnya pesawat terbang melalui paranormal, rnemprediksi data nomor undian dengan
bersemedi di tempat-tempat yang dianggap keramat, dsb). Sistematis artinya, proses yang digunakan
dalam penelitian itu menggunakan langkah-langkah tertentu yang bersifat logis, (lihat proses
penelitian).
Data yang diperoleh melalui penelitian itu mempunyai kriteria tertentu, yaitu harus valid,

reliabel dan obyektif. Valid menunjukkan derajat ketepatan, yaitu ketepatan antara data yang
sesungguhnya terjadi pada obyek dengan data yang dapat dilaporkan oleh peneliti. Misalnya data
orang miskin di suatu desa jumlahnya 100, maka peneliti juga harus melaporkan 100, maka peneliti
harus melaporkan 100. Bila yang dilaporkan peneliti jauh di atas atau di bawah 100, maka datanya
tidak valid. Reliabel menunjukkan derajat konsistensi (keajegan) yaitu konsistensi data dalam
interval waktu tertentu. Misalnya data yang terkumpul dari sumber data kemarin jumlah orang miskin
100, maka sekarang atau besok sumber data akan tetap menyatakan 100. Obyektif (lawannya
subyektif) menunjukkan derajat persamaan persepsi antar orang (interpersonal agreement). Jadi
kalau seseorang mendata jumlah orang miskin 100, maka orang lainpun akan menyatakan jumlah
orang miskin juga 100. Secara umum tujuan penelitian itu meliputi tiga macam yaitu yang bersifat
penemuan, pembuktian dan pengembangan suatu pengetahuan. Penemuan berarti data yang
diperoleh dari penelitian itu betul-betul data yang baru yang sebelumnya belum pernah diketahui.
Pembuktian berarti data yang diperoleh itu diperlukan untuk membuktikan adanya keragu-raguan
terhadap suatu pengetahuan. Selanjutnya, pengembangan berarti data yang diperoleh dari penelitian
itu digunakan untuk memperdalam dan memperluas suatu pengetahuan.
Melalui penelitian manusia dapat menggunakan hasilnya. Secara umum data yang diperoleh
dari penelitian dapat digunakan untuk memahami, memecahkan, dan mengantisipasi masalah dalam
kehidupan manusia. Memahami berarti memperjelas suatu masalah yang sebelumnya tidak diketahui
lalu menjadi tahu. memecahkan berarti meminimalkan atau menghilangkan masalah, dan
mengantisipasi berarti suatu upaya dilakukan sehingga masalah tidak timbul.
B. Variabel Penelitian
1. Pengertian
Kalau ada pertanyaan tentang apa yang anda teliti, maka jawabannya berkenaan
dengan variabel penelitian. Jadi variabel penelitian pada dasarnya adalah segala
sesuatu yang berbentuk apa saja yang ditetapkan oleh peneliti untuk dipelajari
sehingga diperoleh informasi tentang hal tersebut, kemudian ditarik
kesimpulannya.
Secara teoritis variabel dapat didefinisikan sebagai atribut seseorang, atau obyek,
yang mempunyai variasi antara satu orang dengan yang lain atau satu obyek

dengan obyek yang lain (Hatch dan Farhady, 1981). Variabel juga dapat
merupakan atribut dan bidang keilmuan atau kegiatan tertentu. Tinggi, berat
badan, sikap, motivasi, kepemimpinan, disiplin kerja, merupakan atribut-atribut
dari setiap orang. Berat, ukuran, bentuk, dan warna merupakan atribut-atribut dari
obyek. Bahan baku pabrik, teknologi produksi, pengendalian mutu, pemasaran,
advertensi, nilai penjualan, keuntungan adalah merupakan contoh variabel dalam
kegiatan maupun ilmu bisnis.
Dinamakan variabel karena ada variasinya. Misalnya berat badan dapat
dikatakan varibel, karena berat badan sekelompok orang itu bervariasi antara satu
orang dengan yang lain. Demikian juga motivasi, persepsi juga dikatakan sebagai
variabel karena misalnya persepsi dari sekelompok orang tentu bervariasi. Jadi
kalau peneliti akan memililih variabel penelitian, baik yang dimiliki orang,
obyek, maupun bidang kegiatan dan keilmuan tertentu, maka harus ada
variasinya. Variabel yang tidak ada variasinya bukan dikatakan sebagai variabel.
Untuk dapat bervariasi, maka penelitian harus didasarkan pada sekelompok
sumber data atau obyek yang bervariasi.
Kerlinger (1973) menyatakan bahwa variabel adalah konstruk (constructs)
atau sifat yang akan dipelajari. Diberikan contoh misalnya, tingkat aspirasi,
penghasilan, pendidikan, status sosial, jenis kelamin, agolongan gaji,
produktivitas kerja, dan lain-lain. Di bagian lain Kerlinger menyatakan bahwa
variabel dapat dikatakan sebagai suatu sifat yang diambil dari suatu nilai yang
berbeda (different values) dengan demikian variabel itu merupakan suatu yang
bervariasi. Selanjutnya Kidder (1981), menyatakan bahwa variable adalah suatu
kualitas (qualities) dimana peneliti mempelajari dan menarik kesimpulan darinya.
Berdasarkan pengertian-pengertian di atas, maka dapat dirumuskan di sini
bahwa variabel penelitian adalah suatu atribut atau sifat atau nilai dari orang,

obyek atau kegiatan yang mempunyai variasi tertentu yang ditetapkan oleh
peneliti untuk dipelajari dan ditarik kesimpulannya
2. Macam-macam Variabel
Menurut hubungan antara satu variabel dengan variabel yang lain maka macam-
macam variabel dalam penelitian dapat dibedakan menjadi:
a. Variabel I ndependen: variabel ini sering disebut sebagai variabel stimulus,
prediktor, antecedent. Dalam bahasa Indonesia sering disebut sebagai variabel
bebas. Variabel bebas adalah merupakan variabel yang mempengaruhi atau yang
menjadi sebab perubahannya atau timbulnya variabel dependen (terikat). Dalam
SEM (Structural Equation Modeling/Pemodelan Persamaan Struktural, variabel
independen disebut sebagai variabel eksogen.
b. Variabel Dependen: sering disebut sebagai variabel output, kriteria,
konsekuen. Dalam bahasa Indonesia sering disebut sebagai variabel terikat.
Variabel terikat merupakan variabel yang dipengaruhi atau yang menjadi akibat,
karena adanya variabel bebas. Dalam SEM (Structural Equation
Modeling/Pemodelan Persamaan Struktural, variabel dependen disebut sebagai
variabel indogen.


Gambar 1.1. Contoh hubungan variabel independent-dependen
c. Variabel Moderator: adalah variabel yang mempengaruhi (memperkuat dan
memperlemah) hubungan antara variabel independen dengan dependen. Variabel
disebut juga sebagai variabel independen ke dua. Hubungan perilaku suami dan
Intensitas Iklim
(Variabel Independen)
Jumlah Penjualan
(Variabel Dependen)


isteri akan semakin baik (kuat) kalau mempunyai anak, dan akan semakin
renggang kalau ada pihak ke tiga ikut mencampuri. Di sini anak adalah sebagai
variabel moderator yang memperkuat hubungan, dan pihak ke tiga adalah sebagai
variabel moderator yang memperlemah hubungan. Hubungan motivasi dan prestasi
belajar akan semakin kuat bila peranan guru dalam menciptakan iklim belajar sangat
baik, dan hubungan semakin rendah bila peranan guru kurang baik dalam menciptakan
iklim belajar.

Gambar 1.2a. Contoh hubungan variabel independen-moderator, dependen.

Gambar 1.2b. Contoh hubungan variabel dependen.
d. Variabel intervening: dalam hal ini Tuckman (1988) menyatakan An
intervening variable is that factor that theoretically affect the observed
phenomenon but cannot be seen, measure, or manipulate. Variabel intervening
adalah variabel yang secara teoritis mempengaruhi hubungan antara variabel
independen dengan dependen, tetapi tidak dapat diamati dan diukur. Variabel ini
merupakan variabel Penyela/antara yang terletak di antara variabel independen

dan dependen, sehingga variabel independen tidak langsung mempengaruhi
berubahnya atau timbulnya variabel dependen.
Pada contoh berikut dikemukakan bahwa tinggi rendahnya penghasilan akan
mempengaruhi secara tidak langsung terhadap harapan hidup (panjang pendeknya
umur). Dalam hal ini ada variabel antaranya, yaitu yang berupa gaya hidup
seseorang. Antara variabel penghasilan dengan gaya hidup, terdapat variabel
moderator, yaitu budaya lingkungan tempat tinggal

Gambar 1.3 Contoh hubungan variabel independen-moderator Intervening, dependen.

e. Variabel kontrol: adalah variabel yang dikendalikan atau dibuat konstan sehingga
hubungan variabel independen terhadap dependen tidak dipengaruhi oleh faktor luar
yang tidak diteliti. Variabel kontrol sering digunakan oleh peneliti, bila akan
melakukan penelitian yang bersifat membandingkan, melalui penelitian eksperimen.
Contoh : pengaruh jenis pendidikan terhadap keterampilan pemasaran. Variabel
independennya pendidikan (SMU dan SMK), variabel kontrol yang ditetapkan
sama misalnya, adalah produk yang dipasarkan sama, lokasi pemasaran sama,
alat-alat yang digunakan sama, ruang tempat pemasaran sarna. Dengan adanya
variabel konrol tersebut, maka besarnya pengaruh jenis pendidikan terhadap
kemampuan pemasaran dapat diketahui lebih pasti.





Gambar 1.4. Contoh hubungan variabel independen-kontrol, dependen.

Untuk dapat menentukan kedudukan variabel independent, dan dependen, moderator,
intervening atau variabel yang lain, harus dilihat konteksnya dengan dilandasi konsep
teoritis yang mendasari maupun hasil dan pengamatan yang empiris di tempat penelitian.
Untuk itu sebelum peneliti memilih variabel apa yang akan diteliti perlu melakukan
kajian teoritis, dan melakukan studi pendahuluan terlebih dahulu pada obyek yang akan
diteliti. Jangan sampai terjadi membuat rancangan penelitian dilakukan di belakang meja,
dan tanpa mengetahui terlebih dahulu permasalahan yang ada di obyek penelitian. Sering
terjadi, rumusan masalah penelitian dibuat tanpa melalui studi pendahuluan ke obyek
penelitian, sehingga setelah dirumuskan ternyata masalah itu tidak menjadi masalah pada
obyek penelitian. Setelah masalah dapat dipahami dengan jelas dan dikaji secara teoritis,
maka peneliti dapat menentukan variabel-variabel penelitiannya.
Pada kenyataannya, gejala-gejala sosial itu meliputi berbagai macam
variabel saling terkait secara simultan baik variabel independen, dependen,
moderator, dan intervening, sehingga penelitian yang baik akan mengamati semua
variabel tersebut. Tetapi karena adanya keterbatasan dalam berbagai hal, maka
peneliti sering hanya memfokuskan pada beberapa variabel penelitian saja, yaitu
pada variabel independen dan dependen. Dalam penelitian kualitatif hubungan
antara semua variabel tersebut akan diamati, karena penelitian kualitatif
berasumsi bahwa gejala itu tidak dapat diklasifikasikan, tetapi merupakan satu
kesatuan yang tidak dapat dipisahkan (holistic).
Pendidikan SMA & SMK
(Variabel Independen)

Keterampilan Pemasaran
(Variabel Dependen)
Produk, tempat,alat sama
(Variabel Kontrol)


C. Paradigma Penelitian
Dalam penelitian kuantitatif/positivistik, yang dilandasi pada suatu asumsi bahwa
suatu gejala itu dapat diklasifikasikan, dan hubungan gejala bersifat kausal (sebab
akibat), maka peneliti dapat melakukan penelitian dengan memfokuskan kepada
beberapa variabel saja. Pola hubungan antara variabel yang akan diteliti tersebut
selanjutnya disebut sebagai paradigma penelitian atau model penelitian.
Jadi paradigma penelitian dalam hal ini diartikan sebagai pola pikir yang
menunjukkan hubungan antara variabel yang akan diteliti yang sekaligus
mencerminkan jenis dan jumlah rumusan masalah yang perlu dijawab melalui
penelitian, teori yang digunakan untuk merumuskan hipotesis, jenis dan jumlah
hipotesis, dan teknik analisis statistik yang akan digunakan. Berdasarkan hal ini maka
bentuk-bentuk paradigma atau model penelitian kuantitatif khususnya untuk
penelitian survey seperti gambar berikut:
1. Paradigma Sederhana
Paradigma penelitian ini terdiri atas satu variabel independen dan dependen. Hal ini
dapat digambarkan seperti gambar 1.5 berikut.

Gambar 1.5 Paradigma Sederhana
X = Kualitas alat Y = Kualitas barang yang dihasilkan
Berdasarkan paradigma tersebut, maka kita dapat menentukan:
X Y

a. Jumlah rumusan masalah deskriptif ada dua, dan asosiatif ada satu yaitu:
1) Rumusan masalah deskriptif (dua).
a) Bagaimana X ? ( kualitas alat).
b) Bagaimana Y? (kualitas barang yang dihasilkan).
2) Rumusan masalah asosiatif/hubungan (satu)
a) Bagaimanakah hubungan atau pengaruh kualitas alat dengan kualitas
barang yang dihasilkan?
b. Teori yang digunakan ada dua, yaitu teori tentang alat-alat kerja dan tentang
kualitas barang.
c. Hipotesis yang dirumuskan ada dua macam hipotesis deskriptf. dan hipotesis
asosiatf (hipotesis deskriptif sering tidak dirumuskan).
1) Dua hipotesis deskriptif:
a) Kualitas alat yang digunakan oleh lembaga tersebut telah mencapai 70%
baik
b) Kualitas barang yang dihasilkan oleh lembaga tersebut telah mencapai
99% dari yang diharapkan
2) Hipotesis asosiatif:
Ada hubungan yang positif dan signifikan antara kualitas alat dengan kualitas
barang yang dihasilkan. Hal ini berarti bila kualitas alat ditingkatkan, maka

kualitas barang yang dihasilkan akan menjadi semakin tinggi (kata signifikan
hanya digunakan apabila hasil uji hipotesis akan digeneralisasikan ke populasi
di mana sampel tersebut diambil)
d. Teknik analisis Data
Berdasarkan rumusan masalah dan hipotesis tersebut, maka dapat dengan mudah
ditentukan teknik statistik yan digunakan untuk analisis data dan menguji
hipotesis.
1) Untuk dua hipotesis deskriptif, bila datanya berbentuk interval dan ratio, maka
pengujian hipotesis menggunakan t-test one sampel.
Kegiatan penelitian selanjutnya adalah melakukan analisis data. Analisis data dilakukan
terutama untuk menjawab rumusan masalah dan menguji hipotesis yang telah diajukan. Terdapat dua
macam hipotesis, yaitu hipotesis penelitian dan hipotesis statistik. Pengertian hipotesis penelitian
seperti telah dikemukakan di atas yaitu merupakan jawaban sementara terhadap rumusan masalah.
Sedangkan hipotesis statistik adalah dugaan keadaan populasi dengan menggunakan data sampel.
Dengan demikian penelitian yang melakukan pengujian hipotesis statistik adalah penelitian yang
menggunakan data sampel. Bila peneliti merumuskan hipotesis penelitian dan ingin mengujinya
dengan menggunakan data populasi (bukan sampel) maka peneliti tidak akan menguji hipotesis
statistik.
Ciri khas adanya pengujian hipotesis statistik adalah adanya taraf kesalahan yang ditetapkan,
atau taraf signifikansi. Untuk keperluan pengujian hipotesis penelitian maupun statistik maka
diperlukan teknik statistik. Teknik statistik apa yang akan digunakan untuk pengujian hipotesis dapat
dilihat pada bab Pedoman Umum Memilih Teknik Statistik.
Setelah analisis data dilakukan, peneliti dapat mengambil keputusan hipotesis yang diajukan
diterima atau ditolak, maka kegiatan penelitian selanjutnya adalah memberikan pembahasan.
Pembahasan merupakan pencandraan terhadap hasil penelitian maupun analisis dengan
menggunakan berbagai referensi, sehingga hasil penelitian maupun analisisnya akan lebih dapat
diyakini oleh pihak-pihak lain.
Langkah akhir dari kegiatan penelitian adalah membuat kesimpulan dan memberikan saran-
saran. Kesimpulan ini merupakan jawaban terhadap rumusan masalah penelitian dengan menggunakan

data yang telah diperoleh (bukan hanya teori). Selanjutnya berdasarkan kesimpulan itu peneliti
memberikan saran-saran. Saran-saran yang diberikan harus betul-betul dari hasil penelitian, bukan
pemikiran pribadi peneliti.

E. Peranan Statistik Dalam Penelitian
Dalam bab proses penelitian yang ditujukkan pada Gambar 1.9 terlihat jelas dimana peranan
statistik dalam penelitian. Dari gambar tersebut terlihat jelas bahwa peranan statistik dalam penelitian
adalah sebagai:
1. Alat untuk menghitung besarnya anggota sampel yang diambil dari suatu populasi. Dengan
demikian jumlah sampel yang diperlukan lebih dapat dipertanggungjawabkan.
2. Alat untuk menguji validitas dan reliabilitas instrumen. Sebelum instrumen digunakan untuk
penelitian, maka harus diuji validitas dan reliabilitasnya terlebih dahulu.
3. Teknik-teknik untuk menyajikan data, sehingga data lebih komunikatif. Teknik-teknik penyajian
data ini antara lain; tabel, grafik, diagram lingkaran, dan pictogram.
4. Alat untuk analisis data seperti menguji hipotesis penelitian yang diajukan. Dalam hal ini statistik
yang digunakan antara lain; korelasi, regresi, t-test, anova, dll.

F. Macam-macam Statistik
Dalam arti sempit statistik dapat diartikan sebagai data, tetapi dalam arti luas statistik dapat
diartikan sebagai alat. Alat untuk analisis, dan alat untuk membuat keputusan. Statistik dapat
dibedakan menjadi dua, yaitu statistik Deskriptif dan statistik Inferensial. Selanjutnya statistik
inferensal dapat dibedakan menjadi Statistik Parametris dan Non Parametris. Statistik deskriptif
adalah statistik yang digunakan untuk menggambarkan atau menganalisis suatu statistik hasil
penelitian, tetapi tidak digunakan untuk membuat kesimpulan yang lebih luas (generalisasi / inferensi).
Penelitian yang tidak menggunakan sampel, analisisnya akan menggunakan statistik deskriptif.
Demikian juga penelitian yang menggunakan sampel, tetapi peneliti tidak bermaksud untuk membuat
kesimpulan terhadap populasi darimana sampel diambil, maka statistik yang digunakan adalah statistik
dcskriptif. Dalam hal ini Teknik Korelasi dan Regresi juga dapat berperan sebagai statistik dskriptif.


Gambar 1.9. Proses Penelitian dan Statistik yang Diperlukan

Statistik inferensial adalah statistik yang digunakan untuk menganalisis data sampel, dan
hasilnya akan digeneralisasikan (diinferensikan) untuk populasi dimana sampel diambil. Terdapat dua
macam statistik inferensial yaitu; statistik parametris dan non-parametris. Statistik parametris
digunakan untuk menganalisis data interval atau rasio, yang diambil dari populasi yang berdistribusi
normal. Sedangkan statistik non-parametris, digunakan untuk menganalisis data nominal dan ordinal
dari populasi yang bebas distribusi. Jadi tidak harus normal. Dalam hal ini teknik korelasi dan regresi
dapat berperan sebagai statistik inferensial. Bermacam-macam statistik ini dapat digambarkan seperti
pada Gambar 1.10 berikut:

Deskriptif
Non-parametris
Parametris
Inferensial
Statistik
Perlu Statistik untuk Uji
Validasi dan Realibilitas
Instrumen
Perlu Statistik Perlu
Instrumen
Perlu Statistik Perlu Statistik
Masalah Menyajikan
data
Mengumpul-
kan data
Menentukan
sampel
Berteori
Kesimpulan
saran
Pembahasan
Menganalisa
data

Gambar 1.10. Macam-macam Statistik
G. Berbagai Macam Data Penelitian
Data hasil penelitian dapat dikelompokkan menjadi dua, yaitu data kualitatif dan data
kuantitatif. Data kualitatif adalah data yang berbentuk kalimat, kata atau gambar. Sedangkan data
kuantitatif adalah data yang berbentuk angka, atau data kualitatif yang diangkakan (skoring). Data
kuantitatif dapat dikelompokkan menjadi dua yaitu data diskrit dan data kontinum. Data diskrit adalah
data yang diperoleh dari hasil menghitung atau membilang (bukan mengukur). Misalnya jumlah meja
ada 20, jumlah orang ada 12 dsb. Data ini sering juga disebut dengan data nominal. Data nominal
biasanya diperoleh dari penelitian yang bersifat eksploratif atau survey. Data kontinum adalah data
yang diperoleh dari hasil pengukuran. Data kontinum dapat dikelompokkan menjadi tiga yaitu: data
Ordinal, Interval, dan Rasio. Bermacam-macam data seperti dikemukakan tersebut dapat
digambarkan seperti pada Gambar 1.11 berikut:

Gambar 1.11. Bermacam-macam Data Penelitian

Data ordinal adalah data yang berjenjang atau berbentuk peringkat. Oleh karena itu, jarak satu
data dengan yang lain mungkin tidak sama. Juara I, II, III; Golongan I, II, III, IV; Eselon I, II, III, IV,
dsb. Data ordinal biasanya makin kecil angkanya, maka semakin tinggi nilainya. Juara I lebih baik dari
II; Eselon I, lebih tinggi dari II. Yang agak janggal adalah golongan I, mestinya lebih tinggi dari II.
Untuk pegawai negeri ternyata tidak. Menurut data ini, Eselon I, mestinya golongan gajinya juga 1.
Untuk pegawai negeri, Eselon I golongan gajinya adalah IV, hal ini jadi rancu. Data ordinal ini dapat
dibentuk dari data interval atau rasio. Pengertian keduanya akan diuraikan berikut ini.
Data interval adalah data yang jaraknya sama, tetapi tidak mempunyai nilai nol absolut
(mutlak). Pada data ini, walaupun datanya nol, tetapi masih mempunyai nilai. Misalnya nol derajat
Macam Data
Kualitatif
Kuantitatif
Rasio
Kontinum
Interval
Ordinal
Diskrit

celcius, ternyata masih ada nilainya. Dalam penelitian sosial yang
instrumennya menggunakan Skala Likert, Guttman, Semantic Differential, Thurstone, data yang
diperoleh adalah data interval. Data ini dapat dibuat menjadi data ordinal.
Data rasio adalah data yang jaraknya sama dan mempunyai nilai nol absolut. Jadi kalau data
nol berarti tidak ada apa-apanya. Hasil pengukuran panjang (M), berat (Kg) adalah contoh data rasio.
Bila nol meter maka tidak ada panjangnya, demikian juga bila nol kg tidak ada beratnya. Data ini bisa
dibuat penjumlahan dan perkalian. 5 kg + 5 kg =10 kg. Untuk jenis data yang lain tidak bisa demikian,
oleh karena itu data yang paling teliti adalah data rasio. Data ini dapat disusun ke dalam data interval
ataupun ordinal.

H. Pedoman Umum Memilih Teknik Statistik
Terdapat bermacam-macam teknik statistik yang dapat digunakan dalam
penelitian khususnya dalam pengujian hipotesis. Pedoman umum ini ditunjukkan
pada Tabel 1.1. Teknik statistik mana yang akan digunakan untuk pengujian
tergantung pada interaksi dua hal yaitu macam data yang akan dianalisis dan bentuk
hipotesisnya. Seperti dalam jenis penelitian menurut tingkat ekplanasinya maka
bentuk hipotesis ada tiga, yaitu hipotesis deskriptif, komparatif, dan asosiatif.
Hipotesis komparatif ada dua macam yaitu komparatif dua sampel dan lebih dari dua
sampel. Untuk masing-masing hipotesis komparatif dibagi menjadi dua yaitu sampel
related (berpasangan) dan sampel yang independen. (Lihat Tabel 1.1).
Contoh sampel yang berpasangan adalah sampel yang diberi pretest dan
postest, atau sampel yang digunakan dalam penelitian eksperimen sebagai kelompok
kontrol dan kelompok eksperimen. Jadi antara sampel yang diberi treatment
(perlakuan) dan yang tidak diberi perlakuan adalah sampel yang related. Contoh
sampel yang independen misalnya membandingkan antara prestasi kerja pegawai pria
dan wanita.
Berikut ini diberikan contoh rumusan hipotesis deskriptif, komparatif dan asosiatif.

1. Hipotesis Deskriptif
Ho : Daya tahan lampu merk X = 500 jam

Ha : Daya tahan lampu merk X 500 jam
2. Hipotesis Komparatif
Ho : Daya tahan lanipu merk X = merk Y
Ha : Daya tahan lampu merk X merk Y
3. Hipotesis Asosiatif
Ho : Tidak ada hubungan antara tegangan dengan daya tahan lampu
Ha : Ada hubungan antara tegangan dengan daya tahan lampu

Untuk contoh hipotesis tersebut, datanya adalah data rasio (jam) teknik
statistik yang digunakan adalah:
1. Untuk hipotesis deskriptif statistiknya adalah t-test satu variabel (data interval,
hipotesis deskriptif)
2. Untuk hipotesis komparatif juga pakai t-test (dua sampel independen). Data
interval, hipotesis komparatif dua sampel independen.
3. Untuk hipotesis asosiatif pakai Pearson Product Moment. Data interval, hipotesis
asosiatif atau hubungan. Lihat Tabel 1.1.

Bila data nominal, hipotesis asosiatif, teknik statistik yang digunakan adalah
Cotingency, Coefficient, atau Cramers statistik Lamda. Jadi Tabel 1.1 dapat
digunakan sebagai kunci dalam memilih teknik statistik untuk pengujian hipotesis
penelitian.

TABEL 1.1
PENGUNAAN STATISTIK PARAMETRIS DAN NONPARAMETRIS
UNTUK MENGUJI HIPOTESIS
MACAM
DATA
BENTUK HIPOTESIS
Deskriptif
(Satu
Vaniabel)

Komparatif
(dua sampel)
Komparatif
(Iebih dari dua sampel)
Asosiatif
(hubungan)
Related Independen Related Independen
Nominal Binomial Mc Fisher Exact
2
for Contingency

2
One
Sample
Nemar Probabiliti

2
Two
sample
k sample

Cochran Q

2
for
k sample



Coefficient
C
Ordinal Run Test
Sign test

Wilcoxon
matched
pairs
Median Test

Mann-
Whitney
U test

Kolrnogorov
- Sminsov

Wald-
Woldfowitz
Friedman
Two-Way
Anova
Median
Extension

Kruskal Wallis
One Way Anova
Spearman Rank
Correlation

Kendall Tau
Interval
Rasio
t-test*
t-test of*
Related
t-test*
Independent
One-Way
Anova*

Two-Way
Anova*
One-Way
Anova*

Two-Way
Anova*
Pearson
Product
Moment*

Partial
Correlaion*

Multiple
Correlation*
*Statistik Parametris

Buku ini menyajikan semua teknik statistik yang ada pada Tabel 1.1 tersebut
di atas, berikut contoh-contohnya dalam pengujian hipotesis. Bila pembaca telah
memahami semua teknik statistik tersebut, mulai Binomial sampai Multiple
Correlation, maka Anda telah menjadi analis dalam penelitian kuantitatif.




































BAB II
STATISTIK DESKRIPTIF


A. Pengertian Statistik Deskriptif
Statistik deskriptif adalah statistik yang berfungsi untuk mendiskripsikan atau member
gambaran terhadap objek yang diteliti melalui data sample atau populasi. Sebagaimana adanya,
tanpa melakukan analisis dan membuat kesimpulan yang berlaku untuk umum.

Pada statistik Deskriptif ini akan dikemukakan cara-cara penyajian data, dengan table biasa
maupun distribusi frekuensi; grafik garis maupun batang; diagram lingkaran;pictogram;
penjelasan kelompok melalui modus, median, mean dan variasi kelompok melalui rentang dan
simpanan baku.


B. Penyajian Data
Setiap peneliti harus dapat menyajikan data yang telah diperoleh, baik yang
diperoleh melalui observasi, wawancara, kuesioner (angket) maupun dokumentasi. Prinsip dasar
penyajian data adalah komunikatif dan berulang-ulang, dalam arti data yang disajikan dapat
menarik perhatian pihak lain untuk membacanya dan mudah memahami isinya. Penyajian data
yang komunikatif dapat dilakukan dengan: penyajian data dibuat berwarna, dan bila data yang
disajikan cukup banyak maka perlu bervariasi penyajiannya (tidak hanya dengan table saja).

Penyajian data dengan pictogram, (yang dapat menggambarkanrealitas yang sebenarnya)
merupakan penyajian data yang paling komunikatif, tetapi sulit membuatnya dan mahal. Tetapi
setelah ada peralatan computer, pembuatan pictogram dan berbagai model penyajian data menjadi
sangat mudah.

Beberapa cara penyajian data yang akan dikemukakan disini adalah: penyajian dengan table,
grafik, lingkaran dan pictogram.


1. Tabel
Penyajian data hasil penelitian dengan menggunakan tabel merupakan penyajian yang
banyak digunakan, karena lebih efisien dan cukup komunikatif. Terdapat dua macam tabel,
yaitu tabelbiasa dan distribusi frekuensi.

Setiap table berisi judul table, judul setiap kolom, nilai data dalam setiap kolom, dan
sumber data darimana data tersebut diperoleh. Contoh-contoh penyajian dengan table biasa
ditunjukakan pada table 2.1 yang merupakan table denagn data nominal: table 2.2 merupakan
table dengan data ordinal dan table 2.3 merupakan table dengan data interval
a. Contoh table data Nominal
Telah dilakukan pengumpulan data untuk mengetahui komposisi pendidikan
pengawai di PT.Lodaya. Berdasarkan studi dokumentasi diperoleh keadaan sebagai
berikut:
1. dibagian Keuangan : jumlah pegawai yang lulus S1 = 25 orang, sarjana muda = 90
orang , SMU = 45 orang, SMK = 156 orang, Smp = 12 orang, dan SD = 3 orang.

2. dibagian umum: Jumlah pegawai yang lulus S1 = 5 orang, sarjana muda = 6 orang,
SMU = 6 orang, SMK = 8 orang, SMP = 4 orang, dan SD = 1 orang
3. Dibagian penjualan: Jumlah pegawai yang lulus S1 = 7 orang, sarjana, SMK = 65
orang, SMP = 37 orang, dan SD = 5 orang
4. Dibagian Litbang: Jumlah pegawai yang lulus S3 = 1 orang, S2 = 8 orang, S1 = 35
orang

Berdasarkan data mentah tersebut maka dapat disusun dengan table sebagai ditunjukan
dengan table 2.1 berikut.




Judul table 2.1 adalah KOMPOSISI PENDIDIKAN PEGAWAI DI PT. LODAYA. Pada
table tersebut isi kolomnya adalah : No, bagian, tingkat pendidikan dan jumlah. Judul
tabel ditulis ditengah (di atas tabel) dan dengan huruf besar
TABEL 2.1
KOMPOSISI PENDIDIKAN PEGAWAI DI PT.LODAYA
No Bagian
Tingkat Pendidikan Jml
S3 S2 S1 SM SMU SMK SMP SD
1 Keuangan 25 90 45 156 12 3 331
2 Umum 5 6 6 8 4 1 30
3 Penjualan 7 65 37 5 114
4 Litbang 1 8 35 44
Jumlah 1 8 72 96 51 229 53 9 519
Sumber data: Bagian Personalia

b. Contoh tabel Data Ordinal
Contoh tabel yang berisi data ordinal ditunjukan pada tabel 2.2. data tersebut disusun
berdasarkan hasil penelitian terhadap kinerja aparatur pemerintahan disalahsatu profinsi
dipulau jawa. Data ordinal ditunjukan pada data yang berbentuk peringkat/ringking.
Misalnya ringking kinerja yang paling baik yaitu no. 1 berupa kinerja kondisi fisik
tempat kerja (kinerja yang berbentuk presentase, misalnya 61,9% adalah data rasio).


c. Contoh tabel Data Interval
Contoh tabel yang berisi data interval ditunjukkan pada tabel 2.3. Data tersebut
merupakan sebagian kecil hasil penelitian terhadap kepuasan kerja pegawai disalah satu
Propinsi di Jawa. Instrumen yang digunakan disusun dengan skala Likert denagn interval
1 s/d 4, dimana skor 1 berarti sangat tidak puas, 2 tidak puas, 3 puas, 4 sangat puas. Skala
Likert tersebut akan menghasilkan data interval. Berdasarkan 1055 responden, setelah
dianalisis hasilnya ditunjukkan dalan tabel tersebut. Komponen kepuasan meliputi :
kepuasan dalam gaji, insentif, transportasi, perumahan, dan hubungan sosial (antara
pegawai dan pimpinan). Berdasarkan tabel tersebut, Tingkat kepuasan yang paling tinggi
adalah kepuasan dalam pelayanan transportasi, yaitu sebesar 68,60. skor tertinggi = 70.

TABEL 2.2
RANGKING KUALITAS KINERJA APARATUR
No ASPEK KERJA KUALITAS
KINERJA (%)
RANGKING
KINERJA
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
Kondisi fisik tempat
Alat-alat kerja
Ortal
Kemampuan kerja
Peranan Kopri
Kepemimpinan
Performen kerja
Managemen kepegawaian
Produktivitas kerja
Motivasi kerja
Diklat yang diperoleh
Kebutuhan induvidu
61,90
61,02
58,72
58,70
58,42
58,05
57,02
54,61
54,51
54,02
53,16
53,09
1
2
3
4
5
6
7
8
9
10
11
12
Rata-rata kualitas kinerja 56,935
Sumber Data : Biro Kepegawaian
TABEL 2.3
TINGKAT KEPUASAN KERJA PEGAWAI
No. Aspek Kepuasan Kerja Tingkat Kepuasan
1. Gaji 37,58
2. Insentif 57,81

3. Transportasi 68,60
4. Perumahan 48,12
5. Hubungan Kerja 54,00
Sumber data: Biro Kepegawaian

2. Tabel Distribusi Frekuensi
Tabel distribusi frekuensi disusun bila jumlah data yang akan disajikan cukup banyak,
sehingga kalau disajikan dalam tabel biasa menjadi tidak efisien dan kurang komunikatif.
Selain itu, tabel ini juga dibuat untuk persiapan pengujian terhadap normalitas data yang
menggunakan kertas Peluang Normal. Contoh tabel distribusi frekuensi ditunjukkan pada
tabel 2.4
TABEL 2.4
DISTRIBUSI FREKUENSI
NILAI PELAJARAN STATISTIK 150 MAHASISWA
No
Kelas
Kelas Interval Frekuensi
1. 10 19 1
2. 20 29 6
3. 30 39 9
4. 40 49 31
5. 50 59 42
6. 60 69 32
7. 70 79 17
8. 80 89 10
9. 90 99 2
Jumlah 150


a. Hal-hal yang perlu Diperhatikan dalam Tabel Distribusi Frekuensi
1) Tabel distribusi mempunyai sejumlah kelas. Pada contoh tersebut jumlah kelas
intervalnya adalah 9 yaitu nomor 1 s/d 9
2) Pada setiap kelas mempunyai kelas interval. Interval nilai bahwa dengan atas sering
disebut dengan panjang kelas. Jadi panjangnya kelas adalah jarak antara nilai batas

bawah dengan batas atas pada setiap kelas. Batas bawah pada contoh nilai yang ada
pada sebelah kiri tiap kelas (10,20,30,.....90). Sedangkan batas atas ditunjukkan pada
nilai sebelah kanan yaitu 19,29,39,....100 (angka terakhir mestinya 99, tetapi nilai
tertinggi adalah 100), jadi 100 langsung dimasukkan sebagai batas atas.
3) Setiap kelas interval mempunyai frekuensi (jumlah). Sebagai contoh pada kelas ke-3,
mahasiswa yang mendapat nilai antara 30-39 frekuensinya (jumlahnya = 9)
4) Tabel distribusi frekuensi tersebut bila dibuat menjadi tabel biasa akan memerlukan
150 baris (n= 150) jadi akan sangat panjang.

b. Pedoman Umum membuat Tabel distribusi Frekuensi
Langkah pertama dalam membuat tabel distribusi frekuensi adalah
menentukan kelas interval. Dalam menentukan jumlah kelas interval tersebut terdapat
tiga pedoman yang dapat diikuti yaitu:

1) Ditentukan Berdasarkan Pengalaman
Berdasarkan pengalaman, jumlah kelas interval yang dipergunakan dalam
penyusunan tabel distribusi frekuensi berkisar antara 6 s/d 15 kelas. Makin banyak
(variasi) data, maka akan semakin banyak jumlah kelasnya. Namun jumlah kelas
tersebut paling banyak adalah 15 kelas, karena kalau sudah lebih dari itu tabel
menjadi panjang.

2) Ditentukan dengan membaca Grafik
Pada gambar 2.1 ditunjukkan grafik yang menunjukkan hubungan antara banyaknya
data (n) dengan jumlah kelas interval yang diperlukan dalam pembuatan tabel
distribusi frekuensi. Garis yang vertikel menunjukkaN jumlah kelas intervalnya,
sedangkan yang horisontal menunjukkan jumlah data observasi. Dari grafik dapat
dibaca, misalnya jumlah data observasi 50 (n), maka jumlah kelas interval yang
diperlukan adaalah 8. sedangkan bila jumlah data 200, maka jumlah kelasnya sekitar
12. dengan pedoman ini, maka bagi yang belum berpengalaman akan dapat
menentukan kelas intervalnya tanpa ragu-ragu.

3) Ditentukan dengan Rumus Sturges
Jumlah kelas interval dapat dihitung dengan rumus sturges , seperti ditunjuk pada
rumus 2.1 berikut:


K = 1 + 3,3 log n

Dimana
K = jumlah kelas interval
n = jumlah data observasi
log = logaritma

misal jumlah data 200, maka jumlah kelasnya (K):

K = 1 + 3,3 log 200 = 1 + 3,3 . 2,30 = 8,59 dapat dibulatkan menjadi 8 atau 9.

Berdasarkan grafik gambar 2.1, bila jumlah datanya 200, maka jumlah kelas
intervalnya = 12.













C. Contoh Menyusun Tabel Distribusi Frekuensi
Data berikut ini merupakan nilai ujian matakuliah statistik dari 150 mahasiswa. Berdasarkan data
tersebut di atas, maka langkah-langkah yang diperlukan dalam penyusunan tabel distribusi frekuensi
adalah sebagai berikut:


27
53
70
57
27
82
41
49
43
80
35
59
62
33
55
79
44
48
76
46
45
65
64
69
71
54
89
57
61
70
69
93
61
73
62
54
62
40
54
53
43
60
48
80
39
40
51
55
62
43
52
75
61
31
56
39
51
69
57
59
51
65
60
36
54
71
60
73
36
91
56
71
76
42
69
88
42
25
67
83
53
42
44
51
60
27
53
52
45
51
55
58
47
40
59
82
55
59
75
41
62
58
49
59
85
48
55
78
51
13
69
34
46
44
29
44
26
45
44
46
36
69
61
59
72
60
49
71
66
56
85
77
54
68
55
61
63
54
68
57
35
45
86
53
57
61
68
41
73
67


1) Menghitung Jumlah Kelas Interval
K = 1 + 3,3 log 150 = 1 + 3,3 . 2,18 = 8,19
Jadi jumlah kelas interval 8 atau 9. Pada Kesempatan ini digunakan 9 Kelas.

2) Menghitung Rentang Data
Yaitu data terbesar dikurang13i data yang terkecil kemudian ditambah 1. Data terbesar = 93 dan
terkecil = 13.
Jadi 93 - 13 = 80 + 1

3) Menghitung Jumlah Kelas Panjang Kelas = Rentang dibagi Jumlah Kelas
Yakni: 81 : 9 =9. Walaupun dari hitungan panjang kelas diperoleh 9, tetapi pada penyusunan tabel
ini digunakan panjang kelas 10. Supaya nilai batas bawah semua berakhir nol dan batas atas 9. Hal
ini akan lebih komunikatif bila dibandingkan dengan menggunakan panjang Kelas 9.


4) Menyusun Interval Kelas
Secara teoritis penyusunan kelas interval dimulai dari data yang terkecil, yaitu 13. Tetapi supaya
lebih komunikatif, maka dimulai dengan angka 10, sehingga tabel 2.5 berikut:

TABEL 2.5
PENYUSUNAN TABEL DISTRIBUSI FREKUENSI DENGAN TALLY

No.
Kelas
Kelas Interval Tally Frekuensi (f)
1
2
3
4
5
6
7
8
9
10-19
20-29
30-39
40-49
50-59
60-69
70-79
80-89
90-100
I
IIII I
IIII IIII
IIII IIII IIII IIII IIII IIII I
IIII IIII IIII IIII IIII IIII IIII IIII I
IIII IIII IIII IIII IIII IIII II
IIII IIII IIII II
IIII IIII
II
1
6
9
31
42
32
17
10
2
Jumlah : 150


5) Setelah Kelas Interval tersusun, maka untuk memasukkan data guna mengetahui frekuensi pada
setiap Kelas Interval dengan menggunakan tally.
6) Cara memasukkan tally yang cepat dan tepat
Adalah dengan cara memberi tanda centang () pada setiap angka yang sudah dimasukkan pada,
setiap Kelas, dan mulai dari data awal. Misalnya data yang paling awal adalah angka 27, maka
data 27 itu termasuk pada kelass no. 2 yaitu (20-29). Kemudian angka 27 ini diberi tanda centang,
yang berarti data tersebut telah dimasukkan ke dalam Kelas Interval. Selanjutnya angka 53,
ternyata angka tersebut masuk pada kelas no. 5. kalau semua angka telah diberi tanda centang,
berarti semua data telah masuk pada setiap Kelas interval. Jumlah Tally harus sama dengan
jumlah data.


7) Sesudah frekuensi ditemukan maka tally dihilangkan, dan data yang disajikan adalah seperti
yang tertera dalam tabel 2.4. setiap data yang disajikan dengan teknik apapun harus diberi judul.
Judul harus singkat, jelas, tetapi semua isi tercermin dalam judul.

D. Tabel Distribusi Frekuensi Kumulatif
Tabel ini merupakan pengembangan dari tabel distribusi frekuensi. Distribusi frekuensi Kumulatif
adalah tabel yang menunjukkan jumlah observasi yang menyatakan kurang dari nilai tertentu. Untuk
Memulai pernyataan kurang dari digunakan batas bawah dari kelas interval ke-2. Untuk contoh pada
tabel 2.5 digunakan angka 20.
Selanjutnya, frekuensi kumulatif merupakan penjumlahan frekuensi dari setiap Kelas
interval, sehingga jumlah frekuensi terakhir jumlahnya sama dengan jumlah data observasi ( Untuk
contoh tersebut adalah 150).










TABEL 2.6
DISTRIBUSI FREKUENSI KUMULATIF NILAI
STATISTIK 150 MAHASISWA
Kurang Dari Frekuensi Kumulatif

Kurang dari 20
Kurang dari 30
Kurang dari 40
Kurang dari 50
Kurang dari 60
Kurang dari 70
Kurang dari 80
Kurang dari 90
Kurang dari 101
1
7
16
47
89
121
138
148
150

Perhatikan
1) kumulatif setiap nilai adalah jumlah nilai kelas dengan dibawahnya. Misalnya kurang dari 40
adalah 1+6+9 = 16 (lihat tabel 2.5)
2) Pernyataan kurang dari yang terakhir, adalah nilai batas atas Kelas interval terakhir,
ditambah dengan 1. Misalnya Kelas interval terakhir adalah 100. Setelah ditambah1 menjadi
101. Oleh karena itu kalimat terakhir adalah, kurang dari 101.

e. Tabel Distribusi Frekuensi Relatif
Penyajian data lebih mudah dipahami bila dinyatakan dalam persen (%). Penyajian data yang
merubah frekuensi menjadi persen, dinamakan tabel Distribusi Frekuensi Relatif diberikan
pada tabel 2.7, cara pembuatannya adalah dengan merubah frekuensi menjadi persen.
Penyajian didasarkan pada tabel 2.5. Angka 0,67 adalah diperoleh dari 1: 150 x 100%.




TABEL 2.7
DISTRIBUSI FREKUENSI RELATIF
NILAI STATISTIK 150 MAHASISWA
No. Kelas Kelas Interval Frekuensi Relatif (%)
1 10 19 1 0,67
2 20 29 6 4,00

3 30 39 9 6,00
4 40 49 31 20,67
5 50 59 42 28,00
6 60 69 32 21,33
7 70 79 17 11,33
8 80 89 10 6,67
9 90 100 2 1,33
Jumlah 100


f. Tabel Distribusi frekuensi relatif Kumulatif
Bentuk tabelnya seperti Tabel 2.6, tetapi frekuensi Kumulatif yang tertera dalam tabel 2.6
dirubah menjadi persentase. Contoh diberikan pada tabel 2.8 berikut.












TABEL 2.8
DISTRIBUSI FREKUENSI KUMULATIF RELATIF
NILAI STATISTIK 150 MAHASISWA

Kurang dari Frekuensi Kumulatf Relatif
Kurang dari 20 0,67%
Kurang dari 30 4,67%
Kurang dari 40 10,67%

Kurang dari 50 31,33%
Kurang dari 60 59,33%
Kurang dari 70 80,67%
Kurang dari 80 92,00%
Kurang dari 90 98,67%
Kurang dari 101 100,00%


3. Grafik
Selain dengan tabel, penyajian data yang cukup populer dan komunikatif adalh dengan grafik.
Pada umumnya terdapat dua macam grafik yaitu : grafik garis (polygon) dan grafik batang
(histogram). Grafik batang ini dapat dikembangkan lagi menjadi grafik balok (tiga dimensi). Suatu
grafik selalu menunjukkan hubungan antara jumlah dengan variabel lain, misalnya waktu.

a. Grafik garis
Grafik garis dibuat biasanya untuk menunjukkan perkembanga suatu keadaan. Perkembangan
tersebut bisa naik bisa turun. Hal ini akan nampak secara visual melalui garis dalam grafik.
Dalam grafik terdapat garis vertikal yang menunjukkan jumlah (frekuensi) dan yang mendatar
menunjukkan variabel tahun (Gambar 2.2). Yang perlu diperhatikan dalm membuat grafik
adalah ketepatan membuat skala pada garis vertikal yang akan mencerminkan keadaan jumlah
hasil observasi.





b. Grafik Batang
Visualisasi dengan grafik garis nampaknya kurang menarik untuk menyajikan data,
untuk itu maka dikembangkan grafik batang dan grafik balok (grafik batang bentuk gamabar
2D, balok 3D)

Kalau dalam grafik garis, visualisasai data difokuskan pada garis grafik, sedangkan
pada grafik batang visualisasinya difokuskan pada luas batang (panjang x lebar). Namun
kebanyakan penyajian data dengan grafik batang, lebar batang dibuat sama, sedangkan yang
bervariasi adalah tingginya.

Contoh grafik diberikan pada gambar 2.3. pada gambar 2.3 ditunjukkan data tentang
perkembangan jumlah anggota koperasi baik KUD maupun non KUD, dari tahun 1968, 1989
s/d 1994, yang dikutip dari pidato mantan Presiden RI ke dua, pada tanggal 16 Agustus 1995

Pada gambar 2.3 selain menunjukkan perkembangan juga menunjukkan perbandingan antara
jumlah anggota KUD dan non KUD. Karena terdapat dua kelompok data, maka
penggambarkan perlu dibedakan, dalam hal ini untuk anggota KUD dengan garis tegak
sedang untuk non KUD dengan garis melintang. Perbedaan yang lain dapat dilakukan
dengan memberi warna yang berbeda.


Cara pembuatannya adalah:
a. Buatlah lingkaran dengan jari-jari disesuaikan dengan kebutuhan.
b. Untuk kepentingan ini, data telah dinyatakan dalam persen. Oleh karena itu
setiap 1% akan memerlukan 360 : 100 = 3,6 (ingat luas lingkaran = 360
0
).

Misalnya data dinyatakan dalam jumlah orang, 60 orang maka setiap orang akan
memerlukan luas 360 : 60 = 6.
c. Menghitung luas yang diperlukan oleh sekelompok data dalam lingkaran. Dalam
hal ini terdapat lima luas yang jumlah keseluruhan akan sama dengan luas
lingkaran.

1) Luas kelompok yang menggunakan pil
53,9 x 3,6
0
= 194,04
0
2) luas kelompok yang menggunakan kondom
4,4 x 3,6
0
= 15,84
0
3) luas kelompok yang menggunakan suntik
11,1 x 3,6
0
= 39,96
0
4) luas kelompok yang menggunakan IUD
27 x 3,6
0
= 97,20
0
5) Luas kelompok lain
3,6 x 3,6
0
= 12,96
0
(dari hitungan diatas (1) s/d (5) diperoleh jumlah
360
0
).

d. Selanjutnya luas-luas kelompok data tersebut digambarkan dalam lingkaran,
dengan menggunakan busur derajat bisa mulai dari sembarang titik. Jangan
sampai terdapat sisa lingkaran, misalnya jumlah luas dari setiap kelompok data
(a+b+c+d) tidak sampai 360. Jumlah ini kemungkinan tidak sampai 360, atau
memenggal beberapa angka di belakang koma.
e. Contoh dari perhitungan tersebut di atas, dapat digambarkan ke dalam Gambar
2.6 berikut.















5. Pictogram (grafik gambar)

Ada kalanya supanya data yang disajikan lebih komunikatif, maka penyajian data
dibuat dalam bentuk pictogram. Contoh pictogram ditunjukkan dalam Gambar 2.7
dan Gambar 2.8 berikut.


1. Apakah yang dimaksud dengan statistik deskriptif dan inferential?
2. Apakah perbedaan statistik parametris dan non parametris?
3. Sebutkan macam-macam teknik penyajian data yang anda ketahui?
4. Buatlah contoh penyajian data yang menggunakan?
a. Tabel Biasa
b. Tabel Distribusi Frekuensi
c. Grafik garis
d. Grafik batang

e. Grafik balok
f. Diagram Lingkaran (Piechart)
g. Piktogram
5. Apakah perbedaan Modus, Median dan Mean sebagai alat untuk menjelaskan
keadaan kelompok?
6. Kapan Modus, Median, dan Mean berada dalam satu titik?
7. Hitunglah Modus, Median dan Mean dari data berikut:
2,8,4,2,4,8,2,9,2,10
20,8,4,21,40,60,2,8,7,6
8. Teknik statistik apa yang dapat digunakan untuk melihat homogenitas atau variasi
kelompok?
9. Mana yang lebih homogeny dari kelompok berikut:
a. 2,8,2,10.11,17,8,10,8
b. 8,8,7,8,8,6,8,7,4,8
10. Berapa atandard deviasi dan indek variasi dari dua kelompok berikut:
a. 6,8,10,12,14
b. 106,108,110,112,114








BAB III
POPULASI, SAMPEL DAN PENGUJIAN NORMALITAS DATA

A. Populasi
Populasi adalah wilayah generalisasi yang terdiri atas: obyek/subyek yang mempunyai kualitas dan

karakteristik tertentu yang ditetapkan oleh peneliti untuk dipelajari dan kemudian ditarik
kesimpulannya.
Jadi populasi bukan hanya orang, tetapi juga obyek dan benda-benda alam yang lan. Populasi
juga bukan sekedar jumlahb yang aa pada obyek/subyek yang dipelajari, tetapi meliputi seluruh
karakteristik/sifat yang dimiliki oleh subyek ayau onyek yang diteliti itu.
Misalnya akan melakukan penelitian di sekolah X, maka sekolah X ini mempunyai populasi
yang bisa berupa jumlah subyek/orang dan karakteristik subyek/orang. Pengertian pertama member
makna bahwa populasi merupakan sekumpulan orang/subyek dan obyek yang diamati. Pengertian
kedua memberi petunjuk bahwa orang-orang di sekolah X mempunyai karakteristik misalnya motivasi
kerjanya, disiplin kerjanya, kepemimpinannya, iklim organisasinya dan lain-lain.
Satu orangpun dapat digunakan sebagai populasi, karena satu orang itu mempunyai berbagai
karakteristik, misalnya gaya bicaranya, disiplin pribadi, hobi, cara bergaul, kepemimpinananya dan
lain-lain. Misalnya akan melakukan penelitian tentang kepemimpinan presiden Y maka kepemimpinan
itu merupakan sampel dari semua karakteristik yang dimiliki presiden Y.
Dalam bidang kedokteran, satu orang sering bertindak sebagai populasi. Darah yang ada pada
setiap orang adalah populasi, kalau akan diperiksa cukup diambil sebagian darah yang berupa sampel.
Data yang diteliti dari sampelndarah tersebut selanjutnya diberlakukan ke seluruh darah yang dimiliki
orang tersebut.
B. Sampel
Sampel adalagian dari jumlah dan karakteristik yang dimiliki oleh populasi. Bila populasi besar, dan
peneliti tidak mungkin mempelajari semua yang ada pada populasi, misalnya karena keterbatasan
dana, tenaga dan waktu maka peneliti dapat menggunakan sampel yang diambil dari populasi itu. Apa
yang dipelajari dari sampel, kesimpulannya akan dapat diberlakukan untuk populasi. Untuk itu sampel
yang diambil dari populasi harus betul-betul representative (mewakili).
Bila sampel tidak representative, maka ibarat orang buta disuruh menyimpulkan karakteristik
gajah. Satu orang memegang telinga gajah, maka ia menyimpulkan gajah itu seperti kipas. Orang
kedua memegang badan gajah, maka ia menyimpulkan gajah itu seperti tembok besar. Satu orang lagi
memegang ekornya maka ia menyimpulkan gajah it kecil seperti sutas tali. Begitulah kalai sampel
yang dipilih tidak representative, maka ibarat 3 orang buta itu yang membuat kesimpulan tentang
gajah.
C. Teknik Sampling
Teknik sampling adalah merupakan teknik pengambilan sampel. Untuk menentukan sampel dalam
penelitian, terdapat berbagai teknik sampling yang digunakan. Secara skematis, macam-macam teknik

sampling ditunjukan pada Gambar 3.1
Dari Gambar tersebut terlihat bahwa teknik sampling pada dasarnya dapat dikelompokkan
menjadi dua yaitu Probabiliti Sampling dan Nonprobabiliti Sampling. Probabiliti sampling meliputi
simple random, proportionate stratified random, disprportionate stratified random dan area random.
Nonprobabiliti sampling aksidental/incidental, purposive sampling, sampling jenuh dan snowball
sampling.
















1. Probabiliti Sampling

Probabiliti sampling adalah teknik pengambilan sampel yang memberikan peluang yang sama bagi
setiap unsure (anggota) populasi untuk dipilih menjadi anggota sample. Teknik ini meliputi, simple
random sampling, propionate stratifield random sampling, disproportionate stratifield random,
sampling area (cluster) sampling (sampling menurut daerah).
a. Simple Random Sampling
Dikatakan simple( sederhana) karena pengambilan anggota sample dari populasi dilakukan secara acak
tanpa memperhatikan strata yang ada dalam populasi itu. Cara demikian dilakukan bila anggota

populasi dianggap homogen. Pengambilan sampel acak sederhana dapat dilakukan dengan cara undian,
memilih bilangan dari daftar bilangan secara acak, dsb. Lihat Gambar 3. 2 berikut








b. Propoptionate stratifield random sampling
Teknik ini digunakan bila populasi mempunyai anggota/unsure yang tidak homogeny dan berstrata,
maka populasi pegawai itu berstrata. Misalnya jumlah pegawai yang lulus S1=45, S2=30, STM=800,
ST=900, SMEA=400, SD=300. Jumlah sampel yang harus diambil meliputi strata pendidikan tersebut.
Jumlah sampel dan teknik pengambilan sampel diberikan setelah bab ini. Teknik Proportionate
Stratifield Random Sampling dapat digambarkan seperti Gambar 3.3 berikut.



c. Disproportionate Stratified Random Sampling
Teknik ini digunakan untuk menentukan jumlah sampel, bila populasi berstrata tetapi kurang
proporsional. Misalnya pegawai dari unit kerja tertentu mempunyai; 3 orang lulusan S3, 4 orang
lulusan S2, 90 orang S1, 800 orang SMU, 700 orang SMP, maka tiga orang lulusan S3 dan empat
orang S2 itu diambil semuanya sebagai sampel, karena dua kelompok ini terlalu kecil bila
dibandingkan dengan kelompok S1, SMU, SMP.










d. Cluster Sampling (Area Sampling)
Teknik sampling daerah digunakan untuk menentukan sampel bila obyek yang akan diteliti atau
sumber data sangat luas, missal penduduk dari suatu Negara, provinsi, atau kabupaten. Untuk
menentukan penduduk mana yang akan dijadikan sumber data, maka pengambilan sampel ditetapkan
secara bertahap dari wilayah yang luas (Negara) sampai ke wilayah terkecil (kabupaten). Setelah
terpilih sampel terkecil, kemudian baru dipilih sampel secara acak.
Misalnya di Indonesia terdapat 30 provinsi, dan sampelnya akan menggunakan 15 provinsi,
maka pengambilan 15 provinsi itu dilakukan secara random. Tetapi perlu diingat, karena provinsi-
provinsi di Indonesia itu berstrata (tidak sama) maka pengambilan sampelnya perlu menggunakan
stratified random sampling, Provinsi di Indonesia ada yang penduduknya padat, ada yang tidak, ada
yang mempunyai hutan banyak ada yang tidak, ada yang kaya bahan tambang ada yang tidak.
Karakteristik semacam ini perlu diperhatikan sehingga pengambilan sampel menurut strata populasi itu
dapat ditetapkan.
Teknik sampling daerah ini sering digunakan melaui dua tahap, yaitu tahap pertama
menentukan sampel darah dan tahap berikutnya menetukan orang-orang yang ada pada daerah itu
secara sampling juga. Teknik ini dapat digambarkan seperti. Gambar 3.4 berikut.










2. Nonprobabiliti Sampling
Nonprobabiliti Sampling adalah teknik pengambilan sample yang tidak member peluang/kesempatam
sama bagi setiap unsure atau anggota populasi untuk dipilih menjadi sample. Teknik sampel ini
meliputi, sampling sistematis, kuota, aksidental, purposive, jenuh, snowball.
a. Sampling Sistematis

Sampling sistematis adalah teknik pengambilan sampel bedasarkan urutan dari anggota populasi yang
telah diberi nomor urut. Misalnya anggota populasi yang terdiri dari 100 orang. Dari semua anggota itu
diberi nomor urut, yaitu nomor 1 sampai dengan nomor 100. Pengambilan sampel dapat dilakukan
dengan mengambil nomor ganjil saja, genap saja, atau kelipatan dari bilangan tertentu, misalnya
kelipatan dari bilangan lima. Untuk ini maka yang diambil sebagai sampel adalah nomer 1,5,10,15,20
dan seterusnya sampai 100. Lihat gambar 5.5



b. Sampling Kuota
Sampling kuota adalah teknik untuk menentukan sampel dari populasi yang mempunyai cirri-ciri
tertentu sampai jumlah (kuota) yang diinginkan. Sebagai contoh, akan melakukan penelitian tentang
pendapat masyarakat terhadap pelayanan masyarakat dalam urusan ijin mendirikan bangunan (IMB).
Jumlah sampel yang ditentukan 500 orang tersebut, maka penelitian dipandang belum selesai.
Bila pengumpulan data dilakukan secara kelompok yang terdiri atas 5 orang pengumpul data,
maka setiap anggota kelompok harus dapat menghubungi 100 orang anggota sampel, atau 5 orang
tersebut harus dapat mencari data 500 anggota sampel.
c. Sampling Insidental
Sampling incidental adalah teknik penentuan sampel bedasarkan kebetulan, yaitu siapa saja yang
secara kebetulan/ incidental bertemu dengan peneliti dapat digunakan sebagai sampel, bila dipandang

orang yang kebetulan ditemui itu cocok sebagai sumber data.
d. Sampling Purposive
Sampling purposive adalah teknik penentuan sampel dengan pertimbangan tertentu. Misalnya akan
melakukan penelitian pertimbangan tertentu. Misalnya akan melakukan penelitian tentang kualitas
makanan maka sampel sumber datanya adalah orang yang ahli makanan atau penelitian tentang
kondisi politik di suatu daerah, maka sampel sumber datanya adalah orang yang ahli politik. Sampel
ini lebih cocok digunakan untuk penelitian kualitatif atau penelitian-penelitian yang tidak melakukan
generalisasi.
e. Sampling Jenuh
Sampling jenuh adalah teknik penentuan sampel bila semua anggota populasi digunakan sebagai
sampel. Hal ini sering dilakukan bila jumlah populasi relative keci, kurang dari 30 orang, ayau
penelitian yang ingin membuat generalisasi dengan kesalahan yang sangat kecil. Istilah lain sampel
jenuh adalah sensus, dimana semua anggota populasi dijadikan sampel.
f. Snowball Sampling
Snowball sampling adalah teknik penentuan sampel yang mula-mula jumlahnya kecil, kemudian
membesar. Ibarat bola salju yang menggelinding yang lama-lama menjadi besar. Dalam penentuan
sampel, pertama-tama dipilih satu atau dua orang, tapi karena dengan dua orang ini belum merasa
lengkap terhadap data yang diberikan, maka peneliti mencari oranglain yang dipandang lebih tahu dan
dapat melengkapi data yang diberikan oleh dua orang sebelumnya. Begitu seterusnya , sehingga
jumlah sampel semakin banyak. Teknik pengambilan sampel ditunjukkkan pada gambar 3.6 berikut:
Pada penelitian kualitatif banyak menggunakan sampel purposive dan snowball sampling.
Jumlah anggota sample sering dinyatakan dengan ukuran sampel. Jumlah sampel yang diharapkan
100% mewakili populasi adalah sama dengan jumlah anggota populasi itu sendiri.











Jadi bila jumlah populasi 1000 dan hasil penelitian itu akan diberlakukan untuk 1000 orang tersebut
tanpa ada kesalahan, maka jumlah sampel yang diambil sama dengan jumlah populasi tersebut, yaitu
1000 orang. Makin besar jumlah sampel mendekati populasi, maka peluang kesalahan generalisasi
semakin kecil dan sebaliknya makin kecil jumlah sampel menjauhi populasi, maka makin besar
kesalahan generalisasi (diberlakukan umum)
Berapa jumlah anggota sampel yang paling tepat digunakan dalam penelitian? Jawabannya
tergantung pada tingkat keteitian atau kesalahan yang dikehendaki. Tingkat ketelitian/kepercayaan
yang dikehendaki sering tergantung pada sumber dana, waktu dan tenaga yang tersedia. Makin besar
tingkat kesalahan maka akan semakin besar jumlah anggota sampel yang diperlukan sebagai sumber
data.
Berikut ini diberikan tabel penentuan jumlah sampel dari populasi tertentu yang
dikembangkan dari Isaac dan Michael, untuk tingkat kesalahan, 1%, 5%, sdan 10%. Rumus untuk
menghitung ukuran sampel dari populasi yang tidak diketahui jumlahnya adalah sebagai berikut.

s =
2
.N.P.Q
d
2
(N-1) +
2
.P.Q


Dimana :

2
dengan dk=1, taraf kesalahan bisa 1%, 5%, 10%
P=Q=0,5 d=0,05 s= jumlah sampel
Bedasarkan rumus tersebut dapat dihitung jumlah sampel dari populasi mulai dari 10 sampel
dengan 1.000.000. Dari Tabel 3.1 terlihat bahwa, makin besar taraf kesalahan, maka akan semakin
kecil ukuran sampel. Sebagai contoh: untuk populasi 1000, untuk taraf kesalahan 1%, jumlah
sampelnya=399, untuk taraf kesalahan 5% jumlah sampelnya=258, dan untuk taraf kesalahan 10%,
jumlah sampelnya 213. Dari tabel juga terlihat bahwa bila jumlah populasi tak terhingga, maka jumlah
anggota sampelnya untuk kesalahan 1% =664,5%=349 dasn 10%, 272. Untuk jumlah populasi 10
jumlah anggota sampel sebenarnya hanya 9,56 tetapi dibulatkan sehingga menjadi 10.
Cara menentukan ukuran sampel seperti yang dikemukakan di atas didasarkan atas asumsi
bahwa populasi derdistribusi normal. Bila sampel tidak terdistribusi normal, misalnya populasi
homogeny maka cara-cara tersebut tidak perlu dipakai. Misalnya populasinya benda, katakana logam
dimana susunan molekulnya homogeny, maka jumlah sampel yang diperlukan 1% saja sudah bisa
mewakili.
Sebenarnya terdapat berbagai rumus untuk menghitung ukuran sampel, misalnya dari
Cochran, Cohen, dll. Bila keduanya digunakan untuk menghitung ukuran sampel, terdapat sedikit

perbedaan jumlahnya. Lalu yang dipakai yang mana? Sebaiknya yang dipakai adalah jumlah ukuran
sampel yang paling besar.
Selanjutnya pada gambar 3.7 berikut ini diberikan cara menentukan jumlah anggota sampel
dengan menggunakan Nomogram Herry King sperti berikut ini.
Dalam Nomogram Herry King tersebut, jumlah populasi maksimum 2000, dengan taraf
kesalahan yang bervariasi, mulai 0,3% sampai dengan 15% dan factor pengali yang disesuaikan
dengan taraf kesalahan yang ditentukan. Dalam nomogram terlihat untuk confident interval (interval
kepercayaan) 80% faktpor pengalinya=0,780 untuk 85% factor pengalinya=0,785 untuk 99% factor
pengalinya 1,195 dan untuk 99% factor pengalinya=1,573.








































































Contoh:
Misalnya populasi berjumlah 200. Bila dikehendaki kepercayaan sampel terhadap populasi 95% atau
tingkat kesalahan 5%, maka jumlah sampel yang diambil 0,58 x 200x 1,195=19,12 dibulatkan menjadi
19 orang. (Tarik dari angka 200 melewati taraf kesalahan 5 % maka akan ditemukan titik di atas angka
60. Titik itu kurang lebih 58, untuk kesalahan 5% berarti taraf kepercayaan 95% sehingga factor
pengalinya =1,195)
3. Contoh Menentukan Ukuran sampel
Akan dilakukan penelitian untuk mengetahui tanggapan kelompok masyarakat terhadap pelayanan
yang diberikan oleh pemerintah Daerah tertentu. Kelompok masyarakat itu terdiri 1000 orang, yang
dapat dikelompokkan bedasarkan jenjang pendidikan, yaitu lulusan S1 =50, Sarjana Muda=300,
SMK=500, SMP=100, SD=50 (populasi berstrata)
Dengan menggunakan Tabel 3.1 bila jumlah populasi=1000, kesalahan 5% maka jumlah
sampelnya =258. Karena populasi berstrata , maka sampelnya juga berstrata. Stratanya ditentukan
menurut janjang pendidikan. Dengan dmikian masing-masing sampel untuk tingkat pendidikan harus
proporsional sesuai dengan populasi. Bedasarkan perhitungan dengan cara berikut ini jumlah sampel
untuk kelompok S1 =13, Sarjana Muda (SM)=77, SMK=129, SMP=26 dan SD=13
S1 =50/1000 x 258 =12,9 =13
SM =300/1000 x 258 =77,4 =77
SMK =500/1000 x 258 =129 =129
SMP =100/1000 x 258 =25,8 =26
SD =50/1000 x 258 =12,9 =13
Jumlah =258 =258
Jadi jumlah sampelnya =12,9+77,4+129+25,8+12,9=258. Jumlah yang pecahan bisa dibulatkan,

sehingga jumlah samp[el menjadi 13+77+129+26+13=258
Pada perhitungan yang menghasilkan pecahan (terdapat koma) sebaiknya dibulatkan ke atas sehingga
jumlah sampelnya lebih 259. Hal ini lebih aman daripada kurang dari 258. Gambaran jumlah populasi
dan sampel dapat ditunjukkan pada gambar 3.8 berikut:













Roscoe dalam buku Researche Methods For Business (1982: 253) memberikan saran-saran
tentang ukuran sampel untuk penelitian seperti berikut ini.
1. Ukuran sampel yang layak dalam penelitian adalah antara 30 sampai dengan 500
2. Bila sampel dibagi dalam kategori (imisalnya pria, wanita, pegawai negri-swasta dan
lain-lain) maka jumlah anggota sampel setiap kategori minimal 30.
3. Bila dalam penelitian akan elakukan analisis dengan multivaraiate (korelasi atau
regresi ganda misalnya), maka jumlah anggota sampel minimal 10 kali dari jumlah
variable yang diteliti. Misalnya variable penelitiannya ada 5 (independen+dependen),
maka jumlah anggota sampel =10x5=50
4. Untuk penelitian eksperimen yang sederhana, yang menggunakan kelompok
eksperimen dan kelompok control, maka jumlah anggota sampel masing-masing
kelompok antara 10 s/d 20.

4. Cara Mengambil Anggota Sampel
Di bagian depan bab ini telah dikemukakan terdapat dua teknik sampling yaitu probabiliti

sampling dan nonprobabiliti sampling. Probabiliti sampling adalah teknik sampling yang
member peluang sama kepada anggota populasi untuk dipilih menjadi anggota sampel. Cara
demikian sering disebut dengan random sampling atau cara pengambilan sampel secara acak.
Pengambilan sampel secara random/acak dapat dilakukan dengan bilangan random,
computer, maupun sdengan undian. Bila pengambilan dilakukan dengan undian, maka setiap
anggota populasi diberi nomor terlebih dahulu, sesuai dengan jumlah anggota populasi.
Karena teknik pengambilan sampel adalah random, maka setiap anggota populsi mempunyai
peluang sama untuk dipilih menjadi anggota sam[pel. Untuk contoh diatas peluang setiap anggota
populasi =1/1000. Dengan demikian cara pengambilannya bila nomor satu telah diambil, maka
perlu dikembalikan lagi, kalau tidak dikembalikan peluangnya menjadi tidak sama lagi. Misalnya
nomor pertama tidak dikembalikan lagi maka peluang berikutnya menjadi 1: (1000-1)=1/999.
Peluang akan semakin besar bila yang telah diambil tidak dikembalikan. Bila yang telah diambil
keluar lagi, dianggap tidak sah dan dikembalikan lagi.
5. Normalitas Data
a. Kurve Normal
Penggunaan Statistik Parametris, bekerja dengan asumsi bahwa data setiap variable penelitian
yang akan dianalisis membentuk distribusi normal. Bila data tidak normal, maka teknik statistik
parametris tidak dapat digunakan untuk alat analisis. Sebagai gantinya digunakan teknik statistik
lain yuang tidak harus berasumsi bahwa data berdistribusi normal. Teknik statistik itu adalah
Statistik Nonparametris. Untuk itu sebelum peneliti akan menggunakan teknik statistik parametris
sebgai analisisnya, maka peneliti harus membuktikan terlebih dahulu, apakah data yang akan
dianalisis itu berdistribusi normal atau tidak.




III
PENGUMPULAN DATA

4.1 OBSERVASI DAN PARTISIPASI

Untuk waktu yang sangat lama dalam sejarah ilmu antropologi, teknik-teknik observasi dan partisipasi
merupakan teknik tunggal dalam pengumpulan data. Pengumpulan data melalui daftar pertanyaan

malahan dianggap kurang berfaedah.
Dalam vademekum antropologi yang untuk sekian banyak generasi antropolog menjadi sumber utama
untuk mengadakan penelitian lapangan, yaitu Notes dan Queries on Anthropology maka
dikemukakan bahwa data-data untuk any given culture or area material must be collected by (1) direct
and (2) indirect observation. Observasi langsung ditambah dengan immediate interrogation dinilai
sebagai cara yang ideal (halaman 36, 6
th
edition, reprinted 1954). Walaupun untuk antropolog-
antropolog dari generasi tahun 70-an metode observasi dan partisipasi tidak dinilai begitu mutlak lagi
namun metode tersebut tetap sangat penting artinya. Hal itu sebetulnya tidak usah mengherankan kita
sebab pada dasarnya semua penelitian ilmiah berkaitan dengan observasi.

Observasi
Teknik observasi dapat digolongkan menurut teknik observasi yang berstruktur dan yang tidak
berstruktur. Klasifikasi sedemikian juga terkenal dengan istilah lain, seperti observasi formil dan
informil, sedangkan observasi informil juga terkenal dengan nama observasi-partisipasi.
Suatu kemungkinan lain untuk menganalisa masing-masing teknik observasi ialah berdasarkan sifat
interaksi dengan informan/responden! Dengan demikian maka observasi dipersoalkan atas dasar suatu
kontinuum yang memakai dua kutub ekstrem, yaitu observasi-partisipasi di suatu kutub sedangkan
observasi saja (jadi tanpa interaksi apapun juga dengan para responden) pada kutub lain. Diantara
kedua kutub ekstrem terletak peranan-peranan lain yang dapat dimainkan oleh peneliti, yaitu dengan
lebih menitikberatkan observasi daripada partisipasi. Masing-masing teknik akan dibahas sekarang:

1. Teknik observasi-partisipasi
Seperti telah disindirkan oleh istilahnya maka peneliti dapat menerapkan teknik ini memainkan
peranan sebagai partisipan atau peserta dalam suatu kebudayaan. Identitas yang sesungguhnya tidak
diketahui oleh para responden dan informan. Dasar dari teknik tersebut adalah apa yang dinamakan:
role-pretense. Peranan yang dimainkannya bersifat pura-pura, dan semata-mata dengan tujuan untuk
melalui partisipasi dalam kultur tersebut mencari data-data ilmiah yang dibutuhkan. Memainkan
peranan demikian tidak selalu mudah, sebaba ada kemungkinan bahwa seorang peneliti karena
romantika dari peranan dan respons yang baik dari para responden sebegitu mendalam diresapkannya
di dalam suatu kultur sehingga tujuan utama dilupakan.
Ada suatu pandangan populer yang beranggapan bahwa kalau seseorang peneliti telah diterima dalam
suatu masyarakat/kelompok secara akrab dan telah ikut serta dalam semua kegiatan sosial (yang pada
hakekatnya asing baginya) maka seolah-olah peneliti tersebut telah berhasil. Indikasi-indikasi
menunjukkan suatu daya adaptasi yang besar. Hanya kalau peranannya sebagai partisipan selalu

dikendalikannya dalam rangkan peran pengamat (observers role) maka peneliti dapat dikatakan
berhasil. Seorang peneliti dalam rangka menerapkan teknik partisipasi senantiasa harus berusaha untuk
memperoleh suatu imbangan yang tepat antara tuntutan yang berhubunagn dengan dirinya sendiri (self)
dan tuntutan yang berhubungan dengan peranannya yaitu suatu peranan yang dibuat-buatnya
(pretended role). Tuntutan yang menyangkut dirinya sendiri berhubungan dengan kesadaran dirinya
yaitu integritas diri dari peneliti.
Tidak perlu diherankan bahwa dengan berpartisipasi dalam suatu kultur maka adakalanya seorang
peneliti harus ikut serta dalam kegiatan-kegiatan yang masih asing baginya dan bertentangan dengan
norma-norma yang ia anut sebagai peneliti. Bedanya frame of reference dari seorang peneliti dengan
frame of reference dari para partisipan dari suatu kebudayaan menjadi sebab utama dari masalah
tersebut. Sewaktu-waktu seorang peneliti secara emosionil tidak mampu untuk mempermainkan
peranan yang dibuat-buatunya secara tepat karena tuntutan yang berhubungan dengan kesadaran diri.
Akibatnya adalah bahwa peneliti gagal dalam menemukan imbangan yang dibutuhkan. Di lain pihak
ada pula bahwa seorang peneliti memperoleh self-expression dalam peranan yang dimulainya sebagai
peranan yang dibuat-buatnya. Dengan lain kata peneliti yang bersangkutan telah begitu mendalam
melanggar peranan pengamatnya dan begitu meresap nilai dan norma yang berlaku dalam kebudayaan
yang bersangkutan, sehingga secara emosionil ia tidak mampu lagi memainkan peranan sebagai
peneliti.
Orang yang demikian sering kali tidak mampu lagi secara emosionil dan riil untuk melaporkan dan
menganalisa data-data yang diperoleh sebagai hasil partisipasi! Dengan lain kata, telah terjadi suatu
proses yang terkenal dengan nama going native. Bagi seorang peneliti yang merasa diancam oleh
peranan sedemikian cuma tinggal satu kemungkinan, yaitu untuk sementara menjauhkan diri dari
kultur yang bersangkutan dan mencari semacam cooling-off period agar menemukan kembali
imbangan yang tepat di antara peran dan self. Meskipun ada kesukaran yang telah disinyalir itu
berkaitan dengan teknik observasi-partisipasi, namun teknik tersebut untuk mengumpulkan data
tertentu sangatlah penting. Bahkan untuk kejadian tertentu mungkin dapat disifatkan sebagai teknik
tunggal: artinya teknik penelitian lain tidak dipakai untuk mengumpulkan data yang dibutuhkan.
Teknik partisipasi adalah suatu teknik yang sangat kompleks dan selalu membawa masalah yang
berhubungan dengan validity dan reliability. Dengan lain kata seorang peneliti harus senantiasa
bertanya pada dirinya sendiri apakah data yang dikumpulkannya itu dapat disifatkan sebagai indikator
yang tepat bagi gejala-gejala yang dipelajari. Lagipula tuntutan mengenai reliability juga sukar diatasi,
artinya ada kemungkinan yang besar bahwa para peneliti yang memakai teknik partisipasi yang sama
tidak akan memperoleh hasil dan menarik kesimpulan yang sama pula!
Faktor-faktor ini diakibatkan oleh hal-hal seperti:

1. Persepsi selektif dan penilaian selektif oleh peneliti mengenai apa yang diamati
2. Walaupun identitas tidak diketahui oleh para responden maka selalu ada kemungkinan bahwa
hadirnya seorang peneliti di dalam suatu kultur dan partisipasinya dalam tiap-tiap kegiatan sosial
membawa kemungkinan akan timbulnya efek-efek yang semata-mata berkaitan dengan hadirnya
peneliti. Apalagi kalau penelitilah yang secara aktif ikut serta dalam mengarahkan kegiatan
tertentu.
3. Seorang partisipan betapa lama pun berpartisipasi dalam suatu kebudayaan tidak mungkin akan
menyaksikan semua kegiatan dari kebudayaan tersebut. Dengan kata lain masih ada saja aspek-
aspek yang berarti dari suatu gejala yang tidak dapat disaksikannya.

Observasi-partisipasi dan rapport dengan responden
Seorang peneliti harus senantiasa berusaha untuk mempengaruhi image-formation sedemikian rupa
sehingga image dari responden sesuai dengan perananan yang dipakai untuk mengidentifikasikan diri
dengan cara tertentu akan sebaliknya juga diidentifikasikan oleh para responden. Hanya kalau ada
keselarasan di antara masing-masing identifikasi maka baru dapat ditarik kesimpulan bahwa peneliti
telah memainkan peranan secara berhasil. Hal ini berarti bahwa seorang peneliti harus memainkan
pretended role-nya secara meyakinkan!
Apa yang dipersoalkan di atas itu membawa kita kepada masalah yang berhubungan dengan
perbuatan/kelakuan yang konformistis dan nonkonformistis. Perbuatan yang konformistis selalu berarti
bahwa kita di dalam kelakuan dan perbuatan menyesuaikan diri dengan norma-norma tertentu yang
berlaku di dalam suatu masyarakat. Kalau kita mengingat bahwa setiap kultur mengenal norma yang
harus ditaati (musz-normen) dan norma yang memberi beberapa alternatif dalam kelakuan (soll-
normen) maka kesukaran mulai apabila kita harus memilih di antara soll-normen tertentu: pola
kelakuan alternatif yang mana harus dipilih, harus ditentukan oleh kepentingan penelitian.
Seorang peneliti harus menentukan sumber informasi apa yang harus diamankan dan berdasarkan
pilihan ini menentukan pada norma apa ia akan menyesuaikan dirinya. Dengan kata lain, adanya
oportunisme dalam konformisme tergantung pada kemungkinan/kesempatan untuk mengumpulkan
data-data yang dibutuhkan. Hubungan antara responden dengan peneliti yang memungkinkan untuk
mengadakan penelitian/mencari data-data, terkenal dengan nama rapport.
Jelaslah bahwa seorang peneliti senantiasa akan berusaha untuk memperkembangkan rapport yang
baik, atau lebih tepat lagi, berusaha sedemikian rupa sehingga kepentingan penelitian dijamin. Dalam
rangka ini kita mengenal under-rapport dan over-rapport. Kedua bentuk rapport itu dapat
mengakibatkan pembatasan dalam kesempatan penelitian.
Under-rapport berarti bahwa hubungan antara responden dan peneliti adalah sedemikian rupa

sehingga peneliti secara emosionil dan/ atau riil tidak mampu untuk berkomunikasi dengan responden
dan/informan dengan segala akibatnya terhadap data-data penelitian yang dibutuhkan. Kebalikan dari
itu adalah over-rapport yang juga akan membatasi penelitian, sebab over-rapport berarti bahwa
seorang peneliti secara simbolis atau emosionil telah menyesuaikan diri dengan suatu kelompok
tertentu atau karena kelakuan tertentu ia diidentifikasikan dengan kelompok tertentu. Kita harus sadar
bahwa apa yang dibutuhkan adalah rapport yang optimal, sedemikian rupa sehingga peneliti tidak
menutup diri terhadap lingkungan-lingkungan interaksi tertentu. Seorang peneliti Barat yang begitu
ingin menunjukkan suatu bentuk partisipasi berupa makan dengan tangan daripada dengan
sendok/garpu telah menunjukkan kelakuan yang pantas dipakai di dalam lingkungan tertentu dimana
adat makan sedemikian umum berlaku. Tetapi ia akan dicemoohkan kalau kelakuan sedemikian
dipakai di manapun juga tanpa memperhatikan lingkungan interaksi dimana hal sedemikian justru
tidak umum, sebaliknya dapat disifatkan sebagai a-typical.
Sebagai kesimpulan dapat dikemukakan bahwa pengumpulan data merupakan suatu proses yang
kompleks. Dalam rangka teknik observasi-partisipasi maka kedudukan sosial dan kepentingan diri baik
peneliti maupun responden menentukan persepsi dari realitas sosial. Oleh karena kedua-duanya
mempunyai konotasi yang dinamis maka seorang peneliti tiap kali harus merumuskan kembali
kedudukan sosialnya, menyesuaikan peranannya dan karena itu image dari para responden terhadap
peneliti juga senantiasa berubah. Perubahan image juga mengakibatkan perubahan dalam kelakuan
para responden: jadi juga perubahan dalam data yang dikumpulkan.

Gunanya memakai teknik observasi-partisipasi
Kalau kita sekarang menilai teknik observasi-partisipasi sebagai suatu teknik penelitian maka dapat
ditarik kesimpulan bahwa metode yang tidak berstruktur ini adalah begitu kompleks sehingga sukar
dirumuskan dengan tepat. Satu dan lain karena sejumlah proses, seperti perumusan masalah,
pengumpulan data, analisa dari data sedikit banyak terjadi seketika. Lagipula dinamika dari
pendekatan ini mengakibatkan bahwa dengan makin bertambah pengetahuan maka makin berubah
pula perspektif penelitian, artinya masalah tiap kali perlu dirumuskan kembali lagi!
Yang tersebut di atas ini akan menimbulkan pertanyaan apakah tidak lebih tepat untuk memilih
pendekatan yang berstruktur darpada pendekatan yang tidak berstruktur, yaitu observasi-partisipasi.
Jelaslah bahwa sifat dari data yang ingin dikumpulkan akan menentukan teknik penelitian yang akan
dipilih. Hal itu dapat membawa kesukaran kalau masalah yang kita ingin teliti/amati berhubungan
dengan peristiwa-peristiwa yang kejadiannya tidak dapat diramalkan sebelumnya (banjir, gempa bumi
dan sebagainya) atau peristiwa-peristiwa seperti pengeroyokan, perampokan, peristiwa-peristiwa yang
dirahasiakan, misalnya berkumpulnya anggota dari suatu gerombolan, dan sebagainya. Tetapi untuk

kejadian-kejadian yang tertentu maka teknik observasi-partisipasi palinglah tepat dipakai, pada
organisasi sosial yang kompleks yang kompleksitasnya berfungsi sedemikian rupa sehingga gambaran
umum (overall picture) tidak diketahui oleh para anggota. Salah satu contoh klasik dalam hal ini
adalah sistem kula yang dipakai oleh penduduk Trobriand dan dianalisa oleh tokoh antropologi
Malinowsky. Tetapi juga di dalam organisasi sosial yang modern yang kompleksitasnya dapat
mengakibatkan bahwa masing-masing bagian dari organisasi tersebut seolah-olah bekerja sebagai
kesatuan-kesatuan yang bebas sehingga para anggota tidak dapat mengetahui kaitannya dengan sektor
lain dari organisasi yang sama.
Seorang peneliti yang melalui teknik observasi-partisipasi di dalam masing-masing sektor
berkesempatan untuk memperoleh gambaran umum tersebut yang mungkin tidak dapat dihasilkan
melalui teknik lain.
Ada faktor lain yang menuntut pemakaian teknik observasi-partisipasi mengingat bahwa para
responden pada hakekatnya hanya dapat memberikan data berdasarkan suatu proses persepsi yang
ditentukan oleh faktor-faktor emosionil dan kognitif yang bagi setiap responden berbeda-beda. Juga
kebiasaan untuk mengverbalisasi (menjelaskan melalui idiom yang tertentu) pengalamannya dan
kejadiannya dapat menjadi pertimbangan untuk memakai atau mengikutsertakan teknik observasi-
partisipasi.
Apa yang dikemukakan di atas ini mempunyai implikasi bahwa walaupun kejadian dan peristiwa
tertentu dipersepsikan oleh para informan/responden namun mereka secara intelektuil tidak mampu
untuk menjelaskan apa yang telah terjadi! Mereka tidak mengenal konsep-konsep dan idiom yang tepat
untuk berkomunikasi secara berarti dengan peneliti. Faktor lain yang dapat mendorong pemakaian
observasi-partisipasi ialah bahwa selalu ada peristiwa-peristiwa yang ingin dirahasiakan oleh para
responden. Terutama kalau peristiwa sedemikian berhubungan dengan kelakuan dan perbuatan yang
melanggar norma-norma yang dianut oleh para responden. Hal itu terutama terjadi kalau informan
yang bersangkutan mempunyai kepentingan yang berhubungan dengan dirinya sendiri memberi
gambaran idiil mengenai suatu kebudayaan. Sebaliknya observasi-partisipasi juga sangat berarti
dipakai justru dalam hal dimana tidak terjadi gejala-gejala tertentu. Mungkin para informan tidak akan
mempersoalkan hal sedemikian karena menganggapnya biasa, padahal ditinjau dari sudut ilmu
kemasyarakatan hal tersebut sangat berarti untuk diketahui. Observasi-partisipasi dalam hal itu
memberi kemungkinan untuk mensinyalir tidak timbulnya gejala-gejala tertentu di dalam suatu kultur!

2. Teknik observasi saja
Pada teknik ini, interaksi sosial dengan para informan sama sekali tidak terjadi. Observasi sedemikian
dengan mudah dapat mengakibatkan timbulnya ethnocentrism kalau perbuatan dan kelakuan dari para

responden tidak dipahami sesungguhnya. Karena itu bentuk observasi ini hanya dapat dipakai kalau
pengetahuan peneliti mengenai masalah yang ingin diteliti sudah cukup luas.
Pengetahuan sedemikian yang mendalam memberi kesempatan kepada peneliti untuk sebelumnya
merumuskan kategori-kategori yang akan dipakai untuk menganalisa apa yang diobservasikan.
Biasanya peneliti akan memakai sejumlah besar kategori yang kemudian diuji di lapangan dan atas
dasar pengujian tersebut diperkembangkan suatu sitem kategori yang dipakai dalam penelitian yang
lebih lanjut. Penelitian yang pertama dinilai sebagai penelitian pendahuluan saja, semata-mata dengan
tujuan untuk memperkembangkan dan menguji suatu sistem yang terdiri dari kategori-kategori yang
akan dipakai dalam penelitian sesungguhnya. Satu contoh yang terkenal dari cara kerja demikian
diberikan oleh Bales (1950). Bales dalam penelitian pendahuluan memakai lebih dari 50 kategori
untuk mencatat interaksi-interaksi dalam suatu kelompok.
Setelah sekian banyak kategori tersebut diuji, maka Bales telah mampu untuk memperkembangkan
suatu sistem yang terdiri dari 12 kategori saja yang dapat diterapkan secara luas sekali pada sejumlah
besar bentuk-bentuk interaksi dalam suatu kelompok. Sistem Bales terkenal sebagai The Bales
System of Categories for Recording Group Interaction.
Bales mengklasifikasikan kategori-kategori ke dalam 4 kelompok mulai dari yang menunjukkan
solidaritas sampai pada yang menunjukkan permusuhan (antagonism). Sistem kategori dari Bales
dikutip di bawah ini:


Arti yang penting dari Bales Category System ialah bahwa Bales memberi suatu kerangka teoritis dari
deimensi-dimensi dasar dari interaksi dalam kelompok tatap-muka.
Mencatat hasil observasi berdasarkan sistem Bales tidak mudah dan untuk tujuan ini Bales telah
memperkembangkan suatu alat khusus yang terkenal dengan nama Bales and Gerbrands Interaction
Recorder. Pemakai interaction recorder tersebut membutuhkan latihan khusus dan intensif agar
dapat mencapai suatu tingkat reliability yang memuaskan.*
Seperti telah dijelaskan diatas ini di antara kedua teknik yang ekstrem ada lagi dua teknik yang pada
kontinuum yang dipakai terletak antara observasi-partisipasi dan teknik observasi saja.

3. Teknik partisipasi terbatas
Teknik ini banyak sekali dipakai karena tidak menimbulkan masalah-masalah mengenai role-pretense
seperti yang telah dibahas pada teknik partisipasi penuh. Peneliti tidak menyembunyikan identitas
sesungguhnya dan berusaha untuk memperkembangkan rapport yang baik dengan para responden.
Peneliti melalui teknik ini, baik melakukan observasi formil melalui suatu proses wawancara

didasarkan atas daftar-daftar pertanyaan yang telah dipersiapkan (schedules), maupun berpartisipasi
dalam beberapa kegiatan responden. Tetapi masalah yang berhubungan dengan peranan (role) dan diri
(self) juga dapat timbul kalau peneliti dan para informan memperkembangkan suatu persahabatan yang
sangat erat sehingga yang diutamakan lanjutan dari persahabatan tersebut daripada lanjutan dari
masing-masing peranan sebagai peneliti dan informan. Adalah paling tepat kalau hubungan antara
peneliti dan informan diperkembangkan sedemikian rupa sehingga masing-masing interaktor tidak
merasa terikat untuk meluaskan hubungan tersebut di luar suatu hubungan lapangan. Proses interaksi
terkenal sebagai The Interaction of Sociological Strangers (Goerge Simmel).

4. Teknik observasi terbatas
Teknik observasi tersebut didasarkan atas satu kunjungan saja untuk mengadakan wawancara (one-
visit-interviews). Jelaslah bahwa teknik ini hanya mengenal interaksi dengan para informan/responden
secara terbatas sekali dan justru karena itu dapat menimbulkan etnosentrisme. Peneliti melalui tekanik
ini menemukan sejumlah besar responden tanpa ada kemungkinan untuk memperkembangkan rapport
yang baik dan kemungkinan akan timbulnya salah persepsi selalu besar. Bahaya ini berlaku bagi kedua
belah pihak, yaitu para informan/ responden kurang memahami peranan dari peneliti dan sebaliknya
peneliti kurang memahami para responden dengan kemungkinan besar hilangnya imbangan antara
peranan dan diri. Cuma sangatlah mudah pada teknik ini untuk meninggalkan lapangan dengan tujuan
untuk menemukan kembali lagi imbangan yang tepat di antara role dan self.

Responden dan informan
Di atas kita sering mempersoalkan informan dan responden. Dengan sengaja diadakan perbedaan
antara kedua kategori karena jenis data yang diperoleh adalah berbeda-beda.
Kalau kita memakai informan maka dengan sendiri kita mencari data-data yang berhubungan dengan
pihak ketiga. Dengan kata lain kita menginginkan informasi mengenai kejadian atau peristiwa-
peristiwa yang dimiliki oleh informan-informan. Lagipula mengenai semua hal yang melembaga
paling tepat dicari informasi melalui informan. Jelaslah bahwa untuk hal sedemikian tujuan utama
ialah untuk mencari informan yang baik yang betul-betul memiliki pengetahuan yang diharapkan.
Sebaiknya kalau tujuan kita adalah mencari data mengenai variabilitas dalam gejala-gejala, yaitu
perasaan, kebiasaan, sikap, motif, dan persepsi dari responden sendiri maka berdasarkan suatu sampel
kita akan menginterview sejumlah besar responden. Jadi dalam hal ini tujuan utama menjadi
variabilitas dan bukan persamaan yang melembaga.

Perbandingan di antara observasi-partisipasi dan observasi saja

Sifat khas dari observasi-partisipasi ialah untuk memanfaatkan sebaik mungkin hubungan yang telah
diadakan antara peneliti dan para informan dan hal itu dilakukan dengan cara yang berbeda-beda
tergantung pada keadaannya.
Setiap keadaan dieksploitasikan secara optimal semata-mata dengan tujuan untuk memperoleh data-
data. Tetapi sifat khas ini, ialah sifat yang tidak dibakukan, juga merupakan kelemahan dari teknik
tersebut. Satu dan lain hal mengakibatkan bahwa peneliti tidak dapat membandingkan data-data untuk
tujuan statistis. Dengan kata lain kata peneliti tergantung pada suatu penafsiran data yang
impresionistis sifatnya. Kalau kita sadar bahwa ilmu sosial akhirnya harus didasarkan atas
generalisasi-generalisasi yang ketat, maka kelemahan yang disinyalir telah menjadi jelas. Yang biasa
dapat kita lakukan dengan data-data yang dihasilkan dengan teknik yang kemudian harus diuji melalui
teknik yang berstruktur.
Kelemahan lain dari teknik observasi-partisipasi ialah ada kemungkinan besar akan timbul bias justru
karena pemanfaatan hubungan persahabatan di antara peneliti dan para informan. Justru karena
kemungkinan untuk memperkembangkan rapport yang sangat baik maka ada kemungkinan besal
timbul over-rapport, seleksi dalam persepsi; ada kemungkinan pula bahwa frekwensi dalam interaksi
dengan para informan tertentu akan jauh lebih besar daripada informan lain justru karena hubungan
yang intim. Hal itu dapat mengakibatkan bias sebab dengan demikian peneliti agak menutup diri
terhadap sumber-sumber informasi lain yang dapat mengoreksi gambaran yang diberikan oleh
informan yang pertama. Fleksibilitas dari teknik yang tidak berstruktur justru mengandung
kemungkinan besar akan mengakibatkan bias, sedangkan pihak lain fleksibilitas tersebut juga dapat
disifatkan sebagai sesuatu kekuatan, sebab peneliti senantiasa dapat merumuskan sebagai sesuatu
kekuatan, sebab peneliti senantiasa dapat merumuskan kembali masalahnya berdasarkan pengetahuan
yang makin luas. Peneliti melalui metode tidak berstruktur pada hakekatnya senantiasa mengubah
kategori-kategori yang semula dipakai dalam kaitan yang erat dengan pengetahuan yang lebih luas.
Dengan memakai metode yang tidak berstruktur maka peneliti dapat menentukan cara kerja dan
kecepatan kerja sesuai dengan kondisi dan keadaan seperti dialaminya dalam lapangan.
Ia juga jauh lebih mudah dapat menghindarkan diri dari masalah-nasalah yang sensitif dan mengajukan
pertanyaan-pertanyaan yang sensitif! Di bawah ini diberikan diagram mengenai teknik observasi dan
prtisipasi dengan masing-masing sumber bias.


4.2 TEKNIK-TEKNIK PROYEKTIF

Dalam rangka pengumpulan data, maka teknik-teknik tidak langsung (indirect rechniques) juga

memainkan peranan yang berarti sebab sering sekali peneliti gagal untuk memperoleh data melalui
wawancara langsung atau observasi langsung.
Yang dimaksudkan di sini ialah keseganan responden untuk mempersoalkan hal-hal yang emosionil
atau sensitif. Penolakan akan diwawancarai dapat disebabkan oleh alasan yang berbeda-beda yang
berhubungan baik dengan keamanan dan ketentraman maupun dengan jiwa responden sendiri;
responden seringkali juga tidak mampu untuk menjelaskan sikap dan perbuatannya berdasarkan
introspeksi.
Kalau dipakai teknik observasi langsung, selain daripada bias yang timbul karena hadirnya seorang
observer dalam kelompok yang diteliti, ada juga faktor salah persepsi yang memainkan peranan
yang negatif sehingga kesimpulan yang ditarik adalah kurang tepat. Untuk mengatasi hal-hal yang
sedemikian para sosiolog dan antropolog memanfaatkan metode-metode yang semula semata-mata
dipakai oleh ahli psikolog dan psikiater untuk secara tidak langsung membongkar motif-motif dari
kelakuan manusia.
Teknik-teknik proyektif (nama yang dipakai untuk teknik tidak langsung tersebut) tidak bergantung
pada kesediaan manusia untuk mempersoalkan hal-hal yang tertentu karena tujuan dan artinya
disamarkan (disguised).
Metode proyektif juga tidak didasarkan atas instropeksi responden atau persepsi dari peneliti.
Sebaliknya asa responden sendiri yang mempersepsikan stimuli yang tidak berstruktur seperti gambar,
foto, cerita, suatu kata, percikan tinta dan lain-lain.
Karena persepsi adalah suatu proses yang bergantung pada factor-faktor kulturil dan biologis, maka
struktur yang dipersepsikan dalam suatu obyek-obyek (yang tidak berstruktur, artinya poly-
interpretable) dengan sendirinya mencerminkan keadaan batin orang yang bersangkutan.
Sigmund Freud yang pertama yang melalui metode free association mendorong pasiennya untuk
menceritakan apa saja yang ada dalam pikiran/ ingatnnya. Satu dan lain hal, berdasarkan anggapan
freud, bahwa kelakuan manusia terutama didasarkan atas kebutuhan yang tidak disadarkan
(unconscious needs) sedangkan kebutuhan tersebut seringkali dianggap tabu oleh lingkungannya
sehingga orang tersebut menolak untuk mengungkapkannya.
Dengan mendorong pasien-pasiennya untuk menceritakan dirinya tanpa hambatan apapun juga, maka
Freud berusaha untuk membongkar unconscious needs tersebut dan berdasarkan itu mencari jalan
untuk menguasai gangguan mental pasiennya. Berbeda dengan psikolog dan psikiater maka sosiolog
dan antropolog tidak terutama tertarik untuk mempelajari kepribadian seorang manusia, melainkan
melalui teknik proyektif mereka berusaha ubtuk mengetahui sikap dan kelakuan yang berhubungan
dengan kelompok manusia.
Demikian pula teknik-teknik proyektif yang dipakai oleh sosiolog dan antropolog dapat dibagi

kedalam tiga kelompok :
1. teknik-teknik verbal, seperti :
a. Tes asosiasi kata (word association test)
b. Tes melengkapi kalimat (sentence completion test)
c. Pertanyaan-pertanyaan proyektif
2. teknik-teknik visual, seperti:
a. Tes Rorschach
b. Thematic Apperception Test (TAT)
c. Human relation test
3. teknik-teknik theatre, seperti:
a. Sosio drama dan psikodrama
b. Permainan eksperimentil lain

Ad. 1.a.: Tes asosiasi kata (word association test)
Carl Jung adalah sarjana yang bertahun-tahun bekerja sam dengan Sigmund Freud( ia kemudian akan
mengembangkan teori yang berbeda dari Freud tentang kepribadian manusia) yang pada tahun 1918
mengenalkan tes tersebut. Teknik ini mudah sekalai: sejumlah kata dibacakan pada responden,
kemudian ditanya pikiran apa yang diasosiasikan atau dihubungkan dengan kata tersebut. Kata-kata
yang dipilih sedemikian rupa sehingga berkaitan dengan masalah yang akan diteliti. Kecepatan, yaitu
spontanitas, reaksi responden dan isi jawaban dipakai sebagai indicator untuk mengetahui sikap
responden.

Ad. 1.b.: tes melengkapi kalimat (sentence completion test)
Teknik ini banyak dipakai dan terdiri dari sejumlah (suatu set) kalimat yang tidak lengkap. Kemudian
responden dipersilahkan untuk menyelesaikan kalmat tersebut dalam waktu yang terbatas (agar
menjamin spontanitas jawaban). Teknik ini dipakai terutama untuma mempelajari sikap.
Contoh dari suatu sentence completion test adalah sebagai berikut:
1. Saya kagum pada orang indonesia karena ..............................................................
2. Kesukaran dalam pergaulan dengan orang Indonesia ialah ..........
dan sebagainya
Herbert Phillips dalam studi mengenai Thai Peasant Personality (1965) memaka sentence completion
test diantara oarang Bang Chan di Muangthai.
Philips mulai terlebh dahulu dengan mempelajari kejiwaan orang Bang Chan dan berdasarkan
penelitiannya diciptakan 13 kategori yang memainkan perananpenting dalam kehidupan orang

tersebut, antara lain agresi, keberhaslan, hubungan kekekarbatan, pandangan terhadap baik dan buruk,
sikap perhatian terhadap otoritas, asamra, seks, ketakutan, dan lain-lain.
Setelah diadakan pre testing maka Phillips mengajukan tes tersebut kepada suatu stratified sample
yang terdiri dari 1111 orang diatas umur 21 tahun. Dat berupa reaksi dan jawaban orang Bang Chan
kemudian diolah dengan menghitung frekuensinya berdasrkan suatu klasifikasi yang terdiri dari
kategori yang luas.

Ad. 1.c.: Pertanyaan-pertanyaan proyektif
Pertanyaan proyektif terutama dipakai kalau pertanyaan langsung dikira tidak akan menghasilkan
jawaban yang valid. Diusahakan dalam pertanyaan sedemikian agar supaya sebanyak mungkin
melepaskan pertanyaan tersebut dari pribadi responden justru dengan tujuan untuk memancing
jawaban yang valid dan menghindarkan hambatan psikologis dalam jawabannya. Maka dari itu
pertanyaan sedemikian seringkali dihubungkan dengan hal-hal yang imajiner (khayal).
Umpanya : apa yang akan saudara lakukan kalau saudar menarik hadiah utama dai undian harapan?

Ad. 2.a.: Tes Rorschach
Pencipta tes ini adalah Hermann Rorschach, seorang psikiater asal Swiss yang mengembangkan tes ini
setelah PD I meskipun puncak popularitas Rorschach tes baru terjadi pada tahun 40-an.
Tes tersebut terdiri dari 10 gambar dari jenis-jenis percikan tinta yang simetris, yaitu 5 gambar yang
berwarna hitam abu-abu diatas putih dan 5 gambar dengan warna lain. Masing-masing gambar
disuguhkan kepada responden dalam urutan tertentu dan responden kemudian dipersilahkan untuk
menceritakan apa yang tergambar.
Pengolahn data yang diperoleh melalui Rorschach tes ini sulit dan memerlukan keahlian khusus,
system yang dikembangkan Klopfer (1956) paling banyak dipakai. Respon dari responden
mengikutsertakan pertimbangan-pertimbangan yang antara lain berhubungan dengan location,
determinant dan content.
Location berhubungan dengan kenyataan apakah responden memberi reaksi terhadap seluruh percikan
tinta atau hanya terhadap sebagaian saja; determinant mempersoalkan reaksi responden berhubungan
dengan shading dalam gambar atau reaksi yang diberikan dalam rangka bentuk, warna atau gerakan;
content dimaksudkan apakah respon berhubungan dengan manusia, binatang, alam, hal-hal yang
abstrak dan sebagainya.
Tes Rorschach antara lain juga dipakai untuk mempelajari apa yang dinamakan dengan basic
personality structures.
Dalam suatu studi tentang orang Alor, yang dilakukan pada tahun 1938 oleh seorang antropolog

bernama Cora Dubois, mempelajari iwayat hidup dari orang Alor dengan tujuan menganalisa Alorese
personality. Untuk tujuan tersebut, Dubois menggunakan Tes Rorschach sebagai bahan tambahan.
Abraham kardiner adalah psikiater yang kemudian mendeskripsikan basic personality dari orang Alor.
Data-data yang diperoleh melalui Tes Rorschach dianalisa oleh orang lain (Oberholzer) yang tidak
memilki pengetahuan tentang data-data yang berhubungan dengan kebudayaan Alor yang
dikumpulkan Dubois. Ternyata ada suatu penyesuaian yang menarik antara analisa yang didasarkan
atas riwayat-riwayat hidup dan Tes Rorschach yang dipakai.
Tetapi perlu dicatat dalam hal ini data yang dikumpulkan Dubois hanya didasarkan atas riwayat hidup
dari 8 informan, sedangkan data tersebut tidak diolah secara statistis. Maka dari itu, masalah
representativitas perlu diragukan, kecuali apabila kita bertitik tolak dari suatu homogenitas yang amat
besar mengenai cirri-ciri kepribadian orang Alor. Akan tetapi homogenitas sedemikian tidak pernah
dibuktikan.
Faedahnya konsep basic personality structures dan Tes Rorschach yang dipakai untuk mempelajarinya
diragukan sejak penelitian Kaplan (1955) yang mengadakan penelitian antara lain orang Zuni, Navaho,
Mormon, dan Orang Amerika keturunan Spanyol.
Kaplan menemukan perbedaan yang signifikan diantara kekempat kelompok tyersebut yaitu pada 5
kategori dari Tes Rorschach yang dipakai. Berdasrkan suatu analisa statistis maka Kaplan
menyimpulkan bahwa perbedaan diantara responden yang berasal dari kebudayaan yang sama adalah
lkebih besar daripada perbedaan diantara responden yang berasal dari kebudayaan yang berbeda-beda.
Pemakaian Rorschach test pada tahun-tahun terkhir ini menurun terutama karena validity dari tes ini
masih diragukan, lagipula masalah yang dialami dalam pengolahan data cukup rumit. Hal itu nanti
alkan dipersoalkan secara lebih mendalam.

Ad. 2.b.: Thematic Apperception Test (TAT)
Morgan dan Murray untuk pertama kali menggunakan tes ini (yang biasa disingkat dengan huruf TAT)
pada tahun 1935 sebagi metode untuk meneliti khayalan (a method for investigating fantacies).
TAT terdiri dari 20 gambar yang menggambarkan manusia dalam keadaan yang berbeda-beda (seperti
misalnya seorang wanita dan seorang pemuda).
Ke 20 gambar tersebut ditunjukkan satu persatu pada responden dan responden dipersilahkan untuk
menceritakan apa yang dipersepsikan olehnya; artinya apa yang menurut responden telah digambarkan
dan kemudian apa sekiranya berdasarkan khayalannya, akan terjadi kemudian.
Sistem scoring yang dipakai dalam TAT berbeda-beda:
a. Metode scoring yang dipakai dengan tujuan untuk menarik kesimpulan mengenai cirri-ciri
kepribadian seseorang, seperti kelakuaan social, penyesuaian seksual, hubungan emosional

dengan orang tua, keampuan intelektual dan lain-lain (Henry 1947) yang lebih kualitatif
sifatnya.
b. Metode scoring yang kuantitatif sifatnya dikembangkan oleh ahli psikolog sosial.
Dalam suatu studi yang diadakan oleh Adorno et.al mengenai The Authotarian Personality diamping
teknik wawancara juga dikenalkan TAT dengan tujuan menilai kepribadian dari responden yang
masing-masing mendapat skor tinggi dan rendah sebagai hasil wawancara yang bertujuan mengukur
anti semitism dan etnosentrisme.
Dalam membandingkan data-data yang diperleh melalui TAT maka ternyata bahwa responden dengan
yang rendah terhadap kedua masalah tersebut ( artinya yang tidak berprasangka) agak lebih
mengidentifikasikan diri dengan pahlawan-pahlawan dalam ceritanya, menunjukkan sikap yang lebih
rasinal yang didasarkan atas kelakuan yang otonom tanpa banyak dipengaruhi oleh kekuatan ekstern
mensublimasikan agresinya dan tidak mempersepsikan perbedaan besar antara status dari manusia
yang berbeda kulit dan kelamin.




Ad. 2.c.: Human relation test
Tes ini dapat disifatkan sebagai semacam TAT , tes ini terdiri dari 10 gambar yang tidak pasti artinya
sebab dapat ditafsirkan sebagai baik menunjukkan agresi ataupun sebaliknya, yaitu justru tidak
menunjukkan konflik. Apa yang dipersepsikan tergantung pada responden. Responden dipersilahkan
untuk menulis suatu cerita pendek tentang gambar seperti apa yang dilihat dalam gambar, siapa yang
salah, dan bagaiman masalah sekiranya diselesaikan.
Jelaslah bahwa masalah konflik menjadi tema pokok dalam tes ini9. gambar yang dipakai terutama
berhubungan dengan konflik rasial diantara yang berkulit putih dan hitam yang sewaktu-waktu timbul
di Amerika Serikat. Maka dari itu kebanyakn gambar tersebut menunjukkan oarng berkulit hitam dan
putih dalam situasi yang berbeda-beda seperti misalnya pemain bola keranjang dalam mana pemaian
kulit putih berbaring dilamntai dan pemain kulit hitam berbaring diatasnya.

Ad. 3.a.: Sosio drama dan psikodrama
Sosio drama dan psikodrama bertujuan untuk mencari data mengenai sikap responden , responden
dipersilahkan untuk memainkan peran mengenai dirinya sendiri (psychodrama) atau memainkan
peranan dari orang lain (sociodrama).
Peneliti dapat memperoleh pengetahuan yang bertai mengenai sikap responden berdasarkan car

masing-masing peranan dimainkan, terutama kalau responden memainkan peranan dari seseorang (
atau mengenai dirinya sendiri) yang menghadapi kesukaran.

Ad. 3.b.: Permainan eksperimentil lain
Muray Staruss (1968) mengembangkan suatu permainan eksperimental yang bertujuan untuk
mempelajari kelakuan seseorang dalam menyelesaikan suatu masalah (problem solving behaviour).
Teknik tersebut dipakai dalam penelitian yang diadakan di Puerto Rico, India dan Minnesota. Pemain
terdiri dari seorang suami, istri dan anakny yang dilakukan di suatu lapangan kecil berukuran 34
meter.
Digunakan bola-bola dari kayu berwarna yang dilemparkan kepada sasaran kayu yang didirikan pada
pinggiran lapangan tersebut. Pemain harus menaati peraturan permainan, berdasarkan lampu-lampu
merah (salah) dan hijau (benar) yang berfungsi sebagai informational feed back. Dalam semia daerah
penelitian yaitu San Juan, Bombay, dan Minneopolis, ternyata bahwa keluarga kelas menengah
menunjukkan hasil yang lebih besar dalam problem solving yaitu game solving daripada keluarga kelas
sosial bawahan.

Kekuatan dan kelemahan proyektif
Kekuatan dari metode tersebut terutama berhubuingan dengan kemungkinan mempersoalkan emosi,
perasaan dan sikap responden secara tidak langsung. Lagipula satu tes proyektif dapat menghasilkan
data yang jauh lebih luas dan mendalam dari data yang diperoleh melalui teknik langsung (direct
tecniques). Sebaliknya kelemahan dari metode proyektif adalah berhubungan baik dengan pengolahan
data maupun dengan validity dan reability.
Seperti telah menjadi jelas denganh apa yang disebutkan di atas ini, maka pengoalhan data proyektif
cukup sulit, makin banyak waktu, lagipula makin mahal. Seperti juga berlaku bagi data yang diperoleh
melalui wawancara bebbas, maka jawaban harus dianalisa melalui content analysisagar kemudian
dapat diklasifikasikan. Kalau Tes Rorschach dipakai malahan dibutuhkan keahlian khusus untuk
menganalisa data, sedangkan keahlian sedemikian jarang dimiliki antropolog dan sosiolog.
Masalah validity patut disifatkan sebagai problem utamna yang dihadapi oleh peneliti kalau teknik
tidak langsung dipakai. Hal ini justru karena suatu standarisasi untuk mengolah data tidak ada,
disamping kenyataan bahwa data yang dikumpulkan melingkupi aspek yang luas sekali. Tanpa
standarisasi untuk menilai respon secra seragam, maka kemungkinanalah sangat kecil bahwa peneliti
yang berbeda-beda kan mencapai hasil yang sama dalam rangka pengolahan data. Berdasarkan hal itu,
maka realibility menjadi kecil pula, untuk mengatasi hal itu maka data yang diperoleh melalui teknik
proyektif sering dibandingkan dengand data dari suatu nondisguised tes yang mengukur sifat yang

sama.
Sellitz (1971-313) telah membela cara untuk menentukan validity dari nondisguised test yaitu metode
proyektif dengan memakai pedoman data dari suatu nondisguised test:
1 Teknik tidak langsung justru dipakai karena ternyata lebih efektif dalam memperoleh data
daripada teknik langsung. Karena menurut Sellitz adalah tepat kalau data dari suatu
nondisguised test teknik dipakai asal saja nondisguised tes is adminstered test under
circumtances taht make it reasonable to except minimal coencelment of true attitudes. Dan
sebagai contoh ia mengemukakan bahwa adalah keliru memakai sebagai pedoman data dari
suatu tes yang diajukan kepada karyawan oleh majikannya sendiri. Dengan kata lain
anonimitas dari nondisguised test harus dijamin atau rapport diantara peneliti dan subyek
harus sedemikian baik sehingga mereka merasa bebas sekali dalam jawabannya.jika tidak
maka data dari nondisguised test akan menunjukkan bias dengan sendirinya karena itu tidak
layak pakai sebagai pedoman untuk dibandingkan dengan hasil dari teknik proyektif.
2 Tujuan dari suatu nondisguised test mungkin terutamna berhubungan untuk memperoleh
pengetahuan yang lebih luas mengenai sifat dan arti sikap responden. Jadi peneliti ingin
mengetahui seberapa jauh sikap responden berkaitan dengan factor lain. Dengan kata lain
pengetahuan yang lebih luas itu tidak bertujuan untuk memberi suatu penafsiran lain
mengenai how favourable or unfavourable an individual is toward given object.
Suatu pendekatan lain untukmengukur validity hasil yang diperoleh melalui teknik proyektif adalah
dengan mengajukan tes tersebut kepada beberapa kelompok yang diketahui berbeda dalam sikap yang
sedang diukur. Jika tes proyektif membedakan di antara dua kelompok maka hal tersebut dapat
disifatkan sebagai indikasi validitinya. Akhirnya memang patut kalau kita dalam rangka menentukan
validity membandingkan dat-data dari tes prooryektif dengan kelakuan yang nyata dari para subyek.
Suatu contoh dalam kerangka ini diberika Sellitz (1971-298): Hofgrefe, Evans, Chein (nam-nama
peneliti yang bersangkutan) membagikan sejumlah boneka kepada anak-anak kecil. Masing-masing
boneka berwarna hitam dan putih. Semua anak yang berkulit putih diminta untuk memainkan bebrapa
peranan, seprti pergi bersekolah dan lain-lain. Mengikutsertakan atau tidak boneka hitam antara lain
dipakai sebagai suatu indikasi dari sikap anak yang bersangkutan terhadap anak-anak Negro.
Kenyataan ini adalah sesuai dengan jawaban terhadap pertanyaan yang diajukan mengenai pergaulan
dengan anak Negro,. Ternyata 80% dari anak tersebut meberikan respon yang sesuai. Sebaliknya
observasi yang nyata di dalam suatu pusat rekreasi menunjukkan bahwa preferensi untuk memilih
kawan dari sesame klit adalah jauh lebih besar.
Sebagai kesimpulan umum, dapat dikemukakan bahwa mengukur validity dari teknik proyektif
terutama dihambat oleh kesukaran untuk mencari criteria yang objektif.


4.3 WAWANCAR (INTERVIEW)
Mengumpulkan data mengenai sikap dan kelakuan, pengalamn, cita-cita dan harapan manusia seprti
yang dikemukakan oleh responden atas pertanyaan peneliti atau pewawancara adalah dasar teknik
wawancara.
Suatu wawancara dapat disifatkan sebagai suatu proses interaksi dan komunikasi dalam mana sejumlah
variable memainkan peranan penting karena kemungkinan untuk mempengaruhi dan menentukan hasil
wawancara.
Variable yang dimaksudkan antar lain:
1. pewawancara (interviewer)
2. responden (interviewee)
3. daftar pertanyaan atau pedoman pertanyaan (interview guide) yang dipakai
4. rapport antara pewawancara dan responden
kalau untuk tujuan penelitian kita ingin mengetahui sesutau mengenai kehidupan dan kelakuan
manusia, maka salah satu cara yang tepat ialah mengajukan pertanyaan mengenai masalah tersebut
kepada orang yang bersangkutan.
Bagi seorang responden tujuan dari peneliti mungkin tidak memainkan peranan sama sekali dan
motivasi menjawab ataupun menolak pertanyaan adakalanya kompleks sekali. Peranan yang
dimainkan oleh pepewawancara ikut serta dalam menetukan kesediaan responden untuk diwawancarai.
Kalau seorang peneliti memainkan peranan yang sebenarnya yaitu mengaku diri sebagai peneliti dan
untuk tujuan ilmiah meminta bantuan responden untuk diwawancarai, maka untuk memperoleh
persetujuannya sangat tergantung dari frame of reference responden, keadaan setempat dan factor-
faktor lain yang sering kali kompleks. Selalu ada kemungkinan bahwa alas an ilmiah tidak diberi nilai
yang tinggi oleh responden. Ada kemungkinan bahwa responden meragukan alas an ilmiah dari
peneliti dank arena itu menolak kerjasama atau dengan sengaja memberi jawaban palsu.
Dalam hal wawancara memainkan suatu peranan pura-pura dan menyembunikan perananya sebagai
peneliti, maka sampai seberapa jauh responden bersedia untuk bekerja sama tergantung pad aperana
yang dimainkan oleh peneliti di satu pihak dan bagaiman peranan tersebut dipersepsikan oleh
responden pihak lain.
Peneliti dapat memakai bebrapa teknik dalam usahanya mengajak responden untuk bekerja sama. Ia
dapat membujuk dan mencoba meyakinkan responden mengenai tujuan luhur penelitian ilmiah dengan
menambah betapa pentingnya paeranan yang dapat dimainkan responden. Kita juga dapat membayar
responden artinya memberi suatu kompensasi untuk waktu yang disediakan olehnya untuk suatu
wawancara.

Adakalnya ternyata bahwa responden sama sekali tidak perlu didesak untuk diwawancarai., melainkan
merasa kecewa bahkan tersinggung kalau ia tidak diikutsertakan. Alas an gengsi dapat memainkan
peran penting dalm hal itu.
Apa yang dikemukakan di atas ini sangat tergantung pada apa yang dinamakan rapport yang
dikembangkan peneliti dengan responden. Dengan rapport kita maksudkan suatu keadaan psikologis
dalam mana responden telah dapat menerima alas an yang dikemukakan peneliti, memahimi tujuan
peneliti dan bersidia bekerja sama. Dengan kerjasama disini dimaksudkan bahwa reponden telah
bersedia untuk menjawab pertanyaan atau memberi informasi sesuai dengan pandangannya dan
keadaan yang sesungguhnya.
Salah satu hal yang menjadikan proses wawancara sebagi suatu hal yang sensitive adalah kenyataan
baik pewawancara dan responden senantiasa mencoba menafsirkan tujuan dan arti dari pertanyaan
yang diajukan pewawancar di satu pihak dan car pewawancara bereaksi atas jawaban di pihak lain.
Menunujukkan reaksi positif dan reaksi negative dapaty mempengaruhi lanjutan dari wawancar karena
responden mengubah farme of reference-nya berdasarkan atas reaksi yang ditujukan oleh
pewawancara. Apa yang dinamakan dalam bahasa inggris pker faced yaitu tidak menunjukkan emosi
atas jawaban responden adalah kelakuan yang paling tepat untuk menjamin bahwa jawaban itu asli.
Interview situation juga dapat dipengaruhi oleh cara pewawancara berpakaian, oleh bahasa atau logat
dan oleh perhiasan yang dipakai. Faktor- faktor sedemikian dapat membesarkan jarak social responden
dan pewawancara dengan segala akibat terhadap jalannya proses wawancara. Ada beberapa tipe
wawancar yang dipakai, tetapi lepas dari tipe yang akan dipakai satu wawancara selalu harus
disifatkan sebagai purposive conversation dengat catatan bahawa tujuan wawancara serti ditentukan
oleh masalah adalah mencari data informasi dari responden.
Dalam hal ini perlu ditegaskan bahwa rapport yang baik antara responden dan pewawancara hanya
merupakan alat dalam rangka memperoleh dat-data atau dengan kata lain hanya ada artinya kalau ada
rapportsedemikian menghasilkan data yang baik.
Dalam rangka wawancara bebas kita sewaktu-waktu mengadakan probing yaitu mengajukan
pertanyaan lebih dalam kalau ternyata bahwa pertanyaan tidak dipahami oleh respnden atau kalau
jawaban kurang jelas.
Probe questions sedemikian sekali perlu untuk responden yang menunjukkan emosi besar atau kalau
responden tidak ingin menjawab pertanyaan kita tetapi sebaliknya hanya memberikan jawaban yang
berhubungan dengan pertanyaan tapi tidak atas pertanyaan kita. Sewaktu-waktu perlu untuk
mengurangi rapport yang baik melalui antagonistic probes yaitu suatu penunjukkan secara halus
bahwa jawaban yang diberikan oleh responden tidak konsisten dan menunjukkan di antara jawaban.
Pada hakekatnya pewawancara selalu akan menjaga mempertahankan rapport yang baik tetapi sekali

lagi harus dikemukakan rapport yang baik bukan tujuan wawancara. Tujuan dari wawancara adalah
memperoleh data.
Antagonistic probes hanya boleh dipakai secara sadar kalau keadaan menututnya dan sekali-kali tidak
karena pewawancara merasa tersinggung atau capai.
Kita dapat membedakan antara sejumlah tiga wawancara. Kalau kita memakai sebagai pedomen para
responden maka kita dapat mengadakan perbedaan antara:
1. pemimpin formil dan informil
2. informankunci
3. responden pada umumnya untuk memperoleh data mengenai suatu populasi berdasarkan sikap
dan pandangan satuan populasi.

Ad. 1:
Seringkali ternyata bahwa pemimpin formil berkuasa karena kekuasaannya dapat mempengaruhi
penelitian. Mereka bahkan dapat juga menolak mengadakan suatu penelitian. Mewawancara pemimpin
formil yang demikaian ternyata bertujuan untuk mempengaruhi mereka sedemikian rupa sehingga
kerjasama mereka terjamin. Sewaktu-waktu peranan yang dimainkan oleh pewawancara lebih pasif
karena yang terutama mengajukan pertanyaan adalah pemimpin formilnya.
Alasan yang sama berlaku pula bagi pemimpin informil, Cuma dengan perbedaan gensi dan pengaruh
pemimpin informal terhadap responden pada umumnya sangat menentukan berhasilnya suatu
penelitian.

Ad. 2:
Didalam setipa kebudayaan kita sewaktu-waktu kita akan berjumapa dengan seorang responden yang
pengetahuannya lebih luas mengenai masalah yang diteliti daripada responden lain. Mengikutsertakan
mereka dalam suatu wawancara adalah perlu baik untuk memperoelh suatu informasi yang lebih dalam
yang tidak diketahui oleh orang lain maupun untuk memeproleh perspektif yang tepat mengenai
kejadian itu. Sewaktu-waktu informan kunci adalah oarang yang marginal yang untuk sebagian besar
telah meresap nilai dan norma budaya yang masih asing dalam kebudayaan yang diteliti. Mengadakan
checking terhadap data yang diberikan oleh mereka senantisa perlu justru karena mereka sewaktu-
waktu memberi gambaran yang berlebihan.


Ad.3:
Kelompok responden pada umumnya seperti dimaksudkan di atas adalah sumber utama dalam ilmu

sosial, yaitu manusia yang mempersoalkan sikap dan pandangan, pengalaman dan hasrat mengenai
dirinya sendiri.
Di bawah ini kita akan membahas metode wawancara dan mengadakan perbedaan anatara struktur dari
pertanyaan (stimuli)dan struktur dari jawaban (responses). Kita akan membagi pertanyaan dalam
pertanyaan yang berstruktur dan pertanyaan yang tidak berstruktur (open-ended). Lagipula kita akan
membagi jawaban ke dalam jawaban lisan dan jawaban tertulis, sedangkan setiap tipe jawaban dapat
dibagi lagi ke dalam open-ended responses (jawaban terbuka) dan structured/precoded responses yaitu
jawaban berstruktur.
Dengan demikian kita memperoleh suatu diagram sebagai berikut:

TIPE WAWANCARA
Stimuli (pertanyaan)
Responses (jawaban)
Lisan (Oral) Tertulis (written)
Tidak berstruktur (unstructured)

Berstruktur ( structured)
Terbuka (open-ended)


Berstruktur ( structured/ pre-
coded)
Terbuka (open-ended)


Berstruktur ( structured/ pre-
coded)

Kalau kita mempersoalkan oral versus written responses yaitu jawaban responden yang diperoleh
secara lisan atau secara tertulis, maka kita harus mengaitkan kedua tipe jawaban dengan tipe-tipe
pertanyaan yang serupa yaitu kita akan membandingkan oral stimulioral responses, yaitu
pertanyaan lisanjawaban lisan di satu pihak dengan written stimuliwritten responses, yaitu
pertanyaan tertulisjawaban tertulis di lain pihak.
Dengan written stimuli dan responses kita maksudkan suatu daftar pertanyaan berupa suatu
kwestioner, yaitu suatu daftar pertanyaan yang dibaca oleh responden dan kemudian tanpa pertolongan
seorang pewawancara pertanyaan-pertanyaan dijawab secara tertulis di dalam daftar pertanyaan
tersebut.
Written stimuliwritten responses dapat dibagi lagi dalam structured dan unstructured stimuli dan
responses. (Juga terkenal dengan istilah closed dan open questions dan answers).
Suatu closed questioned selalu mengandung closed answer, atau dengan lain kata: pertanyaan yang
berstruktur dengan sendirinya juga menghasilkan jawaban yang berstruktur. Satu contoh yang tepat
mengenai suatu pertanyaan berstruktur yaitu suatu closed question adalah pemilihan umum yang
diadakan pada bulan Mei tahun 1977. Dalam pemilihan umum tersebut pada hakekatnya ditanya untuk

memilih salah satu dari tiga alternative, yaitu PPP, Golkar, atau PDI. Dengan lain kata jawaban telah
ditentukan oleh pertanyaan.
Dalam tipe pertanyaan/ jawaban sedemikian pikiran responden diberi struktur oleh pewawancara
melalui daftar pertanyaan yang dipakai.
Satu contoh dari suatu pertanyaan yang tidak berstruktur adalah suatu pertanyaan sebagai berikut:
Merk sepeda apa yang Saudara sukai? Dalam pertanyaan sedemikian pikiran dari responden tidak
diberi struktur sama sekali dan dia dapat memilih salah satu jawaban dari semua kemungkinan yang
dihafalkan.
Tentu ada kemungkinan untuk mengajukan suatu pertanyaan terbuka (unstructured question) melalui
suatu daftar pertanyaan yang kemudian diikuti oleh suatu jawaban yang telah distruktur (pre-coded)
dalam daftar pertanyaannya.

Masalah oral stimulioral responses dibandingkan dengan written stimuliwritten responses.
Kalau seorang pewawancara memakai suatu daftar pertanyaan dengan catatan bahwa pertanyaan-
pertanyaan yang diajukan oleh pewawancara secara lisan dan kemudian jawaban lisan dari responden
ditulis dalam daftar pertanyaannya oleh pewawancara pula maka kita memakai suatu schedule. Suatu
schedule juga dapat dibagi dalam open questionsopen answers yaitu pertanyaan dan jawaban tidak
berstruktur atau terbuka di satu pihak, dan suatu schedule yang terdiri dari pertanyaan yang berstruktur
(structured questions) yang diikuti oleh jawaban berstruktur (pre-coded/closed answers).
Perbedaan pokok dengan tipe wawancara yang dilakukan melalui suatu kwestioner yang dibaca dan
diisi tanpa pertolongan pewawancara adalah hadirnya pewawancara.
Di samping tipe wawancara berupa oral stimulioral responses melalui suatu schedule ada tipe
wawancara lain lagi yang juga dikelompokkan dalam kategori oral stimulioral responses yang tidak
berstruktur, yaitu yang biasa disebut sebagai free interview (wawancara bebas). Pewawancara yang
memakai tipe ini biasanya hanya dibimbing oleh suatu interview guide yang hanya mengandung
catatan-catatan dari masalah-masalah pokok yang ingin dipersoalkan olehnya.
Sekarang kita membandingkan oral versus written responses atau dengan lain kata wawancara bebas
melalui suatu schedule di satu pihak dan wawancara melalui suatu kwestioner di pihak lain.
Kekuatan besar dari jawaban lisan melalui suatu schedule atau free interview adalah fleksibilitas.
Pewawancara melalui pendekatan ini dapat menguji apakah responden betul-betul memahami
pertanyaannya. Kesempatan demikian tentu tidak ada melalui suatu kwestioner, sebab pewawancara
tidak hadir!
Lagipula adalah sangat sukar untuk memperkembangkan rapport melalui pendekatan written stimuli
written responses, berbeda dengan pertanyaan dan jawaban yang diajukan secara lisan!

Sebaliknya kelemahan dari pendekatan yang terakhir ini oral stimulioral responses adalah
kemungkinan bahwa pewawancara mempengaruhi keadaan wawancara (interview situation). Justru di
sini mungkin akan timbul bias, umpamanya karena pewawancara (secara sadar atau tidak)
menunjukkan perasaannya atau pendapatnya mengenai jawaban dari responden. Bias juga dapat timbul
dalam cara pewawancara mengajukan suatu pertanyaan. Juga cara pewawancara menghadapi seorang
responden dengan pakaian tertentu, logat tertentu dan dengan menunjukkan kekayaan melalui
perhiasan-perhiasan dapat menimbulkan jarak sosial antara kedua belah pihak dengan segala
konsekwensinya. Pokoknya kehadiran seorang pewawancara di dalam suatu interview situation dapat
mengakibatkan bias.
Ditinjau dari sudut pembiayaan maka pendekatan melalui kwestioner jauh lebih murah; seorang
pewawancara harus dilatih, dibiayai, harus dibayar ongkos perjalanannya sedangkan wawancara-
wawancara lisan selalu memakan banyak waktu. Di pihak lain tidak dapat dipungkiri bahwa
wawancara lisan dapat menghasilkan data-data yang luas dan spontan. Hal sedemikian tidak dapat
diharapkan melalui pendekatan kwestioner. Melalui suatu kwestioner kita tidak dapatmendekati
responden yang berpendidikan rendah atau dengan IQ yang rendah, sebab kita tidak ada kesempatan
untuk menjelaskan pertanyaan lebih lanjut atau untuk mengadakan probing.
Spontanitas dari jawaban biasanya tidak diperoleh melalui suatu kwestioner sebab biasanya responden
yang bersangkutan akan membaca semua pertanyaan ebih dahulu dan dengan demikian kita tidak
dapat mengontrol urutan dan penertiban pertanyaan. Akibatnya adalah bahwa dalam suatu kwestioner
responden sering mengubah jawaban yang telah diberikan sebelumnya.
Kelemahan utama dari kwestioner adalah factor non-response.
Kalau responden tidak merasa tertarik pada masalah yang dipersoalkan maka non-response sewaktu-
waktu dapat mencapai prosentase sampai 50% atau lebih, sedang menurut pengalaman bagi mereka
yang tertarik pada masalah jarang sekali dapat diharapkan responses (jawaban) lebih dari 80%.
Jelaslah bahwa dengan tingginya prosentase non-response maka jumlah satuan sample berkurang;
akan tetapi hal itu tidak menjadi masalah pokok sebab kesukaran ini dapat dengan mudah diatasi
dengan bertambah besarnya jumlah kwestioner yang disampaikan kepada responden. Yang menjadi
kesukaran di sini ialah bias atau dengan lain kata: kita tidak mengetahui termasuk kategori-kategori
apa responden yang tidak mengembalikan kwestionernya sebab non-responses tidak disifatkan sebagai
suatu random proses.
Problema ini sukar diatasi. Kita hanya dapat mencoba untuk mengurangi non-responses dengan
mengirimkan surat kepada responden, mengingatkan mengenai kwestioner yang telah dikirimkan dan
secara halus mendesaknya untuk menjawab!
Oleh ahli survai (yang justru memakai kwestioner) dikemukakan bahwa untuk mempelajari responses

bias maka perlu dicatat tanggal pengembalian setiap kwestioner, karena dalam studi empiris
dinyatakan bahwa responden yang mengembalikan kwestionernya agak lambat akan sama dengan
sifatnya dengan kelompok non-response.
Setelah arti dan sifat dari bias dapat ditentukan maka ada kemungkinan pula untuk sedikit mengatasi
masalah tersebut.
Sekarang kita akan membandingkan kedua pendekatan secara sistematis.
1. Standardisasi versus fleksibilitas
Jelaslah bahwa sebuah kwestioner kalau disifatkan sebagai suatu stimulus yang tetap dan konstan,
yaitu yang tidak berubah, maka teknik kwestioner menguntungkan, terutama kalau sampel adalah
homogen. Sebaliknya kalau sampel adalah kurang homogen maka kemungkinan untuk
menterjemahkan dan menjelaskan pertanyaan tidak ada, lagipula untuk menyesuaikan
pertanyaan dengan frame of reference dari responden tidak dapat dipergunakan kwestioner.
Fleksibilitas sedemikian dapat tercapai melalui pertanyaan/jawaban lisan.

2. Universalitas
Suatu kwestioner memerlukan suatu pengetahuan verbal, suatu latihan dan pendidikan, berhubung
dengan itu teknik kwestioner hanya dapat dipakai di dalam suatu negara tertentu dan pada suatu
lapisan sosial yang tertentu.

3. Mengendalikan interview situation
Dalam rangka teknik oral stimulioral responses maka pewawancara dapat memperhatikan (dan
menjaga) bahwa responden tidak dipengaruhi oleh orang lain dan ia juga dapat mengawasi apakah
ia menyelesaikan wawancara secara serius. Jaminan sedemikian tidak ada pada kwestioner. Justru
karena pewawancara tidak hadir, maka responden dapat menyalahgunakan kwestionernya dengan
memberi jawaban yang seenak saja atau dengan sengaja memberi jawaban palsu yang tidak
mencerminkan keadaan, pandangan atau sikapnya.
Di pihak lain kelemahan dari teknik oral stimulioral responses ialah interviewer bias.

4. Penilaian jawaban dalam konteks
Pada suatu kwestioner seorang responden berkesempatan untuk menilai semua pertanyaan secara
sadar, dengan kata lain, secara tidak spontan! Hal itu mengakibatkan bahwa kwestioner hampir
tidak mengijinkan untuk memperoleh suatu reaksi terhadap stimuli dalam konteksnya.
Kebalikannya terjadi dalam suatu wawancara yang lisan, sebab pertanyaan diajukan satu per satu
dan demikian pula kita memperoleh jawabannya. Ini berarti bahwa responden tidak mengetahui

apa yang menjadi pertanyaan yang berikut dan karena itu responden selalu mengubah frame of
reference-nya terhantung pada pertanyaan yang diajukan! Artinya kita dapat reaksi atas stimuli
(pertanyaan) dalam konteksnya!

5. Sifat asli versus buatan
Terutama pada lapisan sosial tertentu dan pada kebudayaan yang tertentu dalam mana komunikasi
verbal memainkan peranan yang penting, maka pendekatan lisan sudah pasti dinilai sebagai lebih
asli daripada pendekatan tertulis! Meskipun demikian kedua pendekatan pada hakekatnya adalah
tidak asli, karena responden dipersilakan untuk mempersoalkan pandangan, sikap dan kelakuan,
yang belum tentu sesuai dengan kenyataan!

6. Pembiayaan
Jelaslah bahwa kwestioner jauh lebih murah daripada wawancara secara lisan. Lain daripada
faktor membiayai para pewawancara maka juga harus dikeluarkan uang untuk perjalanan,
tambahan pula wawancara lisan juga memakan banyak waktu. Dengan teknik written stimuli
written responses ada kemungkinan besar bahwa semua responden dapat dicapai pada waktu yang
sama.

7. Kepercayaan (reliability) dan validity
Reliability berhubungan dengan konsistensi, yaitu apakah dengan memakai teknik yang sama
untuk kedua kali kita juga akan mencapai hasil (data) yang sama.
Dengan validity dimaksudkan apakah alat pengukur (yaitu pertanyaan/stimuli) betul mengukur
apa yang hendak diukur.
Validity dan reliability sangat berkaitan. Tingginya reliability akan menentukan batas-batas
validity. Kalau ternyata bahwa suatu ukuran (pertanyaan) mempunyai validity yang tinggi maka
pertanyaan juga adalah reliable.
Kalau ternyata bahwa suatu pertanyaan sangat reliable tentu timbul pertanyaan bagaimana kita
dapat mengetahui validity-nya. Hal itu sangat tergantung pada kriterium/pedoman yang kita pakai;
yang dimaksudkan yaitu suatu ukuran yang bebas (independent) dari variabel, berdasarkan apa
kita dapat membandingkan hasil dari kwestioner yang kita pakai. Kalau suatu kwestioner yang
bertujuan mengukur sikap responden terhadap kaum nazi, yang kemudian diterapkan pada
anggota/ simpatisan suatu perhimpunan Nazi di Jerman dan orang Yahudi yang sangat anti Nazi,
dan kemudian tidak menunjukkan perbedaan dalam sikap tentang Nazisme, maka jelas bahwa
validity tidak tercapai. Demikian pula kalau suatu tes mengenai IQ tidak dapat membedakan

antara mahasiswa-mahasiswa dari sebuah universitas dan pasien-pasien yang secara mental
terbelakang (debil) maka validity juga tidak tercapai! Selalu menjadi masalah untuk menemukan
pedoman yang tepat sebab kebanyakan pedoman yang (dikira dapat) dipakai, pada hakekatnya
juga kurang reliable dan sering mempunyai validity yang rendah, umpamanya penilaian dari
seorang guru.
Demikian pula kalau kita mempersoalkan masalah reliability dan validity dalam kaitan dengan apa
yang dinamakan pertanyaan-pertanyaan faktuil di satu pihak, dan dengan pertanyaan yang
berhubungan dengan pandangan dan sikapdi pihak lain. Dengan pertanyaan faktuil (hard facts)
dimaksudkan pertanyaan yang berhubungan dengan agama, kelamin, status perkawinan, upah,
pekerjaan, umur, jumlah buruh yang bekerja pada suatu perusahaan, jumlah guru dan murid yang
ada di salah satu sekolah, dan sebagainya. Pertanyaan demikian pada hakekatnya dapat dijawab
dengan tepat atau jawaban yang tepat dapat dicari asal saja kita bersedia meluangkan waktu yang
cukup.
Untuk memperoleh reliability dalam rangka pertanyaan-pertanyaan faktuil sebaiknya kita
memakai sejumlah internal Checks. Tentu kita akan menghindarkan diri dari mengajukan
pertanyaan yang sama dengan cara yang sama berkali-kali, sebab hal itu pasti akan menyinggung
responden. Dengan mengubah rumusan pertanyaan maka secara halus kita dapat mangajukan
pertanyaan yang mempersoalkan sifat yang sama dalam daftar pertanyaan yang dipakai.
Umpamanya pada permulaan wawancara kita dapat mengajukan pertanyaan seperti, berapa kali
dalam waktu seminggu Saudara menonton televisi? Sedangkan lebih jauh dalam wawancara kita
dapat mengajukan pertanyaan kepada responden mengenai sejumlah jenis hiburan yang dinikmati
dalam minggu terakhir ini, seperti sepak bola, menonton film, televisi, pacuan kuda dan
sebagainya diikuti oleh pertanyaan yang berhubungan dengan frekwensi.
Internal checks seringkali dapat didasarkan atas akal sehat saja. Seorang responden yang
mengakui secara aktif ikut serta dalam perang gerilya tentu harus memenuhi syarat tertentu
mengenai umur.
Untuk menentukan validity dari pertanyaan faktuil dipakai sejumlah teknik yang dinamakan
cross-checks. Cross-checks sedemikian membutuhkan sumber informasi lain yang tidak selalu
tersedia: data-data dari responden di-check berdasarkan data yang diperoleh dari sumber lain
seperti umapama angka prosentase absen dalam pekerjaan, data yang ada mengenai dinas
militernya, data mengenai kesehatan dan status perkawinan. Memakai lebih dari satu informan
mengenai hal ihwal yang sama seringkali membawa masalah apabila keterangan yang diperoleh
bertentangan. Kita tidak tahu informasi mana yang benar.
Sewaktu-waktu jawaban dari responden perlu juga dikontrol berdasarkan observasi. Jelaslah

bahwa jaminan yang paling tepat adalah rapport yang baik yang mengakibatkan bahwa responden
bersedia untuk kerjasama dengan peneliti dan memberi informasi yang tepat.
Sampai sekarang kita hanya mempersoalkan validity yang berhubungan dengan pertanyaan yang
mempersoalkan kelakuan pada waktu lampau atau sekarang, artinya data-data yang diberikan oleh
responden diuji atas validity-nya melalui suatu perbandingan mengenai apa yang sungguh terjadi.
Akan tetapi beberapa wawancara bertujuan untuk mancari informasi mengenai kelakuan
responden pada masa yang akan datang, seperti umpamanya pertanyaan yang diajukan dalam
rangka election polls (survai yang bertujuan meramalkan hasil pemilihan umum yang akan
datang).
Jelaslah bahwa pedoman mengenai validity yang dipakai dalam hal ini adalah suatu kejadian pada
masa depan. Hal ini menunjukkan bahwa validity mempunyai beberapa aspek. Umpamanya suatu
survai deskriptif yang mempersoalkan aliran politik dari para responden sebelum pemilihan umum
mungkin dapat disifatkan sebagai valid dalam arti deskriptif sebab memberi gambaran yang tepat
mengenai aliran politik dari responden pada waktu survai diadakan.
Di lain pihak survai tersebut dapat menunjukkan validity yang sangat rendah sebagai ramalan bagi
hasil pemilihan umum pada hari depan. Sikap responden mungkin dapat dipengaruhi oleh
kampanye politik, oleh kekerasan. Bahkan oleh cuaca yang buruk yang mengakibatkan bahwa
banyak pemilih tinggal di rumah dan tidak memilih, dan seterusnya! Kesimpulan adalah bahwa
suatu deskripsi yang diberikan melalui suatu wawancara mengenai suatu keadaan sekarang
mungkin mempunyai validity yang besar, sedangkan untuk meramalkan perbuatan manusia pada
hari depan nilai validity adalah rendah. Gambaran menjadi lain lagi kalau kita mempersoalkan
realibility dan validity terhadap pertanyaan yang mempersoalkan sikap dan pandangan manusia.
Bagi tujuan yang terakhir ini biasanya kita memakai skala-skala sikap atau sejumlah (suatu set)
pertanyaan! Suatu set pertanyaan biasanya lebih reliable daripada apa yang dinamakan single
opinion items. Hasilnya adalah lebih konsisten. Pandangan itu didasarkan atas asumsi bahwa
suatu sikap (attitude) adalah sesuatu yang kompleks. Sudak masuk akal bahwa justru karena
kompleksitas maka pertanyaan tunggal tidak mungkin akan mencerminkan dengan tepat suatu
sikap. Dengan lain kata apa yang dinamakan suatu single attitude question mempunyai reliability
yang rendah.
Dengan memakai sejumlah (suatu set) pertanyaan yang semua berhubungan dengan sikap yang
sama maka dengan sendirinya kita memperkokoh unsur-unsur yang stabil di dalam suatu sikap
dengan kemungkina mengakibatkan data mengenai sikap yang relatif dapat dipercaya (reliable).
Di dalam ilmu sosial juga dicoba untuk menguji reliability dari data mengenai sikap responden
melalui cross checking. Hal itu berarti bahwa data demikian harus konsisten dengan data lain yang

dipakai sebagai pedoman akan mengherankan apabila seorang majikan yang menunjukkan sikap
sangat rasialis akan menerima sebagai pegawai dan pembantu utama anggota-anggota dari suku-
suku yang dibenci. Internal check sedemikian sering dipakai, akan tetapi kita harus hati-hati dalam
menarik kesimpulan mengenai reliability dari pertanyaan sebab kelakuan dan sikap manusia
memang sering tidak konsisten. Kesukaran umum yang dihadapi dalam rangka menentukan
validity dari pertanyaan yang mempersoalkan sikap berhubungan dengan tidak adanya kriteria
yang tepat. Apa yang kita butuhkan ialah criterion groups yaitu suatu kelompok manusia yang
menunjukkan sikap yang diketahui. Melalui criterion groups tersebut kita dapat menguji apakah
pertanyaan kita dapat membedakan atau tidak diantara orang yang menunjukkan sikap demikian
atau tidak. Sewaktu-waktu kelompok demikian dapat dipakai, akan tetapi kita harus sangat
waspada dalam hal ini karena seorang individu mempunyai alasan yang berbeda-beda untuk
menjadi anggota dari suatu kelompok. Hubungan diantara sikap (attitudes) dan kelakuan
(behavior) adalah kompleks, dan menjadi warga dari suatu kelompok belum tentu dapat dinilai
sebagai pedoman yang valid untuk suatu sikap yang tertentu.

TEKNIK SKALA
Dalam ilmu sosial kesatuan-kesatuan analisa dapat dibagikan berdasarkan kualitas dan intensitas.
Pembagian yang didasarkan atas intensitas berhubungan dengan tehnik-tehnik skala yang akan
dipersoalkan di bawah ini.
Kalau kita mempersoalkan intensitas maka jelaslah bahwa kita membutuhkan suatu pedoman
untuk mengukur intensitas tersebut, dan hal itu membawa kita kepada masalah penilaian. Variabel
yang diukur harus mempunyai lebih dari satu nilai, jika tidak, maka tidak ada sesuatu yang dapat
diukur/dinilai.
Biasanya kalau kita memberi pendapat/pandangan mengenai suatu hal, maka berdasarkan suatu
prinsip/ norma kita dapat memberi penilaian positif, negatif, atau kita ragu-ragu, yaitu kita merasa
tidak mampu untuk memilih antara kedua nilai pertama (+ atau -).
Kalau pada mahasiswa Universitas Indonesia diminta pendapat mengenai keluarga berencana,
misalnya, maka dapat dipastikan bahwa paling sedikit mereka akan memberi tiga jenis penilaian:
(+ 0 -).
- Kelompok mahasiswa yang menyokong keluarga berencana,
- Kelompok mahasiswa yang tidak ada pendapat mengenai keluarga berencana,
- Kelompok mahasiswa yang menolak keluarga berencana











IV
BAB I
PENDAHULUAN

Distribusi normal bersama dengan distribusi binomial, distribusi multinomial, distribusi
poisson, distribusi hipergeometris, dan distribusi pascal disusun berdasarkan teori peluang. Oleh
karena itu, pengetahuan tentang distribusi teoritis peluang menjadi sangat penting untuk membuat
esstimasi atau meramalkan variasi-variasi yang mungkin dapat timbul pada suatu keadaan yang tidak
pasti. Di bidang kesehatan, distribusi frekuensi teoritis dapat digunakan untuk menyusun perencanaan
program pelayanan kesehatan di masa yang akan datang dan meramalkan tentang masalah kesehatan
yang mungkin terjadi di masa yang akan datang.
Distribusi normal termasuk dalam distribusi probabilitas kontinu, sementara distribusi lainnya
yang disebutkan di atas termasuk dalam distribusi probabilitas diskret.
Distribusi normal pertama kali diperkenalkan pada abad ke-19. Saat itu para ahli matematika
dihadapkan pada suatu tantangan mengenai fenomena yang dikenal dengan variabilitas pengamat atau
variabilitas interna yang artinya bila seorang mengadakan pengukuran berulang-ulang maka hasilnya
akan berbeda-beda.
Yang menjadi pertanyaan adalah nilai manakah yang dianggap paling tepat dari semua hasil
pengukuran tersebut. Berdasarkan kesepakatan maka nilai rata-rata dianggap paling tepat dan semua
penyimpangan dari rata-rata dianggap suatu kesalahan atau error.
Distribusi normal ini mula-mula diuraikan oleh Abraham de Moivre dan dipopulerkan
penggunaannya oleh Carl Fredreich Gauss dengan percobaannya. Oleh karena itu, distribusi ini lebih
dikenal dengan distribusi Gauss.
Gauss mengamati hasil dari percobaan yang dilakukan berulang-ulang dan menemukan bahwa
nilai rata-rata merupakan hasil yang paling sering. Penyimpangan ke kiri maupun ke kanan yang
makin jauh dari nilai rata-rata makin sedikit terjadi dan bila semua hasil ini disusun maka akan

terbentuk distribsui yang simetris.

BAB II
TINJAUAN PUSTAKA
Distribusi normal atau sering disebut juga distribusi Gauss merupakan distribusi data kuantitatif
kontinu atau variable X yang tersebar secara merata dan simetris, membentuk sebuah kurva seperti
lonceng.
Distribusi Normal Penting Dalam Statistika
Distribusi normal merupakan satu-satunya distribusi probabilitas dengan variable random kontinu dan
mempunyai peran yang sangat penting dalam statistika karena dua hal berikut:
1. Distribusi normal memiliki beberapa sifat yang memungkinkan untuk dipergunakan
sebagai pedoman dalam menarik kesimpulan berdasarkan hasil sampel. Seperti kita
ketahui bahwa pada setiap penelitian kita hamper selalu melakukan pengukuran
pada sampel yang kemudian digunakan untuk menafsirkan parameter populasi
2. Meskipun distribusi normal merupakan distribusi teoritis, tetapi sangat sesuai
dengan distribusi empiris sehingga dikatakan bahwa semua peristiwa secara alami
akan membentuk distribusi ini. Oleh karena itu, distribusi ini sangat dikenal dengan
sebutan distribusi normal dan grafik yang dihasilkan berupa kurva dikena sebagai
kurva normal atau kurva Gauss.

Ciri-ciri distribusi normal
Untuk dapat mengenal distribusi normal, kita harus memahami cirri-ciri atau sifat dari distribusi
tersebut.
Distribusi normal memiliki beberapa ciri sebagai berikut.
1. Disusun dari variabel random kontinu
2. Kurva distribusi normal mempunyai satu puncak. Ini berarti bahwa grafik yang
disusun dari distribusi normal akan berbentuk kurva yang simetris dengan satu
puncak atau unimodal
3. Nilai mean, median, dan modus terletak pada satu titik.
4. Kurva normal dibentuk dari jumlah pengamatan yang sangat banyak
5. Event yang dihasilkan bersifat independen

6. Ekor kurva mendekati aksis pada penyimpangan ke kiri dan ke kanan sebesar 3 SD
dari rata-rata dan ekor grafik ini dapat dikembangkan terus tanpa menyentuh aksis.
Ciri-ciri kurva distribusi normal akan terlihat jelas pada kurva di bawah ini.
Y




X




Distribusi Normal Standar
Kurva distribusi normal bukan satu, tetapi merupakan sekumpulan kurva yang mempunyai ciri-
ciri yang sama. Oleh karena itu, harus ditentukan satu distribusi normal standar sebagai pegangan.
Penjelasan tentang banyaknya kurva normal yang dihasilkan dapat dilakukan dengan dua cara
berikut.
Cara ordinat
Cara ini dapat dijelaskan dengan menggunakan rumus berikut:


Bila nilai dari dan N tetap maka setiap nilai X akan menghasilkan nilai Y sehingga bila nilai
X dimasukkan dalam perhitungan berkali-kali dengan jumlah yang tak terhingga maka akan dihasilkan
kurva distribusi normal.
Dari penjelasan di atas tampak bahwa pada setiap pasangan dan akan menghasilkan kurva
distribusi normal sehingga terdapat banyak kurva normal dengan bentuk yang berlainan, bergantung
pada besar kecilnya .
Bila besar maka kurva yang dihasilkan mempunyai puncak yang rendah dan sebaliknya bila
N kecil maka kurva normal yang dihasilkan mempunyai puncak yang tinggi. Selain itu, kurva normal
juga dapat dibentuk dengan yang berbeda atau keduanya ( dan ) yang berbeda. Kurva-kurva

normal yang dibentuk dapat dilihat pada kurva di bawah ini.
Y
= 1

= 5
= 10
X

Cara Luas
Kurva normal merupakan kurva yang simetris, berarti kurva ini membagi luas kurva menjadi dua
bagian yang sama.
Luas seluruh kurva sama dengan 1 atau 100%. Ini berarti bahwa luas tiap belahan adalah 50% dan
setiap penyimpangan terhadap rata-rata dapat dinyatakan dalam persentase terhadap luas kurva.
Untuk penyimpangan ke kanan dan ke kiri 1, SD sama dengan 68% luas kurva, penyimpangan 2 SD
sama dengan 95,5% dari luas seluruh kurva, dan penyimpangan 3 SD merupakan 99,7% dari luas
seluruh kurva.
Gambar luas kurva normal berdasarkan besarnya penyimpangan (SD) dapat dilihat pada grafik .


68%

-1 SD 1 SD


95,5%

-2 SD 2 SD






99,7%


- 3SD 3 SD

Semua kurva yang terbentuk mewakili persentase yang telah disebutkan. Sebagai contoh dapat
dikemukakan 2 distribusi normal, di mana kurva A mempunyai = 50 dan N = 20 dan kurva B dengan
= 200 dan N = 10.
Kurva A
= 50
= 20



- 2SD 2 SD

Kurva B
= 200
= 10






- 2SD 2 SD
Kedua kurva tersebut karena mempunyai simpangan baku yang sama yaitu ke kanan dan ke kiri
2 maka mempunyai persentase yang sama terhadap seluruh luas kurva.
Atas dasar di atas maka dimungkinkan untuk membentuk satu kurva sebagai standar, yaitu
kurva normal standar.
Proses standarisasi dapat dilakukan dengan transformasi rumus berikut.


Standarisasi penting dilakukan karena variabel random mempunyai satuan yang berbeda-beda,
misalnya cm, kg, dan tahun.

Untuk memudahkan perhitungan, dapat digunakan table distribusi normal yang menunjukkan
luas area di bawah kurva normal antara nilai rata-rata dan nilai variabel random yang dinyatakan
dalam unit deviasi standar (), misalnya untuk luas 95% nilai Z = 1,96 SD.

Penggunaan Tabel Distribusi Normal
Tabel distribusi normal standar terdiri dari kolom dan baris. Pada kolom paling kiri tertera
angka 0 sampai 3 dengan satu decimal di belakangnya. Desimal berikutnya terletak pada baris paling
atas dengan angka dari 0 sampai 9.
Misalnya, Z = 1,96 maka pada kolom paling kiri kita cari angka 1,9 dan bergerak ke kanan
kemudian kita cari angka 6 pada baris paling atas dan bergerak ke bawah sampai bertemu dengan nilai
1,9 dari kolom tadi dan kita mendapat angka 4750 yang berarti 47,5%. Karena tabel ini hanya memuat
setengah dari seluruh luas kurva maka seluruh luas pada Z 1,96 sama dengan 2x47,5% = 95%.
Agar mendapatkan gambaran yang lebih jelas maka akan diberikan beberapa contoh untuk
mencari luas area di bawah kurva distribusi normal standar dengan menggunakan table distribusi
normal standar.

Contoh:
Suatu evaluasi dilakukan terhadap hasil pengobatan TBC menggunakan rifampisin dengan rata-rata
kesembuhan 200 hari dan deviasi standarnya sebesar 10.
Pertanyaan:
1. Berapa probabilitas seorang penderita yang diambil secara random mempunyai
kesembuhan lebih dari 200 hari?
2. Berapa probabilitas seorang penderita sembuh antara 200 dan 205 hari?
3. Berapa probabilitas kesembuhan lebih dari 220 hari?
4. Berapa probabilitas kesembuha antara 205 dan 210 hari?
5. Berapa probabilitas kesembuhan kurang dari 200 hari?
6. Berapa besar probabilitas kesembuhan antara 190 dan 210 hari?

Jawab:
1. Kita ketahui bahwa belahan kanan dan kiri dari rata-rata adalah sama dan nilai rata-
ratanya 200 maka probabilitas seorang penderita dengan kesembuhan lebih dari
200 hari sama dengan 50% seluruh kurva.






200
2. Waktu kesembuhan terletak antara 200 dan 205 hari.
Untuk menjawab pertanyaan ini kita hitung nilai Z dan diperoleh hasil sebagai
berikut.
Z = (205-200) / 10 = 0,5
Bila kita lihat pada table distribusi normal maka akan diperoleh nilai 19195. Ini
berarti bahwa probabilitas kesembuhan antara 200 dan 205 adalah 0,19195
dibulatkan menjadi 0,2 atau 20%.





200 205

3. Untuk mengetahui probabilitas kesembuhan lebih dari 220 hari maka kita hitung
dahulu nilai Z.
Z = (220 200) / 10 = 2
Nilai Z = 2, bila kita lihat pada table distribusi normal maka akan diperoleh 4772
atau luas area sama dengan 0,4772.
Karena luas seluruh area pada belahan sebelah kanan rata-rata sama dengan 0,5
atau 50% maka probabilitas kesembuhan lebih dari 220 hari diperoleh dengan
mengurangi 0,5 dengan 0,4772 = 0,02 atau 2%. Ini berarti bahwa kesembuhan lebih
dari 220 hari hanya 2 dalam 100.






200 220


4. Untuk mengetahui probabilitas kesembuhan antara 205 sampai 210 hari mula-mula
dihitung nilai Z = 210
Z = (210-200) / 10 = 1, yang dalam table sama dengan 0,3413
Kemudian kita hitung nilai Z = 205
Z = (205-200) / 10 = 0,5, atau nilai dalam table sama dengan 0,1915
Luas antara Z = 210 dan Z = 205 adalah 0,3413 0,1915 = 0,1498 atau dibulatkan
menjadi 0,15.





200 205 210

5. Untuk mengetahui porbabilitas kesembuhan kurang dari 205 hari
Mula-mula kita hitung nilai Z = 205, diperoleh 0,5 yang sesuai dengan luas area 0,2.
Jadi, probabilitas kesembuhan kurang dari 205 hari adalah 0,5 + 0,2 = 0,7 atau 70%.





200 205


6. Untuk menghitung waktu kesembuhan antara 190 hari dan 210 hari, mula-mula kita
hitung nilai Z =210 dan kita cari luasnya, lalu kita hitung nilai Z = 190 dan kita cari
luasnya kemudian hasil tersebut dijumlahkan
Z = 210 (210 200) / 10 = 1 0,3413
Z = 190 (190 - 200) / 10 = -1 0,3413 +
0,6826





190 200 205

Ini berarti bahwa probabilitas kesembuhan antara 190 hari dan 210 hari adalah 0,68 atu 68%.
Distribusi diferensiasi normal atau Z test dapat dipakai untuk data kuantitatif dan data kualitatif.
Distribusi normal berdasarkan pendekatan pada distribusinya ada 2 bentuk uji hipotesis yaitu: uji satu
pihak (one tailed test) dan uji dua pihak (two tailed test)
Uji satu pihak digunakan apabila hipotesis alternative menyatakan perbedaan dalam bentuk
lebih besar atau lebih kecil
Uji dua pihak digunakan apabila hipotesis alternative hanya menyatakan perbedaan tanpa
melihat apakah lebih rendah atau lebih tinggi.
Sampel yang berdistribusi normal dan ukuran sampel memenuhi syarat maka dipakai
pendekatan parametrik. Untuk sampel dengan distribusi tidak normal atau tidak diketahui distribusinya
dipakai pendekatan nonparametric, atau untuk ukuran sampel leih kecil dari 30 dipakai pendekatan
nonparametric.

Distribusi normal terdapat pada:
- One sample test:
o Uji 2 pihak terhadap harga rata-rata dengan varian diketahui
o Uji 1 pihak kanan terhadap harga rata-rata dengan varian diketahui
o Uji 1 pihak kiri terhadap harga rata-rata dengan varian diketahui

o Uji 1 pihak kanan terhadap harga proporsi
o Uji 1 pihak kiri terhadap harga proporsi

- Two sample test
o Uji 2 pihak kesamaan 2 harga rata-rata dengan 1=2 = dan diketahui
o Uji 2 pihak kesamaan 2 proporsi
o Uji 1 pihak kanan perbedaan proprosi


Uji 2 pihak terhadap harga rata-rata dengan varian () diketahui
Contoh: Bagian penyediaan obat suatu rumah sakit memesan obat berupa kapsul tetrasiklin dalam
jumlah besar dari sebuah perusahaan farmasi. Diperoleh informasi dari perusahaan tersebut isi rata-rata
kapsul tetrasiklin tersebut 250mg dengan varian sebesar 4mg (
2
= 4mg). Pihak rumah sakit akan
menguji informasi tersebut dengan derajat kemaknaan = 0,05 (=0,05). Sebuah sampel secara random
sebanyak 100 kapsul dan diperoleh rata-rata isi kapsul =249,5mg dengan varians sebesar 4mg (S
2
=
4mg) apakah isi rata kapsul tersebut memang 250mg.
Jawab:
1. Ho : = 250mg
2. H1 : 250mg
3. Jenis test one sample Z test dengan varian populasi diketahui
4. Level of significancy = 0,05 uji 2 pihak
5. Kriteria penerimaan/penolakan nul hipotesis
Nul hipotesis diterima bila Z 1,96 dan Z > -1,96
6. PErhitungan statistik


7. Kesimpulan statistik
Pendekatan klasik Z < -1,96 Nul hipotesis ditolak
Pendekatan probabilistic : p = (1 2 x(0,4938)) = 0,0124
8. Kapsul tetrasiklin tersebut isinya tidak sama dengan 250 mg
9. Kasul tetrasiklin tersebut harus dikembalikan ke pabriknya

Uji 1 pihak kanan terhadap harga rata-rata dengan () varian diketahui


Hipotesis
Ho :
0
H1 : >
0
Kriteria

penolakan dan penerimaan hipotesis. Hipotesis ditolak bila
Z Z (0,5 )
Contoh soal: Suatu obat anti anemia yang sudah lama dipakai dimana obat tersebut mampu
meningkatkan Hb penderita anemia rata =1,57g% per bulan dengan simpangan baku = 0,23g%. Suatu
jenis obat baru diusulkan untuk mengganti obat standar tersebut yang diyakini paling tidak dapat
meningkatkan kadar Hb penderita anemia 1,6g% per bulan. Untuk menentukan apakah obat pengganti
dapat dipakai dilakukan penelitian terhadap 20 sampel penderita anemia ternyata didapatkan kenaikan
Hb= 1,69g%. Pertanyaan apakah obat baru tersebut dapat menggantikan obat lama.
Ho : 16

H1 : > 16
= 1,7647
Hipotesis nul ditolak bila Z = 1,645

Kesimpulan: Tolak hipotesis nul dan terima hipotesis bahwa obat baru dapat meningkatkan Hb
penderita anemia > 16g% per bulan. Dapat disimpulkan obat baru tersebut dapat digunakan untuk
menggantikan obat lama

Uji 1 pihak kiri terhadap harga rata-rata dengan () varian diketahui

Hipotesis
Ho :
0
H1 : <
0
Kriteria penolakan dan penerimaan hipotesis. Hipotesis ditolak bila
Z < - z (0,5-)
Terjadi keluhan dari para dokter bahwa sejenis obat injeksi yang pada etiketnya berisi 5cc dan
diperoleh informasi simpangan bakunya 0,1cc akan tetapi diperkirakan dari obat yang beredar isinya
kurang dari 5cc. Penelitian dilakukan dengan pengambilan sampel secara acak sebanyak 23 vial
didapatkan isi rata-rata 4,9cc dengan simpangan baku =0,2cc
Hipotesis
Ho : 5cc

H1 : < 5cc

Nilai Z < -1,64. Kita tolak hipotesis nul dan terima hipotesis alternative bahwa obat tersebut isinya
kurang dari 5 cc

Uji 1 pihak kanan terhadap harga proporsi



Hipotesis
Ho :
0
H1 : >
0
Kriteria penolakan dan penerimaan hipotesis, hipotesis ditolak bila
Z Z (0,5-)
Dinas Kesehatan Kota Palembang membuat statement bahwa 60% penduduk Kota Palembang Rhesus
Positif. Sebuah sampel acak dari 8500 penduduk ternyata didapati 5426 orang Rhesus Positif. Dengan
memakai batas kepercayaan = 0,01 benarkah statement Dinkes tersebut.
Hipotesis
Ho : 60

H1 : > 60

Z dalam table untuk = 0,01 2,33. PErhitungan Z = 2,79
Kesimpulan hipotesis nul ditolak dan hipotesis alternative diterima berarti persentase rhesus
positif sudah melampaui 60%

Uji 1 pihak kiri terhadap harga proporsi

Hipotesis
Ho :
0
H1 : <
0

Kriteria penolakan dan penerimaan hipotesis, hipotesis ditolak bila
Z (-) Z (0,5-)
Suatu penelitian bertujuan membandingkan prevalensi anemia di suatu wilayah dengan prevalensi
yang dipakai sebagai rujukan di wilayah tersebut di mana diketahui pada rujukan prevalensi anemia
=0,3. Penelitian terhadap sampel sebanyak 425 orang didapatkan prevalensi anemia =0,28. PErtanyaan
apakah prevalensi rujukan memang benar adanya.
Hipotesis
Ho : 0,3

H1 : < 0,3

Kesimpulan: Hipotesis nol diterima. Proporsi anemia memang lebih besar atau sama dengan 0,3
Karena Z hasil perhitungan = -0,90 lebih besar dari z dalam table = -1,64

Uji 2 pihak kesamaan 2 harga rata-rata dengan
1
=
2
=

dan diketahui
Diketahui 2 jenis obat anti obesitas A dan B dapat menurunkan berat badan dengan khasiat yang sama,
diketahui:

2
A =
2
B = 0,2 kg
a = 3,22 kg
S
2
A = 0,1996 S
2
B = 0,397
Na = 10 Nb= 11


Hipotesis
Ho : = 0
H1 : 0
Kriteria penolakan dan penerimaan hipotesis. Hipotesis diterima apabila
(-) Z (1-) < Z < Z (1-)

Kesimpulan: Kita terima hipotesis nul karena harga Z perhitungan lebih kecil dari 1,96

Uji 2 pihak kesamaan 2 proporsi
Hipotesis
Ho : n1 = n2
H1 : n1 n2

Kriteria penerimaan hipotesis
(-) Z < Z < Z
Suatu penelitian terhadap kejadian anemia di dua daerah yang berbeda yaitu daerah A dan B. Di
daerah A diambil secara random 250 sampel didapatkan 150 penderita. Di daerah B diambil 300
sampel didapatkan 162 penderita. Apakah ada perbedaan yang bermakna proporsi anemia dari
kedua daerah tersebut.
Hipotesis
Ho : n1 = n2
H1 : n1 n2



Z= 1,42
Kesimpulan Hipotesis nul diterima, tidak ada perbedaan angka kejadian di kedua daerah
tersebut.

Uji 1 pihak kanan perbedaan proporsi
Hipotesis
Ho : n1 n2
H1 : n1 > n2
Rumus



Kriteria penerimaan hipotesis
Ditolak hipotesis Z Z (0,5 )
Diteerima hipotesis Z < Z (0,5 )
Dua kelompok yang menderita penyakit tertentu diberikan suatu serum kepada kelompok A
yang terdiri dari 100 penderita dan kelompok b terdiri dari 100 orang tidak diberikan apa pun.
Apakah pemberian serum ini dapat menyembuhkan penyakit bila terdapat angka kesembuhan
pada kelompok A dan kelompok B 80 orang dan 68 orang.
Hipotesis
Ho : n1 n2
H1 : n1 > n2



Kriteria penerimaan dan penolakan hjpotesis
Ditolak hipotesis Z Z (0,5 ) 1,64
Diteerima hipotesis Z < Z (0,5 ) < 1,64

Harga Z perhitungan lebih besar dari harga Z dalam table maka hipotesis nul ditolak. Semua
efektif menyembuhkan penyakit tersebut.

Uji 1 pihak kiri perbedaan proporsi
Hipotesis
Ho : n1 n2
H1 : n1< n2

Rumus

Kriteria penerimaan hipotesis
Ditolak hipotesis Z - Z (0,5 )
Diteerima hipotesis Z > - Z (0,5 )
Dua kelompok yang menderita penyakit tertentu diberikan suatu serum kepada kelompok A
yang terdiri dari 100 penderita dan kelompok b terdiri dari 100 orang tidak diberikan apa pun.
Apakah pemberian serum ini dapat menyembuhkan penyakit bila terdapat angka kesembuhan
pada kelompok A dan kelompok B 80 orang dan 68 orang.
Hipotesis
Ho : n1 n2

H1 : n1 > n2



Kriteria penerimaan dan penolakan hjpotesis
Ditolak hipotesis Z - Z (0,5 ) = -1,64
Diteerima hipotesis Z > - Z (0,5 ) = -1,64

Kesimpulan: hipotesis diterima bahwa proporsi kesembuhan oleh serum lebih tinggi dari
proporsi kesembuhan tanpa serum.


BAB III
KESIMPULAN
- Di bidang kesehatan, distribusi frekuensi teoritis dapat digunakan untuk
menyusun perencanaan program pelayanan kesehatan di masa yang akan
datang dan meramalkan tentang masalah kesehatan yang mungkin terjadi di
masa yang akan datang
- Dalam menggunakan distribusi untuk pengujian hipotesis, dikenal distribusi
normal, distribusi t dan distribusi chi-kuadrat. Distribusi normal atau Z test
digunakan apabila varian diketahui, sedangkan apabila varian tidak diketahui
maka digunakan distribusi t test.
















DAFTAR PUSTAKA

- Budiarto E. Biostatistika Untuk Kedokteran dan Kesehatan Masyarakat. EGC.
Jakarta. 2001
- Budiman C. Pengantar Statistik Kesehatan. EGC. Jakarta. 1995
- Tjekyan S. Diktat Kuliah Statistik.






















V

BAB I
PENDAHULUAN

1. LATAR BELAKANG
Dunia kedokteran tidak jauh dari kegiatan meneliti. Dalam meneliti maka diperlukan
ilmu statistika. Penggunaan istilah statistika berakar dari istilah istilah dalam bahasa latin
moderen statisticum collegium ("dewan negara") dan bahasa Italia statista ("negarawan" atau
"politikus").
Istilah 'statistika' (bahasa Inggris: statistics) berbeda dengan 'statistik' (statistic).
Statistika merupakan ilmu yang berkenaan dengan data, sedang statistik adalah data,
informasi, atau hasil penerapan algoritma statistika pada suatu data. Sehingga data mentah
lebih mudah dibaca dan lebih bermakna dan salah satunya membuat permodelan
hubungan (korelasi, regresi, ANOVA, deret waktu).
Banyak penelitian-penelitian tersebut berpusat pada penetapan suatu hubungan
antara dua variabel. Sebagai contoh, di dalam laboratorium, bagaimana tanggapan seekor
binatang tehadap suatu obat berubah dengan berubahnya takaran dari obat tersebut? Di
dalam klinik, apakah ada hubungan antara dua penetapan faali atau biokimia yang diukur
pada penderita-penderita yang sama? Di dalam masyarakat, apakah ada hubungannya
antara berbagai bilangan penunjuk kesehatan dan luasnya penyediaan pelayanan
kesehatan? Semua pertanyaan ini menyangkut hubungan dua variabel bisa diselidiki dengan
memakai salah satu tehnuk statistik yaitu Analisis Korelasi.
Dalam makalah ini akan dibahas salah satu permodelan hubungan dalam statistika
yaitu Analisis Korelasi. Hal inilah menjadi landasan dibuatnya makalah ini. Antara lain agar
mahasiswa pada umumnya dan mahasiswa kedokteran pada khususnya dapat mengetahui
cara dan langkah penggunaan metode analisa korelasi dalam penerapan ilmu.


2. MAKSUD DAN TUJUAN
Makalah berjudul Analisis Korelasi ini dibuat sebagai tugas dari kepaniteraan senior
bagian IKM. Selain itu, makalah ini dibuat untuk memperluas pengetahuan mahasiswa
mengenai statistik penerapan serta penggunaannya.
Tujuan dibuatnya makalah ini antara lain sebagai bahan referensi bahwa ilmu statistik
juga perlu dipelajari oleh mahasiswa kedokteran. Agar paradigma mahasiswa dapat
berkembang ke arah yang lebih baik sehingga mampu menjadi dokter-dokter yang mampu
secara kualitas dalam menyediakan layanan medis di masyarakat.




BAB II
ISI

1. DEFINISI
Analisis korelasi adalah suatu analisis yang membahas derajat antara satu variabel
dengan variabel lainnya. Data hasil pengamatan terdiri dari banyak variabel, ialah betapa
kuat hubungan antara variabel-variabel itu terjadi.dalam kata lain, perlu ditentukan derajat
hubungan antara variabe-variabel.
Analisis korelasi berbeda dengan analisis regresi namun analisis korelasi sukar untuk
dipisahkan dengan analisis regresi. Hubungan antara nilai variabel pertama dengan nilai
variabel kedua yang dideskripsikan secara statistik dan dinyatakan dengan angka, disebut
koefisien korelasi.
Koefisien korelasi (r) Pearson Product Moment : yakni suatu ukuran yang sudah
dianggap baku untuk mengukur hubungan antara dua variabel. Korelasi merupakan angka

yang menunjukkan arah dan kuatnya hubungan antar dua variabel (atau lebih). Arah
dinyatakan dalam bentuk hubungan positif (+) atau negatif (), sedangkan kuatnya hubungan
dinyatakan dengan besarnya koefisien korelasi.
Hubungan dua variabel dinyatakan positif jika nilai suatu variabel ditingkatkan maka
akan meningkatkan variabel lainnya, sebaiknya jika nilai variabel tersebut diturunkan maka
akan menurunkan variabel yang lain. Sebagai contoh hubungan tanaman dengan produksi.
Semakin tinggi jagung maka berat tongkolnya semakin besar, sebaliknya semakin pendek
tanaman maka berat tongkolnya semakin kecil.
Hubungan dua variabel dinyatakan negatif jika suatu variabel ditingkatkan maka akan
menurunkan nilai variabel lainnya, sebailiknya jika nilai variabel tersebut diturunkan maka
akan menaikkan variabel lainnya. Sebagai contoh adalah hubungan tingkat serangan hama
dengan produksi. Semakin tinggi tingkat serangan hama maka produksinya akan semakin
kecil, sebaliknya semakin tingkat serangan hama maka produksinya akan semakin besar.
Kuatnya hubungan antar variabel dinyatakan dengan besarnya koefisien korelasi.
Koefisien korelasi memiliki rentang nilai antara 1 sampai 1. jika hubungan antara 2 variabel
memiliki korelasi 1 atau 1 berarti kedua variabel tersebut memiliki hubungan yang
sempurna, sebaliknya jika hubungan antara 2 variabel memiliki korelasi 0 berarti tidak ada
hubungan antara kedua variabel tersebut.

2. INDEKS DETERMINASI
Analisis korelasi sukar untuk dipisahkan daripada analisis regresi. Secara umum untuk
pengamatan yang terdiri dari dua variabel X dan Y, kita tinjau hal berikut.
Misalkan persamaan regresi Y atas X,

tidak perlu harus linier, yang dihitung dari
sampel, berbentuk: = f(X). Jika regresinya linier, jelas f(X) = a + bX dan jika parabola
kuadratik f(X) = a + bX + cX
2
dan seterusnya. Apabila Y menyatakan rata-rata untuk data

variabel Y, maka kita dapat membentuk jumlah kuadrat total, JK
tot
= (Y
i
Y )
2
dan jumlah
kuadrat residu, JK
res
= (Y
i

i
)
2
dengan menggunakan harga-harga
i
yang didapat dari
regresi Y = f(X).
Besaran yang ditentukan oleh rumus:


(1) . . .


Atau


(2). . .


I dinamakan indeks determinasi yang mengukur derajat hubungan antara variabel X
dan Y, apabila antara X dan Y terdapat hubungan regresi yang berbentuk = f(X). Indeks
determinasi ini bersifat bahwa jika titik-titik diagram pencar letaknya makin dekat kepada
garis regresi, maka harga I makin dekat ke satu. Sebaliknya, jika titik-titik itu makin jauh dari
garis regresi, atau tepatnya terdapat garis regresi yang tuna cocok, maka harga I makin
kepada nol.
Secara umum berlaku 0 I 1.

3. KORELASI DALAM REGRESI LINIER
Apabila garis regresi yang terbaik untuk sekumpulan data berbentuk linier, maka
derajat hubungannya akan dinyatakan dengan r dan biasa dinamakan kefisien korelasi.
Karena rumus (1) di atas bersifat umum, maka itupun berlaku apabila pola hubungan antara
Y dan X berbentuk regresi linier.
(Y
i
Y )
2
(Y
i

i
)
2
I =
(Y
i
Y )
2

JK
tot
JK
res

I =
JK
tot

Dalam hal ini I akan diganti oleh r
2
dan diperoleh:

(3) . . .


r
2
dinamakan koefisien determinasi atau koefisien penentu. Dinamakan demikian oleh karena
100 r
2
% daripada variasi yang terjadi dalam variabel tak bebas Y dapat dijelaskan oleh
variabel bebas X dengan adanya regresi linier Y atas X. Harga
2
1 r dinamakan koefisien
alienasi atau koefisien perenggangan. Harga 1 r
2
sendiri dapat dinamakan koefisien non
determinasi.
Koefisien korelasi r tentu saja didapat dengan jalan mengambil akar dari r
2
. Mudah
dilihat bahwa Rumus (1) dan Rumus (2) akan berlaku 0 r
2
1 sehingga untuk koefisien
korelasi didapat hubungan 1 r + 1. Harga r = 1 menyatakan adanya hubungan linier
sempurna tak langsung antara X dan Y. Ini berarti bahwa titk-titik yang ditentukan oleh (X
i
,Y
i
)
seluruhnya terletak pada garis regresi linier dan harga X yang besar menyebabkan atau
berpasangan dengan Y yang kecil dengan harga X yang kecil berpasangan dengan Y yang
besar. Harga r = + 1 menyatakan adanya hubungan linier sempurna langsung antara X dan
Y. Letak titik-titik ada pada garis regresi linier dengan sifat bahwa harga X yang besar
berpasangan dengan harga Y yang besar, sedangkan harga X yang kecil berpasangan
dengan Y yang kecil pula.
Harga-harga r lainnya bergerak antara 1 dan +1 dengan tanda negatif menyatakan
adanya korelasi tak langsung atau korelasi negatif dan tanda positif menyatakan korelasi
langsung atau korelasi positif. Khusus untuk r = 0, maka hendaknya ini ditafsirkan bahwa
tidak terdapat hubungan linier antara variabel-variabel X dan Y.
Untuk keperluan perhitungan koefisien korelasi r berdasarkan sekumpulan data (X
i
,Y
i
)
berukuran n dapat digunakan rumus:
(Y
i
Y )
2
(Y
i

i
)
2
r
2
=
(Y
i
Y )
2



(4) . . .



Bentuk lain dapat juga digunakan, ialah:
(5) . . .

dengan s
y.x
= kekeliruan baku taksiran s
y
= simpangan baku untuk variabel Y.
Jika persamaan regresi linier Y atas X telah ditentukan dan sudah didapat koefisiensi
arah b, maka koefisien determinasi r
2
dapat ditentukan dengan rumus:

(6) . . .


Dengan sedikit pengerjaan aljabar, dari rumus diatas dapat diturunkan rumus koefisien
korelasi.

(7). . .

dengan s
x
simpangan baku untuk variabel X dan s
x
simpangan baku untuk variabel Y.
Masih ada rumus lain lagi, yaitu yang ditentukan oleh koefisien-koefisien arah garis
regresi Y atas X dan regresi X atas Y. Jika b
1
koefisien arah regresi Y atas X dan b
2
koefisien
arah regresi X atas Y untuk data yang sama, maka
(8)

nX
i
Y
i
(X
i
) (Y
i
)

r =
( ) { } ( ) { }
2 2 2 2
i i i i
Y Y n X X n E E E E
r =
2 2
.
/ 1
y x y
s s
b {nX
i
Y
i
(X
i
) (Y
i
)}
r
2
=
nY
2
i
(Y
i
)
2
r = b s
x
/ s
y
r
2
= b
1
b
2

Rumus ini menyatakan bahwa koefisien korelasi r adalah rata-rata ukur daripada koefisien-
koefisien arah b
1
dan b
2
.
Contoh:
DAFTAR (1)
BANYAK PENGUNJUNG DAN YANG BERBELANJA DISEBUAH TOKO SELAMA 30
HARI
Hari
Berbelanja
X
i
Pengunjung
Y
i
X
i
Y
i
X
i
2
Y
i
2
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
34
38
34
40
30
40
40
34
35
39
33
32
42
40
42
42
41
32
34
36
37
36
37
39
32
36
31
38
29
35
33
30
32
36
31
31
36
37
35
38
37
30
30
30
33
32
34
35
1088
1368
1054
1520
870
1400
1320
1020
1120
1404
1023
992
1512
1480
1470
1596
1517
960
1020
1080
1221
1152
1258
1365
1156
1444
1156
1600
900
1600
1600
1156
1225
1521
1089
1024
1764
1600
1764
1764
1681
1024
1156
1296
1369
1296
1369
1521
1024
1296
961
1444
841
1225
1089
900
1024
1296
961
961
1296
1369
1225
1444
1369
900
900
900
1089
1024
1156
1225

25
26
27
28
29
30
40
33
34
36
37
38
36
32
32
34
32
34
1440
1056
1088
1224
1184
1292
1600
1089
1156
1296
1369
1444
1296
1024
1024
1156
1024
1156

1105 1001 37094 41029 33599

Dalam daftar (1), mengenai hubungan antara banyak pengunjung dan yang berbelanja di
sebuah toko. Dari Daftar (1) telah didapat
X
i
= 1105, Y
i
= 1001, X
i
Y
i =
37094
X
i
2
= 41029, Y
I
2
= 33599 dan n = 30. Jadi dari data tersebut dengan rumus (4)
diperoleh hasil:
30(37094) (1105)(1001)
r =
( ) ( ) { } ( ) ( ) { }
2 2
1001 33599 30 1105 41029 30
r = 0,8758
Dari hasil ini ternyata didapat korelasi positif antara banyak pengunjung X dan yang
berbelanja Y. Berarti, meningkatnya pengunjung yang datang meningkatkan pula banyaknya
yang berbelanja. Besar hubungannya ditentukan oleh koefisien determinasi r
2
= 0,7670 atau
sebesar 76,7%. Ini berarti bahwa meningkatnya atau menurunnya pembeli 76,7% dapat
dijelaskan oleh banyaknya pengunjung melalui hubungan linier yang persamaannya = 8,24
+ 0,68 X. Sisanya ditentukan oleh keadaan lain.
Contoh:
Ambillah regresi model Y = 2 + X
2
. Jelas ini bukan regresi linier. Kita ambil harga-harga
sebagai berikut:


X
i
3 2 1 0 1 2 3
Y
i
11 6 3 2 3 6 11

Dari sini mudah dihitung bahwa:
X
i
= 0, Y
i
= 42, X
i
2
= 28,
Y
i
2
= 336, X
i
Y
i
= 0, n = 7.
Dengan rumus (4) didapat:
7(0) (0)(42)
r = = 0
( ) ( ) { } ( ) ( ) { }
2 2
42 336 7 0 28 7

Yang berarti tidak terdapat hubungan linier antara X dan Y. Memang, hubungan yang
ada antara X dan Y, yakni = 2 + X
2
, berbentuk parabola kuadratik. Sekarang, marilah kita
lihat berapa derajat hubungan yang ada antara X dan Y dalam bentuk kuadratik tersebut.
Untuk ini kita digunakan rumus (3). Kita lihat bahwa Y = 6,
i
= Y
i
dan harganya
seperti tertera di atas. Dengan demikian (Y
i

i
)
2
= 0. sehingga dari rumus (1) mudah
dilihat bahwa r
2
= 1. Ini berarti terdapat hubungan sempurna antara X dan Y yang dinyatakan
oleh parabola dengan persamaan = 2 + X
2
.
Contoh ini memperlihatkan, bahwa koefisien korelasi r = 0 dihitung dengan rumus (4),
tidak berarti tidak terdapat hubungan antara X dan Y. Yang benar adalah tidak terdapat
hubungan linier antara X dan Y, melainkan hubungan berbentuk lain (dalam hal ini model
kuadratik).

4. KOEFISIEN KORELASI UNTUK DATA DALAM DAFTAR DISTRIBUSI FREKUENSI
Perhatikanlah kembali hasil pengamatan yang tersiri dari dua variabel X dan Y. Data
pengamatan, sekarang tidak lagi akan dicatat seperti yang sudah-sudah, melainkan di dalam

bentuk daftar distribusi frekuensi. Jadi dalam hal ini, banyak data atau frekuensi data hasil
pengamatan akan dimiliki oleh dua kelas interval, yaitu kelas interval varabel X dan kelas
interval untuk variabel Y. Daftar demikian dinamakan daftar distribusi frekuensi bervaribel
dua. Sebuah contoh dapat dilihat dalam daftar (2)
DAFTAR (2)
PENDAPATAN BULAN DAN PENGELUARAN UNTUK MEROKOK
BURUH DISUATU DAERAH
(dalam ribuan rupiah)
PENGELUARAN (Y) PENDAPATAN (X)
30 -39 40 -49 50 -59 60 -69 70 -79 80 -89 90 -99 Jumlah
(f
x
)
0,00 0,99
1,00 1,99
2,00 2,99
3,00 3,99
4,00 4,99
5,00 5,99
6,00 6,99
7,00 7,99
1
2
1

3
2
5

1
10
6
2


2
5
4
1
2



1
3
10
5



1
2
6
2
1



1
1
2
2
1
1
6
15
19
12
19
11
2
Jumlah (f
x
) 4 10 19 14 19 12 7 n = 85

Daftar di atas memperlihatkan pendapatan bulanan dan pengeluaran untuk membeli
rokok yang dilakukan oleh 85 orang pegawai di suatu daerah. Dari daftar dapat dibaca
misalnya bahwa ada seorang pegawai yang berpenghasilan paling rendah Rp 30.000 dan
paling tinggi Rp 39.000 yang telah mengeluarkan uangnya untuk membeli rokok paling
banyak Rp 990, ada dua orang yang berpenghasilan demikian yang telah mengeluarkan
uang untuk keperluan rokok paling rendah Rp 1.000 dan paling banyak Rp 1.990, dan begitu
seterusnya.
Untuk keperluan penghitungan, akan kita misalkan Y = pengeluaran dan X =

pendapatan. Dengan demikian, kolom terakhir dalam daftar, yang menyatakan jumlah
frekuensi tiap baris, dapat dinyatakan dengan f
y
. Baris terakhir, yang menyatakan jumlah
frekuensi tiap kolom, dinyatakan dengan f
x
. Kotak di sudut kanan bawah menyatakan ukuran
sampel n = f
x
= f
y
.
Sekarang marilah kita ambil X
i
sebagai tanda kelas untuk kelas-kelas interval ke-i
untuk variabel X dan Y
i
sebagai tanda f
x
= f
y
= jumlah frekuensi = ukuran sampel, maka
koefisien korelasi r dapat dihitung dengan rumus:

(9) . . .


Apabila kelas-kelas interval untuk masing-masing variabel panjangnya sama, maka
cara sandi dapat digunakan untuk menyederhanakan perhitungan. Jika C
x
menyatakan sandi
untuk variabel X dan C
y
sandi untuk variabel Y, maka:




(10)



Contoh :
Untuk data dalam daftar (2), marilah kita hitung berapa besar koefisien korelasinya.
Untuk keperluan perhitungan, daftar seperti daftar (3) perlu dibuat, di mana kelas-kelas
interval tidak lagi dituliskan tetapi cukup diganti dengan tanda-tanda kelasnya.
nf
i
X
i
Y
i
(f
x
X
i
) (f
y
Y
i
)
r =
( ) { } ( ) { }
2 2 2 2
i y i y i x i x
Y f Y f n X f X f n E E E E
nf
i
C
x
C
y
(f
x
C
x
) (f
y
C
y
)
r =
( ) { } ( ) { }
2 2 2 2
y y y y x x x x
C f C f n C f C f n E E E E

Selanjutnya, untuk menyesuaikan dengan kebiasaan sistem sumbu koordinat, sumbu
mendatar X dari kiri dimulai dengan harga terkecil dan sumbu tegak Y dari bawah dimulai
dengan harga terkecil, maka susunan kelas-kelas interval untuk variabel Y akan dibalik, yaitu
dari bawah dimulai dengan tanda kelas terkecil.







DAFTAR (3) HARGA-HARGA YANG PERLU UNTUK MENGHITUNG
KOEFISIEN KORELASI DATA DALAM DAFTAR (2)
X 34,5 44,5 54,5 64,5 74,5 84,5 94,5
Y
C
x

C
y
3 2

1

0

1 2 3 f
y
f
y
C
y
f
y
C
y
2
f
i
C
x
C
y
7,495
6,495
5,495
4,495
3,495
2,495
1,495
0,495
4
3
2
1
0
1
2
3





1
2
1




5
2
3




2
6
10
1

2
1
4
5
2


5
10
3
1
1
2
6
2
1
1
2
2
1
1
2
11
19
12
19
15
6
1
8
33
38
12
0
15
12
3
32
99
76
12
0
15
24
9
20
45
56
8
0
17
26
9
f
x
4 10 19 14 19 12 7 n
= 85
f
y
C
y

= 61
f
y
C
y
2
= 267
f
i
C
x
C
y
= 181

f
x
C
x
12 20 19 0 19 24 21 f
x
C
x

= 13
f
x
C
x
2
36 40 19 0 19 48 63 f
x
C
x
2

= 225
f
i
C
x
C
y
24 116 10 0 38 48 45 f
i
C
x
C
y

= 181

Dalam daftar di atas telah diambil sandi c
x
= 0 yang sesuai dengan tanda kelas X =
64,5 dan sandi c
x
= 0 sesuai dengan tanda kelas Y = 3,495. Sandi lainnya diambil seperti
biasa, yakni untuk tanda kelas yang makin kecil berturut-turut 1, 2, 3, . . . sedangkan
untuk tanda kelas yang makin besar +1, +2, +3, . . . . Harga f
x
c
x
didapat dengan mengalikan
f
x
dan c
x
. Demikianlah misalnya, f
x
c
x
= 12 didapat sebagai hasilkali f
x
= 4 dengan c
x
= 3.
sedangkan f
x
c
x
= 20 didapat sebagai hasilkali f
x
= 10 dengan c
x
= 2, dan begitu
seterusnya.
Begitu pula f
y
c
y
didapat dengan jalan mengalikan hasilkali f
y
= 2 dengan c
y
= 4, f
y
c
y
=
33 sebagai hasilkali f
y
= 11 dengan c
y
= 3, dan seterusnya. Harga-harga f
x
c
x
2
adalah hasilkali
dari f
x
c
x
dan c
x
; dan tentunya f
y
c
y
2
didapat sebagai produk antara f
y
c
y
dengan c
y
. Untuk f
x
c
x
2

= 36 misalnya, didapat dari f
x
c
x
= -12 kali c
x
= -3 dan f
y
c
y
2
= 32 dari f
y
c
y
= 8 kali c
y
= 4.
Untuk baris akhir dan kolom akhir dalam daftar, yakni f
i
c
x
c
y
, akan kita pakai frekuensi-
frekuensi yang ada di dalam badan daftar. Frekuensi-frekuensi ini akan dinyatakan dengan f
i
.
Demikianlah misalnya, f
i
= 1 untuk data dengan tanda kelas X = 34,5 dan tanda kelas Y =
2,495 ; f
i
= 2 untuk data dengan tanda kelas X = 34,5 dan tanda kelas Y = 1,495 dan
seterusnya. Harga-harga f
i
c
x
c
y
didapat sebagai jumlah hasilkali antara semua f
i
c
x
dan c
y
yang
bersangkutan. Baris bawah f
i
c
x
c
y
= 24, untuk tanda kelas X = 34,5 didapat dari (1)(3)(1) +
2(3)(2) + (1)(3)(3) dan f
i
c
x
c
y
= 16, untuk tanda kelas X = 44,5, didapat dari (5)(2)(0) +
(2)(2)(1) + (3)(2)(2). Kolom akhir untuk f
i
c
x
c
y
dihitung dengan jalan yang sama.

Untuk tanda kelas Y = 7,495 dengan f
i
c
x
c
y
= 20 misalnya, didapat dari (1)(2)(4) +
(1)(3)(4).
Selesai melakukan ini semua, pada bagian bawah sudut kanan dalam daftar dapat
dihitung harga-harga yang diperlukan untuk rumus (10). Dari situ didapat
f
x
c
x
= 13, f
x
c
x
2
= 225, f
y
c
y
= 61
f
y
c
y
2
= 267, n = 85 dan f
i
c
x
c
y
= 181.
Baris akhir dan kolom akhir, f
i
c
x
c
y
, dapat dijadikan alat mengecek apakah perhitungan
yang kita lakukan benar atau tidak. Jika terdapat f
i
c
x
c
y
sama besar maka perhitungan dalam
daftar itu benar ; jika tidak, pemeriksaan kembali harus dilakukan.
Setelah harga-harga yang perlu diperoleh, maka dari rumus (10) dihasilkan:
85(181) (13)(61)
r =
( ) ( ) { } ( ) ( ) { }
2 2
61 267 85 13 225 85
r = 0,7476
Angka ini menyatakan derajat hubungan antara pendapatan X dan pengeluaran Y,
apabila pola hubungan antara Y dan X berbentuk linier.


5. DISTRIBUSI SAMPLING KOEFISIEN KORELASI
Uraian tentang koefisien korelasi r dalam bagian-bagian yang lalu seluruhnya berlaku
untuk hubungan antara X dan Y dan tidak bergantung pada asumsi yang dikenakan kepada
variabel-variabel X dan Y. Apabila sekarang untuk X dan Y terdapat pola tertentu, misalnya
bagaimana X dan Y berdistribusi, maka analisis korelasi bisa berjalan lebih jauh, antara lain
menentukan interval taksiran dan menguji hipotesis. Untuk ini, dimisalkan bahwa X dan Y
berdistribusi gabungan normal bervariabel dua yang didalamnya antara lain berisikan
parameter (baca: rho) sebagai koefisien korelasinya.

Dari populasi normal bervariabel dua ini ambillah sampela acak berukuran n lalu hitung
koefisien-koefisien korelasinya r dengan rumus yang telah dijelaskan di atas. Maka didapat
kumpulan koefisien korelasi r
1
, r
2
, r
3
, . . . . Dari kumpulan ini kita dapat membentuk distribusi
sampling koefisien korelasi dan selanjutnya rata-rata dan simpangan bakunya dapat dihitung.
Rata-rata dan simpangan baku untuk distribusi sampling koefisien korelasi ini akan diberi
simbul
r
dan
r
.

Dibedakan dua hal:
Hal A). Populasinya mempunyai = 0
Jika semua sampel acak itu berasal dari popupasi normal bervariabel dua dengan =
0, maka distribusi sampling koefisien korelasi akan simetrik dengan
r
= 0. Jika dibentuk
statistik:

(11). . .

maka akan diperoleh distribusi Student t dengan dk = (n 2).
Hal B). Populasinya mempunyai 0.
Jika populasi dari mana sampel acak itu diambil mempunyai =
0
0, maka distribusi
sampling koefisien korelasi tidak simetrik. Dalam hal ini, dengan menggunakan sebuah
transformasi akan menyebabkan distribusi yang tidak simetrik itu mendekati distribusi
normal. Transformasi yang digunakan ialah transformasi Fisher:

(12) . . . .

dengan ln berarti logaritma asli, yaitu logaritma dengan bilangan pokok e.
Dalam logaritma biasa, transformasi ini dapt juga ditulis sebagai
r 2 n
t =

2
1 r
Z = in |
.
|

\
|

+
r
r
1
1



(13) . . . .


Dengan transformasi ini, distribusi normal yang terjadi (suatu bentuk pendekatan)
mempunyai rata-rata simpangan baku:

(14) . . .



Rumus dapat pula ditulis dalam bentuk:

(15). . .


6. MENAKSIR KOEFISIEN KORELASI
Sebagaimana halnya menaksir parameter-parameter lain (rata-rata , simpangan baku
, proporsi ) ada dua macam penaksiran, ialah titik taksiran dan interval taksiran, maka
untuk koefisien korelasi pun didapat hal yang sama. Titik taksiran dengan mudah dapat
ditentukan ialah koefisien korelasi r yang didapat dari sampel. Jika hubungan antara X dan Y
berbentuk regresi linier, maka r dihitung dengan rumus (4) atau yang sejenisnya. Dalam hal
lain, r dihitung dengan rumus (3). Untuk kita di sini hanya dibahas penaksiran koefisien
korelasi apabila regresi antara X dan Y berbentuk linier.
Untuk menentukan interval taksiran koefisien korelasi , digunakan transformasi
Fisher, yaitu Z. Setelah harga Z didapat, baru batas-batas
z
ditentukan. Jika = koefisien
Z = (1,1513) log |
.
|

\
|

+
r
r
1
1

z
= in
|
|
.
|

\
|

+
0
0
1
1

z
=
3
1
n

z
= (1,1513) log
|
|
.
|

\
|

+
0
0
1
1



kepercayaan yang diberikan, maka interval taksiran
z
dihitung oleh:
(16)

dengan z

didapat dari daftar distribusi normal baku menggunakan peluang .


Akhirnya batas-batas dapat ditentukan dengan menggunakan batas-batas
z
yang
didapat dari rumus (16) dan

(17) . . . .

Contoh:
Sebuah sampel acak dengan ukuran n = 28 telah diambil dari sebuah populasi normal
bervariabel dua. Dari sampel itu didapat r = 0,80. tentukan taksiran koefisien korelasi untuk
populasi.
Jawab:
Titik taksiran dengan mudah dapat ditentukan ialah = 0,80. Untuk menentukan interval
taksiran dengan angka kepercayaan = 95% misalnya dengan rumus (13) kita peroleh:

Z = (1,1513) log |
.
|

\
|

+
8 , 0 1
8 , 0 1
= 1,0986
Dari rumus (14) dan rumus (16) didapat
1,0986
3 28
96 , 1

<
z
< 1,0986 +
3 28
96 , 1

atau 0,7066 <


z
< 1,4906
Substitusikan batas-batas ini ke dalam rumus (17) untuk
z
= 0,7066 didapat:
0,7066 = (1,1513) log
|
|
.
|

\
|

1
1

Z z

z
<
z
< Z + z

z
= (1,1513) log
|
|
.
|

\
|

1
1


log
|
|
.
|

\
|

1
1
= 0,06137 yang menghasilkan = 0,609.
Untuk
z
= 1,4906 dihasilkan:
1,4906 = (1,1513) log
|
|
.
|

\
|

1
1

log
|
|
.
|

\
|

1
1
= 1,2947 yang menghasilkan = 0,903
Interval taksiran dengan angka kepercayaan 95% adalah 0,609 < < 0,903

7. MENGUJI HIPOTESIS
Kembali kepada populasi normal bervariabel dua dengan koefisien korelasi . Dari
modelnya, jika = 0, maka ternyata bahwa X dan Y independen. Sehingga dalam hal
populasi berdistribusi normal, = 0 mengakibatkan bahwa X dan Y independen dan
sebaliknya. Sifat ini tidak berlaku untuk populasi yang tidak berdistribusi normal.
Mengingat dalam banyak penelitian sering ingin mengetahui apakah antara dua
variabel terdapat hubungan yang independen atau tidak, maka kita perlu melakukan uji
ndependen. Dalam hal ini, maka hipotesis yang harus diuji adalah:
H
0
: = 0 melawan H
1
: 0.
Uji ini sebenarnya ekivalen dengan uji H
0
:
2
= 0 dimana
2
menyatakan koefisien arah
regresi linier untuk populasi. Untuk menguji H
0
: = 0 melawan H
1
: 0, jika sampel acak
yang diambil dari populasi normal bervariabel dua itu berukuran n memiliki koefisien koralasi
r, maka dapat digunakan statistik t seperti dicantumkan dalam rumus (11) yaitu
(18)

t =
2
1
2
r
n r





Selanjutnya, untuk taraf nyata = , maka hipotesis kita terima jika t
(1 )
< t < t
(t )
, di
mana distribusi t yang digunakan mempunyai dk = (n 2). Dalam hal lainnya H
0
kita tolak.
Tentu saja alternatif untuk menguji hipotesis H
0
bisa H
1
: > 0 atau H
1
: < 0. Dalam
hal pertama merupakan uji pihak kanan sedangkan yang kedua merupakan uji pihak kiri.
Daerah krisis pengujian, seperti biasa harus disesuaikan dengan alternatif yang diambil.
Contoh:
Untuk menguji H
0
: = 0 melawan H
1
: 0 berdasarkan sebuah sampel acak berukuran n =
27 dengan r = 0,28, maka dari rumus (18) didapat
t =
( )
( )
2
28 , 0 1
2 27 28 , 0


= 1,458
Jika taraf nyata = 0,05, maka dengan dk = 25, dari daftar distribusi t didapat, untuk uji dua
pihak, t
0,995
= 2,060. Mudah dilihat bahwa t = 1,458 antara 2,060 dan 2,060. Jadi H
0
diterima.
Sekarang marilah kita tinjau bagaimanan menguji hipotesis yang tidak nol dapat
dilakukan.
Seperti telah dijelaskan dalam bagian 5, jika sampel acak diambil dari populasi normal
bervariabel dua dengan koefisian korelasi 0, maka dengan transformasi Fisher dalam
rumus (13) akan diperoleh distribusi normal dengan rata-rata dan simpangan baku seperti
tertera dalam rumus (14). Untuk dapat menggunakan daftar distribusi normal baku,
selanjutnya perlu digunakan angka z:

(19). .

Angka z inilah yang akan digunakan untuk menguji hipotesis H
0
: =
0
0 melawan salah
z =
Z
Z
Z
o



satu alternatif:
H
1
:
0
, atau
H
1
: >
0
H
1
: <
0

Jika taraf nyata pengujian diambil , maka daerah kritis, seperti biasa, ditentukan oleh bentuk
alternatif, apakah dua pihak, pihak kanan atau pihak kiri.
Contoh:
Dalam bagian 3, telah dihitung koefisien korelasi antara banyak pengunjung dan yang
berbelanja untuk sampel berukuran n = 30. Di situ telah didapat r = 0,8758. Jika diduga
bahwa populasinya mempunyai = 0,75, dapatkah sampel tadi menguatkan dugaan
tersebut?
Pertanyaan ini akan terjawab apabila kita melakukan pengujian terhadap hipotesis:
H
0
: = 0,75 melawan H
1
: 0,75
Dengan rumus (13) kita dapat menghitung
Z = (1,1513) log |
.
|

\
|

+
8758 , 0 1
8758 , 0 1
= 1,3573
sedangkan dari rumus (14) dan rumus (15) dengan
0
= 0,75 (dari hipotesis H
0
) didapat

z
= (1,1513) log |
.
|

\
|

+
75 , 0 1
75 , 0 1
= 0,9729
Dan

z
=
3 30
1

= 0,1924
Akhirnya, rumus (19) memberikan bilangan baku
z =
1924 , 0
9729 , 0 3573 , 1
= 2,00

Jika diambil = 0,05, maka daerah penerimaan H
0
adalah 1,96 < z < 1,96
Ternyata bahwa pengujian memberikan hasil yang berarti. Sampel itu tidak berasal dari
populasi dengan = 0,75
Contoh:
Berasal dari populasi dengan berapa sampel di muka telah diambil?
Jawab:
Jika diambil = 0,05, maka untuk menguji hipotesis:
H
0
: =
0
melawan H
1
:
0

di mana
0
bilangan yang akan dicari, supaya hipotesis bisa diterima, harus berlaku:
1,96 <
1924 , 0
3573 , 1
Z

< 1,96
Kita selesaikan hal pertama (ketidaksamaan sebelah kiri):
1,96 <
1924 , 0
3573 , 1
Z


Atau (1,1513) log
|
|
.
|

\
|

+
0
0
1
1

< 1,7344
Atau
|
|
.
|

\
|

+
0
0
1
1

< 32,1 sehingga


0
< 0,9395.
Hal kedua adalah (ketidaksamaan sebelah kanan):
1924 , 0
3573 , 1
Z

< 1,96
Atau (1,1513) log
|
|
.
|

\
|

+
0
0
1
1

> 0,9802
Atau
0
0
1
1

+
> 7,1 sehingga
0
> 0,7530

Sampel berukuran n = 30 tadi berasal dari sebuah populasi dengan yang besarnya antara
0,7530 dan 0,9395

8. KORELASI GANDA DAN KORELASI PARSIL
Regresi linier ganda untuk Y atas X
1
, X
2
, . . . X
K
telah ditentukan. Persoalan berikutnya,
setelah regresi linier ganda dihitung ialah menentukan derajat hubungan antara variabel-
variabel. Sebagaimana regresi linier untuk Y atas X, menghasilkan rumus (6) untuk r
2
, maka
dari regresi linier ganda pun akan didapatkan hal yang serupa. Untuk membedakan dengan
korelasi antara dua variabel X dan Y, yang telah dinyatakan dengan r, maka untuk mengukur
derajat hubungan antara tiga variabel atau lebih, akan digunakan simbul R. Berdasarkan
linier ganda:
= a
0
+ a
i
X
i
+ a
2
X
2
+ . . . + a
k
X
k

maka R ditentukan oleh rumus:

(20). . .

(21) . . . .

dengan x
1i
= X
1i
1 X , x
2i
= X
2i
2 X , . . . , x
ki
= X
ki
k X , y
i
= Y
i
Y dan JK
reg
dihitung
dengan rumus (21)
Jika dinyatakan dalam kekeliruan baku taksiran s
y.12 . . . k
maka koefisien korelasi ganda
dapat ditulis sebagai
(22)


dengan s
y
menyatakan simpangan baku untuk variabel Y. R dinamakan koefisien korelasi
R
2
=
2
i
reg
y
JK
E

JK
reg
= a
1
x
1i
y
i
+ a
2
x
2i
y
i
+ ...+a
k
x
ki
y
i
R
2
= 1
( )
( )
2
... 12 .
2
1
1
y
k
y
s n
s k n




ganda antara Y dengan k buah variabel X
1
, X
2
, . . . X
K
:
Tentu saja R
2
dinamakan koefisien determinasi ganda.


Contoh:
DAFTAR (4)
HARGA-HARGA YANG PERLU UNTUK MENGHITUNG R
X
1i
X
2i
Y
i
x
1i
x
2i
y
i
x
1i
y
i
x
2i
y
i
y
i
2

10
2
4
6
8
7
4
6
7
6
7
3
2
4
6
5
3
3
4
3
23
7
15
17
23
22
10
14
20
19
4
4
2
0
2
1
2
0
1
0
3
1
2
0
2
1
2
0
1
0
6
10
2
0
6
5
7
3
3
2
24
40
4
0
12
5
14
0
3
0
18
10
4
0
12
5
7
3
0
2
36
100
4
0
36
25
49
9
9
4
Jumlah 102 57 272

Dari persamaan regresi linier ganda telah didapat a
1
= 2,50, a
2
= 0,48 dan dari daftar di atas
diperoleh x
1i
y
i
= 102, x
2i
y
i
= 57 dan y
i
2
= 272.
Maka, rumus (20) memberikan:
R
2

=
( )( ) ( )( )
272
57 48 , 0 102 50 , 2 +

R
2
= 0,8369

Koefisien korelasi ganda R = 0,914; suatu korelasi yang tinggi.
Dari rumus (22) kita dapa t menghitung kekeliruan baku taksiran s
y.12
.
Untuk ini perlu dihitung s
y
. Jika dihitung, s = 30,22 sehingga

0,8369 = 1
( ) 22 , 30 9
7
2
12 . y
s
atau s .
12
= 6,3371
Untuk harga k (banyak variabel bebas) yang kecil, koefisien korelasi ganda dapat
dihitung pula dengan menggunakan koefisien korelasi antara dua variabel. Demikianlah
misalnya, untuk Y, X
1
dan X
2
, koefisien korelasi ganda R, di sini akan dinyatakan dengan
R
y.12
, dapat dihitung dengan rumus:

(23)

Dengan r
y1
= koefisien korelasi antara Y dan X
1
Dengan r
y2
= koefisien korelasi antara Y dan X
2

Dengan r
12
= koefisien korelasi antara X
1
dan X
2

yang masing-masing dihitung dengan salah satu rumus yang terdapat dalam bagian 3.
Dengan menggunakan koefisien korelasi ganda R ini, kita juga dapat menguji
keberartian korelasi ini, jadi juga menguji keberartian regresi.


Untuk ini digunakan statistik F yang ditentukan oleh:

(24)

dengan k menyatakan banyak variabel bebas dan n = ukuran sampel. Statistik F ini
R
y.12
=
2
12
12 2 1
2
2
2
1
1
2
r
r r r r r
y y y y

+

F =
( ) ( ) 1 / 1
/
2
2
k n R
k R


berdistribusi F dengan dk pembilang = k dan dk penyebut = (n k 1).
Jika rumus ini digunakan untuk menguji regresi dalam contoh di atas, dengan R
2
=
0,8369 dan k = 2 sedangkan n = 10, maka diperoleh F =
7 / 1631 , 0
2 / 8369 , 0
= 17,96 yang berarti
dalam taraf nyata 0,05.
Hasil ini sama dengan (kecuali desimal terakhir karena pembulatan) harga F yang
dihitung oleh rumus (25). Memang demikianlah adanya, bahwa kedua rumus itu digunakan
untuk maksud yang sama.
(25)


Berhubungan erat dengan koefisien korelasi linier ganda adalah koefisien korelasi
parsil. Dengan ini dimaksudkan koefisien korelasi antara sebagian dari sejumlah variabel
apabila berhubungan dengan sebagian variabel lainnya dianggap tetap. Jelaslah bahwa
akibatnya akan banyak koefisien korelasi parsil yang dapat dihitung.
Untuk variabel-variabel Y, X
1
dan X
2
misalnya kita dapat menentukan koefisien korelasi
parsil antara Y dan X
1
dengan menganggap X
2
tetap, dinyatakan dengan r
y1.2
, dan koefisien
korelasi parsil antara Y dan X
2
apabila X
1
dianggap tetap, dinyatakan dengan r
y2.1
.
Rumusnya masing-masing adalah:

(26) . . .


(27)


F =
( ) 1 /
/
k n JK
k JK
res
reg

r
y1.2
=
( )( )
2
12
2
2
12 2 1
1 1 r r
r r r
y
y y



r
y2.1
=
( )( )
2
12
2
1
12 1 2
1 1 r r
r r r
y
y y




Di mana r
y1
, r
y2
, dan r
12
merupakan koefisien-koefisien korelasi seperti dijelaskan untuk
mendapatkan rumus (23).
Jika variabel-variabelnya Y, X
1
dan X
2
dan X
3
, maka akan didapat koefisien-koefisien korelasi
parsil r
y1.23
, r
y2.13
, r
y3.12
, di mana r
y3.12
misalnya, menyatakan koefisien korelasi parsil antara Y
dan X
3
jika X
1
dan X
2
tetap.
r
y1.23
adalah:

(28). . .


dengan koefisien-koefisien korelasi parsil yang ada di ruas kanan dapat dihitung dengan
rumus (26).
Akhirnya, dapat dikemukakan bahwa antara koefisien korelasi, koefisien korelasi ganda dan
koefisien korelasi parsil terdapat hubungan tertentu. Untuk variabel-variabel Y, X
1
dan X
2

misalnya, didapat hubungan:
(29)

Dan untuk Y, X
1
, X
2
dan X
3
berlaku:
(30)

Contoh:
Untuk data dalam daftar (4), kita dapat menghitung koefisien korelasi r
y1
, r
y2
, r
12
dengan
rumus (3). Hasilnya adalah r
y1
= 0,92; r
y2
= 0,74 dan r
12
= 0,86. Dengan rumus (26) didapat
koefisien korelasi parsil antara Y dan X
2
apabila X
1
tetap ialah:
r
y2.1
=
( )( )
( )( ) 7396 , 0 1 8464 , 0 1
86 , 0 92 , 0 74 , 0



r
y1.23
=
( )( )
2
2 . 13
2
2 . 3
2 . 13 2 . 3 2 . 1
1 1 r r
r r r
y
y y



(1R
2
y.12
) = (1r
2
y1
) (1r
2
y2.1
)
(1R
2
y.123
) = (1r
2
y1
) (1r
2
y2.1
) (1r
2
y3.12
)

r
y2.1
= 0,257
Koefisien korelasi gandanya telah dihitung dari daftar (4) ialah R = R
y.12
= 0,8369.


9. UJI KOEFISIEN REGRESI GANDA
Berapa besar kontibusi yang diberikan oleh setiap variabel bebas terhadap prediksi
variabel takbebas Y berdasarkan regresi linier ganda.
Meskipun di situ telah diberikan cara uji keberartian regresi, uji F dengan statisitik F
seperti dicantumkan dalam rumus (25), namun kita belum tahu beberartian adanya setiap
variabel bebas dalam regresi itu. Oleh karena itu, perlu diadakan pengujian tersendiri
mengenai koefisien-koefisien regresi, seperti halnya pengujian mengenai koefisien-koefisien

1
, dan
2
, utamanya
2
, untuk regresi linier Y =
1
+
2
X yang telah diberikan dalam bagian
7.
Mengikuti arah pemikiran dalam bagian 7, bab XV, kita misalkan populasi mempunyai
model regresi linier ganda:

y.x1x2
. . .
xn
=
0
+
1
X
1
+
2
X
2
+ . . .+
k
X
k
yang berdasarkan sebuah sampel acak berukuran n ditaksir oleh regresi berbentuk
= a
0
+ a
1
X
1
+ a
2
X
2
+ . . . + a
k
X
k
Akan diuji hipotesis H
0
melawan hipotesis tandingan H
1
dalam bentuk:

= =
= =
k i H
k i H
i
i
,..., 2 , 1 , 0 :
,..., 2 , 1 , 0 :
1
0
u
u

Untuk menguji hipotesis ini digunakan kekeliruan baku taksiran s
y.12 . . . k
, jumlah
kuadrat-kuadrat. Ex
ij
dengan x
ij
= X
j
X
j
dan koefisien korelasi ganda antara variabel X
1
yang
dianggap variabel tak bebas dengan variabel-variabel bebas sisanya yang ada dalam
regresi, diberi simbul R
i
. Koefisien korelasi ganda R
i
ini dihitung oleh rumus (20) dengan
mengganti y
j
oleh x
ij
dan JK
reg
sekaran dihitung untuk regresi X
i
atas X
1
, X
2
, . . . , X
i1
, X
i +1
, . .

. , X
k
.
Dengan besaran-besaran ini, dibentuk
kekeliruan baku koefisien a
j
, yakni:
(31)


Selanjutnya hitung statistik
(32)


yang ternyata akan berdistribusi Student t dengan derajat kebebasan dk = (n k 1).
Kriterianya adalah tolak hipotesis H
0
jika t
i
terlalu besar ataupun terlalu kecil. Dalam hal ini
H
0
diterima.
Contoh:
Menggunakan contoh mengenai data dalam daftar (4) dengan regresi ganda Y = 3,92 + 2,50
X
1
0,48 X
2
, telah diperoleh:
s
2
y.12
= 6,3371, x
2
1j
= 46 , x
2
2j
= 22
R
1
= r
12
= 0,86 dan R
2
= r
21
= r
12
= 0,86.
Dengan rumus (31) didapat
s
21
=
( )( ) 7396 , 0 1 46
3371 , 6

= 0,7274
s
a2
=
( )( ) 7396 , 0 1 22
3371 , 6

= 1,0518
sedangkan dari rumus (32) diperoleh:
t
1
=
7274 , 0
50 , 2
= 3,44 dan
S
ai
=
( )( )
2 2
2
... 12 .
1
i ij
k y
R x
s
E

t
i
=
ai
i
s
a


t
2
=
0518 , 1
48 , 0
= 0,46
dari daftar distribusi t dengan dk = 7 dan = 0,05 didapat t = 2,36. Nampak bahwa koefisien
untuk X
1
berarti tetapi koefisien untuk X
2
tidak. Prediksi pengeluaran untuk barang A
hanyalah pendapatan yang memberikan kontribusi berarti sedangkan banyak jiwa dalam
keluarga tidak. Ini bisa saja karena barangkali barang A tidak merupakan kebutuhan
bersama dalam keluarga ini

10. KORELASI BISERI
Korelasi antara dua variabel atau lebih yang sifatnya kuantitatif telah dibahas pada
bagian-bagian yang lalu. Demikian pula mengenai asosiasi antara dua faktor berbentuk
atribut.
Sekarang akan kita lihat bagaimana hubungan antara variabel kontinu Y yang dapat
diukur secara kuantitatif dan faktor X yang sifatnya dikotomus, yakni yang terjadi atas dua
kategori. Misalnya, mungkin kita ingin mengetahui korelasi antara nilai ujian tertulis (Y) dan
hasil pekerjaan rumah (X) yang dikategorikan ke dalam memuaskan atau tidak memuaskan,
ujian lisan yang digolongkan lulus atau tidak lulus dan sebagainya. Derajat hubungan yang
digunakan untuk hal demikian dinamakan koefisien korelasi biseri.
Agar supaya koefisien korelasi biseri dapat dihitung dan mempunyai taksiran yang
berarti, maka diperlukan asumsi-asumsi berikut:
1) Y berdistribusi normal
2) Asal distribusi variabel X yang digolongkan menjadi dua kategori berbentuk normal
3) Regresi untuk variabel Y atas X berbentuk linier
Dengan adanya dua kategori variabel X, maka ada nilai-nilai variabel Y yang masuk
kategori pertama dan ada yang masuk kategori kedua. Yang menjadi kategori pertama
biasanya diambil kelompok yang bersifat superior atau yang mempunyai karakteristik yang

dikehendaki. Jika selanjutnya dimisalkan:
Y = rata-rata variabel Y yang didapat karena kategori pertama
2
Y
= rata-rata variabel Y yang didapat karena kategori kedua
s
y
= simpangan baku untuk semua nilai Y
p = proporsi pengamatan yang ada di dalam kategori pertama
q = proporsi pengamatan yang ada di dalam kategori kedua
u = tinggi ordinat dari kurva normal baku pada titik z yang memotong bagian luas
normal baku menjadi bagian p dan q.
Maka rumus untuk koefisien biseri, dinyatakan r
b
adalah:

(33)

Di mana, tentu saja p + q = 1
Contoh:
Data berikut merupakan hasil ujian semacam mata pelajaran dari 145 murid. Ke-145 murid
dibagi menjadi dua kelompok ialah belajar sebelum ujian dan tidak belajar sebelum ujian
mereka lakukan.
DAFTAR (5)
HASIL UJIAN UNTUK DUA KELOMPOK MURID
Nilai Ujian
(Y)
Belajar Tidak
Belajar
Jumlah
55 59
60 64
65 69
70 74
1
0
1
2
31
27
30
16
32
27
31
18
R
b
=
( )
y
us
pq Y Y
2 1



75 79
80 84
85 89
5
6
6
12
3
5
17
9
11
Jumlah 21 124 145

Dari daftar di atas mudah dihitung, dengan menyatakan kelompok belajar sebagai kategori
pertama, bahwa:
1
Y = 79,38;
2
Y = 66,19; s
y
= 9,26
p =
145
21
= 0,1448 dan q = 0,8552
daftar normal baku, daftar F dalam lampiran, dengan p dan q di atas, memberikan z = 1,06.
Dari daftar tinggi ordinat normal baku, daftar E dalam lampiran, dengan z = 1,06 ini didapat
tinggi ordinat u = 0,2275. Jika disubstitusikan ke dalam rumus (33) didapat:
r
b
=
) 26 , 9 )( 2275 , 0 (
) 8552 , 0 )( 1448 , 0 )( 19 , 66 38 , 79 (

r
b
= 0,7753
Seperti diharapkan akan ada hubungan yang kuat antara nilai ujian dan persiapan belajar
sebelum menempuh ujian.

11. PENAFSIRAN
Penafsiran dari suatu bilangan korelasi terutama tergantung pada ketentuan-ketentuan
dari penelitiannya dan sampai seberapa jauh latar belakang seseorang di dalam bahan ilmu
yang diteliti. Pengalaman lampau dalam bidang itu biasanya menjadi dasar untuk
perbandingan di dalam penetapan apakah suatu bilangan korelasi tertentu perlu
diperhatikan. Akan tetapi, sebagai suatu peraturan umum yang kasar, pedoman-pedoman
berikut dapat menolong. Korelasi antara 0 sampai 0,25 menunjukkan sedikit atau tidak ada

hubungan, antara 0,25 sampai 0,50 menunjukkan hubungan cukup besarnya, antara 0,50
sampai 0,75 suatu hubungan yang sedang sampai baik, dan diatas 0,75 suatu hubungan
yang sangat baik sampai istimewa. Jadi menurut patokan-patokan ini, himpunan data yang
pertama menunjukkan korelasi yang baik dan kedua boleh dikatakan tidak menunjukkan
korelasi
Penafsiran yang lain terlihat dari daftar tabel di bawah ini
DAFTAR (6)
PENAFSIRAN KOEFISIEN KORELASI
Korelasi
tinggi
Tinggi Rendah Rendah
Tanpa
korelasi
Tak
ada
korelasi
(acak)
Tanpa
korelasi
Rendah Rendah Tinggi
Korelasi
tinggi
1
<
0.9
> 0.9 < 0.4 > 0.4 0 < +0.4 > +0.4 < +0.9
>
+0.9
+1

Kadang kadang seseorang menjumpai korelasi-korelasi sebesar 0,95 atau lebih tinggi.
Bila korelasi-korelasi semacam itu timbul, terutama di bidang biologi dan dimana data
manusia terlibat, seseorang harus segera curiga. Korelasi-korelasi setinggi ini boleh
dikatakan terlalu baik untuk dapat benar. Bila korelasi-korelasi sangat tinggi yang tidak
diharapkan ditemukan, adalah bijaksana untuk bertanya apakah hubungan yang kuat
tersebut mungkin suatu hasil yang dibuat-buat. Sebagai contoh, seseorang seharusnya tidak
heran menjumpai korelasi yang tinggi antara nilai-nilai dari mahasiwa-mahasiswa kedokteran
dalam ilmu penyakit dalam dan rata-rata nilai mereka selama tingkat-tingkat klinik. Nilai ilmu
penyakit dalam ikut di dalam penentuan rata-rata nilai, dan nilai ilmu penyakit dalam ini
biasanya mendapat pembobotan yang paling tinggi di dalam perhitungan-perhitungan.




















BAB III
KESIMPULAN

Analisis korelasi adalah suatu analisa yang membahas derajat hubungan antara satu
variabel dengan variabel lainnya. Koefisien korelasi (r) Pearson Product Moment : yakni
suatu ukuran yang sudah dianggap baku untuk mengukur hubungan antara dua variabel.
Korelasi merupakan angka yang menunjukkan arah dan kuatnya hubungan antar dua
variabel (atau lebih). Rumus koefisien korelasi





Arah dinyatakan dalam bentuk hubungan positif (+) atau negatif (), sedangkan
kuatnya hubungan dinyatakan dengan besarnya koefisien korelasi. Koefisien korelasi
memiliki rentang nilai antara 1 sampai 1. jika hubungan antara 2 variabel memiliki korelasi
1 atau 1 berarti kedua variabel tersebut memiliki hubungan yang sempurna, sebaliknya jika
hubungan antara 2 variabel memiliki korelasi 0 berarti tidak ada hubungan antara kedua
variabel tersebut.
Pedoman-pedoman berikut dapat menolong. Korelasi antara 0 sampai 0,25
menunjukkan sedikit atau tidak ada hubungan, antara 0,25 sampai 0,50 menunjukkan
hubungan cukup besarnya, antara 0,50 sampai 0,75 suatu hubungan yang sedang sampai
baik, dan diatas 0,75 suatu hubungan yang sangat baik sampai istimewa.
Analisis korelasi berbeda dengan analisis regresi. Namun analisis korelasi sukar
dipisahkan dari analisis regresi.










nX
i
Y
i
(X
i
) (Y
i
)

r =
( ) { } ( ) { }
2 2 2 2
i i i i
Y Y n X X n E E E E








DAFTAR PUSTAKA


1. Budiarto, Eko. Dasar-Dasar Metode Statistika Kedokteran. Penerbit Alumni. Bandung:
1984
2. Sudjana. Metoda Statistika. Penerbit Tarsito. Bandung: 2005.
3. Colton T. Statistika Kedokteran. Penerbit Gadjah Mada University Press. Yogyakarta:
1985
4. Anonim. Statistika. Diperoleh URL: http://id.wikipedia.org/wiki/Statistika. Last updated
Maret 2008
















VI

PENGUJIAN HIPOTESIS

Menguji hipotesis komparatif berarti menguji parameter populasi yang berbentuk perbandingan
melalui ukuran sampel yang juga berbentuk perbandingan. Hal ini juga dapat berarti menguji
kemampuan generalisasi (signifikasi hasil penelitian) yang berupa perbandingan keadaan variable dari
dua sampel atau lebih. Bila Ho dalam pengujian diterima, berarti nilai perbandingan dua sampel atau
lebih tersebut dapat digeneralisasikan untuk seluruh populasi dimana sampel-sampel diambil dengan
taraf kesalahan tertentu.
Desain penelitian masih menggunakan variable mandiri, (satu variable) seperti halnya dalam penelitian
deskriptif, tetapi variable tersebut berada pada populasi dan sampel yang berbeda, atau pada populasi
dan sampel yang sama tetapi pada waktu yang berbeda. Pengujian hipotesis komparatif dapat dipahami
melalui Gambar 6.1.
Terdapat dua model komparasi, yaitu komparasi antara dua sampel dan komparasi antara lebih dari
dua sampel yang sering disebut komparasi k sampel. Selanjutnya setiap model komparasi sampel
dibagi menjadi dua jenis yaitu sampel yang berkorelasi dan sampel yang tidak berkorelasi disebut
dengan sampel independen.


Gambar 6.1 Prinsip Dasar Pengujian Hipotesis Komparatif
Sampel yang berkorelasi biasanya terdapat dalam desain penelitian eksperimen. Sebagai contoh dalam
membuat perbandingan kemampuan kerja pegawai sebelum dilatih dengan yang sudah dilatih,
membandingkan niali pretest dan posttest dan membandingkan kelompok eksperimen dan kelompok
control (pegawai yang diberi latihan dan yang tidak).
Sampel independen adalah sampel yang tidak berkaitan satu sama lain, misalnya akan membandingkan
kemampuan kerja lulusan SMU dan SMK, membandingkan penghasilan petani dan nelayan dan
sebagainya. Bentuk komparasi sampel dapat dipahami melalui Tabel 6.1 berikut:
TABEL 6.1
BERBAGAI BENTUK KOMPARASI SAMPEL
Dua sampel
Lebih dari dua sampel
Berpasangan Independen Berpasangan Independen



Dalam pengujian hipotesis komparatif dua sampel atau lebih, terdapat berbagai teknik statistic yang
dapat digunakan. Teknik statistic mana yang akan digunakan tergantung pada bentuk komparasi dan
macam data. Untuk data interval dan ratio digunakan statistic parametris dan untuk dapat
Statistik
X1 : x2 : x3
Membuat Generalisasi
= berbentuk komparasi
dua sampel atau lebih/
menguji Hipotesis
Komparatif
Parameter
Populasi:
1 : 2 : 3

nominal/diskrit dapat digunakan statistic nonparametris. Tabel 6.2 dapat digunakan sebagai pedoman
untuk memilih teknik statistic yang sesuai.
A. Komparatif Dua Sampel
Pada bagian ini dikemukakan statistic yang digunakan untuk menguji hipotesis komparatif dua sampel
yang berkorelasi dan independen baik menggunakan statistic parametris maupun nonparametris.
Terdapat tiga macam hipotesis komparatif dua sampel dan cara mana yang akan digunakan tergantung
pada bunyi kalimat dalam merumuskan hipotesis. Tiga macam pengujian itu adalah:
1. Uji Dua Fihak
Uji dua fihak bila rumusan hipotesis nol dan alternatifnya berbunyi sebagai berikut:
Ho: tidak terdapat perbedaan (ada kesamaan) produktivitas kerja antara pegawai yang mendapat
kendaraan dinas dengan yang tidak.
Ha: terdapat perbedaan produktivitas kerja antara pegawai yang mendapat kendaraan dinas dengan
yang tidak.
Atau dapat ditulis dalam bentuk:
Ho: 1 = 2
Ha: 1 2
TABEL 6.2
BERBAGAI TEKNIK STATISTIK UNTUK MENGUJI
HIPOTESIS KOMPARATIF
MACAM DATA BENTUK KOMPARASI
Dua Sampel K Sampel
Korelasi Independen Korelasi Independen
Interval Ratio t-test * dua
sampel
t-test * dua
sampel
One Way Anova
*
Two Way Anova
One Way Anova *
Two Way Anova
Nominal Mc Nemar Fisher Exact
Chi Kuadrat Two
sample
Chi Kuadrat for k
sample
Cochran Q
Chi Kuadrat for k
sample

Ordinal Sign test
Wilcoxor:
Matched Pairs
Median test
Mann- Whitney U
test
Friedman
Two Way Anova
Median Extension
Kruskal-Walls
One Way Anova
*Statistik Parametris


Daerah Daerah
Penerimaan Ho Penolakan Ho



2. Uji Fihak Kiri
Uji fihak kiri digunakan apabila rumusan hipotesis nol dan alternatifnya adalah sebagai berikut:
Ho: prestasi belajar siswa SMU yang masuk sore hari lebih besar atau sama dengan yang masuk pagi
hari
Ha: prestasi belajar siswa SMU yang masuk sore hari lebih rendah dari yang masuk pagi hari.
Atau dapat ditulis dalam bentuk:
Ho: 1 2
Ha: 1 < 2
3. Uji Fihak Kanan

Uji fihak kanan digunakan bila rumusan hipotesis nol dan alternatifnya berbunyi sebagai berikut:
Ho: Disiplin kerja Pegawai Swasta lebih kecil atau sama dengan Pegawai Negeri.
Ha: Disiplin kerja Pegawai Swasta lebih besar dari Pegawai Negeri.
Atau dapat ditulis dalam bentuk:
Ho: 1 2
Ha: 1 > 2
Daerah penerimaan Ho dan Ha untuk ketiga macam uji hipotesis tersebut, seperti ditunjukkan pada
gambar-gambar yang ada pada uji deskriptif (satu sampel).
1. Sampel Berkorelasi
a. Statistik Parametris
1) T-test
Statistic parametris yang digunakan untuk menguji hipotesis komparatif rata-rata dua sampel bila
datanya berbentuk interval atau ratio adalah menggunakan t-test.
Rumusan t-test yang digunakan untuk menguji hipotesis komparatif dua sampel yang
berkorelasi ditunjukkan pada Rumus 6.1.


Dimana:
x1 = Rata-rata sampel 1
x2 = Rata-rata sampel 2
s1 = Simpangan baku sampel 1
s2 = Simpangan baku sampel 2
s12 = Varians sampel 1
s22= Varians sampel 2
r = Korelasi antara dua sampel

Contoh Pengujian Hipotesis:
Dilakukan penelitian untuk mengetahui ada tidaknya perbedaan produktivitas kerja

pegawai sebelum dan setelah diberi kendaraan dinas. Berdasarkan 25 sampel pegawai
yang. dipilih secara random dapat diketahui bahwa produktivitas pegawai sebelum
dan sesudah diberi kendaraan dinas adalah seperti ditunjukkan pada Tabel 6.3.
Ho : Tidak terdapat perbedaan nilai produktivitas kerja pegawai antara sebelum dan
setelah mendapat kendaraan dinas.
Ha : Terdapat perbedaan nilai produktivitas kerja pegawai antara sebelum dan setelah
mendapat kendaraan dinas.


Dan data pada Tabel 6.3 tersebut telah dapat dihitung rata-rata nilai produktivitas
sebelum memakai kendaraan dinas xi = 74, simpangan baku s1 = 7,50, dan varians
s12 = 56,25. Rata-rata nilai produktivitas setelah memakai kendaraan dinas x2 =
79,20, simpangan baku s2 = 10,17 dan varians s22 =103,50.

TABEL 6.3
NILAI PRODUKTIVITAS 25 KARYAWAN
SEBELUM DAN SESUDAH DIBERI KENDARAAN DINAS

No. Responden Produktivitas Kerja
Sebelum (X1) Sesudah (X2)
1. 75 85
2. 80 90
3. 65 75
4. 70 . 75
5. 75 75
6. 80 90
7. 65 70
8. 80 85

9. 90 95
10. 75 70
11. 60 65
12. 70 75
13. 75 85
14. 70 65
15. 80 95
16. 65 65
17. 75 80
18. 70 80
19. 80 90
20. 65 60
21. 75 75
22.
23.

80
70

85
80

24. 90 95
25. 70 75
Rata-rata X1 74,00 X2 79,20
SimpanganBaku S1 7,50 S2 10,17
Varians S12 56,25 S22 103,50


Korelasi antara nilai sebelum mendapat kendaraan dinas dan sesudah mendapat
kendaraan dinas r ditemukan sebesar 0,866. Harga-harga tersebut selanjutnya
dimasukkan dalam Rumus 6.1.



Harga t tersebut selanjutnya dibandingkan dengan harga t tabel dengan dk = n1+ n2-2
= 50-2 = 48. Dengan dk = 48, dan bila taraf kesalahan ditetapkan sebesar 5%, maka t
tabel = 2,013.

Harga t hitung lebih kecil dan t tabel, ( 4,952 < 2,013) sehingga Ho diterima dan
Ha ditolak. (Lihat kedudukan t hitung dan t tabel dalam Gambar 6.3). Jadi terdapat
perbedaan secara signifikan, nilai produktivitas kerja pegawai sebelum diberi
kendaraan dinas dan sesudah dibeni kendaraan dinas. Setelah diberi kendaraan
dinas nilai produktivitas dalam sampel kerjanya meningkat.



Gambar 6.3 Uji Hipotesis Komparatif Dua Fihak untuk Membandingkan 25
Karyawan Sebelum dan Sesudah Diberi Kendaraan Dinas


18,5 > 8, maka Ho diterima. Jadi dapat disimpulkan bahwa ruangan kerja yang diberi AC tidak
mempunyai pengaruh yang signifikan terhadap produktivitas kerja pegawai.
Bila sample pasangan leboh besar dari 25, maka distribusinya akan mendekati distribusi
normal. Untuk itu digunakan rumus z dalam pengujiannya.

z =
T
T
T
o

Rumus 6.6

Dimana:
T = jumlah jenjang/rangking yang kecil, pada contoh diatas = 18,5.


TABEL 6.8
TABEL PENOLONG UNTUK TEST WILCOXON

T
=
4
) 1 ( + n n

T
=
24
) 1 2 )( 1 ( + + n n n

Dengan demikian,

z =
T
T
T
o

=
24
) 1 2 )( 1 (
4
) 1 (
+ +
+

n n n
n n
T


Rumus ini dapat juga digunakan umtuk membuktikan contoh di atas dan hasilnya sama.
Harga-harga dalam contoh dimasukkan dalam rumus tersebut, sehingga:

No
Pegawai
X
A1
X
B2
Beda Tanda Jenjang
X
B1
-X
A1
Jenjang + -
1
2
3
4
5
6
7
8
9
10
100
98
76
90
87
89
77
92
78
82
105
94
78
98
90
85
86
87
80
83
+ 5
- 4
+ 2
+ 8
+ 3
- 4
+ 9
- 5
+ 2
+ 1
7,5
5,5
2,5
9,0
4,0
5,5
10,0
7,5
2,5
1,0
7,5
0,0
2,5
9,0
4,0
0,0
10,0
0,0
2,5
1,0
0,0
5,5
0,0
0,0
0,0
5,5
0,0
7,5
0,0
0,0
Jumlah T = 36,5 -18,5

z =
24
) 1 10 . 2 )( 1 10 ( 10
4
) 1 10 ( 10
5 , 18
+ +
+

=
8 , 9
5 , 27 5 , 18
= - 0,918

Bila taraf kesalahan 0,025 (p), maka harga z tabel = 1,96 (tabel XIV Lampiran). Harga z
hitung -0,918 ternyata lebih kecil dari -1,96 (ingat harga (-) tidak diperhitungkan, karena harga
mutlak), dengan demikian Ho diterima. Jadi AC tidak berpengaruh signifikansi dalam meningkatkan
produktivitas kerja pegawai. Kesimpulan ini sama dengan di atas.


2. Sampel Independen (Tidak Berkorelasi)
Menguji hipotesis dua sampel independen adalah menguji kemampuan generalisasi rata-rata data dua
sampel yang tidak berkorelasi. Seperti telah dikemukakan bahwa sampel-sampel yang berkorelasi
biasanya terdapat pada rancangan penelitian eksperimen. Pada penelitian survey, biasanya sampel-
sampel yang dikomparasikan adalah sampel independen. Contoh, perbandingan penghasilan petani dan
nelayan, disiplin kerja pegawai negeri dan swasta.
Teknik stastistik yang digunakan untuk menguji hipotesis komparatif, tergantung pada jenis
datanya. Teknik statistik t-test adalah merupakan teknik statistik parametris yang digunakan untuk
menguji komparasi data rasio atau interval, sedangkan statistik nonparametris yang dapat digunakan
adalah : Media Test, Mann-Whitney, Kolmogorve-Smirnov, Fisher Exact, Chi=kKuadrat, Test Rub
Wald-Wolfowitz. Statistik nonparametris digunakan untuk menguji hipotesis bila datanya nominal dan
ordinal.

a. Statistik Parametris
1) t-test
Terdapat dua rumus t-test yang dapat digunakan untuk menguji hipotesisi komparatuf dua sampel
independen. Rumus tersebut ditunjukan pada Rumus 6.7 dan rumus 6.8 berikut.
Separated Varians :


t =
2
2
2
1
2
1
2 1
n
s
n
s
+
_ _
Rumus 6.7





Polled Varians :

t =
|
|
.
|

\
|
+
+
+

2 1 2 1
2
2
2
2
1 2 1
2 1
1 1
2
) 1 ( ) (
n n n n
s n s n n
_ _
Rumus 6.8


Terdapat beberapa pertimbangan dalam memilih rumus t-test yaitu:
a) Apakah dua rata-rata itu berasal dari dua sampel yang jumlahnya sama atau tidak?
b) Apakah varians data dari dua sampel itu hmogen atau tidak. Untuk menjawab itu perlu pengujian
homogenitas varians

Berdasarkan dua hal tersebut diatas, maka berikut ini diberikan petunjuk untuk memilih
rumus t-test.
(a) Bila jumlah anggota sampel n
1
= n
2
dan varians homogens (
1
2
=
2
1
), maka dapat digunakan
rumus t-test, baik untuk separated maupun polled varians, yaitu Rumus 6.7 dan Rumus 6.8 untuk
menegtahui t tabel digunakan dk yang besarnya dk = n
1
+ n
2
-2.

(b) Bila n
1
n
2
, varians homogen (
1
2
=
2
2
) dapat digunakan t- test dengan polled varians, yaitu
Rumus 6.8. Besarnya dk = n
1
+ n
2
2.
(c) Bila n
1
= n
2
, varians tidak homogen (
1
2

2
2
) dapat digunkan Rumus 6.7 maupun Rumus 6.8
dengan dk= n
1
1 atau dk = n
2
1. Jadi derajat kebebasan (dk) bukan n
1
+ n
2
2 (phopan, 1973)
(d) Bila n
1
n
2
dan varians tidak homogen (
1

2
). Untuk ini digunakan rumus separated varians.
Rumus 6.7 harga t sebagai pengganti harga t tabel dihitung dari selisih harga t tabel dengan dk =

n
1
1 dan dk = n
2
1 , dibagi dua dan kemudian ditambah denga harga t yang terkecil. Contoh: n
1
= 25; berarti dk = 24, amak harga t tabel = 2,797 (Tabel II, lampiran). N
2
= 13, dk = 12, harga t
tabel = 3,055 (untuk kesalahan 1%, uji dua pihak). Jadi harga t tabel yang digunakan adalah
2
797 , 2 055 , 3
= 0,129. Selanjutnya harga ini ditmabah dengan harga t yang terkecil. Jadi 0,129
= 2,797 = 2,926. harga t = 2,926 (lihat Tabel II Lampiran) ini adalah sebagai pengganti harga t
tabel (Phopan, 1973)
Contoh 2. Pengujian Hipotesis
Dilakukan penelitian untuk mengetahui kecepatan memasuki dunia kerja antara lulusan SMU dan
SMK. Berdasarkan 22 responden lulusan SMU dan 18 responden lulusan SMK diperoleh data
bahwa lama menunggu untuk mendapatkan pekerjaan ke dua kelompok lulusan sekolah tersebutt
adalah seperti ditunjukkan pada Tabel 6.9 berikut.
Hipotesis yang diajukan adalah:
Ho : tidak terdapat perbedaan lama menunggu untuk mendapatkan pekerjaan antara lulusan SMU
dan SMK.
Ha : terdapat perbedaan lama menunggu untuk mendapatkan pekerjaan antara lulusan SMU dan
SMK.

Atau dapat ditulis dalam bentuk:
Ho :
1
=
2
Ha :
1

2

Untuk menentukan rumus t-test, akan dipilih untuk pengujian hipotesis, maka perlu diuji dulu
varians ke dua sampel homogen atau tidak. Pengujian homogenitas varians digunakan uji F dengan
rumus 6.9 berikut.





Dalam Tabel 6.9 dibawah dapat dilihat bahwa varians (kuadrat dari simpangan baku) terbesar
= 2,28 dan terkecil = 0,65. jadi F = 2,28 : 0,65 = 3,49. harga F hitung tersebut perlu dibandingkan
dengan F tabel (Tabel XII Lampiran), dengan dk pembilang = (22-1) dan dk penyebut = (18-1).
F = Varians terbesar
Varians terkecil




Berdasarkan dk pembilang = 21 dan penyebut 17, dengan taraf kesalahan ditetapkan = 5%, maka harga
F tabel = 2,22 (harga antara pembilang 20 dan 24).
TABEL 6.9
LAMA MENUNGGU LULUSAN SMU DAN SMK
UNTUK MENDAPATKAN PEKERJAAN
No. Lama Menunggu SMU
Dalam Tahun
Lama Menunggu SMK
Dalam Tahun
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
22.
6
3
5
2
5
1
2
3
1
3
2
4
3
4
2
3
1
5
1
3
1
4
2
1
3
1
3
2
2
1
3
1
1
1
3
2
1
2
2
1
n
1 =
22,00
x
1 =
2,91
s
1 =
1,51
s
1
2
=
2,28
n
2 =
18,00
x
2 =
1,78
s
2 =
0,81
s
2
2
=
0,65


Dalam hal ini berlaku ketemtuan, bila harga F hitung lebih kecil atau sama dengan F tabel
(F
h :
F
t
), maka Ho diterima dan Ha ditolak. Ho diterima berarti varians homogens.
Ternyata harga F hitung lebih besar dari F tabel (3,49 > 2,22). Dengan demikian Ho ditolak
dan Ha diterima. Hal ini berarti varians tidak homogen. Setelah diketahui varians tidak homogen (
1

2
) dan jumlah sampel kelompok 1 tidak sama dengan jumlah kelompok 2 (n
1
n
2
), maka sesuai
dengan pedoman yang telah dikemukakan digunakan Rumus 6.7, yaitu:

t = x
1
x
2 .
=

2,91 1,78 =

3,02
s
1
2
+
s
2
2
2,28 + 0,65
n
1
n
2
22 18
harga t hitung tersebut, selanjutnya dibandingkan dengan harga t tabel. T tabel dengan
digunakan t tabel penganti (karena jumlah sampel dan varians tidak homogen). T tabel dihitung dari
selisih harga t tabel dengan dk = n
1
-1 dan dk = n
2
- 2 dibagi dua, dan kemudian ditambahkan dengan
harga t yang terkecil.
n
1
= 22; dk = 21, maka t tabel = 2,08 ( = 5%)
n
2
= 18; dk = 17, maka t tabel = 2,11

Selisih kedua harga t tabel dan kemudian dibagi dua adalah (2,11-2,08) : 2 = 0,0015. harga
selanjutnya ditambahkan dengan t tabel yang terkecil yaitu: 2,08. jadi penganti adalah 2,08 + 0,015 =
2,095.
Berdasarkan perhitungan tersebut, ternyata t hitung lebih kecil dari t tabel (3,02 > 2,095).
Dengan demikian Ho ditolak dan Ha diterima. Jadi kesimpulannya terdapat perbedaan secara
signifikan masa menunggu untuk mendapatkan pekerjaan antara lulusan SMU dan SMK (dalam
satuan tahun). Lulusan SMK cenderung lebih cepat mendapatkan pekerjaan.

1) Chi Kuadrat (X
2
) dua sampel
Chi kuadrat (X
2
) digunakan untuk menguji hipotesis komparatif dua sampel bila datanya berbentuk
nominal dan sampelnya besar. Cara perhitungan dapat menggunakan rumus yang telah ada, atau dapat
menggunakan Tabel Kontingensi 2x2 (dua baris x dua kolom).


Kelompok Tingkat Pengaruh Perlakuan
Berpengaruh Tdk.berpengaruh
Jumlah Sampel
Kelompok Eksperimen a b a+b

Kelompok Kontrol c d c+d
Jumlah a+c b+d n
n : jumlah sampel

Dengan memperhatikan koreksi Yates, rumus yang digunakan untuk menguji hipotesis adalah
sebagai berikut (Rumus 6.10)

Contoh 1:
Penelitian dilakukan untuk mengetahui pengaruh diklat terhadap prestasi kerja karyawan
prestasi kerja karyawan di PT.Mindanau. Kelompok yang diberi diklat sebanyak 80 orang, dan yang
tidak diberi diklat sebanyak 70 orang. Setelah diklat berakhir, dan mereka kembali bekerja, maka dari
80 orang itu yang berprestasi bertambah sebanyak 60 orang, yang tidak bertambah sebanyak 20 orang.
Selanjutnya dari kelompok kontrol yang tidak.....................

















X
2
= n ( Iad-bcI- n)
2

(a+b)(a+c)(b+d)(c+d)



















VII
BAB I
PENDAHULUAN

Latar belakang masalah
Disadari atau tidak, statistika telah banyak digunakan dalam kehidupan sehari-hari.
Terutama dalam dunia penelitian atau riset, di mana pun dilakukan, bukan saja telah
mendapat manfaat yang baik dari statistika tetapi sering harus menggunakannya. Guna
mengetahui apakah cara yang baru ditemukan lebih baik daripada cara lama, melalui riset
yang dilakukan di laboratorium atau penelitian yang dilakukan di lapangan, perlu diadakan
penilaian dengan statistika. Statistika mampu untuk menentukan apakah faktor yang satu

dipengaruhi atau mempengaruhi faktor lainnya.
Apakah yang dimaksudkan dengan statistika? Penggunaan istilah
statistika berakar dari istilah dalam bahasa Latin modern statisticum
collegium (dewan negara) dan bahasa Italia statista (negarawan atau
politikus). Gottfried Achenwall (1749) menggunakan Statistik dalam bahasa Jerman
untuk pertama kalinya sebagai nama bagi kegiatan analisis data kenegaraan,
dengan mengartikannya sebagai "ilmu tentang negara (state). Pada awal
abad ke-19 telah terjadi pergeseran arti menjadi "ilmu mengenai pengumpulan
dan klasifikasi data". Sir John Sinclair memperkenalkan nama Statistics dan
pengertian ini ke dalam bahasa Inggris. Jadi, statistika secara prinsip mula-mula
hanya mengurus data yang dipakai lembaga-lembaga administratif dan
pemerintahan. Pengumpulan data terus berlanjut, khususnya melalui sensus
yang dilakukan secara teratur untuk memberi informasi kependudukan yang
berubah setiap saat.
Statistika menurut Yule dan Kendall dalam bukunya An Introduction to The Theory
of Statistics adalah....statistics as a quantitative data affected to a marked extent by a
multiplicity of causes, and statistical method as methods specially adapted to the elucidation
of quantitative data affected by a multiplicity of causes. Sedangkan menurut P. Armitage
dalam bukunya yang berjudul Statistical Methods in Medical Research.... statistics as the
discipline concerned with the treatment of numerical data derived from groups of individuals.
Saat ini pengertian statistika secara sederhana yang cukup sering digunakan adalah
pengetahuan yang berhubungan dengan cara-cara pengumpulan data, pengolahan atau
penganalisisannya dan penarikan kesimpulan berdasarkan kumpulan data dan

penganalisisan yang dilakukan. Singkatnya, statistika adalah ilmu yang berkenaan dengan
data.
Istilah 'statistika' (bahasa Inggris: statistics) berbeda dengan 'statistik'
(statistic). Statistika merupakan ilmu yang berkenaan dengan data, sedang
statistik adalah data, informasi, atau hasil penerapan algoritma statistika pada
suatu data. Statistika pada prinsipnya terbagi menjadi dua yaitu statistika
deskriptif yang terdiri dari:
a. pengumpulan data
b. pengolahan data
c. penyajian data menggunakan tabel-tabel atau grafik
d. analisis data, perhitungan nilai tengah, variasi, rata-rata dan rasio;
sehingga data mentah lebih mudah dibaca dan lebih bermakna dan statistika inferensial
atau statistika induktif yaitu berupa penarikan kesimpulan ciri-ciri populasi berdasarkan teori
estimasi dan uji hipotesis, melakukan prediksi observasi masa depan, atau membuat
permodelan hubungan (korelasi, regresi, ANOVA, deret waktu). Antara keduanya memiliki
perbedaan yang jelas dimana statistika deskriptif dibuat berdasarkan hasil observasi yang
nyata, sedangkan statistika inferensial berdasarkan suatu perkiraan untuk menggambarkan
ciri-ciri populasi yang seringkali tidak diketahui.
Selain itu juga dikenal adanya statistika kesehatan dan statistika kedokteran.
Statistika kesehatan merupakan kumpulan keterangan berbentuk angka yang berhubungan
dengan masalah kesehatan masyarakat. Manfaat dengan adanya statistika kesehatan antara
lain:
- menentukan ada dan besarnya masalah kesehatan masyarakat
- menentukan prioritas masalah dan memilih alternatif pemecahan masalah
kesehatan secara efisien

- membuat perencanaan program kesehatan
- mengadakan evaluasi pelaksanaan program kesehatan
- dokumentasi untuk mengadakan perbandingan di masa yang akan datang
- mengadakan penelitian masalah kesehatan yang belum diketahui atau menguji
kebenaran suatu masalah kesehatan
- memberi penerangan tentang kesehatan pada masyarakat.
Statistika kedokteran adalah penerapan teori statistik yang dinyatakan dalam bentuk angka
yang berhubungan dengan masalah kedokteran. Dengan adanya statistika kedokteran, kita
dapat memperoleh informasi yang berhubungan dengan masalah kedokteran seperti angka
kematian akibat penyakit tertentu, juga dapat membantu guna mengadakan penelitian
tentang efektifitas, efisiensi dan keamanan suatu obat baru atau suatu prosedur pengobatan.
Bila kita berbicara mengenai statistika selalu ada kaitannya dengan data. Data
sendiri adalah sekumpulan keterangan hasil pengukuran atau penghitungan yang dinyatakan
dalam bentuk angka, baik yang belum disusun atau telah disusun dalam bentuk tabel. Ada
macam-macam data yang dikenal yakni:
1. data kuantitatif dan data kualitatif
Data kuantitatif adalah data yang dinyatakan dalam bentuk angka yang
dihasilkan dari suatu pengukuran misalnya kadar Hb. Angka yang dihasilkan dapat
berupa bilangan pecahan/desimal, atau berupa bilangan bulat. Hal yang paling
ditonjolkan adalah jumlahnya. Data kuantitatif dibedakan menjadi dua yaitu skala
interval dan skala rasio. Ciri khas dari tipe data dengan skala interval adalah memiliki
kemampuan mengklasifikasikan dan membentuk tingkatan dan tidak adanya nilai nol
mutlak. Artinya, angka nol yang digunakan bukan berarti tidak ada. Contoh: Derajat
suhu. Di dalam skala Celcius misalnya, Nol derajat Celcius bukan berarti tidak ada
suhu. Nol derajat itu memiliki suhu, hanya saja dilambangkan dengan nol. Selain itu,
jarak antar setiap angka yang digunakan adalah sama. Pada data dengan skala

rasio angka nol dianggap mutlak. Contoh: data berat badan (kg). Angka Nol kg
berarti memang tidak ada berat.
Data kualitatif adalah data yang menjelaskan tentang sifat, misalnya baik-buruk,
jenis kelamin, agama. Data inipun terbagi menjadi dua yaitu data nominal atau
disebut juga data kategori dan data ordinal. Data nominal digunakan untuk
mengklasifikasikan informasi/data. Contoh:Data jenis kelamin = Laki-laki dan
Perempuan. Sedangkan data ordinal digunakan untuk mengklasifikasikan serta
memiliki tingkatan. Tipe data ordinal lebih tinggi dari Nominal karena kemampuannya
untuk membentuk tingkatan. Contoh:Jabatan di dalam perusahaan = karyawan,
manager, direktur utama.
2. data primer dan data sekunder
Data primer ialah data yang diperoleh dari hasil pengumpulan sendiri, diolah,
dianalisis serta dipublikasikan sendiri. Sedangkan data sekunder adalah data yang
diperoleh dari hasil penelitian orang lain.
3. data diskrit dan data kontinyu
Data diskrit adalah data yang dihasilkan dari perhitungan, dapat berupa data
frekuensi atau data kategori. Data kontinyu ialah data yang dihasilkan dari
pengukuran dan dapat berupa bilangan bulat atau desimal tergantung alat ukur yang
digunakan, misalnya tinggi badan. Data diskrit lebih mudah untuk dianalisis tetapi
informasi yang dihasilkan menjadi kurang teliti bila dibandingkan dengan data
kontinyu.
Guna memperoleh informasi yang lebih mendalam, maka data yang telah diolah
haruslah dianalisis lebih lanjut. Beberapa cara analisis data yang cukup sering digunakan
dalam statistika antara lain teori estimasi dan uji hipotesis. Teori estimasi digunakan untuk
menaksir ciri-ciri tertentu suatu populasi, melalui parameternya, seperti rata-rata, proporsi
dan jumlah ciri tertentu. Data yang digunakan biasanya data kuantitatif. Dalam bidang

kedokteran, teori estimasi digunakan untuk menaksir banyaknya suatu penyakit atau
menaksir prognosis penyakit tertentu. Dalam bidang kesehatan masyarakat, teori estimasi
digunakan untuk menaksir keadaan kesehatan penduduk suatu wilayah atau jumlah
kunjungan puskesmas dan lain-lain. Uji hipotesis membandingkan nilai statistik sampel
dengan nilai hipotesis. Data kuantitatif maupun kualitatif dapat diuji dengan cara ini
disesuaikan dengan keinginan peneliti.

Rumusan masalah
Setelah kita mengenal apa itu statistika beserta cakupannya di atas, timbul
pertanyaan bagaimana aplikasinya dalam penelitian kesehatan masyarakat mengingat cukup
banyaknya permasalahan kesehatan masyarakat yang dijumpai dan harus segera ditangani.
Tulisan berikut akan membahas bagaimana strategi analisis data kategori dalam penelitian
kesehatan masyarakat. Kita akan membahas mengenai analisis chi square sebagai strategi
tepat guna menganalisis data kategori dalam penelitian masyarakat. Penelitian dalam bidang
kesehatan masyarakat maupun dalam bidang kedokteran sering menghasilkan dua variabel
di mana masing-masing variabel terdiri dari berbagai golongan atau kategori, misalnya;
tingkat beratnya penyakit, tingkat pendidikan, dan lain-lain. Dari hasil penelitian di atas, kita
ingin mengetahui apakah terdapat hubungan antara dua variabel atau apakah dua variabel
tersebut bersifat independen atau bersifat dependen. Guna menjawab pertanyaan di atas
kita menggunakan analisis chi square.
BAB II
PEMBAHASAN

Data kategori
Data kategori atau disebut juga data nominal merupakan data yang bersifat kualitatif.

Data kategori merupakan data yang paling sederhana yang terdiri dari jenis-jenis
pengamatan yang tidak berurutan, terbagi dua ini atau itu. Para ahli matematika
menyebutnya sebagai pembagian dengan skala 0-1, seperti golongan darah, jenis kelamin
atau jenis pekerjaan.

Analisis Chi Square
Distribusi chi square merupakan distribusi sampling dengan variabel random yang
mendekati kontinyu dengan kurva miring ke kanan. Pendekatan ini makin baik pada sampel
yang cukup besar, dan kemiringan kurva distribusi chi square dipengaruhi oleh besarnya
derajat kebebasan yaitu makin besar derajat kebebasan, kemiringan akan berkurang hingga
pada suatu derajat kebebasan tertentu kurva tersebut menjadi simetris. Di bawah ini
diberikan sebuah contoh bentuk kurva dengan derajat kebebasan yang berbeda-beda:


a. kurva X
2
dengan derajat kebebasan (dk) 1

b. kurva X
2
dengan derajat kebebasan (dk) 5


c. kurva X
2
dengan derajat kebebasan (dk) 10




Uji chi square digunakan untuk mengetahui apakah ada perbedaan atau tidak di
antara lebih dari 2 proporsi sampel. Perhitungan didasarkan atas frekuensi observasi (fo) dan
frekuensi yang diharapkan (fe).
Dalam menggunakan chi square untuk keperluan pengujian hipotesis diperlukan
beberapa ketentuan, antara lain:
a. pengamatan harus bersifat independen.
Ini berarti bahwa jawaban sebuah subyek tidak mempunyai pengaruh terhadap
jawaban subyek lain atau sebuah subyek hanya boleh sekali digunakan dalam analisa.
b. chi square hanya dapat digunakan pada data frekuensi/kategori/nominal (data
kualitatif).

c. jumlah frekuensi yang diharapakan harus sama dengan jumlah frekuensi
pengamatan yang sebenarnya.
d. pada derajat kebebasan 1, tidak boleh terdapat nilai ekspektasi kurang dari 5,
kecuali dengan koreksi Yates.
Bila derajat kebebasan cukup besar, adanya satu angka 5 pada nilai ekspekatsi tidak
akan banyak mempengaruhi hasil yang diinginkan atau bila terdapat nilai 5 pada
ekspektasi dapat digabungkan pada nilai ekspektasi yang lain, tetapi bila hal ini
dilakukan akan mempengaruhi hasil penelitian atau informasi yang diperoleh akan
berkurang.
e. bila pada tabel 22 dijumpai nilai kurang dari 5, gunakan nilai Fisher Exact.
f. bila pada tabel 22 tidak ada nilai <5, sebaiknya digunakan uji continuity correction
(koreksi Yates).
g. untuk tabelnya yang lebih dari 22 misalnya 32 atau 33 digunakan uji Pearson
Chi-square.
h. sampel sebaiknya cukup besar.
Dalam statistik inferensial kegunaan chi square cukup banyak antara lain pengujian
hipotesis untuk kesamaan beberapa proporsi, estimasi deviasi, dan pengujian independensi.
Selain digunakan untuk tes data kualitatif atau binomial, juga dapat dipakai untuk tes
terhadap data multinominal serta dapat menjawab pertanyaan apakah ada atau tidak ada
asosiasi antara suatu variabel dengan outcomes?.

Pengujian hipotesis untuk kesamaan beberapa proporsi dengan Chi square
Bila kita memperoleh beberapa proporsi, misalnya: P
1
, P
2
, P
3
, P
4
, P
5
,....P
k
dengan
event-event atau kategori-kategori X
1
, X
2
, X
3
, X
4
, X
5
,....X
k
yang bersifat independen. Kita
ingin mengetahui apakah perbedaan proporsi hasil pengamatan memang berbeda atau

disebabkan karena faktor kebetulan saja. Guna mengetahui hal ini, kita membandingkan
hasil pengamatan terhadap hasil yang diharapkan dengan rumus:


X
2
=
( )

E
E O
2



Nilai ekspektasi (E) dapat dihitung dengan mengalikan besarnya sampel dengan
proporsi hasil pengamatan masing-masing. (O = observasi, E = ekspektasi)
E
1
= nP
1
, E
2
= nP
2
..... E
k
= nP
k

Hipotesis yang akan diuji:
H
0
: P = P
1
= P
2
= P
3
= ......P
k

H
a
: P P
1
= P
2
= P
3
= .......P
k
atau P
1
, P
2
, P
3
......P
k
tidak semuanya sama.
Derajat kebebasan adalah banyaknya kategori dikurangi 1 (dk = k 1).
Kriteria penerimaan hipotesis ialah bila X
2
hasil perhitungan lebih kecil dari X
2
yang
terdapat dalam tabel dengan dk = k 1 dan derajat kemaknaan .



Contoh 1 :
Dinyatakan status gizi anak balita di daerah X mempunyai perbandingan yang sama
yaitu gizi baik = gizi sedang = gizi kurang = gizi buruk. Untuk mengetahui apakah pernyataan
tersebut dapat dipercaya, dilakukan penelitian dengan mengambil sampel random sebanyak
100 anak balita di daerah tersebut dan diperoleh hasil sebagai berikut : 30 anak dengan gizi
baik, 35 anak dengan gizi sedang, 20 anak dengan gizi kurang, dan 15 anak dengan gizi

buruk. Pengujian dilakukan dengan derajat kemaknaan 5%.
Jawab :
H
0
: p = p1 = p2 = p3 = p4
H
a
: p p1 = p2 = p3 = p4 atau antara p1, p2, p3, p4 tidak semuanya sama.
Diketahui : n = 100 (besarnya sampel)
= 0,05
Observasi : 30 35 20 15
Ekspektasi : (n x p) p = 0,25
E1 = 100 x 0,25 = 25
E2 = 100 x 0,25 = 25
E3 = 100 x 0,25 = 25
E4 = 100 x 0,25 = 25
Dapat dibuat tabel sebagai berikut:
Gizi baik Gizi sedang Gizi kurang Gizi buruk
Observasi 30 35 20 15
Ekspektasi 25 25 25 25

X
2
=
( )

E
E O
2

X
2
=
( )
25
25 30
2

+
( )
25
25 35
2

+
( )
25
25 20
2

+
( )
25
25 15
2


X
2
= 1 + 4 + 1 + 4
X
2
= 10
X
2
pada 0,05 dan dk
3
= 7,815 (dk = 4-1)
Kriteria penerimaan bila chi square hasil perhitungan lebih kecil dari chi square yang
terdapat dalam tabel pada 0,05 dan dk
3
. Hasil perhitungan di atas menunjukkan lebih

besar. Hal ini berarti bahwa hipotesis ditolak atau terdapat perbedaan yang bermakna antara
perbandingan status gizi anak balita di daerah tersebut. Kesimpulan: perbandingan status
gizi anak balita daerah X tidak sama.

Contoh 2 :
Dari hasil penelitian tentang status gizi balita sebelumnya di suatu daerah secara
antropometris dibagi dalam kategori baik, sedang, kurang, dan buruk dengan perbandingan 5
: 4 : 2 : 1. Kini dilakukan penelitian dengan mengambil sampel sebanyak 90 balita dan
diperoleh 30 anak dengan gizi baik, 40 anak dengan gizi sedang, 10 anak dengan gizi
kurang dan 5 anak dengan gizi buruk. Permasalahannya apakah perbandingan status gizi
hasil penelitian sebelumnya dapat dipercaya. Pengujian dilakukan pada derajat kemaknaan
5%.
Jawab :
H
0
: p = 5 : 4 : 2 : 1
H
a
: p 5 : 4 : 2 : 1
= 0,05
Berdasarkan perbandingan di atas hasil penelitian ini mempunyai ekspektasi sebagai
berikut:
p1 (gizi baik) = 5/12 x 90 = 37
p2 (gizi sedang) = 4/12 x 90 = 30
p3 (gizi kurang) = 2/12 x 90 = 15
p4 (gizi buruk) = 1/12 x 90 = 8

Dapat dibuat tabel sebagai berikut:
Gizi baik Gizi sedang Gizi kurang Gizi buruk

Observasi 30 40 10 5
Ekspektasi 37 30 15 8
X
2
=
( )

E
E O
2

X
2
=
( )
37
37 30
2

+
( )
30
30 40
2

+
( )
15
15 10
2

+
( )
8
8 5
2


X
2
= 1,32 + 3,33 + 1,67 + 1,13
X
2
= 7,45
dk = 4 1
= 3
= 0,05
X
2
= 7,815
Dari hasil perhitungan X
2
di atas diperoleh nilai X
2
lebih kecil daripada nilai X
2
tabel.
Berarti hipotesis nol diterima pada 0,05 atau tidak terdapat perbedaan yang bermakna
antara proporsi status gizi yang lalu dengan hasil penelitian yang kini dilakukan. Kesimpulan:
proporsi status gizi balita daerah tersebut dapat dipercaya.

Pengujian chi square pada data binominal
Apabila k = 2 yaitu bila data yang akan diuji merupakan data binominal di mana
probabilitas terjadinya sesuatu adalah p dan proporsi lain adalah q. Pengujian dilakukan
dengan mengambil sampel sebesar n, maka dalam sampel n tersebut akan terdapat x event
yang dikehendaki dan n-x event yang tidak dikehendaki sedangkan frekuensi yang
diharapkan untuk event yang diinginkan adalah np dan frekuensi yang tidak diinginkan
adalah nq. Maka rumusnya adalah:



X
2
=
( )
npq
np x
2



Namun rumus tersebut tidak dapat digunakan karena distribusi binominal merupakan
distribusi diskrit. Untuk menggunakan tabel distribusi X
2
pada rumus di atas harus dilakukan
koreksi agar distribusi menjadi kontinyu yang disebut koreksi kontinyuitas (Yates correction)
dan rumusnya menjadi:

X
2
=
( )


npq
np x
2
2
1


Dalam hal ini selisih x dan np digunakan nilai absolut agar tidak mendapatkan nilai
yang negatif. Hipotesis yang digunakan ialah:
H
0
: p = p yang diketahui nilainya.
H
a
: p p yang tidak diketahui nilainya.
Kriteria penerimaan hipotesis nol : bila chi square hasil perhitungan lebih kecil dari
chi square yang terdapat dalam tabel dengan dk = 1 dan derajat kemaknaan .

Contoh 1:
Dinyatakan bahwa penderita yang dirawat di bagian Anak 40% adalah wanita dan
60% adalah laki-laki. Ingin diuji apakah pernyataan tersebut dapat dipercaya pada derajat
kemaknaan 5%. Untuk keperluan ini diambil sampel random sebanyak 50 anak yang dirawat
di bagian Anak dan diperoleh hasil 27 anak wanita dan 23 anak laki-laki.
Jawab :
H
0
: p = 0,4
H
a
: p 0,4

= 0,05
Hasil Observasi (x) : wanita = 27; laki-laki = 23.
Nilai Ekspektasi (np) dapat dihitung sebagai berikut:
Wanita : 0,4 x 50 = 20
Laki-laki : 0,6 x 50 = 30
X
2
=
( )


npq
np x
2
2
1

X
2
=
| |
6 , 0 4 , 0 50
20 27
2
2
1
x x


X
2
=
( )
12
5 , 6
2

X
2
= 3,52
X
2
0,05; dk = 1 = 6,63
Hasil perhitungan menunjukkan lebih kecil dari nilai tabel. Jadi, hipotesis diterima
pada 0,05.
Kesimpulan: proporsi penderita wanita yang dirawat di bagian Anak adalah 0,4 atau
pernyataan bahwa penderita yang dirawat di bagian Anak 40% adalah wanita dapat
dipercaya.
Yates correction berlaku untuk:
- tabel 2 x 2
- nilai ekspektasi lebih kecil dari 5
- derajat kebebasan = 1
- sampel kecil

Contoh 2:
Seseorang ingin meneliti efek semacam obat untuk influenza. Pada penelitian ini

diambil 2 kelompok penderita influenza masing-masing terdiri dari 10 orang. Kelompok
pertama diberi obat sedangkan kelompok kedua diberikan plasebo. Setelah tiga hari ternyata
dari kelompok I, 7 orang sembuh dan 3 orang tidak sembuh, sedangkan dari kelompok II
terdapat 4 orang sembuh dan 6 orang tidak sembuh. Penelitian ini dilakukan pada derajat
kemaknaan 0,05.
Jawab :
H
0
: obat = plasebo
H
a
: obat plasebo
= 0,05

Hasil di atas dapat dibuat tabel sebagai berikut:
EFEK
Sembuh Tidak Jumlah
Obat 7 3 10
Plasebo 4 6 10
Total 11 9 20


X
2
=
( )
( )( )( )( ) D B C A D C B A
n BC AD n
+ + + +

2
2
1


X
2
=
( )
( )( )( )( ) 6 3 4 7 6 4 3 7
20 4 3 6 7 20
2
2
1
+ + + +
x x x

X
2
=
( )
9 11 10 10
10 12 42 20
2
x x x



X
2
=
( )
9900
20 20
2

X
2
=
9900
8000

X
2
= 0,81
X
2
0,05; dk = 1 = 3,84.
Dari hasil di atas ternyata nilai X
2
perhitungan lebih kecil daripada nilai tabel atau
hipotesis diterima. Kesimpulan: obat tersebut tidak mempunyai efek terhadap influenza.

Menguji kesamaan rata-rata Poisson
Misalkan ada k (k 2) buah distribusi Poisson dengan parameter
1
,
2
,
3
,.....
k
.
Akan diuji pasangan hipotesis:
H
0
:
1
=
2
=
3
= ...... =
k

H
a
:
1

2

3
......
k

Dari setiap populasi diambil sebuah sampel acak, berukuran n
1
dari populasi kesatu,
n
2
dari populasi kedua dan seterusnya berukuran n
k
dari populasi ke-k. Untuk tiap sampel
dihitung banyak peristiwa yang mengikuti distribusi Poisson. Jika banyak peristiwa ini
dinyatakan dengan x
1
, x
2
,....., x
k
, maka rata-ratanya:



x =
k
x x x k + + + .... 2 1



Statistik yang digunakan untuk menguji hipotesis H
0
adalah:


X
2
=
( )


x
x xi

2


Derajat kebebasan (dk) = n 1.

Contoh 1 :
Lima orang sekretaris bertugas untuk menyalin data ke dalam sebuah daftar yang
telah disediakan. Misalkan bahwa banyaknya salah menyalin untuk setiap daftar berdistribusi
Poisson masing-masing dengan rata-rata
1
,
2
,
3
,
4
,
5
. Dari hasil salinan tiap sekretaris
diambil sampel acak berukuran empat dan dicatat banyaknya kesalahan dalam tiap daftar.
Data ini akan digunakan untuk menguji hipotesis :
H
0
:
1
=
2
=
3
=
4
=
5

H
a
:
1

2

3

4

5

= 0,05
Tabelnya sebagai berikut:
Sekretaris Kesalahan tiap daftar Banyaknya kesalahan (x
i
)
I 2, 0, 3, 3, 2 10
II 0, 0, 2, 1, 2 5
III 1, 1, 2, 3, 2 9
IV 2, 1, 1, 1, 4 9
V 2, 3, 0, 3, 3 11
Jumlah 44

Dari kolom ketiga didapat rata-rata x = 44/5 = 8,8 dan dengan rumus

X
2
=
( )


x
x xi

2
diperoleh
X
2
=
( )
8 , 8
8 , 8 10
2

+
( )
8 , 8
8 , 8 5
2

+
( )
8 , 8
8 , 8 9
2

+
( )
8 , 8
8 , 8 9
2

+
( )
8 , 8
8 , 8 11
2


X
2
=
8 , 8
44 , 1
+
8 , 8
44 , 14
+
8 , 8
04 , 0
+
8 , 8
04 , 0
+
8 , 8
84 , 4

X
2
=
8 , 8
8 , 20

X
2
= 2,36
X
2
0,05; dk = 4 = 9,49
Ternyata nilai X
2
perhitungan lebih kecil daripada nilai X
2
tabel. Hal ini berarti
hipotesis nul tidak dapat ditolak, di mana tidak ada perbedaan banyaknya kesalahan yang
dilakukan oleh kelima sekretaris tersebut.

Contoh 2 :
Barang rusak setiap hari yang dihasilkan oleh 3 buah mesin ternyata berdistribusi
Poisson. Pengamatan telah dilakukan selama 6 hari dan terdapat barang rusak setiap hari
dari ketiga mesin tersebut, seperti pada tabel di bawah ini:
Mesin Banyak barang rusak tiap hari Jumlah
I 4, 3, 4, 6, 3, 5 25
II 3, 2, 3, 6, 5, 2 21
III 5, 5, 3, 4, 4, 6 27
Total 73

Dapatkah disimpulkan bahwa rata-rata dihasilkannya barang rusak setiap hari oleh
ketiga mesin itu sama besar?

Jawab :
H
0
: p
1
= p
2
= p
3

H
a
: p
1
p
2
p
3

= 0,05
Rata-rata barang yang rusak ( x ) = 73/3 = 24,3
X
2
=
( )


x
x xi

2

X
2
=
( )
3 , 24
3 , 24 25
2

+
( )
3 , 24
3 , 24 21
2

+
( )
3 , 24
3 , 24 27
2


X
2
=
3 , 24
49 , 0
+
3 , 24
89 , 10
+
3 , 24
29 , 7

X
2
=
3 , 24
67 , 18

X
2
= 0,768
X
2
0,05; dk = 2 = 5,991
Hasil perhitungan X
2
lebih kecil dari nilai tabel. Kesimpulannya hipotesis nul tidak
dapat ditolak yang berarti rata-rata dihasilkannya barang rusak setiap hari oleh ketiga mesin
itu sama besar.










Contoh penerapan strategi analisis data kategori dengan menggunakan
metode Chi Square:

Sebuah penelitian tentang cara kontrasepsi yang ditawarkan pada calon akseptor
terdiri dari IUD, pil dan kondom. Penelitian dilakukan pada 3 desa di suatu daerah yaitu desa
X, Y dan Z. Dari penelitian tersebut diperoleh hasil sebagai berikut:
a. dari 40 orang calon akseptor di desa X ternyata 15 orang memilih IUD, 15 orang
memilih pil dan 10 orang memilih kondom
b. dari 30 orang calon akseptor di desa Y ternyata 15 orang memilih IUD, 9 orang
memilih pil dan 6 orag memilih kondom
c. dari 30 orang calon akseptor di desa Z ternyata 12 orang memilih IUD, 8 orang
memilih pil dan 10 orang memilih kondom.
Apakah terdapat hubungan antara pemilihan cara kontrasepsi dengan lokasi desa.
Untuk itu dilakukan pengujian dengan derajat kemaknaan 5%.
Jawab :
H
0
: ada hubungan antara pemilihan cara kontrasepsi dengan lokasi desa
H
a
: tidak ada hubungan antara pemilihan cara kontrasepsi dengan lokasi desa
= 0,05
X
2
=
( )

E
E O
2


Desa X : 15 orang memilih IUD
15 orang memilih pil
10 orang memilih kondom
Desa Y : 15 orang memilih IUD

9 orang memilih pil
6 orang memilih kondom
Desa Z : 12 orang memilih IUD
8 orang memilih pil
10 orang memilih kondom

Tabel:
Desa
Jenis kontrasepsi
Jumlah
IUD Pil Kondom
X 15 15 10 40
Y 15 9 6 30
Z 12 8 10 30
Jumlah 42 32 26 100

Derajat kebebasan = (kolom - 1) (baris - 1)
= (3 1) (3 1)
= 4
E (expected) masing-masing:
E
1
=
100
42 40X
= 16,8
E
2
=
100
42 30X
= 12,6
E
3
=
100
42 30X
= 12,6
E
4
=
100
32 40X
= 12,8
E
5
=
100
32 30X
= 9,6
E
6
=
100
32 30X
= 9,6
E
7
=
100
26 40X
= 10,4
E
8
=
100
26 30X
= 7,8
E
9
=
100
26 30X
= 7,8




O

E

(O E)

(O E)
2


(O E)
2
/E
15 16,8 - 1,8 3,24 0,19
15 12,6 2,4 5,76 0,45
12 12,6 - 0,6 0,36 0,02
15 12,8 2,2 4,84 0,37
9 9,6 - 0,6 0,36 0,0375
8 9,6 - 1,6 2,56 0,26
10 10,4 - 0,4 0,16 0,015
6 7,8 - 1,8 3,24 0,41
10 7,8 2,2 4,84 0,62
Jumlah (X
2
) 2,3725

Nilai X
2
dari tabel chi square dengan derajat kebebasan (dk) 4 adalah 9,488. Hasil
perhitungan yang didapat adalah 2,3725 (hasil perhitungan lebih kecil daripada nilai tabel).
Hipotesis nul diterima.
Kesimpulan : dari penelitian tersebut menunjukkan adanya hubungan antara pemilihan cara
kontrasepsi dengan lokasi desa.



BAB III
KESIMPULAN

Dari pembahasan di atas, dapat disimpulkan sebagai berikut:
a) Chi square adalah strategi yang tepat guna menganalisis data kategori dalam penelitian
masyarakat, karena penelitian dalam masyarakat sering menghasilkan dua variabel di



mana masing-masing variabel terdiri dari berbagai golongan atau kategori, misalnya;
tingkat beratnya penyakit, tingkat pendidikan, dan lain-lain. Dan untuk mengetahui apakah
ada hubungan antara dua variabel tersebut hanya dapat dibuktikan dengan analisis chi
square.
b) Distribusi chi square merupakan distribusi sampling dengan variabel random yang
mendekati kontinyu dengan kurva miring ke kanan. Pendekatan ini makin baik pada sampel
yang cukup besar, dan kemiringan kurva distribusi chi square dipengaruhi oleh besarnya
derajat kebebasan yaitu makin besar derajat kebebasan, kemiringan akan berkurang
hingga pada suatu derajat kebebasan tertentu kurva tersebut menjadi simetris.
c) Uji chi square digunakan untuk mengetahui apakah ada perbedaan atau tidak di antara
lebih dari 2 proporsi sampel. Perhitungan didasarkan atas frekuensi observasi (fo) dan
frekuensi yang diharapkan (fe) dengan rumus:

X
2
=
( )

E
E O
2


d) Kriteria penerimaan hipotesis ialah bila X
2
hasil perhitungan lebih kecil dari X
2
yang
terdapat dalam tabel dengan dk = k 1 dan derajat kemaknaan .













VIII
BAB I
PENDAHULUAN


Dalam penelitian yang menghasilkan lebih dari dua rata-rata, maka cara perhitungan dengan
menggunakan t test dan z test tidak dapat digunakan, karena selain perhitungan menjadi panjang dan rumit,
juga sulit untuk diambil kesimpulan. Kumpulan hasil pengamatan mengenai suatu hal seperti skor hasil
belajar para siswa, berat bayi yang baru lahir, gaji pegawai di suatu perusahaan, hasil jagung setiap hektar
misalnya, memiliki nilai data yang bervariasi dari yang satu dengan yang lain. Karena itu perlu adanya suatu
metode untuk menyelesaikan masalah ini dengan cara yang lebih sederhana. Metode tersebut ialah analisis
varians.
Variasi atau ragam untuk sekumpulan data tersebut dihitung alat ukurnya, yaitu dengan varians.
Varians bersama rata-rata (mean) telah banyak digunakan untuk membuat kesimpulan mengenai populasi,
baik secara deskriptif maupun secara induktif melalui penaksiran dan pengujian hipotesis mengenai
parameter.
Pengujian hipotesis yang dilakukan pada jenis data yang bervariasi tersebut menggunakan teknik
atau metode analisis varians disingkat ANOVA/ANAVA. ANA dari analisis dan VA dari varians. Tujuan
analisis varians ialah untuk menarik kesimpulan melalui pengujian hipotesis untuk kesamaan lebih dari dua
rata-rata populasi, melalui perhitungan rata-rata sampelnya.
Walaupun pengujian hipotesis melalui teknik analisis varians ini beraneka ragam, tetapi yang akan
dibahas pada makalah ini hanya analisis varians sederhana atau analisis varians satu arah atau analisis varians
satu faktor. Misalnya efek berbagai macam obat, beberapa prosedur pengukuran fungsi organ, dan lain-lain.





















BAB II
VARIANS


II. 1. Definisi Varians
Varians termasuk ukuran variasi (ukuran dispersi/ukuran simpangan) yang menggambarkan
bagaimana berpencarnya data kuantitatif. Beberapa ukuran dispersi lain yang terkenal antara lain rentang,
rentang antar kuartil, simpangan kuartil atau deviasi kuartil, rata-rata simpangan atau rata-rata deviasi,
simpangan baku atau deviasi standar, dan koefisien variasi.
Varians adalah pangkat dua dari simpangan baku. Untuk sampel, simpangan baku diberi simbol s,
sedangkan untuk populasi diberi simbol o (baca: sigma). Variasinya tentu adalah s
2
untuk varians sampel dan
o
2
untuk varians populasi. Jelasnya s dan s
2
merupakan statistik sedangkan o dan o
2
adalah parameter.

II. 2. Rumus Perhitungan Varians



Jika kita mempunyai sampel berukuran n dengan data x
1,
x
2
,,x
n
dan rata- rata
_
x , maka statistik s
2

dihitung dengan :
1
) (
_
2
_
2

=

n
x x
x s
Rumus (1)
Untuk mencari simpangan baku s, dari s
2
diambil harga akarnya yang positif. Dari rumus (1)
tersebut, maka varians dihitung sebagai berikut :
1. Hitung rata-rata
_
x
2. Tentukan selisih : x
1
-
_
x , x
2
-
_
x , , x
n
-
_
x
3. Tentukan kuadrat selisih tersebut, yakni (x
1
-
_
x )
2
, (x
2
-
_
x )
2
, , (x
n
-
_
x )
2

4. Kuadrat-kuadrat tersebut dijumlahkan
5. Jumlah tersebut dibagi oleh (n-1)
contoh :
Diberikan sampel dengan data : 8, 7, 7, 10, 11, 4
Untuk menentukan simpangan baku s, dibuat tabel sebagau berikut :

x
x-
_
x (x-
_
x )
2
8 0 0
7 -1 1
10 2 4
11 3 9
4 -4 16

Didapat (x-
_
x )
2
= 30. Dengan menggunakan rumus varians sampel didapat :
S
2
= 30/4
= 7,5



Bentuk lain untuk rumus varians sampel ialah :

( )
) 1 (
2
2 2
2

=

n n
x x n
s
i i
Rumus (2)

Dalam rumus (2) nampak bahwa tidak perlu dihitung dulu rata-rata
_
x , tetapi cukup menggunakan
nilai data aslinya berupa jumlah nilai data dan jumlah kuadratnya. Jika digunakan untuk data di atas, maka
dari tabel berikut ini dihasilkan :

X X
i
2
8
7
10
11
4
64
49
100
121
16
40 = x
i
350= x
i
2

Dengan n = 5, didapat varians :
S
2
= (5 X 350 - (40)
2
) / 5 X 4
= 7,5
Sangat dianjurkan bahwa menghitung simpangan baku lebih baik menggunakan rumus (2) karena
kekeliruannya lebih kecil. Setelah didapat varians sampel dengan menggunakan rumus (2) maka simpangan
baku dihitung dengan menarik akar dari varians.
Jika data dari sampel telah disusun dalam daftar distribusi frekuensi, maka untuk menetukan varians
s
2
dipakai rumus :

1
) (
2
2


=


n
x x f
s
i i
Rumus (3)



Atau yang lebih baik digunakan :

( )
) 1 (
2
2
2

=

n n
x f x f n
s
i i i i
Rumus (4)
Keterangan : x
i
= tanda kelas
f
i
= frekuensi yang sesuai dengan tanda kelas
n = f
i
rumus (3) menggunakan rata-rata
_
x sedangkan rumus (4) hanya menggunakan nilai tengah atau tanda kelas
interval.
Contoh : untuk menghitung varians s
2
dari data dalam daftar berikut tentang nilai ujian 80 mahasiswa, dengan
menggunakan rumus (3), lebih baik dibuat tabel berikut.

Nilai ujian f
i
x
i
-
_
x (x
i
-
_
x ) (x
i
-
_
x )
2
fi(xi-
_
x )
2
31-40
41-50
51-60
61-70
71-80
81-90
91-100
1
2
5
15
25
20
12
35,5
45,5
55,5
65,5
75,5
85,4
95,5
-41,1
-31,1
-21,1
-11,1
-1,1
8,9
18,9
1689,21
967,21
45,21
123,21
1,21
79,21
357,21
1689,21
1834,42
2226,05
1848,15
30,25
15884,20
4286,52
Jumlah 80 - - - 13498,80

Didapat harga-harga :
_
x = 76,6
n = f
i
= 80
fi(xi-
_
x )
2
= 13498,80
Sehingga dengan rumus (3) didapat varians :



s
2
= 113498/79
= 170,9
Untuk menggunakan rumus (4) dengan menggunakan data yang sama, maka tabel harus dibuat seperti di
bawah ini :

Nilai ujian f
i
x
i
-
_
x
x
i
2
fix
i

fixi
2
31-40
41-50
51-60
61-70
71-80
81-90
91-100
1
2
5
15
25
20
12
35,5
45,5
55,5
65,5
75,5
85,4
95,5
1260,25
2070,25
3080,25
4290,25
5700,25
7310,25
9120,25
35,5
91,0
277,5
982,5
1887,5
1710,0
1146,0
1260,25
4140,50
15401,25
64353,75
142506,25
146205,00
109443,00
Jumlah 80 - - 6130,0 483310,00

Dari tabel didapat :
n = f
i
= 80
fix
i
= 6130
fixi
2
= 48310,00
Sehingga dari rumus (4) diperoleh varians :
s
2
= (80 X 48310.00 (6130)
2
)/(80 X 79)
= 172,1
Hasilnya berbeda dengan hasil dari rumus (3) karena
_
x yang dugunakan di rumus (3) telah dibulatkan
hingga satu desimal, yang dengan sendirinya akan menyebabkan adanya perbedaan.

II. 3. Jenis Varians
Dari pembahasan sebelumnya kita telah mengetahui beberapa jenis varians yaitu varians sampel s
2




dan varians populasi o
2
. Varians untuk sekumpulan data ini menggambarkan derajat perbedaan atau variasi
nilai data individu yang ada dalam kelompok atau kumpulan data tersebut. Variasi ini dihitung dari nilai rata-
rata kumpulan data.
Secara umum varians dapat digolongkan ke dalam varians sistematik dan varians galat. Varians
sistematik adalah varians pengukuran karena adanya pengaruh yang menyebabkan skor atau nilai data lebih
condong ke satu arah tertentu dibandingkan ke arah lain. Setiap pengaruh alami atau buatan manusia yang
menyebabkan terjadinya peristiwa dapat diduga atau diramalkan dalam arah tertentu, merupakan pengeruh
sistematik sehingga menyebabkan terjadinya varians sistematik. Cara mengajar yang dilakukan seorang ahli
secara sistematik mempengaruhi kemajuan anak didik lebih baik dibandingkan dengan kemajuan anak yang
diajar secara sembarangan, hasil skor ujiannya menggambarkan adanya varians sistematik.
Salah satu jenis varians sistematik dalam kumpulan data hasil penelitian adalah varians antar
kelompok atau kadang-kadang disebut pula varians eksperimental. Varians ini menggambarkan adanya
perbedaan atau variasi sistematik antara kelompok-kelompok hasil pengukuran. Dengan demikian varians ini
terjadi karena adanya perbedaan antara kelompok-kelompok individu.



















BAB III
ANALISIS VARIANS


III. 1. Konsep Dasar Analisis Varians
Pemikiran dasar analisis varians ialah terdapatnya variasi-variasi hasil pengamatan yaitu variasi hasil
tiap pengamatan terhadap rata-rata seluruh pengamatan (total variance) yang terdiri dari variasi pengamatan
terhadap rata-rata antar kelompok (variance between group) dan variasi pengamatan terhadap rata-rata dalam
satu kelompok (variance within group).
Dua variasi terakhir ini yang digunakan sebagai dasar analisis varians untuk menaksir varians
populasi. Di samping hal tersebut harus pula diasumsikan bahwa sampel-sampel diambil dari populasi yang
berdistribusi normal atau hampir normal sehingga populasi-populasi tersebut mempunyai varians yang sama.
Tetapi bila sampel cukup besar, maka asumsi tersebut tidak diperlukan lagi.

III. 2. Tahap-Tahap Analisis Varians
Dalam membuat analisis varians, ada tahap-tahap yang perlu dilakukan. Tahap-tahap dalam anaslisis
varians adalah:
1. menghitung estimasi varians populasi melalui varians antar kelompok
2. menghitung estimasi varians populasi melalui varians dalam kelompok
3. membandingkan kedua estimasi tersebut.

III. 2. 1. Perhitungan Varians Antar Kelompok
Telah diketahui bahwa rumus varians sampel untuk menaksir varians populasi adalah:

1
) (
_
2
_
2

=

n
x x
x s



karena kita kini berhadapan dengan beberapa kelompok sampel maka x diganti dengan
_
x dan x diganti
dengan grand mean (X) dan n adalah jumlah kelompok, hingga rumus menjadi:

1
) (
2
_
2

=

=
k
x x
x s
k = banyaknya kelompok
Grand mean ialah rata-rata dari seluruh hasil pengamatan. Ini dapat dihitung dengan cara:
1. rata-rata hitung
n
x
x

=
2. rata-rata hitung dengan beban
n n n
x n x n x n
k
k k
x
+ + +
+ + +
=
...
...
2 1
_ _
2 2 1
_
1
_

selanjutnya dihitung kesalahan baku rata-rata

n
x
o
o =
_

hingga simpangan baku populasi adalah:
n
x
=
o
o atau n x =
_
2 2
o o

Bila varians populasi tidak diketahui, dapat ditaksir dari varians sampel hingga rumus menjadi:
n x s =
_
2 2
o
Rumus ini merupakan estimasi varians antar kelompok populasi melalui varians antar kelompok
sampel.

III.2. 2 Perhitungan Varians Dalam kelompok
Untuk menghitung varians dalam kelompok digunakan rumus varians sampel:




1
) (
2
_
2

=

n
x x
s
x = hasil pengamatan dalam satu kelompok
x = rata-rata kelompok
n = jumlah pengamatan dalam kelompok
Bila kita mempunyai k buah kelompok, maka rumus menjadi:

k
s s s
2
3
2
2
2
1 2
...+ + +
= o
Jadi, varians dalam kelompok adalah jumlah semua varians kelompok dibagi dengan banyaknya kelompok.


III. 3. Distribusi F
Distribusi sampling yang digunakan pada analisa varians ialah distribusi F. Distribusi F merupakan
distribusi sampling yang digunakan untuk pengujian hipotesa pada analisa varians. Seperti pada distribusi x
2
,
yaitu terdapat distribusi yang berbeda pada setiap probabilitas derajat kebebasan dan bentuk umum kurva
distribusi F adalah miring ke kanan. Kemiringan ini akan berkurang bila dk pembilang dan dk penyebut
makin besar.
Kurva distribusi F dibentuk berdasarkan sepasang dk yaitu dk pembilang yang merupakan estimasi
dari varians antar kelompok dan dk penyebut merupakan estimasi dari varians dalam kelompok. Karena itu
pengujian hipotesis analisis varians ditentukan oleh F ratio yaitu ratio antara varians antar kelompok dan
varians dalam kelompok.
Di bawah ini akan diberikan contoh tentang kurva distribusi F dengan berbagai dk.






Dari grafik di atas terlihat bahwa makin besar dk kurva menjadi makin simetris. Angka yang terlihat di depan
menunjukkan dk untuk pembilang, sedangkan angka di belakang menunjukkan dk penyebut.

III. 4. Menetukan Derajat Kebebasan
Derajat kebebasan untuk varians antar kelompok sama dengan jumlah kelompok dikurangi satu.
dk = k-1
dk untuk varians dalam kelompok sama dengan jumlah seluruh hasil pengamatan dikurangi dengan jumlah
kelompok.
dk = N-k
N = jumlah seluruh populasi
Bila pengujian hipotesis dilakukan pada o = 0,05 maka lihat tabel F untuk o = 0,05.

III. 5. Kriteria Penerimaan Hipotesis
Hipotesis nol diterima bila nilai F hasil perhitungan lebih kecil daripada nilai F yang terdapat dalam
tabel pada o yang telah ditentukan. Sebaliknya hipotesis nol ditolak atau haipotesis kerja diterima
bila nilai F hasil perhitungan lebih dari nilai F yang terdapat dalam tabel.





Contoh: (untuk contoh sengaja dibuat dengan sampel kecil untuk memudahkan perhitungan)
Misalnya, terdapat 3 cara pengukuran Hb yaitu metode Sahli, talquis dan elektrofotometer. Untuk
metode I diperiksa sebanyak 5 orang, untuk metode II diperiksa sebanyak 5 orang dan untuk metode III
diperiksa sebanyak 5 orang.
Hasil pemeriksaan adalah sebagai berikut:
Metode I (X1) : 10; 11; 13; 14,4; 15
Metode II (X2) : 9,8; 11,2; 13,4;14,2;15
Metode III (X3) : 11; 12,2; 13,6; 14,2; 14,4
Ingin diuji apakah rata-rata sampel tersebut di atas berasal dari populasi dengan rata-rata yang sama.
Jadi, H0 : 1 = 2 = 3
H0 : 1, 2, 3 tidak sama.
Pengujian dilakukan pada derajat kemaknaan 0,05.
Penyelesaian :
Rata-rata kelompok II (
_
x
1
)
n
x
x

= = 63,4/5 = 12,68
Rata-rata kelompok III (
_
x
2
)
n
x
x

= = 63,6/5 = 12,72
Rata-rata kelompok III (
_
x
3
)
n
x
x

= = 65,4/5 = 13, 08
Grand mean (X) = (63,4 + 63,6 + 65,4)/15 = 192,4/15= 12, 83
Varians antar kelompok :
1 3
) 83 , 12 08 , 13 ( ) 83 , 12 72 , 12 ( ) 83 , 12 68 , 12 (
2 2 2
_
2

+ +
= x s

2
0625 , 0 0121 , 0 0225 , 0 + +
=

2
0971 , 0
=
= 0,049



n x s =
_
2 2
o
= 0,049x5
= 0,245
Varians dalam kelompok :
3
2
3
2
2
2
1 2
s s s + +
= o

Kelompok I

X
1
1
_
X X
1- 1
_
X

(X
1- 1
_
X )
2
10 12,68 -2,68 7,18
11 12,68 -1,68 2,82
13 12,68 0,32 0,10
14,4 12,68 1,72 2,96
15 12,68 2,32 5,38

44 , 18 ) (
2
1
_
1
=

x x

4
44 , 18
2
1
= s
= 4,61

Kelompok II

X
2
2
_
X
X
2
- 2
_
X

(X
2
- 2
_
X )
2
9,8 12,72 -2,92 8,53



11,2 12,72 -1,52 2,31
13,4 12,72 0,68 0,46
14,2 12,72 1,48 2,19
14,4 12,72 2,28 5,20

(X
2
- 2
_
X )
2
= 18,69

4
69 , 18
2
2
= s
= 4,67






Kelompok III

X
3
3
_
X
X
3
- 3
_
X

(X
3
- 3
_
X )
2
11 13,08 -2,08 4,33
12,2 13,08 -0,88 0,77
13,6 13,08 0,32 0,10
14,2 13,08 1,12 1,25
15 13,08 1,92 3,69

(X
3
- 3
_
X )
2
= 10,14

4
14 , 10
2
3
= s



Varians dalam kelompok
3
54 , 2 67 , 4 61 , 4
2
+ +
= o

3
82 , 11
=
= 3,94
Distribusi sampling F (F ratio):
F=0,245/3,94
= 0,062
Derajat kebebasan (dk)
dk = 3-1 = 2 (untuk pembilang)
dk = 15-3 = 12 (untuk penyebut)
Dengan menggunakan tabel distribusi F, pada baris dicari angka 2 dan pada kolom dicari angka 12. Diperoleh
F = 3, 89.
Kriteria penerimaan hipotesis :
F hasil perhitungan = 0,062
F tabel pada o 0,05 = 3,89
Jadi hipotesis nol (H0) diterima pada o 0,05.
Kesimpulan :
Ketiga metode pengukuran Hb tersebut tidak berbeda.
Grafik :





Ilustrasi Analisis Varians dalam Dunia Kedokteran
Klinik Medika 24 jam yang terletak di jalan Lestari mempekerjakan 4 orang perawat yang terjadwal
dalam 4 jaga. Direktur utama klinik tersebut ingin mengetahui apakah ada perbedaan produktivitas (jumlah
pasien) di antara 4 kelompok kerja jaga yang ada selama ini. Untuk itu direktur utama memerintahkan seorang
supervisor untuk mengamati produktivitas keempat kelompok kerja tersebut dan berikut adalah hasilnya
(jumlah pasien).

Hari Jaga 1 Jaga 2 Jaga 3 Jaga 4
1 38 45 45 28
2 36 48 48 25
3 39 42 42 24
4 34 46 46 26
5 35 41 41 29
6 32 45 45 14
7 39 48 48 32
8 34 47 47 18
9 32 42 42 29
10 36 41 41 33
11 33 39 39 24
12 39 33 33 22

Penyelasaian :
Kasus di atas terdiri atas empat sampel yang bebas satu sama lain yaitu kelompok jaga 1 berbeda orang dan
waktunya dengan kelompok jaga yang lain. Demikian juga untuk waktu dan anggota kelompok jaga yuang
lainnya saling berbeda. Di sin populasi diketahui berdistribusi normal, dan karena sampel lebih dari dua,
dipakai uji Analisis Varians (ANOVA).






Output Bagian Pertama (Group Statistics)


Pada bagian pertama terlihat ringkasan statistik dari keemapt sampel. Sebagai contoh adalah
deskripsi dari kelompok jaga 1.
- Rata-rata produktivitas (jumlah pasien) adalah 35,58 orang
- Produk minimum adalah 32 orang dan maksimum 39 orang
- Dengan tingkat kepercayaan 95% atau signifikansi 5%, rata-rata pasien ada pada range 33,88 orang
sampai 37,29 orang.
Demikian juga untuk data yang lain. Uji ANOVA ingi melihat apakah rata-rata keempat sampel
adalah sama.





Output bagian kedua (test of homogeneity of variances)




Analisis ini bertujuan untuk menguji berlaku tidaknya asumsi untuk ANOVA, yaitu apakah keempat
sampel mempunyai varians yang sama.
Hipotesis :
H
0
: keempat varians populasi adalah identik
H
1
: keempat varians populasi adalah tidak identik
Pengambilan keputusan
- Jika probabilitas atau p > 0,05, maka H
0
diterima
- Jika probabilitas atau p < 0,05, maka H
0
ditolak
Keputusan :
Terlihat bahwa Levene test hitung adalah 1,173 dengan probabilitas 0,331. Oleh karena probabilitas > 0,05
maka H
0
diterima. Kesimpulannya ialah keempat varians adalah sama.





Output bagian ketiga (ANOVA)





Setelah keempat varians terbukti sama, baru dilakukan uji ANOVA (analysis of variance) untuk
menguji apakah keempat sampel mempunyi rata-rata (mean) yang sama.
Analisis dengan menggunakan ANOVA
Hipotesis :
H
0
: keempat rata-rata populasi adalah identik
H
1
: keempat rata-rata populasi adalah tidak identik
Pengambilan keputusan :
1) Berdasarkan perbandingan F hasil perhitungan dengan F tabel
Dasar pengambilan keputusan :
Jika Statistik Hitung (angka F output) > statisitik tabel (tabel F), maka H
0
ditolak
Jika Statistik Hitung (angka F output) < statisitik tabel (tabel F), maka H
0
diterima
F hitung dari output adalah 44,861
Sedangkan statisitik tabel dapat dihitung pada tabel
- Tingkat signifikansi (o) adalah 5%
- Numerator (jumlah variabel kelompok jaga 1) yaitu 4-1 = 3
- Denumerator (jumlah kasus jumlah variabel kelompok jaga) yaitu 48 4 = 44
- Dari tabel F, didapt angka 2,8164
Oleh karena F hasil perhitungan lebih besar dari F tabel maka H
0
ditolak. Kesimpulannya adalah
bahwa rata-rata produksi keempat kelompok shift tersebut memang berbeda secara nyata.



2) Berdasarkan nilai probabilitas
Jika probabilitas atau p > 0,05, maka H
0
diterima
Jika probabilitas atau p < 0,05, maka H
0
ditolak
Pengambilan keputusan :
Terlihat bahwa F hitung adalah 44,861 dengan probabilitas 0,000. Oleh karena probabilitas < 0,05
maka H
0
ditolak. Kesimpulannya adalah rata-rata produksi keempat kelompok jaga tersebut memang berbeda
secara nyata.









Output bagian keempat (Post Hoc Test)







Setelah diketahui bahwa ada perbedaan yang signigkan di antara keempat kelompk jaga tersebut,
masalah yang akan dibahas aalah mana saja kelompok jaga yang berbeda dan mana yang tidak berbeda.
Masalah ini akan dibahas pada analisis Bonferroni dan Tukey dalam post hoc test berikut.

Tukey test dan Benferroni test
Hasil uji Tukey test yang menguji perbedaan antara kelompok jaga 1 dan kelompok jaga 2 adalah
sebagai berikut :
- Pada kolom mean difference atau perbedaan rata-rata diperoleh angka -7,5. Angka ini berasal dari
mean kelompok jaga 1- kelompok jaga 2 atau 35,58-43,08 orang atau -7,5 orang.
- Pada kolom 95% confidence interval, terlihat range perbedaan mean tersebut berkisar antara -2,76
sampai -12,24 orang.
- Uji signifikansi perbedaan mean antara kelompok jaga 1 dan kelompok jaga 2, yaitu :
o Berdasarkan nilai probabilitas, maka :
Jika probabilitas p > 0,05, maka H
0
diterima
Jika probabilitas p < 0,05, maka H
0
ditolak
- Keputusan :
Terlihat bahwa nilai probabilitas adalah 0,001 berarti p < 0,005. Oleh karena probabilitas <
0,005 maka H
0
ditolak. Kesimpulannya adalah perbedaan rata-rata produktivitas kelompok jaga 1
dan kelompok jaga 2 benar-benar bermakna.
Hasil uji signifikansi dengan mudah dapat dilihat pada output dengan ada tidaknya tanda
*

pada kolom mean difference. Jika tanda
*
ada di angka mean difference atau perbedaan rata-rata
maka itu artinya perbedaan tersebut berbeda secara bermakna atau signifikan. Di baris pertama
terlihat adanya tanda pada angka -7,5 yang menandakan perbedaan tersebut benar-benar nyata atau
signifikan.
Demikian juga untuk hubungan antara variabel yang lain, misal antara kelompok jaga 1
dengan kelompok jaga 3, kelompok jaga 4 dengan kelompok jaga 2, dan lainnya.



Dengan melihat ada tidaknya tanda * pada kolom mean difference, terlihat bahwa :
- Mean dari kelompok jaga 1 berbeda secara bermakna dengan 2, 3, dan 4.
- Mean dari kelompok jaga 2 berbeda secara bermakna dengan kelompok jaga 4.
- Mean dari kelompok jaga 3 berbeda secara bermakna dengan kelompok jaga 4.
- Mean dari kelompok jaga 4 berbeda secara bermakna dengan kelompok jaga 1, 2, dan 3.




Homogeneous Subset

Jika Tukey test dan Bonferroni test untuk menguji kelompok mana saja yang memiliki perbedaan
secara bermakna, maka dalam Homogeneous subset justru akan dicari grup / subset mana saja yang
mempunyai perbedaan rata-rata atau mean difference yang tidak berbeda secara bermakna.
- Pada subset 1, terlihat hanya grup dengan anggota kelompok jaga 4
saja. Dengan kata lain dapat dikatakan kelompok jaga 4 mempunyai perbedaan dengan
kelompok yang lainnya.



- Pada subset 2, terlihat hanya grup dengan anggota kelompok jaga 1 saja. Dengan kata lain
dapat dikatakan kelompok jaga 1 mempunyai perbedaan dengan kelompok yang lainnya.
- Pada subset 3, terlihat grup dengan anggota kelompok jaga 2 dan kelompok jaga 3. Dengan
kata lain dapat dikatakan kelompok jaga 2 dan kelompok jaga 3 tidak mempunyai
perbedaan yang signifikan satu sama lain.
Dari ilustrasi tersebut terlihat bahwa ada kesesuaian antara Tukey test dan Bonferroni test dengan
Homogeneous subset. Hasil dari Tukey test dan Bonferroni test dengan homogeneous subset memang selalu
saling melengkapi.


















BAB IV
KESIMPULAN





Analisis varians dapat digunakan dengan hasil yang memuaskan bila memenuhi beberapa ketentuan sebagai
berikut:
1. Distribusi di mana sampel diambil harus diasumsikan berdistribusi normal atau mendekati
normal. Karena itu dalam pengujian hipotesis dengan cara analisa varians dilakukan pada
sampel besar.
2. Varians dari populasi yang diasumsikan harus sama.
o
1
= o
2
= o
3
= ...= o
k
3. Dari tabel F diketahui bahwa semua nilai F hasil perhitungan yang lebih kecil dari 1, tidak
bermakna.






DAFTAR PUSTAKA


1. Budiarto, Eko. Dasar-Dasar Metode Statistika Kedokteran. Penerbit Alumni. Bandung: 1984
2. Sudjana. Metoda Statistika. Penerbit Tarsito. Bandung: 2005.
















































I
EPIDEMIOLOGI DESKRIPTIF
Epidemiologi adalah ilmu yang mempelajari kejadian, distribusi (yang bersifat dinamis), dan
determinan dari masalah kesehatan dan penyakit-penyakit dalam populasi manusia atau suatu komunitas.
Satuan perhatian primer adalah sekelompok orang, bukan per individu. Sehingga, epidemiologi berhubungan
dengan patologi atau penyakit populasi dan bukan patologi secara klinik (atau penyakit dari seseorang), juga
bukan patologi secara mikroskopis (penyakit sel atau jaringan). Semua penyakit atau kelainan pada populasi
berhubungan kembali dengan komunitas sebagai sumber bahan penelitian, dan hasil dari penelitian
epidemiologik diinterpretasikan dalam bentuk kelompok, bukan individual.
Diantara populasi umum unit terkecil adalah keluarga atau sekelompok orang yang hidup bersama.
Ukuran populasi bervariasi, dapat terdiri dari orang-orang yang menempati apartemen, rumah, kampung,
distrik, kota, propinsi, negara atau benua, bersama-sama lingkungan sekitarnya.
Kata epidemiologi berasal dari kata dalam bahasa Yunani :
Epi : pada
Demos : masyarakat
Logos : ilmu pengetahuan, doktrin, sains
Dengan demikian, epidemiologi dalam artian luas adalah studi terhadap efek dari berbagai hal pada
masyarakat.


1. Perkembangan Definisi Epidemiologi
Definisi 1: Digunakan khusus untuk epidemiologi :
Definisi lama : Ilmu pengetahuan atau doktrin epidemi
(New Standard Dictionary of the English Language)
Definisi 2: Pertama kali diperluas dari studi tentang epidemi menjadi pertimbangan adanya fase
endemik dari penyakit-penyakit epidemik
.Ilmu pengetahuan tentang epidemi dan penyakit-penyakit epidemik(Stedmans Practical



Medical Dictionary)
Definisi 3: Diperluas dari hanya penyakit-penyakit epidemik (communicable disease) menjadi
penyakit-penyakit yang tidak terlalu berkarakter epidemik ( contoh : tuberkulosis, malaria,
lepra, reumatik fever, dan lain-lain);
a. Ilmu pengetahuan tentang penyakit-penyakit menular, penyebab utamanya,
perkembangbiakannya dan pencegahannya (Stallybrass, 1931)
b. Ilmu pengetahuan tentang fenomena masyarakat mengenai penyakit-penyakit menular
atau riwayat alami dari penyakit-penyakit infeksi (Frost, 1927)
Definisi 4: Mengarah pada fenomena masyarakat dan asal usul penyakit atau keadaan fisiologis
(contoh : kanker, arteriosklerosis, hipertensi, dan lain-lain).
a. Studi berbagai penyakit, sebagai sebuah fenomena pada
masyarakat (Greenwood, 1935)
b. Studi mengenai kondisi-kondisi yang diketahui atau diperkirakan mempengaruhi
prevalensi suatu penyakit (Lumsden, 1936)
Definisi 5: Penggunaan pada saat ini, dimana termasuk studi seluruh kondisi dansirkumstansi penting
pada kesehatan manusia dan keselamatan (contoh : kecelakaan, bunuh diri, pelayanan
kesehatan, masalah-masalah administrasi)
Bagian dari ilmu kedokteran yang mempelajari hubungan berbagai faktor dan kondisi yang
menentukan frekuensi dan distribusi dari suatu proses menular, suatu penyakit, atau status
fisiologis pada komunitas manusia. (Maxcy)
Arti Modern
Definisi 1: Epidemiologi adalah ilmu pengetahuan yang menitikberatkan pada asal usul penyakit yang
diekspresikan dalam sekelompok orang yang dihubungkan dengan beberapa faktor umum
usia, jenis kelamin, ras, tempat atau pekerjaan yang berbeda dari perkembangan penyakit
secara individual. (American Epidemiological Society)
Definisi 2: Epidemiologi adalah ilmu mengenai pola-pola penyakit dan
faktor-faktor yang menyebabkan penyakit pada manusia (Center for Disease Control, U.S.
Public Health Services)



Definisi 3: Epidemiologi adalah ilmu tentang distribusi dan determinan dari frekuensi penyakit pada
manusia (Mac Mahon dan Pugh)
Kelompok pertama menggambarkan distribusi atas pola status kesehatanyang
berkaitan dengan usia, jenis kelamin, ras, geografi, dan lain-lain. Kelompok kedua
melibatkan penjelasan faktor risiko atau faktor kausal penyakit dari masalah-masalah
kesehatan.
2. Tujuan dan Kegunaan Epidemiologi
A. Menggambarkan dan menganalisa kejadian penyakit dan distribusi berhubungan dengan berbagai
variabel seperti umur, ras, jenis kelamin, pekerjaan, frekuensi kejadian temporal, fluktuasi
periodik, tren jangka panjang (analisa tren waktu) dan distribusi geografis, untuk membuat
diagnosis komunitas dan memperkirakan risiko morbiditas dan mortalitas.
B. Untuk menganalisa secara hati-hati karakteristik dan interaksi agen, host dan faktor lingkungan
dalam rangka mencari kausa, menentukan seluruh detail asal usul penyakit dan pencegahan serta
ukuran kontrol, dan menyingkap kesenjangan dalam ilmu pengetahuan.
C. Untuk meningkatkan pelayanan kedokteran dan menyediakan panduan administratif untuk
pelayanan kesehatan komunitas.
D. Merangsang penggunaan pendekatan sistemik dari riset ilmiah untuk mempelajari masalah-
masalah lain dalam kesehatan masyarakat bekerjasama dengan lapangan ilmu lainnya seperti
kedokteran gigi, kesejahteraan masyarakat, pendidikan, administrasi dan bidang-bidang ilmu
penting lainnya.
Jadi, tugas epidemiologi adalah menemukan faktor yang berhubungan dengan status
kesehatan untuk perencanaan dan manajemen yang efektif.
3. Ruang Lingkup dan Muatan Epidemiologi
Epidemiologi saat ini mencakup seluruh penyakit utama dalam masyarakat, termasuk penyakit
kronis degeneratif, metabolik dan neoplasma, defisiensi gizi, cedera, gangguan mental dan perilaku dan
masalah-masalah populasi. Metode epidemiologi telah mengalami kemajuan dari observasi sederhana



menjadi disain analitik untuk mengidentifikasi penyebab asal dan perilaku penyakit masyarakat.
Epidemiologi saat ini terfokus pada :

3.1. Geografik Patologi
Salah satu pendekatan tertua untuk pemahaman epidemiologi adalah dengan membandingkan insiden
dan karakteristik penyakit pada tempat-tempat berbeda. Hipokrates mengemukakan prinsip-prinsip
geografik patologi lebih dari 2000 tahun yang lalu. Pekerjaan geografik patologi awalnya terfokus terutama
dengan penyakit-penyakit yang berkaitan dengan gambaran fisik dari kompleks lingkungan. Transportasi
modern mengakibatkan masalah-masalah kesehatan di suatu negara menjadi masalah dunia, dengan akibat
timbulnya kembali minat pada geografi penyakit di tingkat nasional dan internasional.

3.2. Epidemiologi Klinis
Pengertian klinis dari penyakit atau cidera adalah dasar dari epidemiologi, untuk
penyakit yang tidak dapat dipelajari secara kelompok-kelompok manifestasi kecuali secara
nyata teridentifikasi pada banyak orang. Minat epidemiologik telah meluas dari epidemik
skala luas ke fokal infeksi yang sporadik dan terisolasi hingga perilaku pasien dalam kaitan
dengan keluarganya, lingkungannya, dan teman dekatnya. Prinsip ini, sering dilengkapi
prosedur laboratoris, telah diadaptasi menjadi kontrol terhadap penyakit di seluruh dunia.

3.3. Identifikasi Agen Penyakit
Para ahli epidemiologi, dahulu kala, menambah prosedur laboratorium untuk mendukung temuan-
temuan studi lapangan melalui identifikasi agen penyebab. Prinsip laboratorium dan penelitian lapangan
dalam epidemiologi diturunkan terutama dari penyakit-penyakit menular akut. Keuntungan dan kelebihannya
telah pula diperlihatkan pada proses degeneratif kronis, malnutrisi, keracunan, kelainan kongenital, dan
cidera. Sebelum spesimen atau sampel dikumpulkan untuk pemeriksaan laboratorium, peneliti harus
berkonsultasi dengan petugas laboratorium untuk menanyakan tentang bahan yang diperlukan, kuantitas,



metode pengambilan, transportasi dan pengiriman spesimen atau sampel.

3.4. Epidemiologi Statistik
Dengan mengabaikan metode atau teknik penelitian, seluruh prosedur epidemiologik melibatkan
matematika, kadang hanya aritmatika sederhana, tetapi pada banyak hal metode statistik yang rumit
dibutuhkan untuk membuktikan korelasi. Pada penelitian-penelitian epidemiologik, prosedur statistik
digunakan sepanjang pelaksanaan studi, turut berperan pada disain, selama pengumpulan data, pada analisa
dan akhirnya p ada interpretasi hasil.
Metode-metode statistik sering merupakan alat epidemiologik utama dan dapat dipakai pada data dari
hampir seluruh sumber. Tren pada frekuensi sepanjang ,masa, angka kejadian berkaitan dengan tempat, dan
perbedaan jenis orang yang terpengaruh dapat diketahui. Epidemiologi statistik juga mempertimbangkan
perubahan-perubahan karakteristik suatu penyakit dan penyulit yang ditimbulkan.
Sumber-sumber data termasuk laporan resmi kematian dan kesakitan pada masyarakat, riwayat kasus
klinis, dan rekaman otopsi, dapat dikatakan sebagai macam-macam informasi pelengkap. Beberapa data
dikumpulkan untuk tujuan spesifik, yang lainnnya berasal dari laporan periodik resmi, sukarelawan, atau agen
kesehatan industrial, dan lain-lain.
Epidemiologi statistik telah menyumbang epidemiologi teoritis melalui model-model statistik yang
menjelaskan fenomena epidemiologi, mengembangkan konsep-konsep baru, atau mengkonfirmasi hal-hal
lainnya yang timbul dari eksperimen atau observasi.

3.5. Survei Lapangan untuk Tujuan Spesifik
Survei lapangan adalah sebuah studi cross sectional mencari jumlah kasus penyakit atau orang-orang
dengan beberapa atribut, dilakukan pada waktu khusus dan berhubungan dengan ukuran populasi dari mana
mereka diambil. Secara teknis, ini merupakan studi prevalensi, dan dalam bentuk paling sederhana, suatu
cara menentukan point prevalence atau prevalensi dalam kurun waktu tertentu. Tujuannya bermacam-
macam, contonya untuk menilai kesehatan komunitas pada kondisi normal, untuk menentukan angka
kejadian penyakit-penyakit tertentu, dan lain-lain.
Pendekatan utama pada survei lapangan dapat secara klinis, laboratoris atau penelitian lapangan



tradisional dengan kuesioner. Bila ketiganya digabung, kelebihannya adalah bertambahnya tingkat ketelitian
studi. Survei lapangan selalu mengarah ke faktor-faktor kausal, yang kadang-kadang dikonfirmasi oleh studi
laboratorium selanjutnya, atau membenarkan studi insidensi jangka panjang. Survei lapangan lebih hemat
waktu dibanding studi insidensi, tapi sering digunakan karena ringkas. Survei dapat diulang secara interval
untuk menentukan prevalensi periodik dan untuk meningkatkan kemampuan menentukan faktor kausatif.

3.6. Incidence Study (Studi Longitudinal)
Studi lapangan prospektif jangka panjang lebih menitikberatkan insiden dibanding
prevalens dan biasanya tujuannya adalah mencari kausal dibanding distribusi dan perilaku
penyakit. Jika prinsip eksperimen digunakan pada studi lapangan, data dikumpulkan
dalam bentuk perencanaan yang teliti, dengan menetapkan kondisi-kondisi, konstanta, dan
kontrol.

3.7. Epidemiologi Eksperimental
Usaha untuk menggali hukum-hukum dan prinsip-prinsip dari penyakit masyarakat melalui eksperimen
langsung dengan subgroup populasi merupakan evolusi alami dari epidemiologi eksperimental. Epidemiologi
eksperimental adalah salah satu metode untuk membuktikan kebenaran atau ketidakbenaran suatu hipotesa.
Menggunakan model dasar untuk penelitian pengaruh variasi-variasi pada faktor-faktor dibawah kriteria
kontrol.
3.8. Pelacakan Reservoir Sumber Penyakit (Tracing)
Lapangan kerjanya mirip epidemiologi operasional pada CDC (Communicable Disease Control).
Tujuan praktisnya adalah mengidentifikasi sumber infeksi untuk memperkenalkan ukuran kontrol yang tepat,
dan untuk memformulasikan pencegahan secara praktis untuk menghindari ledakan penyakit berikutnya .
Nama lainnya adalah shoe- leather epidemiology; metodenya adalah penelitian rumah ke rumah, dan
prosedurnya adalah observasional dan deskriptif. Bila sumber epidemik ditelusuri, identifikasi
sumber infeksi nyaris selalu cukup untuk menetapkan ukuran kontrol yang tepat. Pengenalan lebih jauh



reservoir infeksi, biasanya manusia (sebagai pasien ataupun carrier), meningkatkan kemungkinan
menghindari epidemik di masa mendatang.

3.9. Kontrol Penatalaksanaan Penyakit
Pada banyak departemen kesehatan, penetapan ukuran kontrol, seperti ditentukan oleh analis
lingkungan, juga kewajiban epidemiologist, khususnya ukuran darurat untuk mengatasi kekurangan
penyediaan air, produksi susu, distribusi makanan atau manajemen dari carrier penyakit. Tugas-tugas
administratif lainnya termasuk perencanaan dan pengadaan program untuk imunisasi spesifik yang didasari,
pada gilirannya, pada evaluasi tingkat proteksi sebelumnya.
Tindakan pencegahan yang berhasil memerlukan pemahaman sifat biologis penyakit secara luas. Jadi,
bagian epidemiologik dari departemen kesehatan, bertanggungjawab atas penelitian, dengan kompleksitas
yang tinggi atau rendah, biasanya bekerjasama dengan organisasi-organisasi non pemerintah atau pusat-pusat
pendidikan yang berkecimpung dalam penelitian kedokteran.

4. Macam macam Epidemiologi
Ada 3 pendekatan dalam epidemiologi.
4.1. Epidemiologi Deskriptif
Epidemiologi deskriptif merupakan yang paling sering digunakan. Biasanya melibatkan
penentuan insidensi, prevalensi dan angka kematian dalam kelompok-kelompok populasi yang berbeda-beda,
diklasifikasikan oleh karakteristik kelompok seperti usia, jenis kelamin, ras, pekerjaan, pendidikan, tingkat
sosial, tempat tinggal dan waktu. Dengan cara ini, distribusi masalah-masalah kesehatan dalam suatu
komunitas digambarkan dibawah 4 garis besar :
a. jenis penyakit atau masalah kesehatan (WHAT)
b. orang (WHO)
c. tempat (WHERE)
d. waktu (WHEN)
Karakteristik epidemiologi deskriptif :



a. Merupakan karakterisasi penyakit, mempertimbangkan semua variabel dari parameter.
- Penyakit atau masalah kesehatan apa yang terjadi di masyarakat ?
- Siapa saja yang terkena ?
- Di mana terjadinya penyakit ?
- Kapan terjadinya ?
b. Memiliki aplikasi yang luas dalam menyelidiki ledakan penyakit infeksi sama seperti penyakit non
infeksi. Memberikan petunjuk bagi epidemiologi analitik dan memberikan panduan ke arah
penelitian kedokteran (mencari kausa penyakit).
Mengapa dan bagaimana terjadinya ?
c. Sebagai tambahan, epidemiologi deskriptif memiliki peranan dalam wilayah pelayanan kedokteran,
dimana karakterisasi penyakit dalam populasi merupakan dasar bagi perencanaan dan evaluasi
terhadap fasilitas pelayanan kesehatan.
Jadi apa yang mesti dilakukan untuk mencegah atau mengontrol penyakit?

4.2. Epidemiologi Analitik / Etiologik
Epidemiologi analitik menggunakan studi tambahan untuk menguji suatu hipotesis. Melibatkan
evaluasi dari determinan-determinan distribusi penyakit dalam mencari faktor-faktor kausa yang mungkin.
Pada dasarnya ada 2 pendekatan, case control dan cohort studi.
Epidemiologi analitik merupakan aspek krusial dari disiplin, sejak epidemiologi analitik
menyediakan dasar ilmiah bagi penerapan ilmu kedokteran pencegahan untuk mengendalikan sekaligus
eradikasi penyakit.



4.3. Epidemiologi Operasional
Kegiatan- kegiatan lapangan yang terdapat pada epidemiologi operasional adalah :

1. Penelitian terhadap ledakan penyakit



2. Penatalaksanaan pencegahan dan kontrol penyakit-penyakit atau masalah-masalah
kesehatan.
Fungsi utamanya adalah mendukung pekerjaan praktis dari agen-agen kesehatan masyarakat.

4.4. Epidemiologi Eksperimental
Termasuk studi-studi yang mencari bukti untuk efikasi dan/atau efektifitas dari ukuran kontrol,
metode pengobatan baru, ukuran profilaktif/preventif. Epidemiologi eksperimental dapat diklasifikasikan sbb
:
1. Clinical trial
2. Field trial
3. Community trial





Tabel 1.1 Ringkasan kemampuan fungsi pelengkap dari klinis dan epidemiologis dalam
perkembangan kedokteran komunitas.
Prosedur Klinis (individual) Epidemiologis(komunitas)



Pemeriksaan Pemeriksaan pasien. Survei keadaan kesehatan sebuah



Interview dan pemeriksaan komunitas dan keluarga



individual melalui anamnesa, menggunakan kuesioner, tes fisik



P.Fisik, P.Psikologis termasuk dan psikologis dan fasilitas



P.Lab, X-ray, atau cara lainnya khusus untuk pem. massal



Diagnosis a. Biasanya dari seorang a. Diagnosis komunitas



pasien, diagnosis b. Status kesehatan



banding untuk komunitas secara



menentukan penyebab keseluruhan atau segmen



utama keluhan pasien tertentu. Contoh : ibu



b. Penilaian status hamil, akibat kehamilan,



kesehatan dari orang kelahiran dan kematian,



yang tidak sakit. dll.



Contoh : wanita c. Biasanya berorientasi



hamil, anak-anak masalah. Distribusi








Penatalaksanaan




Observasi lanjut
sekolah


Sesuai dengan diagnosis dan
bergantung kemampuan pasien
dan badan kesehatan.
Intervensi biasanya dilakukan
setelah pasien berobat.
Evaluasi kemajuan pasien dan
kadang diagnosis lanjut
banding dari keadaan
khusus pada suatu
komunitas dan penyebab-
penyebab distribusi
tersebut.
Sesuai diagnosis komunitas dan
tergantung pada kemampuan
sistem pelayanan kesehatan.
Pencegahan sering dilakukan
sebelum terjadinya penyakit.
Berkelanjutan untuk :
a. menjamin kelanjutan
b. mengikuti perubahan
status kesehatan
komunitas.
Metode-metode survei yang baru
berperanan pada praktek
kedokteran komunitas dan
pelayanan kesehatan primer di
masa mendatang.









Tabel 1.2 Bagan untuk diagnosis dan penatalaksanaan klinis dan komunitas
Diagnosis klinis Diagnosis komunitas



1. Anamnesa a. Studi populasi dan struktur



demografik



b. Studi lingkungan, geografik, iklim,



dan faktor-faktor lain dalam



komunitas



2. Pem. Fisik a. Studi lebih lanjut faktor yang



mempengaruhi lingkungan dengan metode



inspeksi



b. Survei sampel dan sensus untuk mengukur



prevalensi kondisi penyakit, tingkat



imunisasi, dll.



c. Menginventarisasi apa yang telah dilakukan



pada komunitas dengan memperhatikan



kesehatan dan masalah-masalah kesehatan



melalui seluruh orang dan agen.



3. Tes laboratorium






4. Pembuatan diagnosa

5. Penatalaksanaan



6. Fase evaluasi atau
followup

a. Penggunaan alat diagnosis komunitas
umumnya berkenaan dengan statistik vital
dan angka morbiditas.
b. Penggunaan standar untuk kegunaan
perbandingan
c. Studi-studi khusus dalam epidemiologi
penyakit.
a. Dalam hal kebutuhan dari kesehatan
komunitas.
a. Beberapa kegiatan sosial dapat dilembagakan
untuk tujuan khusus, seperti klinik-klinik,
program-program khusus atau ukuran-ukuran
kesehatan masyarakat lainnya.
a. Hub penatalaksanaan dengan eliminasi,
koreksi atau tindakan perbaikan yang
diindikasikan oleh diagnosis.
b. Hubungan dari manfaat yang menyertai
atau efek samping yang berbahaya.
c. Pertimbangan biaya.











EPIDEMIOLOGI DESKRIPTIF



Epidemiologi menurut Mac Mahon (1970), didefinisikan sebagai berikut: epidemiology is study of
distribution and determinants disease frequency in man. Di Indonesia diartikan sebagai ilmu yang
mempelajari distribusi dan determinan penyakit yang sering pada manusia, distribusi tersebut dapat
berdasarkan waktu, tempat, dan orang. Epidemiologi juga memiliki aspek yang lain, yaitu determinan yang
menerangkan pola kejadian penyakit dalam masyarakat berdasarkan penelusuran atau mencari faktor-faktor
kausal.
Determinan penyakit yang dikenal ada dua yaitu determinan genetic dan determinan lingkungan.
Determinan genetik merupakan faktor penyebab dari suatu penyakit karena kelainan genetik yang diturunkan,
misalnya hemofilia A, sindrom down. Sedangkan determinan lingkungan merupakan faktor penyebab auatu
penyakit yang timbul karena keadaan lingkungan, dimana penderita berdiam, misalnya gastroentritis,
pneumokoniosis.
Epidemiologi terbagi dua yaitu epidemiologi deskriptif dan epidemiologi analitik. Epidemiologi
deskriptif adalah merupakan bagian dari epidemiologi yang menerangkan tentang pola kejadian penyakit pada
suatu populasi (defined community) berdasarkan faktor-faktor waktu, tempat dan orang.
Secara sepintas tujuan menguraikan cara deskriptif ini mungkin dapat dianggap tidak berarti dan
tidak berguna untuk ilmu medis. Namun, penelitian deskriptif ini sebenarnya memiliki kepentingan yang
mendasar dan dapat memenuhi berbagai ragam tujuan terutama menimbulkan kewaspadaan kepada
masyarakat medis untuk mengetahui apakah ciri-ciri manuasia tertentu (misalnya tua, muda, laki-laki,
perempuan, pekerjaan halus atau kasar) cenderung untuk terkena penyakit tertentu dan apakah jenis serta
kapan terjadinya penyakit tersebut diramalkan. Penelitian deskriptif juga membantu dalam perencanaan
penyediaan fasilitas pelayanan medis dan kesehatan yang rasional (misalnya tempat tidur dalam unit
pelayanan tertentu) dan dapat memberikan petunjuk-petunjuk mengenai etiologi penyakit serta permasalahan
atau hipotesa untuk penelitian selanjutnya yang bermanfaat.



Dalam upaya mencari frekwensi distribusi penyakit berdasarkan epidemiologi deskriptif timbul
berbagai pertanyaan, diantaranya siapa yang terkena, bila mana hal tersebut terjadi, bagaimana terjadinya,
dimana kejadian tersebut, berapa jumlah orang yang terkena, bagaimana penyebarannya, dan bagaimana ciri-
ciri orang yang terkena.

1. Variabel Orang, Tempat, dan Waktu
Analisis data epidemiologis berdasarkan variabel diatas digunakan untuk memperoleh gambaran
yang jelas tentang morbiditas dan mortalitas yang dihadapi. Dengan demikian memudahkan untuk
mengadakan penanggulangan, pencegahan atau pengamatan.
Untuk menentukan adanya peningkatan atau penurunan insiden atau prevalensi penyakit yang
timbul, harus diperhatikan kebenaran perubahan tersebut. Perubahan yang terjadi dapat disebabkan perubahan
semu sebagai akibat perubahan dalam teknologi diagnostik, perubahan klasifikasi, atau kesalahan dalam
perhitungan jumlah penduduk.
Sebagai contoh, dilaporkan adanya kecendrungan penurunan prevalensi karsinoma hepatis di negara-
negara maju dalam beberapa dasawarsa terakhir, tetapi setelah dilakukan penelitian secara seksama ternyata
perubahan tersebut disebabkan kemajuan teknologi untuk mendeteksi penyakit kanker hepatis hingga
ditemukan karsinoma primernya yang berarti laporan sebelumnya termasuk juga karsinoma sekunder sebagai
metastase. Laporan insiden dan prevalensi karsinoma hepatis yang dilakukan berdasarkan karsinoma
primernya tampaknya seolah-olah terjadi penurunan insiden.

1.1 Variabel Orang
Untuk dapat mengidentifikasikan seseorang terdapat variabel yang tak terhingga banyaknya, tetapi
hendaknya dipilih variabel yang dapat digunakan sebagai indikator untuk menentukan ciri seseorang. Untuk
menentukan variabel mana yang dapat digunakan sebagai indikator, hendaknya disesuaikan dengan
kebutuhan dan kemampuan serta sarana yang ada.
Faktor orang meliputi ubahan-ubahan yang melekat seseorang sebagai anggota populasi
masyarakat. Ubahan-ubahan yang sering digunakan dalam penelitian epidemiologii ialah umur, sex, suku
bangsa/ kelompok etnis, status perkawinan, sosial ekonomi, agama, dan macam pekerjaan.



1. umur
kita ketahui bahwa pada hakikatnya suatu penyakit dapat menyerang setiap orang pada semua
golongan umur, tetapi ada penyakit-penyakit tertentu yang lebih banyak menyerang golongan umur
tertentu. Umur merupakan faktor yang penting pada proses terjadinya penyakit. Penyakit campak,
penyakit cacar air, batuk rejan, pada umunya diderita pada masa kanak-kanak. Penyakit karsinoma prosta
sering terjadi pada usia lanjut. Penyulit suatu penyakit berbeda diantara golongan umur. Penyakit mumps
dapat mengakibatkan radang buah pelir (orchitis) pada orang dewasa, hal ini tidak terjadi pada penderita
anak-anak.
Banyak penderita penyakit kronis atau degeneratif memperlihatkan peningkatan prevalensi secara
progresif yang mengikuti pertambahan umur, seperti penyakit jantung koroner atau osteoartritis. Penyakit
yang berhubungan dengan pola ini cenderung dianggap terjadi hanya karena proses penuaan sendiri.
Tetapi perlu diingat pertambahan umur juga berarti lewatnya waktu dan selama itu tubuh dapat terkena
terus menerus pengaruh lingkungan yang berbahaya. Lebih baik tidak menerima begitu saja pandangan
fatalistik tersebut yang mengatakan bahwa penyakit merupakan akibat proses penuaan yang tidak bisa
dihindari, tetapi dicari faktor penyebab lain. Salah satu contoh pembuktian ahli-ahli epidemiologi
mengenai penyebab penyebab utama artritis sklerosis bukanlah hanya proses penuaan seperti perkiraan
sebelumnya, melainkan kebiasaan dan cara hidup seseorang turut berperan.
Contoh lain yaitu stenosis pilorik hipertropik hanya terjadi pada bayi atau karsinoma prostat sering
terjadi pada orang-orang usia lanjut. Penyakit-penyakit infeksius sering terjadi pada periode kehidupan
tertentu yang dipengaruhi faktor-faktor derajat terkena penyakit pada berbagai tigkat umur, variasi
kerentanan seseorang menurut umur, dan lamanya kekebalan yang timbul setelah terkena penyakit
infeksi, misalnya cacar yang hanya menyerang anak-anak kecil satu kali saja dan penyakit gonoroe yang
bisa terjadi berulang kali dan terutama dijumpai pada anak remaja dan dewasa muda.
Hubungan antara umur dan penyakit tidak hanya pada frekwensinya saja, tetapi pada tingkat
beratnya penyakit, misalnya stphilococcus dan escheria coli akan menjadi lebih berat bila menyerang
bayi dari pada golongan umur lain karena bayi masiih sangat rentan terhadap infeksi.
Variabel umur merupakan hal yang penting karena semua rate morbiditas dan rate mortalitas yang
dilaporkan hampir selalu berkaitan dengan umur. Walaupun secara umum kematian dapat terjadi pada



setiap golongan umur, tetapi dari berbagai catatan diketahui bahwa frekwensi kematian pada setiap
golongan umur berbeda-beda, yaitu kematian tertinggi terjadi pada golongan umur 0-5 tahun dan
kematian terendah terletak pada golongan umur 15-25 tahun dan akan meningkat lagi pada umur 40
tahun ke atas. Dapat dikatakan bahwa secara umum kematian akan meningkat dengan meningkatnya
umur. Hal ini disebabkan berbagai faktor, yaitu pengalaman terpapar oleh faktor penyebab penyakit,
faktor pekerjaan, kebiasaan hidup atau terjadi perubahan dalam kekebalan.

2. jenis kelamin
peluang terjadinya penyakit sering tidak sama antara perempuan dan laki-laki. Perbedaan sex dalam
insiden penyakit akan menimbulkan pemikiran awal tentang kemungkinan adanya faktor hormonal atau
reproduktif yang menjadi faktor predisposisi atau pelindung.
Wanita dan laki-laki memiliki perbedaan dalam banyak hal, termasuk kebisaan, hubungan sosial,
terkenanya oleh pengaruh lingkungan. Prevalensi sirosis hepatis dan bronkhitis yang lebih tinggi pada
pria, sebagian dihubungkan dengan kenyataan bahwa rat-rata kaum pria lebih sering meminum minuman
keras (alkohol) dan lebih banyak merokok dibanding wanita. Ada beberapa faktor hormonal yang
mungkin berperan dalam menerangkan adanya perbedaan antara pria dan wanita yaitu kaumwanita
dilindungi oleh hormon estrogen sebelum terjadi menopause.
Seperti penyakit jantung koroner lebih banyak terjadi pada laki-laki muda dibandingkan wanita
muda. Juga prevalensi batu empedu lebih banyak pada wanita dibandingkan laki-laki. Hal ini dikaitkan
dengan pengaruh kehamilan yang berkali-kali, selain pengaruh hormonal terhadap komposisi empedu.
Tingkat kematian lebih tinggi pada pria sedangkan tingkat penyakitan lebih tinggi pada wanita. Hal ini
mungkin disebabkan oleh perjalanan penyakit yang kurang progresif pada wanita atau karena wanita
cenderung berobat pada tahap awal dari penyakit.

3. ras
perbedaan ras pada prevalensi penyakit sering ditemui pada beberapa kasus penyakit (perbedaan
kulit putih dan hitam pada sickle cell anemia dan kanker kulit). Terlihat perbedaan ras yang ditentukan
secara genetika. Penyakit-penyakit lain, penjelasan tidak sesederhana ini, khususnya kalau perbedaan



status sosial ekonomi, misalnya prevalensi hipertensi lebih banyak pada orang kulit hitam dibandingkan
orang kulit putih di USA.
Prevalensi hipertensi dan komplikasinya yang lebih tinggi pada orang kulit hitam dibandingkan
orang kulit putih di USA. Hal ini dijelaskan sebagai berikut, meningkatnya kerentanan genetik pada
orang berkulit hitam, meningkatnya stress emosional diantara orang berkulit hitam yang terjadi akibat
dikriminasi ras, tingkat sosial ekonomi yang ratarata lebih rendah pada orang berkulit hitam, dan
jangkauan pelayanan medis yang lebih sempit bagi orang berkulit hitam.

4. status perkawinan
status perkawinan merupakan pokok perhatian dalam penelitian etiologi penyakit kanker tertentu,
misalnya perbedaan kanker payudara dan kanker cervix uteri. Kanker payudara lebih cenderung terjadi
pada wanita yang menikah terlambat, sedangkan kanker cervix lebih sering dijumpai pada wanita dengan
perkawinan dini. Pada penelitian lebih lanjut, dapat ditunjukkan bahwa kanker cervix mempunyai kaitan
dengan kegiatan senggama pada waktu usia muda dan juga kehamilan pertama pada usia muda dapat
membantu melindungi seorang wanita terhadap kanker payudara.

5. status sosial ekonomi
pada status sosial ekonomi yang rendah dijumpai insiden penyakit tertentu meningkat yaitu penyakit
jantung rematik, bronkhitis kronis, tuberkulosis, ulkus lambung, kanker lambung dan penyakit-penyakit
kekurangan gizi.
Pada keadaan status sosial ekonomi rendah juga terlihat memberikan perlindungan dalam melawan
beberapa penyakit. Hal ini dapat dilihat pada kasus epidemi poliomielitis pada tahun 1947, dimana
golongan sosial ekonomi tinggi yang paling banyak terserang. Hal ini karena keadaan sosial ekonomi
jelek dan yang memiliki sanitasi yang buruk, mereka telah mengakibatkan tersebarnya infeksi subklinis
pada bayi yang kemudian menghasilkan kekebalan.

1.2 Variabel Tempat
Tempat dapat dibatasi oleh alam, seperti gunung, lembah, sungai, laut, atau dibatasi berdasarkan



wilayah administratif. Batas alamiah lebih memudahkan pemahaman asal usul penyakit.
Ragam penyakit disuatu tempat berhubungan dengan ciri-ciri lingkungan fisik seperti suhu,
kelembaban, curah hujan, ketinggian, kandungan mineral tanah dan tersedianya air. Batas-batas alam yang
tangguh mengakibatkan isolasi penduduk sehingga ciri-ciri genetik tertentu semakin menonjol dan adat
istiadat tetap bertahan dari pengaruh asing.
Hal ini mempengaruhi penyakit di wilayah tersebut. Kondisi alam menentukan macam-macam
kegiatan ekonomi dan transportasi yang berhubungan dengan jangkauan fasilitas pelayanan kesehatan.
Penyakit yang memiliki penyebaran khas dapat berhubungan dengan kandungan mineral tanah (gondok
endemik), dengan kecocokan lingkungan bagi vektor penyakit (malaria dan skistomiasis), dengan pengaruh
sosial budaya setempat (penyakit kuru di Guinea Baru yang berhubungan dengan kanibalisme).
Deskripsi ragam penyakit berdasarkan wilayah administrasi lebih sering dilakukan, karena
kemudahan memperoleh data yang berasal dari statistik rutin pelayanan kesehatan. Perbandingan ragam
penyakit internasional perlu dilakukan dengan hati-hati, mengingat perbedaan dalam kriteria diagnostik serta
kecermatan pencatatan dan pelaporan antar negara. Penelitian yang membandingkan diagnosis penyakit jiwa
di New York dan London telah menunjukkan para ahli kedokteran jiwa di New York lebih cenderung untuk
memilih diagnosis skizofrenia, sedangkan di London para ahli jiwa lebih menyukai diagnosis manik depresif
untuk gejala-gejala yang sama.

1.3 Variabel Waktu
Variabel waktu harus diperhatikan ketika melakukan analisis morbiditas dalam studi epidemiologi
karena pencatatan dan laporan insiden dan prevalensi penyakit selalu didasarkan pada waktu, apakah
mingguan, bulanan, atau tahunan.
Laporan morbiditas ini menjadi sangat penting artinya dalam epidemiologi karena didasarkan pada
kejadian yang nyata dan bukan berdasarkan perkiraan atau estimasi. Selain itu, dengan pencatatan dan laporan
morbiditas dapat diketahui adanya perubahan-perubahan insiden dan prevalensi penyakit hingga hasilnya
dapat digunakan untuk menyusun perencanaan dan penanggulangan msalah kesehatan.
Mempelajari morbiditas berdasarkan waktu juga penting untuk mengetahui hubungan antara waktu
dan insiden penyakit atau fenomena lain, misalnya penyebaran penyakit saluran pernafasan yang terjadi pada



waktu malam hari karena terjadinya perubahan kelembaban udara atau kecelakaan lalu lintas yang sebagian
besar terjadi pada waktu malam hari.
Fluktuasi insiden penyakit yang diketahui terdiri dari kecendrungan sekuler, variasi siklik, variasi
musim, variasi random. Kecendrungan sekular ialah terjadinya perubahan penyakit atau kejadian luar biasa
dalam waktu yang lama. Lamanya waktu dapat bertahun-tahun sampai beberapa dasawarsa. Kecendrungan
sekular dapat terjadi pada penyakit menular maupun penyakit non-menular. Misalnya terjadi pergeseran pola
penyakit yang tidak menular yang terjadi di negara maju pada beberapa dasawarsa terakhir. Pengetahuan
tentang perubahan tersebut dapat digunakan dalam penilaian keberhasilan upaya pemberantasan dan
pencegahan penyakit. Kecendrunan sekuler juga dapat digunakan untuk mengetahui perubahan yang terjadi
pada mortalitas. Dalam mempelajari kecendrungan sekular tentang mortalitas, harus dikaitkan dengan sejauh
mana perubahan pada insiden dan sejauh mana perubahan tersebut menggambarkan kelangsungan hidup
penderita. Angka kematian akan sejalan dengan angka insiden pada penyakit fatal dan bila kematian terjadi
tidak lama terjadi tidak lama setelah diagnosis misalnya karsinoma paru-paru.
Variasi siklik ialah terulangnya kejadian penyakit setelah beberapa tahun, tergantung dari jenis
penyakitnya, misalnya epidemi campak biasanya berulang setelah dua-tiga tahun kemudian. Variasi siklik
biasanya terjadi pada penyakit menular karena penyakit non-infeksi tidak mempunyai variasi siklik.
Perubahan pola penyakit disebut siklik jika tingkat penyakitan naik turun selang beberapa hari, minggu dan
bulan atau bersifat musiman. Dirasakan sesak nafas pada penyakit bisinosis karena debu kapas, memuncak
pada hari pertama masuk kerja, setelah penderita terbebas dari kapas selama liburan akhir minggu. Tingkat
penyakitan berbagai penyakit endemik, misalnya penyakit tifoid, naik turun selang beberapa bulan.
Variasi musiman ialah terulangnya perubahan frekwensi insiden dan prevalensi penyakit yang terjadi
dalam satu tahun. Dalam mempelajari morbiditas dan mortalitas, variasi musim merupakan salah satu hal
yang sangat penting karena siklus penyakit terjadi sesuai dengan perubahan musim dan berulang setiap tahun.
Variasi musim sangat penting dalam menganalisis data epidemiologis tentang kejadian luar biasa untuk
menentukan peningkatan insiden suatu penyakit yang diakibatkan variasi musim atau memang terjadinya
epidemi. Bila adanya variasi musim tidak diperhatikan, kita dapat menarik kesimpulan yang salah tentang
timbulnya kejadian luar biasa. Disamping itu, pengetahuan tentang variasi musim juga dibutuhkan pada
penelitian epidemiologis karena penelitian yang dilakukan pada musim yang berbeda akan menghasilkan



frekwensi distribusi penyakit yang berbeda pula. Penyakit-penyakit yang mempunyai variasi musim antara
lain diare, influenza, dan tifus abdominalis.
Variasi random dapat diartikan sebagai terjadinya epidemi yang tidak dapat diramalkan sebelumnya,
misalnya epidemi yang terjadi karena adanya bencana alam seperti banjir dan gempa bumi.
Berbagai fenomena berkaitan dengan perubahan waktu. Sejalan dengan perjalanan waktu, musim
silih berganti, keadaan lingkungan berubah, situasi sosial ekonomi berbeda, jumlah dan mutu pelayanan
kesehatan dapat meningkat atau merosot. Jika suatu penyakit terus menerus ditemukan pada sekelompok
masyarakat, baik dalam bentuk klinik yang berat, bentuk ringan maupun subklinik, penyakit tersebut disebut
endemik. Penyakit-penyakit kolera, malria, tuberkulosa, filariasis, demam berdarah, bersifat endemik
diberbagai daerah di Indonesia.
Penyakit endemik tiba-tiba dapat meledak dengan tingkat penyakitan yang tinggi, sehingga terjadilah
suatu wabah. Misalnya penyakit dipteri yang pada suatu saat merajalela di dalam sekelompok masyrakat, tiba-
tiba dapat muncul dan menjadi wabah. Sebagai contoh, wabah penyakit kaki gajah (filariasis) diantara para
transmigan yang di daerah asalnya tidak mengenal penyakit tersebut.
Epidemi atau wabah merupakan kejadian penyakit pada anggota-anggota suatu populasi tertentu
yang jumlahnya jelas melebihi kasus yang biasanya ditemukan pada populasi itu. Epidemi ini biasanya hanya
mengenai anggota yang rentan dan anggota populasi ini bisa tidak terbatas jumlahnya.

2. Survailens Epidemiologi
Tingkat terbebasnya dari penyakit menular merupakan suatu survailens yang menetap terminologi
survailens pertama kali digunakan pembatasan tertentu pada individu sesudah kontak dengan penyakit
menular yang serius. Orang yang tersangka di tempatkan dibawah pengawasan medik untuk periode yang
sama pada periode inkubasi dari penyakit untuk deteksi beberapa tanda dan gejala dari penyakit. Jika hal ini
jelas, orang tersebut diobati sebagai kasus. Sejak tahun 1950 konsep survailens diperluas dan di aplikasikan
untuk mengatur hubungan suatu penyakit dengan jelas dari penderita atau kontak.
Saat ini, survailens terdiri dari beberapa aktivitas pada lapangan penelitian tertentu. Seluruh
kasus yang dicurigai bersama-sama dengan konfirmasi laboratorium untuk diagnosis persuasif, untuk
menentukan sumber infeksi, rute transmisi, identifikasi, siapa-siapa yang terkena infeksi dan yang mempunyai



resiko, akhirnya untuk mengetahui penyebaran penyakit, penelitian ini idealnya dilakukan oleh epidemiologis
atau dokter.
Komparabilitas data survailens tergantung daari sensitivitas, reabilitas, representatif sepanjang waktu
dan daerah yang satu ke daerah lain, dan perubahan-perubahan yang mungkin terjadi dalam sistim survailens.
Ada beberapa jenis survailens yaitu survailens aktif dan survailens pasif. Survailens aktif merupakan
usaha khusus yang dilakukan untuk memperoleh kejadian yang lebih lengkap dengn sumber-sumber yang
ada. Sedangkan survailens pasif merupakan kejadian-kejadin yang dilaporkan/diterima tanpa ada usaha
khusus untuk memperoleh data yangn lebih lengkap.
Survailens komprehensif memiliki ciri-ciri dimana seluruh jenis kasus berasal dari seluruh sumber
yang ada, biasanya dilaksanakan secara pasif, insidens yang diperoleh masih under estimate dan
kecendrungan dapat dimonitor. Survailens sentinel memiliki sumber yang terbatas, biasanya dilaksanakan
secara aktif dan kecendrungan dapat dimonitor.
Langkah-langkah di dalam aktivitas survailens adalah tentukan masalah secara jelas terlebih dahulu,
tentukan populasi studi, tempat dan periode waktu observasi kemudian tentukan unit observasi dan spesifikasi
data apa yang ingin dikumpulkan lalu tentukan strategi studi dan tentukan metode pengumpulan data. Setelah
itu, dilanjutkan dengan pelaksanaan pengumpulan data, analissa dat dan interpretasi data. Tentukan strategi
pencegahan dan pemberantasan. Berikan hasilnya kembali kepada pemberi data dan orang lainnya yang
membutuhkan. Selanjutnya tentukan riset apa lagi yang dibutuhkan.

3. Ukuran Morbiditas
Morbiditas dalam arti sempit dimaksudkan sebagai peristiwa sakit atau kesakitan. Dalam arti luas
morbiditas mempunyai pengertian yang jauh lebih kompleks, tidak saja terbatas pada statistik atau ukuran
yang berkaitan dengan peristiwa tersebut, tetapi juga faktor determinan termasuk antara lain faktor sosial,
ekonomi, budaya yang melatarbelakanginya.

Rasio
Rasio merupakan suatu angka yan menunjukkan besar perbandingan antara jumlah tertentu dengan
jumlah lainnya. Bentuk rasio yang paling umum digunakan dalam hubungannya dengan ukuran frekwensi



penyakit adalah rasio antara jumlah penduduk yang menderita penyakit dari jumlah penduduk yang tidak
menderita penyakit. Sebagai contoh, rasio antara jumlah bayi dengan berat lahir dibawah 2500g dengan
jumlah bayi dengan berat lahir diatas 2500g.

Rate
Rate adalah menyatakan frekwensi penyakit per satuan penduduk. Untuk tujuan epidemiologi, rate
perlu dinyatakan dengan kurun waktu dimana pengamatan terhadap kasus penyakit. Contoh, rate penyakit
tuberkulosis pada kota A pada tanggal 1 Januari 1993 adalah 500 per 2000000 penduduk. Untuk tujuan
perbandingan penyakit dengan jumlah penduduk , biasanya dinyatakan dalam kelipatan sepuluh. Jadi rate
TBC di kota A dapat dinyatakan sebagai 0,025/100; 0,25/100; 250/ sejuta penduduk. Rate memerlukan tiga
item infomasi yaitu pembilang yangn menunjukkan jumlah penduduk yang mengalami kejadian, penyebut
yang merupakan jumlah penduduk yang diamati dan kurun waktu pengamatan.
Pembilang dan penyebut pada suatu rate perlu mempunyai batasan yang sama, apabila pembilang
membatasi penduduk dengan umur, jenis kelamin, dan kelompok etnik tertentu, maka penyebut juga harus
membatasi pada hal yang sama. Apabila penyebut membatasi hanya pada penduduk yang mempunyai resiko
untuk mengalami penyakit, maka penyebut sering disebut sebagai population at risk.
Jumlah kasus suatu penyakit kadang-kadang dinyatakan secara relatif terhadap penduduk, yang
disebut sebagai proportional rate. Contoh, proporsi kematian akibat penyakit tertentu terhadap seluruh
kematian, yang disebut proportional mortality rate. Contoh lain, insiden suatu penyakit dilaporkan sebagai
proporsi penderita penyakit tersebut terhadap seluruh penderita yang berkunjung.

Insiden
Insiden suatu penyakit didefinisikan sebagai jumlah kasus baru penyakit tersebut selama kurun
waktu tertentu. Rate insiden merupakan insiden per population at risk nya. Konsep population at risk penting
dalam hubungannya dengan pemahaman rate insiden. Population at risk diartikan sebagai jumlah orang-orang
yang mempunyai resiko terkena penyakit. Secara toritis, population at risk merupakan jumlah lama
waktu sehat dalam tahun yang dijalani bersama-sama oleh semua anggota penduduk dari awal sampai akhir
suatu kurun waktu pengamatan. Dalam praktek besar population at risk umumnya diperkirakan dengan



jumlah penduduk tengah kurun waktu. Perkiraan ini didasarkan pada asumsi netral bahwa dari jumlah kasus
baru yang terjadi selama kurun waktu pengamatan, separuh terjasi sebelum dan separuh terjadi sesudah
tengah kurun waktu pengamatan. Penentuan insiden suatu penyakit umumnya didasarkan pada mulainya
gejala timbul, waktu diagnosis penyakit, tanggal pelaporan atau tanggal dirawat. Perlu dicatat bahwa insiden
adalah frekwensi kejadian selama suatu kurun waktu.
Jadi insiden adalah upaya untuk menjelaskan faktor kausal, menitik bertakan pada penjelasan tetang
kejadian penyakit, dan ukuran deskriptif yang paling mengena untuk keadaan ini adalah insiden rate. Faktor
kausal bekerja sebelum dimulainya serangan penyakit dideteksi dimana insiden dihitung, berarti pengukuran
semakin langsung atau semakin dekat dengn faktor kausal.

Attack Rate
Resiko terhadap suatu penyakit pada suatu penduduk mungkin saja terbatas pada kurun waktu
pendek. Hal ini dapat terjadi karena faktor etiologi penyakit hanya muncul sebentar, yaitu hanya selama
epidemi, atau resiko penyakit hanya terdapat pada kelompok masyarakat tertentu. Sebagai contoh, suatu studi
terhadap 194000 bayi yang baru lahir, ternyata 578 diantaranya mengalami hipertropik pilorok stenosis.
Karena kejadian ini terutama terjadi pad umur dibawah 3 bulan dan hampir tidak pernah ditemukan pada bayi
umur lebih dari 6 bulan, maka kurun waktu pengamatan yang relatif pendek sudah cukup memadai. Dalam
hal ini, rate insiden pilorik stenosis adalah 578x1000/194000 atau 3 per 1000 kelahiran, tanpa perlu
memberikan spesifikasi lama kurun waktu pengamatan.

Secondary Attack Rate
Rate ini mengukur kejadian suatu penyakit menular diantara orang-orang yang dicurigai terkontak
dengan kasus primer. Secondary Attack Rate SAR) diperoleh sebagai berikut:
SAR=jumlah kasus terkontak dg kasus primer dalam periode inkubasi maksimal x100
Population at risk

Prevalensi
Point prevalen merupakan suatu ukuran sensus atau survei, yaitu mengenai frekwensi suatu penyakit



pada suatu saat tertentu. Pada suatu penduduk, pada suatu saat point prevalensi rata-rata suatu penyakit
merupakan proporsi dari penduduk tersebut yang pada saat itu menderita penyakit tanpa memandang kapan
penyakit telah mulai. Penyebut adalah semua penduduk baik yang menderita maupun yang tidak menderita
penyakit.
Periode prevalen merupakan suatu ukuran yang menunjukkan jumlah kasus penyakit yang ada, baik
yang lama maupun yang baru selama kurun waktu tertentu. Peride prevalen merupakan jumlah antara point
prevalen (jumlah kasus yang ada pada awal dan akhir suatu kurun waktu). Periode prevalen kurang
bermanfaat karena secara umum diperlukan perbedaan antara kasus lama dan kasus baru. Dengan demikian,
ukuran frekwensi penyakit yang banyak digunakan adalah point prevalen dan insiden. Point prevalen untuk
selanjutnya disebut sebagai prevalen.
Terdapat hubungan penting antara prevalen dan insiden. Prevalensi bervariasi menurut hasil
perkalian antara insiden dan lama penyakit (D). D dihitung sejak awal penyakit sampai berakhirnya penyakit
yang diukur dari dalam kurun waktu yang sama. Lama penyakit diukur dari titik yang sama (misalnya tanggal
diagnosis) dan prevalen hanya memasukkan kasus pada titik atau setelah titik tersebut.
Perubahan prevalen dari suatu kurun waktu ke kurun waktu berikutnya dapat terjadi karena
perubahan dalam insiden, lama penyakit, atau kedua-duanya. Sebagai contoh; kemajuan pengobatan suatu
penyakit yang mencegah kematian bayi tetapi tidak menghasilkan kesembuhan, justru akan memberi
pengaruh paradoks yaitu meningkatnya prevalen penyakit. Penurunan suatu prevalen boleh jadi bukan saja
karena penurunan insiden tetapi dapat juga karena lama penyakit yang memendek atau jumlah penderita yan
meninggal semakin banyak. Selanjutnya apabila lama penyakit memendek secara nyata, prevalen dapat turun
walaupun insiden meningkat. Penurunan prevalen penderita yang dirawat di rumah sakit jiwa yang banyak
dilaporkan merupakan contoh fenomena yang disebut terakhir.
Pada keadaan dimana insiden dan lama penyakit menetap dalam dimensi waktu, dikatakan penyakit
dalam keadaan stabil. Hubungan antara prevalen, insiden dan lama penyakit dapat dinyatakan sebagai berikut:

P = I x D
P= prevalen
I= insiden



D= durasi penyakit

Pada persamaan tersebut apabila dua nilai diketahui maka nilai yang lain diketahui, maka nilai yang lain dapat
diketahui.

4. Ukuran Mortalitas
Data kematian dapat digunakan sebagai pengukur derajat kesehatan masyarakat yaitu merupakan
salah satu indeks status kesehatan penduduk. Makin besar kematian, khususnya dari golongan umur anak dan
dewasa muda, berarti makin rendah derajat kesehatan masyarakat. Memang kematian merupakan salah satu
kejadian kehidupan yang harus terjadi pada setiap orang, akan tetapi saat terjadinya tentu akan lebih baik
setelah mencapai umur lanjut. Sedangkan apabila terjadi pada umur muda berarti banyak faktor yang
mempengaruhi kejadian kematian ini, yang perlu diusahakan untuk diatasi melallui kegiatan kesehatan
masyarakat dan teknologi kedokteran yang kini dapat diterapkan. Data kematian juga digunakan untuk
menilai keberhasilan usaha kesehatan dan usaha pengobatan yang dijalankan.
Dari sudut statistik, definisi mati atau kematian ialah hilangnya secara permanen semua tanda-tanda
kehidupan pada setiap waktu setelah kelahiran hidup (lenyapnya fungsi-fungsi hidup sesudah dilahirkan tanpa
kemungkinan resusitasi.
Dalam mengukur kematian pada suatu populasi biasanya diperhatikan hal-hal antara lain jumlah
orang yang mati (nilai absolut dari kejadian kematian), umur orang yang mati (distribusi menurut golongan
umur), golongan etnik orang yang mati (distribusi menurut golongan etnik), dan sebab kematian (penyakit
atau gangguan kesehatan yang menyebabkan kematian).

Crude Death Rate
Angka kematian kasar adalah ukuran kematian yang diperhitungkan untuk dan dasar seluruh penduduk, dan
diperoleh dengan jalan membandingkan kejadian kematian terhadap seluruh penduduk tanpa memperhatikan
sifat-sifat tertentu penduduk tersebut.

CDR= jumlah kematian yang terjadi diantara populasi dalam daerah tertentu selama setahun x1000



Populasi total pertengahan tahun pada daerah tertentu pada tahun yang sama

Dari data ini jelas bahwa CDR merupakan angka perkiraan kasar mengenai probabilitas kematian
dalam masyarakat. Disebut perkiraan kasar karena perbandingan diambil terhadap seluruh penduduk dari
semua umur dan tentang kematian dari semua sebab. Angka ini sering dipakai sebagai indeks berbagai
masalah kesehatan dalam masyarakat.

Specific Death Rate
Angka kematian khusus adalah suatu ukuran untuk salah satu sifat yang ada pada penduduk seperti
golongan umur, golongan sex, golongan pekerjaan, status pekerjaan, status perkawinan dan lain-lain.

SDR= jumlah kematian yg terjadi diantara populasi kelompok daerah tertentu selama setahun x1000
Populasi total pertengahan tahun pada daerah tertentu pada tahun yang sama

Maksud kata tertentu/khusus pada rumus diatas karena rate adalah salah satu segmen daripada
penduduk yang mempunyai banyak kerentanan yang berbeda terhadap kematian.

Cause Specific Mortality Rate
SDR= jumlah kematian oleh penyakit tertentu dalam satu periodex1000
Jumlah penderita penyakit tersebut dalam periode yang sama

















EPIDEMIOLOGI DESKRIPTIF MASALAH KANKER

1. Definisi
Epidemiologi deskriptif masalah kanker adalah studi yang mempelajari besarnya masalah kanker dan
distribusinya menurut variabel orang, tempat, dan waktu di dalam masyarakat.

2. Tujuan Epidemiologi deskriptif:
1. agar dapat dilakukan evaluasi kecendrungan-kecendrungan masalah kanker sehingga dapat dilakukan
perbandingan antar negara dan antar daerah di dalam satu negara
2. untuk memberikan informasi yang dibutuhkan sebagai dasar perencanaan, pelaksanaan, dan evaluasi
pelayanan kesehatan sehubungan dengan masalah kanker
3. untuk mengidentifikasikan masalah kanker, yang dapat ditelusuri lebih lanjut dengan epidemiologi
analitik, dan untuk mengidentifikasikan penyebab-penyebab yang mungkin menyebabkan masalah
ini.




Untuk mendeskriptifkan adanya masalah kanker, pertanyaan utama yang harus dijawab adalah siapa
yang terkena, dimana kasus ini terdapat, dan kapan kasus ini terjadi.
a. orang
terjadinya masalah kanker di masyarakat mungkin dapat dihubungkan dengan usia, jenis kelamin, kelompok
etnik/ ras, status sosial ekonomi, pekerjaa, pendidikan, daerah geografi tertentu, dan pemilihan atau tigkat



penghasilan.

b. tempat
lokasi dapat dideskriptifkan di dalam kaitannya dengan bangsa, daerah geografi, unit administratif atau unit
polotik. Tempat juga dapat diklasifikasikan menurut karakteristik lingkunngan, tingkat pertumbuhan ekonomi
dan lokasi rural/ urban.

c. waktu
masalah kanker dapat diekspresikan sebagai kejadian per periode waktu tertentu misalnya tahun. Kejadian-
kejadian kanker sepanjang waktu dapat tidak regular, konstan, meningkat, menurun, ada pola siklis, musim,
dan sebagainya. Pembahasan di dalam terjadinya penyakit sepanjang waktu tertentu, dapat menunjukkan
adanya perubahan di dalam faktor lingkungan, dan atau efektivitas dari proggram intervensi yang
dilaksanakan. Penentuan insiden dari kondisi sebelum dan sesudah intervensi program tertentu, sangat
berguna untuk menilai efek dari intervensi.


3. Survailans Kanker
3.1 Definisi
Survailans kanker merupakan kegiatan pengumpulan, pengolahan, interpretasi data mejadi informasi yang
kemudian disebarluaskan kepada pihak yang berkepentingan dan kegiatan-kegiatan ini merupakan kegiatan
yang berkesinambungan. Kegiatan ini dianggap studi deskriptif yang terus menerus berlangsung.

3.2 Tujuan:
1. mendeskripsikan masalah kanker menurut orang, tempat dan waktu
2. memonitor perubahan dari pola yang ada
3. menentukan prioritas masalah kesehatan masyarakat
4. evaluasi dari pemaparan yang khusus
5. evakuasi program pencegahan dan pemberantasan



6. pembuatan hipotesa untuk penelitian lebih lanjut dengan studi analitik

3.3 Sumber Data:
1. record/catatan rumah sakit/fasilitas kesehatan
2. record/catatan baha-bahan patologi baik dari otopsi maupun biopsi
3. survei:
-survei dalam rangka penemuan kasus
-suvei kanker
4. pemakaian obat-obat anti kanker
5. record/catatan dari populasi yang khusus seperti ketentaraan dan kelompok industri tertentu
6. registrasi kanker
7. record/catatan sertifikat kematian
komparabilitas data survailans tergantung dari sensitivitas, reabilitas, representif sepanjang waktu dan dari
daerah yang satu ke daerah yang lain dan perubahan-perubahan yang mungkin terjadi dalam sistim survailens.

4. Ukuran Frekwensi Kejadian Kanker
Data tentang frekwensi penyakit dan macam-macam aspek penyakit dalam masyarakat, sangat
penting artinya dalam merencanakan pelayanan kesehatan dan mengevaluasi tentang efektivitasnya, untuk
mencari penyebab penyakit, untuk mengevaluasi cara pemberantasan penyakit, dan lain sebagainya.
Penggambaran frekwensi penyakit yang paling sederhana, adalah dengan menyatakan banyaknya
kasus yang ada. Misalnya pada tahun 1966 ada 699 kasus kanker paru di Peru. Ini menunjukkan beban yang
dipikul oleh Dinas Kesehatan Peru yang disebabkan oleh penyakit kanker paru. Dengan data ini Pemerintah
Peru dapat merencanakan seberapa obat yang disediakan untuk menolong penderita kanker paru di negeri itu.
Bila ternyata bahwa pada tahun 1960 jumlah kasus kanker paru yang ada hanya 500 orang, dapatkah kita
simpulkan bahwa keadaan di Peru bertmbah buruk? Memang bila dilihat dari beban terhadap Dinas
Kesehatan, memang bertambah berat, tetapi bila dilihat dari keseluruhan penduduk, ternyata
bahwa kasus dari tahun 1966 merupakan 699/9000000 penduduk sedangkan kasus pada tahun 1960
merupakan 500/5000000 penduduk. Nyatalah bahwa untuk membandingkan dua hal/kelompok/populasi yang



berbeda, nilai mutlak saja tidak dapat dipakai, tetapi haruslah dilihat kuantifikasinya terhadap keseluruhan
populasi.
Ukuran frekwensi penyakit yang memungkinkan untuk mengadakan perbandingan inilah yang
penting dalam epidemiologi.. untuk itu dapat dipakai rate atau ratio.

5. Rate dan Rasio
Rate dan rasio merupakan cara penggambaran penyakit yang paling sering digunakan dalam
epidemiologi karena dapat dipakai untuk membandingkan. Rasio merupakan istilah yang sangat umum, dapat
diterjemahkan sebagai dibanding dengan. Misalnya rasio antar orang sakit dengan orang sehat, sama
dengan jumlah orang sakit dibanding dengan orang yang sehat atau dapat dituliskan sebagai:

Jumlah orang yang sakit
Jumlah orang yang sehat

Rasio menunjukkan perbandingan antara dua kualitas yaitu kuantitas pembilang (numerator) dan kuantitas
penyebut (denominator)nya. Kedua kuantitas tersebut tidak harus mempunyai sifat/ciri yang sama. Apabila
pembilang merupakan sebagian dari penyebut, maka bentuk ini disebut proporsi. Contoh dari proporsi yang
paling sering dipakai adalah persentasi, misalnya persentasi dari penderita kanker paru di rumah sakit A yang
dapat dihitung dari:
Jumlah penderita kanker paru yang datang berobat ke RS A
jumlah orang yang berobat ke SR A(kanker paru+bukan kanker paru)

keistimewaaan lain dari proporsi adalah apabila unsur waktu diperhitungkan, maka unsur tersebut harus ada
dan sama besarnya pada pembilang maupun penyebut. Apabila pembilang dikumpulkan dalam waktu satu
tahun penanggalan; maka penyebut pun harus dikumpulkan pula dalam waktu satu tahun penanggalan.
Dalam prakteknya, hal ini tak selalu mungkin untuk dikerjakan. Misalnya perhitungan frekwensi
penyakit. Jumlah penderita penyakit akan dihitung selama periode waktu tertentu (misalnya saru
penangggalan), sedangkan jumlah penduduk yang ada akan diperhitungkan rata-ratanya. Ini sama dengan
jumlah populasi pada pertengahan periode waktu tersebut. Rasio dimana pembilangnya merupakan sebagian



dari penyebut, dan merupakan hasil pengumpulan data dalam satu periode waktu sedangkan penyebutnya
hasil dari perhitungan sesaat, disebut rate. Jadi dalam perhitungan rate tersebut, ada tiga faktor yang penting
yaitu pembilang (numerator), penyebut (denominator), dan waktu.

Morbidity rate=jumlah orang sakit tertentu pada periode tertentu
Jumlah penduduk penderita berasal pada pertengahan periode

Bila dalam suatu rate penyebutnya hanya terbatas pada mereka yang mempunyai resiko untuk
mengalami event yang dimaksud maka denominator ini disebut population at risk. Rate yang penyebutnya
population at risk ini mengukur kemungkinan/resiko dari setiap individu dalam populasi tersebut untuk
mengalami event itu.
Dalam menginterpretasikan rate, rasio atau proporsi ini penting untuk memperhatikan sumber angka-
angka pembilang san penyebut yang dipakai, dan cara pengumpulan datanya. Data tentang penyakit umumnya
lebih susah didapatkan dari pada data kematian. Ini desebabkan karena tidak semua penyakit di laporkan
kepada Dinas Kesehatan, lagi pula penyakit mempunyai sifat yang sangat berlainan dari kematian yaitu,
kematian merupakan hal yang pasti dan mudah ditentukan, kematian terjadi pada satu saat yang dapat
ditentukan dengan tepat, sedangkan waktu berlangsungnya penyakit sukar ditentukan, kematian hanya terjadi
satu kali pada setiap individu sedangkan penyakit bisa menyerang orang yang sama beberapa kali dalam satu
periode.
Disamping itu penyakit mempunyai manifestasi yang sangat bervariasi. Jadi agar dapat
diperbandingkan haruslah jelas apa yang diukur dalam pembilangnya misalanya jumlah orang yang sakit atau
jumlah sakitnya atau dua-dua nya. Karena penyakit tidak berlangsung sesaat tetappi berjalan dalam periode
waktu misalany 3 hari, 5 bulan, 6 tahun dan sebagainya maka bila waktu pengamatan telah ditentukan,
misalnya pada tahun penanggalan, penyakit yang diamati dapat digolongkan atas beberapa golongan yaitu
penyakit yang dimulai pada tahun penanggalan tersebut dan sembuh dalam tahun itu juga, penyakit yang
dimulai dalam tahun penanggalan itu dan terus berlangsung walaupun tahun penanggalan sudah
selesai, penyakit yang belum dimulai sebelum tahun penanggalan tersebut tapi sembuh dalam tahun itu,
dan penyakit yang dimulai sebelum tahun penanggalan tersebut dan terus berlangsung walaupun tahun itu



sudah berlalu.
Oleh karena perhitungan kasus lama dan baru mempunyai kegunaan yang berbeda maka dalam
epidemiologi tersedia dua macam ukuran yang dapat dipakai untuk menggambarkan frekwensinya yaitu
prevalensi dan insiden.

6. Prevalensi dan Insiden
Prevalensi rate dan insiden merupakan ukuran penyakit yang sering dicampur adukkan
pemakaiannya. Prevalensi merupakan ukuran yang mengurusi data tentang kasus lama. Ada dua macam
ukuran yaitu point prevalence dan period prevalence. Dimana point prevalence merupakan data penyakiy
yang serupa dengan sensus. Dia menyatakan jumlah penderita yang ada pada suatu waktu. Point prevalence
rate adalah proporsi dari penduduk yang sakit pada waktu tersebut. Pembilangnya terdiri atas semua oran
sakit, tanpa dibedakan sejak kapan mulainya dia sakit; sedangkan penyebutnya adalah jumlah penduduk yang
diperiksa baik yang sakit maupun yang sehat. Jadi point prevalence rate menggambarkan apa yang ada pada
waktu itu.
Periode prevalence menunjukkan jumlah penderita pad satu periode waktu. Periode prevalence rate
adalah jumlah tersebut persatuan penduduk yang diperiksa.
Insiden merupakan ukuran penyakit yang mengurusi kasus baru saja. Insiden dari suatu penyakit
adalah jumlah kasus baru yang timbul pada satu periode waktu yang telah ditentukan, jadi dia menunjukkan
frekwensi event yang timbul dalam periode tersebut. Insiden rate adalah jumlah kasus baru yang timbul
dalam satu periode waktu per population at risk. Insiden rate ini diperlukan untuk membandingkan
perkembangan penyakit pada populasi/kelompok yang berbeda dan mencari etiologi dari suatu penyakit.

7. Ukuran-ukuran Kematian
Ukuran ukuran kematian banyak juga dipakai dalam epidemiologi oleh karena ini kematian ini
merupakan salah satu hasil akhir dari penyakit. Tidak berbeda dengan rate dari suatu penyakit, untuk
menghitung rate dari suatu kematian pun diperlukan pembilang, penyebut, dan waktu yang ditentukan.

Crude Death Rate



Angka kematian kasar adalah ukuran kematian yang diperhitungkan untuk dan dasar seluruh penduduk, dan
diperoleh dengan jalan membandingkan kejadian kematian terhadap seluruh penduduk tanpa memperhatikan
sifat-sifat tertentu penduduk tersebut.

CDR= jumlah kematian yang terjadi diantara populasi dalam daerah tertentu selama setahun x1000
Populasi total pertengahan tahun pada daerah tertentu pada tahun yang sama

Dari data ini jelas bahwa CDR merupakan angka perkiraan kasar mengenai probabilitas kematian
dalam masyarakat. Disebut perkiraan kasar karena perbandingan diambil terhadap seluruh penduduk dari
semua umur dan tentang kematian dari semua sebab. Angka ini sering dipakai sebagai indeks berbagai
masalah kesehatan dalam masyarakat.
Specific Death Rate
Angka kematian khusus adalah suatu ukuran untuk salah satu sifat yang ada pada penduduk seperti
golongan umur, golongan sex, golongan pekerjaan, status pekerjaan, status perkawinan dan lain-lain.

SDR= jumlah kematian yg terjadi diantara populasi kelompok daerah tertentu selama setahun x1000
Populasi total pertengahan tahun pada daerah tertentu pada tahun yang sama

Maksud kata tertentu/khusus pada rumus diatas karena rate adalah salah satu segmen daripada
penduduk yang mempunyai banyak kerentanan yang berbeda terhadap kematian.

Cause Specific Mortality Rate
SDR= jumlah kematian oleh penyakit tertentu dalam satu periodex1000
Jumlah penderita penyakit tersebut dalam periode yang sama














KESIMPULAN

Dari catatan sejarah yang terkumpul menunjukkan bahwa epidemiologi merupakan ilmu yang telah
dikenal sejak zaman dahulu bahkan berkembang bersamaan dengan ilmu kedokteran karena kedua disiplin
ilmu ini berkaitan satu dengan yang lain. Misalnya studi epidemiologi bertujuan mengungkapkan penyebab
suatu penyakit atau program pencegahan dan pemberantasan penyakit yang membutuhkan pengetahuan ilmu
kedokteran seperti ilmu faal, biokimia, patologi, mikrobiologi dan genetika. Hasil yang diperoleh dari studi
epidemiologi dapat digunakan untuk menentukan pengobatan suatu penyakit, melakukan pencegahan, atau
meramalkan hasil pengobatan.
Epidemiologi terbagi dua yaitu epidemiologi deskriptif dan epidemiologi analitik. Epidemiologi
deskriptif adalah merupakan bagian dari epidemiologi yang menerangkan tentang pola kejadian penyakit pada
suatu populasi (defined community) berdasarkan faktor-faktor waktu, tempat dan orang.
Dalam upaya mencari frekwensi distribusi penyakit berdasarkan epidemiologi deskriptif timbul
berbagai pertanyaan, diantaranya siapa yang terkena, bila mana hal tersebut terjadi, bagaimana terjadinya,
dimana kejadian tersebut, berapa jumlah orang yang terkena, bagaimana penyebarannya, dan bagaimana ciri-
ciri orang yang terkena.
Analisis data epidemiologis berdasarkan variabel digunakan untuk memperoleh gambaran yang jelas
tentang morbiditas dan mortalitas yang dihadapi. Dengan demikian memudahkan untuk mengadakan
penanggulangan, pencegahan atau pengamatan.
Untuk menentukan adanya peningkatan atau penurunan insiden atau prevalensi penyakit yang
timbul, harus diperhatikan kebenaran perubahan tersebut. Perubahan yang terjadi dapat disebabkan perubahan
semu sebagai akibat perubahan dalam teknologi diagnostik, perubahan klasifikasi, atau kesalahan dalam



perhitungan jumlah penduduk.
Tingkat terbebasnya dari penyakit menular merupakan suatu survailens yang menetap terminologi
survailens pertama kali digunakan pembatasan tertentu pada individu sesudah kontak dengan penyakit
menular yang serius. Orang yang tersangka di tempatkan dibawah pengawasan medik untuk periode yang
sama pada periode inkubasi dari penyakit untuk deteksi beberapa tanda dan gejala dari penyakit.
Morbiditas dalam arti sempit dimaksudkan sebagai peristiwa sakit atau kesakitan. Dalam arti luas
morbiditas mempunyai pengertian yang jauh lebih kompleks, tidak saja terbatas pada statistik atau ukuran
yang berkaitan dengan peristiwa tersebut, tetapi juga faktor determinan termasuk antara lain faktor sosial,
ekonomi, budaya yang melatarbelakanginya.
Data kematian dapat digunakan sebaia pengukur derajat kesehatan masyarakat yaitu merupakan
salah satu indeks status kesehatan penduduk, juga untuk menilai keberhasilan usaha kesehatan, usaha
pengobatan yang dijalankan dan menilai keganasan suatu penyakit. Ukuran mortalitas antara lain crude death
rate, age specific death rate, sex specific death rate.



DAFTAR PUSTAKA

Muti,Bhisma. Prinsip dan Metode Riset Epidemiologi. Surakarta: Gajah Mada University Press,1995

Sutrisno, Bambang. Epidemiologi Lanjut Volume 1. Jakarta: Dian Rakyat, 1990
Watik, Ahmad. Dasar-dasar Metodologi Penelitian Kedokteran dan Kesehatan. Jakarta: PT Raja Grafindo
Persada,2003

Epidemiology. Available from: URL: F:\ikm\Informasi Sistem E-Learning Management Informastion
System And Others Materials Epidemiology.htm

Epidemiology in Health Services Manegement. Available from: URL: F:\ikm\Epidemiology in Health
Services ___ - Google Book Search.htm

Introduction to Epidemiology. Available from: URL: F:\ikm\Introduction to Epidemiology3 - Google Book
Search.htm




II


Rancangan Penelitian dalam Epidemiologi

Rancangan Studi dalam Epidemiologi



Tujuan
Untuk menjelaskan tipe rancangan penelitian dan memberikan konsep-konsepnya
dalam penelitian epidemiologik.

Objektif
Setelah menyelesaikan modul ini, pelajar harus mampu untuk :
1. Menentukan dan mengidentifikasi tipe rancangan penelitian
2. Menjelaskan struktur dasar dari masing-masing rancangan
3. Mengetahui keuntungan dan kerugian masing-masing rancangan
4. Memberikan contoh penelitian epidemiologi

Daftar bacaan yang disarankan
1. Beaglehole R, Bonita R, Kjellstrom T. Basic epidemiology 2
nd
ed. England: Macmillan-Eastern
Press, 1994.
2. Page MR, Cole EG, Timmreck CT. Basic epidemiological method and biostatistics. 2
nd
ed. Boston:
Jones and Bartlett Publishers, 1995.





Daftar Isi

Terminologi dan klasifikasi ............................................................................................................ 6-1
Penelitian observasional ................................................................................................................. 6-2
Penelitian deskriptif ........................................................................................................................ 6-2
Penelitian analitik .................................................................................................................................. 6-4
- Penelitian ekologikal .......................................................................................... 6-4



- Penelitian cross-sectional .................................................................................. 6-5
- Penelitian cohort ................................................................................................ 6-6
- Penelitian kasus-kontrol ..................................................................................... 6-8
Perbedaan studi observasional ........................................................................................................ 6-10
- Rancangan .......................................................................................................... 6-10
- Bias, biaya, waktu .............................................................................................. 6-11
Studi intervensi ....................................................................................................................................... 6-11
- Uji klinik ............................................................................................................ 6-13
- Uji lapangan ....................................................................................................... 6-14
- Uji komunitas ..................................................................................................... 6-14
Referensi ......................................................................................................................................... 6-16
Latihan ............................................................................................................................................ 6-17









Rancangan Penelitian dalam Epidemiologi

Terminologi dan Klasifikasi
Penelitian epidemiologi dapat diklasifikasikan sebagai penelitian observasional maupun penelitian
intervensional, tipe penelitian tercantum pada tabel 1.

Tabel 1 Tipe penelitian epidemiologi




Tipe penelitian Nama lain Unit
penelitian
Penelitian observasional
Penelitian deskriptif
Penelitian analitik
Ekologikal
Cross-sectional
Cohort
Kasus-kontrol
Penelitian intervensi
Uji klinik
Uji lapangan
Uji komunitas


Penelitian etiologik
Korelasional
Prevalensi
Follow-up
Referensi-kasus
Penelitian eksperimental
Uji terapeutik
Uji preventif
Penelitian intervensi komunitas



Populasi
Individual
Individual
Individual

Pasien
Orang sehat
Komunitas

Rancangan
Perbedaan rancangan penelitian pada epidemiologi dapat disebutkan sebagai berikut :

Penelitian Observasional
Penelitian observasional tidak memperhatikan paparan alami. Peneliti melakukan pengukuran tapi
tidak melakukan intervensi. Penelitian observasional ini dapat berupa penelitian deskriptif atau analitik.
Penelitian deskriptif terbatas pada menggambarkan kejadian masalah kesehatan (penyakit atau status
kesehatan) dalam populasi. Penelitian analitik secara lebih jauh menganalisis hubungan antara paparan (faktor
resiko / faktor pelindung dan variabel lainnya) dan outcome (penyakit dan masalah kesehatan).


Penelitian Deskriptif
Definisi
Suatu penelitian yang menerangkan frekuensi dan distribusi relatif kesehatan dan
penyakit dalam populasi (1).



Hasil dari penelitian deskriptif dapat menjelaskan masalah kesehatan dalam populasi, yaitu :
Apakah masalah kesehatan tersebut?
Siapa yang terpapar?
Di mana terjadinya?
Kapan terjadinya?
Berapa banyak masalah (ukuran masalah)?



Struktur Dasar
- Menggambarkan magnitude masalah kesehatan
- Tanpa kelompok pembanding
- Subjek
Seleksi
Kriteria inklusi
Kriteria eksklusi
Ukuran sampel
- Paparan alami
- Outcome dan pengukuran
- Interpretasi

Hal ini merupakan langkah utama dalam penelitian epidemiologik dan membuat hipotesis dari hasil
penelitian deskriptif. Deskripsi sederhana dari masalah kesehatan dalam populasi, berdasarkan pada data
yang tersedia secara rinci seperti morbiditas, mortalitas pada statistik kesehatan masyarakat, pusat
nasional untuk statistik kesehatan dan data diperoleh dengan survey khusus. Penelitian ini tidak
menganalisis hubungan antara paparan dan efeknya. Penelitian ini biasanya menggambarkan distribusi
atau pola masalah kesehatan berdasarkan orang, tempat dan waktu. Contohnya, deskripsi mengenai 4
orang lelaki muda yang menderita suatu bentuk pneumonia yang jarang terjadi dan membuka jalan lebih
lanjut untuk penelitian epidemiologik terhadap kondisi yang sekarang dikenal sebagai AIDS Gottlieb et
al. (2).








Penelitian Analitik (Penelitian Etiologik)
Definisi
Aspek epidemiologi mempertimbangkan pencarian masalah kesehatan yang dihubungkan dengan
penyebab dan efek. (1).

Struktur Dasar
Menentukan penyebab masalah kesehatan
Mempunyai kelompok pembanding
Subjek
Seleksi
Kriteria inklusi
Kriteria eksklusi
Ukuran sampel
Paparan alami
Outcome dan pengukuran
Analisis dan interpretasi


Penelitian Ekologikal (Penelitian Korelasional)
Definisi
Suatu penelitian di mana unit analisisnya adalah populasi atau sekelompok orang,
dan bukan individual. Sebuah contoh adalah penelitian antara hubungan nilai median dan
rata-rata mortalitas kanker dalam yurisdiksi administrasi seperti negara bagian dan negara
(3).

Struktur Dasar
Unit analisisnya adalah populasi atau sekelompok orang dan
bukan individual
Studi tingkat makro
Hasil penelitian ini tidak dapat diterapkan pada setiap individu



Mungkin kekeliruan ekologis
Hipotesis dibuat untuk studi analitik
Mempelajari trend masalah kesehatan.

Pada penelitian ekologis, unit analisisnya adalah populasi, sekelompok orang, dan komunitas, bukan
individual. Studi ini menekankan keseluruhan populasi yang ada untuk membedakan tingkat rata-rata paparan
dan outcome. Lebih lanjut hubungan dapat dipelajari dengan membandingkan populasi pada komunitas yang
berbeda di saat yang sama atau populasi yang sama dalam satu komunitas pada waktu yang berbeda dan
mempelajari masalah kesehatan yang trend mengikuti perubahan paparan yang berbeda pada jangka waktu
yang berbeda. Contohnya, pada komunitas, hubungan didemonstrasikan antara jumlah garam yang terjual dan
mortalitas kanker esofagus pada daerah Henan, propinsi Cina, Lu dan Qin (4). Contoh lainnya, pada satu
negara, hubungan yang didemonstrasikan antara penjualan rata-rata obat anti asma dan angka kejadian
kematian akibat asma yang luar biasa tinggi, Crane et al. (5)


Penelitian Cross Sectional (Penelitian prevalensi)
Definisi
Suatu rancangan penelitian yang menunjukkan karakteristik yang ada secara bersamaan dan
outcome kesehatan. Seperti gambaran situasi pada waktu yang spesifik, penelitian ini tidak dapat menjawab
pertanyaan tentang penyebab dan efeknya (meskipun karakteristik mendahului outcome). (1).

Struktur Dasar
Unit analisisnya adalah individual
Menentukan paparan dan outcome pada saat yang sama
Tiap subjek dinilai hanya sekali pada suatu waktu
Mengukur prevalensi outcome
Penelitian yang mudah untuk efek yang baru terjadi

Pada studi cross-sectional, unit analisisnya adalah individual. Penelitian ini mengukur prevalensi
penyakit dan sering disebut studi prevalensi dan pengukuran paparan dan outcome dilakukan pada saat yang
sama. Tidak mudah untuk menilai alasan terhadap hubungan yang ditunjukkan pada studi cross-sectional.
Kunci pertanyaan yang ditanyakan adalah apakah paparan mendahului atau menyertai outcome.
Penelitian ini berguna untuk meneliti paparan yang merupakan karakteristik terikat dari individu, seperti
etnik, golongan darah, warna mata, warna rambut, sidik jari, dan sebagainya. Jika data paparan diketahui
untuk mewakili paparan sebelum outcome terjadi, analisis data dapat dilakukan dengan cara yang sama seperti



pada studi cohort. Pada ledakan tiba-tiba penyakit, studi cross-sectional yang melibatkan beberapa paparan,
biasanya merupakan langkah pertama yang paling tepat dalam penelitian untuk menentukan penyebab.
Contohnya, Sempos et al. (1993) dan Johnson et al. (1993) menggambarkan prevalensi kolesterol darah yang
tinggi selama beberapa fase dari Survey Pemeriksaan Kesehatan dan Gizi dan menentukan trend level
kolesterol total dalam serum pada penduduk dewasa AS, disebutkan oleh Page et al. (1).


Penelitian Cohort (Penelitian Follow up)
Definisi
Suatu rancangan penelitian yang melihat waktu ke depan dari data dasar. Status kesehatan dan
karakteristik yang berhubungan dinilai dan kemudian dinilai kembali untuk menentukan karakteristik mana
yang mendahului atau menyebabkan perkembangan outcome kesehatan yang baru. Rancangan ini merupakan
rancangan terbaik untuk memperkirakan probabilitas / resiko perkembangan outcome.
Struktur Dasar
Studi populasi ini terdiri dari individual yang diklasifikasikan sebagai terpapar atau tidak
terpapar terhadap faktor resiko tertentu
Urutannya dari paparan ke outcome
Status paparan ditentukan secara
Genetik / biologi
Kesadaran memilih yang dibuat oleh subjek
Keadaan
Mengukur insidensi outcome

Pada studi cohort, unit analisisnya adalah individu. Studi dimulai dari sekelompok orang yang bebas
dari penyakit (cohort) yang diklasifikasikan ke dalam sub grup menurut paparan pada penyebab potensial
penyakit atau outcome. Variabel yang ditemukan dispesifikasi dan diukur sebagai kasus baru (outcome)
berbeda antara kelompok dengan dan tanpa paparan. Karena data dikumpulkan pada waktu yang berbeda,
studi cohort disebut studi longitudinal. Contohnya, pada paparan akut tiba-tiba, hubungan sebab akibat untuk
akibat yang baru terjadi mungkin tidak jelas, tapi studi cohort juga digunakan untuk meneliti efek kronis, di
India, pada tahun 1984, sebuah pabrik pestisida di Bhopal, bahan kimia intermediate (methyl lisocyanate)
pada proses produksi, bocor dari tank dan asapnya menyebar ke daerah pemukiman sekitar, membunuh
lebih dari 2000 orang dan meracuni 200.000 orang lainnya. Efek langsung dapat dengan mudah diteliti
menggunakan studi cross-sectional. Efek kronis yang lebih tak tampak dan efek yang timbul setelah periode



laten yang panjang dapat dipelajari menggunakan studi cohort (6). Contoh lainnya, studi cohort dapat
menggunakan sumber informasi rutin, seperti pencatatan penyakit atau pencatatan nasional kematian sebagai
bagian prosedur follow up, seperti hubungan antara angka mortalitas infant dan berat badan lahir di Brasil
Selatan, hasilnya menunjukkan bahwa kematian selama tahun pertama kehidupan lebih tinggi terjadi pada
bayi dengan berat badan lahir rendah dan sangat rendah untuk bayi dengan berat badan lahir baik, Victoria et
al. (7).
Studi cohort merupakan studi observasional terbaik karena menyediakan informasi terbaik mengenai
penyebaran penyakit (outcome) dan pengukuran paling langsung dari risiko penyakit yang berkembang.


Penelitian Kasus-Kontrol (Studi Case-reference)
Definisi
Studi yang dimulai dengan identifikasi orang dengan penyakit (outcome) yang ditemukan dan
kelompok kontrol yang disesuaikan (pembanding / referensi), terdiri dari kelompok orang tanpa penyakit.
Hubungan antara atribut dengan penyakit diperiksa dengan membandingkan penyakit dan non penyakit
dengan memperhatikan berapa sering atribut ditemukan, atau jika kuantitatif, tingkat dari atribut di tiap
kelompok (3).

Struktur Dasar
Studi populasi terdiri dari individu-individu yang dikelompokkan menjadi kelompok
penyakit dan non penyakit
Melihat waktu ke belakang untuk mengukur paparan terhadap subjek penelitian
Hipotesis harus dispesifikasikan dengan jelas, hubungan yang diharapkan antara masalah
kesehatan dan paparan yang ditemukan
Seleksi kasus
Deskripsi yang tidak membingungkani dan objektif dari masalah kesehatan termasuk
metode diagnostik
Kriteria memenuhi syarat


Seleksi kontrol
Kontrol harus menyerupai kasus dengan
memperhatikan potensial paparan
Kriteria yang digunakan untuk memilih kontrol harus dapat dibandingkan dalam
berbagai cara di mana kriteria digunakan untuk memilih kasus.




Pada sudi kasus kontrol, unit analisisnya adalah individu. Studinya sederhana dan ekonomis untuk
dilaksanakan dan tepat untuk menyelidiki penyebab penyakit, khususnya penyakit yang langka. Penelitian
dimulai dengan orang yang sakit (outcome) yang ditemukan dan kelompok kontrol yang sesuai
(pembanding/referensi) dari orang yang tidak terpengaruh oleh penyakit atau outcome. Penyebab yang
mungkin terjadi dibandingkan antara kelompok kasus dan kelompok kontrol. Kelompok kontrol terdiri dari
orang-orang yang tidak menderita penyakit. Aspek penting dari studi kasus kontrol adalah untuk menentukan
awal dan lamanya paparan dari kelompok kasus dan kelompok kontrol. Dalam studi ini, keadaan paparan dari
kasus biasanya ditentukan setelah perjalanan penyakit. Contoh studi kasus kontrol adalah hubungan antara
Thalidomide dan defek ekstremitas pada bayi yang lahir di Republik Jerman pada tahun 1959 1960. Studi
ini dilakukan pada tahun 1961, dengan membandingkan anak-anak yang terpengaruh dengan anak-anak
normal, Mellin dan Katzenstein (8). Ada 41 orang dari 46 orang ibu yang bayinya mengalami malformasi
setelah memakai Thalidomide pada kehamilan 4 6 minggu di mana 300 ibu berada dalam kelompok kontrol
yang anak-anaknya normal, tidak memakai obat tersebut pada saat itu. Contoh lain, riwayat konsumsi daging
diselidiki di Papua Nugini pada orang yang menderita enteritis nekrotikan, dan perbandingan dibuat dengan
orang yang tidak menderita sakit. Konsumsi daging lebih banyak ditemui pada orang yang menderita penyakit
(50 dari 61 orang) daripada orang yang tidak menderita penyakit (16 dari 57 orang), Millar et. Al (9).

Perbedaan Studi Observasional
Tiap studi observasional memiliki keuntungan dan kerugian yang berbeda sehingga
rancangan yang terpilih harus dipertimbangkan keuntungan dan kerugiannya sebagai
berikut :

Rancangan
Pemilihan rancangan studi tergantung pada karakteristik dari penyakit yang
ditemui dan paparan yang ditemui seperti terlihat pada tabel 2 (6).

Tabel 2 Penerapan berbagai rancangan studi observasional




Penerapan Ekologik
al
X-
Sectional
Cohort
Kasus-Kontrol
Penyakit yang langka
Paparan yang langka
Menguji berbagai
efek dari
penyebab
Meneliti berbagai
paparan
Pengukuran hubungan
waktu
Pengukuran insiden
langsung
Periode laten yang
lama
++++
++
+

++

++

-

-
-
-
++

++

-

-

-
-
+++++
+++++

+++

+++++

+++++

-
+++++
-
-

++++

+
b


+
c


+++


a
Tanda positif menunjukkan tingkat kesesuaian
negatif tidak sesuai

b
Jika prospektif

c
Jika berdasarkan populasi

Bias, Biaya, dan Waktu
Peneliti harus memperhatikan bias, biaya, dan waktu bila akan menentukan
rancangan penelitian seperti terlihat pada tabel 3 (6).




Tabel 3 Bias, biaya, dan waktu pada berbagai rancangan studi observasional
Ekologikal X-Sectional Cohort Kasus-Kontrol
Kemungkinan dari
Bias seleksi
Bias ulangan
Hilang saat follow-up
Connfounding
Waktu diperlukan
Biaya

-
-
-
Tinggi
Rendah
Rendah

Sedang
Tinggi
-
Sedang
Sedang
Sedang

Rendah
Rendah
Tinggi
Rendah
Tinggi
Tinggi

Tinggi
Tinggi
Rendah
Sedang
Sedang
Sedang


Studi Intervensi (Studi Experimental)
Definisi
Suatu studi di mana kondisi berada di bawah kontrol langsung dari peneliti. Dalam epidemiologi,
suatu studi di mana populasi dipilih untuk uji regimen yang telah direncanakan di mana efeknya diukur
dengan membandingkan hasil dari regimen dalam kelompok percobaan dengan outcome dari regimen lainnya
dalam kelompok kontrol. Untuk menghindari bias, anggota kelompok percobaan dan kontrol harus dapat
disesuaikan kecuali pada regimen yang diberikan. Alokasi individu pada kelompok percobaan atau kontrol
diambil secara acak. Pada uji kontrol acak, individu secara acak dikelompokkan; pada beberapa percobaan,
misalnya, fluoridasi air minum, seluruh komunitas telah dikelompokkan (tanpa diacak) menjadi kelompok
percobaan dan kontrol. (3)

Struktur Dasar
Populasi studi terdiri dari individu yang diklasifikasikan sebagai kelompok terpapar atau
tak terpapar terhadap faktor resiko tertentu
Terjadinya dari paparan ke outcome
Paparan telah ditentukan
Mengukur insiden outcome
Kontrol langsung peneliti
Prosedur randomisasi
Digunakan untuk menentukan keamanan dan efikasi pengobatan terhadap penyakit
manusia dan masalah kesehatan
Untuk menentukan apakah pengobatan baru lebih baik daripada
pengobatan standar
Informed consent



Kriteria pemilihan partisipan
Pertimbangan etis

Studi intervensi termasuk usaha untuk memberikan suatu paparan pada satu atau lebih kelompok
orang secara randomisasi. Efek dari intervensi diukur dengan membandingkan outcome pada kelompok yang
diintervensi dengan kelompok kontrol. Karena intervensi ditentukan dengan ketat melalui protokol,
pertimbangan etik sangat diperhatikan pada rancangan penelitian ini.
Studi ini dapat diklasifikasikan dalam tiga bentuk :
Uji klinik
Uji lapangan
Uji komunitas

Uji Klinik
Definisi
Suatu studi intervensi untuk menguji efikasi dan efek samping potensial dari suatu
intervensi seperti obat-obatan, vaksin, atau peralatan medis (1).
Suatu studi di mana subjek dalam populasi secara acak dialokasikan ke dalam kelompok, untuk
menerima atau tidak menerima suatu prosedur pencegahan atau terapi eksperimental, manuver, atau
intervensi. Hasilnya ditentukan dengan membandingkan rata-rata outcome pada kelompok yang diberi
tindakan dan kelompok kontrol. Studi ini secara umum dianggap sebagai metode yang paling ilmiah untuk
pengujian hipotesis (3).

Struktur Dasar
Subjek studi adalah pasien
Variabel yang diintervensi secara acak dialokasikan ke dalam kelompok yang diberi
tindakan dan kelompok kontrol.
Menekankan pada pengobatan
Pengumpulan data dilakukan pada pusat kesehatan

Suatu uji klinis bertujuan untuk mempelajari regimen terapi yang baru. Subjek secara acak dialokasikan
pada kelompok-kelompok, yang disebut kelompok perlakuan dan kelompok kontrol, dan hasilnya



ditentukan dengan membandingkan outcome pada dua atau lebih kelompok. Intervensi di bawah
pengujian dapat berupa regimen baru atau obat baru. Contohnya, uji menggunakan larutan rehidrasi oral
dari beras atau glukosa melibatkan 342 pasien dengan diare cair akut yang merupakan bagian dari kolera
epidemik di Bangladesh pada tahun 1983. Pasien secara acak ditentukan untuk menerima pengobatan
dengan cairan rehidrasi oral glukosa atau beras. Studi ini menunjukkan komponen glukosa pada larutan
rehidrasi oral harus digantikan dengan tepung beras dengan hasil yang lebih baik, seperti diindikasikan
dengan penurunan pengeluaran stool dan masukan cairan, Molla et. al. (10).
Uji Lapangan
Definisi
Suatu studi di mana subjek (yang tidak sakit) dalam populasi secara acak dialokasikan ke dalam
kelompok, untuk menerima atau tidak menerima suatu variabel intervensi preventif eksperimental.
Hasilnya dinilai dengan membandingkan rata-rata outcome dalam kelompok perlakuan dan kelompok
kontrol.

Struktur Dasar
Subjek penelitian adalah orang yang tidak sakit
Menekankan pada pencegahan
Digunakan untuk mengevaluasi intervensi yang ditujukan pada penurunan paparan tanpa
mengukur timbulnya efek kesehatan
Pengumpulan data dilakukan di lapangan

Uji lapangan berbeda dari uji klinik, orang-orang yang terlibat tidak sakit tapi diduga beresiko;
pengumpulan data dilakukan di lapangan. Karena subjek yang tidak sakit dan tujuannya adalah untuk
mencegah terjadinya penyakit yang mungkin terjadi dengan frekuensi yang rendah, dengan demikian
diperlukan banyak subjek dan biaya yang besar untuk penelitian ini. Contohnya, penelitian mengenai
vaksin baru terhadap New World cutaneous leishmaniasis yang dilakukan di Brazil. Tentara Brazil
dengan rata-rata infeksi yang relatif tinggi digunakan untuk menguji efikasi vaksin terhadap placebo,
Antunes et al. (11).


Uji Komunitas
Definisi



Suatu studi intervensi di mana unit yang dialokasikan untuk menerima regimen preventif atau terapeutik
adalah keseluruhan komunitas (3).

Struktur Dasar
Subjek studi adalah orang-orang yang tidak sakit dalam komunitas
Menekankan pemcegahan dan pengobatan
Digunakan untuk mengevaluasi intervensi yang ditujukan pada penurunan outcome
dalam komunitas
Tepat untuk penyakit yang berhubungan dengan kemasyarakatan

Pada bentuk intervensi ini, kelompok perlakuan adalah komunitas dibandingkan individual. Penelitian ini
secara khusus tepat untuk penyakit yang berasal dari kondisi sosial, di mana pada gilirannya dapat sangat
mudah dipengaruhi oleh intervensi langsung pada kelompok perilaku seperti juga individu. Sebagai
contoh, Farquhar et al. (12) melaporkan bahwa edukasi komunitas untuk kesehatan kardiovaskuler
sebagai variabel intervensi dapat menurunkan insiden penyakit kardiovaskuler dalam komunitas.











Referensi :
1. Page RM, Cole GE, Timmreck TC. Basic epidemiological method biostatistics. 2
nd
ed. Boston: Jones
and Bartlett Publishers, 1995.
2. Gottlieb SM et al. Pneumocystic carinii pneumonia and mucosal candidiasis in previously healthy
homosexual men: evidence of a new acquired cellular immunodeficiency. N Engl J Epid 1981; 24:
1425-31.
3. Last JM et al. A dictionary of epidemiology. 3
nd
ed. Oxford: Oxford University Press, 1995.



4. Lu JB, Qin MY. Correlation between high salt intake and mortality rates for oesophageal and gastric
cancers in Henan Province, China. Int J Epidemiol 1987; 2: 171-6.
5. Crane J et al. Prescribed fenoterol and death from asthma in New Zealand, 1981-1983: a case-control
study. Lancet 1989; 1: 917-22.
6. Beaglehole R, Bonita R, Kjellstrom T. Basic epidemiology. 2
nd
ed. England: Macmillan-Eastern
Press, 1994.
7. Victoria GC et al. Birthweight and infant mortality: a longitudinal study of 5,914 Brazilian children.
Int J Epidemiol 1987; 2: 239-45.
8. Mellin WG, Katzenstein M. The saga of Thalidomide: neuropathy to embryopathy, with case reports
of congenital anomalies. N Eng J Epid 1962; 24: 1238-44.
9. Millar SJ et al. Meat consumption as a risk factor in enteritis necroticans. Int J Epidemiol 1985; 2:
318-21.
10. Molla MA et al. Rice-based oral rehydration solution decreases the stool volume in acute diarrhea.
Bull WHO 1985; 4: 751-6.
11. Antunes MFC et al. Controlled field trials of a vaccine against New World cutaneous leishmaniasis.
Int J Epidemiol 1986; 4: 572-80.
12. Farquhar WJ et al. Community education for cardiovascular health. Lancet 1977; 1: 1192-5.
LATIHAN
1. Mengapa penelitian cross-sectional tidak memperbolehkan interpretasi penyebab-efek?
2. Apakah batasan dari penelitian cross-sectional?
3. Mengapa penelitian kasus-kontrol sering dianggap retrospektif?
4. Siapakah yang menjadi kasus dan kontrol dalam penelitian kasus-kontrol?
5. Mengapa penelitian cohort dianggap sebagai studi prospektif?
6. Mengapa pada penelitian cohort perlu menggunakan studi insiden untuk bebas dari outcome
kesehatan yang ditemui pada permulaan studi?
7. Diskusikan bagaimana studi cohort memberikan bukti lebiiihh untuk mendukung hipotesis penyebab
daripada studi cross-sectional atau kasus-konntrol.
8. Apakah kunci untuk membedakan faktor di antara studi intervensi dengan metode studi lainnya?
9. Apakah uji klinik itu? Bagaimana uji klinik berhubungan dengan uji komunitas?
10. Apakah uji lapangan itu? Bagaimana uji klinik berhubungan dengan uji lapangan?
11. Apakah uji komunitas itu?

You might also like