Professional Documents
Culture Documents
Data merupakan sejumlah informasi yang dapat memberikan gambaran tentang suatu keadaan.
Pada umumnya informasi ini diperoleh melalui observasi (pengamatan) yang dilakukan terhadap
sekumpulan individu ( orang, brang, jasa, dsb). Dalam hal in data sangat berguna sebagai dasar
pembuatan keputusan terutama pada kondisi ketidakpastian. Pada umumnya kualitas keputusan
proses pengolahan datanya untuk mendukung keputusan yang dibuat. Secara umum data
digunakan untuk menyediakan informasi bagi suatu penelitian, pengukuran kinerja
(performance), dasar pembuatan keputusan dan menjawab rasa ingin tahu.
Data merupakan bentuk jamak dari datum yang merupakan informasi yang diperoleh dari satu
satuan amanat.
2.1. Variabel
Dalam melakukan observasi tentunya perlu ditentukan karakter yang akan diobservasi dari unit
amanat yang disebut variable. Variable dalam penelitian merupakan suatu atribut dari
sekelompok objek yang diteliti yang memiliki variasi antara satu objek dengan objek yang lain
dalam kelompok tersebut. Sebagai contoh, panjang kaki, dan lebar perut merupakan atribut
seseorang yang merupakan objek penelitian. Berdasarkan bulat atau tidaknya nilai yang
diperoleh, variable dapat dikelompokan menjadi variable kontinu dan variable diskrit. Variable
kontinu adalah variable yang besarnya dapat menempati semua nilai yang ada diantara dua titik.
Pada variable kontinu dapat dijumpai nilai-nilai yang bulat. Variable diskrit merupakan variable
yang besarannya tidak dapat menempati semua nilai. Nilai variable diskrit selalu bilangan bulat.
Pada umumnya variable diskrit diperoleh melalui pencacahan/perhitungan.
Variable independen (independent variable) atau variable bebas, yaitu variable yang
menjadi sebab terjadinya (terpengaruhnya) variable dependent (variable tak bebas)
Variable dependen (dependent variable) atau variable tak bebas, yaitu variable yang
nilainya dipengaruhi oleh variable independen
Variable moderator, yaitu variable yang memperkuat atau memperlemah hubungan
antara variable dependen dan independen
Variable intervening, seperti variable moderator, tetapi nilainya tidak dapat diukur,
seperti kecewa, gembira, sakit hati, dsb.
Variable control, yaitu variable yang dapat dikendalikan oleh peneliti.
2.2. Metode Pengumpulan Data
Dalam kenyataannya dikenal metode pengumpulan data primer dan metode pengumpulan data
sekunder.
Data primer merupakan data yang didapat dari sumber pertama baik dari individu antara
perseorangan seperti hasil wawancara atau hasil pengisian kuesioner yang biasa dilakukan oleh
peneliti. Dalam metode pengumpulan data primer, peneliti/observator melakukan observasi
sendiri baik dilapangan maupun dilaboratorium. Pelaksanaannya dapat dilakukan dengan
melakukan survai atau percobaan
1. Survai
Cara survai dilakukan bila data yang dicari sebenarnya sudah ada dilapangan atau
disasaran penelitian lainnya. Misalnya jenis kelamin, umur, tingkat pedidikan, dan jenis
pekerjaan seseorang. Dalam hal ini tugas observator adalah menentukan bentuk data yang
akan diukur, karakteristik yang akan diteliti dan melakukan pengukuran serta
pengumpulan data dengan teknik-teknik tertentu. Teknik pengumpulan data dengan cara
survai yang biasanya dilakukan misalnya dengan:
Wawancara dengan responden, wawancara atau interview adala suatu cara
mengumpulkan data dengan menanyakan langsung kepada informan atau pihak
yang kompeten dalam suatu permasalahan.
Angket, angket adalah jawaban tertulis dari informan atas data kuesioner dari
peneliti. Perolehan data dengan angket memiliki keuntungan lain bila
dibandingkan dengan wawancara karena lain dapat dikirimkan melalui pos,
secara kuantitatif peneliti dapat memperoleh data yang cukup banyak yang
tersebar merata dalam wilayah yang akan diselidiki. Dengan angket, informasi
yang dikumpulkan dapat lebih banyak dan tersebar merata dalam suatu wilayah
yang luas walaupun kenyataannya tidak semua data kuesioner dikembalikan.
Tetapi dengan menggunakan angket memungkinkan terjadinya salah paham
sehingga diperoleh jawaban yang berlainan dari apa yang dimaksudkan dalam
pertanyaannya disamping ada juga pertanyaan yang tidak dijawab.
Menggunakan telpon (pooling) ataupun melakukan observasi langsung.
2. Percobaan
Cara percobaan (experiment) dilakukan jika data yang ingin diperoleh belum tersedia dan
dengan demikian variable yang akan diukur harus dibangkitkan datanya melalui suatu
percobaan.
2.2.2. Metode Pengumpulan Data Sekunder
Metode pengumpulan data sekunder sering disebut metode penggunaan bahan
dokumen, karena dalam hal ini peneliti tidak secara langsung mengambil data sendiri
tetapi meneliti dan memnfaatkan data atau dokumen yang dihasilkan oleh pihak-pihak
lain. Dalam hal ini, data sekunder merupakan data primer yang diperoleh oleh pihak
lain atau data primer yang telah diolah lebih lanjut dan disjikan baik oleh pengumpul
data primer atau oleh pihak lain yang pada umumnya disajikan dalam bentuk tabel-
tabel atau diagram-diagram. Dalam metode pengumpulan data sekunder observator
tidak meneliti langsung, tetapi data didapatkan misalnya dari:
Mass media
BPS
Lembaga pemerintah atau swasta
Lembaga penelitian maupun pusat bank data
Hasil penelitian individual peneliti lain
Penelitian kepustakaan.
2.3 Jenis data
2.3.1. Data Kualitatif dan Kuantitatif
Data kualitatif adalah data yang sifatnya hanya menggolongkan saja. Termasuk dalam
klasifikasi data kualitatif adalah data yang berskala ukur nominal dan ordinal, sebagai
contoh data kualitatif adalah tingkat pendidikan, tingkat golongan, dll.
Data kuantitatif adalah data yang berbentuk angka. Termasuk dalam klasifikasi data
kuantitaif adalah data yang berskala ukur interval dan rasio.
2.3.2. Data Internal dan Eksternal
Data internal merupakan data yang didapat dari dalam perusahaan atau organisasi dimana
riset dilakukan. Data internal merupakan data yang menggambarkan keadaan dalam
organisasi tersebut. Sebagai contoh, bila ada peneliti yang akan meneliti produktivitas
karyawan bagian penjualan produk semen GRESIK, maka data yang diperolehnya
diambil dari PT. Sinar Gresik sebagai produsennya.
Data eksternal adalah data yang menggambarkan keadaan diluar organisasi. Data
eksternal pada umumnya didapat dari pihak lain dan digunakan sebagai pembanding.
2.3.3. Data Time Series dan Cross Section
Data time series atau data deret waktu merupakan data yang dikumpulkan dari beberapa
tahapan waktu secara kronologis. Pada umumnya data deret waktu merupakan kumpulan
data dari suatu fenomena tertentu yang didapat dalam beberapa interval waktu tertentu
misalnya dalam waktu mingguan, bulanan, atau tahunan. Sebagai contoh data deret waktu
adalah data tinggi banjir DKI Jakarta dari bulan November 2016-februari 2017
Data Cross Section atau data kerat lintang adalah data yang dikumpulkan pada waktu dan
tempat tertentu saja. Contoh data hasil pengisian kuesioner tentang perilaku pembelian
susu kedelai di toko “Maju Bersama” dari 500 orang responden pada bulan januari 2017.
Variabel acak merupakan sumber kesalahan sampling yang paling umum dijumpai.
Sebegai contoh, misalkan seorang pemilik supermarket tertarik untuk menghitung rata-rata
pendapatan per rumah tangga dalam suatu daerah tertentu. Seandainya dalam pelaksanaan
pengambilan sampelnya, yaitu dalam pemilihan suatu sampel acak rumah tangga diperoleh rata-
rata pendapatan rumah tangga sebesar Rp. 250 juta pertahun untuk daerah tersebut, hal ini bias
saja bercuriga bahwa sampel yang diambil mengandung kesalahan pendugaan, yakni secara
kebetulan semua yang dipilih mungkin berada dalam kelompok yang berpenapatan tinggi. Untuk
kasus-kasus yang demikian hadirnya kesalahan pendugaan tidak begitu besar, tentunya kesalahan
pendugaan agak mudah terdeteksi bila informasi yang diperoleh jelas meragukan, namun jika
kesalahan tidak begitu besar, tentunya kesalahan yang muncul menjadi sulit terdeteksi sehingga
pada akhirnya informasi yang diperoleh akan mengarah pada pengambilan kesimpulan yang
keliru.
Kesalahn spesifikasi dapat juga muncul karena daftar unsure populasi(population frame)
yang tidak benar, informasi yang benar pada buku catatan inventori, pemilihan anggota sampel
yang keliru (seperti misalnya melakukan penggantian responden yang dituju dengan tetangga
jika responden yang seharusnya ditemui tidak berada di tempat), sensitivitas pertanyaan,
kesalahan dalam pengumpulan informasi tentang sampel yang disebabkan oleh bias
pewawancara yang disengaja atau tidak disengaja, atau kesalahan-kesalahan dalam memproses
informasi sampel.
Sumber kesalahan tambahan dalam survai sampel adalah disebabkan oleh kesalahan
penetapan responden dari beberapa anggota sampel. Dalam kaitannya dengan kesalahan
sampling, pengalaman adalah petunjuk terbaik untuk digunakan dalam mengenali sumber
kesalahan dalam survai sampling. Para individu atau badan yang merancang atau melakukan
berbagai survai dari tipe tertentu(misalnya pendapat umum, penelitian audit persediaan, dsb)
mengembangkan reputasi untuk mengantisipasi adanya kemungkinan perangkaptertentu yang
mungkin ada dalam survai.
Metode penarikan sampel dapat dipilah menjadi dua, yaitu pemilihan sampel dari populasi secara
acak (random atau probability sampling) dan pemilihan sampel dari populasi secara tidak acak (
non random atau nonprobability sampling ).
Contoh aplikasi
Misalanya dalam suatu Desa untuk memperoleh data tentang banyaknya jumlah
penduduk disuatu desa tersebut dan data tentang bagaimana suatu proses
perencanaan pedesaan mengenai pengolahan desa , maka kepala Desa merupakan
orang yang terbaik untuk bisa memberikan informasi.
4.2.3. Quota Sampling
Untuk teknik sampling ini biasanya digunakan data dari populasi yang berkaitan
dengan demografi (kependudukan) seperti: lokasi geografis, usia, jenis kelamin,
pendidikan, pendapatan, dll. Pada dasanya, qouta sampling ini sama dengan
Judgment sampling.Qouta sampling ini dapat dikatakan sebagai Judgment
sampling dua tahap: Tahap pertama adalah tahapan dimana peneliti merumuskan
kategori kontrol atau qouta dari populasi yang akan ditelitinya seperti, jenis
kelamin , usia, ras yang terdefinisikan dengan baik sebagai basis dari keputusan
pemilihan sampel. Tahap kedua adalah penentuan bagaimana sampel akan
diambil, dapat secara convenience atau jedgment tergantung pada situasi dan
kondisi pada saat akan dilakukan penelitian dan apa yang akan diteliti serta
kemampuan dari peneliti sendiri. Perbedaan antara Judgment sampling dan qouta
sampling terletak pada adanya suatu batasan pada qouta sampling bahwa sampel
yang diambil harus sejumlah tertentu yang dijatah(qutum) dari setiap subgroup
yang telah ditentukan dari suatu populasi.
Contoh aplikasi
Misalnya, disalah satu SMA( Sekolah menengah atas ) kelas IX terdapat siswa
laki-laki 40% dan siswa perempuan 60%. Jika seorang peneliti ingin mengetahui
hasil nilai ujian sekolahnya. Peneliti mewawancarai 50 siswa dari kedua jenis
kelamin tadi maka dia harus mengambil sampel siswa laki-laki sebanyak 22 orang
sedangkan siswa perempuan 28 orang.
4.2.4. Snowball Sampling
Teknik sampling ini sangat tepat digunakan bila populasinya digunakan bila
populasinya digunakan snagat spesifik. Cara pengambilan sampel dengan teknik
ini dilakukan secraa berantai, mulai dari ukuran sampel yang kecil , makin lama
menjadi semakin besar semakin halnya bola salju yang menggeliding menuruni
lereng gunung/bukit.
Contoh Aplikasi
Misalnya seorang peneliti ingin mengetahui penghasilan petani setiap tahunya.
Peneliti cukup mencari satu orang petani dan kemudian melakukan wawancara.
Setelah selesai, peneliti tdai meminta kepada petani tersebut untuk bisa
mewawancarai petani yang lainnya. Setelah jumlah petani yang diwawancarai
sudah cukup, petani bisa menghentikan pencarian petani lainnya.
2.1 INTRODUCTION
Tujuan utama dari statistik adalah untuk membuat kesimpulan tentang populasi dari
informasi yang terkandung dalam sampel.. Oleh karena itu langkah pertama dalam statistik
adalah untuk menemukan cara untuk frase kesimpulan tentang populasi atau, sama, untuk
menggambarkan satu set pengukuran.
Setelah distribusi frekuensi relatif didirikan untuk populasi, kita bisa, dengan
menggunakan argumen probabilitas, menghitung meringkas langkah-langkah numerik seperti
mean, varians, dan standar deviasi. jumlah yang sama dapat dihitung langsung dari pengukuran
sampel.
Untuk tujuan ilustrasi, mari kita asumsikan bahwa populasi terdiri dari sejumlah besar
bilangan bulat, 0, 1, 2, ..., 9, dalam proporsi yang sama. Kita mungkin berpikir bilangan bulat
tersebut seperti yang tertulis pada slip kertas dan bercampur dalam sebuah kotak, yang disimpan
di atas meja (seperti tabel nomor acak), atau seperti yang dihasilkan dalam file komputer. Karena
semua bilangan bulat terjadi dalam proporsi yang sama, relatif frekuensi histogram,
Frekuensi relatif dapat dianggap dalam hal probabilistik. Jika satu nomor yang dipilih
secara acak (misalnya, jika seseorang mencapai ke dalam kotak dan membabi buta mengeluarkan
selembar kertas), maka probabilitas bahwa nomor yang dipilih akan menjadi 4 adalah 1/10.
Misalkan satu nomor yang akan dipilih secara acak dari populasi yang diteliti, dan biarkan
nilainya akan dilambangkan dengan γ. Maka nilai yang mungkin untuk γ (0,1,2, ..., 9 dalam
kasus ini) dan probabilitas yang terkait dengan nilai-nilai (1/10 untuk masing-masing dalam
kasus ini) merupakan distribusi probabilitas untuk variabel γ acak. Probabilitas yang terkait
dengan γ kadang-kadang dilambangkan dengan p (γ). Jadi untuk populasi ini
1
𝑝(0) = 𝑝(1) = ⋯ = 𝑝(8) = 𝑝(9) =
10
Mengukur numerik digunakan untuk meringkas karakteristik populasi didefinisikan
sebagai nilai-nilai yang diharapkan dari 𝛾 atau fungsi 𝛾. Menurut definisi, nilai yang diharapkan
dari 𝛾, 𝐸(𝛾), diberikan oleh
𝐸(𝛾) = ∑ 𝛾𝑝(𝛾)
𝛾
𝐸(𝛾) = ∑ 𝛾𝑝(𝛾)
𝛾
1
= (45) = 4.5
10
Satu dapat melihat bahwa 𝐸(𝛾) adalah sama dengan nilai rata-rata, atau nilai rata, semua
pengukuran dalam populasi konseptual. Secara umum, rata-rata penduduk akan disumbangkan
oleh μ, dan ini berarti bahwa
𝜇 = 𝐸(𝛾)
di mana 𝛾 adalah nilai dari pengukuran tunggal yang dipilih secara acak dari populasi.
Varians dari 𝛾, 𝑉(𝛾), diberikan oleh
1 1 1
= (0 − 4.5)2 ( ) + (1 − 4.5)2 ( ) + ⋯ + (9 − 4.5)2 ( )
10 10 10
1
= [(0 − 4.5)2 + (1 − 4.5)2 + ⋯ + (9 − 4.5)2
10
1
= (82.5) = 8.25
10
Varians 𝑉(𝛾) umumnya dilambangkan dengan 𝜎 2 .
Deviasi standar didefinisikan sebagai akar kuadrat dari varians, dan dilambangkan
dengan 𝜎 = √𝜎 2 . Untuk populasi tertentu dalam diskusi,
𝜎 = √8.25 = 2.9
Dalam studi statistik populasi bunga terdiri dari pengukuran diketahui; maka kita hanya
bisa berspekulasi tentang sifat histogram frekuensi relatif atau ukuran μ dan σ. Untuk
mendapatkan beberapa informasi tentang populasi, kita memilih sampel dari n pengukuran dan
mempelajari sifat-sifat dari sampel ini. Pengukuran sampel, secara umum, akan dilambangkan
dengan 𝛾1 , 𝛾2 , … , 𝛾𝑛 .
Mengikuti pola yang ditetapkan untuk meringkas informasi dalam suatu populasi, kita
dapat menghitung mean, varians, dan standar deviasi dari sampel. Langkah-langkah deskriptif
numerik diberikan, masing-masing, oleh
𝑛
1
𝛾̅ = ∑ 𝛾𝑖
𝑛
𝑖=1
∑𝑛𝑖=1(𝛾𝑖 − 𝛾̅ )2
𝑠2 =
𝑛−1
Dan 𝑠 = √𝑠 2
6, 9, 3, 8, 1, 7, 8, 8, 4,0
1
= (6 + 9 + 3 + ⋯ + 4 + 0)
10
1
= (54) = 5.4
10
𝑛
2
1
𝑠 = ∑(𝛾𝑖 − 𝛾̅ )2
𝑛−1
𝑖=1
1
= [(6 − 5.4)2 + (9 − 5.4)2 + ⋯ + (0 − 5.4)2 ]
9
1
= (92.4) = 10.27
9
Untuk ini jumlah sampel akan dibahas dalam dua bagian berikutnya, tetapi kita dapat
melihat 𝛾̅ yang mungkin membentuk pendekatan yang masuk akal untuk μ jika μ tidak diketahui.
Demikian juga, 𝑠 2 mungkin membentuk pendekatan yang masuk akal untuk 𝜎 2 jika 𝜎 2 tidak
diketahui, dan 𝑠 mungkin membentuk pendekatan yang masuk akal untuk 𝜎.
Sebuah histogram frekuensi untuk sarana 50 sampel ditunjukkan pada Gambar 2.2.
Distribusi ini merupakan pendekatan untuk distribusi sampling teoritis γ ̅, karena hal itu
menunjukkan bagaimana γ ̅ cenderung didistribusikan ketika sampel diulang diambil. Distribusi
sampling dapat dianggap sebagai distribusi aprobability untuk γ ̅. Perhatikan bahwa distribusi γ ̅
cenderung ke pusat dekat dengan mean populasi μ = 4.5; memiliki jauh lebih sedikit spread (atau
variabilitas) dari pengukuran penduduk asli, dan memiliki bentuk gundukan daripada bentuk
datar dari distribusi penduduk.
Dari kursus statistik dasar (lihat Mendenhall, 1983) kita tahu bahwa distribusi sampling
dari 𝛾̅ harus memiliki rata-rata μ, standar deviasi 𝜎/√𝑛, dan bentuk seperti itu dari kurva normal
(simetris, bell-berbentuk kurva). Tampilan ini dari 20 berarti sampel memiliki rata-rata 4,22
(yang dekat dengan μ = 4,5) dan standar deviasi 0,79 (yang dekat dengan 𝜎/√𝑛= 2,9 / √10 =
0,92). Juga, histogram frekuensi memiliki bentuk lonceng perkiraan, meskipun tidak cukup
simetris.
Dari sifat diketahui dari kurva normal berikut bahwa sekitar 68% dari nilai-nilai 𝛾̅ , dalam
pengambilan sampel ulang, harus jatuh dalam satu standar deviasi dari mean dari distribusi
sampling dari 𝛾̅ ′𝑠 ini. Sekitar 95% dari nilai-nilai𝛾̅ , dalam pengambilan sampel ulang, harus
jatuh dalam dua standar deviasi dari mean. Memeriksa laporan untuk sampel diamati dari 20 𝛾̅ ′𝑠,
kita melihat bahwa
Berisi 45 dari 50 (90%) dari γ ̅ ini. Persentase ini cukup dekat dengan nilai-nilai teoritis 68% ang
95%. (Ingat, kita hanya melihat perkiraan, berdasarkan 50 sampel, untuk distribusi sampling
sejati γ ̅.)
Jika distribusi sampling dari beberapa kuantitas sampel tidak mengikuti distribusi normal,
setidaknya sekitar, maka interpretasi frekuensi relatif masih bisa diperoleh dari teorema
Tchebysheff ini. Teorema ini menyatakan bahwa untuk setiap k≥1 setidaknya (1- 1 / k ^ 2) dari
pengukuran di set setiap harus terletak dalam k standar deviasi dari rata-rata mereka. Misalnya,
pengaturan k = 2 hasil bahwa setidaknya (1- 〖1/2〗 ^ 2) = (1-1 / 4) = 3/4 dari setiap set
pengukuran harus terletak dalam dua standar deviasi dari rata-rata mereka. Biasanya, fraksi ini
jauh lebih besar dari 3/4.
Singkatnya, distribusi sampling dari γ ̅ erat harus mendekati distribusi normal jika n tidak
lebih dari 20% dari N. pengamatan Hal ini terutama berlaku jika n≥30. Ketika n adalah
persentase yang sangat tinggi dari N, distribusi sampling dari γ ̅ dikelompokkan bahkan lebih
erat di populasi berarti dari yang diharapkan.
Seringkali sebuah eksperimen menghasilkan lebih dari satu variabel acak yang menarik.
Misalnya, psikolog mengukur lebih dari satu karakteristik per individu dalam studi perilaku
manusia. variabel khas mungkin menjadi ukuran intelegensia, γ_1, ukuran kepribadian, γ_2, dan
variabel lainnya yang mewakili nilai tes atau tindakan dari karakteristik fisik.
Secara intuitif, kita berpikir tentang ketergantungan dari dua variabel acak, γ_1 dan γ_2,
sebagai menyiratkan bahwa satu, mengatakan γ_1, baik bertambah atau berkurang sebagai γ_2
perubahan. Kami akan membatasi perhatian kita dua langkah dari ketergantungan, kovarians dan
koefisien sederhana korelasi linear, dan akan memanfaatkan Angka 2,7 (a) dan 2.7 (b) untuk
membenarkan memilih mereka sebagai langkah ketergantungan. Angka-angka ini mewakili
diplot poin untuk dua sampel (random) dari n = 10 unit percobaan yang diambil dari populasi.
Pengukuran γ_1 dan γ_2 dibuat pada setiap unit percobaan. Jika semua titik terletak pada garis
lurus, seperti ditunjukkan pada Gambar 2.7 (a), γ_1 dan γ_2 jelas tergantung. Sebaliknya,
Gambar 2.7 (b) menunjukkan sedikit atau tidak ada ketergantungan antara γ_1 dan γ_2.
Misalkan kita benar-benar tahu μ_1 dan μ_2, sarana γ_1 dan γ_2, masing-masing, dan
menemukan titik ini pada grafik, Gambar 2.7. Sekarang cari titik diplot pada Gambar 2.7 (a) dan
mengukur penyimpangan, 〖 (γ 〗 _1-μ_1) dan 〖 (γ 〗 _2-μ_2). Perhatikan bahwa kedua
penyimpangan menganggap tanda aljabar yang sama untuk tertentu
〖(γ〗 _1-μ_1) 〖(γ〗 _2-μ_2), adalah positif. Hasil ini akan berlaku untuk semua diplot titik
pada Gambar 2.7 (a). Poin ke kanan (μ_1, μ_2) akan menghasilkan pasang penyimpangan
positif, menunjuk ke kiri akan menghasilkan pasang penyimpangan negatif, dan rata-rata produk
dari penyimpangan 〖(γ〗 _1-μ_1) 〖(γ〗 _2 -μ_2) akan "besar" dan positif. Jika hubungan
linear telah miring ke bawah ke kanan, semua pasangan yang sesuai dari penyimpangan akan
tanda berlawanan, dan nilai rata-rata 〖(γ〗 _1-μ_1) 〖(γ〗 _2- μ_2) akan menjadi angka
negatif besar.
Situasi baru saja dijelaskan tidak akan terjadi untuk Gambar 2.7 (b), di mana sedikit atau
tidak ada ketergantungan ada antara γ_1 dan γ_2. penyimpangan yang sesuai, 〖(γ〗 _1-μ_1)
dan 〖(γ〗 _2-μ_2), akan menganggap tanda aljabar yang sama untuk beberapa poin dan tanda-
tanda yang berlawanan untuk orang lain. Sehingga produk 〖(γ〗 _1-μ_1) 〖(γ〗 _2-μ_2) akan
positif untuk beberapa poin, negatif bagi orang lain, dan akan rata-rata untuk beberapa nilai
mendekati nol.
Semakin besar nilai absolut kovarians dari γ_1 dan γ_2, semakin besar akan menjadi
ketergantungan linear antara γ_1 dan γ_2. nilai-nilai positif menunjukkan bahwa kenaikan γ_1
sebagai γ_2 meningkat; nilai negatif menunjukkan bahwa γ_1 menurun sebagai γ_2 meningkat.
Nilai nol kovarians menunjukkan tidak ada ketergantungan linier antara γ_1 dan γ_2.
(Di mana σ_1 dan 〖σ〗 _2 adalah standar deviasi dari γ_1 dan γ_2, masing-masing) terkait
dengan kovarians dan dapat mengasumsikan nilai-nilai dalam -1≤ρ≤1 interval. Koefisien sampel
korelasi digunakan sebagai estimator dari ρ dan dibahas dalam kursus paling pengantar.
Informasi lebih lanjut mengenai hal ini dapat ditemukan di Mendenhall (1983, Bab 10).
2.5 ESTIMATION
Sebuah estimator merupakan fungsi dari variabel diamati acak, dan konstanta yang
diketahui mungkin lainnya, digunakan untuk memperkirakan parameter. Misalnya, mean sampel
y ̅ dapat digunakan sebagai estimator dari mean populasi μ. Berarti ̅ γ adalah estimator karena
merupakan fungsi dari pengamatan sampel. Jika kita mengambil sampel dan menghitung nilai
tertentu sebagai estimasi terbaik dari μ, kami ingin tahu bahwa pada γ rata ̅ menghasilkan nilai-
nilai yang berpusat sekitar μ dan pada umumnya cukup dekat dengan μ. Dengan demikian kita
akan ingin memilih rencana pengambilan sampel yang menjamin kita bahwa E (γ ̅) = μ dan V
(γ ̅) adalah "kecil."
Secara umum, misalkan θ merupakan estimator dari θ parameter. Dua sifat yang kita
ingin θ untuk memiliki adalah sebagai berikut:
1. E (θ) = θ.
2. V (θ) = σ_θ ^ 2 kecil.
Setelah kita tahu mana θ estimator kita gunakan dalam situasi dan sesuatu tentang
distribusi probabilitas, kita dapat menilai besarnya kesalahan estimasi. Kami mendefinisikan
kesalahan estimasi menjadi │θ-θ│. Seberapa baik perkiraan tunggal akan? Kita tidak bisa
menyatakan bahwa perkiraan diamati akan berada dalam jarak tertentu dari θ, tapi kami bisa,
setidaknya sekitar menemukan terikat B sehingga
𝑃( |𝜃̂ − 𝜃| ≤ 𝐵) = 1 − 𝛼
Untuk setiap diinginkan probabilitas 1-α, di mana 0 <α <1. Jika θ memiliki distribusi normal,
maka B = z_ (α / 2) σ_θ, di mana z_ (α / 2) adalah nilai memotong wilayah (α / 2) di ekor kanan
normal standar distribusi. Tabel nilai dari z_ (α / 2) diberikan dalam Tabel 1 dari Lampiran. Jika
1-α = 0,95, maka z _ (. 025) = 1,96, atau sekitar 2. Karena banyak estimator yang kami gunakan
pada teks tidak akan tepat terdistribusi normal bagi banyak nilai-nilai n dan N, dan karena
teorema Tchebysheff menyatakan bahwa pada setidaknya 75% dari pengamatan untuk setiap
distribusi probabilitas akan berada dalam dua standar deviasi dari rata-rata mereka, kita akan
menggunakan 〖2σ〗 _θ sebagai terikat pada kesalahan dari estimasi. Nilai ini memberikan P
(│θ-θ│≤B) =. 95 untuk kasus-kasus kurang normal dan P (│θ-θ│≤B) =. 75 dalam hal apapun.
Perhatikan bahwa untuk θ terdistribusi normal, terikat untuk memenuhi setiap probabilitas yang
diinginkan (1-α) dapat ditemukan melalui penggunaan Tabel 1.
2.6 SUMMARY
Bab 2 menyajikan tinjauan kapsul konsep dasar statistik. Membuat kesimpulan tentang populasi
membutuhkan metode untuk menggambarkan satu set pengukuran dan, akibatnya, memerlukan
pembahasan histogram frekuensi dan langkah-langkah deskriptif numerik. Dua langkah-langkah
deskriptif numerik sangat berguna adalah mean dan standar deviasi. Meskipun rata-rata
merupakan ukuran mudah dipahami dari tendensi sentral, standar deviasi memperoleh makna
sebagai ukuran of'variation hanya bila ditafsirkan dengan menggunakan teorema Tchebysheff
atau beberapa distribusi tertentu seperti normal.
variabel acak dan distribusi probabilitas mereka disajikan untuk memberikan latar
belakang untuk menggambarkan estimator propertiesof dari paremeters penduduk. Pengertian
tentang harapan, kovarians, dan korelasi membantu dalam mengevaluasi sifat-sifat estimator.
Estimasi parameter populasi adalah metode utama pembuatan inferensi digunakan dalam
metode survei sampel. Konsep estimator titik dengan ukuran yang sesuai kebaikan (terikat pada
kesalahan estimasi) disajikan dan digunakan sebagai metode inferensi dalam semua bab-bab
berikutnya.
BAB 3
Soal
Bab 3
1. suatu percobaan ingin memperkirakan konsumsi air rata-rata per keluarga di kota. membahas
manfaat relatif dari memilih keluarga individu, unit hunian (rumah keluarga tunggal, bangunan
apartemen, dll), dan blok kota sebagai unit sampling. apa yang akan Anda gunakan sebagai
2. rimbawan ingin memperkirakan jumlah pohon di pertanian yang memiliki diameter lebih dari 12
inci. peta pertanian tersedia. membahas masalah memilih unit sampling yang tepat dan frame
yang tepat?
3. seorang pakar keamanan tertarik dalam memperkirakan proporsi ban mobil dengan tapak yang
tidak aman. harus dia menggunakan mobil pribadi atau koleksi mobil, seperti yang di tempat
parkir, sebagai sampel unit? apa yang bisa ia gunakan sebagai bingkai?
4. industri di terdiri dari banyak tanaman kecil yang terletak di seluruh negara bersatu. seorang
eksekutif ingin survei pendapat dari emplyees pada kebijakan liburan industri. apa yang akan
Anda sarankan penggunaan sebagai sampel unit? apa yang bisa ia gunakan sebagai bingkai?
Bab 2
Penyelesaian:
Ada 4 macam skala pengukuran yaitu: skala nominal, skala ordinal, skala interval dan
skala rasio.
1. Skala nominal
Adalah skala yang semata-mata hanya untuk memberikan indeks, atau nama saja dan
tidak mempunyai makna yang lain. Contoh:
Kode Kode
Data
(a) (b)
Yuni 1 4
Desi 2 2
Ika 3 3
Astuti 4 1
Keterangan: Kode 1 sampai dengan 4 (a) semata-mata hanyalah untuk memberi tanda
saja, dan tidak dapat dipergunakan sebagai perbandingan antara satu data dengan data
yang lain. Kode tersebut dapat saling ditukarkan sesuai dengan keinginan peneliti
(menjadi alternatif b) tanpa mempengaruhi apa pun.
2. Skala ordinal
Adalah skala ranking, di mana kode yang diberikan memberikan urutan tertentu pada
data, tetapi tidak menunjukkan selisih yang sama dan tidak ada nol mutlak. Contoh:
Skala Skala
Data Kecantikan Kecantikan
(a) (b)
Yuni 4 10
Desi 3 6
Ika 2 5
Astuti 1 1
Skala kecantikan (a) di atas menunjukkan bahwa Yuni paling cantik (dengan skor
tertinggi 4), dan Astuti yang paling tidak cantik dengan skor terendah (1). Akan tetapi,
tidak dapat dikatakan bahwa Yuni adalah 4 kali lebih cantik dari pada Astuti. Skor yang
lebih tinggi hanya menunjukkan skala pengukuran yang lebih tinggi, tetapi tidak dapat
menunjukkan kelipatan. Selain itu, selisih kecantikan antara Yuni dan Desi tidak sama
dengan selisih kecantikan antara Desi dan Ika meskipun keduanya mempunyai selisih
yang sama (1). Skala kecantikan pada (a) dapat diganti dengan skala kecantikan (b)
tanpa mempengaruhi hasil penelitian.
Skala nominal dan skala ordinal biasanya mempergunakan analisis statistik non
parametrik, contoh: Korelasi Kendall, Korelasi Rank Spearman, Chi Square dan lain-
lain.
3. Skala interval
Skala pengukuran yang mempunyai selisih sama antara satu pengukuran dengan
pengukuran yang lain, tetapi tidak memiliki nilai nol mutlak. Contoh:
Nilai Mata Skor Nilai Mata
Data
Kuliah (a) Kuliah (b)
Yuni A 4
Desi B 3
Ika C 2
Astuti D 1
Tabel di atas menunjukkan bahwa nilai A setara dengan 4, B setara dengan 3, C setara
dengan 2 dan D setara dengan 1. Selisih antara nilai A dan B adalah sama dengan selisih
antara B dan C dan juga sama persis dengan selisih antara nilai C dan D. Akan tetapi,
tidak boleh dikatakan bahwa Yuni adalah empat kali lebih pintar dibandingkan Astuti,
atau Ika dua kali lebih pintas dari pada Astuti. Meskipun selisihnya sama, tetapi tidak
mempunyai nilai nol mutlak.
4. Skala rasio
Adalah skala pengukuran yang paling tinggi di mana selisih tiap pengukuran adalah
sama dan mempunyai nilai nol mutlak. Contoh:
Tinggi Berat
Data
Badan badan
Yuni 170 60
Desi 160 50
Ika 150 40
Astuti 140 30
Tabel di atas adalah menggunakan skala rasio, artinya setiap satuan pengukuran
mempunyai satuan yang sama dan mampu mencerminkan kelipatan antara satu
pengukuran dengan pengukuran yang lain. Sebagai contoh; Yuni mempunyai berat
badan dua kali lipat berat Astuti, atau, Desi mempunyai tinggi 14,29% lebih tinggi dari
pada Astuti.
Penyelesaian:
Penyelesaian:
Jika µ dan σ masing-masing merupakan rataan dan simpangan baku dari peubah acak X,
maka untuk setiap bilangan positif k peluang dari peubah acak x yang bernilai antara µ −
1
𝑘𝜎 dan µ+kσ paling sedikit sebesar 1 − 𝑘 2 dan ditulis :
1
𝑃(|𝑥 − µ| < 𝑘𝜎) ≥ 1 −
𝑘2