You are on page 1of 5

1.

Histogram
Histogram adalah pemecahan konvensional untuk menampilkan internal ratio yang
digambarkan dengan grafis batang yang saling berhimpitan atau tidak ada jarak karena
datanya termasuk data continue yang digunakan untuk mengelompokkan nilai-nilai
variabel menjadi interval atau untuk menunjukkan distribusi atau penyebaran data
secara visual.
Kegunaan histogram sendiri ada beberapa diantaranya yaitu :

Melihat seberapa sering suatu nilai yang berbeda itu terjadi dalam suatu nilai
yang berbeda itu terjadi dalam suatu kumpulan data.
Memerikasaan bentuk distribusi mengenail kemenjuluran, kurtosis, dan pola
modusnya.

Histogram tidak akan digunakan untuk variabel nominal yang tidak memiliki susunan
untuk kategorinya. Dengan histogram kita dapat mengetahui dengan jelas
perbandingan antara satu dengan lainnya apakah ada kesenjangan atau tidak dan akan
memudahkan dalam pengambilan keputusan dalam sebuah kasus.
2. Tampilan batang dan daun
Tampilan batang dan daun merupakan teknik EDA yang mempunyai hubungan erat
dengan histogram. Menurut Somantri (2006:116) penyajian data dengan tampilan
batang dan daun, selain dapat diperoleh informasi mengenai distribusi dari gugus data
juga dapat dilihat nilai-nilai pengamatan aslinya. Jika sampel datanya berjumlah kecil
maka dengan mudah bisa dibuat dengan manual jika tidak maka dengan program
komputer.
Ada beberapa keunggulan tampilan batang dan daun yaitu

Meyajikan suatu kumpulan data tanpa kehilangan informasi semua data


individual.
Menampilkan nilai-nilai yang data yang sebenarnya yang dapat diperiksa
langsung tanpa menggunakan batang tertutup atau asterisk sebagai medium
representasi.
Menunjukkan distribusi nilai-nilai di dalam interval.
Menjaga susunan peringkat sehingga dapat mengetahui median, kuartil, dan
ringkasan statistik lainnya.
Mempermudah menghubungkan kembali suatu pengamatan khusus kepada
arsip data pada subyek yang menghasilkannya.
Mengetahui apakah penyebarannya terpusat atau tersebar.

Menampilkan datum yang paling banyak muncul, datum terkecil dan datum
terbesar.
Jarak dari nilai-nilai tampak jelas secara sekilas, baik bentuk maupun kesan
sebarannya.

3. Kotak plot (boxplot) atau box and whisker plot


Boxplot adalah salah satu cara dalam statistik deskriptif untuk menggambarkan secara
grafik dari data numeris melalui lima ukuran sebagai berikut:
nilai observasi terkecil (nilai minimum)
kuartil terendah atau kuartil pertama (Q1), yang memotong 25 % dari data
terendah
median (Q2) atau nilai pertengahan
kuartil tertinggi atau kuartil ketiga (Q3), yang memotong 25 % dari data tertinggi
nilai observasi terbesar (nilai maksimum).
Median dan kuartil digunakan karena keduanya terutama bersifat statistic yang
resisten. Resisten sendiri adalah karakteristik yang menggambarkan ketidaksensitifan
terhadap lokalisasi perilaku berbeda dalam data. Dalam arti lain tidak terpengaruh oleh
nilai-nilai yang berada di luar kecenderungan (outliers) dan hanya berubah sedikit
dalam dalam kaitannya dengan penggantian sebagian kecil kelompok data. Kuartil
sendiri mempunyai sifat apabila lebih dari 25 persen data dapat dibuat ekstrim tanpa
mengganggu median, yaitu komposisi segi empat dari plot atau kuartil. Rata-rata hitung
maupun standar deviasi dianggap statistika tidak resisten, karena mudah terpengaruh
oleh nila-nilai ekstrim dalam ekor-ekor distribusi dan tidak mewakili nilai tipikal secara
baik di bawah kondisi yang tidak simetris.
Dalam boxplot juga ditunjukkan jika ada nilai outlier dari observasi. Boxplot dapat
digunakan untuk menunjukkan perbedaan antara populasi tanpa menggunakan asumsi
distribusi statistik yang mendasarinya. Karenanya, boxplot tergolong dalam statistik
non-parametrik. Jarak antara bagian-bagian dari box menunjukkan derajat dispersi
(penyebaran) dan skewness (kecondongan) dalam data. Dalam penggambarannya,
boxplot dapat digambarkan secara horizontal maupun vertikal.
Secara mudah kotak plot dapat disusun dengan manual atau menggunakan
program komputer. Isi dasar dari kotak plot terdiri dari :
1. plot segi empat yang terdiri dari 50 persen nilai-nilai data
2. garis tengah (atau notosi lainnya) yang menandai median dan terus
menuju lebar kotak
3. sisi kotak, disebut hinges

4. whiskers yang terbentang dari kanan dan kiri hinges kea rah nilai
terbesar dan terkecil.
Nilai-nilai ini dapat dijumpai dalam 1,5 kali jarak antarkuartil (IQR) dari
kedua sisi kotak.
4. Transformasi
Transformasi tujuan utamanya untuk mengubah skala pengukuran data asli menjadi
bentuk lain, sehingga data dapat memenuhi asumsi-asumsi yang mendasari analisis
ragam dapat menyatakan kembali data dalam suatu skala baru dengan menggunakan
suatu fungsi metematika tunggal untuk setiap titik data.
Ada beberapa alasan emdasar kenapa kita melakukan transformasi data :
a. Untuk meningkatkan interpretasi dan kecocokannya dengan kumpulan data
lainnya.
b. Untuk mensimetriskan dan menstabilkan sebaran.
c. Untuk meningkatklan hubungan linear antara dua dan diantara beberapa
variable.
Suatu skor standar atau skor Z dapat dikalkulusasi untuk meningkatkan kepadanan
diantara variabel-variabel yang berasal dari skala yang berbeda dan membutuhkan
perbandingan. Skore Z menunjukkan jarak dalam unit standar deviasi dengan suatu
rata-rata hitung 0 dan standar deviasi 1. Hal tersebut dapat dilakukan dengan
mengkonversikan skor mentah Xi menjadi :
Z=

Xi X
s

Skor Z meningkatkan interpretasi melalui referensinya dalam bentuk kurva normal


dan pemahapan kita tentang daerah dibawahnya.
5. Tabulasi silang
Suatu teknik membandingkan dua variable klasifikasi, seperti jenis kelamin, dan seleksi
yang dilakukan oelh pemilik perusahaan untuk penugasan ke luar negeri yang
menggunakan table yang memiliki jumlah baris dan kolom yang berhubungan dengan
tingkat atau nilai dari masing-masing kategori.
Total baris dan kolom disebut marginal, muncul pada margin dasar dan margin
kanan tabel yang menunjukkan perhitungan dan presentase dari baris dan kolom yang
terpisah.

6. Penggunaan presentase
Dalam presentasi data ada dua tujuan yamh memenuhi presentase :
1. Menyederhanakan dengan cara mengurangi semua angka kedalam suatu jarak
antara 0 sam pai dengan 100.
2. Menerjemahkan data ke dalam bentuk baku dengan suatu dasar 100, untuk
perbandingan relative.
Petunjuk-petunjuk dalam presentase agar terhindar dari kesalahan dalam melaporkan
hasil.
a. Presentase rata-rata, presentase tidak dapat dirata-ratakan kecuali masingmasing diboboti oleh ukuran grup dari mana presentase tersebut diperoleh.
b. Menggunakan presentase yang terlalu besar, jika mengalami suatu peningkatan
1000 persen, lebih baik menjelaskannya dengan suatu peningkatan 10 kali lipat
karena tujuannya menyederhanakan.
c. Menggunakan suatu nilai dasar yang rendah, suatu angka 60 persen jika
dibandingkan dengan 30 persen perbedaannya sangat besar. Akan tetapi jika
terdapat tiga kasus dalam satu kategori dan enam kasus dalam kategori lain
maka perbedaannya tidak akan signifikan jika muncul dalam presentase.
d. Berkurangnya presentase tidak akan melampaui 100 persen.
7. Variable penjelas dan pengontrol
Variable penjelas yaitu pengenalan terhadap suatu variable ketiga untuk
menginterpretasikan hubungan. Sedangkan variable pengontrol atau faktor penguji
adalah variable tambahan yang dievaluasi secara simultan berdasarkan hubungan
aslinya. Table kontigensi berfungsi sebagai kerangka kerja analisis penjelas.
8. Table yang diciptakan oleh komputer
Suatu analisis lanjut dari analisis elaborasi adalah deteksi interaksi otomatis atau DIO
yang merupakan prosedur yang memisahkan secara berurutan yang dimulai dengan
variable terikat dan sekelompok penduga. Analisis ini dapat mencari sampai dengan
300 variabel untuk pembagian tunggal terbaik berdasarkan masing-masing variabel
penduga, memilih satu variable, dan membagi sampel ke dalam dua subkelompok
untuk memaksimumkan pengurangan jumlah kuadrad variabel terikat yang tidak
dijelaskan. Kedua subkelompok ini kemudian menjadi dua sampel terpisah untuk
analisis lebih lanjut. Prosedur pencarian diulangi untuk menemukan variable yang
ketika dipecah menjadi dua bagian, membuat kontribusi berikut yang besar terhadap
pengurangan variasi yang tidak terjelaskan dalam setiap subsample dan seterusnya.

You might also like