Professional Documents
Culture Documents
1
3.3 UJI AUTOKORELASI ..............................................................................................................58
PERTEMUAN 4 KORELASI.............................................................................. 64
REGRESI ................................................................................................................................................75
2
PERTEMUAN 1
PENGENALAN STATISTIK
Berdasarkan Applied business statistics making better business decisions 7th (Black,
2013) banyak variasi penggunaan dan applikasi dalam statistik bisnis, dapat digunakan untuk
kinerja karyawan, rata-rata penjualan, pengumpulan informasi, dan lain-lain. Suatu bisnis
membutuhkan penelitian untuk mendapatkan lebih banyak informasi yang menarik untuk
bisnisnya. Dengan statistika data yang dimiliki akan diolah menjadi informasi yang memiliki arti
dan berguna untuk pengambilan keputusan.
Webster’s Third New International Dictionary (Black, 2013) memberikan definasi
statistik yang komprenhensif sebagai “ilmu yang berkaitan dengan mengumpulkan, menganalisis,
menginterpretasikan, dan menyajikan data numerik”.
Menurut (Black, 2013), Statistik bisnis adalah tentang mengukur fenomena dalam dunia bisnis dan
mengatur, menganalisa, dan mempresentasikan hasil informasi yang berbentuk numerical dalam
cara yang lebih baik, dengan begitu keputusan bisnis yang terinformasi dapat dibuat. Dalam bisnis
statistik, hal yang paling sering dipelajari mengandung variabel, pengukuran, dan data.
Variabel dalam bisnis statistik adalah karakteristik dari setiap entitas yang dipelajari yang
mampu mengambil nilai yang berbeda (Black, 2013). Banyak sekali variabel dalam bisnis,
misalnya produktivitas pekerja, gaji karyawan, harga produk/jasa, pangsa pasar, jumlah penjualan,
dll. Dalam pembelajaran tentang bisnis statistik, variabel – variabel yang digunakan akan
menghasilkan pengukuran yang dapat digunakan dalam analisis.
Data adalah fakta – fakta dan angka – angka yang dikumpulkan, di analisa dan
dirangkum untuk dipresentasikan dan diperlihatkan hasilnya (Anderson, Sweeney, & Williams,
2011). Data memiliki berbagai wujud seperti angka tinggi badan, angka penjualan, jumlah
produksi, jumlah mahasiswa, dan lain-lain. Kumpulan data yang lebih berarti atau bermakna
setelah melalui suatu proses pengolahan disebut sebagai informasi, contoh : rata-rata tinggi badan
anak SMP yang rutin berenang adalah 100cm. Memilih dan mengorganisasikan informasi yang
menyediakan pengertian, rekomendasi, dan dasar keputusan akan menjadi sebuah pengetahuan.
3
Contoh : terdapat perbedaan rata-rata tinggi badan siswa SMP yang rutin berenang dengan yang
tidak.
4
Data sekunder merupakan data yang berdasarkan informasi yang dihasilkan dari sumber yang
sudah ada. Data dapat bersumber dari internal maupun eksternal organisasi dan dapat diakses
melalui internet serta merupakan informasi yang sudah tersebar. Data sekunder dapat berasal
dari buku, data sensus, database perusahaan, media, laporan tahunan, dan sebagainya.
5
Data diskrit adalah data berupa angka yang bersifat bilangan bulat. Dengan kata lain, data ini
tidak berbentuk pecahan ataupun desimal. Data ini biasanya bukan merupakan bilangan
negatif. Data diskrit dihasilkan pada sesuatu yang dapat dihitung (counted) bukan diukur
(measured), dan bukan merupakan hal yang dapat dinyatakan dalam bentuk pecahan ataupun
desimal. Contoh data ini adalah jumlah orang, jumlah kapal, jumlah kelompok, jumlah unit.
2. Data Kontinyu
Data kontinyu merupakan data berupa angka yang merupakan hasil dari suatu interval. Maka
dalam data kontinyu seluruh angka memiliki suatu nilai, termasuk data dalam bentuk pecahan
ataupun desimal. Data kontinyu dihasilkan dari sesuatu yang dapat diukur (measured) bukan
dihitung (counted). Contoh data ini adalah jam, detik, suhu, tinggi, berat, volume.
(www.organisasi.org, 2006)
6
1.3 Pengertian Skala
Menurut (Anderson, Sweeney, & Williams, 2011) skala perhitungan menentukan jumlah dari
informasi yang terkandung di dalam data dan mengindikasikan ringkasan data yang paling tepat
dan analisis statistik. Pengukuran merupakan aturan-aturan pemberian angka untuk berbagai objek
sedemikian rupa sehingga angka ini mewakili kualitas atribut. Terdapat empat jenis skala yang
dapat digunakan untuk mengukur atribut, yaitu: skala nominal, skala ordinal, skala interval, dan
skala ratio.
1. Skala Nominal
Skala nominal adalah level terendah dari pengukuran data dimana angka yang
merepresentasikan skala nominal dapat digunakan hanya untuk mengklasifikasikan atau
mengkategorikan. Dimana angka yang direpresentasikan tidak menunjukan perbedaan dalam
tingkatan atau level, hanya untuk membedakan antara satu variable dan variable lainnya.
Tipe-tipe variable yang sering menggunakan level nominal adalah jenis kelamin, agama,
etnis, lokasi geografis, dan lain sebagainya.
Contoh dari skala nominal yang sering digunakan adalah
1. Laki-laki
2. Perempuan
DImana angka 1 pada laki-laki tidak menunjukan bahwa laki-laki lebih baik dibanding
perempuan, sebaliknya pun seperti itu.
(smartstat, 2010)
2. Skala Ordinal
Skala pengukuran untuk sebuah variabel dinamakan skala ordinal jika data menunjukkan sifat
data nominal dan keteraturan atau peringkat data yang bermakna. Skala ordinal adalah skala
pemeringkat dimana angka ditetapkan untuk mengindikasikan relativitas karakter yang
dimiliki. Dengan demikian dapat diketahui apakah suatu objek memiliki sesuatu (karakter)
lebih banyak atau lebih sedikit dari objek lainnya. Skala ordinal mengindikasikan posisi
relatif, misalnya pelajar yang diberi peringkat 1 berarti secara relatif lebih baik dari peringkat
2,3, dst, namun tidak dapat diketahui persisnya apakah antara peringkat 1 dan 2 perbedaannya
tipis ataukah sangat jauh.
3. Skala Interval
7
Skala interval adalah skala pengukuran yang lebih tinggi tingkatannya dibanding dengan dua
skala sebelumnya dan selalu berbentuk angka. Skala ini menunjukan jajaran nilai antara dua
bilangan. Dalam skala interval jarak numerik pada skala mewakili jarak yang sama pada
karakter yang diukur. Terdapat interval yang konstan / sama antara nilai skala. Sebagai contoh
adalah perbedaan jenis suhu yang dinyatakan dalam derajat antara 50-80o C dikatakan cukup
panas, 80-110o C dikatakan panas, 110-140o C dikatakan sangat panas.
(smartstat, 2010)
4. Skala Rasio
Skala pengukuran dinamakan skala rasio jika data memiliki semua sifat-sifat data interval dan
rasio dua nilai yang bermakna. Skala rasio adalah rasio yang tertinggi, yang mana skala ini
memiliki titik absolut (zero point), skala ini dapat digunakan untuk menidentifikasikan atau
mengklasifikasikan, memeringkatkan, dan membandingkan interval atau perbedaan objek.
Dalam skala ini dapat berguna untuk menghitung rasio dari nilai skala. Sehingga bukan saja
dapat diketahui perbedaan antara 2 dan 5 sama dengan perbedaan 16 dan 19, yaitu 3, namun
dapat diketahui bahwa 16 adalah 8 kali lipat dari 2.
8
Non comparative scale (metric scale), tiap objek diukur secara independen dari objek
lainnya dalam perangkat stimulus. Data pada umumnya berupa skala interval atau rasio. Contoh :
seorang responden diminta untuk mengevaluasi minuman Fanta dengan skala 1 (sangat baik)
sampai 6 (sangat tidak baik).
9
mobil. Atribut-atribut tersebut didaftar terlebih dahulu seperti : kenyamanan, kecepatan,
fleksibilitas, dll.
c. Skala Stapel
Skala stapel merupakan skala yang dikembangkan oleh Jan Stapel yang menyatakan skala vertikal
antara 5 data titik bawah dan 5 data titik atas dengan 10 kategori yang dinyatakan dalam nilai
negatif dan positif. Skala ini merupakan modifikasi dari skala semantik diferensial. Skala ini
biasanya dinyatakan dalam skala -5 hingga +5, tanpa titik netral atau nol dan responden diminta
10
memberikan penilaian terhadap suatu objek dengan menunjuk pada kecenderungan angka -5
sebagai kriteria tidak bagus dan angka +5 sebagai sangat bagus.
(www.triyatmoko.wordpress.com, 2009)
Menurut Sugiyono (2009:244) analisis data adalah proses mencari dan menyusun data yang
diperoleh dari hasil wawancara, catatan lapangan, dan bahanbahan lain secara sistematis sehingga
mudah dipahami dan temuannya dapat diinformasikan kepada orang lain. Analisis merupakan
tindakan mengolah data hingga menjadi informasi yang bermanfaat dalam menjawab masalah
statistik. Dalam desain riset, perlu direncanakan dengan baik alat analisis yang akan diterapkan
untuk menganalisis data. Tujuan analisis data adalah mendapatkan informasi yang relevan yang
terkandung didalam data tersebut dan menggunakan hasilnya untuk memecahkan suatu masalah.
Metode analisis yang sering digunakan adalah :
11
Dalam Aplikasinya, metode analisis statistik dapat dibagi menjadi dua (2) kelompok besar,
yaitu:
1. Statistik Deskriptif
Analisis deskriptif bertujuan mengubah kumpulan data mentah menjadi mudah dipahami
dalam bentuk informasi yang lebih ringkas. Jadi statistik deskriptif berusaha menjelaskan atau
menggambarkan beberapa karakteristik data, seperti berapa rata-ratanya, seberapa jauh data-data
bervariasi dari rata-ratanya, berapa median data, dan sebagainya.
2. Statistik inferensi
Statistik inferensi bertujuan untuk menyediakan dasar peramalan, dan estimasi yang
digunakan untuk mengubah informasi menjadi pengetahuan.
12
variabel. Contohnya untuk meneliti kepuasan pelanggan, maka variabel yang dianggap
relevan misalnya jumlah pembelian, banyaknya kunjungan, tingkat kompain, dan sebagainya.
(Santoso, 2011)
SPSS adalah software yang memiliki kemampuan analisis yang dirancang untuk membantu
pengolahan data secara statistik . Untuk keseragaman ,SPSS yang digunakan dalam praktikum ini
adalah IBM SPSS Statistic 20.
Proses statistik dengan SPSS :
DATA EDITOR
1. Data yang diproses dimasukkan lewat menu DATA EDITOR yang otomatis muncul di layar
saat SPSS dijalankan.
2. Data yang telah diinput kemudian diproses, juga lewat menu DATA EDITOR.
3. Hasil pengolahan data muncul di layar (window) yang lain dari SPSS, yaitu VIEWER Output
SPSS bisa berupa teks / tulisan, tabel, atau grafik.
Pada saat IBM SPSS Statistics 20 (SPSS 20) pertama kali dibuka, selalu tampak tampilan pertama
sebagai berikut.
13
Window di atas disebut DATA EDITOR dan merupakan window utama pada SPSS. Di dalam
DATA EDITOR inilah akan dilakukan proses utama SPSS yakni menginput data dan selanjutnya
memproses data tersebut.
SPSS DATA EDITOR memiliki dua bagian, yaitu :
DATA VIEW, yaitu tempat untuk menginput data statistik .Inilah yang selalu tampil di
layar.
VARIABLE VIEW, yaitu tempat untuk menginput variabel statistik. Bagian ini digunakan
hanya pada saat memasukkan dan mendefinisikan variabel-variabel.
Berikut penjelasan mengenai kolom-kolom pada variable view yang harus diisi untuk
menambahkan variabel baru :
Name
Kolom ini adalah kolom untuk memberikan nama untuk variabel. Jumlah karakter yang
bisa digunakan untuk memberi nama pada sebuah variabel adalah 64 karakter (bit).
14
Namun untuk membuat sebuah nama dalam bentuk kalimat, gunakan tanda underline
untuk penghubung. Contoh: Data_Penjualan.
Type
Type digunakan untuk mengisi jenis tipe data sesuai dengan data yang ingin dimasukkan.
Dalam SPSS, banyak tipe data yang ditawarkan untuk tiap variable, tetapi untuk
keperluan analisis data biasanya yang digunakan adalah tipe data string, numeric dan
date. Berikut penjelasan tipe-tipe data yang ada pada SPSS :
Numeric : Data dalam bentuk angka.
Comma : Data ini berbentuk numerik dan ditandai koma sebagai pembeda ribuan.
Dot : Data ini berbentuk numerik dan ditandai titik sebagai pembeda ribuan.
Scientific Notation : Data ini berbentuk numerik,dan ditandai dengan simbol E.
Date : Data berupa tanggal dan ada sejumlah pilihan type/format tanggal.
Dollar : Data ini berbentuk numerik dan ditandai ($) dengan tanda koma sebagai
pemisah tanda ribuan.
Custom Currency : Bentuk tipe ini digunakan untuk menampilkan format mata uang
yang dibuat melalui kotak dialog Options dari menu edit.
String : Data dalam bentuk karakter /huruf .
Width
Width digunakan untuk menentukan berapa banyak digit yang dapat dimasukkan pada
data tiap sel. Pilihan ini menyediakan masukan antara 1 sampai 255 digit .
Decimals
Untuk menambahkan atau mengurangi decimal pada data berupa angka.
Label
Label adalah keterangan untuk nama variable, yang bisa disertakan atau tidak. Label yang
tidak diisi tidak mempengaruhi proses data. Walaupun demikian, pada input data yang
banyak dan ada kemiripan, penulisan label sangat dianjurkan untuk memperjelas identitas
sebuah variabel.
Values
Values adalah kode yang diberikan jika variabel yang digunakan kategorik. Misalnya kita
ingin menggunakan kode 1 untuk laki-laki dan kode 2 untuk perempuan.
Missing
Data yang dianggap hilang yang tidak akan kita ikutkan dalam analisis. Ada tiga pilihan :
No missing values
15
Discrete missing values. Angka tertentu yang kita anggap hilang.
Range plus one optinal discrete missing value. Jika ada data hilang dengan range
yang jelas.
Columns
Columns adalah lebar tempat nama karakter pada NAME .Besarnya minimal sama
dengan besarnya nilai WIDTH.
Align
Align digunakan untuk mengubah letak tampilan data seperti pada Ms.Word.
Measure
Adalah skala pengukuran dari variabel yang bersangkutan.
Setelah melakukan pengisian VARIABLE VIEW, kita dapat mulai untuk memasukkan data
ke dalam DATA VIEW.
Fitur baru dalam IBM SPSS Statistics 20:
1. Bisa membuka file data lebih dari 1
2. Menu data yang lebih lengkap, seperti fitur :
Spilt File (memisahkan isi file dengan kriteria tertentu)
Select Case (menyeleksi isi file dengan kriteria tertentu)
Sort Case (mengurutkan data)
16
Modus menggambarkan nilai yang paling sering muncul atau memiliki frekuensi
terbanyak. Jika ada data : 5, 5, 6, 7, 2, 6, 5, 4, 1, 5. Modusnya merupakan angka 5.
2. Mencari ukuran disperse seperti standard deviation, variance.
Variance dari sejumlah observasi adalah rata-rata kuadrat deviasi data dari rata-ratanya.
Standar deviasi adalah akar (positif) dari variance.
3. Selain central tendency dan dispersion, ukuran lain yang dipakai adalah Skewness dan Kurtosis
bertujuan untuk mengidentifikasikan model distribusi dari suatu populasi. Skewness
(kelandaian/kemiringan) adalah suatu ukuran yang dapat menyatakan model distribusi dari suatu
populasi. Terbagi menjadi 3 model kurva, yaitu model positif, negatif dan simetris. Skewness
positif mengindikasikan distribusi yang condong ke kanan. Skewness negatif mengindikasikan
distribusi yang condong ke kiri. Kurtosis adalah pengukuran keruncingan distribusi. Semakin
besar kurtosis, semakin keruncingan akan didistribusikan. Kurtosis dihitung dan dilaporkan baik
sebagai absolut maupun nilai relatif. Nilai absolut selalu angka positif.
3. Histogram
Histrogram adalah chart yang terdiri dari diagram batang dengan tinggi yang berbeda-beda.
Tinggi masing-masing batang mewakili nilai frekuensi dalam kelas yang diwakili oleh diagram
batang.
1. Data Tunggal
Contoh soal:
Pengusaha Wartel Untung Terus mempunyai 15 kios wartel yang tersebar di wilayah Jakarta Barat
dan Jakarta Utara. Sang pemilik ingin melakukan riset tentang usaha yang telah Ia jalankan selama
kurang lebih 2 tahun terakhir. Bantulah pemilik Wartel Untung Terus melakukan analisa data agar
sang pemilik mendapatkan informasi yang jelas mengenai usaha nya tersebut. Berikut ini
merupakan data pendapatan tahunan Wartel Untung Terus di 15 kios selama tahun 2013:
(dalam satuan: juta )
Kios Pendapatan Kios Pendapatan Kios Pendapatan
17
1 10 6 25 11 18
2 20 7 10 12 20
3 15 8 12 13 15
4 17 9 25 14 25
5 20 10 17 15 12
Langkah-langkah pengerjaan:
1. Buka IBM SPSS Statistics 20, input data sesuai dengan tabel diatas
2. Pilih menu analyze >> descriptive statistics >> frequencies. Akan muncul windows frequencies.
Kemudian masukkan Pendapatan ke kotak variable. Display frequency tables tetap dicentang.
18
3. Pada menu statistik, pilih sesuai dengan pertanyaan soal, klik continue.
4. Pada menu chart, ada 3 Pilihan, pilih sesuai yang diperlukan (Bisa, Bar, Pie dan Histogram khusus
untuk Histogram dicentang bagian with normal curve), klik continue.
19
5. Pada menu format, pada Order by, pilih option: Ascending values (data akan menjadi urut dari
terkecil ke terbesar; artinya akan menempatkan 1 atau pria diurutan pertama output) kemudian,
Continue,OK.
6. Klik Ok
7. Interpretasi Hasil melalui Output yang sudah dihasilkan oleh aplikasi SPSS
20
Inteprestasi data dilakukan dengan cara mengamati hasil output dari aplikasi IBM SPSS, kemudian
dibuat laporan dari hasil inteprestasi data tersebut.
2. Data Berkelompok
Contoh Soal :
Data berikut menunjukkan data berat badan 30 wanita setelah melahirkan selama bulan Agustus
2014 di RSIA Kurnia Jakarta Selatan (data dalam kg)
21
2. Nila Minimum dan Maximum
3. Nilai Varians, Standar Deviasi
4. Nilai Kurtosis dan Skewness
5. Kuartil 1,2,3
6. Desil 7
7. Persentil 58
22
3. Pada kotak dialog Recode Into Different Variables, pindahkan variable Berat_Badan kesebelah
kanan, lalu pada Output Variable, ketik: Data1 sebagai nama variable yang baru. Pilih change dan
kemudian pilih: Old and New Values.
4. Input range: 48 through 50 kemudian pada New Value, inputkan Value: 49 sebagai nilai tengah
dari range tersebut. Setelah itu di-add di OldNew, dan seterusnya. Kemudian, klik Continue.
23
6. Pada menu Analyze, pilih Descriptive Statistics >> Frequencies.
7. Pindahkan variable Data1 ke sebelah kanan.
8. Klik Statistics, beri tanda pada ukuran yang diminta, dan klik “Values are group midpoints”,
kemudian klik Continue.
9. Pada menu Chart, pilih jenis chart yang diminta. Klik Continue
24
10. Klik OK, dan didapat Result sebagai berikut
25
Inteprestasi data dilakukan dengan cara mengamati hasil output dari aplikasi IBM SPSS,
kemudian dibuat laporan dari hasil inteprestasi data tersebut.
26
Soal Latihan
1. Seorang manajer sedang melakukan survei terhadap hasil penjualan nugget yang diproduksi
perusahaannya selama setahun ini. Berikut adalah total jumlah bungkus nugget yang diproduksi
setiap bulan (dalam ribuan).
Bulan 1 2 3 4 5 6 7 8 9 10 11 12
Total 12 15 26 31 28 21 36 46 32 18 12 10
Tentukan berikut ini :
a. Nilai mean, median, modus
b. Nilai maksimum dan minimum
c. Nilai simpangan baku dan simpangan ragam
d. Nilai kurtosis dan skewness
e. Kuartil 3
f. Desil 7 dan Persentil 85
2. PT EXIS Indonesia sedang melakukan riset terhadap sejumlah pelanggannya tentang kuota
internet yang digunakan selama 1 bulan. Hal ini menjadi tanggung jawab Ardian sebagai staff
R&D di perusahaan tersebut sehingga untuk melakukan riset Ia mengambil sampel pelanggan
sebagai berikut:
3.2GB 1GB 2GB 2.3GB 3GB 1.5GB 4.5GB 2GB 2.5GB 4GB
1.5GB 1.5GB 5GB 1.5GB 2.5GB 1GB 2GB 3.5GB 1GB 3.2GB
27
70 80 90 95 75 92
65 79 87 85 64 68
82 81 65 93 80 75
68 70 75 55 58 77
96 67 86 77 70 79
60 75 78 65 70 89
Tentukanlah:
a. Jumlah dan lebar kelas
b. Mean, Median, Modus, Minimum, Maximum,
c. Simpangan baku dan ragam
d. Q1, Q3, P65, D2, D8
4. Berikut adalah hasil sensus penduduk Indonesia tahun 2009 mengenai usia laki-laki dan
perempuan yang resmi menikah untuk pertama kalinya. Sebanyak 10 sampel diambil dari
populasi laki-laki dan perempuan yang berdomisili di Kota Jakarta.
Hasil data sensus pada tahun 2009
Jumlah Laki-laki Jumlah Perempuan
1 30 1 22
2 25 2 20
3 27 3 21
4 35 4 19
5 33 5 25
6 40 6 27
7 27 7 30
8 26 8 28
9 28 9 27
10 30 10 26
11 26 11 25
12 25 12 22
13 29 13 19
14 31 14 23
28
15 33 15 22
29
PERTEMUAN 2
VALIDITAS, RELIABILITAS, NORMALITAS
Salah satu instrumen yang sering dipakai dalam penelitian ilmiah adalah kuesioner, yang
bertujuan untuk mengetahui pendapat seseorang mengenai suatu hal. Sebuah kuesioner dapat
disusun dengan pertanyaan yang bersifat terbuka (berapa usia anda saat ini, bagaimana pendapat
Anda tentang Universitas Bina Nusantara) atau pertanyaan tertutup seperti (kategori usia anda :
<20 tahun atau > 20 tahun). Salah satu skala yang sering dipakai dalam penyusunan kuesioner
adalah skala likert (lihat pada penjelasan skala likert).
Dalam penelitian kualitatif yang menggunakan instrumen kuesioner sebagai salah satu
alat ukur, ada dua syarat penting yang harus dipenuhi, yaitu keharusan sebuah kuesioner untuk
Valid dan Reliabel (syarat lainnya, yaitu Tingkat ketelitian tidak dibahas pada modul ini).
Suatu kuesioner dikatakan Valid jika pertanyaan pada suatu kuesioner mampu untuk
mengungkapkan sesuatu yang akan diukur oleh kuesioner tersebut. Sedangkan suatu angket
dikatakan reliabel (andal) jika jawaban seseorang terhadap pertanyaan adalah konsisten atau stabil
dari waktu ke waktu.
Menurut Ferdinand (2014) mengatakan bahwa sebuah scale atau instrument pengukuran
data yang dihasilkan terpercaya atau reliable apabila instrument itu secara konsisten memunculkan
hasil yang sama setiap kali dilakukan pengukuran oleh karena itu tujuan dilakukan pengujian
realibilitas menurut Sarjono (2011) adalah untuk mengukur konsistensi dari tidaknya jawaban
setiap responden terhadap item-item pernyataan yang berada di dalam kuesioner yang sudah
disebarkan itu dapat terpecaya atau reliable.
Repeated Measure atau ukur ulang. Disini seseorang akan disodori pertanyaan yang sama
pada waktu berbeda, dan kemudian dilihat apakah dia tetap konsisten dengan jawabannya.
30
One short atau sekali saja. Di sini pengukuran hanya sekali dan kemudian hasilnya
dibandingkan dengan hasil pertanyaan lain.
1. Menetapkan sebuah Konstrak, yaitu membuat batasan mengenai variabel yang akan diukur.
Jika ingin diteliti mengenai perilaku konsumen, maka perlu dipertegas dahulu apa yang
dimaksud dengan perilaku konsumen tersebut.
2. Menetapkan faktor-faktor, yaitu mencoba menemukan unsur-unsur yang ada pada suatu
konstrak.
3. Menyusun butir-butir pertanyaan, yaitu mencoba menjabarkan sebuah faktor lebih lanjut
dalam berbagai pertanyaan yang langsung berinteraksi dengan pengisi kuesioner. Dalam
setiap konstrak bisa terdiri dari beberapa faktor, dan setiap faktor bisa terdiri dari beberapa
butir pertanyaan, dengan catatan bahwa bisa juga setiap faktor mempunyai jumlah butir yang
tidak sama satu sama dengan yang lain.
Pengujian validitas dan reliabilitas adalah proses menguji butir-butir pertanyaan yang ada dalam
sebuah kuesioner, apakah isi dari butir pertanyaan tersebut sudah valid dan reliabel.
Contoh :
Marcella akan melakukan penelitian untuk melihat hubungan antara kegiatan promosi yang
dilakukan terhadap tingkat loyalitas pelanggan terhadap perusahaan. Oleh karena itu, Marcella
menyebarkan kuesioner kepada 60 responden dengan 4 butir pertanyaan dalam mengukur tingkat
loyalitas mereka dan 3 butir pertanyaan dalam mengukur efektifitas kegiatan promosi. Berikut
merupakan hasil dari kuesioner :
R L1 L2 L3 L4 P1 P2 P3
R1 4 3 4 5 3 4 5
R2 5 4 5 4 4 5 4
R3 4 4 5 3 2 5 3
R4 5 5 5 3 5 5 3
31
R5 4 4 4 3 4 4 3
R6 3 5 5 4 4 5 4
R7 2 3 2 3 3 2 3
R8 2 3 2 3 3 2 3
R9 3 5 4 3 3 3 3
R10 4 3 3 2 5 3 2
R11 4 4 4 4 3 4 4
R12 4 3 3 3 4 3 3
R13 5 5 4 3 3 4 3
R14 5 5 3 3 4 3 3
R15 4 4 4 4 4 4 4
R16 4 4 4 4 4 4 4
R17 5 4 5 5 5 5 5
R18 4 4 4 4 3 4 4
R19 3 2 4 3 2 4 3
R20 4 3 4 3 2 4 3
R21 3 4 4 3 3 4 3
R22 4 4 4 5 5 4 5
R23 4 4 4 3 5 4 3
R24 3 5 5 5 5 5 5
R25 4 4 4 3 3 4 3
R26 3 2 3 3 4 3 3
R27 3 3 4 4 4 4 4
R28 2 3 3 2 3 3 2
R29 2 3 3 4 4 3 4
R30 3 3 4 4 3 4 4
R31 3 4 4 5 3 4 5
R32 2 4 4 3 4 4 3
R33 2 4 3 2 4 3 2
R34 2 4 2 4 3 2 4
R35 3 4 4 4 3 4 4
R36 3 3 3 3 4 3 3
R37 4 4 4 3 2 4 3
R38 4 5 4 4 5 4 4
R39 3 3 2 2 2 2 2
R40 3 4 4 3 2 4 3
R41 3 2 3 3 4 3 3
R42 5 4 4 4 4 4 4
R43 4 4 4 4 5 4 4
R44 3 3 4 5 5 4 5
R45 3 4 3 3 3 3 3
R46 4 4 3 3 5 3 3
R47 2 3 4 4 4 4 4
R48 5 5 3 4 4 3 4
R49 3 4 3 5 5 3 5
R50 5 5 4 4 5 4 4
32
R51 3 4 4 4 5 4 4
R52 2 3 3 4 4 3 4
R53 3 4 4 3 2 4 3
R54 3 4 4 5 2 4 5
R55 4 5 4 4 5 4 4
R56 3 3 4 5 5 4 5
R57 3 4 5 5 5 5 5
R58 4 4 4 4 3 4 4
R59 5 5 5 5 4 5 5
R60 3 3 3 4 3 3 4
Dari hasil kuesioner tersebut lakukanlah pengujian apakah data tersebut valid dan reliabel.
Untuk melakukan pengujian validitas dan reliabilitas, data harus di run per variabel.
Untuk menguji validitas sebuah kuesioner, diperlukan perhitungan Rhitung dan Rtabel. Langkah-
langkah untuk mencari Rtabel adalah sebagai berikut:
33
2. Pilih menu Transform, kemudian pilih submenu Compute Variable.
34
3. Pada window Compute Variable, lakukan pengisian sebagai berikut:
Pada Function group pilihlah Inverse DF, kemudian pada Function and Special Variables
double klik Idf.T
4. Tanda tanya (?) pertama pada kolom Numeric Expression diisi dengan probability, dimana pada
soal ini berarti (1 – α = 1 – 0,05 = ) 0,95. (diinput 0.95)
5. Tanda tanya (?) kedua pada kolom Numeric Expression diisi dengan df, dimana pada soal ini
berarti (n – 2) =60 -2 = 58. Tampilan akan seperti dibawah ini.
35
8. Ganti huruf t pada Target variable dengan huruf r.
9. Hapus Numeric Expression dan ganti sesuai dengan rumus:
t/sqrt(df+t**2)
yang berarti pada kasus ini diisi: t/sqrt(86+t**2)
10. Tampilan akan seperti dibawah ini.
11. Klik OK dan akan muncul kolom r di data view. Itulah nilai Rtabel.
36
2. Pada window Reliability Analysis lakukan pengisian sebagai berikut:
Masukkan semua variabel (L1-L4) ke kotak Items yang ada di sebelah kanan.
Klik menu Statistics, dana ada bagian Descriptive for (kiri atas), centang ketiga pilihan
(Item, Scale, Scale if item deleted), kemudian klik Continue untuk kembali ke window
utama.
N %
Valid 60 100.0
Cases Excludeda 0 .0
Total 60 100.0
37
a. Listwise deletion based on all variables in the
procedure.
Reliability Statistics
Cronbach's N of Items
Alpha
.684 4
Item Statistics
L1 3.4667 .92913 60
L2 3.8000 .79830 60
L3 3.7500 .77295 60
L4 3.6667 .85701 60
Item-Total Statistics
Scale Statistics
4. Interpretasi hasil
38
Seperti telah dijelaskan, pengujian dimulai dengan menguji validitas kuesioner, baru
kemudian reliabilitas kuesioner tersebut.
Setelah uji validitas selesai dilakukan, lakukan uji reliabilitas dengan menggunakan output
terakhir dan membandingkan Rtabel dengan Cronbach’s Α (Rα) pada tabel Reliability Statistics.
1. Menentukan hipotesis
3. Mencari R α
4. Mengambil keputusan
Jika R α < r tabel, maka butir atau variabel tersebut tidak reliabel.
Lakukan lagi pengujian reliabilitas untuk variabel Kualitas Produk dan Loyalitas
Pelanggan.
Uji normalitas dilakukan untuk mengetahui apakah distribusi data mengikuti atau
mendekati distribusi normal atau tidak (Sarjono dan Julianita, 2011: 53). Pada dasarnya uji
normalitas adalah membandingkan antara data yang kita miliki dan data berdistribusi normal yang
memiliki mean dan standar deviasi yang sama dengan data kita. Uji normaltias menjadi hal yang
penting karena salah satu syarat pengujian parametrik adalah data harus berdistribusi normal.
Menurut Budiawan (2012: 58), secara teoritis, semakin besar jumlah sampel, maka data akan
cenderung berdistribusi normal. Uji ini biasanya digunakan untuk mengukur data berskala ordinal,
interval, maupun rasio.
Berikut merupakan Dasar Pengambilan Keputusan (DPK) dalam Uji Normalitas (α dalam
penelitian ini sebesar 5% 0,05) :
39
Untuk jumlah responden 50 lihat sig pada table Shapiro Wilk
Untuk jumlah responden > 50 lihat sig pada table Kolmogorov Smirnov
Contoh soal :
Edwin merupakan mahasiswa Binus University yang sedang skripsi mengenai analisa
pengaruh perubahan logo dan nama produk terhadap brand awareness. Sebagai data
penelitiannya Edwin melakukan penyebaran kuesioner kepada 60 responden. Sebelum
mengolah hasil dari kuesioner, Edwin ingin mengetahui distribusi data dari hasil kueisoner
yang diperoleh. Berikut merupakan hasilnya :
Brand
Logo Nama
Awareness
2.60 2.80 3.75
2.60 2.40 4.75
3.60 3.20 2.75
3.40 4.00 3.50
3.80 4.00 3.25
3.40 3.20 3.25
4.00 3.80 4.25
4.00 3.20 2.50
4.40 4.40 2.25
4.00 3.80 3.25
4.60 4.40 2.50
4.80 4.40 3.25
3.80 3.60 2.75
2.80 2.80 3.50
4.00 4.00 3.75
4.00 4.00 3.75
4.80 4.40 3.25
3.80 3.60 2.75
2.80 2.80 3.50
3.20 3.20 3.25
3.40 3.40 2.50
4.40 4.40 2.25
4.00 3.80 3.25
4.60 4.40 2.50
40
3.60 3.60 3.25
4.40 3.80 3.00
4.00 4.20 2.50
4.40 4.20 2.25
3.60 3.40 3.25
3.40 3.40 2.75
3.80 4.00 4.25
3.40 3.60 2.75
3.00 3.00 2.75
3.00 3.00 4.00
3.60 3.40 3.50
3.20 3.00 2.25
4.40 3.80 3.00
4.00 4.20 2.50
4.40 4.20 2.25
3.60 3.40 3.25
4.40 3.80 3.00
4.00 4.20 2.50
4.20 4.20 3.25
4.00 3.60 3.25
3.20 3.20 4.75
4.40 3.80 3.00
4.00 4.20 2.50
4.40 4.20 2.25
4.00 4.20 5.00
4.60 4.20 3.75
3.60 3.80 2.75
3.40 3.40 3.00
4.40 3.80 3.00
4.00 4.20 2.50
4.40 4.20 2.25
3.60 3.40 3.25
4.40 4.20 3.00
4.60 4.40 3.75
3.80 4.20 4.25
3.60 3.60 3.50
Langkah-langkah:
41
1. Input data di atas pada SPSS
42
3. Masukkan variabel Logo, Nama, dan Brand Awareness pada kotak Dependent List.
4. Pada menu Plots, centang opsi “Normality plots with tests” dan kosongkan opsi yang lain dan
tekan Continue.
5. Pada bagian Display (kiri bawah), pilihlah opsi Plots dan klik OK.
43
6. Hasil output:
Tests of Normality
Kolmogorov-Smirnova Shapiro-Wilk
7. Setelah melakukan analisa pada SPSS hingga mendapatkan hasilnya, kita dapat melanjutkan pada
interpretasi data sebagai berikut:
44
Soal Latihan
1. Fernanda ingin mengetahui mengenai tingkat brand awareness produknya di pasar. Oleh karena
itu, Ia akan melakukan penelitian berdasarkan hasil kuesioner yang akan disebarkan kepada 60
orang responden. Kuesioner yang disebarkan meliputi 2 indikator utama sebagai pengukur
tingkat brand awareness yaitu recall dan recognition.
Berikut merupakan hasil dari kuesioner yang telah disebarkan :
Recall 1 Recall 2 Recognition 1 Recognition 2 Recognition 3
1 1 2 4 1
2 1 3 4 2
3 4 7 1 3
1 3 4 2 1
1 3 4 1 1
4 4 8 3 4
4 4 8 2 4
1 2 3 2 1
3 4 7 3 3
2 3 5 4 2
2 3 5 2 2
3 3 6 2 3
2 3 5 1 2
3 3 6 2 3
4 2 6 1 4
2 1 3 4 2
2 1 3 3 2
1 1 2 3 1
2 3 5 3 2
3 4 7 2 3
4 4 8 1 1
2 4 6 1 2
1 1 2 4 3
2 2 4 3 1
3 1 4 3 1
45
4 3 7 4 4
2 2 4 4 4
2 2 4 2 1
2 3 5 4 3
3 4 7 3 2
2 2 4 3 2
1 2 3 3 3
1 1 2 3 2
3 2 5 3 3
2 1 3 2 4
4 4 8 1 2
4 3 7 1 2
4 3 7 1 1
4 3 7 3 2
1 2 3 4 3
4 4 8 1 4
4 4 8 2 4
4 3 7 3 3
4 2 6 3 2
2 3 5 4 3
2 3 5 4 3
3 4 7 3 4
1 3 4 3 3
2 4 6 4 4
3 4 7 4 4
4 4 8 4 4
3 4 7 3 4
2 1 3 2 1
2 2 4 3 2
3 3 6 4 3
4 2 6 3 2
1 1 2 1 1
46
2 1 3 2 1
1 2 3 3 2
2 4 6 1 4
Lakukanlah pengujian validitas, reliabilitas dan normalitas dari hasil kuesioner diatas!
P1 P2 P3 P4 P5 P6
Setuju Setuju Setuju Setuju Setuju Setuju
Ragu-ragu Ragu-ragu Ragu-ragu Ragu-ragu Ragu-ragu Ragu-ragu
Setuju Setuju Setuju Setuju Setuju Setuju
Setuju Ragu-ragu Setuju Setuju Setuju Ragu-ragu
Ragu-ragu Ragu-ragu Ragu-ragu Ragu-ragu Ragu-ragu Ragu-ragu
Ragu-ragu Ragu-ragu Setuju Ragu-ragu Ragu-ragu Ragu-ragu
Setuju Setuju Setuju Setuju Setuju Setuju
Sangat Setuju Setuju Setuju Setuju Setuju Setuju
Ragu-ragu Ragu-ragu Ragu-ragu Setuju Setuju Ragu-ragu
Setuju Setuju Setuju Setuju Setuju Setuju
Setuju Setuju Setuju Setuju Setuju Setuju
Ragu-ragu Ragu-ragu Ragu-ragu Ragu-ragu Ragu-ragu Ragu-ragu
Setuju Setuju Setuju Ragu-ragu Setuju Setuju
Setuju Setuju Setuju Setuju Setuju Ragu-ragu
Ragu-ragu Ragu-ragu Ragu-ragu Setuju Ragu-ragu Ragu-ragu
Ragu-ragu Ragu-ragu Ragu-ragu Ragu-ragu Ragu-ragu Setuju
Setuju Setuju Setuju Setuju Setuju Setuju
Ragu-ragu Ragu-ragu Ragu-ragu Ragu-ragu Ragu-ragu Setuju
Ragu-ragu Ragu-ragu Ragu-ragu Ragu-ragu Ragu-ragu Setuju
Setuju Ragu-ragu Setuju Ragu-ragu Ragu-ragu Setuju
Setuju Ragu-ragu Ragu-ragu Ragu-ragu Ragu-ragu Ragu-ragu
Setuju Setuju Setuju Setuju Setuju Setuju
47
Ragu-ragu Ragu-ragu Setuju Setuju Ragu-ragu Setuju
Setuju Ragu-ragu Setuju Setuju Ragu-ragu Ragu-ragu
Setuju Setuju Setuju Setuju Setuju Ragu-ragu
Setuju Setuju Setuju Setuju Setuju Setuju
Setuju Setuju Setuju Setuju Setuju Ragu-ragu
Tidak Tidak Tidak
Tidak Setuju Ragu-ragu Setuju
Setuju Setuju Setuju
Tidak
Setuju Setuju Setuju Setuju Tidak Setuju
Setuju
Setuju Setuju Setuju Setuju Setuju Setuju
48
PERTEMUAN 3
ASUMSI KLASIK
Persamaan regresi perlu meyakinkan linearitasnya dan memenuhi tingkat validitas, ketepatan
dalam estimasi, tidak bias dan konsisten yang diharapkan untuk memenuhi peramalan. Hal ini
membutuhkan uji asumsi klasik dengan menggunakan Uji Normalitas, Uji Multikolinearitas, Uji
Heterokedastisitas, dan Uji Autokorelasi. Namun tidak semua uji asumsi klasik yang dilakukan
diperlukan dalam uji Regresi Berganda.
Uji multikolinearitas digunakan untuk menguji apakah dalam model regresi ditemukan adanya
korelasi yang tinggi atau sempurna antar variabel independen. Hal ini menunjukkan bahwa uji
multikolinearitas dilakukan untuk mengukur tingkat asosiasi hubungan/pengaruh antar variable
bebas dengan menggunakan besaran koefisien relasi (r). Jika antar variabel independen terjadi
multikolinearitas sempurna,maka koefisien regresi variabel tersebut tidak dapat ditentukan dan
nilai standard error menjadi tak terhingga. Dalam hal ini, model regresi linear berganda
mengasumsikan bahwa tidak terdapat korelasi yang signifikan antarvariabel bebasnya.
Contoh soal:
Seorang ekonom di PT. Abadi Jaya ingin mengadakan penelitian tentang apa saja faktor yang
mempengaruhi minat pelanggan dalam membeli sebuah produk. Berikut ini adalah data yang
berhasil dikumpulkan dari hasil survey terhadap 30 orang responden yang merupakan konsumen
produk tersebut.
Minat
Rekomendasi
Iklan di Membeli
Orang Lain
Media Produk
2.25 3.50 3.27
3.75 4.00 2.59
4.00 3.75 3.71
2.50 3.50 4.15
3.35 2.50 3.86
2.55 3.50 2.15
3.75 3.50 4.00
2.25 2.75 3.14
3.00 3.50 2.15
49
3.25 3.50 2.75
2.15 2.75 3.00
3.60 3.00 3.25
2.86 4.00 3.77
3.15 3.50 2.86
2.25 3.75 3.22
2.75 3.50 3.75
3.25 3.25 3.50
3.35 3.75 2.75
2.15 2.00 2.86
2.85 3.00 3.25
3.86 3.75 3.80
4.00 3.75 4.15
2.75 3.00 3.25
2.86 2.75 2.86
3.15 4.00 4.13
3.50 3.25 3.75
3.25 3.75 2.15
2.78 3.00 3.23
2.85 3.25 3.00
3.15 3.50 2.75
Langkah-langkah:
7. Input data di atas pada SPSS
50
8. Lakukan uji normalitas terlebih dahulu. Pada menu Analyze, pilih Descriptive Statistics, kemudian
pilih Explore.
9. Masukkan variable Iklan media, Rekomendasi orang lain, dan Minat membeli pada kotak
Dependent List.
10. Pada menu Plots, centang opsi “Normality plots with tests” dan kosongkan opsi yang lain dan
tekan Continue.
51
11. Pada bagian Display (kiri bawah), pilihlah opsi Plots dan klik OK.
52
NB : Buat juga interpretasi hasil uji normalitas untuk variabel Rekomendasi Orang Lain
dan Minat Membeli Produk.
2. Dari menu utama SPSS, pilih menu Analyze, kemudian submenu Regression, lalu pilih Linear.
Maka akan muncul kotak dialog sebagai berikut.
Masukkan variabel yang dipengaruhi (dependen) dan variabel yang mempengaruhi (independen)
ke kotaknya masing-masing.
3. Pilih Statistics. Kemudian Checklist Estimates, Covariance Matrix (meminta matrik korelasi antar
variabel independen), Model Fit (meminta koefisien determinasi R2), Part and Partial correlation
(meminta korelasi parsial dan zero order correlation) dan Colinearity diagnostics (meminta nilai
tolerance dan VIF).
53
4. Klik OK. Berikut hasil output SPSS
Coefficientsa
Model Unstandardized Standardized t Sig. Correlations Collinearity
Coefficients Coefficients Statistics
B Std. Beta Zero- Partial Part Tolerance VIF
Error order
(Constant) 2.442 .833 2.931 .007
Iklan_Media .288 .221 .269 1.301 .204 .260 .243 .242 .809 1.237
1
-
Rekomendasi_Orang_Lain -.025 .256 -.020 -.096 .924 .098 -.019 .809 1.237
.018
a. Dependent Variable: Minat_Membeli
Untuk mengetahui keadaan dimana terjadinya ketidaksamaan varians dari data pada model regresi,
maka perlu dilakukan uji heteroskedastisitas.
54
Pengujian dilakukan dengan mencari korelasi antara nilai residual dengan variable bebasnya. Jika
ditemukan adanya korelasi antara variable bebas dengan nilai residual, maka dapat disimpulkan
terjadi heterokedastisitas.
Masih menggunakan data yang digunakan sebelumnya yaitu mengenai Iklan di Media,
Rekomendasi Orang Lain, dan Minat Membeli Produk. Berikut langkah-langkah uji
heteroskedastisitas :
1. Dari menu utama SPSS, pilih menu Analyze, kemudian submenu Regression, lalu pilih Linear.
Maka akan muncul kotak dialog sebagai berikut.
Masukkan variabel yang dipengaruhi (dependen) dan variabel yang mempengaruhi (independen)
ke kotaknya masing-masing.
2. Pilih Save kemudian pada bagian Residuals pilih Unstandardized (Untuk memunculkan nilai
residual).
55
Lalu klik Continue>> OK. Hasil akan muncul di input SPSS.
3. Setelah muncul nilai residual, dilanjukan dengan analisis korelasi. Pilih menu Analyze
>>Correlate>>Bivariate.
4. Pindahkan variabel independen (dalam kasus ini adalah Iklan di Media dan Rekomendasi Orang
Lain) dan Unstandardized Residuals ke kotak variabel. Kemudian centang Spearman pada
Coefficient Correlation.
56
5. Klik OK.
Correlations
Iklan_Media Rekomendasi_Orang_Lain Unstandardized
Residual
Correlation
1.000 .418* .027
Coefficient
Iklan_Media Sig. (2-
. .022 .887
tailed)
N 30 30 30
Correlation
.418* 1.000 .106
Spearman's Coefficient
rho Rekomendasi_Orang_Lain Sig. (2-
.022 . .578
tailed)
N 30 30 30
Correlation
.027 .106 1.000
Coefficient
Unstandardized Residual
Sig. (2-
.887 .578 .
tailed)
57
N 30 30 30
*. Correlation is significant at the 0.05 level (2-tailed).
Uji autokorelasi bertujuan untuk menguji apakah dalam suatu model regresi linear ada korelasi
antar kesalahan pengganggu (residual) pada periode t dengan kesalahan periode t-1 (sebelumnya).
Jika terjadi korelasi, maka dinamakan ada problem autokorelasi. Autokorelasi muncul karena
observasi yang berurutan sepanjang waktu berkaitan satu sama lainnya. Autokorelasi sering
muncul pada data time series. Sedangkan pada data cross section, masalah autokorelasi relative
jarang terjadi. Dalam penelitian ini akan digunakan metode pengujian Run Test. Run Test
digunakan untuk menguji apakah antar residual terdapat korelasi yang tinggi. Jika ya, maka terjadi
masalah autokorelasi.
Dalam menentukan ada tidaknya auto korelasi, diperlukan beberapa pertimbangan untuk
menentukan adanya masalah atau tidaknya autokorelasi, yakni:
Bila nilai DW berada di antara dU sampai dengan 4 - dU maka koefisien autokorelasi sama
dengan nol. Artinya, tidak ada autokorelasi.
Bila nilai DW lebih kecil daripada dL, koefisien autokorelasi lebih besar daripada nol.
Artinya ada autokorelasi positif.
Bila nilai DW terletak di antara dL dan dU, maka tidak dapat disimpulkan.
Bila nilai DW lebih besar daripada 4 - dL, koefisien autokorelasi lebih besar daripada nol.
Artinya ada autokorelasi negatif.
Bila nilai DW terletak di antara 4 – dU dan 4- dL, maka tidak dapat disimpulkan.
Pertimbangan di atas dilakukan dengan uji Durbin-Watson (DW test) dan biasanya hal ini hanya
digunakan untuk autokorelasi tingkat satu (first order autocorrelation) dan mensyaratkan adanya
intercept dalam model regresi dan tidak ada variable lag di antara variable penjelas.
Masih menggunakan data yang digunakan sebelumnya yaitu mengenai Iklan di Media,
Rekomendasi Orang Lain, dan Minat Membeli Produk. Berikut langkah-langkah melakukan uji
autokorelasi dengan menggunakan Run Test :
1. Pilih menu Analyze >> Nonparametric tests >> Legacy dialogs >>Runs.
58
2. Pada kotak Test Variable List, isikan Unstandardized Residual (RES_1). Pilih Cut Point Median.
Runs Test
Unstandardiz
ed Residual
Test Valuea .07522
59
Cases < Test Value 15
Cases >= Test
15
Value
Total Cases 30
Number of Runs 14
Z -.557
Asymp. Sig. (2-
.577
tailed)
a. Median
Note :
Uji asumsi klasik adalah persyaratan statistik yang harus dipenuhi pada analisis regresi linear
berganda yang berbasis ordinary least square (OLS). Jadi analisis regresi yang tidak berdasarkan
OLS tidak memerlukan persyaratan asumsi klasik, misalnya regresi logistik atau regresi ordinal.
Demikian juga tidak semua uji asumsi klasik harus dilakukan pada analisis regresi linear, misalnya
uji multikolinearitas tidak dilakukan pada analisis regresi linear sederhana dan uji autokorelasi
tidak perlu diterapkan pada data cross sectional. Ketika asumsi tidak terpenuhi, biasanya peneliti
menggunakan berbagai solusi agar asumsinya dapat terpenuhi atau beralih ke metode yang lebih
advance agar asumsinya dapat terselesaikan.
Uji asumsi klasik juga tidak perlu dilakukan untuk analisis regresi linear yang bertujuan untuk
menghitung nilai pada variabel tertentu. Misalnya nilai return saham yang dihitung dengan market
model, atau market adjusted model. Perhitungan nilai return yang diharapkan dapat dilakukan
dengan persamaan regresi, tetapi tidak perlu diuji asumsi klasik.
60
SOAL LATIHAN
1.Seorang mahasiswi Ilmu Komunikasi sedang melakukan penelitian terkait dengan faktor – faktor yang
mempengaruhi partispasi politik di masyarakat. Dan berikut adalah hasil yang didapatkan dari penelitian
kepada 30 orang responden.
61
26 3.13 3.5 3.24 4.15
27 4.04 4.5 4.14 3.85
28 2.96 3 2.89 3.13
29 3.58 3.75 3.25 4.25
30 3.71 3.5 3.18 3.78
Lakukanlah pengujian asumsi klasik (uji multikolinieritas, uji heterokedastisitas, dan uji
korelasi) untuk data di atas!
2.Serena merupakan salah satu pemilik restoran dan coffeeshop terbaru di wilayah kota Tangerang.
Serena sedang melakukan penlitian, faktor-faktor apa saja yang mempengaruhi para konsumen untuk
kembali ke coffee shop miliknya. Berikut data yang terkumpul:
1 4 3 2 5 2 3
2 3 4 3 5 3 4
3 2 5 5 2 5 2
4 5 2 2 2 2 4
5 2 3 4 4 4 4
6 4 4 2 3 2 3
7 3 4 2 5 2 5
8 5 5 3 2 3 5
9 2 2 4 3 4 3
10 5 3 2 2 2 2
11 4 2 5 4 5 5
12 2 3 5 4 2 2
13 5 3 2 3 5 3
14 5 5 5 5 5 4
15 2 4 4 5 5 5
16 3 2 3 2 3 2
17 2 5 2 3 2 5
18 4 3 5 5 4 5
62
19 4 2 5 3 2 2
20 2 5 2 2 3 3
21 2 3 4 5 5 2
22 5 4 5 5 2 4
23 3 2 5 2 4 5
24 4 5 3 3 2 2
25 5 3 3 5 5 5
26 5 4 2 3 2 3
27 5 2 4 2 2 4
28 4 4 3 5 4 2
29 3 5 2 3 3 5
30 5 3 2 2 2 5
63
PERTEMUAN 4
KORELASI
Korelasi adalah hubungan (asosiasi) antara variabel-variabel yang diminati, apakah data
sampel menyediakan bukti yang cukup, dengan maksud adakah kaitan atau hubungan antara
tiap-tiap variabel dalam populasi asal sampel, jika ada hubungan, seberapa kuat hubungan antar
variabel tersebut. Keeratan hubungan itu dinyatakan dengan nama koefisien korelasi atau bisa
disebut korelasi saja. Perlu dicatat, bahwa dalam korelasi kita belum menentukan dengan pasti
variabel independent dan dependent-nya seperti yang kita lakukan dalam analisis regresi.
Koefisien Korelasi ialah pengukuran statistic kovarian atau asosiasi antara dua variabel.
Besarnya koefesien korelasi berkisar antara +1 s/d -1. Koefesien korelasi menunjukkan tingkat
kekuatan (strength) hubungan linear dan arah hubungan antara dua variabel acak.
Jika koefesien korelasi positif, maka kedua variabel mempunyai hubungan yang searah.
Artinya jika nilai variabel X tinggi, maka nilai variabel Y akan tinggi pula.
Sebaliknya, jika koefesien korelasi negatif, maka kedua variabel mempunyai hubungan yang
terbalik. Artinya jika nilai variabel X tinggi, maka nilai variabel Y akan menjadi rendah dan
berlaku sebaliknya.
Untuk memudahkan melakukan interpretasi mengenai kekuatan hubungan antara dua variabel
penulis memberikan kriteria sebagai berikut (Sarwono: 2006):
0 : Tidak ada korelasi antara dua variabel
>0 – 0,25 : Korelasi sangat lemah
>0,25 – 0,5 : Korelasi cukup
>0,5 – 0,75 : Korelasi kuat
>0,75 – 0,99 : Korelasi sangat kuat
1 : Korelasi sempurna
Contoh soal: menggunakan data Export, Government Expenditure, dan GDP
Apakah Terdapat hubungan yang signifikan antara Export dengan GDP?
64
3,55 5,35 3,54
5,34 4,44 4,44
5,35 4,33 3,34
4,45 5,35 4,45
4,34 4,53 3,55
3,45 3,53 3,33
4,55 5,35 5,33
3,45 5,34 3,45
5,55 3,33 4,53
5,34 4,53 3,54
3,35 5,34 5,55
3,35 4,35 3,43
4,45 3,35 4,33
5,35 5,53 3,53
5,35 5,55 3,43
3,34 5,35 3,44
3,44 5,44 4,55
3,33 4,45 3,35
3,43 5,45 4,45
5,43 4,53 4,35
5,43 3,44 3,35
3,33 5,34 5,45
5,45 5,53 5,45
5,34 4,34 5,33
5,43 5,54 4,55
3,55 5,53 4,55
3,33 4,55 5,54
5,54 4,55 3,34
5,44 4,55 3,54
4,34 5,53 4,53
5,45 3,45 4,55
3,55 4,44 5,53
65
5,54 5,55 3,34
4,45 4,33 4,45
5,35 4,44 3,35
5,53 4,43 4,54
5,33 4,33 5,55
4,43 4,44 4,34
5,33 5,33 5,35
5,44 3,55 4,43
4,54 5,33 4,33
3,44 5,54 4,44
3,53 3,44 4,55
5,45 5,34 5,34
4,43 5,55 4,44
3,34 5,53 3,33
3,44 5,35 5,44
Adalah mengukur keeratan hubungan pada hasil-hasil pengamatan dari populasi yang mempunyai
dua varian saja (bivariate). Perhitungan ini memiliki syarat bahwa populasi asal sampel harus
mempunyai dua varian dan harus berdistribusi normal. Korelasi yang digunakan adalah korelasi
pearson (Pearson correlation pada tabel “Correlations”) dimana untuk mengukur korelasi data
interval dan rasio.
66
2. Untuk melakukan pengujian kolerasi, maka pilihlah menu Analyze – Correlate – Bivariate.
67
4. Klik bagian tombol Option sehingga muncul layar dibawah ini.
Keterangan :
o Pada bagian Statistics merupakan pilihan yang digunakan untuk menampilkan statistik
deskritif ringkas dari data-data yang akan dikolerasi.
o Pada bagian Missing values atau perlakuan kolerasi sehubungan dengan adanya data yang
tidak tersedia pada kasus, SPSS menyediakan 2 alternatif perlakuan :
Exclude cases pairwise, yaitu pasangan yang salah satu tidak ada datanya tidak akan
dimasukkan dalam perhitungan.
Exclude cases listwise, yaitu data yang tidak dimasukkan dalam perhitungan adalah data
yang hilang atau missing data.
5. Untuk keseragaman maka yang digunakan adalah pairwise, kemudian tekan Continue – Ok.
Setelah di ok, maka akan muncul result seperti gambar dibawah ini.
68
Descriptive Statistics
Mean Std. N
Deviation
GOVERNMENT_EXP
4.7202 .75666 50
ENDITURE
Correlations
EXPO GOVERN GDP
RT MENT_EX
PENDITU
RE
EXPORT Pearson 1 -.258 -.044
Correlation
Sig. (2-tailed) .071 .761
N 50 50 50
GOVERNMENT_E Pearson -.258 1 .025
XPENDITURE Correlation
Sig. (2-tailed) .071 .864
N 50 50 50
GDP Pearson -.044 .025 1
Correlation
Sig. (2-tailed) .761 .864
N 50 50 50
69
4.2 Korelasi Partial
Contoh soal : menggunakan data Export, Government Expenditure, dan GDP. Nita ingin
mengetahui apakah terdapat hubungan antara GDP dengan Government Expenditure dan Export
sebagai variabel pengontrol.
Langkah – langkah pengujian dalam spss :
1. Masukkan data seperti contoh sebelumnya.
2. Untuk melakukan pengujian kolerasi, maka pilihlah menu Analyze – Correlate – Partial.
3.Pindahkan variable Facility dan Purchase Intention kebagian Variablesdan variable Store Image
ke bagian Controlling for.
70
4. Klik bagian tombol Option sehingga muncul layar dibawah ini
Keterangan :
o Pada bagian Statistics merupakan pilihan yang digunakan untuk menampilkan statistik
deskritif ringkas dari data-data yang akan dikolerasi
o Pada bagian Missing values atau perlakuan kolerasi sehubungan dengan adanya data yang
tidak tersedia pada kasus, SPSS menyediakan 2 alternatif perlakuan :
Exclude cases pairwise, yaitu pasangan yang salah satu tidak ada datanya tidak akan
dimasukkan dalam perhitungan.
Exclude cases listwise, yaitu data yang tidak dimasukkan dalam perhitungan adalah data
yang hilang atau missing data
5. Untuk keseragaman maka yang digunakan adalah pairwise, kemudian tekan Continue – Ok.
Setelah di ok, maka akan muncul result seperti gambar dibawah ini.
71
Correlations
Control Variables GOVERN GDP EXPO
MENT_EX RT
PENDITU
RE
-none-a GOVERNMENT_E Correlation 1.000 .025 -.258
XPENDITURE Significance (2- . .864 .071
tailed)
df 0 48 48
GDP Correlation .025 1.000 -.044
Significance (2- .864 . .761
tailed)
df 48 0 48
EXPORT Correlation -.258 -.044 1.000
Significance (2- .071 .761 .
tailed)
df 48 48 0
EXPO GOVERNMENT_E Correlation 1.000 .014
RT XPENDITURE Significance (2- . .924
tailed)
df 0 47
GDP Correlation .014 1.000
Significance (2- .924 .
tailed)
df 47 0
72
Soal Latihan
1. Princess adalah Girlband baru yang tenar sejak awal November 2016. Mereka pun ingin mencari
tahu apakah ada hubungan antara penjualan CD (X) dengan jadwal magung yang
merepresentasikan tingkat popularitas mereka (Y). Berikut adalah hasil riset mereka:
X 76 60 51 86 55 93 62 87 62 98 84 55
Y 121 122 149 130 120 109 112 106 144 103 148 120
2. Ingin diketahui seberapa besar kuat hubungan antara Pendapatan seorang nelayan di Cimone
Raya dengan Pengeluarannya (DALAM RIBUAN RUPIAH/BULAN)
Pendapatan (X) :
500;1500;1200;400;500;600;1500;1250;600;700;600;400
Pengeluaran (Y) :
150;200;200;200;300;400;150;100;700;200;150;200
a. Apakah ada hubungan antara Pendapatan seorang nelayan di Cimone Raya dengan
Pengeluarannya?
b. Bagaimana Sifat Hubungannya?
3. BINUS itu saying banget sama mahasiswanya. Karena banyak mahasiswa yang kurang paham
akan mata kuliah SPSS, akhirnya dibuka pelajaran tambahan. BINUS ingin mengetahui apakah
jumlah kelas pelajaran tambahan yang dibuka memiliki hubungan dengan nilai mereka. Berikut
adalah tabelnya
73
Tambahan (X/JAM Nilai Kelas A Tambahan nilai kelas
DALAM (X/JAM DALAM B
SEMINGGU) SEMINGGU)
2 80 2 90
3 85 3 80
5 85 5 70
6 80 6 75
7 90 7 90
a. Apakah ada hubungan antara Durasi Pelajaran tambahan dengan rata rata nilai kelas A
dan kelas B?
b. Bagaimana Sifat Hubungannya antara kelas A dan kelas B?
c. Jadi kesimpulannya, apakah tahun depan perlu bikin kelas tambahan lagi atau tidak?
74
PERTEMUAN 5
REGRESI
Regresi
Analisis regresi merupakan suatu model matematis yang dapat digunakan untuk
mengetahui pola hubungan antara dua atau lebih variabel. Istilah regresi yang berarti ramalan
atau taksiran pertama kali diperkenalkan Sir Francis Galton pada tahun 1877, sehubungan
dengan penelitiannya terhadap tinggi manusia, yaitu antara tinggi anak dan tinggi orang tuanya.
Dalam penelitiannya, Galton menemukan bahwa tinggi anak dan tinggi orang tuanya cenderung
meningkat atau menurun dari berat rata-rata populasi. Garis yang menunjukkan hubungan
tersebut disebut garis regresi.
Analisis regresi lebih akurat dalam melakukan analisis korelasi, karena pada analisis itu
kesulitan dalam menunjukkan slop (tingkat perubahan suatu variabel terhadap variabel lainnya
dapat ditentukan). Jadi dengan analisis regresi, peramalan atau perkiraan nilai variabel terikat
pada nilai variabel bebas lebih akurat pula. Karena merupakan suatu prediksi, maka nilai
prediksi tidak selalu tepat dengan nilai riilnya, semakin kecil tingkat penyimpangan antara nilai
prediksi dengan nilai riilnya, maka semakin tepat persamaan regresi yang dibentuk.
Dapat disimpulkan bahwa analisis regresi adalah metode statistika yang digunakan untuk
menentukan kemungkinan bentuk hubungan antara variabel variabel, dengan tujuan pokok
dalam penggunaan metode ini adalah untuk meramalkan atau memperkirakan nilai dari suatu
variabel lain yang diketahui.
Persamaan Regresi
Persamaan Regresi (regression equation) adalah suatu persamaan matematis yang
mendefenisikan hubungan antara dua variabel. Persamaan regresi yang digunakan untuk
membuat taksiran mengenai variabel dependen disebut persamaan regresi estimasi, yaitu suatu
formula matematis yang menunjukkan hubungan keterkaitan antara satu atau beberapa variabel
yang nilainya sudah diketahui dengan satu variabel yang nilainya belum diketahui. Sifat
hubungan antar variabel dalam persamaan regresi merupakan hubungan sebab akibat (causal
relationship). Oleh karena itu, sebelum menggunakan persamaan regresi dalam mejelaskan
hubungan antara dua atau lebih variabel, maka perlu diyakini terlebih dahulu bahwa secara
teoritis atau perkiraan sebelumnya, dua atau lebih variabel tersebut memiliki hubungan sebab
akibat. Variabel yang nilainya akan mempengaruhi nilai variabel lain disebut dengan variabel
75
bebas (independent variabel), sedangkan variabel yang nilainya dipengaruhi oleh nilai variabel
lain disebut variabel terikat (dependent variabel).
Ada dua jenis Persamaan Regresi Linier, yaitu sebagai berikut :
1. Analisis Regresi Sederhana (simple analisis regresi)
2. Analisis Regresi Berganda (multiple analisis regresi)
Regresi Sederhana
Store Purchase
Facility
Image Intention
3.90 3.60 4.00
4.30 3.40 4.00
4.30 3.80 3.60
4.90 3.40 4.60
3.80 4.00 4.20
4.20 4.20 4.20
2.60 2.80 2.80
2.60 2.40 4.75
3.60 3.20 2.75
3.40 4.00 3.50
3.80 4.00 3.25
3.40 3.20 3.25
4.00 3.80 3.80
4.00 3.20 3.40
3.60 4.00 3.40
4.60 3.60 4.40
76
4.20 2.60 3.25
4.20 3.20 2.75
2.80 3.40 3.50
2.40 3.20 3.25
3.20 3.40 3.80
4.00 4.40 4.40
4.00 3.80 3.60
4.60 4.40 3.40
3.60 3.60 2.40
3.00 3.40 3.20
3.60 3.60 3.00
2.60 3.00 2.00
3.20 3.80 3.00
3.40 3.40 4.00
3.80 4.00 3.60
3.40 3.60 3.00
3.40 3.00 3.00
4.40 3.00 4.00
3.80 3.40 3.50
4.40 3.00 2.25
3.60 3.00 3.50
3.40 3.00 3.75
2.40 4.20 2.25
3.20 4.20 3.00
3.00 4.00 3.00
3.00 3.20 4.50
4.50 3.80 3.25
3.25 3.40 3.25
3.20 3.25 4.75
3.80 2.50 4.75
4.75 3.25 5.00
5.00 3.75 5.00
77
5.00 3.00 5.00
5.00 2.00 5.00
5.00 3.00 4.50
4.50 4.00 4.50
3.20 3.20 4.00
3.60 3.80 4.25
2. Dari menu utama SPSS, pilih menu Analyze, kemudian submenu Regression, lalu pilih Linear.
Maka akan muncul kotak dialog sebagai berikut.
.
Masukkan variabel yang dipengaruhi (dependen) dan variabel yang mempengaruhi (independen)
ke kotaknya masing-masing.
3. Pilih Statistics. Kemudian Checklist Estimates, Model Fit, dan Descriptives.
78
4. Klik Continue dan selanjutnya pilih Plots. Atur seperti gambar dibawah ini.
79
6. Klik Option, pada Stepping Method Criteria, pilih :Entry .05(uji F yang mengambil standar
angka probabilitas sebesar 5%). Beri tanda pada Include constant in equation (menyertakan
konstanta tetap dipilih). Pada Missing Value, pilih: Exclude cases listwise (data kasus tidak ada
yang hilang). Kemudian Continue.
80
ANOVAa
Model Sum of Squares df Mean Square F Sig.
1 Regression 7.465 1 7.465 16.312 .000b
Residual 23.796 52 .458
Total 31.261 53
Dasar pengambilan keputusan diambil dari Sig Tabel Anova
a. Dependent Variable: Purchase_Intention
b. Predictors: (Constant), Store_Image
Model Summaryb
Adjusted R Std. Error of
Model R R Square Square the Estimate
1 .489a .239 .224 .67647
81
Coefficientsa
Unstandardized Standardized
Coefficients Coefficients
Model B Std. Error Beta t Sig.
1 (Constant) 1.671 .503 3.325 .002
Store_Image .533 .132 .489 4.039 .000
Seperti yang diuraikan diatas, jika pada Regresi sederhana hanya ada satu variabel dependen (Y)
dan satu variabel independent (X), maka pada kasus Regresi berganda, terdapat satu variabel
dependen dan lebih dari satu variabel independent. Dalam praktek bisnis, regresi berganda justru
lebih banyak digunakan, selain karena banyaknya variabel dalam bisnis yang perlu dianalisis
bersama, juga pada banyak kasus regresi berganda lebih relevan digunakan.
Contoh Soal: Masih menggunakan data Store Image, Facility, dan Purchase Intention
(Asumsikan: Uji asumsi klasik telah terpenuhi/memenuhi syarat)
Store Purchase
Facility
Image Intention
3.90 3.60 4.00
4.30 3.40 4.00
4.30 3.80 3.60
4.90 3.40 4.60
3.80 4.00 4.20
4.20 4.20 4.20
2.60 2.80 2.80
2.60 2.40 4.75
3.60 3.20 2.75
82
3.40 4.00 3.50
3.80 4.00 3.25
3.40 3.20 3.25
4.00 3.80 3.80
4.00 3.20 3.40
3.60 4.00 3.40
4.60 3.60 4.40
4.20 2.60 3.25
4.20 3.20 2.75
2.80 3.40 3.50
2.40 3.20 3.25
3.20 3.40 3.80
4.00 4.40 4.40
4.00 3.80 3.60
4.60 4.40 3.40
3.60 3.60 2.40
3.00 3.40 3.20
3.60 3.60 3.00
2.60 3.00 2.00
3.20 3.80 3.00
3.40 3.40 4.00
3.80 4.00 3.60
3.40 3.60 3.00
3.40 3.00 3.00
4.40 3.00 4.00
3.80 3.40 3.50
4.40 3.00 2.25
3.60 3.00 3.50
3.40 3.00 3.75
2.40 4.20 2.25
3.20 4.20 3.00
3.00 4.00 3.00
83
3.00 3.20 4.50
4.50 3.80 3.25
3.25 3.40 3.25
3.20 3.25 4.75
3.80 2.50 4.75
4.75 3.25 5.00
5.00 3.75 5.00
5.00 3.00 5.00
5.00 2.00 5.00
5.00 3.00 4.50
4.50 4.00 4.50
3.20 3.20 4.00
3.60 3.80 4.25
84
Langkah-langkah penyelesaian:
1. Masukkan data ke dalam IBM SPSS v.20 seperti gambar berikut.
2. Dari menu utama SPSS, pilih menu Analyze, kemudian submenu Regression, lalu pilih Linear.
Maka akan muncul kotak dialog sebagai berikut.
Masukkan variabel yang dipengaruhi (dependen) dan variabel yang mempengaruhi (independen)
ke kotaknya masing-masing.
85
4. Klik continue dan selanjutnya pilih Plots. Atur seperti gambar dibawah ini
6. Klik Option, pada Stepping Method Criteria, pilih :Entry .05(uji F yang mengambil standar
angka probabilitas sebesar 5%). Beri tanda pada Include constant in equation (menyertakan
86
konstanta tetap dipilih). Pada Missing Value, pilih: Exclude cases listwise (data kasus tidak ada
yang hilang). Kemudian Continue.
Descriptive Statistics
Mean Std. Deviation N
Purchase_Intention 3.6676 .76800 54
Store_Image 3.7481 .70470 54
Facility 3.4509 .51317 54
Correlations
Purchase_Intention Store_Image Facility
Pearson Correlation Purchase_Intention 1.000 .489 -.167
Store_Image .489 1.000 .004
Facility -.167 .004 1.000
Sig. (1-tailed) Purchase_Intention . .000 .113
Store_Image .000 . .490
Facility .113 .490 .
N Purchase_Intention 54 54 54
Store_Image 54 54 54
Facility 54 54 54
87
Model Summaryb
Model R R Square Adjusted R Square Std. Error of the Estimate
1 .517a .267 .239 .67013
a. Predictors: (Constant), Facility, Store_Image
b. Dependent Variable: Purchase_Intention
ANOVAa
Model Sum of Squares df Mean Square F Sig.
1 Regression 8.358 2 4.179 9.306 .000b
Residual 22.903 51 .449
Total 31.261 53
a. Dependent Variable: Purchase_Intention
b. Predictors: (Constant), Facility, Store_Image
Coefficientsa
Unstandardized Coefficients Standardized Coefficients
Model B Std. Error Beta t Sig.
1 (Constant) 2.542 .793 3.205 .002
Store_Image .533 .131 .489 4.082 .000
Facility -.253 .179 -.169 -1.410 .165
a. Dependent Variable: Purchase_Intention
88
Soal Latihan
1. Manajer HRD perusahaan Nusabakti ingin mengetahui apakah terdapat pengaruh tingkat
kehadiran terhadap prestasi kerja karyawannya. Berikut ini hasil sampel yang diperoleh dari
karyawannya:
89
27 92 75
28 74 70
29 92 79
30 84 77
2. Aura sedang melakukan penelitian untuk memenuhi tugas akhirnya, ia ingin melakukan
penelitian tentang pengaruh antara motivasi kerja dengan kompensasi terhadap loyalitas
karyawan pada PT. Indomay. Berikut ini merupakan hasil yang diperoleh dari 20 sampel.
yaitu:
Loyalitas
No Motivasi Kerja Kompensasi Karyawan
1 6.67 6.50 9.40
2 8.67 8.00 10.00
3 8.33 7.50 10.00
4 8.33 8.00 8.50
5 6.67 7.00 8.50
6 6.67 7.00 8.30
7 9.00 8.50 9.00
8 8.00 9.00 10.00
9 6.67 7.00 9.30
10 8.00 9.00 10.0
11 6.33 6.50 8.30
12 7.33 7.50 7.00
13 9.00 9.00 8.50
14 8.67 9.50 10.00
15 6.33 6.50 8.00
16 8.00 7.00 7.00
17 9.67 9.50 9.00
18 6.67 7.50 9.00
90
19 9.33 9.00 10.00
20 7.33 8.50 10.00
Tentukanlah:
a. Apakah terdapat pengaruh motivasi kerja terhadap loyalitas karyawan?
b. Apakah terdapat pengaruh variable independent terhadap variable dependent?
c. Seberapa besar pengaruhnya variable independent terhadap dependent?
d. Bagaimana korelasi secara keseluruhan dari semua variable?
e. Tuliskan persamaan regresinya berikut interpretasinya!
3. Lahyada adalah toko onlime yang sangat terkenal. Untuk dapat terus menjalankan bisnisnya
maka Lahyada melakukan penelitian mengenai faktor yang mempengaruhi kepuasan belanja
online sehingga hasilnya dapat dijadikan sebagai acuan dalam membangun strategi-strategi
baru demi keberlanjutan bisnis. Berikut data yang berhasil terkumpul:
Kualitas Kepuasan
No Diskon Efisien
Barang Konsumen
1 3.50 3.38 3.47 3.34
2 4.00 3.69 3.57 3.45
3 2.75 3.34 3.10 3.18
4 2.25 2.38 2.34 2.52
5 3.00 2.53 2.52 2.50
6 4.75 3.97 3.78 3.57
7 3.75 4.31 4.10 4.21
8 3.25 3.25 3.07 3.47
9 3.25 2.81 2.57 2.78
10 3.50 2.97 2.94 2.88
11 3.25 3.09 3.35 3.26
12 3.25 3.19 3.47 3.33
13 3.25 3.19 3.11 3.06
14 2.75 3.00 2.77 2.76
15 3.50 3.41 3.21 3.20
16 3.25 3.59 3.47 3.55
17 2.75 3.00 3.20 3.03
91
18 2.50 2.66 2.74 2.73
19 2.75 2.78 2.71 2.77
20 3.50 3.03 3.13 2.99
21 3.75 3.53 3.48 3.18
22 3.00 3.47 3.34 3.32
23 3.25 2.91 3.08 3.13
24 3.50 3.22 3.11 2.88
25 2.75 3.28 3.22 2.88
26 3.75 3.44 3.53 3.25
27 4.25 4.25 4.21 4.05
28 3.50 3.84 3.98 4.00
29 3.75 3.41 3.56 3.51
30 3.25 3.63 3.50 3.26
31 3.75 3.63 3.28 3.38
32 3.00 3.34 3.09 3.39
33 2.25 2.53 2.52 2.72
34 4.00 2.91 2.71 2.86
35 3.50 3.56 3.37 3.38
Tentukanlah:
a. Apakah terdapat pengaruh diskon terhadap kepuasan konsumen?
b. Apakah terdapat pengaruh variable independent terhadap variable dependent?
c. Seberapa besar pengaruhnya variable independent terhadap dependent?
d. Bagaimana korelasi secara keseluruhan dari semua variable?
e. Tuliskan persamaan regresinya berikut interpretasinya!
92
PERTEMUAN 6
ANOVA
ANOVA
Analysis of variance merupakan metode untuk menguji hubungan antara satu variabel
dependen (skala metrik) dengan satu atau lebih variabel independen (skala nonmetrik atau
kategorikal dengan kategori lebih dari dua). Hubungan antara satu variabel dependen dengan
satu variabel independen disebut One Way ANOVA. Pada kasus satu variabel dependen metrik
dan dua atau tiga variabel independen kategorikal sering disebut Two Ways ANOVA dan Three
Ways ANOVA.
ANOVA digunakan untuk mengetahui pengaruh utama (main effect) dan pengaruh
interaksi (interaction effect) dari variable independen kategorikal (sering disebut faktor) terhadap
variable dependen metrik.
1. Homogeneity of variance, yaitu variabel dependen harus memiliki varain yang sama dalam
setiap kategori varaibel independen. Test ini dinamakan Levene’s Testof Homogeneity of
Variance. Pada pengujian Levene Test, hasil yang dikehendaki adalah menerima hipotesis nol
dimana probabilitas < 0.05 yang berarti terdapat kesamaan variance pada grup.
2. Random sampling : untuk tujuan uji signifikansi, maka subjek didalam setiap grup harus
diambil secara random.
3. Multivariate Normality : untuk tujian uji signifikansi, maka variable harus mengikuti
distribusi normal multivariate.
Contoh soal :
Barry adalah seorang petani di suatu desa kecil. Ia memiliki 5 orang anak buah yang
membantunya setiap harinya. Untuk mempermudah pekerjaan anak buahnya ia memutuskan untuk
menggunakan bantuan traktor. Ia membeli 3 jenis traktor, traktor A, traktor B dan traktor C untuk
digunakan. Berikut adalah tingkat kepuasan ke 5 anak buah terhadap ketiga traktor yang ada.
93
7 4 4
7 5 9
10 8 10
6 7 8
Tabel diatas menunjukkan tingkat kepuasan 5 anak buah nya terhadap ketiga traktor, semakin
tinggi nilai nya menandakan bahwa anak buah nya semakin puas, sebaliknya semakin rendah
menandakan anak buahnya semakin tidak puas akan traktor tersebut.
Berdasarkan data diatas tentukan:
a. Apakah data diatas berdistribusi normal?
b. Apakah data diatas memiliki varians yang sama?
c. Apakah terdapat perbedaan rata-rata tingkat kepuasan anak buah terhadap ketiga jenis Traktor?
d. Apakah terdapat perbedaan rata-rata tingkat kepuasan anak buah antara traktor A dan Traktor C
menurut Turkey dan Bonferroni?
Langkah Pengerjaan:
1. Masukkan variable kepuasan dan jenis traktor ke dalam variable view. Lalu gunakan value labels
untuk variable jenis traktor
94
3. Lakukan Uji Normalitas terlebih dahulu
4. Setelah itu pilih Analyze – Compare Means – One Way Anova. Masukkan data kepuasan ke
dependent list dan data jenis traktor ke dalam factor.
95
6. Pilih Option, lalu ceklis Descriptive dan Homogeneity of variance test.
96
8. Lakukan Uji F. Pilih Transform – Compute Variable.
97
9. Lihat hasi F table pada data view.
98
Soal Latihan
Ekonomi 4 2 5 4 6 3 4 5 5
Bisnis 3 3 3 5 4 3 5 6 4
Eksekutif 4 5 5 6 3 2 4 4 3
2. Seorang guru SD melakukan pendataan atas nilai Ujian Nasional muridnya sebagai berikut:
Apakah terdapat perbedaan rata-rata hasil Ujian Nasional tersebut menurut Bonferroni?
99
3. BINUS Mengajar melakukan survei tentang kualitas pendidikan beberapa sekolah di Jakarta,
dengan hasil evaluasi sebagai berikut:
Jakarta Pusat Jakarta Barat Jakarta Timur Jakarta Selatan Jakarta Utara
Baik Rata-rata Rata-rata Baik Baik
Sangat Baik Buruk Sangat Buruk Baik Sangat Baik
Rata-rata Rata-rata Rata-rata Rata-rata Baik
Sangat Buruk Rata-rata Baik Rata-rata Rata-rata
100
PERTEMUAN 7
CHISQUARE
Chi-square test digunakan untuk menganalisa data kategorikal. Yang berarti data yang
dihitung dibagi menjadi beberapa kategori. Contohnya adalah : jika Anda ingin menguji apakah
menghadiri kelas pengaruh terhadap performa siswa saat ujian. Jika menggunakan skor tes (0-100)
sebagai data, maka data tersebut tidak akan sesuai untuk uji Chi-square. Namun, jika mengubah
data siswa ke dalam kategori "Lulus" dan "Gagal" maka datanya bisa digunakan.
Uji Chi-square atau qai-kuadrat digunakan untuk melihat ketergantungan antara variabel
bebas dan variabel tergantung berskala nominal atau ordinal. Prosedur uji chi-square menabulasi
satu atau variabel ke dalam kategori-kategori dan menghitung angka statistik chi-square. Seperti
sifatnya, prosedur uji chi-square dilkelompokan kedalam statistik uji non-parametrik.
Semua variabel yang akan dianalisa harus bersifat numerik kategorikal atau nominal dan
dapat juga berskala ordinal. Prosedur ini didasarkan pada asumsi bahwa uji nonparametrik tidak
membutuhkan asumsi bentuk distribusi yang mendasarinya. Data diasumsikan berasal dari sampel
acak. Frekuensi yang diharapkan (fe) untuk masing-masing kategori harus setidaknya : Tidak
boleh lebih dari dua puluh (20%) dari kategori mempunyai frekuensi yang diharapkan.
Uji keselarasan atau goodness of fit test digunakan pada data yang memiliki satu variable.
goodness of fit test berfungsi untuk membandingkan frekuensi yang diamati (fo) dengan frekuensi
yang diharapkan (fe).
Uji keselarasan atau goodness of fit test digunakan untuk mengukur seberapa baik distribusi dari
data diamati sesuai dengan distribusi yang diharapkan
chi-square goodness of fit test tepat digunakan ketika kondisi berikut terpenuhi:
Metode pengambilan sampel adalah simple random sampling
Variabel yang diteliti adalah kategoris.
Setidaknya terdapat limaFrekuensi yang diharapkan dari jumlah pengamatan sampel di setiap
tingkat variabel
101
Contoh frekuensi yang diharapkan sama untuk setiap kategori :
Susanti adalah salah satu Staff Marketing dari Bina Nusantara University ia ingin menggetahui
apakah terdapat kemerataan pemilihan mahasiswa baru terhadap program studi SOBM (School of
Business Management) yang ada di BINUS. Program Studi SOBM itu sendiri terdiri dari Management,
International Business Management, International Marketing dan Business Creation. Calon
Mahasiswa/i ini terdiri dari 10 Sekolah Menengah Atas didaerah Tangerang, yang jumlah calon
mahasiswanya adalah 1050.
Langkah pengerjaan :
1. Input Variabel Program Studi dan peminatan pada Variable View.
102
3. Input data kedalam Data View.
4. Kemudian lakukan Weight Cases karena data yang dilampirkan merupakan ringkasan dari
kumpulan data yang didapat sebelumnya. Pilih Data – Weight Cases dan akan tampil layar
sebagai berikut.
103
5. Pilih Weight cases by pemilihan (masukkan pemilihan pada Frequency Variable), kemudian
OK
6. Setelah dilakukan Weight Cases maka dapat dilakukan pengujjian selanjutnya yang di mana
dimulai dengan melakukan uji normalitas. Uji Normalitas dilakukan untuk mengetahui
distribusi data dari variabel yang dianalisa. Pilih Analyze → Descriptive Statistics → Explore.
Tests of Normality
Kolmogorov-Smirnova Shapiro-Wilk
Statistic df Sig. Statistic df Sig.
104
pemiliha
.237 1200 .000 .829 1200 .000
n
a. Lilliefors Significance Correction
7. Lakukan pengujian Goodness of fit. Pilih Analyze >> Non Parametric tests >> Legacy
Dialogs >> Chi Square. Pindahkan variable Program studi ke Variable List.
program_studi
Observed Expected Residual
N N
Management 250 300.0 -50.0
International Business
422 300.0 122.0
Management
International Marketing 178 300.0 -122.0
Business Creation 350 300.0 50.0
105
Total 1200
Test Statistics
program_stu
di
Chi-
115.893a
Square
df 3
Asymp.
.000
Sig.
a. 0 cells (0.0%) have
expected frequencies less
than 5. The minimum
expected cell frequency is
300.0.
106
Contoh frekuensi yang diharapkan diketahui :
Susanti adalah salah satu Staff Marketing dari Bina Nusantara University ia ingin menggetahui
apakah terdapat kemerataan pemilihan mahasiswa baru terhadap program studi SOBM (School of
Business Management) yang ada di BINUS. Program Studi SOBM itu sendiri terdiri dari Management,
International Business Management, International Marketing dan Business Creation. Berdasarkan data
tahun 2015, data peminatan calon mahasiswa terhadap program studi SOBM adalah sebagai berikut:
Calon Mahasiswa/i ini terdiri dari 10 Sekolah Menengah Atas didaerah Tangerang, yang jumlah
calon mahasiswanya adalah 1200. Susanti ingin mengetahui apakah keempat program studi ini di tahun
2016 memiliki tingkat kemenarikan yang merata?
Berikut adalah data calon mahasiwa tahun ini :
Langkah pengerjaan :
107
Program Studi Peminatan 2015 (Fe) Peminatan 2016 (Fo)
Management 288 250
3. Input data kedalam Data View. Untuk frekuensi hanya masukkan data pemilihan 2016 (Fo).
108
4. Kemudian lakukan Weight Cases karena data yang dilampirkan merupakan ringkasan dari
kumpulan data yang didapat sebelumnya. Pilih Data – Weight Cases dan akan tampil layar
sebagai berikut.
5. Pilih Weight cases by pemilihan (masukkan pemilihan pada Frequency Variable), kemudian OK.
109
6. Setelah dilakukan Weight Cases maka dapat dilakukan pengujjian selanjutnya yang di mana
dimulai dengan melakukan uji normalitas. Uji Normalitas dilakukan untuk mengetahui distribusi
data dari variabel yang dianalisa. Pilih Analyze → Descriptive Statistics → Explore.
Tests of Normality
Kolmogorov-Smirnova Shapiro-Wilk
Statistic df Sig. Statistic df Sig.
pemiliha
.237 1200 .000 .829 1200 .000
n
a. Lilliefors Significance Correction
7. Lakukan pengujian Goodness of fit. Pilih Analyze >> Non Parametric tests >> Legacy Dialogs
>> Chi Square. Pindahkan variable program studi ke Variable List.
110
8. Lalu pada bagian Expected Values pilih Value kemudian input data pemilihan 2015 (Fe) secara
berurutan :
program_studi
Observed Expected Residual
N N
Management 250 274.3 -24.3
International Business
422 436.2 -14.2
Management
International Marketing 178 396.2 -218.2
Business Creation 350 93.3 256.7
Total 1200
Test Statistics
program_stu
di
111
Chi-
828.607a
Square
df 3
Asymp.
.000
Sig.
a. 0 cells (0.0%) have
expected frequencies less
than 5. The minimum
expected cell frequency is
93.3.
10. Untuk mencari nilai Chisquare hitung dengan menggunakan langkah berikut :
Pilih Transform >> Compute Variable
Ketik X pada Target Variable
Pada Function Group pilih Inverse DF dan pada Function and Special Variables pilih
Idf.Chisq
Pada Numeric Expression akan muncul IDF.CHISQ(?,?). Lalu ? pertama isi dengan
probabilitas, yaitu 0.95 dan ? kedua isi dengan derajat kebebasan, yaitu 3 (dapat dilihat
pada tabel output). Lalu Klik OK
112
11. Hasil Chisquare table akan muncul pada inputan spss.
113
Uji Independensi
Chi-square goodness-of-fit test digunakan untuk menganalisis distribusi frekuensi untuk kategori
satu variabel. Namun, goodness-of-fit test tidak bisa digunakan untuk menganalisis dua variabel
secara bersamaan. Karena itu dikenal yang namanya chi-square test of independence yang dapat
digunakan untuk menganalisis frekuensi dari dua variabel dengan beberapa kategori untuk
menentukan apakah kedua variabel independen.
Contoh :
Evantut adalah seorang Personal Trainer di Medal’s Gym. Ia ingin melihat apakah
terdapat hubungan antara umur pengunjung di Medal’s Gym terhadap penawaran Paket Gym
Bulanan dari …… anggota. Paket Gym tersebut terdiri dari :
Paket A : Rp. 199.000
Paket B: Rp. 299.000 + Towel Exercise
Paket C : Rp. 356.000 + Towel Exercise + Free 15 Days
Paket D : Rp. 400.000 + Towel exercise + Free 1 Month
USIA PAKET
A B C D
< 17 Tahun 15 48 34 50
18-35 Tahun 33 39 23 10
36-50 Tahun 36 23 43 18
>50 Tahun 16 17 40 38
Langkah pengerjaan :
1. Input variabel Usia, Paket, dan Frekuensi pada Variable View
114
3. Input data ke dalam Data View.
4. Kemudian lakukan Weight Cases. Pilih Data – Weight Cases. Pada window yang muncul, pilih
Weight cases by frekuensi (masukkan frekuensi pada Frequency Variable), kemudian OK.
115
5. Setelah dilakukan Weight Cases maka dapat dilakukan pengujjian selanjutnya yang di mana
dimulai dengan melakukan uji normalitas. Uji Normalitas dilakukan untuk mengetahui distribusi
data dari variabel yang dianalisa. Pilih Analyze → Descriptive Statistics → Explore
Tests of Normality
Kolmogorov-Smirnova Shapiro-Wilk
Statistic df Sig. Statistic df Sig.
frekuensi .168 483 .000 .911 483 .000
a. Lilliefors Significance Correction
6. Lakukan pengujian Goodness of fit. Pilih Analyze, Descriptive Statistics, lalu klik Crosstabs.
7. Pada kotak dialog Crosstabs muncul, pindahkan usia ke Row(s) dan paket ke Column(s).
Klik Statistics, Pada kotak dialog Crosstabs: Statistics yang muncul centang Chi-Square.
Klik Cells, kemudian pilih Observed, Expected.
116
8. Klik Continue, lalu Ok untuk melihat hasil.
117
Expected
30.4 38.7 42.6 35.3 147.0
Count
Count 33 39 23 10 105
18-35
Expected
Tahun 21.7 27.6 30.4 25.2 105.0
Count
Count 36 23 43 18 120
36-50
Expected
Tahun 24.8 31.6 34.8 28.8 120.0
Count
Count 16 17 40 38 111
>50 Tahun Expected
23.0 29.2 32.2 26.7 111.0
Count
Count 100 127 140 116 483
Total Expected
100.0 127.0 140.0 116.0 483.0
Count
Chi-Square Tests
Value df Asymp. Sig.
(2-sided)
Pearson Chi-Square 66.746a 9 .000
Likelihood Ratio 69.978 9 .000
Linear-by-Linear
.279 1 .598
Association
N of Valid Cases 483
a. 0 cells (0.0%) have expected count less than 5. The
minimum expected count is 21.74.
118
Pada Function Group pilih Inverse DF dan pada Function and Special Variables pilih
Idf.Chisq.
Pada Numeric Expression akan muncul IDF.CHISQ(?,?). Lalu ? pertama isi dengan
probabilitas, yaitu 0.95 dan ? kedua isi dengan derajat kebebasan, yaitu 4 (dapat dilihat
pada tabel output).
Klik OK.
119
Soal Latihan
1. Setelah melihat perbedaan pengaruh antara ketiga layanan maka Cella pun membuat kuesioner
untuk melihat parameter yang mempengaruhi kenyamanan layanan di layanan mahasiswa maka
dari 110 orang didapat 45 orang menganggap keramahan yang mempengaruhi kenyamanan, 25
beranggapan ketepatan penyelesaiaan yang mempengaruhi kenyamanan, 40 beranggapan
kecepatan layanan yang mempengaruhi kenyamanan. Sedangkan untuk layanan keuangan
sebagai estimasi didapat frekuensinya sebagai berikut:
Parameter kenyamanan Layanan keuangan
Keramahan 55
ketepatan penyelesaian 30
kecepatan 25
2. Seorang dosen memperkirakan bahwa tipikal distribusi grade dari kelasnya adalah 35% grade A,
30% grade B, 25% grade C, dan 10% kurang dari sama dengan (≤) grade D. Pada semester ini,
kelas dosen tersebut berisi 100 mahasiswa.
a. Estimasikan jumlah mahasiswa yang akan memperoleh masing-masing grade berdasarkan
ekspektasi dosen.
b. Di akhir semester, terdapat 25 anak mendapat grade A, 30 anak mendapat grade B, 25 anak
mendapat grade C, dan sisanya mendapat grade kurang dari sama dengan (≤) grade D. Ujilah
normalitas data tersebut!
c. Apakah hasil grade pada akhir semester mengikuti distribusi grade yang diharapkan?
3. Carllim adalah seorang pemilik toko sembako terbesar di Tangerang, sembako yang paling
banyak dibeli dan dibutuhkan adalag Beras. Berikut adalah penjualan beras tahun 2014 di 5 toko
terbesarnya :
120
TOKO PENJUALAN
Ruko Pasar 9 212
Ruko Pasar Sipansa 252
Ruko Pasar Modern BSD 243
Ruko Pasar modern GS 439
Ruko Pasar Moderland 259
Apakah data penjualan beras tahun 2014 memiliki distribusi yang merata di lima toko
terbesarnya ?
121
PERTEMUAN 8
MANN WHITNEY
Uji Mann Whitney sebanding dengan t – test nonparametrik untuk sampel independen.
Mann Whitney adalah uji non – parametrik yang digunakan untuk mengetahui perbedaan rata –
rata 2 kelompok independen (bebas) yang berasal dari populasi yang sama apabila skala
data variabel terikatnya adalah ordinal atau interval/ratio tetapi tidak berdistribusi normal. Uji
Mann-Whitney merupakan uji nonparametrik yang digunakan untuk menguji apakah dua buah
sampel independen berasal dari populasi yang sama.
Populasi dari sampel pertama berbeda dengan populasi dari sampel kedua sehingga
kedua sampel tersebut bersifat independen. Uji Mann-Whitney menguji parameter populasi dari
masing-masing sampel. Pada dasarnya, parameter yang di uji adalah median populasi. Jika nilai
median dari populasi pertama sama dengan nilai median dari populasi kedua, maka kedua
sampel tersebut berasal dari populasi yang sama. Namun jika nilai median dari populasi pertama
tidak sama dengan nilai median dari populasi kedua, maka kedua sampel tersebut berasal dari
populasi yang berbeda.
Data yang dianalisis pada uji Mann-Whitney berupa ranking dari hasil pemeringkatan
seluruh nilai dari dua sampel. Karena data yang dianalisis berupa ranking, maka data tersebut
termasuk data ordinal.
Pengujian mann whitney dapat dilakukan dengan memenuhi asumsi berikut :
Data yang digunakan tidak berhubungan satu sama lain (Independen)
Populasi tidak harus berdistribusi normal (bebas)
Berskala minimal Ordinal
Jumlah data yang digunakan sedikit (<30)
Contoh :
H&M saat ini menggunakan 2 mesin pembuat baju yaitu mesin 1 berasal dari Jepang dan mesin
2 berasal dari Korea. Kedua mesin itu digunakan untuk memproduksi baju secara massal. Wanda
ingin mengetahui adakah perbedaan kualitas mesin pembuat baju pada industri fashion H&M.
Kedua kualitas mesin pembuat baju tersebut diukur dengan menggunakan instrumen yang terdiri
dari beberapa butir pertanyaan. Skor penilaian dengan kualitas tertinggi 50 dan terendah 0. Data
yang didapatkan peneliti dari hasil kuisioner adalah sebagai berikut.
122
RESPONDEN MESIN KOREA MESIN JEPANG
1 16 29
2 18 29
3 10 31
4 12 35
5 16 36
6 14 37
7 15 33
8 10 37
9 12 29
10 15 33
11 16 29
12 11 35
13 16 37
14 18 30
15 10 41
16 12 45
17 16 29
18 11 33
19 12 29
20 10 35
21 14 25
22 16 26
23 17 27
24 16 23
25 18 27
Langkah-langkah pengerjaan :
1. Input variabel kelas dan nilai pada Variable View. Gunakan Value Label untuk variabel mesin
123
2. Input data ke Data View.
124
4. Pilih Analyze >> Nonparametric Tests >> Legacy Dialogs >> 2 Independent Samples. Kemudian pada
window yang muncul, pindahkan variable kualitas ke Test Variable List dan mesin ke group variable.
6. Pilih Continue. Pada test-type pilih Mann-Whitney U kemudian OK untuk melihat output.
125
126
Soal Latihan
1. Fernando seorang mahasiswa tingkat akhir. Ia ingin melakukan suatu penelitian untuk
mengetahui apakah terdapat perbedaan rata rata tingkat penerimaan fresh graduate di dunia kerja
antara Universitas Bina Nusantara dengan Universitas Trisakti. Berikut hasil data yang telah
diperoleh. Bantulah fernando dalam pengujian ini.
2. Barney diberikan suatu tugas oleh dosen Business Statistics untuk melakukan suatu penelitian di
Bhinneka. Disana Barney ingin melihat apakah terdapat perbedaan rata – rata preferensi
konsumen antara laptop LCD 14 inch dengan laptop LCD 11 inch. Berikut adalah hasil data
yang berhasil diperoleh :
127
6 8
7 7
6 7
7 1
128
PERTEMUAN 9
SIGN WILCOXON
Wilcoxon signed rank test adalah metode nonparametrik yang digunakan untuk
membandingkan 2 sampel data yang berasal dari grup yang sama (2 sampel yang saling
berhubungan). Hal ini dapat dilakukan ketika ingin menyelidiki apakah terjadi perubahan nilai
dari 1 waktu ke waktu lain atau ketika individu diberikan lebih dari 1 kondisi (diberikan
perlakuan yang berbeda).
Pengujian Wilcoxon signed rank dapat dilakukan ketika memenuhi asumsi berikut :
Contoh:
Losaura adalah seorang peneliti ingin mengetahui bagaimana perkembangan asisten laboratory of
business management terhadap kualitas dari seorang asisten setelah diberikan training inti. Peneliti
mengharapkan adanya dampak positif setelah diberikannya training inti. Losaura mengambil
sampel sebanyak 10 asisten.Berikut hasil data yang telah diteliti losaura:
129
Yusliana 77 62
Langkah-langkah:
1. Input variabel sebelum training inti dan sesudah training inti pada Variable View.
2.
Input data diatas pada Data View.
2. Uji distribusi data, jika data tidak normal maka bisa menggunakan metode non-parametrik
130
4. Pada menu Analyze, pilih Non-Parametric Test – 2 Related Sample.
5. Pada kolom Test Pairs, masukkan variable sebelum training inti dan sesudah training inti.
Kemudian Test Tipe : Wilcoxon. Abaikan pilihan lain, klik OK.
131
6. Output hasil.
132
Soal Latihan
1. Sebagai bisnis manufacture bunga plastik yang dijalankan turun temurun, Mawar
Manufacture Company sudah banyak melakukan inovasi dalam proses produksinya. Pada
awal tahun 1990an Mawar Manufacture menggunakan cara manual dalam memproduksi,
namun seiring dengan perkembangan teknologi Mawar Manufacture mulai melalukan
produksi bukan lagi secara manual tapi dengan menggunakan mesin berteknologi tinggi
sehingga mempersingkat proses produksi dan meningkatkan produktivitas pekerjanya.
Mawar Manufacture ingin mengetahui apakah dengan menggunakan mesin yang cangih
benar benar meningkatkan produktivitas karyawannya. Berikut terlampir data produktivitas
karyawan, ada beberapa data pekerja yang tidak lengkap. (Tingkat kepercayaan 91%)
133
20 3 6 40 6 -
2. Top Nusantara memproduksi berbagai macam permen dan snack. Pada tahun 2010 - 2012
penjualan permen dan snack tidak mengalami kenaikan ataupun penurunan. Pt. Top
Nusantara berencana untuk meningkatkan penjualan dengan menambah frekuensi
advertising. Berikut merupakan data hasil penjualan permen dan snack dalam miliar pada
tahun 2012 dan 2013, apakah ada peningkatan penjualan sebelum dan sesudah penambahan
frekuensi advertising. (α = 15%)
Jan Feb Mar Apr Mei Jun Jul Agus Sep Okt Nov Des Rata-
rata
2012 7 6 6 3 5 4 10 4 5 6 8 15
2013 9 8 6 4 5 5 6 6 6 7 9 14
134
PERTEMUAN 10
KRUSKALL WALLIS
Kruskal Wallis merupakan salah satu metode non-parametrik yang memiliki tujuan untuk
menentukan apakah terdapat perbedaan yang signifikan antara tiga atau lebih variabel independent
terhadap variabel dependent. Non-parametrik merupakan metode yang tidak didasarkan pada asumsi
distirbusi populasi. Variabel independent merupakan variable yang mempengaruhi variable dependent
atau merupakan variable bebas satu sama lain, sedangkan variable dependent merupakan variable yang
dipengaruhi variable independent atau merupakan variable terikat.
Ciri-ciri data Uji Kruskal-Wallis
1. Data merupakan metode non-parametrik
2. Memiliki jumlah responden minimal 30 atau lebih
3. Variable independent minimal 3 atau lebih (3,4,5,…,dst) kelompok.
4. Variable dependent berskala nominal (interval/ratio) atau Ordinal
5. Data tidak berdistribusi normal
6. Kruskall wallis merupakan nilai distribusi chi-square dengan derajat bebas k-1 makan jumlah
sample harus lebih dari 5
7. Setiap katagori memiliki variablilitas yang sama, yaitu bentuk kurve atau sebaran data yang
sama.
Contoh Soal :
Supervisor penjualan untuk Roti Coklat dari Duta Makmur ingin mengetahui apakah ada
perbedaan penjualan Roti Coklat yang nyata di daerah Penjualan JABODETABEK. Untuk itu
diambil sampel berupa data penjualan Roti Coklat, masing-masing enam outlet untuk kawasan
JABODETABEK, dengan data sebagai berikut :
135
Berikut langkah-langkah pengerjaan menggunakan SPSS :
1. Masukkan variable ke dalam tab “Variable View”, yaitu Kota dan Penjualan
2. Klik pada Value di baris data Kota, akan muncul kotak “Value Labels”. Pada Kolom Value,
tulis angka 1 dan pada kolom Label tulis Jakarta, lalu klik “Add”. Lanjutkan sampai Value 5.
3. Pada tab “Data View”, di kolom Shift masukkan angka 1 untuk Jakarta, dan pada kolom
Penjualan masukkan hasil copy dari data penjualan Jakarta. Lanjutkan sampai angka 5 dan
data penjualan Depok.
136
4. Lakukan Uji Normalitas sebagai syarat Uji Kruskal Wallis untuk mengetahui bahwa Data
berdistribusi tidak normal. Langkah melakukan Uji Normalitas :
Klik Analyze – Descriptive Statistics – Explore
137
- Pada Descriptive uncheck Stem-and-leaf
- Klik Normality plots with tests.
- Klik Continue
- Klik Ok pada kotak dialog Explore
7. Hasil Output Uji Normalitas menunjukkan bahwa jumlah data masing-masing variable adalah 6,
maka diambil data pada kolom Shapiro-Wilk. Dari hasil Sig pada Shapiro-Wilk menunjukkan
seluruh data lebih kecil dari α (0.05), sehingga dapat dilanjutkan pengujian Kruskal Wallis.
Tests of Normality
Kota Kolmogorov-Smirnova Shapiro-Wilk
Statistic df Sig. Statistic df Sig.
Jakarta ,313 6 ,068 ,776 6 ,035
Bogor ,390 6 ,005 ,700 6 ,006
Penjualan Tangerang ,318 6 ,057 ,750 6 ,020
Bekasi ,356 6 ,017 ,692 6 ,005
Depok ,348 6 ,022 ,786 6 ,043
8. Kemudian lakukan Uji Kruskal Wallis. Klik Analyze – Nonparametric Tests – Legacy Dialog -
K Independent Samples.
138
9. Kemudian akan muncul kotak dialog “Tests for Several Independent Samples” kemudian
pindahkan variable Penjualan ke kolom Test Variable List dan Kota ke Grouping Variable
sebagai berikut:
10. Kemudian klik Define Range dan isikan nilai Minimum : 1 dan nilai Maximum : 5 (karena
terdiri dari 5 sample) sebagai berikut :
11. Kemudian klik Continue dan klik Ok. Hasil Output dari Kruskal-Wallis Test sebagai berikut :
139
Test Statisticsa,b
Penjualan
Chi-
17,921
Square
df 4
Asymp.
,001
Sig.
a. Kruskal Wallis Test
b. Grouping Variable:
Kota
Ranks
Kota N Mean
Rank
Jakarta 6 20,25
Bogor 6 26,17
Tangerang 6 8,00
Penjualan
Bekasi 6 9,67
Depok 6 13,42
Total 30
140
12. Setelah mendapat Asymp Sig. dan Chi-Square hitung kita memerlukan Chi-Square Tabel
dengan menggunakan tool di spss. Pertama klik Transform dan pilih Compute Variable.
14. Output table Chi-Square akan ada pada data view yaitu 5.99.
141
Soal Latihan
1. Tabel di bawah ini berisi data panjang daun tanaman dari spesies yang sama di empat
taman berbeda. Pada setiap taman, enam tanaman dipilih secara acak. Untuk setiap
tanaman, sepuluh daun dipilih secara acak, dan rata-rata dari sepuluh daun tersebut dicatat
untuk setiap tanaman dari setiap taman. Gunakan test Kruskal-Wallis untuk menentukan
apakah terdapat perbedaan yang signifikan antara distribusi rata-rata panjang daun di
lokasi taman yang berbeda. Gunakan α=0,05.
2. EPA ingin menentukan apakah perubahan suhu di dalam air laut yang disebabkan oleh
pembangkit listrik tenaga nuklir akan memiliki efek yang signifikan pada kehidupan
hewan di wilayah tersebut. Spesimen yang baru menetas dari beberapa spesies ikan dibagi
menjadi empat kelompok secara acak. Kelompok-kelompok tersebut ditempatkan pada
simulasi lingkungan laut yang terpisah dan dengan suhu air yang identic. Enam bulan
kemudian, spesimen-spesimen tersebut ditimbang dan hasilnya ditunjukkan pada table.
Gunakan α=0,10 untuk mengetahui apakah terdapat perbedaan yang signifikan antara
berat spesimen pada suhu yang berbeda.
Suhu
38 F 42 F 46 F 50 F
15.0 16.0 42.0 18.0
17.0 17.0 23.0 18.0
21.0 16.0 21.0 21.0
18.0 16.0 17.0 18.0
19.0 22.0 22.0 21.0
15.0 17.0 23.0 18.0
142
31.0 24.0 22.0 23.0
30.0 38.0 15.0 23.0
3. Kumbang menyebabkan kerugian jutaan rupiah akibt kerusakan tanaman kapas setiap
tahunnya. Oleh karena itu, tiga bahan kimia dirancang untuk mengontrol populasi
kumbang untuk masing-masing lahan tanaman kupas. Setelah tiga bulan, sepuluh lahan
berukuran sama dipilih secara acak dan persentase kerusakan tanaman kapas dicatat.
Apakah terdapat perbedaan yang signifikan antara distribusi tingkat kerusakan dengan
ketiga perlakuan pada tanaman kapas ?
143
DAFTAR PUSTAKA
Black, Ken. 2010. Business for Contemporary Decision Making Statistics 6th edition. Wiley Plus
Setyadharma, Andryan. 2010. Uji Asumsi Klasik dengan SPSS 16.0. Universitas Negeri
Semarang
http://docplayer.info/238136-E-book-statistika-gratis-statistical-data-analyst-uji-asumsi-klasik-
regresi-linear.html
Anderson, D. R., Sweeney, D. J., & Williams, T. A. (2011). Statistics For Business and
Economics 11e. South Western: Cengage Learning.
Black, K. (2013). Applied Business Statistics Making Better Bussiness Decisions 7th Edition.
Singapore: John Wiley & Sons.
Ghozali, I. (2013). Aplikasi Analisis Multivariate dengan Program IBM SPSS 21 Updated PLS
Regresi. Semarang: Badan Penerbit Universitas Diponegoro.
Hidayat, A. (2014, July 17). Kruskall Wallis H. Retrieved Maret 20, 2015, from
www.statistikian.com: http://www.statistikian.com/2014/07/kruskall-wallis-h.html
Kelley, W. M., & Donnelly, R. A. (2009). The Humongous Book of Statistics Problems. USA:
Penguin Group.
Ltd, L. R. (n.d.). Chi Square Goodness of Fit Test in SPSS Statistics. Retrieved Juli 28, 2015,
from www.statistics.laerd.com: https://statistics.laerd.com/spss-tutorials/chi-square-goodness-of-
fit-test-in-spss-statistics.php
Putra, Z. (2012, Februari 23). Konsep Data Klasifikasi Jenis dan Macam Pembagian Data dalam
Statistik. Retrieved July 28, 2015, from http://www.scribd.com:
http://www.scribd.com/doc/101086535/Konsep-Data-Klasifikasi-Jenis-Dan-Macam-Pembagian-
Data-Dalam-Statistika#scribd
144
Santosa, P. B., & Ashari. (2005). Analisis Statistik dengan Microsoft Excel & SPSS. Yogyakarta:
Andi.
Santoso, S. (2011). Mastering SPSS Versi 19. Jakarta: PT Elex Media Komputindo.
Sekaran, U., & Bougie, R. (2013). Research Methods for Business. West Sussex: John Wiley &
Sons Ltd.
Suseno, B. (2013, April 18). Analisis chi square. Retrieved July 28, 2015, from Statisti Olah
Data: http://www.statistikolahdata.com/2013/04/analisis-chi-square.html
https://statistics.laerd.com/spss-tutorials/wilcoxon-signed-rank-test-using-spss-statistics.php
Black, K. (2013). Applied Business Statistics: Making Better Business Decisions. Hoboken, NJ:
John Wiley & Sons.
smartstat. (2010, Februari 20). Skala Pengukuran Variabel. Retrieved 5 20, 2016, from
www.smartstat.wordpress.com: https://smartstat.wordpress.com/2010/02/20/skala-
pengukuran-variabel/
www.organisasi.org. (2006, Juni 21). KLASIFIKASI, JENIS DAN MACAM DATA - PEMBAGIAN
DATA DALAM ILMU EKSAK SAINS STATISTIK / STATISTIKA. Retrieved 5 20, 2016,
from www.organisasi.org: http://www.organisasi.org/1970/01/klasifikasi-jenis-dan-
macam-data-pembagian-data-dalam-ilmu-eksak-sains-statistik-statistika.html
145