Professional Documents
Culture Documents
MAKALAH Disusun untuk memenuhi tugas mata kuliah Analisis Statistik Multivariat yang dibimbing oleh Ibu Trianingsih
oleh Bunga Suci Bintari A.Ali Syihabuddin Etika Wahyu Kartika Niken Susanti 908312410091 308312417490 308312417501 308312417502
UNIVERSITAS NEGERI MALANG FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM JURUSAN MATEMATIKA OKTOBER 2011
BAB I PENDAHULUAN
LATAR BELAKANG
Analisis diskriminan merupakan teknik menganalisis data, dimana variabel dependen merupakan data kategorik ( nominal dan ordinal ) sedangkan variabel independen berupa data interval atau rasio .Misalnya berdasarkan data dari nasabah peminjam kredit suatu bank, seperti penghasilan, umur, pekerjaan, tingkat pendidikan, ingin meramalkan apakah seseorang nasabah yang baru termasuk jujur atau tidak jujur. Analisis diskriminan ini termasuk dalam analisis multivariat dengan metode dependensi. Ada dua metode dalam analisis multivariat yaitu metode dependensi dan metode interdenpendensi . Metode dependensi yaitu variabel-variabelnya tidak saling bergantung satu dengan yang lain, sedangkan metode interdenpendensi adalah antarvariabelnya ada saling ketergantungan. Variabel dependen adalah data kategorikal. Jika data kategorikal terdiri dari dua kelompok atau kategori disebut Two-Group Discriminant Analysis , sedangkan jika lebih dari dua kategori disebut dengan Multiple Discriminant Analysis. Peranan dan aplikasi analisis diskriminan yang merupakan salah satu dari teknik statistik multivariat yang banyak digunakan dalam berbagai bidang ilmu yang terjadi dalam sebuah fenomena sosial, keuangan dan ekonomi Analisis diskriminan sangat menarik, karena ada banyak hal yang bisa dijawab dalam kehidupan ini jika memahami analisis diskriminan seperti : 1. Mengapa ada perusahaan yang bangkrut dan yang lain tetap berdiri? 2. Mengapa ada nasabah bank yang membayar hutang dengan lancar dan yang lain macet ? 3. Mengapa sebagian orang lebih suka bank swasta dibanding bank pemerintah? 4. Dengan analisis diskriminan,direktur personalia dapat meramalkan apakah seseorang calon karyawan perusahaan akan menjadi karyawan yang produktif atau tidak produktif. 5. Seorang direktur perusahaan dapat meramalkan apakah seorang pelanggan merupakan pelanggan loyal atau tidak. 6. Seorang direktur kredit suatu bank dapat meramalkan seseorang nasabah termasuk jujur atau tidak jujur.
Analisis diskriminan digunakan asalkan pertanyaan penelitian mengarah pada variabel tak bebas (dependent variable) yang berupa data kategori seperti : macetlancar,untung-rugi, puas-tidak puas dan lainnya. Analisis diskriminan adalah metode untuk mencari dasar pengelompokan individu berdasarkan lebih dari satu variabel bebas. Analisis Diskriminan dipakai untuk menjawab pertanyaan bagaimana individu dapat dimasukkan ke dalam kelompok berdasarkan beberapa variabel. Persamaan Fungsi Diskriminan yang dihasilkan untuk memberikan peramalan yang paling tepat untuk mengklasifikasi individu kedalam kelompok berdasarkan skor variabel bebas .
B. Rumusan Masalah 1. Apa saja factor yang sangat mempengaruhi konsumen membeli produk body lotion (A/B)? 2. Bagaimana Analisis fungsi diskriminan yang terbentuk?
C. Tujuan 1. untuk mengetahui factor yang snagat mempengaruhi konsumen membeli konsumen membeli produk lotion. 2. Untuk mengetahui analisis fungsi diskriminan yang terbentuk.
BAB II PEMBAHASAN
A. Kajian Teori 1. Analisis Diskriminan Analisis diskriminan adalah salah satu teknik statistik yang bisa digunakan pada hubungan dependensi (hubungan antarvariabel dimana sudah bisa dibedakan mana variabel terikat dan mana variabel bebas). Lebih spesifik lagi, analisis diskriminan digunakan pada kasus dimana variabel terikat berupa data kualitatif dan variabel bebas berupa data kuantitatif. Analisis diskriminan bertujuan untuk mengklasifikasikan suatu individu atau observasi ke dalam kelompok yang saling bebas (mutually exclusive/disjoint) dan menyeluruh (exhaustive ) berdasarkan sejumlah variabel bebas. Ada dua asumsi utama yang harus dipenuhi pada analisis diskriminan ini, yaitu: a. Sejumlah p variabel bebas harus berdistribusi normal. b. Matriks varians-covarians variabel bebas berukuran harus sama. Jika dianalogikan dengan regresi linier, maka analisis diskriminan merupakan kebalikannya. Pada regresi linier, variabel terikat yang harus mengikuti distribusi normal dan homoskedastis, sedangkan variabel bebas diasumsikan fixed, artinya variabel bebas tidak disyaratkan mengikuti sebaran tertentu. Untuk analisis diskriminan, variabel bebasnya seperti sudah disebutkan di atas harus mengikuti distribusi normal dan homoskedastis, sedangkan variabel terikatnya fixed. Analisis ini didasarkan atas fungsi diskriminan yang mempunyai bentuk umum: Dimana Y adalah kelompok merupakan variabel boneka (dummy variables) dan adalah variabel pembeda. Pada dasarnya fungsi diskriminan merupakan fungsi regresi ganda dengan variabel dependen merupakan variabel boneka yang mengambil nilai1,2,...,k yang sesuai dengan pengelompokan awal setiap individu dan banyaknya kelompok (k). 2. Uji Kenormalan Multivariat pada kedua kelompok
Menurut Karson(1982), untuk menguji kenormalan multivariate digunakan prosedur yang dikembangkan oleh Mardia (1970) dengan cara menghitung dua macam ukuran Statistic yaitu ukuran skewness (b1,p ) dan kurtosis (b2,p ) yaitu: ( ) ( ( ) ) ( ( ) )
( )
Hipotesis yang digunakan adalah: Ho : multivariate mengikuti sebaran normal H1 : multivariate tidak mengikuti sebaran normal Bila ( ( )( ) , dan [b2,p p (p+2)]/ ( ( ) )
3. Uji Kesamaan Matrik Kovarians Untuk menguji kesamaan matrik kovarians ( ) antar kelompok, digunakan hipotesa: Ho: = = =
H1: sedikitnya ada 2 kelompok yang berbeda Statistik uji yang digunakan adalah statistik Boxs, yaitu : -2 ln *= (n-k) ln |W / (n- k)|dimana:
( )
( -1) ln | |
* k
= banyaknya kelompok
W/(n-k)= matrik kovarians dalam kelompok gabungan Sj = matrik kovarians kelompok ke-j
4. Uji Vektor Nilai Rata-rata Pengujian terhadap vektor nilai rata-rata antarkelompok dilakukan denga hipotesa:
Statistik uji yang digunakan adalah statistik V-Bartlett, yang mengikut sebaran Chi-Kuadrat dengan derajat bebas ( Statistik V-Bartlett diperoleh melalui : [( Dimana, ) ] ( ) ), bila benar.
= banyaknya pengamatan = banyaknya peubah dalam fungsi pembeda (discriminant) = banyaknya kelompok
dengan, (
= matrik jumlah kuadrat dan hasil kali data dalam kelompok = matrik jumlah kuadrat dan hasil kali data antar kelompok )( ) maka menerima
Jika
Apabila ada perbedaan vektor nilai rataan, maka fungsi pembeda (discriminant) layak disusun untuk mengkaji hubungan antar kelompok dan berguna untuk mengelompokan suatu objek baru ke dalam salah satu kelompok tersebut. 5.
DATA
UJI NORMALITAS
UJI MULTIKOLINIERITA
ANALISIS DISKRIMINAN
DISKRIMINAN SKOR
CUTTING SKOR
HIT RASIO
KESIMPULAN
SELESAI
B. Aplikasi pada permasalahan sehari-hari Persaingan body lotion cukup menarik untuk diperhatikan, body lotion bagi sebagian wanita sudah menjadi bagian yang tidak terpisahkan dalam kehidupan sehari-hari. Oleh karena itu perlu dilakukan penelitian mengenai faktor apa saja yang diperhitungkan seorang konsumen untuk membeli produk body lotion sehingga produsen mampu menciptakan produk body lotion yang sesuai dengan ekspektasi konsumen. Data responden dilengkapi dengan pertanyaan produk yang digunakan A. Citra & B. Ponds, maka akan coba dilihatfaktor apa saja yang mempengaruhi seorang responden memilih produk A atau produk B. Untuk itu, akan dilakukan analisis diskriminan untuk mengetahui apa saja yang menjadi pertimbangan seorang pembeli cenderung membeli produk A atau produk B. Hasil analisis diskriminan ini memberikan manfaat bagi penjual (toko/swalayan) yaitu menentukan level stok persediaan produk dengan mempertimbangkan karakteristik pelanggan yang sering datang ke tokonya. Delapan faktor tersebut diinterpretasikan sebagai berikut: Faktor 1 : Kesegaran di Kulit Faktor 2 : Aroma Tahan Lama Faktor 3 : Kemasan Faktor 4 : Jangka Waktu Kadaluarsa Faktor 5 : Kekentalan Faktor 6 : Tidak menyebabkan alergi Faktor 7 : Ada Sample Gratis Faktor 8 : Kesesuaian Harga & Kualitas
.Tabel 3.1 Data Responden (8 faktor dari hasil analisis faktor) dan Jenis Produk yang Dipilih
No 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19. 20. 21. 22. 23. 24. 25. 26. 27. 28. 29. 30. Y 1.0 2.0 1.0 1.0 2.0 2.0 2.0 2.0 2.0 1.0 1.0 2.0 1.0 1.0 1.0 2.0 2.0 1.0 2.0 2.0 1.0 1.0 2.0 1.0 1.0 2.0 2.0 1.0 1.0 2.0 X1 1.21 0.13 0.96 1.14 -1.22 -0.81 0.58 -0.56 -0.53 1.12 1.13 -0.87 1.17 1.18 0.93 0.11 -0.98 1.42 -0.44 -0.71 -0.91 -1.02 0.18 -1.61 1.22 -0.86 -0.18 0.93 -1.78 -0.91 X2 0.97 -0.99 -0.45 0.96 -1.19 1.33 1.43 0.77 -0.13 0.56 0.45 -0.45 -0.93 -0.3 0.65 -0.98 -1.27 -1.59 -0.87 0.26 1.17 1.3 -1.18 1.52 -0.27 -1.23 0.03 0.65 -1.4 1.17 X3 0.53 -0.02 0.05 0.6 0.69 0.79 -0.2 0.05 1.71 1.74 0.89 -0.18 1.37 -0.23 -1.44 2.03 -0.51 -1.55 -1.14 -1.58 -0.2 -0.43 -1.4 -0.52 -0.6 -0.14 0.55 -1.44 0.8 -0.2 X4 -0.28 0.26 -1.24 -0.37 -0.02 1.03 0.82 0.9 -0.23 -0.84 1.07 -0.65 0.57 0.49 -0.6 -0.48 -1.21 -0.91 1.0 0.9 1.01 -3.58 0.75 -0.31 0.78 0.73 0.09 -0.6 -0.09 1.01 X5 -0.26 1.91 -1.5 -0.15 0.56 0.37 -0.91 -0.49 -1.04 0.26 -0.32 0.42 0.46 -1.98 2.1 0.49 -1.17 -0.62 -0.42 -1.52 0.63 -0.04 -0.27 -0.85 0.47 0.56 -0.12 2.1 0.7 0.63 X6 -0.44 -1.57 -0.8 -0.58 -0.93 -0.28 -0.58 -1.32 0.75 1.89 0.46 0.07 -1.07 -1.47 -0.21 -0.05 0.65 1.02 -0.36 -0.35 1.07 -0.39 1.74 -0.41 0.21 0.41 2.5 -0.21 -0.86 1.07 X7 -2.45 -0.44 0.7 -1.61 -0.37 -0.21 -0.46 0.17 1.34 0.75 -0.72 0.97 1.23 1.61 0.49 -0.63 -0.63 0.55 1.1 -0.48 1.22 0.08 -1.99 -0.56 0.1 -0.89 -0.1 0.49 -0.49 1.22 X8 0.51 0.36 1.11 0.45 -2.19 0.6 -1.21 -0.72 -0.11 -2.65 0.7 0.58 0.47 -0.05 0.09 1.6 1.28 -0.06 -0.77 0.45 1.11 -0.19 -0.98 -0.8 -1.01 0.89 0.3 0.09 -0.97 1.11
A. Uji Asumsi
a. Uji Normalitas
One-Sample Kolmogorov-Smirnov Test Kesesu aian Jangka Kesega ran Kulit
N Normal Parameters
a
Harga dan
Aroma Tahan lama 30 -.0003 1.00011 .141 .141 -.112 .773 .589
Waktu Kemas Kadalu Kekent an 30 .0007 1.0006 3 .114 .114 -.076 .623 .833 arsa 30 .0000 alan 30 .0000
Sampel Kwalita Gratis 30 -.0003 s 30 -.0003 1.0000 8 .125 .067 -.125 .684 .738
30
Mean Std. Deviation
.99966 .99994 .142 .142 -.134 .779 .579 .142 .142 -.078 .778 .581
.99929 .99910 .149 .149 -.059 .818 .515 .102 .078 -.102 .561 .912
Kolmogorov-Smirnov Z
Dari uji normalitas diatas terlihat bahwa pada test Kolmogorov-Smirnov Z signifikansi pada semua variabel bernilai lebih dari = 0.05, berarti semua variabel bebas berdistribusi normal.
b. Uji Multikolinieritas
Pooled Within-Groups Matrices
Kesesuai Jangka Tidak Ada an Harga Aroma Waktu Kekentala Menyebabk Sampel dan Tahan lama Kemasan Kadaluarsa n an Alergi Gratis Kwalitas -.125 1.000 .007 .081 -.016 .027 .016 .007 1.000 -.011 .002 -.003 .193 .081 -.011 1.000 .023 -.043 -.038 -.016 .002 .023 1.000 .009 .067 .027 -.003 -.043 .009 1.000 -.052 -.022 .003 .033 -.005 .011 .044 .018 -.002 -.030 .007 -.010
Kesegaran Kulit Correlation Kesegaran Kulit Aroma Tahan lama Kemasan Jangka Waktu Kadaluarsa Kekentalan Tidak Senyebabka n Alergi Ada Sampel Gratis 1.000 -.125 .016 .193 -.038 .067
-.052
-.022
.003
.033
-.005
.011
1.000
.008
Kesegaran Kulit Correlation Kesegaran Kulit Aroma Tahan lama Kemasan Jangka Waktu Kadaluarsa Kekentalan Tidak Senyebabka n Alergi Ada Sampel Gratis Kesesuaian Harga dan Kwalitas 1.000 -.125 .016 .193 -.038 .067
-.052
-.022
.003
.033
-.005
.011
1.000
.008
.044
.018
-.002
-.030
.007
-.010
.008
1.000
Dari table di atas terlihat bahawa tidak ada angka yang mencapai 0,5 atau di atasnya sehingga dapat disimpulkan tidak terjadi multikolinieritas pada data tersebut
c. Uji kesamaan matrik varian-kovarian
Test Results Box's M F Approx. df1 df2 Sig. 10.954 3.369 3 1.411E5 .018
Terlihat bahwa signifikansinya adalah 0,018 (< = 0,05), sehingga dapat disimpulkan bahwa tidak terdapat kesamaan antar variansi-kovariansi, namun karena 0,018 tidak terlalu jauh dari nilai 0,05 maka bisa dianggap masih ada peluang cukup untuk terjadi kesamaan variansikovanriansi.
Dari table diatas terlihat bahwa nilai signifikansi dari variable kesegaran kulit (0.007) dan jangka waktu kadaluarsa (0.073) bernilai kurang dari produk. Body lotion B. Pembentukan Model diskriminan
Canonical Discriminant Function Coefficients Function 1 Kesegaran Kulit Jangka Waktu Kadaluarsa (Constant) Unstandardized coefficients .995 -.689 .000
hal ini berarti bahwa kedua variable tersebut membedakan kedua kelompok
C. Uji Validasi a. Penghitungan diskriminan skor NO X1 X4 Y (diskriminan skor) 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19. 20. 21. 22. 23. 24. 25. 26. 27. 28. 29. 30. 1.21 0.13 0.96 1.14 -1.22 -0.81 0.58 -0.56 -0.53 1.12 1.13 -0.87 1.17 1.18 0.93 0.11 -0.98 1.42 -0.44 -0.71 -0.91 -1.02 0.18 -1.61 1.22 -0.86 -0.18 0.93 -1.78 -0.91 -0.28 0.26 -1.24 -0.37 -0.02 1.03 0.82 0.9 -0.23 -0.84 1.07 -0.65 0.57 0.49 -0.6 -0.48 -1.21 -0.91 1.0 0.9 1.01 -3.58 0.75 -0.31 0.78 0.73 0.09 -0.6 -0.09 1.01 1.39687 -0.04979 1.80956 1.38923 -1.20012 -1.51562 0.01212 -1.1773 -0.36888 1.69316 0.38712 -0.4178 0.77142 0.83649 1.33875 0.44017 -0.14141 2.03989 -1.1268 -1.32655 -1.60134 1.45172 -0.33765 -1.38836 0.67648 -1.35867 -0.24111 1.33875 -1.70909 -1.60134
Nilai yang dihasilkan dari fungsi diskriminan kemudian dibandingkan dengan nilai centroid produk A dan B, jika nilainya lebih dekat pada nilai centroid produk A, maka responden (konsumen) tersebut akan memiliki kecenderungan membeli produk A.Sebagai contoh pada data responden 1 karena data diskriminan scornya 1.39687 maka akan lebih dekan ke dalam kelompok 1 yaitu 0.695,dan seterusnya
NO
Y (diskriminan skor)
Kelompok awal
1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19. 20. 21. 22. 23. 24. 25. 26. 27. 28. 29. 30.
1.39687 -0.04979 1.80956 1.38923 -1.20012 -1.51562 0.01212 -1.1773 -0.36888 1.69316 0.38712 -0.4178 0.77142 0.83649 1.33875 0.44017 -0.14141 2.03989 -1.1268 -1.32655 -1.60134 1.45172 -0.33765 -1.38836 0.67648 -1.35867 -0.24111 1.33875 -1.70909 -1.60134
1.0 2.0 1.0 1.0 2.0 2.0 2.0 2.0 2.0 1.0 1.0 2.0 1.0 1.0 1.0 2.0 2.0 1.0 2.0 2.0 1.0 1.0 2.0 1.0 1.0 2.0 2.0 1.0 1.0 2.0
1 2 1 1 2 2
1
2 2 1 1 2 1 1 1
1
2 1 2 2
2
1 2
2
1 2 2 1
2
2
c. Hit Ratio Setelah semua observasi diprediksi keanggotaannya, dapat dihitung hit ratio, yaitu rasio antara observasi yang tepat pengklasifikasiannya dengan total seluruh observasi.
Classification Results
b,c
Count
1 2
1 2
a. Cross validation is done only for those cases in the analysis. In cross validation, each case is classified by the functions derived from all cases other than that case. b. 83.3% of original grouped cases correctly classified. c. 80.0% of cross-validated grouped cases correctly classified.
A. Kesimpulan Dari pembahasan diatas kita dapat mengetahui bahwa factor yang dominan yang mempengaruri konsumen untuk memilih produk A atau produk B adalah factor X1=kelembapan kulit,dan X4=jangka waktu kadaluarsa. Dari persamaan deskriminan , sudah cukup signifikan terlihat pada hit rasio pada prosentase sudah mencapai 80%.oleh karenanya B. Saran Dengan melihat kenyataan diatas maka manager perusahan body lotion tentunya akan lebih mempertimbangkan tingkat kelembaapan body lotion dan juga lama kadaluarsa suatu produk. Sehingga nantinya didapat suatu produk yang unggul.