You are on page 1of 9

SUMBER DATA

Data yang digunakan untuk melakukan analisis PCA berikut diambil dari buku “Statistika
Lingkungan Hidup 2022” yang diunduh dari website bps.go.id. Berikut ini adalah preview dari
data tersebut
Kecepatan Angin Kelembaban Jumlah Curah Jumlah Hari Penyinaran
Provinsi
(m/det) Udara Hujan (mm) Hujan (hari) Matahari (%)
Aceh 4.06 76.48 1834.1 162 5.1
Sumatera Utara 3.59 77.83 3269.5 200 4.5
Sumatera Barat 1.98 81.18 4950.5 223 4.51
Riau 0.82 76.21 3231.1 168 4.52
Jambi 1.34 86.33 3265.6 174 4.21
Sumatera Selatan 2.55 81.17 3250.2 219 4.07
Bengkulu 4.66 77.11 4518.5 201 5.95
Lampung 1.79 77.61 2099.1 162 4.86
Kepulauan Bangka
Belitung
3.11 83.3 3026.7 234 3.74
Kepulauan Riau 4.72 83.58 2590.6 204 4.51
DKI Jakarta 2.36 77.21 2136.3 158 3.85
Jawa Barat 1.77 84.75 3505.4 239 4.92
Jawa Tengah 4.04 76.29 2643.9 188 6.02
DI Yogyakarta 3.43 78.19 3161.2 214 4.55
Jawa Timur 3.35 78.34 3059.7 211 5.5
Banten 2.73 78.22 2877.2 201 4.21
Bali 3.72 81.14 2834.4 200 5.92
Nusa Tenggara
Barat
3.77 77.96 2649.9 168 6.6
Nusa Tenggara
Timur
3.43 73.66 2183 127 7.79
Kalimantan Barat 2.72 79.72 3040.6 200 4.93
Kalimantan Tengah 3.53 84 3259.1 240 4.81
Kalimantan Selatan 2.71 78.65 2738.1 206 4.21
Kalimantan Timur 2.77 83.18 3313.7 224 4.3
Kalimantan Utara 3.09 84.2 2065.3 207 5.01
Sulawesi Utara 1.8 80.11 3529.8 256 4.77
Sulawesi Tengah 4.12 80.17 879.4 175 5.01
Sulawesi Selatan 3.73 79.73 4650.9 209 5.67
Sulawesi Tenggara 1.71 79.51 2695.4 222 4.24
Gorontalo 1.15 77.19 2082.8 202 4.35
Sulawesi Barat 3.04 84.54 2395.8 168 6
Maluku 2.09 82.24 3766 244 5.54
Maluku Utara 4.74 85.14 2913.9 238 5.5
Papua Barat 1.66 84.42 1549 174 4.69
Papua 1.31 84.09 2576.3 207 5.27

UJI ASUMSI
1. Normalitas Multivariat
Berikut akan dilakukan pengujian asumsi normalitas multivariat menggunakan Uji Mardia
pada variabel-variabel data iklim 2022 dengan menggunakan bantuan Software R:
 Hipotesis
H 0 : Data variabel berdistribusi normal multivariat.
H 1 : Data variabel tidak berdistribusi normal multivariat.

 Taraf Signifikansi
𝛼 = 5%

 Statistik Uji
Mardia Skewness dan Mardia Kurtosis

 Kriteria Uji
Tolak H 0 jika 𝑝 – 𝑣𝑎𝑙𝑢𝑒 < α , terima dalam hal lainnya
 Pengujian dengan bantuan software R

 QQ Plot Jarak Mahalanobis


 Keputusan
Berdasarkan hasil perhitungan tersebut, karena nilai 𝑝 – 𝑣𝑎𝑙𝑢𝑒 pada mardia skewness dan
mardia kurtosis lebih besar dari α =5 % , maka H0 diterima
 Keputusan
Berdasarkan hasil perhitungan menggunakan software R tersebut, maka dapat
disimpulkan bahwa data berdistribusi normal multivariat. Secara visual, QQ plot pada
gambar di atas menunjukkan bahwa titik data tersebar di sekitar garis lurus
2. Uji Homogenitas Varians
Berikut akan dilakukan pengujian asumsi homogenitas varians dengan Uji Bartlett pada
variabel-variabel data iklim 2022 dengan menggunakan bantuan Software R:
 Hipotesis
H 0 : Data Memiliki Varians yang Homogen
H 1 : Data Memiliki Varians yang Tidak Homogen

 Taraf Signifikansi
α =5 %=0,05

 Statistik Uji
Bartlett’s Test
 Kriteria Uji
Tolak H 0 jika p−value<α

 Perhitungan Menggunakan Software R

 Keputusan
Berdasarkan hasil perhitungn tersebut, karena nilai 𝑝 – 𝑣𝑎𝑙𝑢𝑒 lebih kecil daripada α =5 %
, maka H0 ditolak
 Keputusan
Berdasarkan hasil perhitungan menggunakan software R tersebut, maka dapat
disimpulkan bahwa data tidak memiliki varians yang homogen.

ANALISIS KOMPONEN UTAMA


1. Standardisasi Data
Karena satuan pada variabel data iklim berbeda, maka dilakukan standardisasi data
untuk mengubah data ke skala yang sebanding. Standardisasi data dapat dilakukan
dengan software R menggunakan syntax berikut:
#===== Standardisasi Data
> # untuk mengubah data ke skala yang sebanding
> # jika ada perbedaan besar antara rentang variabel>
> X <- as.matrix(scale(data_used))
> X

2. Membentuk matriks varians kovarians dan matriks korelasi.


Untuk memahami hubungan antar variabel dengan menggunakan software R,
didapatkan nilai matrix varians kovarians dan matrik skorelasi sebagai berikut:

3. Menghitung Nilai Eigen Dan Vektor Eigen


Karena asumsi homogenitas varians tidak terpenuhi, maka digunakanlah matriks
korelasi untuk menentukan nilai eigen dan vektor eigen. Dengan menggunakan
software R didapatkan hasil sebagai berikut:

4. Menentukan Analisis Komponen Utama


Analisis komponen utama dapat dilakukan menggunakan software R dengan fungsi
princomp. Output yang dikeluarkan akan menghasilkan persamaan dari komponen
utama. Dengan menggunakan software R didapatkan hasil sebagai berikut :

Berdasarkan hasil perhitungan tersebut, dapat dilihat nilai proporsi kumulatif > 80%
berada di Comp 3. Artinya komponen utama 1, 2, dan 3 dapat menjelaskan sekitar
83% informasi dari ke 5 variabel asal.

5. Visualisasi Hasil Komponen Utama


 Menentukan jumlah komponen utama dengan melihat Barplot
Penentuan jumlah komponen dapat dilakukan dengan meihat barplot. Jika
menggunakan barplot, maka banyak komponen yang diambil adalah pada titik
grafik tidak lagi menurun tajam atau mulai melandai.

 Menentukan jumlah komponen utama dengan melihat Scree Plot


Jika menggunakan scree plot banyak komponen yang diambil adalah pada titik
kurva tidak lagi menurun tajam atau mulai melandai. Atau banyaknya komponen
utama yang diambil adalah komponen utama yang memiliki nilai eigen lebih
dari satu.

 Menentukan jumlah komponen utama dengan melihat plot nilai eigen


Banyaknya komponen utama yang diambil adalah komponen utama yang
memiliki nilai eigen lebih dari satu. Berikut adalah hasil run menggunakan
software R:

Berdasarkan hasil perhitungan tersebut, karena komponen 1, 2, dan 3 dapat


menjelaskan sekitas 83% dari informasi keseluruhan data, maka didapatakan
persamaan komponen utama sebagai berikut:

Y 1 = 0.2715854(X1) - 0.4638257(X2) - 0.378454(X3) - 0.598220(X4) - 0.4582712(X5)


Y2 = 0.628854714(X1) + 0.000802967(X2) + 0.522957706(X3) + 0.320227255(X4) + 0.478028081(X5)
Y3 = 0.4250137(X1) + 0.7003383(X2) - 0.57086964(X3) + 0.03985572(X4) + 0.03753666(X5)

You might also like