You are on page 1of 38

BAHAN KULIAH AKADEMI METEOROLOGI & GEOFISIKA SEMESTER GANJIL TA.

2009/2010

STATISTIKA II (UM1742)
Urip Haryoko, MSi. Ir. Antoyo Setyadipratikto, Ah.MG.

Pendahuluan

Pendahuluan

Pendahuluan

Pendahuluan

Pendahuluan

Sasaran : Siswa memahami analisis time series


Materi
Analisis eksplorasi data 1. 2. 3. 4.

Sub
Ukuran-ukuran summari data numerik Eksplorasi data dengan grafis, Eksplorasi data berpasangan, Eksplorasi data berdimensi lebih dari dua

Pertemuan
1-2

Clustering Uji Hipotesis Analsis Time Series

1. Cara pengelompokan 2. Aplikasi clustering untuk ZOM 1. Significant level, 2. Metoda uji hipotesis 1. 2. 3. 4. 5. 1. 2. 3. 4. 5. Moving average, Fungsi autokorelasi dan auto korelasi parsial, Auto regresi, Analisis trend, Analisis harmonik Regresi linier sederhana, Regresi linier berganda, Autoregressive Forecasting (AR), Autoregressive Moving Average (ARMA), Autoregressive Integrated Moving Average (ARIMA),

3 4-6 8-10

Forecasting

11-14

1. UKURAN-UKURAN SUMMARY DATA NUMERIK


Latar Belakang
Robustness and Resistance Quantile

Ukuran summary
Lokasi (pemusatan) Penyebaran Simetris

1.1. Robustness and Resistance


Sifat-sifat yang penting dalam metode Exploratory Data Analysis (EDA) adalah robust (ketegaran) dan resistant (tahan). Robustness dan resistance adalah dua aspek ketidaksensitifitasan terhadap data. Metoda robust tidak perlu harus optimal dalam beberapa hal, namun mempunyai performa yang baik dalam hal yang lain. Misalkan statistik rata-2 sampel x-rata = xi / n adalah statistik yang terbaik untuk mengukur pemusatan data, jika diketahui bahwa data tersebut mengikuti distribusi Gauss. Namun jika data tersebut tidak mengikuti distribusi Gauss (misal : jika ada data ekstrim kejadian hujan), maka rata-rata sampel akan memperoleh nilai yang misleading. Sebaliknya, metodametoda robust secara umum tidak sensitif terhadap asumsi tentang data secara keseluruhan. Metoda resisten adalah dipengaruhi oleh sejumlah kecil outlier atau data aneh. Hasil dari metoda resistant hanya sedikit berubah jika sebagian kecil data diubah nilainya, meskipun perubahan itu secara drastis. Rata-rata sampel tidak mempunyai sifat resistant terhadap ukuran pemusatan data.

1.1. Robustness and Resistance


Misalkan data {11, 12, 13, 14, 15, 16, 17, 18 ,19). Rata-rata sampelnya adalah 15. Namun jika datanya diubah menjadi {11, 12, 13, 14, 15, 16, 17, 18 ,91), maka rata-ratanya menjadi 23. Ukuran-ukuran yang resistant dari pemusatan sekumpulan data hanya sedikit berubah atau bahkan tidak berubah sama sekali dengan mengganti angka 19 menjadi 91. Median resistant terhadap nilai ekstrim Rata-2 tidak resistant terhadap nilai ekstrim

1.2. QUANTILE
Quantile qp (0<p<1) qp = q0,5 = median q0,25, q0,5, q0,75 quartile q0,1, q0,2,.q0,9 deciles q0,01, q0,02, q0,03,q0,99 percentile

1.2. QUANTILE
q0,5 = median = x([n+1]/2) ... n ganjil = {x(n/2) + x([n/2]+1)}/2 n genap
Contoh : Jika terdapat 9 data (n=9), nilai median adalah q0,5 = x(5). Quartil bawah adalah q0,25 = x(3), quartil atas adalah q0,75 = x(7)

1.3. Ukuran Pemusatan


Ukuran pemusatan yang robust dan resistant adalah ukuran median Trimean = (q0,25+2q0,5+q0,75)/4
(Rata-rata tertimbang dari median dan quartil. Trimean merupakan ukuran resistant)

1.4. Ukuran penyebaran (spread)


Ukuran penyebaran (spread atau dispersion atau scale) yang umum, sederhana, robust dan resistant adalah interquartile range (jarak antar kuartil) IQR. IQR = q0,75 q0,25 Ukuran penyebaran yang konvensional : standard deviation

Koefisien Variasi : KV = (simpangan baku/rata)*100%

Median Absolute Deviation (MAD) MAD = median|xi q0,5|

1.5. Kesimetrisan
Skewness coefficient (koefisien kemiringan) [ 1/(n-1 ] (xi xrata)3 b1 = ---------------------------s3

1.5. Kesimetrisan
Kurtosis coefficient (koefisien keruncingan) [ 1/(n-1 ] (xi xrata)4 b2 = ---------------------------s4

2. Eksplorasi data dengan grafis


Stem and Leaf Display Boxplots Schematic plot Histogram Distribusi Frekuensi Kumulatif

2.1. Eksplorasi data dengan grafis

Stem and Leaf Display (diagram dahan daun)


2 8 19 02 20 224688

(10) 21 2244666668 13 22 00022224466 2 23 22

2.2. Eksplorasi data dengan grafis


Boxplot (Box and Whiskers Plot)
Boxplot of T-Bdg
23

maksimum Whiskers

22

Q1
Q2 BOX

T-Bdg

21

Q3

20

Whiskers
19

minimum

2.3. Eksplorasi data dengan grafis


Schematic plot Upper outer fence = q0,75 + 3 IQR Upper inner fence = q0,75 + 3 IQR/2 Lower inner fence = q0,25 - 3 IQR/2 Lower outer fence = q0,25 - 3 IQR
Boxplot of T-Bdg2
30

25

T-Bdg2

20

15

10

2.3. Eksplorasi data dengan grafis (schematic plot)


Boxplot of T-Bdg2; T-Jkt2
35

30

25
Data

20

15

10 T-Bdg2 T-Jkt2

2.4. Eksplorasi data dengan grafis


Histogram
FREKUENSI BAGI HASIL 229 TANAMAN KEDELAI RICHLAND
45 40 35 FREKUENSI 30

25
20 15 10

5
0 3 8 13 18 23 28 33 38 43 48 HASIL (GR/TANAMAN) 53 58 63 68

2.5. Eksplorasi data dengan grafis


Distribusi Frekuensi Kumulatif
DISTRIBUSI FREKUENSI KUMULATIF USIA 150 WANITA PESERTA PROGRAM KB
150 120 JUMLAH ( ORG ) 90 60 30 0 < 15

DISTRIBUSI FREKUENSI KUMULATIF USIA 150 WANITA PESERTA PROGRAM KB


100% JUMLAH ( PERSEN ) 80% 60% 40% 20%

< 20

< 25

< 30 < 35 USIA ( TH )

< 40

< 45

0% < 15

< 20

< 25

< 30

< 35

< 40

< 45

USIA ( TH )

2.5. Eksplorasi data dengan grafis


Distribusi Frekuensi Kumulatif
FREKUENSI HARI HUJAN BULANAN DI KARANGKATES - MALANG
100% 90% 80%
JUMLAH KEJADIAN 26-31 HR 21-25 HR 16-20 HR

70%
60% 50%

11-15 HR

40% 30% 20% 10% 0% 1 2 3 4 5 6 7 BULAN 8 9 10 11 12


6-10 HR 0-5 HR

Tugas mandiri / PR :
Data : Hujan dan suhu Sta Tanjung Priok dan Pondok Betung Lakukan eksplorasi data sbb :
1. Summary data (pemusatan, penyebaran dan kesimetrisan) 2. Eksplorasi data dengan grafis

Berikan analisis singkat AS MUCH AS POSSIBLE

BAHAN KULIAH AKADEMI METEOROLOGI & GEOFISIKA SEMESTER GANJIL TA. 2009/2010

STATISTIKA II (UM1742)

3. Eksplorasi data berpasangan


Scatterplots Pearson Correlation Rank Correlation Serial Correlation

3.1. Scatterplot Diagram


Scatterplot of Suhu_rata2 vs RH_rata2 Staklim Pondok Betung
30 29

Suhu_rata2

28

27

26

25 65 70 75 80 RH_rata2 85 90

3.2. Pearson Correlation


Analisis Korelasi : menyelidiki ada tidaknya hubungan dua peubah atau lebih Koefisien korelasi : untuk mengukur tingginya derajad hubungan Korelasi linier : hubungan peubah acak X dan Y yang membentuk garis lurus Arah hubungan eubah dapat bernilai positif atau negatif Koefisien korelasi populasi :

Koefisien korelasi sampel :

DATA IKLIM STAKLIM PONDOK BETUNG kode_stasiun


96733 96733 96733 96733 96733 96733 96733 96733 96733 96733 96733 96733 96733 96733 96733 96733 96733 96733 96733

Tahun
1995 1995 1995 1995 1995 1995 1995 1995 1995 1995 1995 1995 1996 1996 1996 1996 1996 1996 1996

Bulan
1 2 3 4 5 6 7 8 9 10 11 12 1 2 3 4 5 6 7

Hujan
394.5 217.4 289.2 154.1 189.2 328.0 95.9 0.0 303.4 243.8 189.5 174.0 270.8 482.4 277.9 291.3 68.3 55.0 36.0

HH
26 25 26 15 15 16 9 0 11 19 24 16 18 21 15 19 10 9 8

Suhu_rata2 Suhu_max Suhu_min RH_min RH_max RH_rata2


26.6 26.6 26.6 27.5 27.7 27.2 27.3 27.5 27.4 27.4 26.7 26.7 26.2 26.2 26.6 27.2 27.9 27.7 27.7 33 39 34 34.2 34.2 34.4 33.7 35.4 35.2 34.2 33.6 34.1 34.8 32.4 34 35.2 35 35.2 35 22.2 22.6 22.5 23 22.8 22.6 22 22 19.6 22 22.4 22.5 21.6 22.2 21.3 22.5 22.5 20.2 20.4 59 56 50 47 51 49 41 38 34 50 56 53 58 66 54 44 43 45 41 100 100 100 98 98 98 99 95 92 100 99 98 99 100 100 100 97 98 95 85 84 85 80 81 82 78 71 75 80 85 82 85 88 86 84 78 79 76

Scatterplot of Suhu_rata2 vs RH_rata2 Staklim Pondok Betung

X : suhu rata-rata Y : RH rata-rata rxy : - 0,53 Hubungan antara X dan Y negatif Jika X naik maka Y turun

30 29

Suhu_rata2

28

27

26

25 65 70 75 80 RH_rata2 85 90

3.3. Rank Correlation


Korelasi antar peubah yang disusun berurut (rank) rrank = 1- [6 di2] / [n(n2-1)]

3.4. Serial Correlation


Korelasi untuk data time series Korelasi antara data ke-t dengan data ke t-k Misal : korelasi antara curah hujan bulan berjalan dengan curah hujan sebelumnya (ryt yt-1) atau r1 (k=1 atau lag =1)

3.4. Serial Correlation


DATA IKLIM STAKLIM PONDOK BETUNG

(ryt yt-1) =0.37

kode_stasiun Tahun Bulan 96733 1995 1 96733 1995 2 96733 1995 3 96733 1995 4 96733 1995 5 96733 1995 6 96733 1995 7 96733 1995 8 96733 1995 9 96733 1995 10 96733 1995 11 96733 1995 12 96733 1996 1 96733 1996 2 96733 1996 3 96733 1996 4 96733 1996 5 96733 1996 6 96733 1996 7

t 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19

Hujan ke-t 394.5 217.4 289.2 154.1 189.2 328.0 95.9 0.0 303.4 243.8 189.5 174.0 270.8 482.4 277.9 291.3 68.3 55.0 36.0

Hujan ke-(t-1) 394.5 217.4 289.2 154.1 189.2 328.0 95.9 0.0 303.4 243.8 189.5 174.0 270.8 482.4 277.9 291.3 68.3 55.0

4. Eksplorasi data berdimensi lebih dari dua Correlation Matrix Scatterplot Matrix Correlation Map

4.1. Correlation Matrix


Aceh Bengkulu Jambi Medan Meulaboh Padang nino dmi monsun Sabang -0.156 -0.135 -0.094 -0.285 0.047 0.242 0.180 0.356 0.030 Aceh -0.088 -0.026 0.295 0.294 0.387 0.118 -0.243 0.341 Bengkulu 0.709 -0.016 0.267 0.287 -0.432 -0.435 -0.014 Jambi Medan Meulaboh

-0.065 0.118 0.198 -0.421 -0.538 0.042

0.330 0.250 0.000 -0.122 -0.246

0.504 -0.092 -0.108 -0.016

4.2. Scatter Plot Matrix


Matrix Plot of Sabang, Aceh, Bengkulu, Jambi, Medan, Meulaboh, ...
-60 0 60 -80 0 80 -100 0 100 -1 0 1 -1 0 1
200 100

Sabang
60 0 -60

Aceh
200

Bengkulu
100 0 -100

0 -200

Jambi
100

Medan
100 0 -100

0 -100

Meulaboh
200

Padang
1 0 -1

0 -200

nino
2

dmi
1 0 -1

0 -2

monsun 0 100 200 -200 0 200 -100 0 100 -200 0 200 -2 0 2

4.3. Correlation Map :


Peta yang menggabarkan hubungan antara dua peubah

Tugas
Data : Hujan dan suhu Sta Tanjung Priok dan Pondok Betung Lakukan eksplorasi data sbb :
1. Summary data (pemusatan, penyebaran dan kesimetrisan) 2. Eksplorasi data dengan grafik 3. Eksplorasi data berpasangan (korelasi)

Berikan analisis singkat AS MUCH AS POSSIBLE

You might also like