Professional Documents
Culture Documents
yˆ = b0 + b1 x y
Garis regresi
slope
b0 = intercept sampel
b1 = slope sampel
Keduanya dicari dengan analisis kuadrat
terkecil (least square analysis): proses di
mana model regresi dicari yang menghasilkan intercept Error pada prediksi
jumlah error kuadrat terkecil
x
1
Slope dan Intercept Sampel Analisis Residual
ΣxΣy
SS xy = Σ( x − x )( y − y ) = Σxy − Residual = error garis regresi = perbedaan
n antara y prediksi (dari persamaan regresi) dan y
(Σx ) 2 aktual = y − yˆ
SS xx = Σ( x − x ) 2 = Σx 2 −
n Tujuan analisis Residual: menguji sebagian atau
seluruh asumsi yang mendasari regresi
SS xy
b1 = sederhana, yaitu:
SS xx
Model adalah linear
Suku error mempunyai varians yang konstan
Σy Σx
b0 = y − b1 x = − b1
Semua suku error: independen
n n
Suku error terdistribusi normal
x x
0 0
x x
Cara alternatif untuk mempelajari error pada se adalah deviasi standar error pada model
regresi regresi
Merupakan satu ukuran error pada regresi SSE
se =
n−2
Dapat digunakan untuk
SSE = Σ( y − yˆ ) 2 = Σy 2 − b0 Σy − b1Σxy
mempelajari error pada model
mengestimasi outliers
2
Standard Error of The Estimate se
Koefisien Determinasi r2
(lanjutan)
y r2 = variabilitas variabel bergantung yang
diakibatkan oleh variabel bebas x
Bernilai antara 0 sampai dengan 1
r2 = 0 artinya: prediktor (x) tidak
Error terdistribusi normal mempengaruhi variabilitas y;
dengan rata-rata = 0 dan
deviasi standar = se r2 = 1 artinya: variabilitas y seluruhnya
x
diakibatkan oleh prediktor x
r = -0.57 r = 0.005
x x
y y
r = 0.69 r = 0.034
x x
3
Koefisien Korelasi Pearson r
Analisis Regresi dengan MINITAB
dengan MINITAB
Row x y
Stat → Basic Statistics → Correlation Stat → Regression→ Regression
1 140 25
2 119 29
3 103 46
4 91 70
5 65 88
6 29 112
7 24 128
Residuals Versus x
(response is y)
0
Residual
-5
-10
40 90 140
Regression Analysis
p-value untuk
Testing the Slope
The regression equation is menguji slope
y = 144 - 0.898 x b1 − β1, 0
Statistik uji: t= dengan
Predictor Coef StDev T P sb
Constant 144.414 6.220 23.22 0.000
x -0.89824 0.06816 -13.18 0.000 se
sb =
S = 7.377 R-Sq = 97.2% R-Sq(adj) = 96.6% SS xx
Analysis of Variance
SSE
se =
Source
Regression
DF
1
SS
9452.7
MS
9452.7
F
173.69
P
0.000
n−2
Error 5 272.1 54.4
( Σx ) 2
Total 6 9724.9
SS xx = Σx 2 −
se = √MSE p-value untuk n
menguji overall
model
4
Testing the Slope (lanjutan) Testing the Slope (lanjutan)
H0: β1 = β1,0 vs Ha: β1 < β1,0 H0: β1 = β1,0 vs Ha: β1 > β1,0
Distribusi t dengan
derajat bebas = n-2 Distribusi t dengan derajat bebas = n-2
R:: t < -tα
R:: t > tα
α 1-α
1-α α
t
t 0
− tα ,n − 2
0 tα ,n − 2
1 ( x0 − x ) 2 100
yˆ ± t α se +
,n− 2 n SS xx
y
2
50
1 (x − x)
0 95% PI
2
yˆ ± t α se 1+ + 0 40 90 140
2
,n −2 n SS xx x
5
MINITAB: Stat → Regression → Regression →
Option
Bagian 2
New Obs x
1 75.0
Row Price SqFt Age Regression Analysis: Price versus SqFt, Age
6
Menguji Signifikansi Koefisien
Menguji Overall Model
Regresi
H0: β1 = β2 = ….. = βk = 0 H0: β1 = 0 versus Ha: β1 ≠ 0
Ha: sedikitnya satu koefisien regresi ≠ 0 Pada contoh di atas, nilai p untuk β1 adalah
0.000 < α (= 5%) → tolak H0. Artinya, variabel
Statistik uji: F (lihat tabel ANOVA) SqFt berpengaruh secara signifikan terhadap
SSR variabel Price.
F= k H0: β2 = 0 versus Ha: β2 ≠ 0
SSE Pada contoh di atas, nilai p untuk β2 adalah
n − k −1 0.008 < α (= 5%) → tolak H0. Artinya, variabel
Age berpengaruh secara signifikan terhadap
Pada contoh di atas: nilai p (=0.000) < α (= 5%) → tolak variabel Price.
H0. Jadi, sedikitnya satu koefisien regresi ≠ 0
7
Row Sales N_of_Rep N_sqr
1 2.1 2 4
500
2 3.6 1 1
3 6.2 2 4
400
4 10.4 3 9
5 22.8 4 16
300
6 35.6 4 16
Sales
7 57.1 5 25
200
8 83.5 5 25
9 109.4 6 36
100
10 128.6 7 49
11 196.8 8 64
0
12 280.0 10 100
13 462.3 11 121 0 5 10
N_of_Rep
dikuadratkan
Analysis of Variance
Source DF SS MS F P
Regression 2 215069 107534 177.79 0.000
Residual Error 10 6048 605
Total 12 221117
Analysis of Variance
Source DF SS MS F P
Regression 1 192395 192395 73.69 0.000
Residual Error 11 28721 2611
Total 12 221117 log y, -1/√y, ….atau log y, -1/√y, ….atau
log x, -1/√x, …. x2, x3, …..
8
Model Regresi dengan Interaksi Transformasi Model
y = β 0 + β1 x1 + β 2 x2 + β 3 x1 x2 + ε
Contoh: y = β 0 x β1 ε
suku interaksi
jelas bukan merupakan model linear. Namun jika
ditransformasi menjadi
x1x2 adalah suku interaksi
log y = log β 0 + β1 log x + ε
Di dalam proses regresi, x1x2 disubstitusi dengan
variabel x3 sehingga model regresinya menjadi y ' = β 0 '+ β1 ' x' dengan
y' = log y
y = β 0 + β1 x1 + β 2 x2 + β 3 x3 + ε
β0' = log β0 dan
x' = log x
12
Row y x log_y log_x
10
bo = 10 −1.25306 = 0.0558393
Output MINITAB Jadi, model regresi dinyatakan dalam variabel asal adalah
0.5
S = 0.06328 R-Sq = 98.2% R-Sq(adj) = 97.9%
Analysis of Variance
0.0
Source DF SS MS F P
Regression 1 1.3389 1.3389 334.32 0.000
Residual Error 6 0.0240 0.0040 2 3 4 5
9
Variabel Indikator (dummy) Contoh Variabel Indikator
Variabel kualitatif hanya memberikan Variabel Kualitatif: Lokasi
Tempat Variabel Dummy
informasi data pada level nominal atau tempat tinggal. Ada 4 tinggal
pilihan: Jakarta, di
ordinal Bandung, Surabaya,
Jkt Bdg Sby
Mdn 0 0 0
10
Row Y X1 X2 X3 X4
MINITAB: Stat → Regression→ Stepwise
1 101 2 77 1.2 42
2 127 4 72 1.7 26
3 98 9 69 2.4 47
4 79 5 53 2.6 65
5 118 3 88 2.9 37
6 114 1 53 2.7 28
Contoh Data 7 110 3 82 2.8 29
8 94 2 61 2.6 22
9 96 8 60 2.4 48 Untuk memilih
10 73 6 64 2.1 42 Stepwise,
11 108 2 76 1.8 34 Forward, atau
12 124 5 74 2.2 11 Backward
13 82 6 50 1.5 61
14 89 9 57 1.6 53
15 76 1 72 2.0 72
16 109 3 74 2.8 36
17 123 2 99 2.6 17
18 125 6 81 2.5 48
Stepwise Regression: Y versus X1, X2, X3, X4 Stepwise Regression: y versus x1, x2, x3, x4
Step 1 2
Constant 133.53 91.01 Step 1 2
Constant 133.53 91.01
X4 -0.78 -0.60
x4 -0.78 -0.60
T-Value -4.20 -3.22 Kesimpulan: hanya x2 dan x4 Kesimpulan: hanya x2 dan x4
T-Value -4.20 -3.22
P-Value 0.001 0.006 yang sebaiknya digunakan P-Value 0.001 0.006 yang sebaiknya digunakan
dalam model. Variabel x1 dan dalam model. Variabel x1 dan
X2 0.51 x3 tidak signifikan terhadap x2 0.51 x3 tidak signifikan terhadap
T-Value 2.15 perubahan y. T-Value 2.15 perubahan y.
P-Value 0.048 P-Value 0.048
Step 1 2 3
Constant 83.96 86.93 91.01
Bagian 4
x1 0.6 0.6
T-Value 0.50 0.51
P-Value 0.623 0.617
11
Data Kategori Chi-Square Goodness of Fit Test
adalah data non numerik yang merupakan hitungan digunakan untuk menganalisis probabilitas trial distribusi
frekuensi dua atau lebih kategori dari satu atau lebih multinomial pada satu dimensi.
variabel Contoh: Kelas ekonomi (satu dimensi) dengan
Contoh: kemungkinan outcome:
Kelas bawah
60
Kelas menengah
50
Kelas atas
Membandingkan frekuensi kategori teoritis (expected)
Sum of Frek
40
dari populasi, dengan frekuensi kategori aktual
30 (observed), apakah sama atau tidak sama.
20
A B C D E
Nilai
fe
Kelas Kelas df = k – 1 – c
Atas Ekonomi Atas Ekonomi f0 = frekuensi hasil pengamatan
Bwh Menengah Bwh Menengah
fe = frekuensi yang diduga
dibandingkan
k= banyaknya kategori
O = Observed (yang diamati, aktual) c = banyaknya parameter yang diestimasi dari data
E = Expected (yang diduga, teoritis) sampel, miaslnya 0 (uniform), 1 (Poisson), 2 (Normal)
12
Data Jawab
Banyaknya kedatangan Frekuensi yang diamati H0: distribusi yang diamati sama dengan
fo distribusi yang diduga (Poisson)
Ha: distribusi yang diamati tidak sama dengan
0 7 distribusi yang diduga (Poisson)
1 18 c = 1 (hanya 1 parameter yang diestimasi, yaitu
2 25 λ)
3 17 k=6
4 12 df = k – 1 – c = 6 – 1 – 1 = 4
>5 5 α = 5%
R: χ2 > χ2 0.05,4 = 9.488
13
Review tentang Probabilitas Uji Hipotesa
A B H0: kedua variabel kategori independen (tidak saling
bergantung)
Ha: kedua variabel kategori saling bergantung
Statistik uji: ( f − f )2
χ 2 = ∑∑ o e
fe
df = (r – 1)(c – 1)
r= banyaknya baris
c = banyaknya kolom
f0 = frekuensi hasil pengamatan ni n j
A∩B fe = frekuensi yang diduga = eij =
Jika A dan B independen, maka P(A∩B) = P(A) * P(B) ni = total baris i N
Note: P(A∩B) dapat ditulis P(AB), dibaca Probabilitas nj = total kolom j
(A dan B terjadi) N = total semua frekuensi
Data Jawab
H0: jenis minuman yang dipesan tidak bergantung pada
usia pemesan
Minuman yang dipesan
Ha: jenis minuman yang dipesan bergantung pada usia
Minuman Lain-lain pemesan
Teh/Kopi Statistik uji
ringan (susu dll)
( fo − fe )
2
χ 2 = ∑∑
21-34 26 95 18 fe
r=3
Usia 35-55 41 40 20 c=3
df = (3-1)(3-1) = 4
>55 24 13 32
α = 5%
R: χ2 > χ2 0.05,4 = 9.4877
14
Menghitung frekuensi yang diduga fe
Statistik uji
Minuman yang dipesan ( fo − fe )2 (26− 40.94)2 (95− 66.58)2 (32−15.63)2
Minuman Lain-lain χ 2 = ∑∑ = + + ........... +
Teh/Kopi fe 40.94 66.58 15.63
ringan (susu dll)
= 59.41
(40.94) (66.58) (31.49)
21-34 139
26 95 18 Karena χ2 > 9.4877 maka H0 ditolak.
Usia (29.74) (48.38) (22.88) Artinya, jenis minuman yang dipesan pada
35-55 101
41 40 20
saat makan siang di suatu restoran
(20.32) (33.05) (15.63)
>55 69 bergantung pada usia pemesannya.
24 13 32
91 148 70 309 Dengan MINITAB: Stat → Table → Chi-
139 *148 69 * 91
Square Test
e12 = = 66.58 e31 = = 20.32
309 309
2 41 40 20 101
29.74 48.38 22.88
3 24 13 32 69
20.32 33.05 15.63
sama dengan
yang
Total 91 148 70 309
telah dihitung
15
Statistika Parametrik vs Statistika Keuntungan Statistika
Nonparametrik (lanjutan) Nonparametrik
Statistika Nonparametrik: Kadang-kadang tidak ada alternatifnya pada
statistika parametrik
Cocok untuk data yang tidak memenuhi asumsi
statistika parametrik atau yang berjenis kualitatif Uji nonparametrik tertentu dapat digunakan
untuk analisis data nominal
Disebut juga distribution-free statistics
Uji nonparametrik tertentu dapat digunakan
Didasarkan atas lebih sedikit asumsi mengenai untuk analisis data ordinal
populasi dan parameter dibandingkan dengan
Proses perhitungan pada statistika
statistika parametrik.
nonparametrik biasanya lebih sederhana
Ada yang dapat digunakan untuk data nominal dibandingkan pada statistika parametrik,
Ada yang dapat digunakan untuk data ordinal khususnya untuk sampel kecil
Kekurangan Statistika
Runs Test
Nonparametrik
Runs Test satu sampel adalah pengujian
Uji nonparametrik menjadi tak berguna nonparametrik untuk menguji keacakan
apabila uji parametrik untuk data yang (randomness)
sama tersedia H0: pengamatan pada sampel terjadi secara
acak
Uji nonparametrik pada umumnya tidak Ha: pengamatan pada sampel terjadi secara
tersedia secara luas dibandingkan dengan tidak acak
uji parametrik Ide:
PWPWPWPWPWPWPWPWPW → tidak acak
Untuk sampel besar, perhitungan untuk (banyaknya runs = 18)
statistika nonparametrik menjadi rumit
PPPPPPPPPWWWWWWWWW → tidak acak
(banyaknya runs = 2)
Jadi: jika runs terlalu banyak atau terlalu sedikit →
tidak acak
16
Solusi dengan MINITAB
Dapat digunakan untuk sampel kecil maupun
besar
Ubah data menjadi 1 dan 0 saja, tulis di sebuah
kolom
Data Display
C1
1 0 0 0 0 0 1 0 0 1 0 0
0 0 1 0 1 0 0 0 1 1 1 0
0 0
Runs Test dengan Sampel Besar Runs Test dengan Sampel Besar
(lanjutan) (lanjutan)
H0: pengamatan pada sampel terjadi secara acak Apakah sequence ini terjadi secara acak?
Ha: pengamatan pada sampel terjadi secara tidak acak Gunakan α = 5%
NNN F NNNNNNN F NN FF NNNNNN F NNNN F
R − µR NNNNNN FFFF NNNNNNNNNNNN
Statistik uji z =
σR Distribusi Normal Standar JAWAB
Daerah penolakan Daerah penolakan H0: pengamatan pada sampel terjadi secara acak
Ha: pengamatan pada sampel terjadi secara tidak acak
α α
2 1-α 2 n1 = 40 (banyaknya N)
n2 = 10 (banyaknya F)
Z
− Zα 0 Zα R = 13 (banyaknya runs)
R − µR
2 2
Statistik uji
Daerah penolakan : Z > Z α z=
2 σR
17
2n1n2
µR = + 1 = 17 Runs Test: C1
n1 + n2
C1
2n1n2 ( 2n1n2 − n1 − n2 )
σR = = 2.213 K = 0.5000
(n1 + n2 ) 2 (n1 + n2 − 1)
13 − 17
z= = −1.81 The observed number of runs = 13
2.213 The expected number of runs = 17.0000
40 Observations above K 10 below
Dengan α = 0.05, daerah penolakan adalah jika * N Small -- The following approximation may be invalid
|z| > z0.025 = 1.96. The test is significant at 0.0707
Karena z = -1.81 berada di luar daerah Cannot reject at alpha = 0.05
penolakan, maka pertahankan H0. Artinya, data
tersebut memang terjadi secara acak. Karena p-value > α, maka
Dengan MINITAB: Stat → Nonparametrics → pertahankan Ho. Artinya urutan Ekivalen
dengan p-value
Runs Test data tersebut memang acak (nilai p)
18
Data (sampel) Jawab
Pekerja Kesehatan ($) Pekerja Pendidikan ($)
Karena populasi tidak dapat diasumsikan
20.10 26.19 normal, maka uji t 2 sampel tidak dapat
19.80 23.88 digunakan (meskipun level data adalah rasio).
22.36 25.50 Jadi digunakan uji U
18.75 21.64 H0: populasi honor pekerja kesehatan dan
pekerja pendidikan identik
21.90 24.85 Ha: populasi honor pekerja kesehatan dan
22.96 25.30 pekerja pendidikan tidak identik
20.75 24.12 n1 = 7 dan n2 = 8
23.45 α = 5%
1 20.10 26.19
2 19.80 23.88
3 22.36 25.50
4 18.75 21.64
5 21.90 24.85
6 22.96 25.30
7 20.75 24.12
8 23.45
19
Mann-Whitney Test and CI: H, E Uji U pada Sampel Besar
H N = 7 Median = 20.750
E N = 8 Median = 24.485 Untuk sampel besar (n1 > 10 dan n2 > 10),
Point estimate for ETA1-ETA2 is -3.385 distribusi sampling untuk U akan mendekati
95.7 Percent CI for ETA1-ETA2 is (-5.370,-1.551)
W = 31.0 distribusi normal dengan rata-rata dan deviasi
Test of ETA1 = ETA2 vs ETA1 not = ETA2 is standar sebagai berikut:
significant at 0.0046
n1n2
µU =
Ekivalen dengan p-value (nilai p) 2
Sedikit berbeda dengan Tabel A13, hanya karena
pembulatan angka n n (n + n + 1)
σU = 1 2 1 2
Karena nilai p < α, maka tolak H0. Artinya, populasi 12
honor pekerja kesehatan dan pekerja pendidikan tidak
identik
20
Nilai Peringkat Kelompok Nilai Peringkat Kelompok
Jumlah peringkat yang dari kelompok W
2.25 1 W 4.01 16 W
(Warung) = W1 =
2.70 2 R 4.05 17 W
2.75 3 W 4.10 18.5 R
1+3+4.5+4.5+6+7+8+10+11+13+16+17+21+22
2.97 4.5 W 4.10 18.5 R = 144
14 *15
2.97 4.5 W 4.25 20 R U1 = 14 *16 + − 144 = 185
3.10 6 W 4.29 21 W 2
3.15 7 W 4.53 22 W U 2 = 14 *16 − 185 = 39
3.29 8 W 4.75 23 R
U = min(39,185) = 39
3.50 9 R 4.80 24.5 R
14 *16
3.60 10 W 4.80 24.5 R µU = = 112
3.61 11 W 4.98 26 R 2
3.65 12 R 5.11 27 R 14 *16 * 31
3.68 13 W 5.50 28 R σU = = 24.1
3.89 14 R 5.75 29 R
12
3.95 15 R 6.25 30 R 39 − 112
z= = -3.03
24.1
uji 2 sisi
Uji Peringkat Bertanda (Wilcoxon)
Nilai p untuk z = -3.03 adalah 2 * 0.0012 = 0.0024 < α →
tolak H0. Artinya: populasi pengeluaran uang makan untuk data Sepadan
siang untuk karyawan yang ke warung tidak sama
dengan yang ke restoran Data Sepadan (matched pairs):
Dengan MINITAB:
Statistika Parametrik: Uji t (asumsi: populasi normal)
Statistika Nonparametrik: Uji Wilcoxon
Mann-Whitney Test and CI: W, R Uji Wilcoxon (seperti juga uji t) digunakan untuk
menganalisis data pada 2 kelompok yang berkaitan,
W N = 14 Median = 3.445
termasuk kasus before-and-after di mana orang atau
R N = 16 Median = 4.500
Point estimate for ETA1-ETA2 is -1.065
objek yang sama diamati pada dua kondisi yang
95.2 Percent CI for ETA1-ETA2 is (-1.700,-0.460) berbeda
W = 144.0 Jenis data pada Wilcoxon: serendah-rendahnya level
Test of ETA1 = ETA2 vs ETA1 not = ETA2 is significant ordinal
at 0.0026 Asumsi Uji Wilcoxon
The test is significant at 0.0026 (adjusted for ties)
Pasangan data diambil secara acak
p-value
Distribusi populasi: simetris
21
Uji Wilcoxon untuk Sampel Kecil
Contoh
(n<15)
Seorang peneliti melakukan
survey mengenai biaya Pasangan A B
Dengan n dan α, gunakan Tabel A14 pemeliharaan kesehatan yang keluarga
dikeluarkan oleh keluarga di
(tersedia untuk one-tailed test dan two- kota A dan B. Peneliti tersebut 1 1950 1760
mengambil enam pasang
tailed test) untuk mendapatkan Tkritis. keluarga yang dipadankan 2 1840 1870
secara demografis di kota A 3 2015 1810
Jika T < Tkritis → tolak H0. dan B. Dari keenam pasang
keluarga tersebut dicatat biaya 4 1580 1660
pemeliharaan kesehatan pada 5 1790 1340
tahun yang lalu (dalam USD).
Dengan menggunakan α = 6 1925 1765
0.05, lakukan pengujian untuk
menentukan apakah ada
perbedaan signifikan di dalam
pengeluaran biaya kesehatan
di antara kedua kota tersebut
22
Pekerja Before After d = Pering-
Before
– After
kat H0: Md = 0 versus Ha: Md < 0
1 5 11 -6 -19 T- = 179.5
2 4 9 -5 -17
3 9 9 0 Hapus T+ = 10.5
4 6 8 -2 -9
5 3 5 -2 -9 T = min(179.5, 10.5) = 10.5
6 8 7 1 +3.5
7 7 9 -2 -9 n = 19 (1 data dengan d = 0 dihapus)
8 10 9 1 +3.5
9 3 7 -4 -14.5 Menghitung statistik uji:
10 7 9 -2 -9
n ( n + 1) 19 * 20
µT = = = 95
11 2 6 -4 -14.5
12 5 10 -5 -17
13 4 9 -5 -17 4 4
n (n + 1)( 2n + 1)
14 5 7 -2 -9
19 * 20 * 39
15
16
8
7
9
6
-1
1
-3.5
+3.5
σT = = = 24.8
17 9 10 -1 -3.5 24 24
18 5 8 -3 -12.5 T − µT 10.5 − 95
19 4 5 -1 -3.5 z= = = −3.41
20 3 6 -3 -12.5 σT 24.8
− z0.01 = −2.33
20 3 6 -3
23
Prosedur Uji Kruskal-Wallis
Prosedur Uji Kruskal-Wallis
(lanjutan)
Data dari setiap kelompok diberi peringkat dari 1 H0: seluruh c populasi identik
(terkecil), dengan memandang seolah-olah Ha: sedikitnya 1 populasi berbeda
semuanya berasal dari 1 kelompok. Daerah penolakan: selalu di kanan, yaitu: R: K > χ2α, c-1
Hitung statistik uji K: ( )
f χ2
12 ⎛⎜ c T j ⎞⎟
2
K= ∑
n( n + 1) ⎝ j =1 n j ⎟⎠
⎜
− 3( n + 1)
n1 = 6 n2 = 6 n3 = 6 n4 = 6 MINITAB
2 5 1
3 7 1
4 11 1
4
T j2 25.52 642 87.52 1232 5 9 1
∑
j =1 n j
=
6
+
6
+
6
+
6
= 4588.6 6
7
8
6
10
12
1
2
2
9 11 2
10 9 2
12
K= ( 4588.6) − 3( 24 + 1) = 16.77 11
12
13
12
2
2
24 * 25 13 11 3
14 14 3
15 10 3
24
Kruskal-Wallis Test: Respons versus Faktor
H = 16.77 DF = 3 P = 0.001
H = 16.86 DF = 3 P = 0.001 (adjusted for ties)
25
Jawab
Merk Merk Merk Merk Merk
Orang
1 2 3 4 5
1 3 5 2 4 1
H0: Populasi kelima merk sama
2 1 3 2 4 5
Ha: Sedikitnya satu populasi merk berperingkat lebih
3 3 4 5 2 1
tinggi dibandingkan populasi merk lainnya
4 2 3 1 4 5
5 5 4 2 1 3 b = 10
6 1 5 3 4 2 c=5
7 4 1 3 2 5 df = c – 1 = 5 – 1 = 4
8 2 3 4 5 1
α = 0.01
9 2 4 5 3 1
Dengan α = 0.01 dan df = 4, didapatkan χ20.01,4 =
10 3 5 4 2 1
13.2767. Jadi tolak H0 apabila χ2 > 13.2767.
Rj 26 37 31 31 25 5
∑R
c
= 4592 12 12
∑ R 2j − 3b(c + 1) = 10 * 5 * 6 4592 − 3 *10 * 6 = 3.68
2
Rj2 676 1369 961 961 625 j χ2 =
j =1 bc (c + 1) j =1
26
Row Mentah BBM Mentah_P BBM_P d d2
∑d 2
= 12.5 Correlations: Mentah_P, BBM_P
6∑ d 2
6 *12.5 Pearson correlation of Mentah_P and BBM_P = 0.895
rs = 1 − = 1− = 0.89583 P-Value = 0.001
n(n 2 − 1) 9(92 − 1)
Peramalan (Forecasting)
adalah seni dan pengetahuan untuk
memrediksi masa depan. Peramalan digunakan
Bagian 6 di dalam proses pengambilan keputusan untuk
membantu pebisnis menyimpulkan tentang
pembelian, penjualan, produksi, dll. Contoh:
Pengamat pasar memprediksi nilai saham di tahun
Peramalan dengan Deret depan
Perencana kota meramalkan krisis air di suatu kota
Waktu (Time Series)
Harga BBM akan meningkat secara tajam pada
beberapa bulan yad
27
Komposisi Deret Waktu Pengukuran Galat pada Peramalan
Trend: arah umum jangka panjang suatu data Galat peramalan individual:
Cycle: pola tinggi rendahnya data pada periode et = xt − Ft
waktu yang lebih dari satu tahun
Seasonal effects: siklus data yang terjadi pada et = galat pada peramalam
periode waktu kurang dari 1 tahun xt = nilai aktual
Ft = nilai peramalan
Irregular fluctuations: perubahan cepat pada
Deviasi Mutlak Rata-rata (Mean Absolute Deviation =
data pada selang waktu jauh lebih pendek MAD):
dibandingkan seasonal effects
MAD =
∑e i
banyaknya peramalan
MSE =
∑ ei2 2 23.6 19.1 4.5 4.5 20.3
21.5 94.6
MAD = = 3.6 MSE = = 15.8
6 6
Cara-cara Penghalusan
Model peramalan naif
(Smoothing Techniques)
adalah cara-cara untuk menghilangkan Adalah model sederhana yang menggunakan asumsi
bahwa data pada periode waktu yang lebih mutakhir
efek tak teratur pada data deret waktu. merepresentasikan prediksi atau peramalan untuk masa
yang akan datang.
antara lain:
Cocok untuk data deret waktu yang selang waktunya
Model peramalan naif adalah harian atau mingguan, atau yang tidak
menunjukkan trend atau seasonality.
Model Perataan
Penghalusan eksponensial Ft = xt −1
Ft = nilai peramalan untuk periode waktu t
xt-1 = nilai untuk periode waktu t-1
28
Rata-rata Sederhana (Simple
Model Perataan
Average)
Dihitung dengan menggunakan rata-rata Peramalan untuk periode waktu t adalah rata-
dari beberapa periode waktu dan rata dari nilai sejumlah tertentu periode waktu
menggunakan rata-rata sebagai di masa lalu:
peramalan untuk periode waktu berikutnya
Contoh:
X t −1 + X t − 2 + X t −3 + ..... + X t − n
Ft =
Rata-rata Sederhana n
Rata-rata Bergerak
Rata-rata Bergerak Berbobot
Moving Average
Length 4
Accuracy Measures
MAPE 6.28
MAD 80.25
MSD 9808.44
29
Moving Average Plot for Shipment Rata-rata Bergerak Berbobot
1450 Variable
A ctual (Weighted Moving Average)
1400 Fits
1350
Mov ing Av erage
Length 4
Adalah rata-rata bergerak yang menggunakan
A ccuracy Measures
bobot yang berbeda antara suatu periode waktu
1300 MAPE 6.28 dengan periode waktu lainnya.
Shipment
MAD 80.25
1250 MSD 9808.44 Pembagi (penyebut) adalah jumlah total bobot
1200
untuk setiap periode waktu.
Contoh: misalnya untuk rata-rata bergerak
1150
berbobot 3 bulan, bobot untuk bulan ke 1 adalah
1100 1, ke 2 adalah 2, dan ke tiga, adalah 3.
1050
Rumusnya adalah:
Oct Nov Dec Jan Feb Mar Apr May Jun Jul Aug Sep 3M t −1 + 2M t − 2 + M t −3
Month x berbobot =
6
30
α = 0.2 α = 0.5 α = 0.8
Year X
F e F e F e Contoh perhitungan untuk α = 0.2
1984 1750 - - - - - -
1985 1742 1750.0 -8.0 1750.0 -8.0 1750.0 -8.0 1984: F belum ada
1986 1805 1748.4 56.6 1746.0 59.0 1743.6 61.4
1987 1620 1759.7 -139.7 1775.5 -155.5 1792.7 -172.7 1985: F = mengambil data aktual tahun
1988 1488 1731.8 -243.8 1697.8 -209.8 1654.5 -166.5 1984
1989 1376 1683.0 -307.0 1592.9 -216.9 1521.3 -145.3
1990 1193 1621.6 -428.6 1484.4 -291.4 1405.1 -212.1 1986: F = 0.2X1985 + 0.8F1985 = 0.2*1742 +
1991 1014 1535.9 -521.9 1338.7 -324.7 1235.4 -221.4 0.8*1750 = 1748.4
1992 1200 1431.5 -231.5 1176.4 23.6 1058.3 141.7
1993 1288 1385.2 -97.2 1188.2 99.8 1171.7 116.3
1987: F = 0.2X1986 + 0.8F1986 = 0.2* 1805+
1994 1457 1365.8 91.2 1238.1 218.9 1264.7 192.3 0.8*1748.4 = 1759.7
1995 1354 1384.0 -30.0 1347.5 6.5 1418.5 -64.5
e = X – F setiap tahun
1996 1477 1378.0 99.0 1350.8 126.2 1366.9 110.1
1997 1474 1397.8 76.2 1413.9 60.1 1455.0 19.0
1998 1617 1413.0 204.0 1443.9 173.1 1470.2 146.8
1999 1666 1453.8 212.2 1530.5 135.5 1587.6 78.4
Smoothing C onstant
1700
A lpha 0.2
1400
1300
1200
1100
1000
2 4 6 8 10 12 14 16
Index
31
Single Exponential Smoothing Plot for X Single Exponential Smoothing Plot for X
1900 Variable 1900 Variable
A ctual A ctual
1800 Fits 1800 Fits
X
1400 1400
1300 1300
1200 1200
1100 1100
1000 1000
2 4 6 8 10 12 14 16 2 4 6 8 10 12 14 16
Index Index
S *I
S=
I
TCSI/ TC *100
32
Tahun Quarter Nilai Aktual Indeks Data tanpa efek musim
Indeks Musim (T*C*S*I) Musim (Deseasonalized data)
(T*C*I)
Quarter Thn 1 Thn 2 Thn 3 Thn 4 Thn 5 1 1 4009 98.47 4071
2 4321 105.87 4081
1 - 96.85 100.22 100.09 94.84
3 4224 100.53 4202
2 - 104.63 106.16 105.57 108.14
4 3944 95.13 4146
3 102.05 106.35 99.00 98.71 -
2 1 4123 98.47 4187
4 94.40 90.34 97.33 95.86 - 2 4522 105.87 4271
3 4657 100.53 4632
Quarter Index 4 4030 95.13 4236
96.85 + 100.09
1 98.47 3 1 4493 98.47 4563
2
2 105.87 2 4806 105.87 4540
Tidak ikut dirata-rata
3 100.53 3 4551 100.53 4327
(yang terbesar
dan terkecil) 4 95.13 4 4485 95.13 4715
bersambung
33
Time Series Decomposition for TCSI
Multiplicative Model Time TCSI Trend Seasonal Detrend Deseason Predict Error
Data TCSI 1 4009 4167.74 0.98469 0.96191 4071.33 4103.94 -94.938
2 4321 4194.85 1.05871 1.03007 4081.38 4441.13 -120.132
Length 20 3 4224 4221.96 1.00536 1.00048 4201.48 4244.59 -20.588
NMissing 0 4 3944 4249.07 0.95124 0.92820 4146.17 4041.88 -97.884
1 4123 4276.18 0.98469 0.96418 4187.10 4210.72 -87.716
Fitted Trend Equation 2 4522 4303.29 1.05871 1.05082 4271.23 4555.94 -33.937
3 4657 4330.40 1.00536 1.07542 4632.17 4353.61 303.393
Yt = 4140.63 + 27.1095*t 4 4030 4357.51 0.95124 0.92484 4236.58 4145.03 -115.034
1 4493 4384.62 0.98469 1.02472 4562.85 4317.49 175.506
Seasonal Indices 2 4806 4411.73 1.05871 1.08937 4539.49 4670.74 135.259
Period Index 3 4551 4438.84 1.00536 1.02527 4526.74 4462.63 88.373
4 4485 4465.95 0.95124 1.00427 4714.90 4248.18 236.815
1 0.98469 1 4595 4493.06 0.98469 1.02269 4666.44 4424.27 170.728
2 1.05871 2 4799 4520.17 1.05871 1.06169 4532.87 4785.55 13.454
3 1.00536 3 4417 4547.28 1.00536 0.97135 4393.45 4571.65 -154.646
4 0.95124 4 4258 4574.38 0.95124 0.93084 4476.27 4351.34 -93.335
1 4245 4601.49 0.98469 0.92253 4311.00 4531.05 -286.050
2 4900 4628.60 1.05871 1.05863 4628.27 4900.35 -0.350
Accuracy Measures 3 4585 4655.71 1.00536 0.98481 4560.56 4680.66 -95.665
MAPE 2.7 4 4533 4682.82 0.95124 0.96801 4765.36 4454.49 78.514
MAD 120.1
MSD 20983.1
Time Series Decomposition Plot for TCSI Component Analysis for TCSI
Multiplicative Model
Multiplicative Model
Original Data Detrended Data
5000 Variable
A ctual
4750 200
Fits
Detr. Data
4800 Trend 4500
Data
0
A ccuracy Measures
4250
MA PE 2.7
-200
4600 MA D 120.1 4000
MSD 20983.1
4 4 4 4 4 4 4 4 4 4
TCSI
Quarter Quarter
4400
Seasonally Adjusted Data Seasonally Adj. and Detrended Data
4750 200
4500
0
4000 4250
-200
4000
2 4 2 4 2 4 2 4 2 4
Quarter 4 4 4 4 4 4 4 4 4 4
Quarter Quarter
Daftar Pustaka
Terima kasih
Black, K. 2003. Business Statistics for
Contemporary Decision Making. 4th Ed.
West Publishing Co.
MINITAB, Inc. 2003. Meet MINITAB
Release 14 for Windows
Lind, D.A. 2002. Basic Statistics for
Business and Economics . 4nd Ed.
McGraw-Hill Companies
34