Professional Documents
Culture Documents
Dasar
Bagian 1
Statistika Deskriptif
Pengelompokan Statistika
Istilah-istilah Dasar
Statistika Parametrik:
Menggunakan
Membutuhkan
Jenis Data
Bilangan menunjukkan perbedaan
Pengukuran dapat digunakan untuk
membuat peringkat atau mengurutkan
objek
Perbedaan bilangan mempunyai arti
Mempuyai nol mutlak dan rasio antara
dua bilangan mempunyai arti
Nominal
Ordinal
Interval
Rasio
Distribusi Frekuensi
Data:
60, 65, 70, 73, , (tulis di C1)
MINITAB:
Stat -> Basic Statistics -> Display
Descriptive Statistics
Histogram of Nilai
Boxplot of Nilai
7
6
Frequency
5
4
3
2
1
0
30
40
50
60
70
80
90
100
Nilai
Variable
Nilai
N
40
Mean
72.83
Median
74.50
TrMean
73.39
Variable
Nilai
Minimum
35.00
Maximum
100.00
Q1
59.25
Q3
89.50
StDev
18.37
SE Mean
2.90
40
50
60
70
80
90
100
Nilai
Informasi di dalam Boxplot: Minimum, Q1, Median (Q2), Q3, dan Maksimum
Pie Chart
MINITAB: Graph -> Pie Chart
Cumulative Frequency
40
30
20
10
0
30
40
50
60
70
80
90
100
Nilai
Ogive
Bar Chart
C (1500, 35.5%)
B ( 500, 11.8%)
A ( 350, 8.3%)
E ( 680, 16.1%)
D (1200, 28.4%)
Stem-and-leaf
Sum of Pemilih
1500
1000
500
Calon
Stem-and-leaf of HrgTanah
Leaf Unit = 10
= 50
1
2
3
7
20
(18)
12
8
4
3
1
1
4
5
6
7
8
9
10
11
12
13
14
15
5
5
5
2699
0012455555669
000000345555556779
0000
0000
0
00
Mencari persentil ke p:
- Urutkan n data dari kecil ke besar
- Hitung lokasi persentil i = (p/100) * n
- Jika i = bil bulat, maka persentil ke p
adalah (bil ke i + bil ke i+1) / 2
- Jika i bukan bil bulat, maka persentil ke p
adalah bil ke int(i) + 1
Varians populasi
2 =
( X )2
N
MAD =
X
N
( XN )
Varians sampel:
(X X )
=
n 1
X
=
n 1
grouped =
fM
S=
fM
)
( fM
N
; = 2
f (M X )
n 1
fM
( fMn )
n 1
; S = S2
Skewness
simetris
100%
CV =
2 =
fM
Ukuran Bentuk
Mean
Median
Mode
( X X )2
n 1
f = frekuensi kelas
N = frekuensi total
( X )2
N
( X ) 2
n
Mode
Median
Mean
Negatively skewed
Mean
Median
Mode
Positively skewed
Distr. Platikurtis
(datar dan menyebar)
Distr. Mesokurtis
(normal)
Distr. Leptokurtis
(tinggi dan tipis)
Probabilitas
Bagian 2
Probabilitas
P( E ) =
Klasikal
Menggunakan Frekuensi
Dengan carai subyektif
Relatif Kejadian
ne
N
Probabilitas Subyektif
Struktur Probabilitas
Utk
= {1, 2, 3, 4, 5, 6, 7, 9}
= {4}
S
Utk
XUY
Mutually Exclusive Events: adalah kejadiankejadian yang tidak mempunyai irisan. Artinya,
kejadian yang satu meniadakan kejadian yang
XY
lainnya; kedua kejadian
tidak dapat terjadi
secara simultan. Jadi:
XY
P(XY) = 0
Aturan hitungan mn
N
N!
N Cn =
n = n!( N n)!
kemungkinan
Aturan Perjumlahan
Aturan Perkalian
P( X | Y ) =
P ( X Y ) P ( X ) * P (Y | X )
=
P (Y )
P(Y )
Jawab
S
M
0.22
0.19
0.03
0.56
Jawab
Komputer
Ya
Tdk
Kalkulator
Ya
Tdk
46
3
11
15
57
18
49
= 0.653
P(A) =
75
57
P(B) =
= 0.76
75
46
P(AB) =
= 0.613
75
P(A) * P(B) = 0.653 * 0.76 = 0.49628 P(AB)
A dan B tidak independen
49
26
75
Bagian 3
Variabel Acak Diskret
P(X)
f(X)
Rata-rata
= E ( X ) = X * P( X )
Deviasi Standar
P( X ) = 1
f ( x)dx = 1
(X )
* P( X )
Distribusi Binomial
P( X ) =
n!
p X q n X
X !(n X )!
Distribusi Binomial
n = # trials
X = # sukses
p = probabilitas sukses pada satu trial
q = 1 - p = probabilitas gagal pada satu trial
= n* p
Rata-rata Distribusi Binomial
= n* p*q
Distribusi Poisson
Distribusi Poisson:
P( X ) =
X e
X!
X = 0, 1, 2, .
= rata-rata
e = 2.718282
Rata-rata Distribusi Poisson =
Deviasi standar Distribusi Poisson =
Distribusi Poisson merepresentasikan kejadian yang
amat jarang. X = banyaknya kejadian tersebut terjadi
pada suatu waktu atau area
MINITAB: Calc -> Probability Distribution -> Poisson
Bagian 4
Variabel Acak Kontinu
10
z=
Probability
Density
Probability
Inverse Cumulative Probabilty
Cumulative
Probability Density
Cumulative Probability
f(x)
f(x)
f(input) = output (untuk kontinu)
P(X = input) = output (untuk diskret)
output
input
input
f(x)
output
Ans: x = 144.6728
11
P(X=24)
P(X>30)
P(30<X<34)
P(X<33)
Untuk
Jawab:
Rata-rata
= = np = 80*0.3 = 24
Standar = = n * p * q
koreksi kontinuitas
diskret
= 4.0988
23.5 24
24.5 24
)
P ( X = 24) = P (23.5 < X < 24.5) = P(
<Z <
4.0988
4.0988
= P(-0.122 < Z < 0.122)
diskret
kontinu
= 2 * 0.0478 = 0.0956
30.5 24
)
4.0988
= P(Z > 1.5858)
= 0.5 0.4441 = 0.0559
kontinu
koreksi kontinuitas
30.5 24
34.5 24
)
<Z <
4.0988
4.0988
= P(1.5858 < Z < 2.5617)
= 0.4948 0.4441 = 0.0507
kontinu
koreksi kontinuitas
33.5 24
)
4.0988
= P(Z < 2.3177)
= 0.5 + 0.4898 = 0.9898
80!
0.324 0.780 24 = 0.0969513
24!(80 24)!
diskret
kontinu
koreksi kontinuitas
Distribusi Eksponensial
f ( x ) = e x
dengan x 0
>0
e = 2.71828...
dan =
12
P( X x0 ) = e x0
x0
Jawab
= 1/3.2 = 0.313. Jadi rata-rata 0.313*30
menit = 9.39 menit waktu antar
kedatangan pelanggan
1 jam = 2 interval, yaitu 2 * 30 menit. Jadi
x = 2. P(X>2) = 1-exp( -3.2*2) = 0.998
15 menit = 0.5 interval. Jadi x = 0.5.
P(X>0.5) = exp( -3.2*0.5) = 0.202
Bagian 5
Sampling dan Distribusi
Sampling
Random Sampling
Simple random sampling
Stratified random sampling
Systematic random sampling
Cluster random sampling
13
Nonrandom Sampling
Convenience sampling
Judgement sampling
Quota sampling
Populasi
Sampel
Ukuran sampel = n
Ukuran sampel = n
Rata-rata sampel =
Rata-rata sampel =
Jadi
X Variabel acak
Sampel
Populasi
Ukuran sampel = n
Sampel
Proporsi =
Ukuran sampel = n
Proporsi =
Proporsi = P
Sampel
Z=
Rata-rata =
Deviasi standar =
Sampel
Ukuran sampel = n
Rata-rata sampel =
Proporsi =
p Variabel acak
Ukuran sampel = n
Z=
p P
P *Q
n
Bagian 6
Estimasi untuk Populasi
Tunggal
14
Statistika Inferensial
Selang kepercayaan
100(1-)% untuk
pada sampel besar:
Populasi
Sampel
= 100(1 )%
P X Z
X + Z
n
n
2
2
Artinya:
X Z
Estimasi:
mendapatkan statistik
1-
Note: apabila
tidak diketahui
dapat digantikan
dengan s
Selang kepercayaan
100(1-)% untuk
pada sampel kecil:
Artinya:
X t
2
, n 1
s
n
N
50
Mean
924.2
StDev
174.7
SE Mean
17.0
95.0 % CI
890.9,
957.5)
s
s
= 100(1 )%
X + t
P X t
, n 1
, n 1
n
n
2
2
1-
t
2
0
, n 1
t
2
, n 1
15
Output MINITAB:
Sampel
Confidence Intervals
Variable
HrgTanah
N
15
Mean
952.7
Proporsi = P
(akan diestimasi)
StDev
243.4
SE Mean
62.8
p
q = 1 p
Selang kepercayaan
100(1-)% untuk P
Artinya:
P p Z
2
p Z
p q
P p + Z
n
2
p q
n
p q
= 100(1 )%
n
(n 1) S 2 (n 1) S 2
, 2
2
,n 1
1 , n 1
2
Populasi
Sampel
Varians Populasi = 2
(akan diestimasi)
Distribusi 2
( )
f 2
Artinya
(n 1) S 2
(n 1) S 2
2 2
P
= 100(1 )%
2
,n 1
1 , n 1
2
2
Ukuran = n
Varians sampel
= S2
proporsi
95.0 % CI
817.9, 1087.5)
Ukuran = n
1-
0
1 , n 1
2
2
2
, n 1
dengan derajat
bebas = n-1
16
f 2
z
n = /2
E
0.025
0.025
dengan
E = galat estimasi = error of estimation = x
= deviasi standar populasi,
= range/4 apabila tidak diketahui
= taraf keterandalan
100(1 )% = tingkat keyakinan = level of confidence
0.95
0
02.975,34
02.025,34
= 19.8063
= 51.9660
2dengan derajat
bebas = 34
Contoh
Jawab
Seorang manajer bank ingin menentukan ratarata deposito bulanan per nasabah di bank
tersebut. Untuk itu ia akan mengestimasi
dengan menggunakan selang kepercayaan.
Berapa ukuran sampel yang harus ia ambil
apabila ia ingin yakin 99% dan kesalahannya
tidak lebih dari 200 juta rupiah. Ia asumsikan
bahwa deviasi standar untuk deposito bulanan
semua nasabah adalah 1 milyar rupiah
n=
z / 2 pq
E2
dengan
E = galat estimasi = error of estimation = p
p
p = proporsi populasi,
= 0.5 apabila tidak diketahui (agar n maksimum)
q=1-p
= taraf keterandalan
100(1 )% = tingkat keyakinan = level of confidence
Contoh
17
Jawab
Bagian 7
Uji Hipotesa untuk Populasi
Tunggal
n=
Uji Hipotesis
Hipotesis Riset:
menyatakan hubungan
H0 benar
H0 salah
Pertahank
an H0
Keputusan
benar
Galat Tipe
II ()
Tolak H0
Galat Tipe
I ()
Keputusan
benar
(power)
Statistik uji
Z=
X 0
1-
18
H0: = 0 vs H1: 0
Distribusi Normal Standar
R
R: Z < -Z
1-
1-
R : Z > Z
2
Nilai p
Nilai p
Untuk kasus:
H1: < 0
Z
0
Distribusi
Normal Standar
Untuk kasus:
Ha: > 0
Z
-Z
Untuk kasus:
H1: 0
Jumlahnya = nilai p
Data
9.7
8.5
9.8
11.0
11.5
13.0
8.7
7.9
8.4
7.6
10.6
10.9
11.0
9.1
10.0
10.5
10.2
5.5
7.0
7.2
8.0
8.0
9.5
9.5
7.8
10.5
11.0
12.0
9.8
7.0
19
Output MINITAB
Z-Test
Test of mu = 10.000 vs mu < 10.000
The assumed sigma = 1.71
Variable
Masuk
N
30
Mean
9.373
StDev
1.715
SE Mean
0.313
Z
-2.00
P
0.023
R: t < -t
Distribusi t dengan derajat bebas = n-1
R: t > t
t ,n 1
H0: = 0 vs H1: 0
Distribusi t dengan
derajat bebas = n-1
1-
t
2
R : t > t
Distribusi t dengan
derajat bebas = n-1
0
, n 1
t ,n 1
1-
1-
Nilai p
t
t
2
, n 1
Untuk kasus:
H1: > 0
t
t
, n 1
20
Nilai p
Untuk kasus:
H1: < 0
t
Distribusi t dengan
derajat bebas = n-1
-t
Untuk kasus:
H1: 0
Jumlahnya = nilai p
Output MINITAB
T-Test of the Mean
Test of mu = 41.00 vs mu not = 41.00
Variable
Usia
N
11
Mean
45.00
StDev
7.07
SE Mean
2.13
T
1.88
P
0.090
p P0
P0Q0
n
Statistik uji
R: Z < -Z
Distribusi Normal Standar
R: Z > Z
1-
1-
21
H0: P = P0 vs H1: P P0
R
Distribusi Normal Standar
1-
Nilai p
Z
R : Z > Z
Untuk kasus:
H1: P > P0
Nilai p
Untuk kasus:
H1: P < P0
Z
Distribusi
Normal Standar
-Z
Untuk kasus:
H1: P P0
Jumlahnya = nilai p
Jawab
2 =
(n 1) S 2
02
H0: 2 = 2 0 vs H1: 2 < 2 0
( )
f 2
Distribusi
Normal
Standar
R: Z < -1.645
Z di luar R,
jadi terima H0.
Artinya, tidak benar
bahwa manajer
restoran yang
wanita di kota
tesrsebut kurang
dari 30%
Statistik uji
R : 2 < 12 ,n 1
0.05
1-
-0.488
-1.645
Z
0
12 ,n 1
dengan derajat
bebas = n-1
22
H0: 2 = 2 0 vs H1: 2 2 0
( )
( )
f 2
f 2
R:2 < 2
2 ,n 1
dengan derajat
bebas = n-1
, n 1
1-
1-
R : 2 > 2
1 , n 1
2
R : > ,n 1
2
1 , n 1
2
, n 1
dengan derajat
bebas = n-1
Data
105
110
106
111
101
100
101
101
100
95
97
108
99
99
100
100
101
102
103
100
103
99
99
98
98
94
100
100
101
100
Jawab
N = 30
S = 3.82 (Stat -> Basic Statistic -> Descriptive Statistics)
H0: 2 = 36 vs H1: 2 < 36
Untuk df = 29 dan = 0.10, 20.90,29 = 19.7677 (Calc ->
Probability Distribution -> Chisquare)
R: 2 < 20.90,29 = 19.7677
Statistik uji:
2 =
(30 1)3.82 2
= 11.7550
62
Bagian 8
Statistika Inferensi untuk Dua
Populasi
23
12
Ukuran = n1 (besar)
Rata-rata = X 1
Deviasi Standar = S1
Rata-rata = 1
(tidak diketahui)
n1
standar populasi
tidak ada, dapat
digantikan dengan
deviasi standar
sampel S
22
n2
independen
Populasi 2
R: Z > Z
Sampel 2
Ukuran = n2 (besar)
Rata-rata = X 2
Deviasi Standar = S2
Rata-rata = 2
(tidak diketahui)
1-
H0: 1 2 = 0 vs H1: 1 2 0
Distribusi Normal Standar
R
R: Z < -Z
1-
1-
12 22
+
( X 1 X 2 ) Z
n1 n2
2
Artinya:
12 22
12 22
P ( X 1 X 2 ) Z
+
1 2 X 1 X 2 ) + Z
+
n1 n2
n1 n2
2
2
= 100(1 )%
Catatan: Bila deviasi standar populasi tidak ada, dapat
digantikan dengan deviasi standar sampel S
R : Z > Z
Z
2
S=
S12 (n1 1) + S 22 ( n2 1)
n1 + n2 2
24
Distribusi t, df = n1 + n2 - 2
1-
H0: 1 2 = 0 vs H1: 1 2 0
( X 1 X 2 ) t S 1 + 1
n
n
1
2
2
Distribusi t, df = n1 + n2 - 2
R
1-
t
2
Artinya:
R : t > t
1 1
1 1
P ( X 1 X 2 ) t S
+
1 2 X 1 X 2 ) + t S
+
n1 n2
n1 n2
2
2
= 100(1 )%
t
2
1-
Distribusi t, df = n1 + n2 - 2
R: t < -t
R: t > t
Data
Row
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
Jakarta
5.6
7.1
6.8
10.2
12.5
13.5
6.8
5.8
9.9
10.2
15.6
7.7
9.8
6.8
5.8
6.8
8.9
9.4
10.5
12.6
Bandung
8.1
7.9
5.4
4.5
5.6
6.8
9.2
8.1
7.2
4.5
5.2
6.8
6.7
5.7
5.8
5.8
10.3
4.5
5.8
10.2
9.8
5.8
5.5
5.6
7.2
25
Two-sample T for j vs b
N
20
25
j
b
Mean
9.12
6.72
StDev
2.83
1.75
Difference = mu j - mu b
Estimate for difference: 2.395
95% lower bound for difference: 1.240
T-Test of difference = 0 (vs >): T-Value = 3.48 P-Value =
0.001 DF = 43
Both use Pooled StDev = 2.29
Kesimpulan: tolak Ho: J B = 0. Jadi: laporan bahwa
rata-rata gaji bulanan direktur bank di Jakarta lebih
tinggi dari pada di Bandung didukung data.
Jakarta
N = 20
Median =
9.150
Bandung
N = 25
Median =
5.800
Point estimate for ETA1-ETA2 is
2.100
95.2 Percent CI for ETA1-ETA2 is (0.899,3.800)
W = 593.5
Test of ETA1 = ETA2 vs ETA1 > ETA2 is significant at
0.0012
The test is significant at 0.0012 (adjusted for ties)
Kesimpulan: tolak Ho: J B = 0. Jadi: laporan bahwa
rata-rata gaji bulanan direktur bank di Jakarta lebih
tinggi dari pada di Bandung didukung data.
Populasi
Yang Terkait (related)
Sampel 1
Sampel 2
Before
After
Data
Row
1
2
3
4
5
6
7
8
9
10
11
12
Krywan
Adi
Budi
Cica
Dedi
Edi
Feri
Gina
Hedi
Iwan
Joni
Kia
Lena
Before
After
450
503
400
435
370
550
525
378
440
510
522
533
470
535
433
450
450
570
555
410
480
555
535
566
20
32
33
15
80
20
30
32
40
45
13
33
D = after - before
Untuk menghitung D, Calc -> Calculator
26
Output MINITAB
T-Test of the Mean
Test of mu = 30.00 vs mu > 30.00
Variable
D
N
12
Mean
32.75
StDev
17.77
SE Mean
5.13
T
0.54
P
0.30
Nilai p = 0.30 dan = 0.10. Ternyata nilai p > , maka terima H0.
Kesimpulan: klaim lembaga kursus Bahasa Inggris bahwa
setelah kursus peningkatan nilai TOEFL sedikitnya 30, tidak
didukung data.
Selang kepercayaan
100(1-)% untuk d
pada sampel kecil:
Artinya:
d t
2
, n 1
sd
n
Bagian 9
sd
sd
= 100(1 )%
P d t
d d + t
, n 1
, n 1
n
n
2
2
Anova
1-
t
2
0
, n 1
t
2
, n 1
terdistribusi normal
Sampel diambil secara acak dari masing-masing
populasi
Varians semua populasi sama
H0: 1 = 2 = 3 = = C
H1: sedikitnya ada 1 rata-rata populasi yang
berbeda
Populasi 2
Varians 2
Varians 2
Rata-rata = 1
Rata-rata = 2
Sampel 1
Sampel 2
Ukuran n1
Ukuran n2
Populasi C
..
Varians 2
Rata-rata = C
Sampel C
..
Ukuran nc
27
Source
DF
SS
MS
Treatment (C
=Column)
C-1
SSC
MSC =
SSC
C 1
Error
NC
SSE
MSE =
SSE
N -C
Jumlah
N1
SST
MSC
MSE
F=
Catatan:
N = ni
i =1
Row
Data
A
15
11
10
9
8
8
7
9
11
8
11
11
8
8
9
10
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
D
14
11
10
9
11
12
12
10
Sale
15
11
10
9
8
8
7
9
11
8
11
11
8
8
9
10
14
11
10
9
11
12
12
10
Tr
Output MINITAB
Level
1
2
3
4
N
4
6
6
8
Pooled StDev =
Mean
11.250
8.500
9.500
11.125
1.683
StDev
2.630
1.378
1.378
1.553
1
1
1
1
2
2
2
2
2
2
3
3
3
3
3
3
4
4
4
4
4
4
4
4
F
3.67
P
0.029
F dengan derajat
bebas = C-1 dan N-C
R: F > F
Distribusi F
f (F )
1-
0
28
Variabel Blocking
H0: 1 = 2 = 3 = = C
H1: sedikitnya ada 1 rata-rata treatment yang berbeda
denga yang lain
H0: 1 = 2 = 3 = = R
H1: sedikitnya ada 1 rata-rata blok yang berbeda
dengan yang lain
.
.
.
.
.
Source
DF
SS
MS
Block (R =Row)
R-1
SSR
MSR =
SSR
R 1
F=
MSR
MSE
Treatment (C
=Column)
C-1
SSC
MSC =
SSC
C 1
F=
MSC
MSE
Error
(C-1)(R-1)
SSE
Jumlah
N1
SST
MSE =
SSE
(C - 1)(R - 1)
Data
Merah
Kuning
Biru Hijau
Kecil
Sedang
Besar
10
12
Row
NSale
Ukuran
Warna
1
2
3
4
5
6
7
8
9
10
11
12
6
7
9
5
9
8
6
6
10
7
8
12
1
2
3
1
2
3
1
2
3
1
2
3
1
1
1
2
2
2
3
3
3
4
4
4
29
Output MINITAB
Topik-topik Lanjut
F
9.00
1.32
P
0.016
0.353
Daftar Pustaka
Black, K. 2003. Business Statistics for
Contemporary Decision Making. 4th Ed.
West Publishing Co.
MINITAB, Inc. 2003. Meet MINITAB
Release 14 for Windows
Lind, D.A. 2002. Basic Statistics for
Business and Economics . 4nd Ed.
McGraw-Hill Companies
Terima kasih
30