You are on page 1of 45

JENIS ANALISIS STATISTIK

Analisis
Statistik

Analisis Deskriptif:
Mengutip, meringkas, dan
menerangkan data

Analisis Inferens:
Membuat kesimpulan dan/atau
membuat keputusan mengenai
populasi berdasarkan data sampel

JENIS KESAHAN
Kesahan Dalaman : Setakat mana kenyataan keputusan kajian yang berkait dengan pemboleh ubah yang
dikaji boleh dipertahankan.
Kesahan Luaran : Setakat mana sampel kajian yang dicabut daripada populasi dapat mewakili populasi yang
dikaji.
Populasi Sampel
Ukuran yang digunakan untuk
menerangkan populasi dipanggil
parameter
Ukuran yang dikira daripada
data sampel dipanggil statistik
KONSEP ASAS STATISTIK
Pembolehubah
Sebarang objek/fenomena yang sifatnya boleh berubah.
E.g. jantina, berat badan, intelek, nilai, kepercayaan
Populasi
Keseluruhan set individu, objek, benda atau fenomena yang mempunyai ciri-ciri kesamaan.
E.g. Penduduk Malaysia.
Sampel
Sebahagian daripada populasi yang dipilih dengan menggunakan kaedah pemilihan sampel
tertentu.
Ciri-ciri sampel yang baik:
Dipilih secara rawak
Memiliki ciri populasi
Mewakili sampel


KONSEP ASAS STATISTIK
Parameter
Ukuran numerik yang menerangkan ciri-ciri populasi
Parameter kepada purata/min populasi diwakili oleh simbol mew ().
Statistik
Ukuran numerik yang menerangkan ciri sampel.
Diperolehi daripada manipulasi/hasil analisis data
Pembolehubah Bebas
Pemboleh ubah yang mempengaruhi/memberi kesan kepada suatu pemboleh ubah yang lain.
Pembolehubah Berkait/Terikat
Pemboleh ubah yang dipengaruhi oleh pemboleh ubah bebas.
Pemboleh Ubah Kualitatif
Pemboleh ubah yang mempunyai ciri saling eksklusif dan mempunyai subkelas
e.g. pembolehubah bangsa (subkelas Melayu, Cina & India).
Pemboleh Ubah Kuantitatif
Pemboleh ubah yang di dalamnya terkandung nilai angka yang menunjukkan sifat yang berhubung dengan
objek pemboleh ubah tersebut.
Terbahagi 2 Diskrit dan Selanjar.



KATEGORI DATA
Data
Numerikal
Diskrit:
e.g. bilangan anak
Selanjar:
e.g. berat kanak-kanak
Kategorikal:
e.g. Taraf Perkahwinan
Data adalah nilai berbeza yang dikaitkan dengan satu pembolehubah.

Skala Nominal
Skala paling mudah dan ketepatan yang
paling mudah.
Mengkategorikan pemboleh ubah
mengikut ciri-ciri kesamaan.
Mengklasifikasi data kepada kategori
berbeza di mana tiada pemeringkatan.
Digunakan untuk pemboleh ubah
kualitatif.

Skala Ordinal

Menggambarkan susunan nilai sesuatu kualiti
pemboleh ubah.
Boleh bermula daripada peringkat/pangkat yang
paling rendah hingga ke peringkat/pangkat paling
tinggi.
Ciri-ciri:
Digunakan bagi pengkelasan data bersifat
eksklusif.
Menggambarkan susunan pemeringkatan.
Mempunyai pemberat.

Skala Sela

skala terurut di mana perbezaan di antara ukuran
adalah satu kuantiti yang bermakna tetapi ukuran
ini tidak mempunyai titik kosong mutlak.
Contoh, pembolehubah suhu , perbezaan suhu
antara 200
o
C dengan 100
o
C adalah sama dengan
400
o
C dan 500
o
C (100
o
C).
Pada O
o
C tidak bermakna tidak ada kepanasan
suhu, malahan suhu boleh turun lebih rendah
drpd O
o
C.
Skala Nisbah

satu skala terurut di mana perbezaan di antara
ukuran adalah satu kuantiti yang bermakna dan
ukuran mempunyai titik kosong mutlak.

Kategori Nom
bor/
Kod
Bangsa Melayu
Cina
India
1
2
3
Jantina Lelaki
Perempu
an
0
1
Pemilikan
Komputer
Tidak
Ya
0
1
Carta Turus
Digunakan untuk menggambarkan data jenis
nominal dan ordinal.
Turun menegak dan turus mendatar mewakili
setiap kategori yang bersifat eksklusif.
Setiap turus hendaklah terpisah dengan turus
yang lain.
Panjang turus menunjukkan kekerapan
(frekuensi) atau peratusan bagi setiap kategori.


Banking Preference
0% 5% 10% 15% 20% 25% 30% 35% 40% 45%
ATM
Automated or live telephone
Drive-through service at branch
In person at branch
Internet
Graf Garisan & Kekerapan Poligon

Graf ini menggunakan nilai titik tengah yang mewakili setiap
kelas taburan.
Garisan graf dilukis melalui setiap titik tengah dalam bentuk
garisan lurus.
Frequency Polygon: Daily High Temperature
0
1
2
3
4
5
6
7
5 15 25 35 45 55 65
F
r
e
q
u
e
n
c
y
Kelas Titik Tengah
(In a percentage
polygon the vertical axis
would be defined to
show the percentage of
observations per class)
Kelas
10 - 20 15 3
21 - 30 25 6
31 - 40 35 5
41 - 50 45 4
51 - 60 55 2
Frekuensi
Titik
Tengah
Ogif
Dilukiskan berdasarkan kepada nilai
kekerapan kumulatif.
Paksi mendatar menggunakan nilai had
sebenar bagi setiap kelas dan peratusan
kumulatif di sepanjang paksi menegak.

Carta Bulatan/Pai

Digunakan untuk menunjukkan
perbandingan kategori yang digunakan
dalam data nominal atau ordinal.
Carta bulatan/pai adalah satu bulatan
yang dibahagikan kepada kepingan
yang mewakili kategori. Saiz setiap
kepingan berbeza mengikut
peratusdalam setiap kategori.

Banking Preference
16%
2%
17%
41%
24%
ATM
Automated or live
telephone
Drive-through service at
branch
In person at branch
Internet
Nilai Asas dan Nilai Hujung (Stem-and-Leaf Display)

Satu cara mudah untuk melihat bagaimana data tertabur
dan di mana tertumpu.
Kaedah - Asingkan siri data yang telah disusun dari min ke
max kepada digit asas (stem) dan digit hujung (leaves)
Age of
Surveyed
College
Students
(Umur
Pelajar
Universiti
yang
dikumpul
)
Day Students
16 17 17 18 18 18
19 19 20 20 21 22
22 25 27 32 38 42
Night Students
18 18 19 19 20 21
23 28 32 33 41 45
Menyenarai Data Numerik :
Contoh Taburan Kekerapan
Susun data mentah dalam susunan menaik (Sort raw data in ascending order):
12, 13, 17, 21, 24, 24, 26, 27, 27, 30, 32, 35, 37, 38, 41, 43, 44, 46, 53, 58
Cari julat (Find range): 58 - 12 = 46
Pilih jumlah kelas (Select number of classes): 5 (usually between 5 and 15)
Hitung sela kelas (Compute class interval) (width): 10 (46/5 then round up)
Tentukan sempadan kelas (Determine class boundaries) (limits):
Class 1: 10 to less than 20
Class 2: 20 to less than 30
Class 3: 30 to less than 40
Class 4: 40 to less than 50
Class 5: 50 to less than 60
Hitung titik tengah kelas (Compute class midpoints): 15, 25, 35, 45, 55
Kira pemerhatian dan letakkan ke kelas yang betul (Count observations & assign to classes)
Ukuran Kecenderungan Memusat : Ringkasan
Min
Median
Mod
Min Geometrik
(luar skop kurs)
n
X
X
n
i
i
=
=
1
n / 1
n 2 1
G ) X X X ( X =
Rate of change of
a variable over time
Min = 3
3
5
15
5
5 4 3 2 1
= =
+ + + +
Min dipengaruhi oleh
sebarang perubahan
nilai dalam taburan.
Jumlah skor dari min
bersamaan sifar.
data. susunan dalam kedudukan
n
Median Kedudukan
2
1 +
=
Jika bilangan nilai adalah
ganjil, median adalah
nombor tengah

Jika bilangan nilai adalah
genap, median adalah
purata dua titik tengah.
Nilai yang berlaku paling kerap
Tidak dipengaruhi oleh nilai ekstrim (outliers)
Digunakan bagi data nominal atau kategori (nominal)
Mungkin tidak ada mod/beberapa mod


Julat
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14
Julat = 13 - 1 = 12
Contoh:
Ukuran variasi paling mudah.
Perbezaan antara nilai terbesar (maksimum)
dan terkecil (minimum).
Julat = X
Mak
X
Min

Min Sisihan
Nilai mutlak min sisihan:



di mana,
X = markat/pengamatan,
M = min taburan
N = bilangan markat.
N
M X
MS
N
i

=

=
1
X X - M | X M |
38 -3 3
39 -2 2
40 -1 1
41 0 0
41 0 0
41 0 0
42 1 1
43 2 2
44 3 3
Jumlah = 369 0 12
Min = 41 1.33
Rumus Varians
Varians populasi



Varians sampel
1 - N
) (X
N
1 i
2
i
2

=

=

o
1 - N
) X (X
S
N
1 i
2
i
2

=

=
= min arithmetik
N = saiz sampel
X
i
= nilai ke i bagi pembolehubah X

X
= min populasi
N = saiz populasi
X
i
= nilai ke i bagi pembolehubah X

1 - N
) X (X
S
N
1 i
2
i
2

=

=
8
S
2
28
=
50 3. S
2
=
Rumus Varians
Varians populasi



Varians sampel
( )
1 - N
N
X
- X
N
1 i
N
1 i
2
2


=
=
=
2
o
( )
1 - N
N
X
- X
s
N
1 i
N
1 i
2
2


=
=
=
2
( )
1 - 9
s
2
9
369
15157
2

=
8
s
2
15129 15157
=
8
s
2
28
=
50 3. s
2
=
Sisihan Piawai
Populasi



Sampel
1 - N
) X (X
S
N
1 i
2
i
=

=
1 - N
) (X
N
1 i
2
i
=

=

o
Sisihan Piawai
Populasi



Sampel
1 - N
) X (X
S
N
1 i
2
i
=

=
1 - N
) (X
N
1 i
2
i
=

=

o
Persentil
Kelas Had Sebenar Nilai Titik
Tengah
Kekerapan
(K)
KK % KK
65 69
60 64
55 59
50 54
45 49
40 44
35 39
30 34
25 29
20 24
64.5 69.5
59.5 64.5
54.5 59.5
49.5 54.5
44.5 49.5
39.5 44.5
34.5 39.5
29.5 34.5
24.5 29.5
19.5 24.5
67
62
57
52
47
42
37
32
27
22
6
15
37
30
42
23
20
7
5
3
188
182
167
130
100
58
35
15
8
3
100.00
96.81
88.83
69.15
53.19
30.85
18.61
7.98
4.26
1.60


iaitu
P
X
= markat yang terletak pada titik persentil yang
dikehendaki
X
r
= markat terendah had sebenar pada kelas yang
mengandungi titik persentil.
KK = kekerapan kumulatif yang berada di bawah kelas
yang
mengandungi titik persentil.
K = kekerapan pada ke!as yang mengandungi titik
persentil
J = julat
P = peratus persentil yang dikehendaki
N = jumlah kes
( ) ( ) | | J K KK P N X P
r X
+ =
Pengiraan Persentil
Nilai yang digunakan untuk mengira P85 ialah:
X
r
= 54.5, J = 5, KK = 130, K = 37, P = 0.85, N = 188
P85 = 54.5 + [((188 x 0.85) 130)/37] x 5
= 54.5 + [(159.8 130)/37] x 5
= 54.5 + (29.8/37) x 5
= 54.5 + 4.03
= 58.53
P85 bersamaan dengan markat 58.53. Ini bermakna 85 peratus
pelajar mencapai prestasi markat 58.53 dan ke bawah.
Pangkat Persentil
Perbezaan antara persentil dan pangkat persentil ialah:
Persentil membolehkan kita mengetahui peratus markat atau kes
yang berada pada atau di bawah sesuatu markat yang diberi.
Pangkat persentil pula membolehkan kita menentukan peratus
yang berada pada atau di bawah markat yang diberi.
Pangkat Persentil
Formula:



Iaitu:
PPx = pangkat persentil kepada markat yang dikehendaki
KK = kekerapan kumulatif pada kelas yang berada di bawah kelas yang mengandungi markat yang
dikehendaki
X
r
= markat terendah had sebenar bagi kelas yang mengandungi markat yang dikehendaki
X = markat yang dikehendaki pangkat persentilnya
K = kekerapan pada kelas yang mengandungi markat yang dikehendaki
J = julat
N = jumlah kes.
( ) ( ) | |
100
+
=
N
K J / X X KK
PP
r
X
Pangkat Persentil
Contoh pengiraan:
Xr = 59.5, J = 5, KK = 167, K = 15,
X = 64 dan N = 188
Pengiraan kepada PP64


( ) ( ) | |
100
15 5 5 59 64 167
64
+
=
188
/ .
P P
01 96 64 . P P =
Markat 64 bersamaan dengan pangkat persentil 96.01.
Ini bermakna sebanyak 96.01% pelajar dalam taburan tersebut
mempunyai markat prestasi 64 ke bawah.
Markat Piawai - dapat menunjukkan kedudukan markat asal sama ada berada di atas atau di bawah min
kumpulannya.

Dalam pengiraan di atas:
nilai z = - 0.86 menunjukkan pelajar mempunyai markat prestasi pencapaian 40 berada pada kedudukan 0.86 unit
sisihan piawai di bawah min kumpulannya.
Nilai z = 0.68 menunjukkan pelajar mempunyai markat prestasi pencapaian 55 berada pada kedudukan 0.68 unit
sisihan piawai di bawah min kumpulannya.
Nilai z = 1.19 menunjukkan pelajar mempunyai markat prestasi pencapaian 60 berada pada kedudukan 1.19 unit
sisihan piawai di bawah min kumpulannya.


Contoh: Katakan min kumpulan = 48.38, sisihan piawai = 9.76 dan markat mentah 40, 55 dan 60
Markat z bagi markat mentah 40 ialah:



Markat z bagi markat mentah 55 ialah:




Markat z bagi markat mentah 60 ialah:
68 0.
9.76
48.38 - 55
z = =
19 1.
9.76
48.38 - 60
z = =
86 0.
9.76
48.38 - 40
z = =
Piawai Sisihan
Min - Mentah Markat
z =
Markat Piawai
Markat piawai negatif, z < 0 menunjukkan markat asal lebih rendah
daripada min kumpulannya.
Markat piawai positif, z > 0 menunjukkan markat asal lebih tinggi
daripada min kumpulannya.
Markat piawai sama dengan sifar (z = 0), maka markat asal sama
dengan min kumpulannya.
Markat Transformasi
Digunakan untuk masalah teknikal dan salah pentafsiran.
Kekeliruan timbul jika nilai markat piawai adalah negatif.
Markat transformasi ini dinamakan sebagai markat T.
Markat transformasi boleh menukar markat z kepada markat T
yang mempunyai min bersamaan dengan 50 dan sisihan
piawainya 10.
Cara penukaran:




( ) 50 + = 10 z Markat T arkat M
Korelasi Positif
Korelasi Negatif
Korelasi Kosong
Pekali Korelasi
Pekali korelasi merupakan indeks atau nilai yang
menggambarkan kekuatan hubungan antara dua pemboleh
ubah.
Ia mempunyai julat antara -1.0 hingga +1.0.
Nilai +1.0 menunjukkan hubungan positif yang amat kuat.
Nilai -1.0 menunjukkan hubungan negatif yang amat kuat.
Nilai pekali korelasi sifar jika dua pemboleh ubah tidak hubungan.
Saiz Pekali Korelasi Interpretasi Korelasi
0.90 - 1.00
0.70 - 0.90
0.50 - 0.70
0.30 - 0.50
0.01 - 0.30
0.00
Terlalu tinggi
Tinggi
Sederhana
Rendah
Lemah
Tiada korelasi
Pekali Korelasi Pearson
( )( )
( ) | | ( ) | |




=
2
2
2
2
Y Y N X X N
Y X XY N
r
XY
( ) ( )( )
( ) ( ) | | ( ) ( ) | |
2 2
680 46764 10 660 43672 10
680 660 45094 10


=
XY
r
88 0. r
XY
=
Pengiraan Pekali Korelasi Spearman
Pekali

( ) ( ) | | 1 6 1
2 2
=

N N d r
S
( ) ( ) ( ) ( ) | | 1 10 10 5 12 6 1
2
= . r
S
92 0. r
S
=
Pekali Penentuan
Ukuran yang menunjukkan jumlah variasi dalam satu
pemboleh ubah diterangkan oleh variasi dalam pemboleh
ubah lain.
Diwakili oleh r
2
.
Jika r = 0.88, r
2
= 0.77, ini bermakna 77% variasi markat
motivasi menerangkan variasi dalam prestasi akademik.
Kaedah Korelasi Lain
Jadual 7.7: Kaedah Analisis Korelasi Mengikut Jenis Data

Jenis Data Pemboleh
Ubah X
Jenis Data Pemboleh Ubah Y
Nominal, dikotomi Ordinal Sela, nisbah
(selanjar)
Nominal, dikotomi Pekali phi,
Tetrachoric
Ordinal Dwisiri Pangkat Spearman
Sela, nisbah (selanjar) Dwisiri, Dwisiri Titik Pearson
PEMBOLEH UBAH
Pemboleh ubah bersandar/terikat ialah pemboleh
ubah yang cuba dijangka atau diterangkan.
Pemboleh ubah bebas ialah pemboleh ubah yang
digunakan untuk menerangkan pemboleh ubah
bersandar.
Contoh: Gred statistik pelajar PLK semakin baik jika
jam belajar meningkat.
P/U bersandar : Gred pelajar
P/U bebas : Jam belajar
Model Regresi Mudah
Model yang menggambarkan hubungan antara pemboleh
ubah bersandar (Y) dan satu pemboleh ubah bebas (X
1
).
e.g.


di mana Y = hasil jualan dan X
1
= perbelanjaan pengiklanan.
) (
1
X f Y =
1
bX a Y + =
Model Regresi Berbilang
Model yang menggambarkan hubungan antara pemboleh
ubah bersandar (Y) dan lebih daripada satu pemboleh ubah
bebas (X
1
& X
2
).
e.g.


di mana Y = hasil jualan, X
1
= perbelanjaan pengiklanan dan X
2
= harga
barang.
) X , X ( f Y
2 1
=
2 1
cX bX a Y + + =
i i i
bX a Y + + =
Komponen linear
REGRESI GARISAN LURUS
Pintasan

Koefisien/
kecerunan Terma
Ralat
Pemboleh ubah
bersandar
Pemboleh ubah
bebas
Komponen
ralat
rawak
Ralat
rawak nilai X
i


Y
X
i i i
bX a Y + + =
X
i
Kecerunan = b

Pintasan = a

i
REGRESI GARISAN LURUS
Y

Y
JENIS HUBUNGAN
Y
X
Y
X
Y
Y
X
X
Hubungan linear Hubungan Tidak linear
Hubungan Positif
Hubungan Negatif
JENIS HUBUNGAN
Y
X
Y
X
Y
Y
X
X
Hubungan kuat Hubungan lemah
JENIS HUBUNGAN
Y
X
Y
X
Tiada hubungan
OPERASI KAEDAH REGRESI
Nilai a dan b diperolehi dengan formula
( )( )
( )

=
2
2
X X N
Y X XY N
b
X b Y a =
Contoh Pengiraan
Harga Rumah
(RM000)
(Y)
Keluasan (m
2
)
(X)
(X
2
) XY
245 1400 1960000 343000 -315 -41.5
312 1600 2560000 499200 -115 25.5
279 1700 2890000 474300 -15 -7.5
308 1875 3515625 577500 160 21.5
199 1100 1210000 218900 -615 -87.5
219 1550 2402500 339450 -165 -67.5
405 2350 5522500 951750 645 118.5
324 2450 6002500 793800 735 37.5
319 1425 2030625 454575 -290 32.5
255 1700 2890000 433500 -15 -31.5




) ( X X ) ( Y Y
508597 =

XY
30983750
2
=

X
17150
1
=

=
N
i
X 2865
1
=

=
N
i
Y
5 286
10
2865
. Y = = 1715
10
17150
= = X
Contoh Pengiraan






Persamaan regresi yang dianggarkan ialah
11 . 0
15715000
1725000
294122500 309837500
49134750 50859750
294122500 ) 30983750 ( 10
) 2865 )( 17150 ( ) 5085975 ( 10
) X ( X N
Y X XY N
b
2 2
=
=

=


85 . 7 9
188.65 286.5
0.11(1715) 286.5
X b Y a
=
=
=
=
i i
X 11 . 0 85 . 7 9 Y

+ =
Contoh Output
Pemboleh
Ubah
Koefisien Ralat
Piawai
Statistik-t Nilai-p
Intersep 97.85 58.03 1.69 0.13
Keluasan
Rumah 0.11 0.033 3.33 0.01
a adalah nilai purata dianggarkan bagi Y bila nilai X = kosong. Oleh kerana sebuah
rumah tidak boleh mempunyai kaki persegi 0, a tidak mempunyai apa-apa aplikasi
praktikal.
b menganggarkan perubahan dalam nilai purata Y akibat daripada perubahan
seunit X.
Jika b = 0.11, nilai min rumah meningkat sebanyak 0.10977(1000) =
$109.77, secara purata, bagi setiap kaki persegi tambahan dalam saiz
rumah.
Ralat Piawai Anggaran
Dari modul (ms 101)

korelasi pekali
2
1 ) 1 (
2
,
=


=
r
N
N r SP
S
y
x y
RALAT PIAWAI ANGGARAN
Statistik Regresi
Multiple R 0.76
R Square 0.58
Adjusted R Square 0.53
Standard Error 41.33
Observations 10
ANOVA
df SS MS F Significance F
Regression 1 18934.93 18934.93 11.08 0.010
Residual 8 13665.57 1708.19
Total 9 32600.50
Coefficients Standard Error t Stat P-value Lower 95% Upper 95%
Intercept 97.83 58.03 1.69 0.13 -35.58 232.07
Square Feet 0.11 0.033 3.33 0.01 0.03 0.19
41.33 S
YX
=
Membandingkan Ralat Piawai
Y Y
X X
kecil S
YX
besar S
YX
S
YX
adalah ukuran variasi nilai Y yang diperhatikan
daripada garis regresi
Magnitud S
YX
sentiasa patut dinilai secara relatif kepada nilai Y
dalam sampel
i.e., S
YX
= $41.33K adalah agak kecil secara relatif terhadap
harga rumah dalam julat $200K - $400K

You might also like