You are on page 1of 48

1

GE3143
Statistik Deskriptif
2
Pengenalan

Statistik adalah teknik dan kaedah untuk
penyelidik mengumpul, mengelas,
meringkas, menyusun, menganalisis dan
menginterpretasi data kuantitatif.

3
J enis statistik
Statistik deskriptif
Memerihalkan ciri sesuatu sampel
Merumuskan dan menyusun bilangan data
yang banyak.
Statistik inferensi
Satu kaedah untuk membuat keputusan atau
penganggaran mengenai populasi berdasarkan
keputusan yg didapati drp sampel.
4
Istilah dan Simbol Statistik
Populasi- Semua ahli dalam
sesuatu kumpulan yang
mempunyai ciri yang
mendefinasikan populasi
kajian
Sampel- satu subset atau
pewakilan daripada populasi
yang dipilih untuk kajian
Subjek- individu dalam
sesuatu sampel
Parameter (nilai yang
digunakan untuk menerangkan
populasi) (,
2
)



Statistik (nilai yang digunakan
untuk menerangkan sampel)

( X , s)

5
Contoh
Populasi Sampel Statistik
deskriptif
Statistik
inferensi
100,000
pelajar
ting. 3
mendudu
ki ujian
matematk
PMR
Pengkaji
memilih
secara
rawak
skor/
markah
1000
pelajar
Guna
untuk
memerihal
kan sampel

X (min)
dan
s (sisihan
piawai)
Berdasarkan
statstik
deskriptif
digunakan
untuk
mengganggar
skor untuk
populasi
100,000
pelajar
(min) dan

2
(sisihan
piawai)
6
GB6023
6
Fikir dan buat
Nyatakan apakah populasi, sampel dan
pembolehubah bagi pernyataan kajian
di bawah:

Satu kajian dijalankan untuk
mengetahui tahap pengetahuan ICT
bagi pelajar-pelajar sekolah rendah di
Selangor.
7
Pengkelasan data
Tiga cara:
Cara data diwakil
Kuantitatif (boleh diukur dan wujud dalam skala nombor)
Kualitatif (tidak boleh diukur dalam skala nombor)
Bentuk
Diskrit (mempunyai sukatan data tertentu- cth: bilangan
komputer)
Selanjar (mempunyai sukatan yang berterusan cth:
ketinggain sesuatu bangunan)
Tahap ukuran

8
Skala Pengukuran
Nominal: data boleh dikategorikan mempunyai nama atau label
tertentu
cth., jantina, bangsa, jawapan ya/tidak.
Ordinal: data yang boleh disusun ikut tertib tetapi perbezaan nilai
tidak memberi makna
cth., pengetahuan komputer pelajar dikelaskan kepada cemerlang, baik
dan sederhana.
Interval: data yang boleh disusun ikut tertib dan perbezaan nilai data
adalah bermakna,nilai sifar memberi nilai kuantiti dan bukannya
tiada kuantiti.
cth., skor ujian, ujian IQ, suhu
Ratio: data yang boleh disusun ikut tertib dan perbezaan nilai data
adalah bermakna, dan nilai sifar menunjukkan tiada kuantiti
e.g., umur, halaju kereta.
9
J enis Analisis Deskriptif
Analisis univariatememerihalkan data
mengenai sesuatu pembolehubah
selalunya pembolehubah bersandar.
Analisis Bivariatemencari korelasi
antara pembolehubah, membanding
kumpulan atau mencari mencari
pembezaan antara kumpulan
10
Dua cara pemerihalan
Dengan menyusun data melalui jadual dan
graf
Dengan mendapatkan ukuran berbentuk
numerik bagi data
11
Taburan frekuensi

Students by Regi on of the Uni ted States
679 44.8
415 27.4
423 27.9
North East
South East
West
Frequency Percent
12
Plot Stem-and-Leaf
Stem ditunjukkan
pada lajur menegak
dan ia mewakili digit
pertama di sesuatu
skor.
Leaf mewakili digit
yang terakhir yang
terdapat pada stem.
Age of Students
2 335678889
3 01224445555699
4 22445566678
5 1244589
13
Histogram
Mewakili data dalam
dua dimensi di mana
nilai frekuensi adalah
pada paksi y dan
maklumat mengenai
pembolehubah
bersandar (skor)
adalah pada paksi x
Highest Year School Completed, Mother
20.0 17.5 15.0 12.5 10.0 7.5 5.0 2.5 0.0
600
500
400
300
200
100
0
Std. Dev =3.46
Mean =10.8
N =1233.00
14
Carta Bar
Mewakili data dalam
bentuk dimensi dan
sesuai untuk data
berbentuk nominal,
iaitu frekuensi diwakili
pada paksi y dan
kategori diwakili oleh
paksi x.
Is Life Exciting or Dull
Dull Routine Exciting Missing
C
o
u
n
t
600
500
400
300
200
100
0
15
Poligon frekuensi
Menggmbarkan data
seperti histogram.
Titik tengah di setiap
bar pada histogram
dikenalpasti dan
disambungkan
dengan satu garisan.
Highest Year of School Completed
20
19
18
17
16
15
14
13
12
11
10
9
8
7
6
5
4
3
0
Missing
C
o
u
n
t
500
400
300
200
100
0
16
Carta Pie- mewakili %
frekuensi
100%- 360 darjah
1%- 3.6 darjah
Sudut ditentukan melalui:
Frekuensi relatif
(frekuensi/jumlah
responden x 360 darjah)
1st Qt r 2nd Qt r
3r d Qt r 4t h Qt r
17
Ukuran numerik statistik deskriptif
Untuk merumuskan taburan frekuensi atau
sekumpulan data dengan satu ukuran (nilai)
Ukuran Kecenderungan Memusat- keadaan
purata atau indeks kepusatan sesuatu
taburan data
Terdapat tiga jenis ukuran:
1. Min
2. Median
3. Mod
18
Min
Nilai purata bagi suatu kumpulan
Dikirakan dengan menjumlahkan semua
data dibahagikan dengan bilangan data
Simbol by x atau M
19
GB6023 19
Min

N
N
...
2 1
N
populasi, min

+ + +
=

=

n
n
...
2 1
sampel, min

+ + +
=

=
n
20
GB6023 20
Min
Contoh:
Markah ujian statistik bagi 10 pelajar adalah seperti berikut.
Dapatkan min markah ujian statistik.
75.60 52.40 85.00 43.00 72.00
70.00 60.00 81.50 51.00 49.00

95 . 63
10
00 . 49 00 . 51 50 . 81 00 . 60 00 . 70 00 . 72 00 . 43 00 . 85 40 . 52 60 . 75
,
=
+ + + + + + + + +
=

=
N
Min

21
Median
Bacaan data yang wujud di tengah-tengah
apabila data disusun dalam tertib menarik
atau menurun.
Simbol Mdn atau X
Jika bilangan data ganjil, median- data di
tengah-tengah
Jika bilangan data genap, median= purata
dua data di tengah-tengah
22
22
Median
Contoh:
Berikut merupakan markah ujian statistik bagi 9
orang pelajar.

69 57 61 53 70 67 59 65 70
23
Median
Contoh:
Susun data secara meningkat.
53 57 59 61 65 67 69 70 70
Data di tengah2
Median, adalah 65
~

24
Mod
Bilangan skor yang mempunyai kekerapan
terbanyak didalam satu set data/taburan
Diperolehi daripada melihat taburan sahaja
Terdapat tiada mod/ lebih daripada satu mod
J arang digunakan

25
25
Mod
Contoh:
Berikut merupakan markah ujian statistik bagi 20 orang
pelajar.
33 25 33 75 84
75 65 57 84 70
61 53 38 70 81
69 70 71 59 67
26
Mod
Contoh:
Susun data secara meningkat
25 33 33 38 53 57 59 61 65 67 69 70 70 70 71 75 75 81 84 84
Kekerapan paling tinggi
Mod, adalah 70

27
Perbandingan di antara min, median dan mod



Kesesuaian

Skala pengukuran

Min

Median

Mod









Nominal

tidak

tidak

ya

Ordinal

tidak

ya

ya

Interval

ya

ya

ya

Ratio

ya

ya

ya

28
LATIHAN
Kriteria yg diberikan di bawah merujuk
kepada uku. kecenderungan memusat
yang mana?
Paling boleh dipercayai
Paling kurang dipercayai
Mudah dipengaruhi oleh sesuatu
nilai dalam cerapan
Boleh dianggarkan secara langsung
drp taburan data
Boleh dianggarkan secara langsung
drp histogram
29
29
Hubungan di antara Min, Mod dan Median
Pembolehubah
Min = Median = Mod
Bentuk Simetri
30
30
Bentuk Terpencong Ke Kanan
Pembolehubah
F
r
e
k
u
e
n
s
i

Median
Mod
Min
31
31
Bentuk Terpencong Ke Kiri
Pembolehubah
F
r
e
k
u
e
n
s
i

Mod
Median
Min
32
33
33
LATIHAN
Jika kebanyakan drp pelajar dlm kelas anda
tidak mengulangkaji dengan baik topik yang
anda ajarkan, skor ujian yang bakal diberikan
nanti akan cenderung untuk bertabur:
- secara NORMAL?
- secara TERPENCONG POSITIF?
- secara TERPENCONG NEGATIF?

34
Serakan
Ukuran memusat tidak dapat
menggambarkan perbezaan antara
suatu skor dengan skor yang lain
Perlu lapur juga ukuran serakan untuk
menggambarkan keadaaan kepelbagaian
atau keseragaman

35
Contoh
Kedua-dua taburan skor set di bawah
mempunyai nilai min yang sama ( = 50), tetapi
taburan skor set 2 adalah lebih terserak.
Taburan skor untuk set 1: 48 49 49 50 50 50 51
51 52 (serakan rendah)
Taburan skor untuk set 2: 10 30 30 50 50 50 70
70 90 (serakan tinggi)
36
J enis ukuran serakan
J ulat
Varians
Sisihan Piawai
37
J ulat
J ulat= Skor mak- skor min
Kurang sesuai untuk mengukur serakan
data kerana ia hanya mengambil kira niala
minima dan nilai maksima saja
38
GB6023 38
J ulat
Contoh:
44 49 50 58 58 60 61 68 70 72
Julat = data maksimum data minimum
= 72 44
=28
39
SISIHAN PIAWAI & VARIANS
Sisihan piawai adalah pengukuran yang paling
sesuai digunakan untuk mengukur serakan data

Sisihan piawai yang diperolehi memberikan nilai
bagi kedudukan data yang bertabur sekitar min

Nilai sisihan piawai yang tinggi memberikan
gambaran bahawa data itu tertabur jauh daripada
min (kurang padat)
xx
x
40
Sisihan piawai
Simbol adalah SD, , or s
Sisihan piawai sering digunakan dengan
mengaitkannya
Antara sisihan piawai dan taburan normal
41
Taburan normal
Satu poligon frekuensi yang garisannya telah
dilatarkan
42
Ciri Taburan Normal
Unimodal
Simetrikal(samaukur)
Min=Median=mod
Lengkuk akan menghampiri paksi x
apabila skor menjauhi min tetapi tidak
akan mencecah paksi x


43
Kaitan antara Luas di bawah taburan
normal dan sisihan piawai
J umlah luas di bawah taburan normal
mewakili semua skor dalam taburan
tersebut
68% skor adalah antara MIN + 1s
95% skor adalah antara MIN + 2s
99.7% skor adalah antara MIN + 3s
44
45
Peratus berkaitan dengan luas di bawah
taburan juga boleh ditulis dalam bentuk
perpuluhan
84.13%= 0.8413
J ika dalam bentuk perpuluhan, merujuk
kepada konsep Kebarangkalian atau
bahagian (pecahan) luas kawasan
(proportion of area)
84.13% skor adalah dibawah nilai 115
Kebarangkalian untuk memilih skor dibawah nilai
115 ialah 0.8413
Bahagian (pecahan) luas kawasan dibawah nilai
115 ialah 0.8413

46
STATISTIK KORELASI
xx
x
Mengambarkan kekuatan hubungan di antara dua
pembolehubah:
Contohnya: hubungan antara sikap pelajar
terhadap matapelajaran dengan pencapaian
pelajar dalam matapelajaran tersebut
Kekuatan hubungan diringkaskan dengan nilai r
(pekali korelasi).
Nilai r adalah dalam julat +1 dan 1.00
Tanda + @ - menunjukkan arah hubungan
Nilai menggambarkan kekuatan hubungan
47
STATISTIK KORELASI
xx
x
Seandainya pembolehubah yang ingin
dihubungkan adalah bersifat interval, maka
korelasi Pearson digunakan.
Sebaliknya, jika data adalah bersifat
nominal/ordinal maka, korelasi Spearman
digunakan
48
Terima Kasih
Sila hantar jawapan anda

You might also like