Professional Documents
Culture Documents
Bab 3 Taburan
Bab 3 Taburan
TABURAN KEKERAPAN
(Frequency distribution)
Pemungutan data akan menghasilkan banyak pengukuran (nilai atau nombor).
(Data collection will produce numerous measurements or scores)
Masalah yang timbul adalah bagaimana menyusun data dalam bentuk yang akan memberi
makna supaya dapat difahami dalam laporan atau membuat rumusan yang berkaitan.
(How do we organize these in ways that will provide some meaningful conclusions?)
Prosedur yang biasa dilakukan ialah dengan meletak skor dalam satu taburan kekerapan.
(One of the simplest procedures is to tabulate in terms of frequencies)
Kekerapan (frequency): Rekod bilangan individu terletak dalam satu kategori (skor)
pada sesuatu skala pengukuran.
(Frequency is the number of individuals in a certain
category)
Jadual Taburan kekerapan (Frequency distribution Table)
(Frequency distribution table is an organized tabulation of the number of individuals
located in each category on the scale of measurement)
Contoh: Andaikan satu pemungutan data penyelidikan menghasilkan skor berikut
(Assume a collection of data produce the following)
8,9,8,7,10,9,6,4,9,8,7,8,10,9,8,6,9,7,8,8
Skor tertinggi ialah X5 = 10 and X13=10
(Highest score)
Skor terendah ialah X8 = 4
(Lowest score)
Frekuensi atau kekerapan bagi setiap skor dibilang, misalnya f bagi X7 = 6 ialah 2.
(Frequency for each score is counted eg. X7 = 6 is 2.
fx
10
9
8
7
6
5
4
2
5
7
3
2
0
1
20
45
56
21
12
0
4
Catatan: (note)
1) Senaraikan mengikut skala tertentu, nilai 5 dimasukkan walaupun tidak ada nilai
(List using certain scale, the value 5 is included)
2) f = N
3) Untuk mengira jumlah semua X gunakanlah lajur f dan fx.
(to calculate the summation of all X, use the column f and fx)
fr
score frequency
100
total number of scores
Contoh: (eg.)
X
10
9
8
7
6
5
4
2
5
7
3
2
0
1
fr
0.1
0.25
0.35
0.15
0.10
0
0.05
10%
25%
35%
15%
10%
0%
5%
Taburan
longgokan
100%
90%
65%
30%
15%
5%
5%
Kita boleh mengumpulkan skor mengikut klas tertentu. Bilangan klas tidaklah tetap,
tetapi bergantung kepada perbezaan di antara skor tertinggi dan skor terendah (julat).
(We can group the data in certain class interval. The number of classes is not fixed, but
will depend on the difference between the highest and lowest score)
Bilangan klas yang biasa digunakan ialah 10.
(Normally 10 class interval is often used)
Kita ingin menghasilkan kekerapan kumpulan mengikut klas Jadual kekerapan
mengikut klas.
(Our aim is to produce Frequency distribution of grouped data.
Perhatian:
(note)
1) Taburan data terkumpul biasanya mengandungi 8-10 klas. Jika terlampau banyak, ini
akan menjadi sukar. Jika terlampau sedikit, banyak maklumat yang akan hilang.
Ingat,tujuanya ialah melihat bentuk data yang terhasil daripada cerapan.
(Frequency of grouped data normally contains 8-10 classes. If there are too many classes
it becomes difficult and cumbersome. If we have too few classes, we begin to loose
information about the distribution of scores)
2) Saiz atau selang klas biasanya adalah nilai yang mudah seperti 2,5,10 dan 20.
(Normally the size of the class intervals is multiple of simple numbers such as 2, 5, 10 or
20 )
3) Semua selang klas mestilah sama ( the value of the class interval is the same for all
classes)
4) Nilai bawah haruslah gandaan pada selang klas. Contoh: 10,20,30,dsb.
Contoh: Berikut adalah markah yang telah diperolehi oleh 25 orang pelajar dalam satu
ujian:
( Following is a set of marks obtained by 25 students in a test)
82,75,88,93,53,84,87, 58,72,94,91,64,87,84,70,76,89,75,
80,73,69,84,61,78,60
1) Tentukan julat skor,
(Determine the range)
Julat skor Xmaks. Xmin tetapi bagi angkubah selanjar nilai sebenar
(range is Xmax. Xmin, but for continous variable, the true value of
Xmaks ialah 94.5 dan nilai sebenar Xmin ialah 52.5, maka
(Xmax is 94.5 and the true value of Xmin is 52.5, hence)
Catatan:
1) Boleh juga gunakan formula berikut untuk menentukan bilangan klas (Hukum
Sturges):
(it is also possible to use the following formula)
k = 1 + 3.3 log10 N,
dalam mana
Susun dari minimum ke maksimum (atau sebaliknya) (arrange from the minimum to the
maximum, or other wise)
a) Nyatakan kekerapan skor dalam lajur berkenaan
( state the scores in each column)
b) Kirakan kekerapan relatif (calculate the relative frequencies)
c) Kekerapan longgokan iaitu jumlah pelajar yang mendapat skor tertentu dan skor yang
dibawahnya. (the cumulative frequency if the sum of the number of individuals in each
score and scores below it)
d) Boleh juga mengira kekerapan longgokan relatif. (sometimes the cumulative relative
cumulative frequencies is calculated)
Titik tengah
(center
point)
50-54
55-59
60-64
65-69
70-74
75-79
80-84
85-89
90-94
1
1
3
1
3
4
5
4
3
52
57
fk (kekerapan
longgokan)
(cumulative
frequency)
1
2
Fkr(Kekerapan longgokan
relatif) Cumulative relative
proportion)
18
22
25
72%
88%
100%
1/25 = 4%
8%
paksi-x
(x-axis)
Biasanya ketinggian paksi-y biasanya ialah 3/4 panjang paksi -x.
(Normally the height of the y axis is of the length of the x-axis)
f
1
2
2
4
2
1
f
4
5
3
3
2
Example:
Number of social
interactions
45-49
40-44
35-39
30-34
25-29
20-24
15-19
10-14
5-9
0-4
Frequencies
3
3
3
4
11
10
16
16
16
12
frequency
14
15
26
31
13
18
16
12
3
1
2
Frequencies
3
3
3
4
11
10
16
16
16
12
10
5
20
11
12
Catatan (notes)
Pencong negatif
(negative skew)
Bi-modal (bimodal)
13
F (f)
150-159
140-149
130-139
120-129
110-119
100-109
90-99
80-89
70-79
60-69
50-59
40-49
1
6
44
163
363
548
539
356
132
41
6
1
Peratus
(percentage)
0.05
0.27
2.0
7.4
16.5
24.9
24.5
16.2
6.0
1.9
0.27
0.05
Peratus longgokan
(cumulative frequency)
100.00
99.95
99.7
97.7
90.3
73.8
48.9
24.4
8.2
2.2
.32
0.05
Berpandukan ogif (atau taburan kekerapan longgokan) boleh melihat percentile yang
berkaitan:
(based on the ogive we can read the values related to certain percentile)
Biasa yang digunakan ialah kuartil (quartile) (Quartiles are often used)
14
Kuartil (P25) ditakrifkan sebagai titek dibawahnya adalah suku daripada cerapan yang
telah dibuat. Demekian juga P50 dan P75.
(Quartiles are defined as values below it are a quarter from the observed values)
Ada beberapa lagi kaedah iaitu box-whisker plots, Stem-and leaf diagrams, time-series
graph atau sebagainya. (other examples are Stem-and leaf diagrams, time-series graph
etc.)
15
Stem
0
1
2
3
52 54 55 55 57
58 59 59
63 67
71 75 75 76 76
78 78 79
83,84,87,87,89
94,96,96
102,103,106,107,107
113,114,117,119
122,125,125,127,128,129,129
138,139
190
Leaf
0000000000023356667
8
2223555579
33577
22278999
4
01123346667899
24557899
6
7
8
9
10
11
12
13
19
37
1556689
34779
466
23677
3479
2557899
89
0
16
(stem and leave diagram is a way a good way to represent in visually for eyeball
estimation and useful in identifying outliers)
Catatan:
Stem tidak semestinya terdiri daripada digit "puluh" demikian juga leaf tidak semestinya
terdiri daripada digit "sa" sahaja. Jika julat data adalah dalam 100 ke 1000, maka digit
"ratus" akan menjadi stem dan digit "puluh" menjadi leaf, dan kita mengabaikan digit
"sa".
(Stem is not necessarily comes from the tenth digit and the leave from the unit value.
Stem can also come from the 100th , 1000th and so on and the leave from the 10th, 100th.
value respectively).
Exercise:
18
21
22
16
A)
B)
C)
D)
15
23
10
17
22
18
17
15
19
20
19
19
18
21
19
20
17
20
21
18
18
20
20
18
20
15
18
40
17
18
18
18
12
17
24
19
16 16 17
19 20 23
11 19 31
16
17