You are on page 1of 17

BAB 3

TABURAN KEKERAPAN
(Frequency distribution)
Pemungutan data akan menghasilkan banyak pengukuran (nilai atau nombor).
(Data collection will produce numerous measurements or scores)
Masalah yang timbul adalah bagaimana menyusun data dalam bentuk yang akan memberi
makna supaya dapat difahami dalam laporan atau membuat rumusan yang berkaitan.
(How do we organize these in ways that will provide some meaningful conclusions?)
Prosedur yang biasa dilakukan ialah dengan meletak skor dalam satu taburan kekerapan.
(One of the simplest procedures is to tabulate in terms of frequencies)
Kekerapan (frequency): Rekod bilangan individu terletak dalam satu kategori (skor)
pada sesuatu skala pengukuran.
(Frequency is the number of individuals in a certain
category)
Jadual Taburan kekerapan (Frequency distribution Table)
(Frequency distribution table is an organized tabulation of the number of individuals
located in each category on the scale of measurement)
Contoh: Andaikan satu pemungutan data penyelidikan menghasilkan skor berikut
(Assume a collection of data produce the following)
8,9,8,7,10,9,6,4,9,8,7,8,10,9,8,6,9,7,8,8
Skor tertinggi ialah X5 = 10 and X13=10
(Highest score)
Skor terendah ialah X8 = 4
(Lowest score)
Frekuensi atau kekerapan bagi setiap skor dibilang, misalnya f bagi X7 = 6 ialah 2.
(Frequency for each score is counted eg. X7 = 6 is 2.

Senaraikan dalam jadual:


(tabulated in a frequency table)
X

fx

10
9
8
7
6
5
4

2
5
7
3
2
0
1

20
45
56
21
12
0
4

Catatan: (note)
1) Senaraikan mengikut skala tertentu, nilai 5 dimasukkan walaupun tidak ada nilai
(List using certain scale, the value 5 is included)
2) f = N
3) Untuk mengira jumlah semua X gunakanlah lajur f dan fx.
(to calculate the summation of all X, use the column f and fx)

Taburan kekerapan relatif (Relative frequency distribution)


Kadar perbandingan = p = f/N,
(comparison proportion)
Kekerapan relatif menunjukkan peratus pelajar yang mendapat satu-satu skor,
(relative frequency shows the percentage of students obtaining a certain score)
Kekerapan relatif (fr )
(relative frequency)

fr

score frequency
100
total number of scores

Contoh: (eg.)
X

10
9
8
7
6
5
4

2
5
7
3
2
0
1

fr
0.1
0.25
0.35
0.15
0.10
0
0.05

10%
25%
35%
15%
10%
0%
5%

Taburan
longgokan
100%
90%
65%
30%
15%
5%
5%

Taburan kekerapan dengan pengumpulan skor


(Frequency table based on grouped data)
Taburan di atas adalah taburan mudah kerana tidak melibatkan banyak skor.
Jika jumlah sampel adalah banyak, skor tersebut boleh dikumpulkan mengikut selang
klas tertentu
(The above frequency table is a simple distribution for a small number of scores. If the
total sample s large, the scores can be simplified and grouped in a class interval)

Kita boleh mengumpulkan skor mengikut klas tertentu. Bilangan klas tidaklah tetap,
tetapi bergantung kepada perbezaan di antara skor tertinggi dan skor terendah (julat).
(We can group the data in certain class interval. The number of classes is not fixed, but
will depend on the difference between the highest and lowest score)
Bilangan klas yang biasa digunakan ialah 10.
(Normally 10 class interval is often used)
Kita ingin menghasilkan kekerapan kumpulan mengikut klas Jadual kekerapan
mengikut klas.
(Our aim is to produce Frequency distribution of grouped data.
Perhatian:
(note)
1) Taburan data terkumpul biasanya mengandungi 8-10 klas. Jika terlampau banyak, ini
akan menjadi sukar. Jika terlampau sedikit, banyak maklumat yang akan hilang.
Ingat,tujuanya ialah melihat bentuk data yang terhasil daripada cerapan.
(Frequency of grouped data normally contains 8-10 classes. If there are too many classes
it becomes difficult and cumbersome. If we have too few classes, we begin to loose
information about the distribution of scores)
2) Saiz atau selang klas biasanya adalah nilai yang mudah seperti 2,5,10 dan 20.
(Normally the size of the class intervals is multiple of simple numbers such as 2, 5, 10 or
20 )
3) Semua selang klas mestilah sama ( the value of the class interval is the same for all
classes)
4) Nilai bawah haruslah gandaan pada selang klas. Contoh: 10,20,30,dsb.
Contoh: Berikut adalah markah yang telah diperolehi oleh 25 orang pelajar dalam satu
ujian:
( Following is a set of marks obtained by 25 students in a test)
82,75,88,93,53,84,87, 58,72,94,91,64,87,84,70,76,89,75,
80,73,69,84,61,78,60
1) Tentukan julat skor,
(Determine the range)
Julat skor Xmaks. Xmin tetapi bagi angkubah selanjar nilai sebenar
(range is Xmax. Xmin, but for continous variable, the true value of
Xmaks ialah 94.5 dan nilai sebenar Xmin ialah 52.5, maka
(Xmax is 94.5 and the true value of Xmin is 52.5, hence)

Julat = 94.5 52.5 = 42


(Range = 94.5 52.5 = 42)
2) Menentukan selang klas;
(Determining the class intervals)
Selang
(class)
2
5
10

Bil. Klas yang akan diperolehi


(number of classes obtaine)
21 (terlampau banyak)
(too many)
9 (boleh diterima)
(acceptable)
5 (terlampau sedikit)
(Too few)

Catatan:
1) Boleh juga gunakan formula berikut untuk menentukan bilangan klas (Hukum
Sturges):
(it is also possible to use the following formula)
k = 1 + 3.3 log10 N,
dalam mana

k ialah bilangan klas (k the number of classes)


N jumlah bilangan data/sample (total number of data/sample)
Log N ialah log asas 10 (log N is log to base 10)

3) Titek tengah (Center point value)

Susun dari minimum ke maksimum (atau sebaliknya) (arrange from the minimum to the
maximum, or other wise)
a) Nyatakan kekerapan skor dalam lajur berkenaan
( state the scores in each column)
b) Kirakan kekerapan relatif (calculate the relative frequencies)
c) Kekerapan longgokan iaitu jumlah pelajar yang mendapat skor tertentu dan skor yang
dibawahnya. (the cumulative frequency if the sum of the number of individuals in each
score and scores below it)

d) Boleh juga mengira kekerapan longgokan relatif. (sometimes the cumulative relative
cumulative frequencies is calculated)

Jadual yang akan dihasilkan (isikan nilai yang dikosongkan)


(The table produced)
X

Titik tengah
(center
point)

50-54
55-59
60-64
65-69
70-74
75-79
80-84
85-89
90-94

1
1
3
1
3
4
5
4
3

52
57

fk (kekerapan
longgokan)
(cumulative
frequency)
1
2

Fkr(Kekerapan longgokan
relatif) Cumulative relative
proportion)

18
22
25

72%
88%
100%

1/25 = 4%
8%

(kira dan isikan dengan nilai yang berkaitan)


(calculate and write the appropriate values)
Graf Serakan Kekerapan (Frequency Distribution Graphs)
Graf - satu cara untuk menggambarkan perhubungan antara dua angkubah X dan Y.
(one method to describe the relationships between variable X and Y)
Bentuk:
(shape)
paksi -y
(y-axis)

paksi-x
(x-axis)
Biasanya ketinggian paksi-y biasanya ialah 3/4 panjang paksi -x.
(Normally the height of the y axis is of the length of the x-axis)

HISTOGRAM & GRAF BAR (Graf Palang)


(HISTOGRAM and BAR GRAPH)
Histogram:
1) Ketinggian bar mewakili nilai frekuensi (kekerapan)
(the height of the bar represents the frequencies)
2) Lebar bar sama dengan selang had sebenar
(the width of the bar is equal to the actual class interval)
Histogram boleh digunakan untuk menggambarkan data interval atau ratio
Bar bagi setiap selang mewakili had sebenar bagi sesuatu selang.
(histogram can be used to represent interval or ratio data. The bar )
Contoh: Bagi data:
(eg. For the data)
X
6
5
4
3
2
1

f
1
2
2
4
2
1

Histogram untuk data di-atas(lukiskan):

Bagi data terkumpul


(for the grouped data)
X
12-13
10-11
8-9
6-7
4-5

f
4
5
3
3
2

Histogram adalah seperti berikut (lukiskan): Latihan dalam klas


(Histogram produced is the following class exercise)
How to make a histogram
1)
2)
3)
4)

Make a frequency table (for grouped data)


Put the values along the bottom of the page
Make a scale of frequencies along the left of the page
Make a bar for each value

Example:
Number of social
interactions
45-49
40-44
35-39
30-34
25-29
20-24
15-19
10-14
5-9
0-4

Frequencies
3
3
3
4
11
10
16
16
16
12

How to make a frequency polygon


1) make a frequency table
2) Put the values at the bot6om of the page
3) Along the left of the page, make a scale of frequencies that goes from 0 at the
bottom to the highest frequency for any value
4) Mark a point above each value with a height for the frequency of that value
5) Connect the points with lines
9

6) Describe the pattern of the data


Example:
Stress rating
10
9
8
7
6
5
4
3
2
1
0

frequency
14
15
26
31
13
18
16
12
3
1
2

Or for grouped data


Number of social
interactions
45-49
40-44
35-39
30-34
25-29
20-24
15-19
10-14
5-9
0-4

Frequencies
3
3
3
4
11
10
16
16
16
12

10

Graf palang (Bar)


(Bar Graph)
Digunakan untuk menggambarkan data Nominal
(Used to represent nominal data)

Jenis personaliti (personality type)


Diambil daripada data:
f
Jenis personaliti
(Type of personality)
10
Jenis A (type A)
Jenis B (type B)
Jenis C (type C)

5
20

11

Poligon kekerapan (frequency poligon)


Poligon -- banyak isi (polygon many sides)
Titek diambil pada titik tengah selang (lukiskan) gunakan contoh di muka surat 7
(Obtain the center point for each class draw) use the example on page 7)

Kekerapan relatif dan garislengkung


(relative frequency curves)
Bagi populasi adalah mustahil untuk melukis taburan kekerapan untuk setiap kes.
Biasanya digunakan graf yang menunjukkan kekerapan relatif pada paksi menegak dan
menggunakan garislengkung sekata (smooth).
Biasanya bagi ciri manusia (contoh: indeks kecerdasan, pencapaian dalam peperiksaan
umum, ketinggian, berat badan dsb.) akan menghasilkan satu garislengkung normal
(normal curve).
(For the population it is impossible to draw frequency distribution for each case in the
population. Often we use relative frequency for the vertical axis and use a smooth curve
as an approximation to illustrate the distribution
For distribution of the population for traits such as IQ, achievement in a public
examinations, height, weight etc. will produce what is called a NORMAL CURVE)

12

Catatan (notes)

1) Bentuk adalah simetri pada garis tengah (median).


(The shape is symmetrical about the center line (median))
2) Kekerapan adalah tinggi pada kawasan tengah.
(The distribution is maximum at the center)
3) Kekerapan adalah rendah pada nilai-nilai penghujung.
(The frequency is small at the ends)
Contoh: taburan untuk IQ (eg. Distribution for IQ)

Bentuk-bentuk garislengkung yang lain (shapes for other distributions)


Pencong positif
(positive skew)

Pencong negatif
(negative skew)

Bi-modal (bimodal)

13

TABURAN KUMULATIF (Cumulative distributions)


Kekerapan dan poligon kekerapan relatif boleh dibentuk menjadi taburan longgokan.
Peratus longgokan atau ogif biasa digunakan.
(The frequency polygon can be transformed into cumulative frequency distribution or
what is referred as ogive)
Contoh: Data yang diperolehi daripada satu kajian.
(eg. Data obtained from one experiment)
Klas (class)

F (f)

150-159
140-149
130-139
120-129
110-119
100-109
90-99
80-89
70-79
60-69
50-59
40-49

1
6
44
163
363
548
539
356
132
41
6
1

Peratus
(percentage)
0.05
0.27
2.0
7.4
16.5
24.9
24.5
16.2
6.0
1.9
0.27
0.05

Peratus longgokan
(cumulative frequency)
100.00
99.95
99.7
97.7
90.3
73.8
48.9
24.4
8.2
2.2
.32
0.05

Data akan menghasilkan Ogif berikut (lukiskan):


(the data will produced the following ogive)

Berpandukan ogif (atau taburan kekerapan longgokan) boleh melihat percentile yang
berkaitan:
(based on the ogive we can read the values related to certain percentile)
Biasa yang digunakan ialah kuartil (quartile) (Quartiles are often used)

14

Kuartil (P25) ditakrifkan sebagai titek dibawahnya adalah suku daripada cerapan yang
telah dibuat. Demekian juga P50 dan P75.
(Quartiles are defined as values below it are a quarter from the observed values)
Ada beberapa lagi kaedah iaitu box-whisker plots, Stem-and leaf diagrams, time-series
graph atau sebagainya. (other examples are Stem-and leaf diagrams, time-series graph
etc.)

15

Gambarajah "stem-and leaf" (stem and leaf diagram)


Satu kaedah (cara) untuk menggambarkan data secara visual.
(visual representation of data)
Contoh: Katakan kita mengumpul data mengenai jumlah masa (dalam minut) seminggu
pelajar sekolah menengah bermain "electronic games".
(example: data collected concerning the total time (in minutes) secondary students
engaged playing electronic games in a week )
Data mentah (raw data)
0,0,0,0,0,0,0,0,0,0,0,2,3,3,5,6,6,6,7,8
12,12,12,13,15,15,15,15,17,19
23,23,25,27,27
32,32,32,37,38,39,39,39
40 41 4142 43
43 44 46 46 46
47 48 49 49

Stem
0
1
2
3

52 54 55 55 57
58 59 59

63 67
71 75 75 76 76
78 78 79
83,84,87,87,89
94,96,96
102,103,106,107,107
113,114,117,119
122,125,125,127,128,129,129
138,139
190

Leaf
0000000000023356667
8
2223555579
33577
22278999

4
01123346667899
24557899
6
7

8
9
10
11
12
13
19

37
1556689

34779
466
23677
3479
2557899
89
0

Dari data mentah:


(From the raw scores)
Terdapat beberapa skor dalam 40an, sekumpulan lagi dalam 50an puluhan dan dua dalam
60an, dan beberapa dalam 70an.
(exist some scores in the 40s, 50s and 60s)
Kita namakan digit "puluh" sebagai "stem" dan digit dalam "sa" sebagai leaf.
(we name the tenth digit as stem and the unit digit as leave)
Gambarajah "stem and leaf" adalah satu kaedah yang baik untuk melihat secara
"visual"(eyeball) data yang terhasil dan sangat berguna untuk mengesan outlier.

16

(stem and leave diagram is a way a good way to represent in visually for eyeball
estimation and useful in identifying outliers)
Catatan:
Stem tidak semestinya terdiri daripada digit "puluh" demikian juga leaf tidak semestinya
terdiri daripada digit "sa" sahaja. Jika julat data adalah dalam 100 ke 1000, maka digit
"ratus" akan menjadi stem dan digit "puluh" menjadi leaf, dan kita mengabaikan digit
"sa".
(Stem is not necessarily comes from the tenth digit and the leave from the unit value.
Stem can also come from the 100th , 1000th and so on and the leave from the 10th, 100th.
value respectively).
Exercise:
18
21
22
16
A)
B)
C)
D)

15
23
10
17

22
18
17
15

19
20
19
19

18
21
19
20

17
20
21
18

18
20
20
18

20
15
18
40

17
18
18
18

12
17
24
19

16 16 17
19 20 23
11 19 31
16

Plot an ungrouped frequency distribution for the above data


What is the general shaped of the distribution
Create a histogram of the data using a reasonable number of intervals
Draw stem-and-leaf display of the data.

17

You might also like