You are on page 1of 17

BAB 3 TABURAN KEKERAPAN (Frequency distribution) Pemungutan data akan menghasilkan banyak pengukuran (nilai atau nombor).

(Data collection will produce numerous measurements or scores) Masalah yang timbul adalah bagaimana menyusun data dalam bentuk yang akan memberi makna supaya dapat difahami dalam laporan atau membuat rumusan yang berkaitan. (How do we organize these in ways that will provide some meaningful conclusions?) Prosedur yang biasa dilakukan ialah dengan meletak skor dalam satu taburan kekerapan. (One of the simplest procedures is to tabulate in terms of frequencies) Kekerapan (frequency): Rekod bilangan individu terletak dalam satu kategori (skor) pada sesuatu skala pengukuran. (Frequency is the number of individuals in a certain category) Jadual Taburan kekerapan (Frequency distribution Table) (Frequency distribution table is an organized tabulation of the number of individuals located in each category on the scale of measurement) Contoh: Andaikan satu pemungutan data penyelidikan menghasilkan skor berikut (Assume a collection of data produce the following) 8,9,8,7,10,9,6,4,9,8,7,8,10,9,8,6,9,7,8,8 Skor tertinggi ialah X5 = 10 ( Highest score) Skor terendah ialah X8 = 4 (Lowest score) Frekuensi atau kekerapan bagi setiap skor dibilang, misalnya f bagi X7 = 6 ialah 2. (Frequency for each score is counted eg. X7 = 6 is 2.

Senaraikan dalam jadual: (tabulated in a frequency table) X 10 9 8 7 6 5 4 Catatan: (note) 1) Senaraikan mengikut skala tertentu, nilai 5 dimasukkan walaupun tidak ada nilai (List using certain scale, the value 5 is included) 2) f = N 3) Untuk mengira jumlah semua X gunakanlah lajur f dan fx. (to calculate the summation of all X, use the column f and fx) f 2 5 7 3 2 0 1 fx 20 45 56 21 12 0 4

Taburan kekerapan relatif (Relative frequency distribution) Kadar perbandingan = p = f/N, (comparison proportion) Kekerapan relatif menunjukkan peratus pelajar yang mendapat satu-satu skor, (relative frequency shows the percentage of students obtaining a certain score) Kekerapan relatif (fr ) (relative frequency)

fr =

score frequency 100 total number of scores

Contoh: (eg.) X 10 9 8 7 6 5 4 f 2 5 7 3 2 0 1 0.1 0.25 0.35 0.15 0.10 0 0.05 fr 10% 25% 35% 15% 10% 0% 5%

Taburan kekerapan dengan pengumpulan skor (Frequency table based on grouped data) Taburan di atas adalah taburan mudah kerana tidak melibatkan banyak skor. Jika jumlah sampel adalah banyak, skor tersebut boleh dikumpulkan mengikut selang klas tertentu (The above frequency table is a simple distribution for a small number of scores. If the total sample s large, the scores can be simplified and grouped in a class interval) Kita boleh mengumpulkan skor mengikut klas tertentu. Bilangan klas tidaklah tetap, tetapi bergantung kepada perbezaan di antara skor tertinggi dan skor terendah (julat).

(We can group the data in certain class interval. The number of classes is not fixed, but will depend on the difference between the highest and lowest score) Bilangan klas yang biasa digunakan ialah 10. (Normally 10 class interval is often used) Kita ingin menghasilkan kekerapan kumpulan mengikut klas Jadual kekerapan mengikut klas. (Our aim is to produce Frequency distribution of grouped data. Perhatian: (note) 1) Taburan data terkumpul biasanya mengandungi 8-10 klas. Jika terlampau banyak, ini akan menjadi sukar. Jika terlampau sedikit, banyak maklumat yang akan hilang. Ingat,tujuanya ialah melihat bentuk data yang terhasil daripada cerapan. (Frequency of grouped data normally contains 8-10 classes. If there are too many classes it becomes difficult and cumbersome. If we have too few classes, we begin to loose information about the distribution of scores) 2) Saiz atau selang klas biasanya adalah nilai yang mudah seperti 2,5,10 dan 20. (Normally the size of the class intervals is multiple of simple numbers such as 2, 5, 10 or 20 ) 3) Semua selang klas mestilah sama ( the value of the class interval is the same for all classes) 4) Nilai bawah haruslah gandaan pada selang klas. Contoh: 10,20,30,dsb. Contoh: Berikut adalah markah yang telah diperolehi oleh 25 orang pelajar dalam satu ujian: ( Following is a set of marks obtained by 25 students in a test) 82,75,88,93,53,84,87, 58,72,94,91,64,87,84,70,76,89,75, 80,73,69,84,61,78,60 1) Tentukan julat skor, (Determine the range) Julat skor Xmaks. Xmin tetapi bagi angkubah selanjar nilai sebenar (range is Xmax. Xmin, but for continous variable, the true value of Xmaks ialah 94.5 dan nilai sebenar Xmin ialah 52.5, maka (Xmax is 94.5 and the true value of Xmin is 52.5, hence) Julat = 94.5 52.5 = 42 (Range = 94.5 52.5 = 42)

2) Menentukan selang klas; (Determining the class intervals) Selang (class) 2 5 10 Catatan: 1) Boleh juga gunakan formula berikut untuk menentukan bilangan klas (Hukum Sturges): (it is also possible to use the following formula) k = 1 + 3.3 log10 N, dalam mana k ialah bilangan klas (k the number of classes) N jumlah bilangan data/sample (total number of data/sample) Log N ialah log asas 10 (log N is log to base 10) Bil. Klas yang akan diperolehi (number of classes obtaine) 21 (terlampau banyak) (too many) 9 (boleh diterima) (acceptable) 5 (terlampau sedikit) (Too few)

3) Titek tengah (Center point value)

Susun dari minimum ke maksimum (atau sebaliknya) (arrange from the minimum to the maximum, or other wise)

a) Nyatakan kekerapan skor dalam lajur berkenaan ( state the scores in each column) b) Kirakan kekerapan relatif (calculate the relative frequencies) c) Kekerapan longgokan iaitu jumlah pelajar yang mendapat skor tertentu dan skor yang dibawahnya. (the cumulative frequency if the sum of the number of individuals in each score and scores below it) d) Boleh juga mengira kekerapan longgokan relatif. (sometimes the cumulative relative cumulative frequencies is calculated)

Jadual yang akan dihasilkan (isikan nilai yang dikosongkan) (The table produced) X f Titek tengah (center point) 52 57 fk (kekerapan longgokan) (cumulative frequency) 1 2 5 6 9 13 18 22 25 Fkr(Kekerapan longgokan relatif) Cumulative relative proportion) 1/25 = 4% 8% 20% 24% 36% 52% 72% 88% 100%

50-54 55-59 60-64 65-69 70-74 75-79 80-84 85-89 90-94

1 1 3 1 3 4 5 4 3

(kira dan isikan dengan nilai yang berkaitan) (calculate and write the appropriate values) Graf Serakan Kekerapan (Frequency Distribution Graphs) Graf - satu cara untuk menggambarkan perhubungan antara dua angkubah X dan Y. (one method to describe the relationships between variable X and Y) Bentuk: (shape) paksi -y (y-axis)

paksi-x (x-axis) Biasanya ketinggian paksi-y biasanya ialah 3/4 panjang paksi -x. (Normally the height of the y axis is of the length of the x-axis)

HISTOGRAM & GRAF BAR (Graf Palang) (HISTOGRAM and BAR GRAPH) Histogram: 1) Ketinggian bar mewakili nilai frekuensi (kekerapan) (the height of the bar represents the frequencies) 2) Lebar bar sama dengan selang had sebenar (the width of the bar is equal to the actual class interval) Histogram boleh digunakan untuk menggambarkan data interval atau ratio Bar bagi setiap selang mewakili had sebenar bagi sesuatu selang. (histogram can be used to represent interval or ratio data. The bar ) Contoh: Bagi data: (eg. For the data) X 6 5 4 3 2 1 Histogram untuk data di-atas(lukiskan): f 1 2 2 4 2 1

Bagi data terkumpul (for the grouped data) X 12-13 10-11 8-9 6-7 4-5 f 4 5 3 3 2

Histogram adalah seperti berikut (lukiskan): Latihan dalam klas (Histogram produced is the following class exercise) How to make a histogram 1) 2) 3) 4) Make a frequency table (for grouped data) Put the values along the bottom of the page Make a scale of frequencies along the left of the page Make a bar for each value

Example: Number of social interactions 45-49 40-44 35-39 30-34 25-29 20-24 15-19 10-14 5-9 0-4 Frequencies 3 3 3 4 11 10 16 16 16 12

How to make a frequency polygon 9

1) make a frequency table 2) Put the values at the bot6om of the page 3) Along the left of the page, make a scale of frequencies that goes from 0 at the bottom to the highest frequency for any value 4) Mark a point above each value with a height for the frequency of that value 5) Connect the points with lines Example: Stress rating 10 9 8 7 6 5 4 3 2 1 0 Or for grouped data Number of social interactions 45-49 40-44 35-39 30-34 25-29 20-24 15-19 10-14 5-9 0-4 Frequencies 3 3 3 4 11 10 16 16 16 12 frequency 14 15 26 31 13 18 16 12 3 1 2

10

Graf palang (Bar) (Bar Graph) Digunakan untuk menggambarkan data Nominal (Used to represent nominal data)

Jenis personaliti (personality type) Diambil daripada data: Jenis personaliti (Type of personality) Jenis A (type A) Jenis B (type B) Jenis C (type C) f 10 5 20

11

Poligon kekerapan (frequency poligon) Poligon -- banyak isi (polygon many sides) Titek diambil pada titik tengah selang (lukiskan) gunakan contoh di muka surat 7 (Obtain the center point for each class draw) use the example on page 7)

Kekerapan relatif dan garislengkung (relative frequency curves) Bagi populasi adalah mustahil untuk melukis taburan kekerapan untuk setiap kes. Biasanya digunakan graf yang menunjukkan kekerapan relatif pada paksi menegak dan menggunakan garislengkung sekata (smooth). Biasanya bagi ciri manusia (contoh: indeks kecerdasan, pencapaian dalam peperiksaan umum, ketinggian, berat badan dsb.) akan menghasilkan satu garislengkung normal (normal curve). (For the population it is impossible to draw frequency distribution for each case in the population. Often we use relative frequency for the vertical axis and use a smooth curve as an approximation to illustrate the distribution For distribution of the population for traits such as IQ, achievement in a public examinations, height, weight etc. will produce what is called a NORMAL CURVE)

12

Catatan (notes) 1) Bentuk adalah simetri pada garis tengah (median). (The shape is symmetrical about the center line (median)) 2) Kekerapan adalah tinggi pada kawasan tengah. (The distribution is maximum at the center) 3) Kekerapan adalah rendah pada nilai-nilai penghujung. (The frequency is small at the ends) Contoh: taburan untuk IQ (eg. Distribution for IQ)

Bentuk-bentuk garislengkung yang lain (shapes for other distributions) Pencong positif (positive skew) Pencong negatif (negative skew)

Bi-modal (bimodal)

13

TABURAN KUMULATIF (Cumulative distributions) Kekerapan dan poligon kekerapan relatif boleh dibentuk menjadi taburan longgokan. Peratus longgokan atau ogif biasa digunakan. (The frequency polygon can be transformed into cumulative frequency distribution or what is referred as ogive) Contoh: Data yang diperolehi daripada satu kajian. (eg. Data obtained from one experiment) Klas (class) 150-159 140-149 130-139 120-129 110-119 100-109 90-99 80-89 70-79 60-69 50-59 40-49 F (f) 1 6 44 163 363 548 539 356 132 41 6 1 Peratus (percentage) 0.05 0.27 2.0 7.4 16.5 24.9 24.5 16.2 6.0 1.9 0.27 0.05 Peratus longgokan (cumulative frequency) 100.00 99.95 99.7 97.7 90.3 73.8 48.9 24.4 8.2 2.2 .32 0.05

Data akan menghasilkan Ogif berikut (lukiskan): (the data will produced the following ogive)

Berpandukan ogif (atau taburan kekerapan longgokan) boleh melihat percentile yang berkaitan: (based on the ogive we can read the values related to certain percentile) Biasa yang digunakan ialah kuartil (quartile) (Quartiles are often used) Kuartil (P25) ditakrifkan sebagai titek dibawahnya adalah suku daripada cerapan yang telah dibuat. Demekian juga P50 dan P75. (Quartiles are defined as values below it are a quarter from the observed values) Ada beberapa lagi kaedah iaitu box-whisker plots, Stem-and leaf diagrams, time-series graph atau sebagainya. (other examples are Stem-and leaf diagrams, time-series graph etc.) 14

15

Gambarajah "stem-and leaf" (stem and leaf diagram) Satu kaedah (cara) untuk menggambarkan data secara visual. (visual representation of data) Contoh: Katakan kita mengumpul data mengenai jumlah masa (dalam minut) seminggu pelajar sekolah menengah bermain "electronic games". (example: data collected concerning the total time (in minutes) secondary students engaged playing electronic games in a week ) Data mentah (raw data) 0,0,0,0,0,0,0,0,0,0,0,2,3,3,5,6,6,6,7,8 12,12,12,13,15,15,15,15,17,19 23,23,25,27,27 32,32,32,37,38,39,39,39 40 41 4142 43 43 44 46 46 46 47 48 49 49 52 54 55 55 57 58 59 59 63 67 71 75 75 76 76 78 78 79 83,84,87,87,89 94,96,96 102,103,106,107,107 113,114,117,119 122,125,125,127,128,129,129 138,139 190 Stem 0 1 2 3 4 5 6 7 Leaf 00000000000233566678 2223555579 33577 22278999 01123346667899 24557899 37 1556689

8 9 10 11 12 13 19

34779 466 23677 3479 2557899 89 0

Dari data mentah: (From the raw scores) Terdapat beberapa skor dalam 40an, sekumpulan lagi dalam 50an puluhan dan dua dalam 60an, dan beberapa dalam 70an. (exist some scores in the 40s, 50s and 60s) Kita namakan digit "puluh" sebagai "stem" dan digit dalam "sa" sebagai leaf. (we name the tenth digit as stem and the unit digit as leave) Gambarajah "stem and leaf" adalah satu kaedah yang baik untuk melihat secara "visual"(eyeball) data yang terhasil dan sangat berguna untuk mengesan outlier.

16

(stem and leave diagram is a way a good way to represent in visually for eyeball estimation and useful in identifying outliers)

Catatan: Stem tidak semestinya terdiri daripada digit "puluh" demikian juga leaf tidak semestinya terdiri daripada digit "sa" sahaja. Jika julat data adalah dalam 100 ke 1000, maka digit "ratus" akan menjadi stem dan digit "puluh" menjadi leaf, dan kita mengabaikan digit "sa". (Stem is not necessarily comes from the tenth digit and the leave from the unit value. Stem can also come from the 100th , 1000th and so on and the leave from the 10th, 100th. value respectively). Exercise:
18 21 22 16 15 23 10 17 22 18 17 15 19 20 19 19 18 21 19 20 17 20 21 18 18 20 20 18 20 15 18 40 17 18 18 18 12 17 24 19 16 19 11 16 16 20 19 17 23 31

A) Plot an ungrouped frequency distribution for the above data B) What is the general shaped of the distribution C) Create a histogram of the data using a reasonable number of intervals D) Draw stem-and-leaf display of the data.

17

You might also like