You are on page 1of 31

บทที่ 2

การวิเคราะห์ข้อมูลอย่างง่าย
2.1 การวัดแนวโน้มเข้าสู่ส่วนกลาง (Measures of Central Tendency)

การวัดแนวโน้มเข้าสู่ส่วนกลางเป็นระเบียบวิธีทางสถิติในสถิติเชิงพรรณนา ที่ใช้การหาค่า
คะแนนกลางหรือค่าเฉลี่ยเพื่อใช้เป็นตัวแทนแสดงขนาดและลักษณะของข้อมูลแต่ละชุดที่มีอยู่ จาก
ข้อมูลที่เก็บรวบรวมมาได้ โดยจะเลือกเอาตัวแทนที่มีค่าใกล้เคียงกับค่าสังเกตส่วนใหญ่ และการวัด
แนวโน้มสู่ส่วนกลาง สามารถหาได้หลายวิธี ทั้งนี้ก็ขึ้นอยู่กับลักษณะของข้อมูล และวัตถุประสงค์
ของผู้วิเคราะห์ ดังนี้

1. ค่าเฉลี่ยเลขคณิต (Arithmetic Mean :AM)

เป็นค่ากลางที่นิยมใช้กันมากซึ่งโดยทั่วไปเรียกกันสั้น ๆ ว่า ค่าเฉลี่ย (Mean) ค่ากลางชนิดนี้


ใช้ได้ดีสาหรับข้อมูลเชิงปริมาณ ที่มีลักษณะปกติ

- กรณีข้อมูลทีไ่ ม่ได้จัดหมวดหมู่ (Ungrouped Data)


ค่าเฉลี่ย มีค่าเท่ากับผลรวมของค่าสังเกตทุกค่า หารกับ จานวนค่าสังเกตทั้งหมดของข้อมูล
N
xi
 = iN1
เมื่อ x i หมายถึง ค่าสังเกตแต่ละค่าของข้อมูล i = 1, 2, …, N
N หมายถึง จานวนค่าสังเกตทั้งหมดของข้อมูลประชากร
n
xi
หรือ x = iN1
เมื่อ x i หมายถึง ค่าสังเกตแต่ละค่าของข้อมูล i = 1, 2, …, n
n หมายถึง จานวนค่าสังเกตทั้งหมดของข้อมูลตัวอย่าง

ตัวอย่างที่ 2.1 น้าหนักของนักศึกษาสาขาเศรษฐศาสตร์ จานวน 15 คน เป็นดังนี้ 49.8, 39, 50.6,


42.8, 53.6, 42.5, 55, 52, 43, 51, 50.5, 43, 44, 42, 40.5 กิโลกรัม จงหาน้าหนักเฉลี่ยของนักศึกษา
กลุ่มนี้
19

N
xi
วิธีทา จาก  = iN1 จะได้ว่า
49.8  39    40.5
= 15
= 46.62
นั่นคือ น้าหนักเฉลี่ยของนักศึกษาสาขาเศรษฐศาสตร์ ทั้ง 15 คนเป็น 46.62 กิโลกรัม

- กรณีข้อมูลที่จัดหมวดหมู่(Grouped Data)
k
 fi x i
 = i1N
เมื่อ x i หมายถึง จุดกึ่งกลางของชั้นที่ i ; i = 1,2,..,k
fi หมายถึง ความถี่ของชั้นที่ i ; i = 1,2,..,k
k
N หมายถึง จานวนค่าสังเกตทั้งหมดของข้อมูล หรือ  fi
i1

ตัวอย่างที่ 2.2 จงหาค่าเฉลี่ยของข้อมูลต่อไปนี้

ค่าสังเกต ( x i ) ความถี่ ( fi ) ผลรวม ( fi x i )


8 5 40
10 4 40
12 3 36
14 5 70
16 3 48
รวม 20 234
k
 fi x i
วิธีทา จาก  = i1N จะได้ว่า
234
 = 20 = 11.7
นั่นคือค่าเฉลี่ยของข้อมูลชุดนี้เป็น 11.7
20

ตัวอย่างที่ 2.3 จงหาความสูงเฉลี่ย ของนักศึกษาสาขาวิชาคอมพิวเตอร์ 45 คน ดังตารางแจกแจง


ความถี่ต่อไปนี้

ความสูง จานวน
150 - 154 5
155 - 159 10
160 - 164 14
165 - 169 6
170 - 174 10

วิธีทา

ความสูง จานวน( fi ) จุดกึ่งกลางชั้น ( x i ) ผลรวม ( fi x i )


150 - 154 5 152 760
155 - 159 10 157 1,570
160 - 164 14 162 2,268
165 - 169 6 167 1,002
170 - 174 10 172 1,720
รวม 45 7,320

k
 fi x i
วิธีทา จาก  = i1N จะได้ว่า
7,320
 = 45
 = 162.67
นัน่ คือความสูงเฉลี่ย ของนักศึกษาสาขาคอมพิวเตอร์ทั้ง 45 คนเท่ากับ 162.67 เซนติเมตร
21

ค่าเฉลี่ยรวม (Combined Mean)

เป็นการหาค่าเฉลี่ยรวมของข้อมูลหลาย ๆ ชุด ที่เป็นเรื่องเดียวกัน โดยทราบค่าเฉลี่ยของ


ข้อมูลแต่ละชุด i หรือ x i และทราบจานวนค่าสังเกตของข้อมูลแต่ละชุด Ni หรือ n i ดังนั้นสูตร
ในการหาค่าเฉลี่ยรวม คือ
k
 N i i
ค่าเฉลี่ยรวมของประชากร  c = i1k
 Ni
i1
k
 nixi
หรือ ค่าเฉลี่ยรวมของตัวอย่าง x c = i1
k
 ni
i1

ตัวอย่างที่ 2.4 ในวิชาหลักสถิติที่เปิดสอนของมหาวิทยาลัยแห่งหนึ่ง ในภาคเรียนที่1 ปีการศึกษา


2547 พบว่ามีนักศึกษาเรียนกลุ่มละ 55, 48, 60 และ 75 คน และได้คะแนนสอบเฉลี่ยกลุ่มละ 70,
75, 80 และ 70 คะแนน ตามลาดับ จากคะแนนเต็ม 100 คะแนน จงหาคะแนนเฉลี่ยรวมของ
นักศึกษาที่เรียนวิชาหลักสถิติในภาคเรียนนี้
k
 N i i
วิธีทา จาก  c = i1k จะได้ว่า
 Ni
i1
(55  70 )  ( 48  75)  (60  80 )  (75  70 )
C = 238
C = 73.529
นั่นคือคะแนนเฉลี่ยรวมของนักศึกษาที่เรียนวิชาหลักสถิติทั้งหมด เป็น 73.529 คะแนน

ค่าเฉลี่ยถ่วงน้าหนัก (Weighted Mean)


เป็นการหาค่าเฉลี่ย ในกรณีที่ค่าสังเกตแต่ละค่ามีน้าหนักไม่เท่ากัน เช่น คะแนนสอบวิชาต่าง
ๆ ซึ่งต้องให้น้าหนักตามจ้านวนชั่วโมงที่เรียน หรือเรียกว่าหน่วยกิต หรืออาจจะมีการสอบหลาย ๆ
22

ครั้ง และเนื้อหาของการสอบแต่ละครั้งอาจไม่เท่ากัน จึงเรียกการหาค่าเฉลี่ยนี้ว่า ค่าเฉลี่ยถ่วง


น้้าหนัก (Weighted Mean)  w ดังนั้นสูตรการหาค่าเฉลี่ยถ่วงน้้าหนัก คือ
k
 wix i
w = i1
k
 wi
i1
เมื่อ xi เป็นค่าสังเกตตัวที่ i ; i = 1, 2, …, k
wi เป็นน้าหนักของค่าสังเกตตัวที่ i ; i = 1, 2, …, k

ตัวอย่างที่ 2.5 จงหาเกรดเฉลี่ยของนายยุทธศาสตร์ ซึ่งได้รับผลการเรียน จากการลงทะเบียนเรียน


ทั้งหมด 6 ภาคเรียนเป็นดังนี้

ภาคเรียน จานวนหน่วยกิต เกรดที่ได้


1/2545 21 2.56
2/2545 18 2.84
1/2546 19 2.93
2/2546 22 2.77
1/2547 21 2.68
2/2548 15 3.00
116
k
 wix i
วิธีทา จาก  w = i1k จะได้ว่า
 wi
i1
( 21  2.56)  (18  2.84 )  (19  2.93)  ( 22  2.77)  ( 21  2.68)  (15  3)
= 116
 = 2.78
นั่นคือ เกรดเฉลี่ยของนายยุทธศาสตร์ เป็น 2.78
23

คุณสมบัติของค่าเฉลี่ย
N
1. ผลรวมของค่าสังเกตแต่ละค่าที่แตกต่างจากค่าเฉลี่ย มีค่าเท่ากับศูนย์  ( x i   ) = 0
i1
N
2. ผลรวมของกาลังสองของค่าสังเกตแต่ละค่าที่แตกต่างจากค่าเฉลี่ย  ( x i  a ) 2 จะมี
i1
ค่าน้อยที่สุดเมื่อ a มีค่าเท่ากับ 
3. ถ้านาค่าคงที่ C ไปบวกเข้า หรือ ลบออกกับค่าสังเกตทุกค่าในข้อมูลชุดเดิม จะได้
ค่าเฉลี่ยของข้อมูลชุดใหม่เป็น ค่าเฉลี่ยของข้อมูลชุดเดิม บวกเข้าหรือลบออกกับค่า C
ถ้านาค่าคงที่ C ไปคูณกับค่าสังเกตทุกค่าในข้อมูลชุดเดิม จะได้ค่าเฉลี่ยของข้อมูลชุด
ใหม่เป็น ค่าเฉลี่ยของข้อมูลชุดเดิม คูณกับค่า C
และถ้านาค่าคงที่ C ซึ่งC0 ไปหารกับค่าสังเกตทุกค่าในข้อมูลชุดเดิม จะได้ค่าเฉลี่ย
ของข้อมูลชุดใหม่เป็น ค่าเฉลี่ยของข้อมูลชุดเดิม หารกับค่า C
ข้อสังเกต
1. ค่าเฉลี่ยเป็นการใช้ค่าสังเกตทุกค่ามาคานวณ ถ้าค่าสังเกตบางค่าผิดปกติ เช่นสูงหรือต่า
กว่าค่าสังเกตค่าอื่นมาก ๆ ค่าเฉลี่ยก็จะผิดปกติไปด้วย ดังนั้นค่าเฉลี่ยจึงเป็นค่าที่ถูกกระทบกระเทือนได้
ง่าย
2. ค่าเฉลี่ยใช้เป็นค่ากลางได้ดี สาหรับข้อมูลเชิงปริมาณ ที่มีมาตรวัดอันตรภาค และมาตร
วัดอัตราส่วน
3. ในกรณีทไี่ ม่ทราบค่าสังเกตบางค่าจากข้อมูลชุดนั้น หรือข้อมูลจากตารางการแจก
แจงความถี่เป็นแบบปลายเปิด จะหาค่าเฉลี่ยไม่ได้

2. มัธยฐาน (Median)

เป็นค่ากลางที่อยู่ในตาแหน่งกึ่งกลางของข้อมูลแต่ละชุด ซึ่งเมื่อนาข้อมูลชุดหนึ่งมาจัด
เรียงลาดับจากค่าสังเกตที่มีค่าน้อยไปยังค่ามากแล้ว แสดงว่าค่ามัธยฐานจะเป็นตัวที่แบ่งข้อมูลชุด
นั้นออกเป็นสองส่วน โดยจะมีข้อมูลจานวนครึ่งหนึ่งหรือ 50% ที่มีค่าน้อยกว่าค่ามัธยฐาน และมี
ข้อมูลจานวนอีกครึ่งหนึ่งหรือ 50% ที่มีค่ามากกว่าค่ามัธยฐาน
24

- กรณีข้อมูลที่ไม่ได้จัดหมวดหมู่(Ungrouped Data)
จัดเรียงลาดับค่าสังเกตทั้งหมดของข้อมูลจากค่าน้อยไปยังค่ามาก นับจานวนข้อมูล ทั้งหมด
( N  1)
(N) เพื่อหา ตาแหน่งที่มัธยฐานอยู่ คือ ตาแหน่งที่ 2 และค่าที่ตรงกับตาแหน่งที่มัธยฐานอยู่
ก็คือค่ามัธยฐาน

ตัวอย่างที่ 2.6 จงหาค่ามัธยฐานของข้อมูลต่อไปนี้


6 4 5 8 4
วิธีทา เรียงข้อมูล N = 5 จากน้อยไปมากได้ดังนี้
4 4 5 6 8
( N  1) (5  1)
หาตาแหน่งที่มัธยฐานอยู่ จาก 2 จะได้ ว า
่ 2 =3
ดังนั้นมัธยฐานคือ 5

ตัวอย่างที่ 2.7 จงหาค่ามัธยฐานของส่วนสูงนักศึกษาชาย มหาวิทยาลัยแม่โจ้ 8 คนต่อไปนี้


165 166 171 168 167 164 175 170 หน่วย: เซนติเมตร
วิธีทา เรียงข้อมูล N = 8 จากน้อยไปมากได้ดังนี้
164 165 166 167 168 170 171 175
( N  1) (8  1)
หาตาแหน่งที่มัธยฐานอยู่ จาก 2 จะได้ ว า
่ 2 = 4.5
167  168
ค่ามัธยฐานคือ 2 = 167.5
ดังนั้นค่ามัธยฐานของความสงนักศึกษาชายมหาวิทยาลัยแม่โจ้ คือ 167.5 เซนติเมตร

- กรณีข้อมูลทีจ่ ัดหมวดหมู่ (Grouped Data)


มีขั้นตอนการทาดังนี้
1. เรียงลาดับค่าสังเกตทั้งหมดของข้อมูล(N) จากค่าน้อยไปยังค่ามาก
N
2. หาตาแหน่งที่มัธยฐานอยู่ คือ ตาแหน่งที่ 2
( N / 2)  F 
ค่ามัธยฐาน = L Me  I  f
 Me 
เมื่อ LMe หมายถึง ขอบเขตล่างของชั้นที่คาดว่ามัธยฐานอยู่
I หมายถึง ความกว้างของชั้น
25

F หมายถึง ความถี่สะสมชนิดน้อยกว่าของชั้นที่มีค่าสังเกต ที่มีค่าน้อยกว่าชั้น


มัธยฐาน
fMe หมายถึง ความถี่ของชั้นที่คาดว่ามัธยฐานอยู่

ตัวอย่างที่ 2.8 จากตัวอย่างที่ 2.3 จงหาค่ามัธยฐานของความสูง

ความสูง จานวน(f) F
150 - 154 5 5
155 - 159 10 15
160 - 164 14 29
165 - 169 6 35
170 - 174 10 45
วิธีทา
N 45
จาก 2 = 2 = 22.5 แสดงว่ามัธยฐานอยู่ที่ชั้น 160 – 164
และได้ว่า LMe = 159.5 , F = 15 , f Me = 14 , I = 5
( N / 2)  F 
จาก ค่ามัธยฐาน = L Me  I  f
 Me 
22.5  15
ได้ = 159.5  5 14 
 
= 162.178
นั่นคือ มัธยฐานความสูงของนักศึกษาสาขาคอมพิวเตอร์ทั้ง 45 คนเท่ากับ 162.178 เซนติเมตร

คุณสมบัติของมัธยฐาน
ถ้านาค่าคงที่ C ไปบวกเข้าหรือลบออกกับค่าสังเกตทุกค่าในข้อมูลชุดเดิม จะได้ค่ามัธยฐาน
ของข้อมูลชุดใหม่เป็น ค่ามัธยฐานของข้อมูลชุดเดิม บวกเข้าหรือลบออกกับค่า C
ถ้านาค่าคงที่ C ไปคูณเข้ากับค่าสังเกตทุกค่าในข้อมูลชุดเดิม จะได้ค่ามัธยฐานของข้อมูลชุด
ใหม่เป็น ค่ามัธยฐานของข้อมูลชุดเดิม คูณกับค่า C
ถ้านาค่าคงที่ C ซึ่ง C0 ไปหารกับค่าสังเกตทุกค่าในข้อมูลชุดเดิม จะได้ค่ามัธยฐานของ
ข้อมูลชุดใหม่เป็น ค่ามัธยฐานของข้อมูลชุดเดิม หารกับค่า C
26

ข้อสังเกต
N N
1.  ( x i  median ) 2   ( x i  mean ) 2
i1 i1
2. ค่ามัธยฐานเหมาะสาหรับข้อมูลที่มีค่าสังเกตบางค่าผิดปกติ เช่นสูงหรือต่ากว่าค่าสังเกต
ค่าอื่นมาก ๆ
3. ค่ามัธยฐานเหมาะสาหรับข้อมูลมาตรวัดเรียงอันดับ มาตรวัดอันตรภาค และมาตรวัด
อัตราส่วน
4. สาหรับข้อมูลจากตารางแจกแจงความถี่ที่มีลักษณะแบบปลายเปิด สามารถหา
ค่ามัธยฐานได้
5. สาหรับตารางข้อมูลจากตารางแจกแจงความถี่ ถ้าค่า N/2 ตรงกับค่าความถี่สะสมของชั้น
ใด จะได้ว่า มัธยฐาน = ขอบเขตบนของชั้นนั้น

3. ฐานนิยม (Mode)

เป็นค่ากลางที่แสดงถึงค่าสังเกตที่มีซ้ากันมากที่สุด หรือมีจานวนความถี่สูงสุดในข้อมูลชุด
นั้น ข้อมูลชุดหนึ่ง ๆ อาจมีค่าฐานนิยมมากกว่า 1 ค่า หรือ อาจไม่มีค่าฐานนิยมเลย

- กรณีข้อมูลที่ไม่ได้จัดหมวดหมู่(Ungrouped Data)
ฐานนิยม คือ ค่าสังเกตที่มีซ้ากันมากที่สุด ในข้อมูลชุดหนึ่ง

ตัวอย่างที่ 2.9 จงหาค่าฐานนิยมของข้อมูลต่อไปนี้


ข้อมูลชุดที่ 1 ได้แก่ ก , ข , ก , ค , จ , ง ฐานนิยม คือ ก
ข้อมูลชุดที่ 2 ได้แก่ 6, 2 , 1, 0 , 9 , 4 , 6 , 0 ฐานนิยมคือ 6 , 0
ข้อมูลชุดที่ 3 ได้แก่ 5, 7 , 0 , 1 , 4 , 6 ไม่มีฐานนิยม

- กรณีข้อมูลทีจ่ ัดหมวดหมู่ (Grouped Data)


1 
จาก ค่าฐานนิยม = L Mo  I 
 1   2 

เมื่อ LMoหมายถึง ขอบเขตล่างของชั้นที่คาดว่ามีฐานนิยมตกอยู่


I หมายถึง ความกว้างของชั้น
27

1 หมายถึง ผลต่างของความถี่มากที่สุดกับความถี่ถัดไป ทางด้านค่าสังเกตที่มีค่าน้อย


 2 หมายถึง ผลต่างของความถี่มากที่สุดกับความถี่ถดั ไป ทางด้านค่าสังเกตที่มีค่ามาก

ตัวอย่างที่ 2.10 จากตัวอย่างที่ 2.3 จงหาค่าฐานนิยม ของความสูง

ความสูง จานวน(f)
150 - 154 5
155 - 159 10
160 - 164 14
165 - 169 6
170 - 174 10

วิธีทา
ความถี่สูงสุดคือ 14 อยู่ชั้น ที่ 160 – 164
และได้ LMo = 159.5 , 1 = 14 – 10 = 4 ,  2 = 14 – 6 = 8 , I = 5
1 
จาก ฐานนิยม = L Mo  I  จะได้ว่า
 1   2 
4
ฐานนิยม = 159.5  5 4  8 
 
ฐานนิยม = 161.167
นั่นคือ ฐานนิยมความสูงของนักศึกษาสาขาคอมพิวเตอร์ทั้ง 45 คนเท่ากับ 161.167 เซนติเมตร

คุณสมบัติของฐานนิยม
ถ้านาค่าคงที่ C ไปบวกเข้า หรือลบออกกับค่าสังเกตทุกค่าในข้อมูลชุดเดิม จะได้ค่าฐาน
นิยมของข้อมูลชุดใหม่เป็น ค่าฐานนิยมของข้อมูลชุดเดิม บวกเข้าหรือลบออก กับค่า C
ถ้านาค่าคงที่ C ไปคูณกับค่าสังเกตทุกค่าในข้อมูลชุดเดิม จะได้ค่าฐานนิยมของข้อมูลชุด
ใหม่เป็น ค่าฐานนิยมของข้อมูลชุดเดิม คูณกับค่า C
ถ้านาค่าคงที่ C ซึ่ง C  0 ไปหารกับค่าสังเกตทุกค่าในข้อมูลชุดเดิม จะได้ค่าฐานนิยมของ
ข้อมูลชุดใหม่เป็น ค่าฐานนิยมของข้อมูลชุดเดิม หารกับค่า C
28

ข้อสังเกต
N N N
1.  ( x i  mod e ) 2   ( x i  median ) 2   ( x i  mean ) 2
i1 i1 i1
2. สาหรับข้อมูลจากตารางแจกแจงความถี่ ที่มีความกว้างในแต่ละชั้นไม่เท่ากัน ไม่
สามารถหาค่าฐานนิยมได้
3. การหาค่าฐานนิยมในกรณีที่มีความถี่มากที่สุดเท่ากัน 2 ชั้น และอยู่ติดกัน ใช้สูตร ดังนี้
1
ค่าฐานนิยม = L  2 I
1   2

4. ความสัมพันธ์ระหว่างค่าเฉลี่ย มัธยฐาน และฐานนิยม


จากความสัมพันธ์ของค่าเฉลี่ย ค่ามัธยฐาน และค่าฐานนิยม สามารถบอกลักษณะรูปของ
การแจกแจงได้ ดังนี้
1. ถ้าข้อมูลชุดใด มีค่าเฉลี่ย (Mean ) ค่ามัธยฐาน (Median) และค่าฐานนิยม(Mode)เท่ากัน
จะได้ลักษณะรูปของการแจกแจงโค้งความถี่เป็นรูประฆังที่สมมาตร

Mean = Median = Mode


2. ถ้าข้อมูลชุดใด มีค่าเฉลี่ย (Mean ) มากกว่า ค่ามัธยฐาน (Median) และมากกว่าค่าฐาน
นิยม(Mode)
จะได้ลักษณะรูปของการแจกแจงโค้งความถี่เป็นรูประฆังที่เบ้ขวา

Mode Median Mean


3. ถ้าข้อมูลชุดใด มีค่าฐานนิยม(Mode) มากกว่า ค่ามัธยฐาน (Median) และมากกว่า
ค่าเฉลี่ย (Mean )
29

จะได้ลักษณะรูปของการแจกแจงโค้งความถี่เป็นรูประฆังที่เบ้ซ้าย

Mean Median Mode


จากความสัมพันธ์นี้ สาหรับลักษณะรูปของการแจกแจงโค้งความถี่ที่เป็นรูประฆัง ที่
ค่อนข้างสมมาตร คือมีความเบ้ไม่ค่อยมาก สามารถหาค่าเฉลี่ย หรือค่ามัธยฐาน หรือค่าฐานนิยม ได้
จากสูตร
Mean – mode = 3(mean – median )

2.2 การแบ่งข้อมูล (Partition Values)

ในการศึกษาลักษณะของข้อมูล นอกจากมีการศึกษาค่ากลางของข้อมูลแล้ว ยังมีการศึกษา


หาตาแหน่งของค่าสังเกตใดๆ ในข้อมูลได้อีกด้วย โดยวิธีการที่เรียกว่า การแบ่งข้อมูลซึ่งมี 3 แบบ
คือ
1. ควอร์ไทล์ (Quartile : Q)

เป็นการแบ่งจานวนข้อมูลทั้งหมดออกเป็น 4 ส่วนเท่า ๆ กัน ส่วนละ 25% หรือ 1 / 4 ของ


ข้อมูลทั้งหมด โดยเรียงลาดับข้อมูลจากค่าน้อยไปยังค่ามาก เช่น Q 1 แสดงว่าค่าของข้อมูลที่มี
จานวนข้อมูลที่น้อยกว่าค่า Q 1 มีอยู่ 25 %

- กรณีข้อมูลที่ไม่ได้จัดหมวดหมู่(Ungrouped Data)
เรียงลาดับค่าสังเกตทั้งหมดของข้อมูล (N) จากค่าน้อยไปยังค่ามาก จากนั้นหาตาแหน่งโดย
( N  1)r
ตาแหน่งควอร์ไทล์ Q r (r = 1, 2, 3) = 4
แล้วค่าควอร์ไทล์ Q r คือ ค่าที่ตรงกับตาแหน่งควอร์ไทล์ Q r

- กรณีข้อมูลทีจ่ ัดหมวดหมู่(Grouped Data)


มีขั้นตอนการทาดังนี้
1. เรียงลาดับค่าสังเกตทั้งหมดของข้อมูล (N) จากค่าน้อยไปยังค่ามาก
30

2. หาตาแหน่ง
Nr
ตาแหน่งควอร์ไทล์ Q r (r = 1, 2, 3) ; N r = 4
N F
3. หาค่าควอร์ไทล์ ที่ r (Q r) = L  I  r 
 f 
เมื่อ L หมายถึง ขอบเขตล่างของชั้นที่คาดว่า มีค่าควอร์ไทล์ อยู่
I หมายถึง ความกว้างของชั้น
F หมายถึง ความถี่สะสมชนิดน้อยกว่าของชั้นที่มคี ่าสังเกตมีค่าน้อยกว่าชั้นที่ค
วอร์ไทล์อยู่
f หมายถึง ความถี่ของชั้นที่คาดว่ามีค่าควอร์ไทล์ อยู่

2. เดไซล์ (Decile :D)

เป็นการแบ่งจานวนข้อมูลทั้งหมดออกเป็น 10 ส่วนเท่า ๆ กัน ส่วนละ 10% หรือ 1/10 ของ


ข้อมูลทั้งหมด โดยเรียงลาดับข้อมูลจากค่าน้อยไปยังค่ามาก เช่น D 6 แสดงว่าค่าของข้อมูลที่มี
จานวนข้อมูลที่น้อยกว่าค่า D 6 มีอยู่ 60 %

- กรณีข้อมูลที่ไม่ได้จัดหมวดหมู่(Ungrouped Data)
เรียงลาดับค่าสังเกตทั้งหมดของข้อมูล (N) จากค่าน้อยไปยังค่ามาก จากนั้นหาตาแหน่งโดย
( N  1)r
ตาแหน่งเดไซล์ D r (r = 1, 2, …, 9) = 10
ค่าเดไซล์ D r คือ ค่าที่ตรงกับตาแหน่งเดไซล์ D r

- กรณีข้อมูลทีจ่ ัดหมวดหมู่(Grouped Data)


มีขั้นตอนการทาดังนี้
1. เรียงลาดับค่าสังเกตทั้งหมดของข้อมูล (N) จากค่าน้อยไปยังค่ามาก
2. หาตาแหน่ง
Nr
ตาแหน่งเดไซล์ D r (r = 1, 2, …, 9) ; N r = 10
N F
3. หาค่าเดไซล์ ที่ r (Dr) = L  I  r 
 f 
เมื่อ L หมายถึง ขอบเขตล่างของชั้นที่คาดว่ามีค่าเดไซล์ อยู่
I หมายถึง ความกว้างของชั้น
31

F หมายถึง ความถี่สะสมชนิดน้อยกว่าของชั้นที่มคี ่าสังเกตมีค่าน้อยกว่าชั้น


ที่เดไซล์ อยู่
f หมายถึง ความถี่ของชั้นที่คาดว่ามีค่าเดไซล์ อยู่

เปอร์เซ็นไทล์ (Percentile : P)

เป็นการแบ่งจานวนข้อมูลทั้งหมดออกเป็น 100 ส่วนเท่า ๆ กัน ส่วนละ 1% หรือ 1/100


ของข้อมูลทั้งหมด โดยเรียงลาดับข้อมูลจากค่าน้อยไปยังค่ามาก เช่น P 70 แสดงว่าค่าของข้อมูลที่มี
จานวนข้อมูลที่น้อยกว่าค่า P 70 มีอยู่ 70 %

- กรณีข้อมูลที่ไม่ได้จัดหมวดหมู่(Ungrouped Data)
เรียงลาดับค่าสังเกตทั้งหมดของข้อมูล (N) จากค่าน้อยไปยังค่ามาก จากนั้นหาตาแหน่งโดย
( N  1)r
ตาแหน่งเปอร์เซ็นไทล์ Pr (r = 1, 2, …, 99) = 100
ค่าเปอร์เซ็นไทล์ Pr คือ ค่าที่ตรงกับตาแหน่งเปอร์เซ็นไทล์ Pr

- กรณีข้อมูลทีจ่ ัดหมวดหมู่(Grouped Data)


มีขั้นตอนการทาดังนี้
1. เรียงลาดับค่าสังเกตทั้งหมดของข้อมูล (N) จากค่าน้อยไปยังค่ามาก
2. หาตาแหน่ง
Nr
ตาแหน่งเปอร์เซ็นไทล์ Pr (r = 1, 2, …, 99) ; N r = 100
N F
3. หาค่าเปอร์เซ็นต์ไทล์ ที่ r (Pr) = L  I  r 
 f 
เมื่อ L หมายถึง ขอบเขตล่างของชั้นที่คาดว่า มีค่าเปอร์เซ็นต์ไทล์อยู่
I หมายถึง ความกว้างของชั้น
F หมายถึง ความถี่สะสมชนิดน้อยกว่าของชั้นที่มคี ่าสังเกตมีค่าน้อยกว่าชั้นที่
เปอร์เซ็นต์ไทล์อยู่
f หมายถึง ความถี่ของชั้นที่คาดว่า มีค่าเปอร์เซ็นต์ไทล์อยู่
32

ตัวอย่างที่ 2.11 คะแนนสอบกลางภาคของวิชาสถิติ 1 ซึง่ เต็ม 50 คะแนน ของนักศึกษา 12 คนเป็น


ดังนี้ 31 28 32 27 26 22 29 40 45 38 29 46 ถ้านางสาวราชาวดี สอบได้เป็น
เปอร์เซ็นต์ไทล์ที่ 69 จงหาว่านางสาวราชาวดีได้คะแนนเท่าไร

วิธีทา
จากคะแนนเรียงทั้งหมด 22 26 27 28 29 29 31 32 38 40 45 46
ในที่นี้ N = 12 หาเปอร์เซ็นต์ไทล์ที่ 69 หรือ P 69
( N  1)r
จาก Pr = 100 จะได้ว่า
(12  1)69
9 = 100
แสดงว่าเมื่อเรียงคะแนนแล้ว นางสาวราชาวดีได้คะแนนอยู่ที่ ตาแหน่งที่ 9
ตาแหน่งที่ 9 คือคะแนน 38
ดังนั้น นางสาวราชาวดีได้คะแนน 38 คะแนน

ตัวอย่างที่ 2.12 จากเกรดเฉลี่ย (GPA) ของนักศึกษาชั้นปีที่ 2 สาขาสัตวศาสตร์ จานวน 40 คน เป็น


ดังนี้
เกรดเฉลี่ย จานวนนักศึกษา F
2.00 – 2.49 10 10
2.50 – 2.99 19 29
3.00 – 3.49 7 36
3.50 – 3.99 4 40

ถ้านางสาวนิตยา ได้เกรดเฉลี่ย 3.12 จะอยู่ในตาแหน่งเปอร์เซ็นต์ไทล์ที่เท่าไร


วิธีทา
พบว่าเกรดเฉลี่ย 3.12 ตกอยู่ในช่วงเกรดเฉลี่ย 3.00 – 3.49 ทาให้ได้ค่าต่างๆ ดังนี้
L = 2.995 , F = 29 , f = 7 และ I = 0.50
N F
จาก ค่าเปอร์เซ็นต์ไทล์ ที่ r (Pr) = L  I  r 
 f 
33

จะได้ว่า
N  29 
3.12 = 2.995  0.50   r
 7 
7
N r = (3.12 – 2.995)• ( )+ 29
0.50
N r = 30.75
Nr
จาก N r = 100 จะได้ว่า
40 r
30.75 =
100
r = 76.875
นั่นคือเกรดเฉลี่ย 3.12 ของนางสาวนิตยา จะอยู่ในตาแหน่งเปอร์เซ็นต์ไทล์ที่ 76.875

2.3 การกระจาย ความเบ้และความโด่ง ของข้อมูล (Variation Skewness and Kurtosis)

1. การกระจายของข้อมูล

การวัดการกระจายของข้อมูล หมายถึงการที่ค่าสังเกตแต่ละตัวของข้อมูล มีความแตก าง


ไปจากค่ากลางของข้อมูลชุดนั้น ๆ มากน้อยเพียงใดเช่น
ข้อมูลชุดที่ 1 2 , 3 , 4 , 5 , 6 Mean = 4
ข้อมูลชุดที่ 2 3, 4 , 5, 4 , 4 Mean = 4
เมื่อพิจารณาข้อมูลทั้งสองชุดนี้จะเห็นได้ว่า ค่าเฉลี่ยเลขคณิต (Mean) ของข้อมูลทั้งสองชุด
นีม้ ีค่าเท่ากัน แต่ถ้าใช้ค่าเฉลี่ยนี้ไปสรุปว่าข้อมูลทั้งสองชุดนี้เหมือนกัน ก็จะเป็นการสรุปที่ผิดไป
จากข้อเท็จจริง เนื่องจากว่าข้อมูลในชุดที่ 1 มีค่าสังเกตที่แตกต่างไปจากค่าเฉลี่ยมากกว่าข้อมูลชุดที่
2 แสดงว่าข้อมูลชุดที่ 1 มีการกระจายของข้อมูลที่มากกว่าชุดที่ 2 จึงเป็นเหตุผลที่ต้องใช้การวัด
การกระจายของข้อมูลมาช่วยในการพิจารณาลักษณะของข้อมูล เพื่อให้เห็นความชัดเจนมากยิ่งขึ้น
ซึ่งการวัดการกระจายของข้อมูลจะแบ่งออกเป็น 2 ประเภท คือ
1.1 การวัดการกระจายสัมบูรณ์
เป็นการวัดการกระจายของข้อมูลชุดเดียว เพื่อให้ทราบว่าค่าสังเกตของข้อมูลชุดนั้น มี
ความแตกต่างกันมากน้อยอย่างไร ถ้าค่าการกระจายสัมบูรณ์นี้มีค่ามาก ก็แสดงว่าค่าสังเกตของ
ข้อมูลมีการกระจายหรือมีความแตกต่างกันมาก ทานองเดียวกันถ้าค่าการวัดการกระจายสัมบูรณ์มี
34

ค่าน้อย ก็แสดงว่าค่าสังเกตของข้อมูลมีการกระจายหรือมีความแตกต่างกันน้อย ซึ่งการวัดการ


กระจายชนิดนี้ได้แก่
ก. พิสัย (Range)
เป็นการวัดการกระจายของข้อมูลอย่างง่าย ๆ ใช้เมื่อต้องการความรวดเร็วเท่านั้น โดยพิสัย
คือ ผลต่างของค่าสังเกตของข้อมูลที่มีค่าสูงสุดกับค่าต่าสุด ในข้อมูลแต่ละชุด
พิสัย = ค่าสังเกตสูงสุด – ค่าสังเกตต่าสุด
ข. ส่วนเบี่ยงเบนเฉลี่ย (Mean deviation : M.D.)
เป็นค่าเฉลี่ย ของผลรวมของค่าสัมบูรณ์ของค่าสังเกตแต่ละตัวที่แตกต่างไปจากค่าเฉลี่ยเลข
คณิตของข้อมูลชุดนั้น ๆ

- กรณีข้อมูลที่ไม่ได้จัดหมวดหมู่
N
 xi μ
ข้อมูลประชากร M.D. = i1 N
เมื่อ x i แทน ค่าสังเกตแต่ละค่า
 แทน ค่าเฉลี่ยเลขคณิตของข้อมูลประชากร
N แทน จานวนค่าสังเกตทั้งหมด
n
 xi  x
ข้อมูลตัวอย่าง M.D. = i1 n
เมื่อ x i แทน ค่าสังเกตแต่ละค่า
x แทน ค่าเฉลี่ยเลขคณิตของข้อมูลตัวอย่าง
n แทน จานวนค่าสังเกตทั้งหมด

- กรณีข้อมูลทีจ่ ัดหมวดหมู่
k
 fi x i  
ข้อมูลประชากร M.D. = i1 N
เมื่อ x i แทน จุดกึ่งกลางของชั้นที่ i ; i = 1,2,…,k
fi แทน ความถี่ของชั้นที่ i ; i = 1,2,…,k
35

 แทน ค่าเฉลี่ยเลขคณิตของข้อมูลประชากร
N แทน จานวนค่าสังเกตทั้งหมด
k
 fi x i  x
ข้อมูลตัวอย่าง M.D. = i1 n
เมื่อ x i แทน จุดกึ่งกลางของชั้นที่ i ; i = 1,2,…,k
fi แทน ความถี่ของชั้นที่ i ; i = 1,2,…,k
x แทน ค่าเฉลี่ยเลขคณิตของข้อมูลตัวอย่าง
n แทน จานวนค่าสังเกตทั้งหมดของข้อมูลตัวอย่าง

ค. ความแปรปรวนและส่วนเบี่ยงเบนมาตรฐาน (Variance and Standard deviation)


ความแปรปรวน (Variance) คือค่าเฉลี่ยของกาลังสองของผลรวมของค่าสังเกตแต่ละตัวที่
แตกต่างไปจากค่าเฉลี่ยเลขคณิตของข้อมูลชุดนั้น ๆ และส่วนเบี่ยงเบนมาตรฐาน (Standard deviation
: S.D) เป็นค่ากระจายของข้อมูลที่มีค่าเท่ากับ รากที่สองของความแปรปรวน

- กรณีข้อมูลที่ไม่ได้จัดหมวดหมู่
N
2
 ( x i  )
ข้อมูลประชากร ความแปรปรวน ( 2 ) = i1 N
N
N
(  x i )2
2 i1
xi 
N
= i1
N
เมื่อ x i แทน ค่าสังเกตแต่ละค่า
 แทน ค่าเฉลี่ยเลขคณิตของข้อมูลประชากร
N แทน จานวนค่าสังเกตทั้งหมดของข้อมูลประชากร
n
2
 (x i  x )
ข้อมูลตัวอย่าง ความแปรปรวน (S2) = i1 n  1
36

n
n
(  x i )2
2 i1
xi n 

= i1 n  1
เมื่อ x i แทน ค่าสังเกตแต่ละค่า
x แทน ค่าเฉลี่ยเลขคณิตของข้อมูลตัวอย่าง
n แทน จานวนค่าสังเกตทั้งหมดของข้อมูลตัวอย่าง

- กรณีข้อมูลที่จัดหมวดหมู่
k
2
 fi ( x i   )
ข้อมูลประชากร ความแปรปรวน ( 2 ) = i1 N
k
k
(  fi x i ) 2
2 i1
 fi x i 
N
= i1
N
เมื่อ x i แทน จุดกึ่งกลางของชั้นที่ i ; i = 1,2,…,k
fi แทน ความถี่ของชั้นที่ i ; i = 1,2,…,k
 แทน ค่าเฉลี่ยเลขคณิตของข้อมูลประชากร
N แทน จานวนค่าสังเกตทั้งหมดของข้อมูลประชากร
k
2
 fi ( x i  x )
ข้อมูลตัวอย่าง ความแปรปรวน (S2) = i1 n  1
k
k
(  fi x i ) 2
2 i1
 fi x i 
n
= i1
n 1
เมื่อ x i แทน จุดกึ่งกลางของชั้นที่ i ; i = 1,2,…,k
fi แทน ความถี่ของชั้นที่ i ; i = 1,2,…,k
x แทน ค่าเฉลี่ยเลขคณิตของข้อมูลตัวอย่าง
n แทน จานวนค่าสังเกตทั้งหมดของข้อมูลตัวอย่าง
37

ตัวอย่างที่ 2.13 จากข้อมูลรายจ่ายต่อวันของตัวอย่างนักศึกษา 5 คนเป็นดังนี้ 60, 75, 85, 100, 90


จงหาพิสัย ส่วนเบี่ยงเบนเฉลี่ย ความแปรปรวนและส่วนเบี่ยงเบนมาตรฐาน ของรายจ่ายต่อวันของ
นักศึกษาทั้ง 5 คนนี้
วิธีทา จาก พิสัย = ค่าสังเกตสูงสุด – ค่าสังเกตต่าสุด จะได้ว่า
พิสัย = 100 – 60
พิสัย = 40
นั่นคือ พิสัยของรายจ่ายต่อวันของนักศึกษาทั้ง 5 คน เท่ากับ 40 บาท
n
 xi  x
ส่วนเบี่ยงเบนเฉลี่ย = M.D. = i1 n
60  75  85  100  90
จากข้อมูล x = 5 = 82
60  82  75  82    90  82
 M.D. = 5
22  7  3  18  8
M.D. = 5
M.D. = 11.6
นั่นคือ ส่วนเบี่ยงเบนเฉลี่ยของรายจ่ายต่อวันของนักศึกษาทั้ง 5 คน เท่ากับ 11.6 บาท
n
จากข้อมูลจะได้ว่า  x 2i = 602 + 752 + 852 + 1002 + 902 = 34,550
i1
n
n
(  x i )2
2 i1
xi 
n
ความแปรปรวน = S = 2 i1
n 1
( 410) 2
34 ,550  5
S2 = 4
2
S = 232.5 และ ส่วนเบี่ยงเบนมาตรฐาน = S = 15.248
นั่นคือ ความแปรปรวน ของรายจ่ายต่อวันของนักศึกษาทั้ง 5 คน เท่ากับ 232.5 บาท2 และ
ส่วนเบี่ยงเบนมาตรฐาน เท่ากับ 15.248 บาท
38

ตัวอย่างที่ 2.14 จากความสูงของนักศึกษาสาขาวิชาคอมพิวเตอร์ ในตัวอย่างที่ 2.3


จงหาส่วนเบี่ยงเบนเฉลี่ย ความแปรปรวน และส่วนเบี่ยงเบนมาตรฐาน ของความสูง

ความสูง จานวน
150 - 154 5
155 - 159 10
160 - 164 14
165 - 169 6
170 - 174 10

วิธีทา
ความสูง ( fi ) (xi) fi xi fixi2 xi μ fi x i  μ
150 - 154 5 152 760 115,520 10.67 53.35
155 - 159 10 157 1,570 246,490 5.67 56.7
160 - 164 14 162 2,268 367,416 0.67 9.38
165 - 169 6 167 1,002 167,334 4.33 25.98
170 - 174 10 172 1,720 295,840 9.33 93.3
รวม 45 7,320 1,192,600 30.67 238.71

k
 fi x i
7,320
จาก  = i1N = 45 = 162.67
k
 fi x i  
ส่วนเบี่ยงเบนเฉลี่ย M.D. = i1 N
238.71
M.D. =
45
M.D. = 5.30
นั่นคือ ส่วนเบี่ยงเบนเฉลี่ยของความสูงของนักศึกษาทั้ง45 คนเท่ากับ 5.30 เซนติเมตร
39

k
k
(  fi x i ) 2
2 i1
 fi x i 
N
ความแปรปรวน = 2 = i1
N
(7,320 ) 2
1,192,600 
 =
2 45
45
 = 41.78 และส่วนเบี่ยงเบนมาตรฐาน =  = 6.46
2

นั่นคือ ความแปรปรวนของความสูง ของนักศึกษาทั้ง 45 คน เท่ากับ 41.78 เซนติเมตร2


และส่วนเบี่ยงเบนมาตรฐาน เท่ากับ 6.46 เซนติเมตร

คุณสมบัติของส่วนเบี่ยงเบนมาตรฐาน
ถ้านาค่าคงที่ C ไปบวกเข้า หรือ ลบออกกับค่าสังเกตทุกค่าในข้อมูลชุดเดิม จะได้ค่าส่วน
เบี่ยงเบนมาตรฐานของข้อมูลชุดใหม่เป็น ส่วนเบี่ยงเบนมาตรฐานเดิม
ถ้านาค่าคงที่ C ไปคูณกับค่าสังเกตทุกค่าในข้อมูลเดิม จะได้ค่าส่วนเบี่ยงเบนมาตรฐานของ
ข้อมูลชุดใหม่เป็น ส่วนเบี่ยงเบนมาตรฐานเดิม x C
ถ้านาค่าคงที่ C ซึ่ง C  0 ไปหารกับค่าสังเกตทุกค่าในข้อมูลชุดเดิม จะได้ค่าส่วนเบี่ยงเบน
มาตรฐานของข้อมูลชุดใหม่เป็น ส่วนเบี่ยงเบนมาตรฐานเดิม / C 

1.2 การวัดการกระจายสัมพัทธ์

เป็นการวัดการกระจายของข้อมูล ตั้งแต่ 2 ชุดขึ้นไป และสามารถนาค่าการกระจายมา


เปรียบเทียบกันได้ ซึ่งการเปรียบเทียบนี้จะไม่มีหน่วยของข้อมูลมาเกี่ยวข้อง จึงเรียกอีกอย่างหนึ่งว่า
สัมประสิทธิ์ของการกระจาย (Coefficient of Dispersion) โดยมีความหมายว่าถ้าค่าสัมประสิทธิ์ของ
การกระจายมาก แสดงว่าข้อมูลชุดนั้นจะมีการกระจายมากกว่าชุดอื่น และที่นิยมใช้กันมากก็คือ
สัมประสิทธิ์การกระจายของส่วนเบี่ยงเบนมาตรฐาน (Coefficient of Standard Deviation) หรือ
สัมประสิทธิ์แห่งความแปรผัน (Coefficient of Variation : C.V.)
ส่วนเบีย่ ง เบนมาตรฐาน 
C.V = = 
ค่าเฉลีย่
นิยมทาให้เป็นร้อยละ โดยการนา 100 คูณกับค่าที่หาได้
40

ตัวอย่างที่ 2.15 จากข้อมูลส่วนสูงและน้าหนักของเด็กนักเรียนอนุบาล 2 ในจังหวัดเชียงใหม่ พบว่า


นักเรียนอนุบาล 2 มีส่วนสูงเฉลี่ย 103 เซนติเมตร ส่วนเบี่ยงเบนมาตรฐานความสูงเป็น 6 เซนติเมตร
และน้าหนักเฉลี่ย 18.3 กิโลกรัม ส่วนเบี่ยงเบนมาตรฐานน้าหนักเป็น 2.1 กิโลกรัม จงเปรียบเทียบ
การกระจายของข้อมูลส่วนสูงและน้าหนักของเด็กกลุ่มนี้
วิธีทา
ส่วนเบีย่ ง เบนมาตรฐาน 
C.V = =   100 จะได้ว่า
ค่าเฉลีย่
6
C.V ของส่วนสูง = 103  100
= 5.825
2. 1
C.V ของน้าหนัก = 18.3  100
= 11.475
นั่นคือข้อมูลน้าหนักของเด็กกลุ่มนี้ มีการกระจายมากกว่าข้อมูลส่วนสูง

2. การวัดความเบ้ (Skewness)

ความเบ้เป็นลักษณะของข้อมูลที่มีรูปของการแจกแจงโค้งความถี่ที่ไม่สมมาตร ซึ่งมีการเบ้
ของโค้งไปข้างใดข้างหนึ่ง คือมีค่า Mean Median และ Mode ที่ต่างกัน เช่น เบ้ขวา จะมีค่าความเบ้
เป็นบวก (Mean > Median > Mode) โดยที่ค่า Mean จะมีค่ามากที่สุด และเบ้ซ้าย จะมีค่าความเบ้เป็น
ลบ ( Mode > Median > Mean ) โดยที่ค่า Mode จะมีค่ามากที่สุด ดังรูป

รูปของการแจกแจงโค้งความถี่เป็นรูประฆังที่สมมาตร

mean = median = mode


41

รูปของการแจกแจงโค้งความถี่เป็นรูประฆังที่เบ้ขวา

Mode Median Mean


Mean > Median > Mode โดย Mean – Mode มีค่าความเบ้เป็นบวก

รูปของการแจกแจงโค้งความถี่เป็นรูประฆังที่เบ้ซ้าย

Mean Median Mode


Mode > Median > Mean โดย Mean – Mode มีค่าความเบ้เป็นลบ

ค่าความเบ้
- กรณีข้อมูลชุดเดียว
จะพิจารณาจากค่า Mean และ Mode ดังนี้
Mean – Mode = 0 ข้อมูลชุดนั้นมีรูปของการแจกแจงโค้งความถี่ที่สมมาตร
Mean – Mode > 0 ข้อมูลชุดนั้นมีรูปของการแจกแจงโค้งความถี่ที่เบ้ขวา
Mean – Mode < 0 ข้อมูลชุดนั้นมีรูปของการแจกแจงโค้งความถี่ที่เบ้ซ้าย

- กรณีข้อมูลหลายชุด
Mean  Mode
สัมประสิทธิ์ความเบ้ = Sk = 
และจาก Mode = 3 Median – 2 Mean จะได้ว่า
3(Mean  Median )
สัมประสิทธิ์ความเบ้ = Sk = 
42

โดยพิจารณาค่าความเบ้ดังนี้
Sk = 0 ข้อมูลชุดนั้นมีรูปของการแจกแจงโค้งความถี่ที่สมมาตร
Sk > 0 ข้อมูลชุดนั้นมีรูปของการแจกแจงโค้งความถี่ที่เบ้ขวา
Sk < 0 ข้อมูลชุดนั้นมีรูปของการแจกแจงโค้งความถี่ที่เบ้ซ้าย

หรือพิจารณาด้วยโมเมนต์
- กรณีข้อมูลที่ไม่ได้จัดหมวดหมู่
N
3
 ( x i  )
Sk หรือ 3 = i1
N 3
เมื่อ  คือ ค่าเฉลี่ยเลขคณิตของข้อมูลชุดนั้น
 คือ ค่าส่วนเบี่ยงเบนมาตรฐานของข้อมูลชุดนั้น
N คือ จานวนของข้อมูลชุดนั้นทั้งหมด

- กรณีข้อมูลที่จัดหมวดหมู่
k
3
 fi ( x i   )
Sk หรือ 3 = i1
N 3
เมื่อ  คือ ค่าเฉลี่ยเลขคณิตของข้อมูลชุดนั้น
 คือ ค่าส่วนเบี่ยงเบนมาตรฐานของข้อมูลชุดนั้น
fi คือ ความถี่แต่ละชั้นที่ i ; i = 1,2,…,k
N คือ จานวนของข้อมูลชุดนั้นทั้งหมด

โดยพิจารณาค่าความเบ้ดังนี้
 3 = 0 ข้อมูลชุดนั้นมีรูปของการแจกแจงโค้งความถี่ที่สมมาตร
 3 > 0 ข้อมูลชุดนั้นมีรูปของการแจกแจงโค้งความถี่ที่เบ้ขวา
 3 < 0 ข้อมูลชุดนั้นมีรูปของการแจกแจงโค้งความถี่ที่เบ้ซ้าย
43

3. การวัดความโด่ง (Kurtosis)

ความโด่ง เป็นลักษณะความสูงของรูปการแจกแจงความถี่ข้อมูล ซึ่งการวัดความโด่ง ใช้


เป็นเหตุผลอีกประการหนึ่งในการพิจารณา ลักษณะของข้อมูลที่มีการแจกแจงเป็นแบบปกติ เพราะ
ข้อมูลที่มีการแจกแจงแบบปกติ จะต้องมีลักษณะ 2 ประการคือ รูปโค้งความถี่ต้องมีลักษณะสมมาตร
ไม่เบ้ และรูปโค้งความถี่ ต้องมีความโด่งพอดี โดยความโด่งของรูปโค้งความถี่ของข้อมูลมี 3
ลักษณะดังนี้
1. รูปการแจกแจงโค้งความถี่ที่มีลักษณะเป็นเส้นโค้งโด่งปกติ เรียกว่า Mesokurtic
2. รูปการแจกแจงโค้งความถี่ที่มีลักษณะเป็นเส้นโค้งโด่งสูง เรียกว่า Leptokurtic
3. รูปการแจกแจงโค้งความถี่ที่มีลักษณะเป็นเส้นโค้งแบน เรียกว่า Platykurtic

ค่าความโด่ง
- กรณีข้อมูลที่ไม่ได้จัดหมวดหมู่
N
4
 ( x i  )
 4 = i1
N 4
เมื่อ  คือ ค่าเฉลี่ยเลขคณิตของข้อมูลชุดนั้น
 คือ ค่าส่วนเบี่ยงเบนมาตรฐานของข้อมูลชุดนั้น
N คือ จานวนของข้อมูลชุดนั้นทั้งหมด

- กรณีข้อมูลที่จัดหมวดหมู่
k
4
 fi ( x i   )
 4 = i1
N 4
เมื่อ  คือ ค่าเฉลี่ยเลขคณิตของข้อมูลชุดนั้น
 คือ ค่าส่วนเบี่ยงเบนมาตรฐานของข้อมูลชุดนั้น
f i คือ ความถี่แต่ละชั้นที่ i ; i = 1,2,…,k
N คือ จานวนของข้อมูลชุดนั้นทั้งหมด
44

โดยพิจารณาค่าความโด่งดังนี้
 4 = 3 ข้อมูลชุดนั้นมีรูปการแจกแจงโค้งความถี่ที่มีลักษณะเป็นเส้นโค้งโด่งปกติ
 4 > 3 ข้อมูลชุดนั้นมีรูปการแจกแจงโค้งความถี่ที่มีลักษณะเป็นเส้นโค้งโด่งสูง
 4 < 3 ข้อมูลชุดนั้นมีรูปการแจกแจงโค้งความถี่ที่มีลักษณะเป็นเส้นโค้งแบน

ตัวอย่างที่ 2.16 จากตัวอย่างที่ 2.3 จงหาสัมประสิทธิ์ความเบ้ และความโด่ง

ความสูง จานวน
150 - 154 5
155 - 159 10
160 - 164 14
165 - 169 6
170 - 174 10

วิธีทา จากข้อมูลดังกล่าวจะได้ว่า Mean =  = 162.67 Median = 162.178 และ  = 6.46


N= 45
3(Mean  Median )
และจาก สัมประสิทธิ์ความเบ้ = Sk =  จะได้ว่า

3(162.67  162.178)
Sk = 6.46
Sk = 0.2285
k
4
 fi ( x i   )
จากสัมประสิทธิ์ความโด่ง  4 = i1 จะได้ว่า
N 4
5(152  162.67) 4  10(157  162.67) 4    10(172  162.67) 4
4 =
45  6.46 4
153,030.4364
= 78,368.6897
= 1.9527
45

นั่นคือ ความสูงของนักศึกษากลุ่มนี้ มีสัมประสิทธิ์ความเบ้เป็น 0.2285 และสัมประสิทธิ์


ความโด่งเป็น 1.9527 หมายความว่า ข้อมูลชุดนี้มีรูปของการแจกแจงโค้งความถี่ที่ค่อนข้างเบ้ขวา
และมีลักษณะเป็นโค้งแบน

2.4 คะแนนมาตรฐาน (Standard Score)

เป็นการเปลี่ยนค่าสังเกตให้เป็นคะแนนมาตรฐาน(Standard Score) ซึ่งค่าคะแนนมาตรฐาน


จะไม่มีหน่วย และยังสามารถใช้เปรียบเทียบค่าสังเกตของข้อมูล ตั้งแต่ 2 ชุดขึ้นไปได้ โดยข้อมูล
ต่าง ๆ นั้นอาจจะมีค่าเฉลี่ย หรือ ส่วนเบี่ยงเบนมาตรฐานที่แตกต่างกัน หรือมีหน่วยที่ต่างกัน ถ้าค่า
คะแนนมาตรฐานที่ได้มีค่ามากก็แสดงว่า ข้อมูลชุดนั้นมีค่าของคะแนนมากกว่าข้อมูลชุดอื่น
คะแนนมาตรฐาน
x 
Z = 
เมื่อ Z หมายถึง คะแนนมาตรฐานของค่าสังเกต
x หมายถึง ค่าสังเกต
 หมายถึง ค่าเฉลี่ยเลขคณิต
 หมายถึง ส่วนเบี่ยงเบนมาตรฐาน

ตัวอย่างที่ 2.17 ถ้าเวลาที่นักศึกษาใช้พิมพ์งานในสาขาคอมพิวเตอร์ สาขาเศรษฐศาสตร์สิ่งแวดล้อม


สาขาเศรษฐศาสตร์เกษตร และสาขาเศรษฐศาสตร์สหกรณ์ โดยใช้การพิมพ์แบบทดสอบของแต่ละ
สาขา โดยมีค่าเฉลี่ยและส่วนเบี่ยงเบนมาตรฐานดังนี้

สาขา เวลาพิมพ์เฉลี่ย ส่วนเบี่ยงเบนมาตรฐาน


สาขาคอมพิวเตอร์ 180 วินาที 25 วินาที
เศรษฐศาสตร์สิ่งแวดล้อม 300 วินาที 45 วินาที
เศรษฐศาสตร์เกษตร 15 นาที 2.5 นาที
เศรษฐศาสตร์สหกรณ์ 20 นาที 3.5 นาที

ถ้าต้องการเปรียบเทียบความเร็วในการพิมพ์ของ จอมพิมพ์, ธวัลรัตน์, ลัชนนท์ และ ประภาดา ซึ่ง


เป็นนักศึกษาในสาขาคอมพิวเตอร์ สาขาเศรษฐศาสตร์สิ่งแวดล้อม สาขาเศรษฐศาสตร์เกษตร และ
สาขาเศรษฐศาสตร์สหกรณ์ ตามลาดับ โดยใช้เวลาในการพิมพ์แบบทดสอบของแต่ละสาขา เป็น
46

200 วินาที 295 วินาที 14 นาที และ 22 นาที ตามลาดับ จงหาว่าใครมีความสามารถในการพิมพ์มาก


ที่สุด
วิธีทา เนื่องจากเป็นการเปรียบเทียบเวลาที่ใช้ในการพิมพ์ของแต่ละบุคคล จึงต้องคานวณหา
คะแนนมาตรฐาน Z
x 
จาก Z =  จะได้ว่า
200  180
Z ของ จอมพิมพ์ = 25 = 0.8
295  300
Z ของ ธวัลรัตน์ = 45 = – 0.11
14  15
Z ของ ลัชนนท์ = 2.5 = – 0.4
22  20
Z ของ ประภาดา = 3.5 = 0.57
เนื่องจาก Z ของลัชนนท์ มีค่าน้อยที่สุด นั่นคือ ลัชนนท์จะมีความสามารถในการพิมพ์มาก
ที่สุด
47

แบบฝึกหัดบทที่ 2

1. จากข้อมูลต่อไปนี้ 14 , 16 , 18 , 16 , 15 , 17 , 16 , 19 และ 18 จงหาค่าเฉลี่ย มัธยฐาน ฐาน


นิยม และส่วนเบี่ยงเบนมาตรฐาน
2. จากข้อมูลต่อไปนี้

ขีดจากัด จานวน
1–9 12
10 – 18 18
19 – 27 10
28 – 36 10

จงหาค่าเฉลี่ย มัธยฐาน ฐานนิยม และความแปรปรวน


3. ข้อมูลต่อไปนี้เป็นคะแนนสอบวิชากลศาสตร์ของนักศึกษาจานวน 120 คน

คะแนนสอบ จานวนนักศึกษา
30 – 39 1
40 – 49 4
50 – 59 10
60 – 69 22
70 – 79 45
80 – 89 30
90 - 99 8
จงหาค่า Q 3 , D 4 และ P 80

4. ในการประเมินผลการเรียนวิชาหนึ่ง ประกอบด้วยการสอบไล่ และสอบย่อยเก็บคะแนนอีก 3


ครั้ง โดยในการสอบย่อยแต่ละครั้งมีน้าหนักเป็น 2 เท่าของการสอบไล่ ถ้านายวิชัย ได้คะแนน
ในการสอบไล่และสอบย่อยอีก 3 ครั้งเป็น 79 , 83 , 76 และ 80 ตามลาดับ จงหาคะแนนสอบ
เฉลี่ยวิชานีข้ องนายวิชัย
48

5. เมื่อสร้างตารางแจกแจงความถี่ของคะแนนของนักศึกษาจานวน 36 คนโดยให้ความกว้าง
ของแต่ละอันตรภาคชั้นเป็น 10 แล้วปรากฏว่า มัธยฐานของคะแนนทั้งหมดอยู่ในช่วง 50 – 59
คะแนน ถ้ามีนักศึกษาที่สอบได้คะแนนต่ากว่า 49.5 คะแนนจานวน 12 คน และมีนักศึกษาที่ได้
คะแนนต่ากว่า 59.5 อยู่จานวน 20 คน แล้วมัธยฐานของคะแนนสอบครั้งนี้จะมีค่าเป็นเท่าไร
6. ข้อมูลชุดหนึ่งมี 20 จานวน หาค่าเฉลี่ยเลขคณิตได้เป็น 12 แต่ต่อมาตรวจพบว่ามีการเขียน
ข้อมูลผิดไป 2 จานวน คือ ข้อมูลเป็น 8 แต่เขียนเป็น 3 และข้อมูลเป็น 7 แต่เขียนเป็น 4
จงหาค่าเฉลี่ยเลขคณิตที่ถูกต้องของข้อมูลชุดนี้
7. เงินเดือนของคนงานโรงงานหนึ่งเฉลี่ยต่อคนมีค่าเท่ากับ 7,500 บาทต่อเดือน และสัมประ
สิทธ์ ของการแปรผันของเงินเดือนเท่ากับ 15 เปอร์เซ็นต์ ดังนั้นส่วนเบี่ยงเบนมาตรฐานของ
เงินเดือนของคนงานมีค่าเท่ากับเท่าไร
8. ในการสอบปลายภาคของนางสาวปูเป้ ที่ลงทะเบียนเรียนในภาคเรียนที่ 2 ของมหาวิทยาลัย
แห่งหนึ่ง ซึ่งลงเรียนทั้งหมด 4 วิชาได้ผลดังนี้
วิชาที่เรียน คะแนนเฉลี่ย ส่วนเบี่ยงเบนมาตรฐาน คะแนนที่สอบได้
ภาษาอังกฤษ 27 14 62
คณิตศาสตร์ 25 16 57
สถิติ 21 10 51
วิทยาศาสตร์ 35 10 50
นางสาวปูเป้ทาคะแนนในวิชาใดได้ดีที่สุด

You might also like