Professional Documents
Culture Documents
การวิเคราะห์ข้อมูลอย่างง่าย
2.1 การวัดแนวโน้มเข้าสู่ส่วนกลาง (Measures of Central Tendency)
การวัดแนวโน้มเข้าสู่ส่วนกลางเป็นระเบียบวิธีทางสถิติในสถิติเชิงพรรณนา ที่ใช้การหาค่า
คะแนนกลางหรือค่าเฉลี่ยเพื่อใช้เป็นตัวแทนแสดงขนาดและลักษณะของข้อมูลแต่ละชุดที่มีอยู่ จาก
ข้อมูลที่เก็บรวบรวมมาได้ โดยจะเลือกเอาตัวแทนที่มีค่าใกล้เคียงกับค่าสังเกตส่วนใหญ่ และการวัด
แนวโน้มสู่ส่วนกลาง สามารถหาได้หลายวิธี ทั้งนี้ก็ขึ้นอยู่กับลักษณะของข้อมูล และวัตถุประสงค์
ของผู้วิเคราะห์ ดังนี้
N
xi
วิธีทา จาก = iN1 จะได้ว่า
49.8 39 40.5
= 15
= 46.62
นั่นคือ น้าหนักเฉลี่ยของนักศึกษาสาขาเศรษฐศาสตร์ ทั้ง 15 คนเป็น 46.62 กิโลกรัม
- กรณีข้อมูลที่จัดหมวดหมู่(Grouped Data)
k
fi x i
= i1N
เมื่อ x i หมายถึง จุดกึ่งกลางของชั้นที่ i ; i = 1,2,..,k
fi หมายถึง ความถี่ของชั้นที่ i ; i = 1,2,..,k
k
N หมายถึง จานวนค่าสังเกตทั้งหมดของข้อมูล หรือ fi
i1
ความสูง จานวน
150 - 154 5
155 - 159 10
160 - 164 14
165 - 169 6
170 - 174 10
วิธีทา
k
fi x i
วิธีทา จาก = i1N จะได้ว่า
7,320
= 45
= 162.67
นัน่ คือความสูงเฉลี่ย ของนักศึกษาสาขาคอมพิวเตอร์ทั้ง 45 คนเท่ากับ 162.67 เซนติเมตร
21
คุณสมบัติของค่าเฉลี่ย
N
1. ผลรวมของค่าสังเกตแต่ละค่าที่แตกต่างจากค่าเฉลี่ย มีค่าเท่ากับศูนย์ ( x i ) = 0
i1
N
2. ผลรวมของกาลังสองของค่าสังเกตแต่ละค่าที่แตกต่างจากค่าเฉลี่ย ( x i a ) 2 จะมี
i1
ค่าน้อยที่สุดเมื่อ a มีค่าเท่ากับ
3. ถ้านาค่าคงที่ C ไปบวกเข้า หรือ ลบออกกับค่าสังเกตทุกค่าในข้อมูลชุดเดิม จะได้
ค่าเฉลี่ยของข้อมูลชุดใหม่เป็น ค่าเฉลี่ยของข้อมูลชุดเดิม บวกเข้าหรือลบออกกับค่า C
ถ้านาค่าคงที่ C ไปคูณกับค่าสังเกตทุกค่าในข้อมูลชุดเดิม จะได้ค่าเฉลี่ยของข้อมูลชุด
ใหม่เป็น ค่าเฉลี่ยของข้อมูลชุดเดิม คูณกับค่า C
และถ้านาค่าคงที่ C ซึ่งC0 ไปหารกับค่าสังเกตทุกค่าในข้อมูลชุดเดิม จะได้ค่าเฉลี่ย
ของข้อมูลชุดใหม่เป็น ค่าเฉลี่ยของข้อมูลชุดเดิม หารกับค่า C
ข้อสังเกต
1. ค่าเฉลี่ยเป็นการใช้ค่าสังเกตทุกค่ามาคานวณ ถ้าค่าสังเกตบางค่าผิดปกติ เช่นสูงหรือต่า
กว่าค่าสังเกตค่าอื่นมาก ๆ ค่าเฉลี่ยก็จะผิดปกติไปด้วย ดังนั้นค่าเฉลี่ยจึงเป็นค่าที่ถูกกระทบกระเทือนได้
ง่าย
2. ค่าเฉลี่ยใช้เป็นค่ากลางได้ดี สาหรับข้อมูลเชิงปริมาณ ที่มีมาตรวัดอันตรภาค และมาตร
วัดอัตราส่วน
3. ในกรณีทไี่ ม่ทราบค่าสังเกตบางค่าจากข้อมูลชุดนั้น หรือข้อมูลจากตารางการแจก
แจงความถี่เป็นแบบปลายเปิด จะหาค่าเฉลี่ยไม่ได้
2. มัธยฐาน (Median)
เป็นค่ากลางที่อยู่ในตาแหน่งกึ่งกลางของข้อมูลแต่ละชุด ซึ่งเมื่อนาข้อมูลชุดหนึ่งมาจัด
เรียงลาดับจากค่าสังเกตที่มีค่าน้อยไปยังค่ามากแล้ว แสดงว่าค่ามัธยฐานจะเป็นตัวที่แบ่งข้อมูลชุด
นั้นออกเป็นสองส่วน โดยจะมีข้อมูลจานวนครึ่งหนึ่งหรือ 50% ที่มีค่าน้อยกว่าค่ามัธยฐาน และมี
ข้อมูลจานวนอีกครึ่งหนึ่งหรือ 50% ที่มีค่ามากกว่าค่ามัธยฐาน
24
- กรณีข้อมูลที่ไม่ได้จัดหมวดหมู่(Ungrouped Data)
จัดเรียงลาดับค่าสังเกตทั้งหมดของข้อมูลจากค่าน้อยไปยังค่ามาก นับจานวนข้อมูล ทั้งหมด
( N 1)
(N) เพื่อหา ตาแหน่งที่มัธยฐานอยู่ คือ ตาแหน่งที่ 2 และค่าที่ตรงกับตาแหน่งที่มัธยฐานอยู่
ก็คือค่ามัธยฐาน
ความสูง จานวน(f) F
150 - 154 5 5
155 - 159 10 15
160 - 164 14 29
165 - 169 6 35
170 - 174 10 45
วิธีทา
N 45
จาก 2 = 2 = 22.5 แสดงว่ามัธยฐานอยู่ที่ชั้น 160 – 164
และได้ว่า LMe = 159.5 , F = 15 , f Me = 14 , I = 5
( N / 2) F
จาก ค่ามัธยฐาน = L Me I f
Me
22.5 15
ได้ = 159.5 5 14
= 162.178
นั่นคือ มัธยฐานความสูงของนักศึกษาสาขาคอมพิวเตอร์ทั้ง 45 คนเท่ากับ 162.178 เซนติเมตร
คุณสมบัติของมัธยฐาน
ถ้านาค่าคงที่ C ไปบวกเข้าหรือลบออกกับค่าสังเกตทุกค่าในข้อมูลชุดเดิม จะได้ค่ามัธยฐาน
ของข้อมูลชุดใหม่เป็น ค่ามัธยฐานของข้อมูลชุดเดิม บวกเข้าหรือลบออกกับค่า C
ถ้านาค่าคงที่ C ไปคูณเข้ากับค่าสังเกตทุกค่าในข้อมูลชุดเดิม จะได้ค่ามัธยฐานของข้อมูลชุด
ใหม่เป็น ค่ามัธยฐานของข้อมูลชุดเดิม คูณกับค่า C
ถ้านาค่าคงที่ C ซึ่ง C0 ไปหารกับค่าสังเกตทุกค่าในข้อมูลชุดเดิม จะได้ค่ามัธยฐานของ
ข้อมูลชุดใหม่เป็น ค่ามัธยฐานของข้อมูลชุดเดิม หารกับค่า C
26
ข้อสังเกต
N N
1. ( x i median ) 2 ( x i mean ) 2
i1 i1
2. ค่ามัธยฐานเหมาะสาหรับข้อมูลที่มีค่าสังเกตบางค่าผิดปกติ เช่นสูงหรือต่ากว่าค่าสังเกต
ค่าอื่นมาก ๆ
3. ค่ามัธยฐานเหมาะสาหรับข้อมูลมาตรวัดเรียงอันดับ มาตรวัดอันตรภาค และมาตรวัด
อัตราส่วน
4. สาหรับข้อมูลจากตารางแจกแจงความถี่ที่มีลักษณะแบบปลายเปิด สามารถหา
ค่ามัธยฐานได้
5. สาหรับตารางข้อมูลจากตารางแจกแจงความถี่ ถ้าค่า N/2 ตรงกับค่าความถี่สะสมของชั้น
ใด จะได้ว่า มัธยฐาน = ขอบเขตบนของชั้นนั้น
3. ฐานนิยม (Mode)
เป็นค่ากลางที่แสดงถึงค่าสังเกตที่มีซ้ากันมากที่สุด หรือมีจานวนความถี่สูงสุดในข้อมูลชุด
นั้น ข้อมูลชุดหนึ่ง ๆ อาจมีค่าฐานนิยมมากกว่า 1 ค่า หรือ อาจไม่มีค่าฐานนิยมเลย
- กรณีข้อมูลที่ไม่ได้จัดหมวดหมู่(Ungrouped Data)
ฐานนิยม คือ ค่าสังเกตที่มีซ้ากันมากที่สุด ในข้อมูลชุดหนึ่ง
ความสูง จานวน(f)
150 - 154 5
155 - 159 10
160 - 164 14
165 - 169 6
170 - 174 10
วิธีทา
ความถี่สูงสุดคือ 14 อยู่ชั้น ที่ 160 – 164
และได้ LMo = 159.5 , 1 = 14 – 10 = 4 , 2 = 14 – 6 = 8 , I = 5
1
จาก ฐานนิยม = L Mo I จะได้ว่า
1 2
4
ฐานนิยม = 159.5 5 4 8
ฐานนิยม = 161.167
นั่นคือ ฐานนิยมความสูงของนักศึกษาสาขาคอมพิวเตอร์ทั้ง 45 คนเท่ากับ 161.167 เซนติเมตร
คุณสมบัติของฐานนิยม
ถ้านาค่าคงที่ C ไปบวกเข้า หรือลบออกกับค่าสังเกตทุกค่าในข้อมูลชุดเดิม จะได้ค่าฐาน
นิยมของข้อมูลชุดใหม่เป็น ค่าฐานนิยมของข้อมูลชุดเดิม บวกเข้าหรือลบออก กับค่า C
ถ้านาค่าคงที่ C ไปคูณกับค่าสังเกตทุกค่าในข้อมูลชุดเดิม จะได้ค่าฐานนิยมของข้อมูลชุด
ใหม่เป็น ค่าฐานนิยมของข้อมูลชุดเดิม คูณกับค่า C
ถ้านาค่าคงที่ C ซึ่ง C 0 ไปหารกับค่าสังเกตทุกค่าในข้อมูลชุดเดิม จะได้ค่าฐานนิยมของ
ข้อมูลชุดใหม่เป็น ค่าฐานนิยมของข้อมูลชุดเดิม หารกับค่า C
28
ข้อสังเกต
N N N
1. ( x i mod e ) 2 ( x i median ) 2 ( x i mean ) 2
i1 i1 i1
2. สาหรับข้อมูลจากตารางแจกแจงความถี่ ที่มีความกว้างในแต่ละชั้นไม่เท่ากัน ไม่
สามารถหาค่าฐานนิยมได้
3. การหาค่าฐานนิยมในกรณีที่มีความถี่มากที่สุดเท่ากัน 2 ชั้น และอยู่ติดกัน ใช้สูตร ดังนี้
1
ค่าฐานนิยม = L 2 I
1 2
จะได้ลักษณะรูปของการแจกแจงโค้งความถี่เป็นรูประฆังที่เบ้ซ้าย
- กรณีข้อมูลที่ไม่ได้จัดหมวดหมู่(Ungrouped Data)
เรียงลาดับค่าสังเกตทั้งหมดของข้อมูล (N) จากค่าน้อยไปยังค่ามาก จากนั้นหาตาแหน่งโดย
( N 1)r
ตาแหน่งควอร์ไทล์ Q r (r = 1, 2, 3) = 4
แล้วค่าควอร์ไทล์ Q r คือ ค่าที่ตรงกับตาแหน่งควอร์ไทล์ Q r
2. หาตาแหน่ง
Nr
ตาแหน่งควอร์ไทล์ Q r (r = 1, 2, 3) ; N r = 4
N F
3. หาค่าควอร์ไทล์ ที่ r (Q r) = L I r
f
เมื่อ L หมายถึง ขอบเขตล่างของชั้นที่คาดว่า มีค่าควอร์ไทล์ อยู่
I หมายถึง ความกว้างของชั้น
F หมายถึง ความถี่สะสมชนิดน้อยกว่าของชั้นที่มคี ่าสังเกตมีค่าน้อยกว่าชั้นที่ค
วอร์ไทล์อยู่
f หมายถึง ความถี่ของชั้นที่คาดว่ามีค่าควอร์ไทล์ อยู่
- กรณีข้อมูลที่ไม่ได้จัดหมวดหมู่(Ungrouped Data)
เรียงลาดับค่าสังเกตทั้งหมดของข้อมูล (N) จากค่าน้อยไปยังค่ามาก จากนั้นหาตาแหน่งโดย
( N 1)r
ตาแหน่งเดไซล์ D r (r = 1, 2, …, 9) = 10
ค่าเดไซล์ D r คือ ค่าที่ตรงกับตาแหน่งเดไซล์ D r
เปอร์เซ็นไทล์ (Percentile : P)
- กรณีข้อมูลที่ไม่ได้จัดหมวดหมู่(Ungrouped Data)
เรียงลาดับค่าสังเกตทั้งหมดของข้อมูล (N) จากค่าน้อยไปยังค่ามาก จากนั้นหาตาแหน่งโดย
( N 1)r
ตาแหน่งเปอร์เซ็นไทล์ Pr (r = 1, 2, …, 99) = 100
ค่าเปอร์เซ็นไทล์ Pr คือ ค่าที่ตรงกับตาแหน่งเปอร์เซ็นไทล์ Pr
วิธีทา
จากคะแนนเรียงทั้งหมด 22 26 27 28 29 29 31 32 38 40 45 46
ในที่นี้ N = 12 หาเปอร์เซ็นต์ไทล์ที่ 69 หรือ P 69
( N 1)r
จาก Pr = 100 จะได้ว่า
(12 1)69
9 = 100
แสดงว่าเมื่อเรียงคะแนนแล้ว นางสาวราชาวดีได้คะแนนอยู่ที่ ตาแหน่งที่ 9
ตาแหน่งที่ 9 คือคะแนน 38
ดังนั้น นางสาวราชาวดีได้คะแนน 38 คะแนน
จะได้ว่า
N 29
3.12 = 2.995 0.50 r
7
7
N r = (3.12 – 2.995)• ( )+ 29
0.50
N r = 30.75
Nr
จาก N r = 100 จะได้ว่า
40 r
30.75 =
100
r = 76.875
นั่นคือเกรดเฉลี่ย 3.12 ของนางสาวนิตยา จะอยู่ในตาแหน่งเปอร์เซ็นต์ไทล์ที่ 76.875
1. การกระจายของข้อมูล
- กรณีข้อมูลที่ไม่ได้จัดหมวดหมู่
N
xi μ
ข้อมูลประชากร M.D. = i1 N
เมื่อ x i แทน ค่าสังเกตแต่ละค่า
แทน ค่าเฉลี่ยเลขคณิตของข้อมูลประชากร
N แทน จานวนค่าสังเกตทั้งหมด
n
xi x
ข้อมูลตัวอย่าง M.D. = i1 n
เมื่อ x i แทน ค่าสังเกตแต่ละค่า
x แทน ค่าเฉลี่ยเลขคณิตของข้อมูลตัวอย่าง
n แทน จานวนค่าสังเกตทั้งหมด
- กรณีข้อมูลทีจ่ ัดหมวดหมู่
k
fi x i
ข้อมูลประชากร M.D. = i1 N
เมื่อ x i แทน จุดกึ่งกลางของชั้นที่ i ; i = 1,2,…,k
fi แทน ความถี่ของชั้นที่ i ; i = 1,2,…,k
35
แทน ค่าเฉลี่ยเลขคณิตของข้อมูลประชากร
N แทน จานวนค่าสังเกตทั้งหมด
k
fi x i x
ข้อมูลตัวอย่าง M.D. = i1 n
เมื่อ x i แทน จุดกึ่งกลางของชั้นที่ i ; i = 1,2,…,k
fi แทน ความถี่ของชั้นที่ i ; i = 1,2,…,k
x แทน ค่าเฉลี่ยเลขคณิตของข้อมูลตัวอย่าง
n แทน จานวนค่าสังเกตทั้งหมดของข้อมูลตัวอย่าง
- กรณีข้อมูลที่ไม่ได้จัดหมวดหมู่
N
2
( x i )
ข้อมูลประชากร ความแปรปรวน ( 2 ) = i1 N
N
N
( x i )2
2 i1
xi
N
= i1
N
เมื่อ x i แทน ค่าสังเกตแต่ละค่า
แทน ค่าเฉลี่ยเลขคณิตของข้อมูลประชากร
N แทน จานวนค่าสังเกตทั้งหมดของข้อมูลประชากร
n
2
(x i x )
ข้อมูลตัวอย่าง ความแปรปรวน (S2) = i1 n 1
36
n
n
( x i )2
2 i1
xi n
= i1 n 1
เมื่อ x i แทน ค่าสังเกตแต่ละค่า
x แทน ค่าเฉลี่ยเลขคณิตของข้อมูลตัวอย่าง
n แทน จานวนค่าสังเกตทั้งหมดของข้อมูลตัวอย่าง
- กรณีข้อมูลที่จัดหมวดหมู่
k
2
fi ( x i )
ข้อมูลประชากร ความแปรปรวน ( 2 ) = i1 N
k
k
( fi x i ) 2
2 i1
fi x i
N
= i1
N
เมื่อ x i แทน จุดกึ่งกลางของชั้นที่ i ; i = 1,2,…,k
fi แทน ความถี่ของชั้นที่ i ; i = 1,2,…,k
แทน ค่าเฉลี่ยเลขคณิตของข้อมูลประชากร
N แทน จานวนค่าสังเกตทั้งหมดของข้อมูลประชากร
k
2
fi ( x i x )
ข้อมูลตัวอย่าง ความแปรปรวน (S2) = i1 n 1
k
k
( fi x i ) 2
2 i1
fi x i
n
= i1
n 1
เมื่อ x i แทน จุดกึ่งกลางของชั้นที่ i ; i = 1,2,…,k
fi แทน ความถี่ของชั้นที่ i ; i = 1,2,…,k
x แทน ค่าเฉลี่ยเลขคณิตของข้อมูลตัวอย่าง
n แทน จานวนค่าสังเกตทั้งหมดของข้อมูลตัวอย่าง
37
ความสูง จานวน
150 - 154 5
155 - 159 10
160 - 164 14
165 - 169 6
170 - 174 10
วิธีทา
ความสูง ( fi ) (xi) fi xi fixi2 xi μ fi x i μ
150 - 154 5 152 760 115,520 10.67 53.35
155 - 159 10 157 1,570 246,490 5.67 56.7
160 - 164 14 162 2,268 367,416 0.67 9.38
165 - 169 6 167 1,002 167,334 4.33 25.98
170 - 174 10 172 1,720 295,840 9.33 93.3
รวม 45 7,320 1,192,600 30.67 238.71
k
fi x i
7,320
จาก = i1N = 45 = 162.67
k
fi x i
ส่วนเบี่ยงเบนเฉลี่ย M.D. = i1 N
238.71
M.D. =
45
M.D. = 5.30
นั่นคือ ส่วนเบี่ยงเบนเฉลี่ยของความสูงของนักศึกษาทั้ง45 คนเท่ากับ 5.30 เซนติเมตร
39
k
k
( fi x i ) 2
2 i1
fi x i
N
ความแปรปรวน = 2 = i1
N
(7,320 ) 2
1,192,600
=
2 45
45
= 41.78 และส่วนเบี่ยงเบนมาตรฐาน = = 6.46
2
คุณสมบัติของส่วนเบี่ยงเบนมาตรฐาน
ถ้านาค่าคงที่ C ไปบวกเข้า หรือ ลบออกกับค่าสังเกตทุกค่าในข้อมูลชุดเดิม จะได้ค่าส่วน
เบี่ยงเบนมาตรฐานของข้อมูลชุดใหม่เป็น ส่วนเบี่ยงเบนมาตรฐานเดิม
ถ้านาค่าคงที่ C ไปคูณกับค่าสังเกตทุกค่าในข้อมูลเดิม จะได้ค่าส่วนเบี่ยงเบนมาตรฐานของ
ข้อมูลชุดใหม่เป็น ส่วนเบี่ยงเบนมาตรฐานเดิม x C
ถ้านาค่าคงที่ C ซึ่ง C 0 ไปหารกับค่าสังเกตทุกค่าในข้อมูลชุดเดิม จะได้ค่าส่วนเบี่ยงเบน
มาตรฐานของข้อมูลชุดใหม่เป็น ส่วนเบี่ยงเบนมาตรฐานเดิม / C
1.2 การวัดการกระจายสัมพัทธ์
2. การวัดความเบ้ (Skewness)
ความเบ้เป็นลักษณะของข้อมูลที่มีรูปของการแจกแจงโค้งความถี่ที่ไม่สมมาตร ซึ่งมีการเบ้
ของโค้งไปข้างใดข้างหนึ่ง คือมีค่า Mean Median และ Mode ที่ต่างกัน เช่น เบ้ขวา จะมีค่าความเบ้
เป็นบวก (Mean > Median > Mode) โดยที่ค่า Mean จะมีค่ามากที่สุด และเบ้ซ้าย จะมีค่าความเบ้เป็น
ลบ ( Mode > Median > Mean ) โดยที่ค่า Mode จะมีค่ามากที่สุด ดังรูป
รูปของการแจกแจงโค้งความถี่เป็นรูประฆังที่สมมาตร
รูปของการแจกแจงโค้งความถี่เป็นรูประฆังที่เบ้ขวา
รูปของการแจกแจงโค้งความถี่เป็นรูประฆังที่เบ้ซ้าย
ค่าความเบ้
- กรณีข้อมูลชุดเดียว
จะพิจารณาจากค่า Mean และ Mode ดังนี้
Mean – Mode = 0 ข้อมูลชุดนั้นมีรูปของการแจกแจงโค้งความถี่ที่สมมาตร
Mean – Mode > 0 ข้อมูลชุดนั้นมีรูปของการแจกแจงโค้งความถี่ที่เบ้ขวา
Mean – Mode < 0 ข้อมูลชุดนั้นมีรูปของการแจกแจงโค้งความถี่ที่เบ้ซ้าย
- กรณีข้อมูลหลายชุด
Mean Mode
สัมประสิทธิ์ความเบ้ = Sk =
และจาก Mode = 3 Median – 2 Mean จะได้ว่า
3(Mean Median )
สัมประสิทธิ์ความเบ้ = Sk =
42
โดยพิจารณาค่าความเบ้ดังนี้
Sk = 0 ข้อมูลชุดนั้นมีรูปของการแจกแจงโค้งความถี่ที่สมมาตร
Sk > 0 ข้อมูลชุดนั้นมีรูปของการแจกแจงโค้งความถี่ที่เบ้ขวา
Sk < 0 ข้อมูลชุดนั้นมีรูปของการแจกแจงโค้งความถี่ที่เบ้ซ้าย
หรือพิจารณาด้วยโมเมนต์
- กรณีข้อมูลที่ไม่ได้จัดหมวดหมู่
N
3
( x i )
Sk หรือ 3 = i1
N 3
เมื่อ คือ ค่าเฉลี่ยเลขคณิตของข้อมูลชุดนั้น
คือ ค่าส่วนเบี่ยงเบนมาตรฐานของข้อมูลชุดนั้น
N คือ จานวนของข้อมูลชุดนั้นทั้งหมด
- กรณีข้อมูลที่จัดหมวดหมู่
k
3
fi ( x i )
Sk หรือ 3 = i1
N 3
เมื่อ คือ ค่าเฉลี่ยเลขคณิตของข้อมูลชุดนั้น
คือ ค่าส่วนเบี่ยงเบนมาตรฐานของข้อมูลชุดนั้น
fi คือ ความถี่แต่ละชั้นที่ i ; i = 1,2,…,k
N คือ จานวนของข้อมูลชุดนั้นทั้งหมด
โดยพิจารณาค่าความเบ้ดังนี้
3 = 0 ข้อมูลชุดนั้นมีรูปของการแจกแจงโค้งความถี่ที่สมมาตร
3 > 0 ข้อมูลชุดนั้นมีรูปของการแจกแจงโค้งความถี่ที่เบ้ขวา
3 < 0 ข้อมูลชุดนั้นมีรูปของการแจกแจงโค้งความถี่ที่เบ้ซ้าย
43
3. การวัดความโด่ง (Kurtosis)
ค่าความโด่ง
- กรณีข้อมูลที่ไม่ได้จัดหมวดหมู่
N
4
( x i )
4 = i1
N 4
เมื่อ คือ ค่าเฉลี่ยเลขคณิตของข้อมูลชุดนั้น
คือ ค่าส่วนเบี่ยงเบนมาตรฐานของข้อมูลชุดนั้น
N คือ จานวนของข้อมูลชุดนั้นทั้งหมด
- กรณีข้อมูลที่จัดหมวดหมู่
k
4
fi ( x i )
4 = i1
N 4
เมื่อ คือ ค่าเฉลี่ยเลขคณิตของข้อมูลชุดนั้น
คือ ค่าส่วนเบี่ยงเบนมาตรฐานของข้อมูลชุดนั้น
f i คือ ความถี่แต่ละชั้นที่ i ; i = 1,2,…,k
N คือ จานวนของข้อมูลชุดนั้นทั้งหมด
44
โดยพิจารณาค่าความโด่งดังนี้
4 = 3 ข้อมูลชุดนั้นมีรูปการแจกแจงโค้งความถี่ที่มีลักษณะเป็นเส้นโค้งโด่งปกติ
4 > 3 ข้อมูลชุดนั้นมีรูปการแจกแจงโค้งความถี่ที่มีลักษณะเป็นเส้นโค้งโด่งสูง
4 < 3 ข้อมูลชุดนั้นมีรูปการแจกแจงโค้งความถี่ที่มีลักษณะเป็นเส้นโค้งแบน
ความสูง จานวน
150 - 154 5
155 - 159 10
160 - 164 14
165 - 169 6
170 - 174 10
3(162.67 162.178)
Sk = 6.46
Sk = 0.2285
k
4
fi ( x i )
จากสัมประสิทธิ์ความโด่ง 4 = i1 จะได้ว่า
N 4
5(152 162.67) 4 10(157 162.67) 4 10(172 162.67) 4
4 =
45 6.46 4
153,030.4364
= 78,368.6897
= 1.9527
45
แบบฝึกหัดบทที่ 2
ขีดจากัด จานวน
1–9 12
10 – 18 18
19 – 27 10
28 – 36 10
คะแนนสอบ จานวนนักศึกษา
30 – 39 1
40 – 49 4
50 – 59 10
60 – 69 22
70 – 79 45
80 – 89 30
90 - 99 8
จงหาค่า Q 3 , D 4 และ P 80
5. เมื่อสร้างตารางแจกแจงความถี่ของคะแนนของนักศึกษาจานวน 36 คนโดยให้ความกว้าง
ของแต่ละอันตรภาคชั้นเป็น 10 แล้วปรากฏว่า มัธยฐานของคะแนนทั้งหมดอยู่ในช่วง 50 – 59
คะแนน ถ้ามีนักศึกษาที่สอบได้คะแนนต่ากว่า 49.5 คะแนนจานวน 12 คน และมีนักศึกษาที่ได้
คะแนนต่ากว่า 59.5 อยู่จานวน 20 คน แล้วมัธยฐานของคะแนนสอบครั้งนี้จะมีค่าเป็นเท่าไร
6. ข้อมูลชุดหนึ่งมี 20 จานวน หาค่าเฉลี่ยเลขคณิตได้เป็น 12 แต่ต่อมาตรวจพบว่ามีการเขียน
ข้อมูลผิดไป 2 จานวน คือ ข้อมูลเป็น 8 แต่เขียนเป็น 3 และข้อมูลเป็น 7 แต่เขียนเป็น 4
จงหาค่าเฉลี่ยเลขคณิตที่ถูกต้องของข้อมูลชุดนี้
7. เงินเดือนของคนงานโรงงานหนึ่งเฉลี่ยต่อคนมีค่าเท่ากับ 7,500 บาทต่อเดือน และสัมประ
สิทธ์ ของการแปรผันของเงินเดือนเท่ากับ 15 เปอร์เซ็นต์ ดังนั้นส่วนเบี่ยงเบนมาตรฐานของ
เงินเดือนของคนงานมีค่าเท่ากับเท่าไร
8. ในการสอบปลายภาคของนางสาวปูเป้ ที่ลงทะเบียนเรียนในภาคเรียนที่ 2 ของมหาวิทยาลัย
แห่งหนึ่ง ซึ่งลงเรียนทั้งหมด 4 วิชาได้ผลดังนี้
วิชาที่เรียน คะแนนเฉลี่ย ส่วนเบี่ยงเบนมาตรฐาน คะแนนที่สอบได้
ภาษาอังกฤษ 27 14 62
คณิตศาสตร์ 25 16 57
สถิติ 21 10 51
วิทยาศาสตร์ 35 10 50
นางสาวปูเป้ทาคะแนนในวิชาใดได้ดีที่สุด