You are on page 1of 26

91

บทที่ 4
การวิเคราะห์ ไคสแควร์

การวิเคราะห์ไคสแควร์ เป็ นการเปรี ยบเทียบความถี่ของข้ อมูลตัวอย่างกับความถี่


คาดหมายของรูปแบบที่คาดไว้ ในบทนี ้จะอธิบายถึงการวิเคราะห์ข้อมูลที่อยูใ่ นรูปความถี่ และ
ทดสอบความสัมพันธ์ระหว่างตัวแปร 2 ตัว และการเปรี ยบเทียบระดับความสัมพันธ์ระหว่างตัว
แปรหนึง่ กับตัวแปรหนึง่ กับตัวแปรอื่นๆแต่ละตัว การทดสอบไคสแควร์ เกี่ยวข้ องกับการทดสอบ
ดังนี ้
4.1 การทดสอบภาวะสารูปสนิทดี (Goodness of Fit Test) เกี่ยวกับสัดส่วน
4.2 การทดสอบภาวะสารูปสนิทดี (Goodness of Fit Test) เกี่ยวกับการแจกแจงความ
น่าจะเป็ น
4.3 การทดสอบความเป็ นอิสระ (Test of Independence)

4.1 การทดสอบภาวะสารู ปสนิทดี (Goodness of Fit Test) เกี่ยวกับสัดส่ วน


เป็ นการทดสอบเกี่ยวกับสัดส่วนของประชากรว่าเป็ นไปตามที่คาดไว้ หรื อไม่ แบ่ง
ออกเป็ น 2 กรณี คือ
4.1.1 ข้ อมูลแจงอยูใ่ นรูปแบบตารางทางเดียว
4.1.2 ข้ อมูลแจงอยูใ่ นรูปแบบตารางสองทาง
4.1.1 ข้ อมูลแจงอยู่ในรู ปแบบตารางทางเดียว
เป็ นการวิเคราะห์ข้อมูลที่มีลกั ษณะเป็ นมิตเิ ดียว หรื อตัวแปรเดียว
สถิตสิ าหรับการทดสอบ คือ

2 k (O  E ) 2
 =  i i
i1 Ei

โดยมีองศาเสรี df =k –1
Oi คือ ความถี่คา่ สังเกตของกลุม่ ที่ i
Ei คือ ความถี่คาดหมายของกลุม่ ที่ i ภายใต้ ข้อสมมุติ H0 เป็ นจริง
k คือ จานวนกลุม่ ที่จาแนก
92

การทดสอบภาวะสารูปสนิทดี มีขนตอนดั
ั้ งนี ้
1. ตังสมมติ
้ ฐาน
2. ระดับนัยสาคัญ
3. ภายใต้ ข้อสมมติฐาน H0 เป็ นจริง คานวณค่าความถี่คาดหมาย โดยใช้ ขนาดตัวอย่าง
คูณกับสัดส่วนของแต่ละกลุม่ ดังระบุในสมมติฐานว่าง H0
2 k (O  E ) 2
4. สถิตทิ ี่ใช้  =  i i
cal i1 Ei
2 2
5. เปิ ดตารางหาค่าวิกฤต ปฏิเสธสมมติฐานว่าง H0 ถ้ า  cal >  tab และจะยอมรับ
2 2
สมมติฐานว่าง H0 ถ้ า    tab
cal
6. สรุปผล

กรณีท่ ี 1 การทดสอบความเท่ากันของสัดส่วนของประชากร
กาหนดให้ สดั ส่วนของประชากรแต่ละกลุม่ มีคา่ เท่ากัน = 1/k

ตัวอย่ างที่ 1 บริษัทได้ ผลิตเค้ กออกมา 5 รสชาติ คือ B, C, D, E และ F ฝ่ ายวิจยั ต้ องการทดสอบ
สัดส่วนความนิยมของลูกค้ าว่ามีความแตกต่างกันหรื อไม่ ที่ระดับนัยสาคัญ 0. 05 โดยสุม่ ลูกค้ ามา
100 คน แล้ วให้ ลกู ค้ าบอกว่าชอบรสชาติใดมากที่สดุ ได้ ข้อมูลดังนี ้
รสชาติ B C D E F รวม
จานวนลูกค้ า 17 27 22 15 19 100
วิธีทา
กาหนดให้ pB คือ สัดส่วนความนิยมของรสชาติเค้ ก B
PC คือ สัดส่วนความนิยมของรสชาติเค้ ก C
PD คือ สัดส่วนความนิยมของรสชาติเค้ ก D
PE คือ สัดส่วนความนิยมของรสชาติเค้ ก E
PF คือ สัดส่วนความนิยมของรสชาติเค้ ก F
1. ตังสมมติ
้ ฐาน
H0 : pB = pC = pD = pE = pF = 1
5
H1 : pB  pC  pD  pE  pF  1
5
93

2. ระดับนัยสาคัญ
 = 0.05

3. คานวณความถี่คาดหมาย
1
จาก Eij = npi ดังนัน้ EB = EC = ED = EE = EF = (100) = 20
5
ตารางความถี่คา่ สังเกตและความถี่คาดหมาย
รสชาติเค้ ก
B C D E F รวม
ความถี่คา่ สังเกต Oi 17 27 22 15 19 100
ความถี่คาดหมาย Ei 20 20 20 20 20 100
4. สถิตทิ ี่ใช้
k (O  E ) 2

2
=  i i
cal i1 Ei
(17  20)2 (27  20)2 (22  20)2 (15  20)2
= + + + +
20 20 20 20
(19  20)2
20
= 2.40
5. เปิ ดตารางหาค่าวิกฤต
df = k – 1 = 5 – 1 = 4
2 2
 tab =  0.05,4 = 9.49
2.40

2

9.49

 ยอมรับสมมติฐานว่าง H0
6. สรุปผล
สัดส่วนความนิยมของลูกค้ ามีความแตกต่างกัน ที่ระดับนัยสาคัญ 0.05
94

กรณีท่ ี 2 การทดสอบการคาดหมายของอัตราส่วนของประชากร
กาหนดให้ สดั ส่วนของประชากรมีคา่ เท่ากับค่าคาดหมาย

ตัวอย่ างที่ 2 อาจารย์ผ้ สู อนวิชาหลักสถิตเิ คยตัดเกรดวิชาหลักสถิตเิ มื่อปี ที่แล้ ว โดยให้ เกรด A


5% เกรด B 25% เกรด C 40% เกรด D 25% และเกรด F 5% อยากทราบว่าในปี นี ้ การแจกแจง
ของเกรดที่อาจารย์ผ้ สู อนวิชาหลักสถิตยิ งั คงเหมือนปี ที่แล้ วหรื อไม่ จึงสุม่ ตัวอย่างนักศึกษาที่เรี ยน
วิชาหลักสถิตใิ นปี นี ้มา 150 คน พบว่าได้ A จานวน 11 คน B 32 คน C 62 คน D 29 คน และได้
เกรด F 16 คน จงทดสอบที่ระดับนัยสาคัญ 0.01
วิธีทา
กาหนดให้ pA คือ สัดส่วนของเกรด A
pB คือ สัดส่วนของเกรด B
pC คือ สัดส่วนของเกรด C
pD คือ สัดส่วนของเกรด D
pF คือ สัดส่วนของเกรด F
1. ตังสมมติ
้ ฐาน
H0 : pA = 0.05, pB = 0.25, pC = 0.40 และ pD = 0.25, pF = 0.05
H1 : pA  0.05, pB  0.25, pC  0.40 และ pD  0.25, pF  0.05
2. ระดับนัยสาคัญ
 = 0.01

3. คานวณความถี่คาดหมาย
จาก Eij = npi ดังนัน้ EA = (0.05)(150) = 7.5
EB = (0.25)(150) = 37.5
EC = (0.40)(150) = 60
ED = (0.25)(150) = 37.5
EF = (0.05)(150) = 7.5
95

ตารางความถี่คา่ สังเกตและความถี่คาดหมาย
เกรด
A B C D F รวม
ความถี่คา่ สังเกต Oi 11 32 62 29 16 150
ความถี่คาดหมาย Ei 7.5 37.5 60 37.5 7.5 150
4. สถิตทิ ี่ใช้
k (O  E ) 2

2
=  i i
cal i1 Ei
(11  7.5)2 (32  37.5)2 (62  60)2 (29  37.5)2
= + + + +
7.5 37.5 60 37.5
(16  7.5)2
7.5
= 14.07
5. เปิ ดตารางหาค่าวิกฤต
df = k – 1 = 5 – 1 = 4
2 2
 tab =  0.01,4 = 13.3
14.07

2

13.3

 ปฏิเสธสมมติฐานว่าง H0
6. สรุปผล
การแจกแจงของเกรดที่อาจารย์ผ้ สู อนวิชาหลักสถิตไิ ม่เหมือนปี ที่แล้ ว ที่ระดับ
นัยสาคัญ 0.01
96

4.1.2 ข้ อมูลแจงอยู่ในรู ปแบบตารางสองทาง


เป็ นการทดสอบสัดส่วนของประชากรสาหรับข้ อมูลคุณภาพหรื อข้ อมูลเชิงกลุม่ ที่
อยูใ่ นรูปแบบตารางสองทางหรื อตารางการจรที่มีขนาด r แถว และ c สดมภ์ การทดสอบสัดส่วน
ของประชากรกรณีนี ้จะมีขนาด 2 แถวเท่านัน้ สมมติฐานในการทดสอบคือ
H0: p1 = p2 = … = pc
H1: p1  p2  …  pc
สถิตสิ าหรับการทดสอบ คือ

2
2 r c (Oij  E ij )
 = 
i1j1 E ij

โดยมีองศาเสรี df = (r - 1)(c – 1)
ค่า Eij คานวณได้ จาก
Orow i O col j
Eij =
n

Oij คือ ความถี่คา่ สังเกตในแถว i สดมภ์ j


Eij คือ ความถี่คาดหมายในแถว i สดมภ์ j ภายใต้ ข้อสมมุติ H0 เป็ นจริง
Orow i คือ ความถี่คา่ สังเกตรวมของแถว i
Ocol j คือ ความถี่คา่ สังเกตรวมของสดมภ์ j
r คือ จานวนแถว
c คือ จานวนสดมภ์
ตัวอย่ างที่ 3 ในการสอบถามความคิดเห็นของประชาชนเกี่ยวกับการยุบสภา จึงสุม่ ประชาชนมา
200 คน สอบถามความคิดเห็นว่ารัฐบาลควรยุบสภาหรื อไม่ ดังนี ้
ความคิดเห็น
เพศ รวม
เห็นด้ วย ไม่เห็นด้ วย เฉย ๆ
ชาย 39 46 9 94
หญิง 60 36 10 106
รวม 99 82 19 200
97

อยากทราบว่า ความคิดเห็นเกี่ยวกับการยุบสภาของชายและหญิงแตกต่างกันหรื อไม่ ที่


ระดับนัยสาคัญ 0.05
วิธีทา
กาหนดให้ p1 คือ สัดส่วนความคิดเห็นที่เห็นด้ วย
p2 คือ สัดส่วนความคิดเห็นที่ไม่เห็นด้ วย
p3 คือ สัดส่วนความคิดเห็นที่เฉย ๆ
1. ตังสมมติ
้ ฐาน
H0 : p1 = p2 = p3
H1 : p1  p2  p3
2. ระดับนัยสาคัญ
 = 0.05

3. คานวณความถี่คาดหมาย
Orow i O col j (94)(99)
จาก Eij = ดังนัน้ E11 = = 46.53
n 200
(94)(82)
E12 = = 38.54
200
(94)(19)
E13 = = 8.93
200
(106)(99)
E21 = = 52.47
200
(106)(82)
E22 = = 43.46
200
(106)(19)
E23 = = 10.07
200
ตารางความถี่คาดหมาย มีดงั นี ้
ความคิดเห็น
เพศ รวม
เห็นด้ วย ไม่เห็นด้ วย เฉย ๆ
ชาย 46.53 38.54 8.93 94
หญิง 52.47 43.46 10.07 106
รวม 99 82 19 200
98

4. สถิตทิ ี่ใช้
2 (Oij  eij ) 2
r c
 cal = 
i1 j1 eij
2 (46  38.54)2 2 2
= (39  46.53) + + (9  8.93) + (60  52.47)
46.53 38.54 8.93 52.47
+
(36  43.46)2 (10  10.07)2
+
43.46 10.07
= 5.02
5. เปิ ดตารางหาค่าวิกฤต

df = (r – 1)(c – 1) = (2 – 1)(3 – 1)
=2
2 2
5.02  tab =  0.05,2 = 5.99

2

5.99

 ยอมสมมติฐานว่าง H0
6. สรุปผล
ความคิดเห็นเกี่ยวกับการยุบสภาของชายและหญิงไม่แตกต่างกัน ที่ระดับ
นัยสาคัญ 0.05
99

4.2 การทดสอบภาวะสารู ปสนิทดี (Goodness of Fit Test) เกี่ยวกับการแจกแจงความ


น่ าจะเป็ น
เป็ นการทดสอบการแจกแจงความน่าจะเป็ นของประชากรว่ามีลกั ษณะการแจกแจง
เป็ นไปตามคาดหรื อไม่ โดยจะกล่าวถึงการทดสอบการแจกแจงความน่าจะเป็ นที่มีลกั ษณะ
4.2.1 การแจกแจงทวินาม (Binomial Distribution)
4.2.2 การแจกแจงปั วส์ซอง (Poisson Distribution)
4.2.3 การแจกแจงปกติ (Normal Distribution)
สถิตทิ ี่ใช้ ทดสอบสารูปสนิทดีเกี่ยวกับการแจกแจกความน่าจะเป็ นของประชากร คือ

2 k (O  E ) 2
 =  i i
i1 Ei

โดยมีระดับองศาเสรี df = k – 1
Oi คือ ความถี่คา่ สังเกตของกลุม่ ที่ i
Ei คือ ความถี่คาดหมายของกลุม่ ที่ i ภายใต้ ข้อสมมุติ H0 เป็ นจริง
k คือ จานวนกลุม่ ที่จาแนก

หมายเหตุ ความถี่คาดหมาย (ei) แต่ละกลุม่ ต้ องมีคา่ ไม่ต่ากว่า 5 กรณีกลุม่ ใดมีความถี่


คาดหมายต่ากว่า 5 ให้ ยบุ รวมกับกลุม่ ที่อยูต่ ดิ กัน

4.2.1 การทดสอบการแจกแจงทวินาม (Binomial Distribution)


สมมติฐาน
H0: ประชากรมีการแจกแจงทวินาม
H1: ประชากรไม่ได้ มีการแจกแจงทวินาม

ทังนี้ ้ค่าความถี่คาดหมาย Ei เป็ นผลคูณระหว่างความน่าจะเป็ นของกลุม่ i กับจานวน


ตัวอย่าง ซึง่ ความน่าจะเป็ นของแต่ละกลุม่ คานวณได้ จากฟั งก์ชนั ความน่าจะเป็ นทวินาม

n!
f(x) = x!(n  x )! p x qnx
100

โดย p คือ ความน่าจะเป็ นของผลสาเร็จของสิ่งที่สนใจ


q คือ ความน่าจะเป็ นที่ไม่เป็ นผลสาเร็จของสิ่งที่สนใจ
x คือ จานวนครัง้ ของผลสาเร็จ
n คือ จานวนการทดลองทังหมด ้

ตัวอย่ างที่ 4 ผู้วิจยั ต้ องการทดสอบว่าจานวนรถจักรยานยนต์ที่ขายได้ ตอ่ วันมีการแจกแจงทวิ


นามโดยมีความน่าจะเป็ นที่จะขายได้ เท่ากับ 0.30 หรื อไม่ ที่ระดับนัยสาคัญ 0.05 จึงทาการสุม่
จานวนวันและบันทึกจานวนได้ ข้อมูลดังนี ้

จานวนรถที่ขายได้ ตอ่ วัน จานวนวัน


0 30
1 32
2 25
3 10
4 3
รวม 100
สมมติฐาน
H0: จานวนรถจักรยานยนต์ที่ขายได้ ตอ่ วันมีการแจกแจงทวินาม ด้ วย p = 0.30
H1: จานวนรถจักรยานยนต์ที่ขายได้ ตอ่ วันไม่ได้ มีการแจกแจงทวินาม ด้ วย p = 0.30
ฟั งก์ชนั ความน่าจะเป็ นทวินาม คือ
n!
f(x) = x!(n  x )! p x qnx
โดย
p = 0.30 คือ ความน่าจะเป็ นที่รถแต่ละคันจะขายได้
q = 0.70 คือ ความน่าจะเป็ นที่รถแต่ละคันจะขายไม่ได้
x = 0, 1, 2, 3, 4 คือ ตัวแปรสุม่ แทนจานวนรถที่ขายได้ ตอ่ วัน
n =4 คือ จานวนรถที่ขายได้ ทงหมดต่
ั้ อวัน

คานวณความน่าจะเป็ นที่ขายรถจักรยานยนต์จานวน x = 0, 1, 2, 4
4!
f(0) = 0!(4  0)! (0.30)0 (0.70) 40 = 0.2401
101

4!
f(1) = 1!(4  1)! (0.30)1 (0.70) 41 = 0.4116
4!
f(2) = 2!(4  2)! (0.30) 2 (0.70) 42 = 0.2646
4!
f(3) = 3!(4  3)! (0.30)3 (0.70) 43 = 0.0756
4!
f(4) = 4!(4  4)! (0.30) 4 (0.70) 44 = 0.0081
คานวณจานวนวันคาดหมายที่จะขายรถจักรยานยนต์ เมื่อ x = 0, 1, 2, 3 และ 4 โดยคูณความ
น่าจะเป็ นกับจานวนตัวอย่างทังหมด
้ ดังนี ้
E(x = 0) = (0.2401)(100) = 24.01
E(x = 1) = (0.4116)(100) = 41.16
E(x = 2) = (0.2646)(100) = 26.46
E(x = 3) = (0.0756)(100) = 7.56
E(x = 4) = (0.0081)(100) = 0.81

กลุม่ จานวนรถที่ขายได้ ความน่าจะเป็ น ความถี่คา่ สังเกต ความถี่คาดหมาย


ต่อวัน f(x) Oi Ei
i
0 0.2401 30 24.01
1 0.4116 32 41.16
2 0.2646 25 26.46
3 0.0756 10 7.56
4 0.0081 3 0.81
รวม 1.0000 100 100.00

จากเงื่อนไข ความถี่คาดหมาย (Ei) แต่ละกลุม่ ต้ องมีคา่ ไม่ต่ากว่า 5 กรณีกลุม่ ใดมีความถี่


คาดหมายต่ากว่า 5 ให้ ยบุ รวมกับกลุม่ ที่อยูต่ ดิ กัน ดังนันยุ
้ บกลุม่ x = 4 รวมกับ กลุม่ x =3
102

กลุม่ จานวนรถที่ขายได้ ตอ่ วัน ความน่าจะเป็ น ความถี่คา่ สังเกต ความถี่คาดหมาย


i f(x) Oi Ei
0 0.2401 30 24.01
1 0.4116 32 41.16
2 0.2646 25 26.46
3 หรื อ 4 0.0837 13 8.37
รวม 1.0000 100 100.00

สถิตทิ ดสอบ
2 k (O  E ) 2
 =  i i
i1 Ei
(30  24.01) 2 (32  41.16) 2 ( 25  26.46) 2 (13  8.37)2
= 24.01 + 41.16 + 26.46 + 8.37
= 6.1746
ระดับองศาเสรี df = k – m – 1 = 4 – 0 – 1 = 3
ค่าวิกฤต

2

0.05
(df = 3) = 7.81

0.05
0.95 2

7.81
สรุป
ค่าสถิติ  2 <  02.05 จึงยอมรับสมมุตฐิ านว่าง H0 สรุปได้ วา่ จานวนรถจักรยานยนต์ที่
ขายได้ ตอ่ วันมีการแจกแจงทวินาม ด้ วย p = 0.30 ที่ระดับนัยสาคัญ 0.05
103

4.2.2 การทดสอบการแจกแจงปั วส์ ซอง (Poisson Distribution)


สมมติฐาน
H0: ประชากรมีการแจกแจงปั วส์ซอง
H1: ประชากรไม่ได้ มีการแจกแจงปั วส์ซอง

ทังนี
้ ้ค่าความถี่คาดหมาย Ei เป็ นผลคูณระหว่างความน่าจะเป็ นของกลุม่ i กับจานวน
ตัวอย่าง ซึง่ ความน่าจะเป็ นของแต่ละกลุม่ คานวณได้ จากฟั งก์ชนั ความน่าจะเป็ นปั วส์ซอง ดังนี ้

x 
 e
f(x) = x!

โดย  คือ ค่าเฉลี่ยภายในช่วงเวลาที่กาหนด


x คือ จานวนสิ่งสนใจภายในช่วงเวลาที่กาหนด

ตัวอย่ างที่ 5 สาขาของธนาคารแห่งหนึง่ จะทาการปรับปรุงการให้ บริการแก่ลกู ค้ า โดยจัดให้ มี


ช่องบริการเพียงพอต่อจานวนลูกค้ าที่เข้ ามาใช้ บริการ ขณะเดียวกันต้ องเป็ นการประหยัดค่าใช้ จา่ ย
สาหรับธนาคาร ฝ่ ายวิจยั เชื่อว่าจานวนลูกค้ าที่เข้ ามาใช้ บริการในช่วงเวลาที่สนใจศึกษานันมี
้ การ
แจกแจงปั วส์ซอง จึงทาการทดสอบความเชื่อที่ระดับนัยสาคัญ 0.05 โดยสุม่ ช่วงเวลา 10 นาทีที่
สนใจมาจานวน 128 ช่วง นับจานวนลูกค้ าที่เข้ ามาใช้ บริการในช่วงเวลา 10 นาทีดงั กล่าว ได้ ข้อมูล
ดังนี ้
104

จานวนลูกค้ า จานวนช่วงเวลา
x f
0 2
1 8
2 10
3 12
4 18
5 22
6 22
7 16
8 12
9 6
รวม 128

สมมติฐาน
H0: จานวนลูกค้ าเข้ ามาใช้ บริการในช่วงเวลา 10 นาที มีการแจกแจงปั วส์ซอง
H1: จานวนลูกค้ าเข้ ามาใช้ บริการในช่วงเวลา 10 นาที ไม่ได้ มีการแจกแจงปั วส์ซอง

ฟั งก์ชนั ความน่าจะเป็ นปั วส์ซอง คือ


x 
 e
f(x) = x!
โดย
คือ ค่าเฉลี่ยของลูกค้ าที่เข้ ามาใช้ บริการภายในช่วงเวลา 10 นาที
x คือ ตัวแปรสุม่ แทนจานวนลูกค้ าที่เข้ ามาใช้ บริการภายในช่วงเวลา 10 นาที

การคานวณความน่าจะเป็ นของการแจกแจงปั วส์ซอง จะต้ องประมาณค่าเฉลี่ย  ก่อน


โดยใช้ ข้อมูลตัวอย่าง ตัวประมาณค่าแบบจุดของค่าเฉลี่ย  คือค่าเฉลี่ยตัวอย่าง x คานวณ
ดังนี ้
105

จานวนลูกค้ า จานวนช่วงเวลา fx
x f
0 2 0
1 8 8
2 10 20
3 12 36
4 18 72
5 22 110
6 22 132
7 16 112
8 12 96
9 6 54
รวม 128 640

 fx 640
x= n = 128 = 5

ดังนันจ
้ านวนเฉลี่ยของลูกค้ าที่เข้ ามาใช้ บริการภายในช่วงเวลา 10 นาที (  ) เท่ากับ 5 คน
คานวณความน่าจะเป็ นที่จานวนลูกค้ า x = 0, 1, 2, 3, … คนเข้ ามาใช้ บริการภายในช่วงเวลา 10
นาที
5 0 e 5 51 e 5
f(0) = 0! = 0.0067 f(1) = 1! = 0.0337
2 5
5 e 5 3 e 5
f(2) = 2! = 0.0842 f(3) = 3! = 0.1404
4 5
5 e 5 5 e 5
f(4) = 4! = 0.1755 f(5) = 5! = 0.1755
6 5
5 e 5 7 e 5
f(6) = 6! = 0.1462 f(7) = 7! = 0.1044
8 5
5 e 5 9 e 5
f(8) = 8! = 0.0653 f(9) = 9! = 0.0363
f(x=10 หรื อมากกว่า ) = 1 – f(0) - …. – f(9) = 1 – 0.0067 – … - 0.0363 = 0.0318
106

คานวณจานวนลูกค้ าคาดหมายที่เข้ ามาใช้ บริการภายในช่วงเวลา 10 นาที โดยใช้ คา่


ความน่าจะเป็ นคูณกับจานวนตัวอย่างทังหมด
้ ดังนี ้
E(x = 0) = (0.0067)(128) = 0.8576 E(x=1) = (0.0337)(128) = 4.3136
E(x = 2) = (0.0842)(128) = 10.7776 E(x=3) = (0.1404)(128) = 17.9712
E(x = 4) = (0.1755)(128) = 22.4640 E(x=5) = (0.1755)(128) = 22.4640
E(x = 6) = (0.1462)(128) = 18.7136 E(x=7) = (0.1044)(128) = 13.3632
E(x = 8) = (0.0653)(128) = 8.3584 E(x=9) = (0.0363)(128) = 4.6464
E(x = 10 หรื อมากกว่า) = (0.0318)(128) = 4.0704

กลุม่ จานวนลูกค้ า ความน่าจะเป็ น ความถี่คา่ สังเกต ความถี่คาดหมาย


i f(x) Oi ei
0 0.0067 2 0.8576
1 0.0337 8 4.3136
2 0.0842 10 10.7776
3 0.1404 12 17.9712
4 0.1755 18 22.4640
5 0.1755 22 22.4640
6 0.1462 22 18.7136
7 0.1044 16 13.3632
8 0.0653 12 8.3584
9 0.0363 6 4.6464
10 หรื อมากกว่า 0.0318 0 4.0704
รวม 1.0000 128 128.0000

จากเงื่อนไข ความถี่คาดหมาย (ei) แต่ละกลุม่ ต้ องมีคา่ ไม่ต่ากว่า 5 กรณีกลุม่ ใดมีความถี่


คาดหมายต่ากว่า 5 ให้ ยบุ รวมกับกลุม่ ที่อยูต่ ดิ กัน ดังนัน้
ยุบกลุม่ x = 0 รวมกับ กลุม่ x =1
ยุบกลุม่ x =10 หรื อมากกว่า รวมกับ กลุม่ x = 9
107

กลุม่ จานวนลูกค้ า ความน่าจะเป็ น ความถี่คา่ สังเกต ความถี่คาดหมาย


i f(x) Oi ei
0 หรื อ 1 0.0404 10 5.1712
2 0.0842 10 10.7776
3 0.1404 12 17.9712
4 0.1755 18 22.4640
5 0.1755 22 22.4640
6 0.1462 22 18.7136
7 0.1044 16 13.3632
8 0.0653 12 8.3584
9 หรื อมากกว่า 0.0681 6 8.7168
รวม 1.0000 128 128.0000

2 (Oi  e i ) 2
k
 = 
i1 ei
(10  5.1712 ) 2 (10  10.7776 ) 2 (12  17.9712 ) 2 (18  22.464 ) 2
= 5.1712 + 10.7776 + 17.9712 + 22.464
( 22  22.464 ) ( 22  18.7136 ) (16  13.3632 ) (12  8.3584 ) 2
2 2 2
+ 22.464 + 18.7136 + 13.3632 + 8.3584
2
(6  8.7168 )
+ 8.7168
= 10.9766
ระดับองศาเสรี df = k – m – 1 = 9 – 1 – 1 = 7
ค่าวิกฤต
2

0.05
(df = 7) มีคา่ เท่ากับ 14.07
ค่าสถิติ  2 <  02.05 จึงยอมรับสมมติฐานว่าง H0
สรุป
จานวนลูกค้ าเข้ ามาใช้ บริการในธนาคารมีการแจกแจงปั วส์ซอ ง โดยมีคา่ เฉลี่ยเท่ากับ 5
คนต่อช่วงเวลา 10 นาที ที่ระดับนัยสาคัญ 0.05
108

4.2.3 การทดสอบการแจกแจงปกติ (Normal Distribution)


สมมติฐาน
H0: ประชากรมีการแจกแจงปกติ
H1: ประชากรไม่ได้ มีการแจกแจงปกติ

ทังนี
้ ้ค่าความถี่คาดหมาย Ei เป็ นผลคูณระหว่างความน่าจะเป็ นของกลุม่ i กับจานวน
ตัวอย่าง หากข้ อมูลยังไม่ได้ จดั กลุม่ ต้ องดาเนินการจัดกลุม่ ก่อน การหาความน่าจะเป็ นแต่ละกลุม่
จะเป็ นการหาพื ้นที่ภายใต้ โค้ งปกติ โดยอาศัยการหาค่ามาตรฐาน (Z) และพื ้นที่ภายใต้ โค้ งของการ
แจกแจงปกติมาตรฐาน ด้ วยสูตร

x 
Z= 

ตัวอย่ างที่ 6 การศึกษาการแจกแจงความน่าจะเป็ นของความสูงของนักเรี ยนชายในโรงเรี ยนแห่ง


หนึง่ โดยมีข้อมูลความสูงของตัวอย่างนักเรี ยนชาย 40 คน ดังนี ้

ความสูง (ซม.) จานวน


118 – 126 3
127 – 135 5
136 – 144 9
145 – 153 12
154 – 162 5
163 – 171 4
172 – 180 2
รวม 40

จงทดสอบว่าความสูงของนักเรี ยนชายในโรงเรี ยนแห่งนี ้มีการแจกแจงปกติด้วยค่าเฉลี่ย


เท่ากับ 146.975 และส่วนเบี่ยงเบนมาตรฐานเป็ น 1000 บาท หรื อไม่ ที่ระดับนัยสาคัญ 0.10
109

สมมติฐาน
H0: ความสูงของนักเรี ยนชายมีการแจกแจงปกติด้วยค่าเฉลี่ย 146.975 และส่วนเบี่ยงเบน
มาตรฐาน 13.896
H1: ความสูงของนักเรี ยนชายไม่ได้ มีแจกแจงปกติด้วยค่าเฉลี่ย 146.975 และส่วน
เบี่ยงเบนมาตรฐาน 13.896
แบ่งพื ้นที่ใต้ โค้ งปกติออกเป็ น 7 ช่วงตามกลุม่ ความสูง โดยใช้ คา่ ขอบเขตบนของชันเป็
้ นจุด
แบ่งกลุม่ ดังภาพ

x
135.5

144.5

153.5

162.5
126.5

171.5
x 
คานวณค่ามาตรฐาน Z จากสูตร Z = 
126 .5  146 .975 135 .5  146 .975
Z1 = 13.896 = - 1.47 Z2 = 13.896 = - 0.83
144 .5  146 .975 153 .5  146 .975
Z3 = 13.896 = - 0.18 Z4 = 13.896 = 0.47
162 .5  146 .975 171 .5  146 .975
Z5 = 13.896 = 1.12 Z6 = 13.896 = 1.76
อาศัยค่ามาตรฐาน Z ที่คานวณได้ อ่านค่าความน่าจะเป็ นแต่ละช่วงจากตารางการแจก
แจงความน่าจะเป็ นปกติมาตรฐาน

.0708 .1325 .2253 .2522 .1878 .0922 .0392


Z
- 0.18
- 0.83
- 1.47

1.12

1.76
0.47

ความถี่คาดหมายแต่ละช่วง เป็ นผลคูณระหว่างความน่าจะเป็ นและจานวนตัวอย่าง ดังนี ้


E1 = (0.0708)(40) = 2.832 E2 = (0.1325)(40) = 5.3
E3 = (0.2253)(40) = 9.012 E4 = (0.2522)(40) = 10.088
E5 = (0.1878)(40) = 7.512 E6 = (0.0922)(40) = 3.688
E7 = (0.0392)(40) = 1.568
110

กลุม่ ความสูง ขอบเขต ความถี่สงั เกต ความถี่คาดหมาย


i Oi Ei
ต่ากว่า 127 ต่ากว่า 126.5 3 2.832
127 – 135 126.5 – 135.5 5 5.300
136 – 144 135.5 – 144.5 9 9.012
145 – 153 144.5 – 153.5 12 10.088
154 – 162 153.5 – 162.5 5 7.512
163 – 171 162.5 – 171.5 4 3.688
สูงกว่า 171 สูงกว่า 171.5 2 1.568
รวม 40 40

จากเงื่อนไข ความถี่คาดหมาย (Ei) แต่ละกลุม่ ต้ องมีคา่ ไม่ต่ากว่า 5 กรณีกลุม่ ใดมีความถี่


คาดหมายต่ากว่า 5 ให้ ยบุ รวมกับกลุม่ ที่อยูต่ ดิ กัน ดังนี ้
ยุบชันแรก
้ รวมกับ ชันที
้ ่2
ยุบชันที
้ ่ 6 รวมกับ ชันที
้ ่7

กลุม่ ความสูง ขอบเขต ความถี่สงั เกต ความถี่คาดหมาย


i fi Ei
ต่ากว่า 135 ต่ากว่า 135.5 8 8.132
136 – 144 135.5 – 144.5 9 9.012
145 – 153 144.5 – 153.5 12 10.088
154 – 162 153.5 – 162.5 5 7.512
สูงกว่า 162 สูงกว่า 162.5 6 5.256
รวม 40 40

2 k (O  E ) 2
 =  i i
i1 Ei
(8  8.132 ) 2 (9  9.012 ) 2 (12  10.088 ) 2 (5  7.512 ) 2 (6  5.256 ) 2
= 8.132 + 9.012 + 10.088 + 7.512 + 5.256
= 1.3099
111

องศาเสรี df = k– 1 = 5 – 1 = 4

ค่าวิกฤต
2

0.10
(df = 4) มีคา่ เท่ากับ 7.7794
ค่าสถิติ  2 <  02.05 จึงยอมรับสมมติฐานว่าง H0
สรุป
ความสูงของนักเรี ยนชายโรงเรี ยนแห่งนี ้มีการแจกแจงปกติด้วยค่าเฉลี่ย 146.975 และ
ส่วนเบี่ยงเบนมาตรฐาน 13.896 ที่ระดับนัยสาคัญ 0.10

4.3 การทดสอบความเป็ นอิสระ (Test of Independence)


เป็ นการทดสอบเมื่อข้ อมูลที่ต้องการทดสอบเป็ นข้ อมูลคุณภาพหรื อข้ อมูลเชิงกลุม่ ที่มี 2
ตัวแปร โดยทาการทดสอบความเป็ นอิสระระหว่างตัวแปรทังสอง ้ จานวนลักษณะของตัวแปรที่ 1
แทนด้ วยจานวนแถว r และจานวนลักษณะของตัวแปรที่ 2 แทนด้ วยจานวนสดมภ์ c
สมมติฐานในการทดสอบคือ
H0: ตัวแปรที่ 1 กับ ตัวแปรที่ 2 เป็ นอิสระจากกัน
H1: ตัวแปรที่ 1 กับ ตัวแปรที่ 2 ไม่เป็ นอิสระจากกัน
หรื อ
H0: ตัวแปรที่ 1 กับ ตัวแปรที่ 2 ไม่สมั พันธ์กนั
H1: ตัวแปรที่ 1 กับ ตัวแปรที่ 2 สัมพันธ์กนั กัน
สถิตสิ าหรับการทดสอบ คือ

2
2 r c (Oij  E ij )
 = 
i1j1 E ij

โดยมีองศาเสรี df = (r - 1)(c – 1)
ค่า Eij คานวณได้ จาก
Orow i O col j
Eij =
n
112

Oij คือ ความถี่คา่ สังเกตในแถว i สดมภ์ j


Eij คือ ความถี่คาดหมายในแถว i สดมภ์ j ภายใต้ ข้อสมมุติ H0 เป็ นจริง
Orow i คือ ความถี่คา่ สังเกตรวมของแถว i
Ocol j คือ ความถี่คา่ สังเกตรวมของสดมภ์ j
r คือ จานวนแถว
c คือ จานวนสดมภ์

ตัวอย่ างที่ 7 ฝ่ ายวิจยั ของธนาคารแห่งหนึง่ ต้ องการทดสอบเพศของผู้ใช้ บตั รเครดิตกับชนิดของ


บัตรเครดิต ว่าเป็ นอิสระกันหรื อไม่ ที่ระดับนัยสาคัญ 0.05 จึงสุม่ ตัวอย่างลูกค้ าที่ใช้ บตั รเครดิตมา
1,078 คน แยกตามเพศและชนิดของบัตรเครดิตดังนี ้
ชนิดของบัตรเครดิต
เพศ บัตรในประเทศ บัตรต่างประเทศ ทังในและต่ ้ างประเทศ รวม
ชาย 128 66 137 331
หญิง 295 165 287 747
รวม 423 231 424 1,078
วิธีทา
1. ตังสมมติ
้ ฐาน
H0: เพศของผู้ใช้ บตั รเครดิตเป็ นอิสระกับชนิดของบัตรเครดิต
H1: เพศของผู้ใช้ บตั รเครดิตไม่เป็ นอิสระกับชนิดของบัตรเครดิต
2. ระดับนัยสาคัญ
 = 0.05

3. คานวณความถี่คาดหมาย
Orow i O col j (331)(423)
จาก Eij = ดังนัน้ E11 = = 129.88
n 1,078
(331)(231)
E12 = = 70.93
1,078
(331)(424)
E13 = = 130.19
1.078
(747)(423)
E21 = = 293.12
1,078
113

(747)(231)
E22 = = 160.07
1,078
(747)(424)
E23 = = 293.81
1,078

ตารางความถี่คาดหมาย มีดงั นี ้
ชนิดของบัตรเครดิต
เพศ บัตรในประเทศ บัตรต่างประเทศ ทังในและต่
้ างประเทศ รวม
ชาย 129.88 70.93 130.19 331
หญิง 293.12 160.07 293.81 747
รวม 423 231 424 1,078

4. สถิตทิ ี่ใช้
2 r c (Oij  eij ) 2
 cal = 
i1 j1 eij
(128  129.88)2 (66  70.93)2 (137  130.19)2
= + + +
129.88 70.93 130.19
(295  293.12)2 (165  160.07)2 (287  293.81)2
+ +
293.12 160.07 293.81
= 0.78
5. เปิ ดตารางหาค่าวิกฤต
df = (r – 1)(c – 1) = (2 – 1)(3 – 1)
= (1)(2) = 2
0.78 2
 tab = 2
 0.05,2 = 5.99

2
5.99 
 ยอมรับสมมติฐานว่าง H0
6. สรุปผล
เพศของผู้ใช้ บตั รเครดิตเป็ นอิสระกับชนิดของบัตรเครดิต ที่ระดับนัยสาคัญ 0.05
114

แบบฝึ กหัดท้ ายบทที่ 4


1. บริษัทนมเวียงพิงค์ทาการศึกษาการบริโภคนมของกลุม่ โรงเรี ยนอนุบาลในเขตจังหวัดเชียงใหม่
200 แห่ง พบว่ามียอดบริโภคนมเฉลี่ย 78 ลิตร/วัน ส่วนเบี่ยงเบนมาตรฐานเท่ากับ 9 โดยมีการแจก
แจงความถี่ดงั นี ้
จานวนนมที่บริโภค (ลิตร/วัน) 65 66 - 70 71 – 75 76 - 80 81 - 85  86
จานวนโรงเรี ยนที่สารวจ (แห่ง) 10 20 40 50 40 40
จงทาการทดสอบสมมติฐานว่าข้ อมูลมีการแจกแจงความถี่เป็ นแบบปกติหรื อไม่ ที่ระดับ
นัยสาคัญ 0.05
2. ฝ่ ายวิจยั ตลาดสนใจศึกษาพฤติกรรมการชาระเงินของลูกค้ าโทรศัพท์มือถือในสาขาทัว่ ประเทศ
ซึง่ ปกติจะมีผ้ ชู าระล่าช้ ากว่ากาหนดร้ อยละ 30 จึงทาการศึกษาข้ อมูลลูกค้ า 1,000 คน พบว่า
จานวนครัง้ ที่ชาระเงินล่าช้ า จานวนผู้ให้ ความเห็น
ไม่เคยค้ างชาระ (0) 180
1 470
2 240
3 110
รวม 1,000
จงทดสอบสมมติฐานว่าสัดส่วนการชาระเงินล่าช้ าของลูกค้ าเท่ากับ 0.4 ที่ระดับนัยสาคัญ 0.05
3. ทบวงมหาวิทยาลัยได้ กาหนดมาตรฐานของบุคลากรในมหาวิทยาลัยไว้ ดงั นี ้
อาจารย์ : นักวิจยั : ธุรการ : นักศึกษา ควรจะเป็ น 1: 5 : 10 : 24 จากการสารวจสัดส่วน
บุคลากรของ มหาวิทยาลัยพิษณุโลก จานวน 300 ชุดมีดงั นี ้ อาจารย์ : นักวิจยั : ธุรการ :
นักศึกษา เท่ากับ 1: 7 : 9 : 13 ที่ระดับนัยสาคัญ 0.05 จงทดสอบว่าอัตราส่วนการจัดบุคลากร
ของมหาวิทยาลัยพิษณุโลก เป็ นไปตามมาตรฐานทบวงมหาวิทยาลัยหรื อไม่
115

4. กองกิจการนักศึกษาวางแผนสารวจการดื่มสุราของนักศึกษา 4 คณะเพื่อรณณรงค์ ให้ ลด


อบายมุข โดยการสอบถามนักศึกษาชันปี
้ ที่ 4 เกี่ยวกับการดื่มสุรา มีรายละเอียดดังนี ้ จงทดสอบ
สมมติฐานว่านักศึกษาทัง้ 4 สาขา เคยดื่มสุราเท่ากันหรื อไม่ที่ระดับนัยสาคัญ=0.05
การดื่มสุรา
สาขา เคยดื่ม ไม่เคยดื่ม รวม
บริหารธุรกิจ 268 32 300
เศรษฐศาสตร์ 199 51 250
พืชไร่ 233 67 300
วิศวะ 267 83 350
รวม 967 233 1,200
5. สหกรณ์ร้านค้ ามหาวิทยาลัยเชียงใหม่ ทาการสารวจความคิดเห็นต่อการปรับปรุงร้ านจะมีผล
ในการตัดสินใจซื ้อสินค้ าหรื อไม่ โดยทาการสารวจนักศึกษา 3 สาขามีรายละเอียดดังนี ้
การตัดสินใจซื ้อสินค้ า
สาขา ซื ้อ ไม่ซื ้อ รวม
บริหารธุรกิจ 50 30 80
เศรษฐศาสตร์ 45 30 75
วิทยาศาสตร์ 25 20 45
รวม 120 80 200

จงทดสอบว่าที่ระดับนัยสาคัญ 0.05 การตัดสินใจซื ้อสินค้ าขึ ้นกับสาขาของนักศึกษา


หรื อไม่
6. ฝ่ ายวิจยั ตลาด บริษัทโค้ ก มีความสนใจว่าพนักงาน 2 กลุม่ จะมีประสิทธิภาพ ในการทางาน
เท่ากันหรื อไม่ ในการจัดภาชนะหีบห่อในเวลา 1 ชัว่ โมง กลุม่ ที่ 1 จัดทาได้ 60 ชุด กลุม่ ที่ 2 จัดทา
ได้ 40 ชุด ที่ระดับนัยสาคัญ 0.05 จงทดสอบ ว่าพนักงาน 2 กลุม่ มีผลการทางานเท่ากันหรื อไม่
116

7. กรมทางหลวงทาการประเมินผลทางสังคมเกี่ยวกับการสร้ างถนน 4 เลนของ


ถนนอุตรดิดถ์ – พิษณุโลก จานวน 3 กลุม่ อาชีพ ประกอบด้ วย นักศึกษา นักธุรกิจและเกษตรกร
จานวน 200 คน มีรายละเอียดดังนี ้
ความคิดเห็น อาชีพ รวม
นักศึกษา นักธุรกิจ เกษตรกร
ดี 61 36 3 100
ไม่ดี 25 60 15 100
รวม 86 96 18 200
จงทดสอบสมมุตฐิ านว่าอาชีพของผู้ใช้ ถนน กับความคิดเห็นเป็ นอิสระต่อกันหรื อไม่ ใช้
ระดับนัยสาคัญ 0.05

You might also like