Professional Documents
Culture Documents
บทที่ 1
ความรู้เบือ้ งต้ นเกีย่ วกับสถิติ
ความหมายของสถิติ (Statistics)
1. ข้อความจริ ง ตัวเลขซึ่ งได้เก็บรวบรวมไว้
2. ศาสตร์อย่างหนึ่ง
ขอบข่ ายของสถิติ
ประเภทของสถิติ
1. สถิติวิเคราะห์เชิงพรรณนา (Descriptive Statistics)
2. สถิติวิเคราะห์เชิงอนุมาน (Inferential Statistics) ศาสตร์ที่วา่ ด้วยการใช้ขอ้ มูลทางสถิติที่สุ่มมา
เป็ นตัวอย่างจากประชากรทั้งหมด ไปใช้อา้ งอิง (อนุมาน) หรื อพยากรณ์ค่าของประชากรทั้งหมด
ประโยชน์ ของสถิติกบั งานด้ านต่ างๆ
ความหมายของข้ อมูล - ข้อความจริ ง ตัวเลข
ประเภทของข้ อมูล
แบ่ งตามลักษณะของข้ อมูล
1. ข้อมูลเชิงคุณภาพ – บอกคุณภาพของลักษณะที่วดั ได้
2. ข้อมูลเชิงปริ มาณ – บอกปริ มาณของลักษณะที่วดั
2.1 ไม่ต่อเนื่อง
2.2 ต่อเนื่อง
แบ่ งตามแหล่ งทีม่ าของข้ อมูล
- ปฐมภูมิ
- ทุติยภูมิ
แบ่ งตามมาตรวัด
1. นามบัญญัติ (Nominal Scale) เป็ นการแบ่งกลุ่ม จัดประเภทสิ่ งต่างๆ โดยกำหนดเป็ น
ชื่อ หรื อรหัส เป็ นมาตรวัดที่หยาบที่สุด ไม่สามารถนำมา + , - , x และ / ทาง
คณิ ตศาสตร์ได้
2. จัดอันดับ (Ordinal Scale) เป็ นการเรี ยง หรื อจัดอันดับ ของสิ่ งที่เราศึกษา อาจกำหนด
เป็ นตัวเลข ไม่สามารถนำมา + , - , x และ / ทางคณิ ตศาสตร์ได้
3. อันตรภาค (Interval Scale) เป็ นการจำแนก เรี ยบอันดับข้อมูล และแต่ละหน่วยของ
การวัดมีค่าคงที่ ไม่มีจุดศูนย์ที่แท้จริ ง สามารถนำมา + และ - ทางคณิ ตศาสตร์ได้
4. อัตราส่ วน (Ratio Scale) เหมือนมาตรวัดอัตรภาค มีจุดศูนย์ที่แท้จริ ง สามารถนำมา
+ , - , x และ / ทางคณิ ตศาสตร์ได้
คำนิยามทางสถิติ
1. ค่าสังเกต (Observation) หมายถึง ค่าที่วดั ได้ สังเกตได้จากการทดลอง
2. ตัวแปร (Variable) หมายถึง ลักษณะที่ให้ค่าสังเกตเปลี่ยนแปลงได้หลายค่า สัญลักษณ์
ที่ใช้แทนตัวแปร แทนด้วยตัวอักษรภาษาอังกฤษตัวพิมพ์ใหญ่
2.1 ตัวแปรไม่ต่อเนื่อง (Discrete variable) เป็ นตัวแปรที่ไม่สามารถให้ค่าสังเกตได้ครบ
ทุกค่าในช่วงที่กำหนด ให้ค่าเป็ นจำนวนนับ หรื อจำนวนเต็มบวก
2
2.2 ตัวแปรต่อเนื่อง (Continuous variable) เป็ นตัวแปรที่สามารถให้คา่ สังเกตครบทุก
ค่าในช่วงที่กำหนด
3. ประชากร(Population) หมายถึงทุกหน่วยในเรื่ องที่สนใจศึกษา
3.1 ประชากรจำกัด (Finite population) สามารถนับจำนวนได้แน่นอน
3.2 ประชากรอนันต์ (Infinite population) เป็ นประชากรที่มีจำนวนมากจนไม่สามารถ
นับจำนวนที่แน่นอนได้
4. ตัวอย่าง (Sample) หมายถึง ส่ วนหนึ่ง หรื อบางส่ วน ของประชากร
5. พารามิเตอร์ (Parameter) หมายถึง ค่าที่แสดงคุณลักษณะของประชากร
6. ค่าสถิติ (Statistic) หมายถึง ค่าที่แสดงคุณลักษณะของตัวอย่าง เพื่อนำไปประมาณค่า
ของพารามิเตอร์
ตัวอย่าง
พารามิเตอร์ ค่าสถิติ ความหมาย
x ค่าเฉลี่ย
S ส่ วนเบี่ยงเบนมาตรฐาน
2
2
S ความแปรปรวน
p
สัดส่ วน
p
r ค่าสัมประสิ ทธิ์ สหสัมพันธ์
ระเบียบวิธีการทางสถิติ
เป็ นขั้นตอนการดำเนินงานทางสถิติ
1. การเก็บรวบรวมข้อมูล อาจเก็บในลักษณะข้อความหรื อตัวเลขจากประชากร ที่ตอ้ งการ มี 3 วิธี
1) การสำมะโน เป็ นการเก็บรวบรวมข้อมูลจากสมาชิกทุกหน่วยของประชากร
2) การสำรวจด้วยตัวอย่าง ทำการเก็บรวบรวมเพียงบางส่ วนของตัวอย่าง
3) การทดลอง ผูเ้ ก็บรวบรวมต้องทำการทดลองศึกษาจริ งอย่างมีระเบียบกฎเกณฑ์ ควบคุม
ปั จจัยที่ไม่เกี่ยวข้อง
2. การนำเสนอข้อมูล จัดข้อมูลที่เก็บรวบรวมมาให้อยูใ่ นลักษณะเข้าใจง่าย เช่น บทความ ตาราง
กราฟเส้นและแผนภูมิต่างๆ
3. การวิเคราะห์ขอ้ มูล แบ่งเป็ น
การวิเคราะห์ขอ้ มูลขั้นต้น ซึ่ งจะใช้สถิติวิเคราะห์เชิงพรรณนา
การวิเคราะห์ขอ้ มูลขั้นสูง ซึ่ งจะใช้สถิติวิเคราะห์เชิงอนุมาน
4. การตีความหมายข้อมูล ทำการแปลผล แปลความหมายของข้อมูล ตลอดจนทำการสรุ ปผล
N N N N
2. ( Xi Yi Zi ) Xi Yi Zi
i 1 i 1 i 1 i 1
3
N N
3. C Xi C Xi เมื่อ C เป็ นค่าคงที่ใดๆ
i 1 i 1
N
4. C NC เมื่อ C เป็ นค่าคงที่ใดๆ
i 1
ตัวอย่ างที่ 1
X1 5 , X2 3 , X3 2
กำหนดให้
Y1 3 , Y2 1 , Y3 9
จงหาค่าของ
3 3 3
1. Xi , Yi 5. Xi Yi
i 1 i 1 i 1
3 3 2
2. Xi2 , Yi2 6. (2 Xi Xi Yi )
i 1 i 1 i 1
3 2
3. 3 Xi 7. 3( Xi 6 Yi )
i 1 i 1
3 3
4. (5 Xi 6 ) 8. (7 Xi2 10 Yi )
i 1 i 1
เมื่อ fi แทนความถี่ในชั้นที่ i
Xi แทนจุดกลางชั้นที่ i
k แทนจำนวนชั้น
N , n แทนจำนวนข้อมูลทั้งหมดของประชากรและตัวอย่าง ตามลำดับ
รวม 100
จงคำนวณหาความสูงโดยเฉลี่ยของเด็กแรกเกิดทั้ง 100 คน
วิธีทำ
5
fiXi (5 * 61 ) (18 * 64 ) ( 42 * 67 ) ( 27 * 70 ) ( 8 * 73 )
i 1
100 100
305 1152 2814 1890 584
100
6745
100
67.45
คุณสมบัติของค่าเฉลีย่ เลขคณิต
1. ในข้อมูลแต่ละชุดที่เป็ นตัวเลข หาค่าเฉลี่ยเลขคณิ ตได้เสมอ และมีได้เพียงค่าเดียวเท่านั้น
2. ถ้าข้อมูลมีค่าสูงหรื อต่ำเกินไปจากค่าอื่นๆ การคำนวณค่าเฉลี่ยเลขคณิ ตจะไม่เหมาะสม
3. หาค่าเฉลี่ยเลขคณิ ตได้เมื่อทราบค่าทุกค่าของข้อมูล
N
4. ค่าของ ( Xi ) 0
i 1
N
5. ค่าของ ( Xi ) 2 จะมีค่าน้อยสุ ด
i 1
การวัดการกระจายของข้ อมูล
1. พิสัย (Range) เป็ นการวัดการกระจายของข้อมูลอย่างหยาบๆ
1.1 กรณี ขอ้ มูลไม่ได้แจกแจงความถี่ (Ungrouped Data)
พิสยั = ค่าสูงสุ ดของข้อมูล – ค่าต่ำสุ ดของข้อมูล
1.2 กรณี ขอ้ มูลที่มีการแจกแจงความถี่ (Grouped Data)
พิสยั = ขอบเขตบนของชั้นที่มีคา่ สู งสุ ด – ขอบเขตล่างของชั้นที่มีคา่ ต่ำสุ ด
2. การหาค่าส่ วนเบี่ยงเบนมาตรฐาน (Standard Deviation : )
แบ่งเป็ น 2 กรณี
2.1 กรณี ขอ้ มูลไม่ได้แจกแจงความถี่ (Ungrouped Data)
ประชากร ตัวอย่าง
N n
( Xi ) 2 ( Xi X) 2
i 1 i 1
2 S2
N n 1
N n
N
( Xi ) 2 n
( Xi ) 2
Xi2 i 1
N
Xi2 i 1
n
i 1 i 1
N n 1
N n n
Xi2 n Xi2 ( Xi ) 2
i 1 i 1 i 1
2
N n (n 1)
2 S S2
ประชากร ตัวอย่าง
7
k k
fi ( Xi ) 2 fi ( Xi X) 2
i 1 i1
2 S2
N n 1
k k
k
( fi Xi ) 2 k
( fi Xi ) 2
fi Xi2 i 1
N
fi Xi2 i 1
n
i 1 i 1
N n 1
k k k
fi Xi2 n fi Xi2 ( fi Xi ) 2
i 1 i 1 i 1
2
N n ( n 1)
2 S S2
เมื่อ fi แทนความถี่ในชั้นที่ i
Xi แทนจุดกลางชั้นที่ i
k แทนจำนวนชั้น
N , n แทนจำนวนข้อมูลทั้งหมดของประชากรและตัวอย่าง ตามลำดับ
รวม 40
41
5
fi Xi2
i1
2 2
40
( 2 * 900 ) ( 8 * 1225 ) (15 * 1600 ) (10 * 2025 ) (5 * 2500 )
( 41 ) 2
40
1800 9800 24000 20250 12500
1681
40
68350
- 1681 27.75
40
27 . 75 5.268
คุณสมบัติของส่ วนเบี่ยงเบนมาตรฐาน
1. ส่ วนเบี่ยงเบนมาตรฐานจะมีค่าเป็ นบวกเสมอ
2. ถ้าข้อมูลชุดหนึ่งมีค่าสังเกตเท่ากันหมด แสดงว่าไม่มีการกระจายของข้อมูล จะมีส่วนเบี่ยง
เบนมาตรฐานเท่ากับ 0
3. ถ้าค่าของส่ วนเบี่ยงเบนมาตรฐานมีคา่ มาก แสดงว่าข้อมูลมีการกระจายมาก
ถ้าค่าของส่ วนเบี่ยงเบนมาตรฐานมีคา่ น้อย แสดงว่าข้อมูลมีการกระจายน้อย
9
4. ถ้านำค่าคงที่ไปบวกหรื อลบกับค่าสังเกตทุกค่าในข้อมูลชุดเดิม ค่าของส่ วนเบี่ยงเบน
มาตรฐานของข้อมูลชุดใหม่จะเท่ากับส่ วนเบี่ยงเบนมาตรฐานของข้อมูลชุดเดิม
1
5. ถ้านำค่าคงที่ไปคูณ กับค่าสังเกตทุกค่าในข้อมูลชุดเดิม ด้วย m หรื อ m เมื่อ m 0
1
ค่าของส่ วนเบี่ยงเบนมาตรฐานของข้อมูลชุดใหม่จะเท่ากับ m เท่าหรื อ m เท่าของ
ส่ วนเบี่ยงเบนมาตรฐานของข้อมูลชุดเดิม ค่าความแปรปรวนของข้อมูลชุดใหม่จะเป็ น
1
m2 เท่า หรื อ m 2 เท่าของความแปรปรวนชุดเดิม
3. สั มประสิทธิ์การกระจายของส่ วนเบี่ยงเบนมาตรฐานหรือสั มประสิทธิ์ความผันแปร
(Coefficient of Standard Deviation : Coeff.S.D. or Coefficient of Variation : C.V. )
ส่วนเบี่ยงเบนมาตรฐาน
C. V. 100
ค่าเฉลี่ย
100
S
100
X
อยากทราบว่านายประเวชเรี ยนวิชาใดได้ดีกว่ากัน
วิธีทำ
42 40
คะแนนมาตรฐานของวิชาคณิ ตศาสตร์ ( Z ) = 12
0.167
58 60
คะแนนมาตรฐานของวิชาสังคม ( Z ) = 7
- 0.286
48 55
คะแนนมาตรฐานของวิชาเคมี ( Z ) = 10
- 0.70
ตัวอย่ างที่ 9 นาย ก นาย ข และนาย ค ทดสอบวิ่งในระยะทางต่างกัน คือ 200, 400 และ 800
เมตร ตามลำดับ ใช้เวลาในการวิ่งเท่ากับ 48 , 70 และ 110 ตามลำดับ ข้อมูลได้ดงั นี้
70 68
คะแนนมาตรฐานของนาย ข ( Z ) = 20
0.4472
110 115
คะแนนมาตรฐานของนาย ค ( Z ) = 25
-1
เนื่องจาก ค่า Z ของนาย ค มีคา่ น้อยสุ ด จึงสรุ ปได้วา่ นาย ค วิ่งได้ดีที่สุด รองลงมาคือ นาย ข
และนาย ก
จงหา 1) หาค่าเฉลี่ยเลขคณิ ต
2) ส่ วนเบี่ยงเบนมาตรฐาน 3) สัมประสิ ทธิ์ ของการแปรผัน
X i
2
110 Y i
2
1250
i 1 และ i 1
10 10
X i 30 Y i 110
i 1 และ i 1
จงหาว่าราคาสิ นค้าชนิดใดมีการกระจายมากกว่ากัน
ข้ อที่ 7 คะแนนสอบวิชาสถิติของนิสิตกลุ่มหนึ่งมีเส้นโค้งความถี่เป็ นเส้นโค้งเบ้ทางซ้ายมือ โดย
นิสิตส่ วนมากสอบได้คะแนนเท่ากันคือ 75 คะแนน สมชายสอบได้คะแนนเท่ากับค่า
เฉลี่ยเลขคณิ ตของคะแนนสอบของนิสิตทั้งกลุ่มซึ่ งคะแนนสอบของสมชายต่างจาก
ฐานนิยมของคะแนนสอบอยู่ 6 คะแนน จงหามัธยฐานของคะแนนสอบวิชาสถิติของนิสิต
กลุ่มนี้
ข้ อที่ 8 ในการสอบแข่งขันชิงทุนการศึกษา ปรากฏว่ามีผเู ้ ข้าสอบ 1,000 คน ในจำนวนนี้มีนกั เรี ยน
ชาย 600 คน ส่ วนที่เหลือเป็ นนักเรี ยนหญิง ผลปรากฏว่าค่าเฉลี่ยเลขคณิ ตของคะแนนสอบ
ของนักเรี ยนชายและหญิงเท่ากัน คือ 50 คะแนน ส่ วนเบี่ยงเบนมาตรฐานของคะแนนสอบ
ของนักเรี ยนชายและหญิงเท่ากับ 1.5 และ 1 คะแนน ตามลำดับ จงหาสัมประสิ ทธิ์ ของ
การแปรผันของคะแนนสอบทั้งหมด
ข้ อที่ 9 ในการสอบวิชาคณิ ตศาสตร์ของนักเรี ยน 10 คน ปรากฏผลว่าค่าเฉลี่ยเลขคณิ ตของ
คะแนนสอบเท่ากับ 73 คะแนน ถ้าเราทราบคะแนนสอบของนักเรี ยน 8 คนว่ามีคะแนน
ดังนี้ 58 , 62 , 79 , 85 , 61 , 62 , 95 , 90 ส่ วนคะแนนของนักเรี ยนอีก 2 คนหายไป และ
ทราบว่าผลต่างของคะแนนเท่ากับ 8 คะแนน มัธยฐานของคะแนนสอบของนักเรี ยนทั้ง
10 คน มีค่าเท่ากับเท่าไร
ข้ อที่ 10 ในการชัง่ น้ำหนักเด็กกลุ่มหนึ่ง คำนวณค่าเฉลี่ยเลขคณิ ตได้เท่ากับ 20 กิโลกรัม และ
ส่ วนเบี่ยงเบนมาตรฐานได้เท่ากับ 3 กิโลกรัม ต่อมาทราบว่าเครื่ องชัง่ น้ำหนักนั้นให้คา่
ต่ำกว่าที่เป็ นจริ ง นัน่ คือ น้ำหนักที่ถูกต้องของเด็กแต่ละคนมากกว่าน้ำหนักที่ชงั่ ได้ร้อย
ละ 10 ดังนั้นค่าส่ วนเบี่ยงเบนมาตรฐานที่ถูกต้องของน้ำหนักของเด็กกลุ่มนี้เท่ากับเท่าไร
ข้ อที่ 11 จำนวนผลิตต่อชัว่ โมงของเครื่ องจักรใหม่จะเป็ น 4 เท่าของเครื่ องจักรเก่า ถ้าค่าเฉลี่ย
เลขคณิ ต และส่ วนเบี่ยงเบนมาตรฐานของจำนวนผลผลิตต่อชัว่ โมงของเครื่ องจักรเก่า ซึ่ ง
ทำการผลิตในช่วงเวลา 10 ชัว่ โมง มีค่าเป็ น 20 และ 4 หน่วย ตามลำดับแล้ว ค่าเฉลี่ย
เลขคณิ ตและค่าความแปรปรวนของจำนวนผลผลิต ต่อ ชัว่ โมงของเครื่ อ งจักรใหม่ซ่ ึ ง
ทำการผลิตในช่วงเวลา 10 ชัว่ โมงคือเท่าใด
ข้ อที่ 12 จากข้อมูลต่อไปนี้
ชุดที่ 1 2 3 6 8 5 9
ชุดที่ 2 3 7 9 4 7 5
13
หลักสถิติหลักสถิติหลักสถิติหลักสถิติหลักสถิติหลักสถิติหลักสถิติหลักสถิติหลักสถิติหลักสถิติ