You are on page 1of 44

หน่วยที่ 6

การตรวจสอบคุณภาพเครือ
่ งมือ

สำนักทดสอบทางการ
ศึกษา สพฐ.
1
การวิเคราะห์คณ
ุ ภาพแบบทดสอบ
1. คุณล ักษณะของแบบทดสอบทีด
่ ี

2. วิธก
ี ารวิเคราะห์แบบทดสอบ

ี ารวิเคราะห์โดยไม่ใชว้ ธ
2.1 วิธก ิ ก
ี ารทางสถิต ิ

ี ารวิเคราะห์โดยใชว้ ธ
2.1 วิธก ิ ก
ี ารทางสถิต ิ

1) การวิเคราะห์คณ
ุ ภาพข้อสอบรายข้อ

2) การวิเคราะห์คณ
ุ ภาพข้อสอบทงฉบ
ั้ ับ
1. คุณล ักษณะของแบบทดสอบทีด
่ ี

1. ความตรง/ความเทีย
่ งตรง (validity)

2. ความเทีย ื่ มน
่ ง/เชอ ่ ั (reliability)

3. ความยากง่าย (difficulty)

4. อำนาจจำแนก (discrimination )

5. เป็นปรน ัย (objectivity)
1.1 ความตรง/เทีย
่ งตรง (Validity)

ความถูกต้องแม่นยำของเครือ ่ งมือในการว ัด
สงิ่ ทีต
่ อ
้ งการจะว ัด

ประเภทของความเทีย
่ งตรง
้ หา (Content Validity)
1. ความตรงตามเนือ
้ หาของเครือ
เนือ ่ งมือ หรือเนือ ้ หาของข้อคำถามว ัดได้ตรง
ตามประเด็นหรือต ัวชวี้ ัดทีต
่ อ
้ งการว ัดหรือไม่?
2. ความตรงเชงิ โครงสร้าง (Construct Validity)
เครือ
่ งมือนนสามารถว
ั้ ัดได้ครอบคลุมขอบเขต ความหมาย
หรือครบตามคุณล ักษณะประจำตามทฤษฎีทใี่ ชส ้ ร้าง
เครือ่ งมือหรือไม่?
1.1 ความตรง/เทีย
่ งตรง (Validity)

ประเภทของความตรง (ต่อ)
ั ันธ์ (Criterion-related
3. ความตรงตามเกณฑ์สมพ
Validity) เครือ
่ งมือว ัดได้ตรงตามสภาพทีต ่ อ
้ งการว ัด โดย
พิจารณาจากเกณฑ์ทเี่ กีย ่ วข้องว่าเครือ
่ งมือนนจะใช
ั้ ้ นาย
ทำ
พฤติกรรมของบุคคลในสภาพเฉพาะเจาะจงตามต้องการหรือ
ไม่? จำแนกได้ 2 ชนิด คือ

3.1 ความตรงร่วมสม ัยหรือตามสภาพทีเ่ ป็นจริง


(Concurrent Validity) สอดคล้องก ับสภาพความเป็น
จริงในปัจจุบ ัน
3.2 ความตรงเชงิ ทำนาย (Predictive Validity)
สอดคล้องก ับสภาพความเป็นจริง หรือสภาพความ
สำเร็จในอนาคต
1.2 ความเทีย ื่ มน
่ ง/เชอ ่ ั (Reliability)

ความคงทีห
่ รือความคงเสน้ คงวาของผลที่
ได้จากการว ัด
วิธก
ี ารประมาณค่าความเทีย
่ ง
1. การว ัดความคงที่ (Measure of Stability)
2. การว ัดความสมมูลก ัน หรือเท่าเทียมก ัน (Measure of Equivalence)
3. การว ัดความคงทีแ
่ ละความเท่าเทียมก ัน (Measure of Stability and
Equivalence)
4. การว ัดความสอดคล้องภายใน (Measure of Internal
Consistency)
4.1 วิธแ
ี บ่งครึง่ ข้อสอบ (Split-half)
4.2 วิธข
ี อง Kuder-Richardson (Kr20 , Kr21)
4.3 วิธส ั
ี มประส ิ ธ์แอลฟาของ Cronbach (Cronbach’s alpha ()

1.2 ความเทีย ื่ มน
่ ง/เชอ ่ ั (Reliability)

วิธป
ี ระมาณค่า Measure of Stability
1) การว ัด ความหมาย
ความคงที่ ความคงเสน ้ คงวาของคะแนนจากการว ัดในชว ่ งเวลาทีต่ า่ ง
2) การว ัดความ ี อบซ้ำด้วยแบบสอบฉบ ับเดิม (test-retest
ก ันโดยวิธส
เท่าเทียมก ัน
method)
3) การว ัดความ วิธปี ระมาณค่า
คงทีแ่ ละความ
เท่าเทียมก ัน

คำนวณค่าสมประส ิ ธิส
ท ั ันธ์ระหว่างคะแนนทีว่ ัดได้
์ หสมพ
จากคนเดียวก ันด้วยเครือ ่ งมือเดียวก ัน โดยทำการว ัดซ้ำสอง
4) การว ัดความ
สอดคล้อง
ครงในเวลาที
ั้ ต
่ า่ งก ัน
ภายใน
1.2 ความเทีย ื่ มน
่ ง/เชอ ่ ั (Reliability)

วิธป
ี ระมาณค่า Measure of Equivalence
1) การว ัดความ ความหมาย
คงที่ ความสอดคล้องก ันของคะแนนจากการว ัดในชว ่ งเวลา
2) การว ัดความ เดียวก ันโดยใชแ ้ บบสอบทีส ่ มมูลก ันหรือเท่าเทียมก ัน
เท่าเทียมก ัน (equivalence-form method)
3) การว ัดความ วิธป
ี ระมาณค่า
คงทีแ่ ละความ
เท่าเทียมก ัน

คำนวณค่าสมประส ิ ธิส
ท ์ หสมพั ันธ์ระหว่างคะแนนทีว่ ัดได้
ในเวลาเดียวก ันจากคนกลุม ่ เดียวก ัน โดยใชเ้ ครือ
่ งมือ 2
4) การว ัดความ
สอดคล้อง
ฉบ ับทีท
่ ัดเทียมก ัน
ภายใน
1.2 ความเทีย ื่ มน
่ ง/เชอ ่ ั (Reliability)

วิธป
ี ระมาณค่า Measure of Stability and Equivalence
1) การว ัดความ ความหมาย
คงที่ ความสอดคล้องก ันของคะแนนจากการว ัดในชว ่ งเวลาต่าง
2) การว ัดความ ก ัน โดยวิธสี อบซ้ำด้วยแบบสอบทีส ่ มมูลก ันหรือเท่าเทียมก ัน
เท่าเทียมก ัน
(test-retest with equivalence method)
3) การว ัดความ วิธปี ระมาณค่า
คงทีแ่ ละความ คำนวณค่าสมประส ั ิ ธิส
ท ั ันธ์ระหว่างคะแนนทีว่ ัดได้
์ หสมพ
เท่าเทียมก ัน
ในชว ่ งเวลาทีต่ า่ งก ันจากกลุม ่ เดียวก ัน โดยใชเ้ ครือ
่ คนกลุม ่ ง
4) การว ัดความ
สอดคล้อง
มือ 2 ฉบ ับทีท่ ัดเทียมก ัน
ภายใน
1.2 ความเทีย ื่ มน
่ ง/เชอ ่ ั (Reliability)

วิธป
ี ระมาณค่า Measure of Internal Consistency
1) การว ัดความ ความหมาย
คงที่ ความสอดคล้องก ันระหว่างคะแนนรายข้อ หรือความเป็น
2) การว ัดความ เอกพ ันธ์ของเนือ ้ หารายข้ออ ันเป็นต ัวแทนของคุณล ักษณะ
เท่าเทียมก ัน
เด่นเดียวก ันทีต่ อ้ งการว ัด
3) การว ัดความ วิธป
ี ระมาณค่า
คงทีแ่ ละความ
เท่าเทียมก ัน
มีหลายวิธ ี ได้แก่
4) การว ัดความ 1) วิธแ
ี บ่งครึง่ ข้อสอบ (Split-half)
สอดคล้อง
2) วิธข
ี อง Kuder-Richardson (KR20, KR21)
ภายใน
3) วิธส ั
ี มประสทิ ธ์แอลฟาของ Cronbach
(Cronbach’s alpha () method)
1.3 ความยากง่าย (Difficulty)

ความยากง่ายของแบบทดสอบมีความ
เหมาะสมก ับความสามารถของผูส ้ อบ
ั ว่ น หรือเปอร์เซ็นต์
ซงึ่ พิจารณาจาก สดส
ของจำนวนคนทีต ่ อบข้อสอบข้อนนถู ั้ กจาก
คนทีส ่ อบทงหมด
ั้
1.4 อำนาจจำแนก (Discrimination)

ความสามารถของข้อสอบแต่ละข้อ
ในการจำแนกคนทีอ ่ ยูใ่ นกลุม
่ เก่งออก
จากคนทีอ ่ ยูใ่ นกลุม
่ อ่อนได้
ซงึ่ พิจารณาจากผลต่างของสดส ั ว่ น
ของกลุม ่ เก่งทีต ่ อบถูกก ับกลุม ่ อ่อนที่
ตอบถูก
1.5 ความเป็นปรน ัย (Objectivity)


ความชดเจนของแบบทดสอบหรื อคำถามทีท่ ก
ุ คน
เข้าใจตรงก ัน รวมทงการตรวจให้
ั้ คะแนนมีเกณฑ์ท ี่
แน่นอน ความเป็นปรน ัย มีองค์ประกอบ 3 ประการ :
1. โจทย์หรือข้อคำถาม
2. วิธก
ี ารตรวจให้คะแนน
3. การแปลความหมายของคะแนน
การหาความเป็นปรน ัยทีน ่ ย
ิ มปฏิบ ัติก ัน คือ
ี่ วชาญพิจารณาและตรวจสอบ
ให้ผเู ้ ชย
2. วิธก
ี ารวิเคราะห์คณ
ุ ภาพแบบสอบ

2.1 การวิเคราะห์แบบสอบโดยไม่ใชว้ ธ
ิ ก
ี ารทางสถิต ิ

2.2 การวิเคราะห์แบบสอบโดยใชว้ ธ
ิ ก
ี ารทางสถิต ิ
2.1 การวิเคราะห์แบบสอบโดยไม่ใชว้ ธ
ิ ก
ี ารทางสถิต ิ

้ หา
1) การตรวจสอบความถูกต้องและครอบคลุมของเนือ
วิชาและจุดมุง
่ หมาย

แนวทางการพิจารณา
้ หาทีเ่ รียนหรือไม่
1) ข้อคำถามครบถ้วนทุกเนือ
2) จำนวนข้อคำถามของแต่ละเนือ ั ว
้ หามีสดส ่ นตาม
น้ำหน ักทีกำ
่ หนดไว้หรือไม่
3) ข้อคำถามแต่ละข้อว ัดได้ตรงตามพฤติกรรมทีร่ ะบุไว้ใน
จุดมุง
่ หมายของการสอนแต่ละเนือ้ หาหรือไม่
2.1 การวิเคราะห์แบบสอบโดยไม่ใชว้ ธ
ิ ก
ี ารทางสถิต ิ

้ หา
1) การตรวจสอบความถูกต้องและครอบคลุมของเนือ
วิชาและจุดมุง
่ หมาย

วิธดำ
ี เนินการ
ี่ วชาญในเนือ
1) ตรวจสอบโดยผูเ้ ชย ้ หาวิชานนๆ
ั้

2) ตรวจสอบโดยการเปรียบเทียบตารางกำหนดจำนวน
ข้อคำถาม (test Blueprint)
2.1 การวิเคราะห์แบบสอบโดยไม่ใชว้ ธ
ิ ก
ี ารทางสถิต ิ

2) การตรวจสอบภาษาและความสอดคล้องก ับเทคนิค
การเขียนคำถาม

แนวทางการพิจารณา
1) ข้อความทีใ่ ชเ้ ขียนเป็นข้อคำถามสามารถสอ
ื่ ความ
หมายได้ดเี พียงไร

2) การเขียนข้อคำถามนนมี
ั้ ความถูกต้องตามเทคนิคใน
การเขียนข้อคำถามทีด่ ห
ี รือไม่
2.1 การวิเคราะห์แบบสอบโดยไม่ใชว้ ธ
ิ ก
ี ารทางสถิต ิ

2) การตรวจสอบภาษาและความสอดคล้องก ับเทคนิค
การเขียนคำถาม

วิธดำ
ี เนินการ
ี่ วชาญทางด้านภาษา
1) ตรวจสอบโดยผูเ้ ชย

ี่ วชาญทางด้านว ัดผลการศก
2) ตรวจสอบโดยผูเ้ ชย ึ ษา

(ถ้าหากไม่สามารถหาผูเ้ ชย ี่ วชาญเพือ ่ ชว่ ยตรวจสอบได้


อย่างน้อยควรให้เพื
เพือ่ นครู หรือต ัวครูเองเป
เองเป็ นผูทำ
้ การตรวจ
สอบ)
2.2 การวิเคราะห์แบบสอบโดยใชว้ ธ
ิ ก
ี ารทางสถิต ิ

1) การวิเคราะห์ขอ้ สอบเป็นรายข้อ
1.1) ด ัชนีความสอดคล้องระหว่างข้อสอบก ับจุดประสงค์
(IOC-Index of Item Objective Congruence)
1.2) ค่าระด ับความยากง่าย (Difficulty Index)
1.3) ค่าอำนาจจำแนก (Discrimination Power)

2) การวิเคราะห์ขอ
้ สอบทงฉบ
ั้ ับ
2.1) ความเทีย ่ งตรง (Validity)
2.2) ความเชอื่ มน่ ั (Reliability)
1) การวิเคราะห์ขอ
้ สอบรายข้อ

1.1) ด ัชนีความสอดคล้องระหว่างข้อสอบก ับจุดประสงค์


(IOC-Index of Item Objective Congruence)

วิธดำ
ี เนินการ
ให้ผเู ้ ชยี่ วชาญตงแต่
ั้ ้ ไป ประเมินความ
3 คนขึน
สอดคล้องระหว่างข้อคำถามในเครือ ้ หาที่
่ งมือก ับเนือ
ต้องการว ัด จากนนนำผลการประเมิ
ั้ นมาคำนวณค่า IOC
โดยใชส ้ ต ู ร
R
IOC =
N
่ R แทน ผลรวมของคะแนนจากผูเ้ ชย
เมือ ี่ วชาญ

ิ IOC ควรมีคา่ มากกว่า 0.5


เกณฑ์ต ัดสน
1.1) ด ัชนีความสอดคล้องระหว่างข้อสอบก ับจุดประสงค์
(IOC-Index of Item Objective Congruence)

ต ัวอย่าง ตารางการหาค่า IOC

ผลการประเมิน
ต ัวชวี้ ัดตามมาตรฐาน ข้อสอบ
-1 0 1
ผูเ้ รียนสามารถบอกถึงหน้าที่ 1. หน้าทีข่ องใบคืออะไร?
หรือความแตกต่างของ ก. ยึดลำต้น
สว่ นประกอบต่างๆของพืชได้ ข. ดูดอาหาร

ค. สงเคราะห์ แสง
ง. ลำเลียงอาหาร
้ งคู?
2. ข้อใดเป็นพืชใบเลีย ่
ก. ข้าว
ข. อ้อย
ค. กล้วย
ง. มะเขือ

- 1 หมายถึง ไม่สอดคล ้อง 0 หมายถึง ไม่แน่ใจ 1 หมายถึง สอดคล ้อง


1.1) ด ัชนีความสอดคล้องระหว่างข้อสอบก ับจุดประสงค์
(IOC-Index of Item Objective Congruence)

ต ัวอย่าง การคำนวณหาค่า IOC

ข้อคำถาม คนที่ 1 คนที่ 2 คนที่ 3 คนที่ 4 คนที่ 5 IOC

ข้อ 1 1 1 1 0 1 4/5=0.8

ข้อ 2 1 0 -1 0 -1 -1/5=-0.2

เกณฑ์การพิจารณา ข้อสอบทีใ่ ชไ้ ด้ คือ ข้อสอบทีม


่ ค
ี า่ IOC ตงแต่
ั้ ้ ไป
.5 ขึน

สรุป...
ข้อสอบข้อ 1 มีความสอดคล้องก ับจุดมุง ่ หมายเชงิ พฤติกรรม สามารถนำ
ไปใชส้ อบได้
ข้อสอบข้อ 2 ไม่สอดคล้องก ับจุดมุง ่ หมายเชงิ พฤติกรรม ไม่ควรนำไปใช ้
ต้องต ัดทิง้ หรือปร ับปรุงใหม่
1) การวิเคราะห์ขอ
้ สอบรายข้อ

1.2) ค่าระด ับความยากง่าย (Difficulty Index)

ั ว
ระด ับความยากง่าย หมายถึง สดส ่ น หรือเปอร์เซ็นต์ของจำนวนคนที่
ตอบข้อสอบข้อนนถู ั้ กจากคนทีส ่ อบทงหมด
ั้
้ ญล
ใชส ั ักษณ์ “p”

ข้อสอบแบบปรน ัย (คะแนนแบบทวิภาค 0 ก ับ 1)

ข้อสอบแบบอ ัตน ัย (คะแนนแบบพหุภาค มากกว่า 2 ค่า)


1.2) ค่าระด ับความยากง่าย (Difficulty Index)

ค่
ค่าาความยากง่
ความยากง่าาย
ย ((Difficulty
Difficulty Index)
Index)
มี
มีคคา่ า่ ต
ตงแต่
ั้งแต่
ั้ 0.00
0.00 จนถึ
จนถึงง 1.00
1.00

เกณฑ์
เกณฑ์ใในการแปลความหมายค่
นการแปลความหมายค่าาความยากง่
ความยากง่าาย

ค่า p = 0.00-0.19 หมายความว่า ข้อสอบข้อนนยากเกิ


ั้ นไป
ค่า p = 0.20-0.39 หมายความว่า ข้อสอบข้อนนค่
ั้ อนข้างยาก
ค่า p = 0.40-0.59 หมายความว่า ข้อสอบข้อนนยากง่
ั้ ายปานกลาง
ค่า p = 0.60-0.79 หมายความว่า ข้อสอบข้อนนค่
ั้ อนข้างง่าย
ค่า p = 0.80-1.00 หมายความว่า ข้อสอบข้อนนง่
ั้ ายเกินไป

เกณฑ์
เกณฑ์:: ข้
ข้ออสอบที
สอบทีม่ม
่ ค
ีค
ี า่ า่ ความยากง่
ความยากง่าายพอเหมาะ
ยพอเหมาะ หรื
หรืออมี
มีคคณ
ุณ
ุ ภาพดี
ภาพดี

ค่า p ใกล้เคียง .50 หรือ อยูร่ ะหว่าง 0.20 – 0.80


1.2) ค่าระด ับความยากง่าย (Difficulty Index)

(1) ค่าระด ับความยากง่าย (Difficulty Index) ข้อสอบปรน ัย

R R R R
p หรือ p   100 หรือ p H L
N N N N
H L

R แทน จำนวนคนทีต่ อบข้อนนถู ั้ ก


N แทน จำนวนคนทีส ่ อบทงหมด ั้
RH แทน จำนวนคนทีต่ อบข้อนนถูั้ กในกลุม ่ สูง
RL แทน จำนวนคนทีต
่ อบข้อนนถู
ั้ กในกลุม ่ ต่ำ
NH แทน จำนวนคนในกลุม ่ สูง
NL แทน จำนวนคนในกลุม ่ ต่ำ
กลุ่มสู ง กลุ่มต่ำ
ข้ อ (RH) (RL) P
(20 คน) (20 คน)

1 ก 4 6 (6+4)/40= 0.25
ข* 9 3 (9+3)/40 = 0.3
ค 3 5 (5+3)/40= 0.2
ง 4 6 (6+4)/40= 0.25
รวม 20 20
1.2) ค่าระด ับความยากง่าย (Difficulty Index)

(2) ค่าระด ับความยากง่าย (Difficulty Index) ข้อสอบอ ัตน ัย

1. ตรวจและเรียงคะแนนรวมจากสูงสุดถึงต่ำสุด
2. แบ่งกลุม
่ สูง (H) และกลุม
่ ต่ำ (L)

ั ว
3. คำนวณสดส ่ นของคะแนนรวมรายข้อทีไ่ ด้จำแนกตามกลุม

H L
PH = —— PL = ——

H รวมคะแนนกลุ่มสู ง L รวมคะแนนกลุ่มต่ำ
TH รวมคะแนนเต็มกลุ่มสู ง TL รวมคะแนนเต็มกลุ่มต่ำ
TH TL PH + PL
4. วิเคราะห์คา่ ความยาก (p) • p = ————
2
•แบบสอบความเรียงมี 5 ข้อ แต่ละข้อคะแนนเป็ น 10,10,20,30,30 คะแนน ตามลำดับ
•ใช้สอบนักเรียน 8 คน
•ตรวจให้คะแนน และเรียงลำดับคะแนนจากมากไปน้อย (อันดับ 1-8)
•แบ่งนักเรียนเป็ น 2 กลุ่ม(เทคนิค 50%) ได้กลุ่มสูงและกลุ่มต่ำ กลุ่มละ 4 คน
•การวิเคราะห์ขอ้ สอบต้องรวมรายข้อของผูส้ อบทุกคนแต่ละกลุ่ม
ข้ อ คะแนน กลุ่มสู ง (H) (4 คน) กลุ่มต่ำ (L) (4 คน)
เต็ม 1 2 3 4 5 6 7 8

1 10 10 10 9 8 5 8 8 7
2 10 9 10 8 9 8 7 6 3
3 20 20 15 15 17 15 9 10 8
4 30 25 25 24 20 16 17 13 10
5 30 16 10 10 7 11 7 6 2
กลุ่มสู ง กลุ่มต่ำ
คะแนน (4 คน) (4 คน)
ข้ อ H
เต็ม L
เต็ม PH PL Pi
เต็ม

1 10 37 40 28 40 .93 .70 .81


2 10 36 40 24 40 .90 .60 .75
3 20 67 80 42 80 .84 .53 .68
4 30 94 120 56 120 .78 .47 .62
5 ข้30
อ1 43 120
ง่ายเกิน26 120 .36
ไป อำนาจจำแนกต่ำ .22 .29
ข้อ 2 – ข้อ 4 เป็ นข้อสอบทีใ่ ช้ได้
ข้อ 5 ค่อนข้างยาก อำนาจำแนกต่ำ
1) การวิเคราะห์ขอ
้ สอบรายข้อ

1.3) ค่าอำนาจจำแนก (Discrimination power)

อำนาจจำแนก หมายถึง ความสามารถของข ้อสอบแต่ละข ้อในการจำแนกคน


ทีอ
่ ยูใ่ นกลุม่ เก่งออกจากคนทีอ่ ยูใ่ นกลุม
่ อ่อนได ้
(ข ้อสอบทีม ่ อำ
ี นาจจำแนกดี คนเก่งจะตอบถูก แต่คนอ่อนจะ
ตอบผิด) ใชส้ ญ ั ลักษณ์ “r”

ข้อสอบแบบปรน ัย (คะแนนแบบทวิภาค 0 ก ับ 1)

ข้อสอบแบบอ ัตน ัย (คะแนนแบบพหุภาค มากกว่า 2 ค่า)


1.3) ค่าอำนาจจำแนก (Discrimination power)

ค่
ค่าาอำนาจจำแนก
อำนาจจำแนก ((Discrimination
Discrimination power)
power)
มี
มีคคา่ า่ ต
ตงแต่
ั้งแต่
ั้ -1.00
-1.00 จนถึ
จนถึงง 1.00
1.00
เกณฑ์
เกณฑ์ใในการแปลความหมายค่
นการแปลความหมายค่าาอำนาจจำแนก
อำนาจจำแนก

ค่า r = -1.00-0.19 หมายความว่า ข้อสอบข้อนนจำแนกไม่


ั้ ได้เลย
ค่า r = 0.20-0.39 หมายความว่า ข้อสอบข้อนนจำแนกได้
ั้ เล็กน้อย
ค่า r = 0.40-0.59 หมายความว่า ข้อสอบข้อนนจำแนกได้
ั้ ปานกลาง
ค่า r = 0.60-0.79 หมายความว่า ข้อสอบข้อนนจำแนกได้
ั้ ดี
ค่า r = 0.80-1.00 หมายความว่า ข้อสอบข้อนนจำแนกได้
ั้ ดมี าก

เกณฑ์
เกณฑ์:: ข้
ข้ออสอบที
สอบทีม่ม
่ ค
ีค
ี ณ
ุณ
ุ ภาพดี
ภาพดี

ค่า r ตงแต่
ั้ ้ ไป
+0.20 ขึน
1.3) ค่าอำนาจจำแนก (Discrimination power)

(1) ค่าอำนาจจำแนก ข้อสอบปรน ัย

R R
r H L
N
H
หมายเหตุ NH = N L

RH แทน จำนวนคนทีต
่ อบข้อนนถู ั้ กในกลุม ่ สูง
RL แทน จำนวนคนทีต่ อบข้อนนถู ั้ กในกลุม่ ต่ำ
NH แทน จำนวนคนในกลุม ่ สูง
NL แทน จำนวนคนในกลุม ่ ต่ำ

ค่า r มีคา่ ตงแต่


ั้ -1 จนถึง +1 เกณฑ์การพิจารณา คือ r มีคา่ ตงแต่
ั้ ้ ไป
.2 ขึน
เป็นลบ เมือ ่ คนกลุม ่ อ่อนตอบถูกมากกว่าคนกลุม่ เก่ง
เป็นบวก เมือ ่ คนกลุม
่ เก่งตอบถูกมากกว่าคนกลุม
่ อ่อน
กลุ่มสู ง กลุ่มต่ำ
ข้ อ (RH) (RL) r
(20 คน) (20 คน)

1 ก 4 6 (6 – 4)/20 =0.1
ข* 9 3 (9 - 3)/20 = 0.3
ค 3 5 (5 – 3)/20 =0.1
ง 4 6 (6 – 4)/20 =0.1
รวม 20 20
1.3) ค่าอำนาจจำแนก (Discrimination power)

(2) ค่าอำนาจจำแนก ข้อสอบอ ัตน ัย

1. ตรวจและเรียงคะแนนรวมจากสูงสุดถึงต่ำสุด
2. แบ่งกลุม
่ สูง (H) และกลุม
่ ต่ำ (L)

ั ว
3. คำนวณสดส ่ นของคะแนนรวมรายข้อทีไ่ ด้จำแนกตามกลุม

H
PH = —— L
PL = ——

H รวมคะแนนกลุ่มสู ง L รวมคะแนนกลุ่มต่ำ
TH รวมคะแนนเต็มกลุ่มสู ง TL รวมคะแนนเต็มกลุ่มต่ำ
TH TL
4. วิเคราะห์คา่ อำนาจจำแนก (r) • r = PH – PL
กลุ่มสู ง กลุ่มต่ำ
คะแนน (4 คน) (4 คน)
ข้ อ H
เต็ม L
เต็ม PH PL ri
เต็ม

1 10 37 40 28 40 .93 .70 .23


2 10 36 40 24 40 .90 .60 .30
3 20 67 80 42 80 .84 .53 .31
4 30 94 120 56 120 .78 .47 .31
5 ข้30อ 1 43 120
ง่ายเกิน26 120 .36
ไป อำนาจจำแนกต่ำ .22 .14
ข้อ 2 – ข้อ 4 เป็ นข้อสอบทีใ่ ช้ได้
ข้อ 5 ค่อนข้างยาก อำนาจำแนกต่ำ
เกณฑ์ในการสรุปว่าข้อสอบมีคณ
ุ ภาพดี

ข้อสอบข้อนนต้
ั้ องมีคา่ ความยากง่าย และค่า อำนาจจำแนกเป็นไปตามเกณฑ์ทกำ
ี่ หนด

ข้อ ต ัวเลือก กลุม


่ สูง กลุม
่ ต่ำ p r ความหมาย สรุป
ที่ (H=20) (L=20)

ก 3 4 7/40 = 0.18 (4-3)/20 = 0.05

(ข) 13 6 19/40 = 0.48 (13-6)/20=0.35 ยากง่ายปานกลาง ใชไ้ ด้

1 ค - 3 3/40 = 0.08 (3-0)20 = 0.15

ง 2 4 6/40 = 0.15 (4-2)/20 = 0.10

จ 2 3 5/40 = 0.13 (3-2)/20 = 0.05

เกณฑ์: ต ัวถูก เกณฑ์: ต ัวลวง


p = 0.20 – 0.80 p = 0. 05 – 0.50
r = +0.20 ขึน ้ ไป r = 0. 05 – 0.50
การคัดเลือกข ้อสอบทีม
่ ค
ี ณ
ุ ภาพ
1
ค่าความยากง่
าย (p)
.9 4

.8
.7
เกณฑ์: ข้อสอบทีม่ ค
ี ณ
ุ ภาพ .6
p = 0.20 – 0.80
้ ไป
r = +0.20 ขึน .5
.4 1

3 .3
.2
2 .1 5
ค่าอำนาจจำแนก (r)

- -. -. -. -. -. -. -. -. -. 0 .1 .2 .3 .4 .5 .6 .7 .8 .9 1
2) การวิเคราะห์ขอ
้ สอบทงฉบ
ั้ ับ

2.1) ความเทีย
่ งตรง (Validity)

วิธก ่ งตรงเชงิ เนือ


ี ารตรวจสอบความเทีย ้ หา
ี่ วชาญตงแต่
ให้ผเู ้ ชย ั้ 3 คนขึน้ ไป ประเมินความสอดคล้อง
ระหว่างข้อคำถามในเครือ ้ หาทีต
่ งมือก ับเนือ ่ อ
้ งการว ัด จากนนนำ
ั้
ผลการประเมินมาคำนวณด ัชนีความสอดคล้องระหว่างข้อคำถาม
และว ัตถุประสงค์ (Item-Objective Congruence Index: IOC)

R
IOC =
N
เมือ
่ R ี่ วชาญ
แทน ผลรวมของคะแนนจากผูเ้ ชย
2) การวิเคราะห์ขอ
้ สอบทงฉบ
ั้ ับ

ื่ มน
2.2) ความเชอ ่ ั (Reliability)

การทดสอบโดยการหาความสอดคล้องภายในเป็นการ
หาความเชอ ื่ มน
่ ั โดยการทดสอบว่าแบบ ทดสอบหรือ
แบบสอบถามแต่ละข้อมีความ สมพ ั ันธ์ก ับข้ออืน
่ ๆ ใน
ฉบ ับเดียวก ันหรือไม่
สูตรในการหาค่าความเชอ ื่ มน
่ั :
1. ให้คะแนนแบบ 0-1 ใชส้ ต
ู ร
Kuder-Richardson (KR-20, KR-21)
้ ต
2. ให้คะแนนแบบ 0-1 หรือ มากกว่า 1 ใชส ู ร

สมประส ิ ธิแ
ท ์ อลฟ่าของครอนบาค (Cronbach)
ข้อสอบทีม่ คี ณ
ุ ภาพ ว ัดได้ตรง ครอบคลุม
ความสามารถของผูเ้ รียนและ
มีการบริหารจ ัดการทีเ่ หมาะสมแล้ว
ผลการสอบจะมีคณ ุ อน ันต์น ัก
่ ใดข้อสอบไร้ซงึ่ คุณภาพ
แต่เมือ
และนำผลไปต ัดสน ิ ชวี ติ คนนน ั้
การกระทำเชน ่ นีจ ้ ัดว่าเป็น
“การทำบาปทางวิชาการทีทำ ่ ร้ายคนทงช ั้ วี ต
ิ ”
1) การว ัดความคงที่ (Measure of Stability)

สมชาย ข ้อสอบฉบับ A

่ งเวลา
ชว ต่อมา

สมชาย ข ้อสอบฉบับ A
2) การว ัดความเท่าเทียมก ัน (Measure of Equivalence)

ข ้อสอบฉบับ A

สมชาย คูข
่ นานก ัน

ข ้อสอบฉบับ B
3) การว ัดความคงทีแ
่ ละความเท่าเทียมก ัน
(Measure of Stability and Equivalence )

สมชาย ข ้อสอบฉบับ A

่ งเวลา
ชว ต่อมา
คูข
่ นานก ัน

สมชาย ข ้อสอบฉบับ B

You might also like