Professional Documents
Culture Documents
การตรวจสอบคุณภาพเครื่องมือ
การตรวจสอบคุณภาพเครื่องมือ
การตรวจสอบคุณภาพเครือ
่ งมือ
สำนักทดสอบทางการ
ศึกษา สพฐ.
1
การวิเคราะห์คณ
ุ ภาพแบบทดสอบ
1. คุณล ักษณะของแบบทดสอบทีด
่ ี
2. วิธก
ี ารวิเคราะห์แบบทดสอบ
ี ารวิเคราะห์โดยไม่ใชว้ ธ
2.1 วิธก ิ ก
ี ารทางสถิต ิ
ี ารวิเคราะห์โดยใชว้ ธ
2.1 วิธก ิ ก
ี ารทางสถิต ิ
1) การวิเคราะห์คณ
ุ ภาพข้อสอบรายข้อ
2) การวิเคราะห์คณ
ุ ภาพข้อสอบทงฉบ
ั้ ับ
1. คุณล ักษณะของแบบทดสอบทีด
่ ี
1. ความตรง/ความเทีย
่ งตรง (validity)
2. ความเทีย ื่ มน
่ ง/เชอ ่ ั (reliability)
3. ความยากง่าย (difficulty)
4. อำนาจจำแนก (discrimination )
5. เป็นปรน ัย (objectivity)
1.1 ความตรง/เทีย
่ งตรง (Validity)
ความถูกต้องแม่นยำของเครือ ่ งมือในการว ัด
สงิ่ ทีต
่ อ
้ งการจะว ัด
ประเภทของความเทีย
่ งตรง
้ หา (Content Validity)
1. ความตรงตามเนือ
้ หาของเครือ
เนือ ่ งมือ หรือเนือ ้ หาของข้อคำถามว ัดได้ตรง
ตามประเด็นหรือต ัวชวี้ ัดทีต
่ อ
้ งการว ัดหรือไม่?
2. ความตรงเชงิ โครงสร้าง (Construct Validity)
เครือ
่ งมือนนสามารถว
ั้ ัดได้ครอบคลุมขอบเขต ความหมาย
หรือครบตามคุณล ักษณะประจำตามทฤษฎีทใี่ ชส ้ ร้าง
เครือ่ งมือหรือไม่?
1.1 ความตรง/เทีย
่ งตรง (Validity)
ประเภทของความตรง (ต่อ)
ั ันธ์ (Criterion-related
3. ความตรงตามเกณฑ์สมพ
Validity) เครือ
่ งมือว ัดได้ตรงตามสภาพทีต ่ อ
้ งการว ัด โดย
พิจารณาจากเกณฑ์ทเี่ กีย ่ วข้องว่าเครือ
่ งมือนนจะใช
ั้ ้ นาย
ทำ
พฤติกรรมของบุคคลในสภาพเฉพาะเจาะจงตามต้องการหรือ
ไม่? จำแนกได้ 2 ชนิด คือ
ความคงทีห
่ รือความคงเสน้ คงวาของผลที่
ได้จากการว ัด
วิธก
ี ารประมาณค่าความเทีย
่ ง
1. การว ัดความคงที่ (Measure of Stability)
2. การว ัดความสมมูลก ัน หรือเท่าเทียมก ัน (Measure of Equivalence)
3. การว ัดความคงทีแ
่ ละความเท่าเทียมก ัน (Measure of Stability and
Equivalence)
4. การว ัดความสอดคล้องภายใน (Measure of Internal
Consistency)
4.1 วิธแ
ี บ่งครึง่ ข้อสอบ (Split-half)
4.2 วิธข
ี อง Kuder-Richardson (Kr20 , Kr21)
4.3 วิธส ั
ี มประส ิ ธ์แอลฟาของ Cronbach (Cronbach’s alpha ()
ท
1.2 ความเทีย ื่ มน
่ ง/เชอ ่ ั (Reliability)
วิธป
ี ระมาณค่า Measure of Stability
1) การว ัด ความหมาย
ความคงที่ ความคงเสน ้ คงวาของคะแนนจากการว ัดในชว ่ งเวลาทีต่ า่ ง
2) การว ัดความ ี อบซ้ำด้วยแบบสอบฉบ ับเดิม (test-retest
ก ันโดยวิธส
เท่าเทียมก ัน
method)
3) การว ัดความ วิธปี ระมาณค่า
คงทีแ่ ละความ
เท่าเทียมก ัน
ั
คำนวณค่าสมประส ิ ธิส
ท ั ันธ์ระหว่างคะแนนทีว่ ัดได้
์ หสมพ
จากคนเดียวก ันด้วยเครือ ่ งมือเดียวก ัน โดยทำการว ัดซ้ำสอง
4) การว ัดความ
สอดคล้อง
ครงในเวลาที
ั้ ต
่ า่ งก ัน
ภายใน
1.2 ความเทีย ื่ มน
่ ง/เชอ ่ ั (Reliability)
วิธป
ี ระมาณค่า Measure of Equivalence
1) การว ัดความ ความหมาย
คงที่ ความสอดคล้องก ันของคะแนนจากการว ัดในชว ่ งเวลา
2) การว ัดความ เดียวก ันโดยใชแ ้ บบสอบทีส ่ มมูลก ันหรือเท่าเทียมก ัน
เท่าเทียมก ัน (equivalence-form method)
3) การว ัดความ วิธป
ี ระมาณค่า
คงทีแ่ ละความ
เท่าเทียมก ัน
ั
คำนวณค่าสมประส ิ ธิส
ท ์ หสมพั ันธ์ระหว่างคะแนนทีว่ ัดได้
ในเวลาเดียวก ันจากคนกลุม ่ เดียวก ัน โดยใชเ้ ครือ
่ งมือ 2
4) การว ัดความ
สอดคล้อง
ฉบ ับทีท
่ ัดเทียมก ัน
ภายใน
1.2 ความเทีย ื่ มน
่ ง/เชอ ่ ั (Reliability)
วิธป
ี ระมาณค่า Measure of Stability and Equivalence
1) การว ัดความ ความหมาย
คงที่ ความสอดคล้องก ันของคะแนนจากการว ัดในชว ่ งเวลาต่าง
2) การว ัดความ ก ัน โดยวิธสี อบซ้ำด้วยแบบสอบทีส ่ มมูลก ันหรือเท่าเทียมก ัน
เท่าเทียมก ัน
(test-retest with equivalence method)
3) การว ัดความ วิธปี ระมาณค่า
คงทีแ่ ละความ คำนวณค่าสมประส ั ิ ธิส
ท ั ันธ์ระหว่างคะแนนทีว่ ัดได้
์ หสมพ
เท่าเทียมก ัน
ในชว ่ งเวลาทีต่ า่ งก ันจากกลุม ่ เดียวก ัน โดยใชเ้ ครือ
่ คนกลุม ่ ง
4) การว ัดความ
สอดคล้อง
มือ 2 ฉบ ับทีท่ ัดเทียมก ัน
ภายใน
1.2 ความเทีย ื่ มน
่ ง/เชอ ่ ั (Reliability)
วิธป
ี ระมาณค่า Measure of Internal Consistency
1) การว ัดความ ความหมาย
คงที่ ความสอดคล้องก ันระหว่างคะแนนรายข้อ หรือความเป็น
2) การว ัดความ เอกพ ันธ์ของเนือ ้ หารายข้ออ ันเป็นต ัวแทนของคุณล ักษณะ
เท่าเทียมก ัน
เด่นเดียวก ันทีต่ อ้ งการว ัด
3) การว ัดความ วิธป
ี ระมาณค่า
คงทีแ่ ละความ
เท่าเทียมก ัน
มีหลายวิธ ี ได้แก่
4) การว ัดความ 1) วิธแ
ี บ่งครึง่ ข้อสอบ (Split-half)
สอดคล้อง
2) วิธข
ี อง Kuder-Richardson (KR20, KR21)
ภายใน
3) วิธส ั
ี มประสทิ ธ์แอลฟาของ Cronbach
(Cronbach’s alpha () method)
1.3 ความยากง่าย (Difficulty)
ความยากง่ายของแบบทดสอบมีความ
เหมาะสมก ับความสามารถของผูส ้ อบ
ั ว่ น หรือเปอร์เซ็นต์
ซงึ่ พิจารณาจาก สดส
ของจำนวนคนทีต ่ อบข้อสอบข้อนนถู ั้ กจาก
คนทีส ่ อบทงหมด
ั้
1.4 อำนาจจำแนก (Discrimination)
ความสามารถของข้อสอบแต่ละข้อ
ในการจำแนกคนทีอ ่ ยูใ่ นกลุม
่ เก่งออก
จากคนทีอ ่ ยูใ่ นกลุม
่ อ่อนได้
ซงึ่ พิจารณาจากผลต่างของสดส ั ว่ น
ของกลุม ่ เก่งทีต ่ อบถูกก ับกลุม ่ อ่อนที่
ตอบถูก
1.5 ความเป็นปรน ัย (Objectivity)
ั
ความชดเจนของแบบทดสอบหรื อคำถามทีท่ ก
ุ คน
เข้าใจตรงก ัน รวมทงการตรวจให้
ั้ คะแนนมีเกณฑ์ท ี่
แน่นอน ความเป็นปรน ัย มีองค์ประกอบ 3 ประการ :
1. โจทย์หรือข้อคำถาม
2. วิธก
ี ารตรวจให้คะแนน
3. การแปลความหมายของคะแนน
การหาความเป็นปรน ัยทีน ่ ย
ิ มปฏิบ ัติก ัน คือ
ี่ วชาญพิจารณาและตรวจสอบ
ให้ผเู ้ ชย
2. วิธก
ี ารวิเคราะห์คณ
ุ ภาพแบบสอบ
2.1 การวิเคราะห์แบบสอบโดยไม่ใชว้ ธ
ิ ก
ี ารทางสถิต ิ
2.2 การวิเคราะห์แบบสอบโดยใชว้ ธ
ิ ก
ี ารทางสถิต ิ
2.1 การวิเคราะห์แบบสอบโดยไม่ใชว้ ธ
ิ ก
ี ารทางสถิต ิ
้ หา
1) การตรวจสอบความถูกต้องและครอบคลุมของเนือ
วิชาและจุดมุง
่ หมาย
แนวทางการพิจารณา
้ หาทีเ่ รียนหรือไม่
1) ข้อคำถามครบถ้วนทุกเนือ
2) จำนวนข้อคำถามของแต่ละเนือ ั ว
้ หามีสดส ่ นตาม
น้ำหน ักทีกำ
่ หนดไว้หรือไม่
3) ข้อคำถามแต่ละข้อว ัดได้ตรงตามพฤติกรรมทีร่ ะบุไว้ใน
จุดมุง
่ หมายของการสอนแต่ละเนือ้ หาหรือไม่
2.1 การวิเคราะห์แบบสอบโดยไม่ใชว้ ธ
ิ ก
ี ารทางสถิต ิ
้ หา
1) การตรวจสอบความถูกต้องและครอบคลุมของเนือ
วิชาและจุดมุง
่ หมาย
วิธดำ
ี เนินการ
ี่ วชาญในเนือ
1) ตรวจสอบโดยผูเ้ ชย ้ หาวิชานนๆ
ั้
2) ตรวจสอบโดยการเปรียบเทียบตารางกำหนดจำนวน
ข้อคำถาม (test Blueprint)
2.1 การวิเคราะห์แบบสอบโดยไม่ใชว้ ธ
ิ ก
ี ารทางสถิต ิ
2) การตรวจสอบภาษาและความสอดคล้องก ับเทคนิค
การเขียนคำถาม
แนวทางการพิจารณา
1) ข้อความทีใ่ ชเ้ ขียนเป็นข้อคำถามสามารถสอ
ื่ ความ
หมายได้ดเี พียงไร
2) การเขียนข้อคำถามนนมี
ั้ ความถูกต้องตามเทคนิคใน
การเขียนข้อคำถามทีด่ ห
ี รือไม่
2.1 การวิเคราะห์แบบสอบโดยไม่ใชว้ ธ
ิ ก
ี ารทางสถิต ิ
2) การตรวจสอบภาษาและความสอดคล้องก ับเทคนิค
การเขียนคำถาม
วิธดำ
ี เนินการ
ี่ วชาญทางด้านภาษา
1) ตรวจสอบโดยผูเ้ ชย
ี่ วชาญทางด้านว ัดผลการศก
2) ตรวจสอบโดยผูเ้ ชย ึ ษา
1) การวิเคราะห์ขอ้ สอบเป็นรายข้อ
1.1) ด ัชนีความสอดคล้องระหว่างข้อสอบก ับจุดประสงค์
(IOC-Index of Item Objective Congruence)
1.2) ค่าระด ับความยากง่าย (Difficulty Index)
1.3) ค่าอำนาจจำแนก (Discrimination Power)
2) การวิเคราะห์ขอ
้ สอบทงฉบ
ั้ ับ
2.1) ความเทีย ่ งตรง (Validity)
2.2) ความเชอื่ มน่ ั (Reliability)
1) การวิเคราะห์ขอ
้ สอบรายข้อ
วิธดำ
ี เนินการ
ให้ผเู ้ ชยี่ วชาญตงแต่
ั้ ้ ไป ประเมินความ
3 คนขึน
สอดคล้องระหว่างข้อคำถามในเครือ ้ หาที่
่ งมือก ับเนือ
ต้องการว ัด จากนนนำผลการประเมิ
ั้ นมาคำนวณค่า IOC
โดยใชส ้ ต ู ร
R
IOC =
N
่ R แทน ผลรวมของคะแนนจากผูเ้ ชย
เมือ ี่ วชาญ
ผลการประเมิน
ต ัวชวี้ ัดตามมาตรฐาน ข้อสอบ
-1 0 1
ผูเ้ รียนสามารถบอกถึงหน้าที่ 1. หน้าทีข่ องใบคืออะไร?
หรือความแตกต่างของ ก. ยึดลำต้น
สว่ นประกอบต่างๆของพืชได้ ข. ดูดอาหาร
ั
ค. สงเคราะห์ แสง
ง. ลำเลียงอาหาร
้ งคู?
2. ข้อใดเป็นพืชใบเลีย ่
ก. ข้าว
ข. อ้อย
ค. กล้วย
ง. มะเขือ
ข้อ 1 1 1 1 0 1 4/5=0.8
ข้อ 2 1 0 -1 0 -1 -1/5=-0.2
สรุป...
ข้อสอบข้อ 1 มีความสอดคล้องก ับจุดมุง ่ หมายเชงิ พฤติกรรม สามารถนำ
ไปใชส้ อบได้
ข้อสอบข้อ 2 ไม่สอดคล้องก ับจุดมุง ่ หมายเชงิ พฤติกรรม ไม่ควรนำไปใช ้
ต้องต ัดทิง้ หรือปร ับปรุงใหม่
1) การวิเคราะห์ขอ
้ สอบรายข้อ
ั ว
ระด ับความยากง่าย หมายถึง สดส ่ น หรือเปอร์เซ็นต์ของจำนวนคนที่
ตอบข้อสอบข้อนนถู ั้ กจากคนทีส ่ อบทงหมด
ั้
้ ญล
ใชส ั ักษณ์ “p”
ข้อสอบแบบปรน ัย (คะแนนแบบทวิภาค 0 ก ับ 1)
ค่
ค่าาความยากง่
ความยากง่าาย
ย ((Difficulty
Difficulty Index)
Index)
มี
มีคคา่ า่ ต
ตงแต่
ั้งแต่
ั้ 0.00
0.00 จนถึ
จนถึงง 1.00
1.00
เกณฑ์
เกณฑ์ใในการแปลความหมายค่
นการแปลความหมายค่าาความยากง่
ความยากง่าาย
ย
เกณฑ์
เกณฑ์:: ข้
ข้ออสอบที
สอบทีม่ม
่ ค
ีค
ี า่ า่ ความยากง่
ความยากง่าายพอเหมาะ
ยพอเหมาะ หรื
หรืออมี
มีคคณ
ุณ
ุ ภาพดี
ภาพดี
R R R R
p หรือ p 100 หรือ p H L
N N N N
H L
1 ก 4 6 (6+4)/40= 0.25
ข* 9 3 (9+3)/40 = 0.3
ค 3 5 (5+3)/40= 0.2
ง 4 6 (6+4)/40= 0.25
รวม 20 20
1.2) ค่าระด ับความยากง่าย (Difficulty Index)
1. ตรวจและเรียงคะแนนรวมจากสูงสุดถึงต่ำสุด
2. แบ่งกลุม
่ สูง (H) และกลุม
่ ต่ำ (L)
ั ว
3. คำนวณสดส ่ นของคะแนนรวมรายข้อทีไ่ ด้จำแนกตามกลุม
่
H L
PH = —— PL = ——
H รวมคะแนนกลุ่มสู ง L รวมคะแนนกลุ่มต่ำ
TH รวมคะแนนเต็มกลุ่มสู ง TL รวมคะแนนเต็มกลุ่มต่ำ
TH TL PH + PL
4. วิเคราะห์คา่ ความยาก (p) • p = ————
2
•แบบสอบความเรียงมี 5 ข้อ แต่ละข้อคะแนนเป็ น 10,10,20,30,30 คะแนน ตามลำดับ
•ใช้สอบนักเรียน 8 คน
•ตรวจให้คะแนน และเรียงลำดับคะแนนจากมากไปน้อย (อันดับ 1-8)
•แบ่งนักเรียนเป็ น 2 กลุ่ม(เทคนิค 50%) ได้กลุ่มสูงและกลุ่มต่ำ กลุ่มละ 4 คน
•การวิเคราะห์ขอ้ สอบต้องรวมรายข้อของผูส้ อบทุกคนแต่ละกลุ่ม
ข้ อ คะแนน กลุ่มสู ง (H) (4 คน) กลุ่มต่ำ (L) (4 คน)
เต็ม 1 2 3 4 5 6 7 8
1 10 10 10 9 8 5 8 8 7
2 10 9 10 8 9 8 7 6 3
3 20 20 15 15 17 15 9 10 8
4 30 25 25 24 20 16 17 13 10
5 30 16 10 10 7 11 7 6 2
กลุ่มสู ง กลุ่มต่ำ
คะแนน (4 คน) (4 คน)
ข้ อ H
เต็ม L
เต็ม PH PL Pi
เต็ม
ข้อสอบแบบปรน ัย (คะแนนแบบทวิภาค 0 ก ับ 1)
ค่
ค่าาอำนาจจำแนก
อำนาจจำแนก ((Discrimination
Discrimination power)
power)
มี
มีคคา่ า่ ต
ตงแต่
ั้งแต่
ั้ -1.00
-1.00 จนถึ
จนถึงง 1.00
1.00
เกณฑ์
เกณฑ์ใในการแปลความหมายค่
นการแปลความหมายค่าาอำนาจจำแนก
อำนาจจำแนก
เกณฑ์
เกณฑ์:: ข้
ข้ออสอบที
สอบทีม่ม
่ ค
ีค
ี ณ
ุณ
ุ ภาพดี
ภาพดี
ค่า r ตงแต่
ั้ ้ ไป
+0.20 ขึน
1.3) ค่าอำนาจจำแนก (Discrimination power)
R R
r H L
N
H
หมายเหตุ NH = N L
RH แทน จำนวนคนทีต
่ อบข้อนนถู ั้ กในกลุม ่ สูง
RL แทน จำนวนคนทีต่ อบข้อนนถู ั้ กในกลุม่ ต่ำ
NH แทน จำนวนคนในกลุม ่ สูง
NL แทน จำนวนคนในกลุม ่ ต่ำ
1 ก 4 6 (6 – 4)/20 =0.1
ข* 9 3 (9 - 3)/20 = 0.3
ค 3 5 (5 – 3)/20 =0.1
ง 4 6 (6 – 4)/20 =0.1
รวม 20 20
1.3) ค่าอำนาจจำแนก (Discrimination power)
1. ตรวจและเรียงคะแนนรวมจากสูงสุดถึงต่ำสุด
2. แบ่งกลุม
่ สูง (H) และกลุม
่ ต่ำ (L)
ั ว
3. คำนวณสดส ่ นของคะแนนรวมรายข้อทีไ่ ด้จำแนกตามกลุม
่
H
PH = —— L
PL = ——
H รวมคะแนนกลุ่มสู ง L รวมคะแนนกลุ่มต่ำ
TH รวมคะแนนเต็มกลุ่มสู ง TL รวมคะแนนเต็มกลุ่มต่ำ
TH TL
4. วิเคราะห์คา่ อำนาจจำแนก (r) • r = PH – PL
กลุ่มสู ง กลุ่มต่ำ
คะแนน (4 คน) (4 คน)
ข้ อ H
เต็ม L
เต็ม PH PL ri
เต็ม
ข้อสอบข้อนนต้
ั้ องมีคา่ ความยากง่าย และค่า อำนาจจำแนกเป็นไปตามเกณฑ์ทกำ
ี่ หนด
.8
.7
เกณฑ์: ข้อสอบทีม่ ค
ี ณ
ุ ภาพ .6
p = 0.20 – 0.80
้ ไป
r = +0.20 ขึน .5
.4 1
3 .3
.2
2 .1 5
ค่าอำนาจจำแนก (r)
- -. -. -. -. -. -. -. -. -. 0 .1 .2 .3 .4 .5 .6 .7 .8 .9 1
2) การวิเคราะห์ขอ
้ สอบทงฉบ
ั้ ับ
2.1) ความเทีย
่ งตรง (Validity)
R
IOC =
N
เมือ
่ R ี่ วชาญ
แทน ผลรวมของคะแนนจากผูเ้ ชย
2) การวิเคราะห์ขอ
้ สอบทงฉบ
ั้ ับ
ื่ มน
2.2) ความเชอ ่ ั (Reliability)
การทดสอบโดยการหาความสอดคล้องภายในเป็นการ
หาความเชอ ื่ มน
่ ั โดยการทดสอบว่าแบบ ทดสอบหรือ
แบบสอบถามแต่ละข้อมีความ สมพ ั ันธ์ก ับข้ออืน
่ ๆ ใน
ฉบ ับเดียวก ันหรือไม่
สูตรในการหาค่าความเชอ ื่ มน
่ั :
1. ให้คะแนนแบบ 0-1 ใชส้ ต
ู ร
Kuder-Richardson (KR-20, KR-21)
้ ต
2. ให้คะแนนแบบ 0-1 หรือ มากกว่า 1 ใชส ู ร
ั
สมประส ิ ธิแ
ท ์ อลฟ่าของครอนบาค (Cronbach)
ข้อสอบทีม่ คี ณ
ุ ภาพ ว ัดได้ตรง ครอบคลุม
ความสามารถของผูเ้ รียนและ
มีการบริหารจ ัดการทีเ่ หมาะสมแล้ว
ผลการสอบจะมีคณ ุ อน ันต์น ัก
่ ใดข้อสอบไร้ซงึ่ คุณภาพ
แต่เมือ
และนำผลไปต ัดสน ิ ชวี ติ คนนน ั้
การกระทำเชน ่ นีจ ้ ัดว่าเป็น
“การทำบาปทางวิชาการทีทำ ่ ร้ายคนทงช ั้ วี ต
ิ ”
1) การว ัดความคงที่ (Measure of Stability)
สมชาย ข ้อสอบฉบับ A
่ งเวลา
ชว ต่อมา
สมชาย ข ้อสอบฉบับ A
2) การว ัดความเท่าเทียมก ัน (Measure of Equivalence)
ข ้อสอบฉบับ A
สมชาย คูข
่ นานก ัน
ข ้อสอบฉบับ B
3) การว ัดความคงทีแ
่ ละความเท่าเทียมก ัน
(Measure of Stability and Equivalence )
สมชาย ข ้อสอบฉบับ A
่ งเวลา
ชว ต่อมา
คูข
่ นานก ัน
สมชาย ข ้อสอบฉบับ B