Professional Documents
Culture Documents
การสร้างข้อสอบปรนัย
ผูช้ ว่ ยศาสตราจารย์ นายแพทย์เชิดศักดิ์ ไอรมณีรตั น์
ภาควิชาศัลยศาสตร์, คณะแพทยศาสตร์ศิริราชพยาบาล, มหาวิทยาลัยมหิดล, กรุงเทพมหานคร ๑๐๗๐๐.
ทางทีใ่ ครจะรูไ้ ด้วา่ การทีผ่ สู้ อบเลือกตอบ “ไม่มขี อ้ ใดถูก” หาใช่สตู รคณิตศาตร์ทไี่ ม่มขี อ้ ยกเว้น ผูน้ พิ นธ์ไม่คาดหวัง
นั้นเขาคิดถึงยาใด และยานั้นไม่เหมาะสมมากไปกว่า ให้อาจารย์ผพู้ ฒ ั นาข้อสอบยึดข้อแนะนำ�เหล่านีเ้ สมือน
ยาที่มีอยู่ในตัวเลือกหรือไม่ งานวิจัยทั้งหมดที่ศึกษาถึง กฎเกณฑ์ตายตัวทีต่ อ้ งทำ�ตามในทุกกรณี หากแต่ตอ้ งการ
ตัวเลือกชนิดนี้ได้ข้อสรุปที่ตรงกันว่าข้อสอบที่ใช้ตัวเลือก ให้อาจารย์ใช้เป็นแนวทางในการสร้างข้อสอบ ในบาง
ประเภทนีเ้ พิม่ ระดับความยากให้ขอ้ สอบ๑๖ โดยทัว่ ไปแล้ว บริบทผูอ้ อกข้อสอบอาจเลือกทีจ่ ะไม่ปฏิบตั ติ ามข้อแนะนำ�
จึงไม่แนะนำ�ให้ใช้ตวั เลือกประเภทนีใ้ นการสอบทางแพทย บางประการได้บ้าง แต่การที่จะไม่ปฏิบัติตามข้อแนะนำ�
ศาสตรศึกษาซึง่ ทางเลือกสำ�หรับสถานการณ์ทนี่ �ำ เสนอมี เหล่านีน้ นั้ ต้องมีเหตุผลทีเ่ หมาะสม และควรทำ�ไม่บอ่ ยนัก
ได้มากและการตัดสินใจเลือกคำ�ตอบต้องอาศัยการเปรียบ ยกตัวอย่างเช่นข้อแนะนำ�ว่า โจทย์ไม่ควรเขียนถามข้อ
เทียบข้อดีข้อเสียของแต่ละตัวเลือก ยกเว้น จะพบได้ว่ามีบางบริบทที่การรู้ข้อยกเว้น หรือข้อ
ห้ามปฏิบัติก็เป็นองค์ความรู้ที่สำ�คัญในการดูแลรักษา
สรุป ผู้ป่วย ดังนั้นในบริบทที่เหมาะสมผู้นิพนธ์เองก็เห็นด้วย
ว่าอาจเขียนโจทย์ที่ถามข้อยกเว้นได้ แต่อย่างไรก็ตาม
ในบทความนี้ผู้นิพนธ์ได้กล่าวถึงข้อแนะนำ�ขั้น การจะไม่ปฏิบัติตามข้อแนะนำ�นี้ต้องไม่ทำ�บ่อยจนเกิน
พื้นฐานในการพัฒนาข้อสอบปรนัยชนิดเลือกคำ�ตอบที่ จำ�เป็น หากออกข้อสอบ ๑๐๐ ข้อ จะมีข้อสอบที่ถามข้อ
ถูกที่สุดโดยสรุปข้อแนะนำ�เหล่านี้ออกเป็นสี่กลุ่มด้วยกัน ยกเว้น ปะปนมาบ้าง ๒-๓ ข้อ ย่อมเป็นสิง่ ทีพ่ อยอมรับได้
ได้แก่ (๑) เนือ้ หาข้อสอบ, (๒) การจัดรูปแบบข้อสอบ, (๓) แต่หากในชุดข้อสอบมีขอ้ สอบถึงร้อยละ ๒๐ – ๓๐ ทีโ่ จทย์
การเขียนโจทย์, และ (๔) การเขียนตัวเลือก ผู้นิพนธ์หวัง เขียนในรูปประโยคปฏิเสธ ถามสิง่ ทีไ่ ม่ควรปฏิบตั ิ หรือสิง่ ที่
ว่าข้อแนะนำ�เหล่านี้คงพอเป็นแนวทางสำ�หรับอาจารย์ ไม่ถกู ต้อง อย่างนีย้ อ่ มจัดว่าละเลยแนวทางในการพัฒนา
แพทย์ในการพัฒนาข้อสอบปรนัยที่มีคุณภาพเพื่อใช้ใน ข้อสอบอย่างไม่เหมาะสม ซึ่งย่อมส่งผลให้คุณภาพของ
การประเมินนักศึกษาแพทย์และแพทย์ประจำ�บ้านได้ ข้อสอบด้อยลงอย่างชัดเจน
บ้าง อย่างไรก็ตามบทความนีเ้ ป็นการกล่าวถึงข้อแนะนำ�
เบือ้ งต้นเท่านัน้ ยังมีขอ้ แนะนำ�อืน่ ๆ ทีผ่ นู้ พิ นธ์ไม่ได้น�ำ มา
รวบรวมไว้ในบทความนี้เพื่อต้องการทำ�ให้เนื้อหากระชับ
โดยข้อแนะนำ�อื่น ๆ ที่ผู้นิพนธ์ไม่ได้กล่าวถึงนี้พบว่าเป็น
ปัญหาน้อยในการออกข้อสอบทางการแพทย์ หรือเป็น
ข้อแนะนำ�ที่ไม่ได้รับการสนับสนุนอย่างกว้างขวางจาก เอกสารอ้างอิง
ผู้เชี่ยวชาญทางการวัดและประเมินผล หากผู้อ่านสนใจ 1. Downing SM. Assessment of knowledge with written test forms. In:
Norman GR, van der Vleuten C, Newble DI, editors. International
รายละเอียดของข้อแนะนำ�อื่น ๆ ที่มีผู้กล่าวไว้สามารถ handbook of research in medial education. Dordrecht: Kluwer Aca-
ศึ ก ษาเพิ่ ม เติ ม ได้ จ ากเอกสารอ้ า งอิ ง ที่ แ สดงไว้ ท้ า ย 2. demic Pubishers, 2002:647 - 72.
Haladyna TM, Downing SM. A taxonomy of multiple-choice item-
บทความ writing rules. Appl Meas Educ 1989;2:37-50.
3. Haladyna TM. Developing and validating multiple-choice test items,
มีข้อควรพิจารณาในการประยุกต์ใช้ข้อแนะนำ� 3rd ed. Mahwah, NJ: Lawrence Erlbaum Assoicates, 2004.
4. Maatsch JL, Huang RR, Downing SM, Munger BS. The predictive
เหล่านีใ้ นการพัฒนาข้อสอบทีผ่ นู้ พิ นธ์ขอกล่าวถึงประการ validity of test formats and a psychometric theory of clinical com-
หนึ่งคือ แม้ว่าข้อแนะนำ �ที่กล่าวถึงเหล่านี้หลายข้อมี Washington, petence. The 23rd Conference on Research in Medical Education.
DC: Association of American Medical Colleges, 1984.
การศึ ก ษาวิ จั ย สนั บ สนุ น ที่ ชั ด เจน แต่ สิ่ ง เหล่ า นี้ ก็ เ ป็ น 5. Jozefowicz RF, Koeppen BM, Case S, Galbraith R, Swanson D, Glew
RH. The quality of in-house medical school examinations. Acad Med
เพี ย งข้ อ แนะนำ � ว่ า ผู้ อ อกข้ อ สอบควรปฏิ บั ติ ไม่ ใ ช่ ก ฎ 2002;77(2):156-61.
เกณฑ์ตายตัว การเขียนข้อสอบปรนัยนั้นเป็นงานที่ต้อง 6. Tarrant M, Ware J. Impact of item-writing flaws in multiple-choice
questions on student achievement in high-stakes nursing assessments.
อาศัยทั้งศาสตร์และศิลปะผสมผสานกันอย่างเหมาะสม Med Educ 2008;42:198-206.
๓๕
มกราคม-มิถุนายน ๒๕๕๕, ปีที่ ๕, ฉบับที่ ๑
เวชบันทึกศิริราช บทความทั่วไป
7. Downing SM. The effects of violating standard item writing principles 12. Tamir P. Positive and negative multiple choice items: How different
on tests and students: The consequences of using flawed test items are they? Stud Educ Eval 1993;19:311-25.
on achievement examinations in medical education. Adv Health Sci 13. Rogers WT, Harley D. An empirical comparison of three- and four-
Educ Theory Pract 2005;10:133-43. choice items and tests: Susceptibility to testwiseness and internal
8. Case SM, Swanson D. Constructing written test questions for the basic consistency reliability. Educ Psychol Meas 1999;59:234-47.
and clinical sciences, 3rd ed. Philadelphia, PA: National Board of 14. Sidick JT, Barrett GV, Doverspike D. Three-alternative multiple
Medical Examiners, 2002. choices tests: An attractive option. Pers Psychol 1994;47:829-35.
9. Haladyna TM, Downing SM. Validity of a taxonomy of multiple- 15. Cizek GJ, Rachor RE. Nonfunctioning options: A closer look. The
choice item-writing rules. Appl Meas Educ 1989;2(1):51-78. annual meeting of the American Educational Research Association.
10. Haladyna TM, Downing SM, Rodriguez MC. A review of multiple- San Francisco, CA, 1995.
choice item-writing guidelines for classroom assessment. Appl Meas 16. Crehan KD, Haladyna TM, Brewer BW. Use of an inclusive option
Educ 2002;15:309-34. and the optimal number of options for multiple-choice items. Educ
11. Downing SM, Dawson-Saunders B, Case SM, Powell RD. The psy- Psychol Meas 1993;53:241-7.
chometric effects of negative stems, unfocused questions, and hetero- 17. Lord FM. Optimal number of choices per item. J Educ Meas 1977;
geneous options on NBME Part I and Part II item characteristics. the 14:33-8.
annual meeting of the National Council on Measurement in Education. 18. Haladyna TM, Downing SM. How many options is enough for a
Chicago, IL, 1991. multiple-choice item? Educ Psychol Meas 1993;53:999-1010.
๓๖
มกราคม-มิถุนายน ๒๕๕๕, ปีที่ ๕, ฉบับที่ ๑