You are on page 1of 8

บทความการศึกษาตอเนื่อง 

4002­1­000­004­03­2560 
Approved Date: 31 มีนาคม 2560 
Expired Date: 30 มีนาคม 2561 
Credit: 3 CPE 

Critical Appraisal for Therapy Articles: 


Randomized Controlled Trial 
ดร.ภญ.เบญจพร ศิลารักษ 
กลุมงานเภสัชกรรม โรงพยาบาลขอนแกน  
 

บทความทางการแพทยที่รายงานผลงานวิจัยที่นำไปใชเปนหลักฐานเชิงประจักษทางวิชาการ (evidence­based 
medicine, EBM) ในชวงหลายทศวรรษที่ผานมา กอนจะมีงานวิจัยรูปแบบการศึกษา systematic reveiw นั้น จะเปนงาน
วิจัยที่มีรูปแบบการศึกษาเปน randomized controlled trial (RCT) ซึ่งเปนวิธีการศึกษาที่ประเมินประสิทธิภาพของการ
รักษาที่ให intervention เปรียบเทียบกับการรักษามาตรฐานหรือการรักษาในกลุมควบคุม โดยมีการควบคุมปจจัยอยางอื่นที่
เทาเทียมกันทั้งสองกลุม การนำผลงานวิจัยการศึกษาแบบ RCT ไปใชในการวางแผนการดูแลรักษาผูปวยนั้น จะตองมีการ
ประเมินคุณคาของงานวิจัยนั้นกอนวามีคุณคา มีความเที่ยงตรง นาเชื่อถือ เพียงพอในการนำไปประยุกตใช  

เกณฑในการประเมินคุณคาของบทความวิจัยนั้นมีมากมายหลายเกณฑ ความละเอียดในแตละเกณฑก็จะแตกตางกัน
ไป ดวยบทความในปจจุบันมีมากมาย การสืบคนที่งาย สะดวก เขาถึงบทความไดมากขึ้น ถือเปนสิ่งที่ไดประโยชน อยางไรก็ดี  
เวลาที่ใชในการอานบทความมีจำกัด การประเมินคุณคาของบทความวิจัยที่กระชับและตรงประเด็นหลักในการวัดความเที่ยง
ตรงของการศึกษา ตลอดจนการมองเห็นตรวจจับไดถึงขอบกพรองของงานวิจัย (flaw) จะชวยใหใชเวลาในการอานบทความ
ไดอยางมีประสิทธิภาพและเกิดประโยชนสูงสุด  

ในบทความนี้จักกลาวถึงการประเมินคุณคางานวิจัยแบบ RCT โดยใชเกณฑการประเมินของ Centre of 


Evidence­based Medicine มหาวิทยาลัย Oxford ซึ่งการประเมินคุณคาการศึกษาวิจัยที่เปน RCT จะประกอบดวยสองขั้น
ตอนตามลำดับ ขั้นแรกจะตองประเมินกอนวา ผลการศึกษาวิจัยนั้นมีความเที่ยงตรงหรือไม ซึ่งเปนการประเมินการศึกษาแบบ 
internal validity หากประเมินการศึกษานั้นแลววามีความเที่ยงตรงนาเชื่อถือ จึงนำไปสูการประเมินขั้นตอนที่สองคือ  
external validity ซึ่งเปนการประเมินคุณลักษณะของผูปวย บริบทของการดูแลที่เรามีอยู กอนที่เราจะนำผลการศึกษานี้ไปใช
ในการวางแผนดูแลผูปวย 

 
Internal Validity 
ขั้นตอนแรก เปนการประเมินความเที่ยงตรงของงานวิจัย โดยเริ่มจากคำถามพื้นฐานแรกที่ถามถึงคำถามของงานวิจัย  
ตามดวยคำถามที่ใชในการประเมินขอบกพรองของการศึกษา (flaw) ซึ่งประเมินไดจากสวนตางๆของบทความ และประเมินใน
สวนของวิธีการแสดงผลลัพธการศึกษา 
What question did the study ask? 
กอนประเมินบทความ ตองประเมินงานวิจัยวา คำถามของงานวิจัยนี้คืออะไร คำถามของการวิจัยในรูปแบบ RCT จะ
ประกอบดวย 4 องคประกอบหลักที่เรียกวา PICO ซึ่งไดแก   
● Participant / Patient ผูเขารวมการศึกษาวิจัย หรือผูปวยนั้นมีคุณลักษณะอยางไร 
● Intervention การรักษา การปองกัน หรือสิ่งที่สนใจหลักที่ใหในกลุมทดลอง 
● Comparison / Control ทางเลือกที่ใหเพื่อเปนกลุมควบคุม อาจจะเปนทางเลือกที่เปนมาตรฐานในการรักษาหรือเปน
ยาหลอก เปนตน 
● Outcome(s) ผลลัพธที่สนใจที่ตองการเปรียบเทียบระหวางกลุมที่ไดรับ intervention และกลุมควบคุม  

เมื่อเราทราบองคประกอบสำคัญของงานวิจัยทั้งสี่องคประกอบแลว การประเมินคุณคางานวิจัยจะเนนที่วิธีการ
ดำเนินการวิจัย โดยจำแนกตามขั้นตอนหลักๆ ของการทำวิจัย ไดแก การสุมเลือก (randomization) การจัดการกลุมที่ศึกษา 
(allocation) และการวัดประเมิน (measurement) หลังจากนั้นจะประเมินคุณคาจากผลการศึกษา 

Randomization  
เมื่อประเมินคำถามงานวิจัยแลว จะเปนการประเมินเกี่ยวกับวิธีการสุมตัวอยาง โดยมีคำถามยอยสองคำถามดังนี้  

1. ผูปวยที่เขารวมการศึกษาไดรับการสุมแยกกลุมหรือไม  
ผูปวยที่เขารวมโครงการวิจัยจะตองไดรับการสุมใหอยูในกลุมทดลองหรือกลุมควบคุม ทั้งนี้เพื่อใหปจจัยตางๆของทั้ง
สองกลุมไดรับการควบคุมอยางเทาเทียมกัน งานวิจัยแตละงานจะตองระบุถึงวิธีที่ใชในการสุม ในอดีตจะใชรหัสสุม  
(randomization codes) ใสในซองทึบปดผนึกแยกตามรายคน ในปจจุบัน มีการใชเทคโนโลยีในการพัฒนาวิธีการสุม ระยะ
แรกเปนวิธี interactive voice response system (IVRS) ซึ่งผูทำวิจัยจะโทรศัพทติดตอไปที่หนวยกลางของงานวิจัยนั้น และ
ระบุลักษณะของผูปวยตามปจจัยที่กำหนด โดยใชระบบ centralised computer randomization ตอมาเปลี่ยนจากระบบ
การโทรศัพทเปนการระบุขอมูลผานระบบ internet (web based) ซึ่งถือเปนวิธีที่เปนที่ยอมรับและใชในการศึกษาที่มีขนาด
ใหญแบบ multi­centered trials อยางไรก็ตาม หากเปนการศึกษาที่มีขนาดเล็ก อาจจะใชระบบรหัสสุมโดยผูที่สุมจะเปนผูที่
ไมเกี่ยวของกับการคัดเลือกผูปวย เชน เภสัชกร เปนตน  
แหลงที่คนหาคำตอบ วิธีการศึกษาจะระบุวาผูปวยไดรับการคัดเลือกแยกไปแตละกลุมอยางไร มีการสุมดวยวิธีใด และ
เปนการสุมแบบปกปดหรือไม  
 
 
2. ตอนเริ่มตนการศึกษา ลักษณะประชากรของแตละกลุมคลายคลึงกันหรือไม 

การสุมเลือก (random allocation) เปนการลดอคติที่อาจเกิดขึ้นในการจำแนกผูปวยตามแตละกลุม อยางไรก็ตาม 


วิธีการสุมเลือกนี้ไมไดรับประกันวา ณ จุดเริ่มตนของการศึกษาผูปวยทั้งสองกลุมจะมีลักษณะปจจัยที่เหมือนกัน มีโอกาสที่จะ
เปนการบังเอิญไดวาผูปวยที่มีภาวะโรคที่รุนแรงจะไดรับการเลือกไปยังกลุมหนึ่งมากกวาอีกกลุมหนึ่งก็เปนได ดังนั้น จึงมีความ
จำเปนที่จะตองประเมินวาผูปวยทั้งสองกลุมนั้นมีความคลายคลึงกัน ณ จุดเริ่มตนหรือไม ซึ่งการประเมินจะเนนปจจัยที่มีความ
สัมพันธกับการพยากรณโรคและผลลัพธของการศึกษา ตัวอยางเชน การศึกษาประสิทธิภาพของยาลดความดันโลหิตสูง  
ผลลัพธของการศึกษาวัดดวยจำนวนผูปวยที่เกิด stroke และ heart attack ดังนั้น จึงจำเปนที่จะตองตรวจสอบวา ปจจัยเสี่ยง
ที่สำคัญของโรคเหลานี้ที่จุดเริ่มตนการศึกษา (baseline) ซึ่งไดแก อายุ เพศ ระดับไขมันในเสนเลือดและการสูบบุหรี่ ของผู
ปวยทั้งสองกลุมมีความคลายคลึงกัน 
ถาปจจัยที่สำคัญมีความแตกตางกัน ณ จุดเริ่มตน ก็ยังไมจำเปนที่ละทิ้งการอานบทความวิจัยนั้น เนื่องดวยความแตก
ตางเหลานั้นสามารถประเมินไดดวยการใชการวิเคราะหทางสถิติอยางถูกตองเหมาะสม ดังนั้น หากพบความแตกตางของปจจัย
สำคัญ ณ จุดเริ่มตน คำถามที่ตามมาก็คือ ปจจัยเหลานั้นจะถูกนำมาวิเคราะหขอมูลรวมดวยหรือไม  
ถากระบวนการสุมเลือก (randomization) ทำไดอยางมีประสิทธิผล กลุมทดลองและกลุมเปรียบเทียบจะมีลักษณะ
ที่คลายคลึงกัน ยิ่งมีความคลายกันมากเทาใดความแตกตางระหวางกลุมก็จะลดนอยลงมากเทานั้น จะเหลือแตเพียงความตาง
ของ intervention ทั้งนี้อาจจะเปนไปไดวามีปจจัยบางประการที่มีโอกาสแตกตางกันอยางมีนัยสำคัญทางสถิติ   
แหลงที่คนหาคำตอบ ผลการศึกษาจะแสดงตารางลักษณะประชากรเมื่อเริ่มตนการศึกษา (Baseline Characteristics) 
เปรียบเทียบกันระหวางกลุมทดลองและกลุมควบคุม โดยระบุตัวแปรหรือปจจัยตางๆที่มีผลตอผลลัพธการศึกษา (เชน อายุ  
ปจจัยเสี่ยง เปนตน) แตถาไมพบตาราง ความคลายคลึงกันของขอมูลเหลานี้จะตองนำมากลาวเปนเนื้อความในยอหนาแรกของ
ผลการศึกษา 

Allocation  
เปนการประเมินการจัดการรักษา การตรวจ การใหการดูแล ฯลฯ ของกลุมทดลองและกลุมควบคุม  
1. นอกเหนือจากการรักษาที่ให (intervention) แลว แตละกลุมไดรับการดูแลที่เหมือนกันหรือไม 
กลุมทดลองและกลุมควบคุมจะตองไดรับการจัดการรักษา การตรวจทางหองปฏิบัติการ การใหการติดตามดูแล การ
รักษาอื่นๆเพิ่มเติมที่เหมือนกัน มีเพียง intervention เทานั้นที่แตกตางกันระหวางกลุมทดลองและกลุมควบคุม 
แหลงที่คนหาคำตอบ วิธีการศึกษาจะระบุการใหการรักษาหรือการตรวจทางหองปฏิบัติการ ตารางการนัดตรวจ
ติดตาม และการรักษาเพิ่มเติมที่อนุญาตใหมีได ซึ่งจะตองตรวจสอบผลการศึกษาอีกครั้งวา ขอมูลดังที่กลาวมานั้นทั้งสองกลุม
จะตองคลายคลึงกัน โดยเฉพาะสวนของการใชยาหรือการไดรับการรักษาตามจริง (actual use)  

2. ผูปวยทุกคนที่เขารวมในการวิจัยไดรับการติดตามดูแลทั้งหมดหรือไม และถูกนำมาวิเคราะหอยูในกลุมที่ไดรับการสุม
เลือกใชหรือไม 

การศึกษาทั่วๆ ไปทางคลินิกมีโอกาสที่ผูปวยบางรายอาจจะขาดการติดตามและหายไป แตสำหรับการวิจัยทางคลินิก


สิ่งที่ตองคำนึงถึงเปนอยางยิ่ง คือ ผูปวยที่ขาดการติดตามนั้นมีลักษณะพิเศษอยางไร ตัวอยางเชน ผูปวยอาจจะไมไดมาตามนัด
เนื่องจากวาเขามีอาการเจ็บปวยมากขึ้นจนเขาไมสามารถเดินทางมาตามนัดได ในทางกลับกันผูปวยอาจจะดีขึ้นมากและคิดวา
ไมจำเปนที่จะตองมาตรวจติดตามก็ได ถากลุมหนึ่งไดรับการพิสูจนแลววาการรักษามีประสิทธิภาพ ดังนั้นผูปวยที่หายดีแลวก็
อาจจะไมมารับการตรวจติดตาม ถาอีกกลุมหนึ่งใหผลการรักษาที่มีประสิทธิภาพนอยกวาก็อาจจะเปนไดวาผูปวยที่ไมมาตรวจ
ติดตามเพราะมีอาการที่แยมาก จึงเปนการยากที่ทราบวาทำไมผูปวยบางรายถึงไมมารับการตรวจติดตาม  
อยางไรก็ตาม เปนที่นากังขาวาผูปวยที่ผานการการสุมเลือกมาแลวขาดการติดตามรักษาเปนจำนวนมากอาจจะมี
ความแตกตางของประชากรทั้งสองกลุม และจะตองตระหนักมากขึ้น หากสัดสวนหรือจำนวนผูปวยที่ขาดการติดตามผลการ
รักษาของกลุมหนึงมากกวาอีกกลุมหนึ่ง การขาดการตรวจติดตามที่ยอมรับไดคือตองมีจำนวนนอยกวารอยละ 20 อยางไร
ก็ตาม ถาผลลัพธที่ไดมีจำนวนคอนขางนอย (เชน การเสียชีวิตจากหัวใจลมเหลว) แมวาจำนวนผูปวยที่ขาดการติดตามจะนอย
มากก็ทำใหการแปลผลลัพธการศึกษาเกิดอคติได  
ผูปวยที่เขารวมในการวิจัยอาจมีการเปลี่ยนแปลงการรักษา และอาจจะมีโอกาสสลับการรักษาจากกลุมหนึ่งไปอีก
กลุมหนึ่งได ไมวาจะเกิดเหตุการณแบบใดก็ตาม คำแนะนำที่ดีที่สุดคือ ใหทำการวิเคราะหตามกลุมที่ผูปวยไดรับการสุมเลือก
ตั้งแตแรกเริ่ม ซึ่งเปนไปตามความตั้งใจตั้งแตเริ่มวิจัย (intention­to­treat analysis) โดยใหคำนึงวาผูปวยที่มีการ
เปลี่ยนแปลงการรักษา หรือแมแตถอนตัวออกจากการศึกษา อาจจะมีความแตกตางเชนเดียวกันกับผูที่ไมมีการเปลี่ยนแปลง
การรักษา การคัดผูปวยกลุมที่เปลี่ยนแปลงการรักษานี้ออกจากการวิเคราะหจะทำใหเกิดความแตกตางระหวางผูปวยสองกลุม
ที่เขารวมในการวิจัย ความเทาเทียมกันในปจจัยตางๆเมื่อเปรียบเทียบการรักษาก็จะตางออกไป   
แหลงที่คนหาคำตอบ ผลการศึกษาจะระบุขอมูลวามีผูปวยที่ทำการสุมเลือกจำนวนเทาใด และผูปวยที่นำมาวิเคราะห
นั้นจำนวนเทาใด ผูประเมินบทความจะตองอานในเนื้อความของผลการศึกษาเพื่อประเมินจำนวนผูปวยที่ขาดการติดตามและ
เหตุผลที่การขาดการติดตาม 

Measurement  
1. การวัดผลลัพธเปนแบบรูปธรรมที่ชัดเจนใชหรือไม 
การออกแบบการวัดผลการรักษาวามีประสิทธิภาพหรือไมนั้นไมใชเรื่องงายเสมอไป ในบางโรคจะมีมาตรวัดที่ชัดเจน  
เชนโรคมะเร็งจะประเมินจากระยะเวลาที่ผูปวยรอดชีวิต ในขณะที่บางโรค เชน รูมาตอยด การวัดดวยระยะเวลาการรอดชีวิต
อาจไมเหมาะสม อาจจะตองใชมาตรวัดที่เปนการวัดระดับความรุนแรงของโรค การเคลื่อนไหวทางกายภาพที่สัมพันธกับภาวะ
ของโรค หรือคุณภาพชีวิตแทน การวัดผลลัพธของการรักษาอาจจะมีมากมายหลายมาตรวัด ซึ่งมีความจำเปนที่ควรจะเลือก
มาตรวัดใดมาตรวัดหนึ่งวัดที่ดีที่สุดมาประเมินประสิทธิภาพของการรักษา อาจเปนมาตรวัดเชิงบวกที่บงชี้วาอาการของโรคดี
ขึ้น เชน ระดับความแรงของโรคที่ลดลง หรือความพึงพอใจของผูปวย ในขณะที่อีกมุมหนึ่งอาจจะเปนมาตรวัดเชิงลบที่บงชี้วา
อาการของโรคแยลง เชน ภาวะแทรกซอนที่รุนแรง หรือแมกระทั่งการเสียชีวิต การใชมาตรรวัดระยะสั้นอาจไมไดบอก
ประสิทธิภาพของการรักษาที่ชัดเจน เชน ภาวะผูปวยที่สัปดาหที่สองหลังรับการรักษา เปนตน 
หากมีการใชมาตรวัดผลลัพธของการรักษาหลายมาตรวัด ควรเลือกมาตรวัดใดมาตรวัดหนึ่งเปนมาตรวัดหลักที่สำคัญ
เพื่อประเมินประสิทธิภาพของการรักษา มิฉะนั้นอาจจะพบปญหาเกิดความลำบากในการตัดสินใจในกรณีที่มาตรวัดบางตัวให
ผลความแตกตางอยางมีนัยสำคัญ ในขณะที่มาตรวัดอื่นไมบงชี้ความแตกตาง นอกจากนี้แลว ผลลัพธหลัก (primary 
outcome) ยังมีความสำคัญโดยเปนตัวแปรที่นำใชในการคำนวณขนาดตัวอยาง (sample size) บทความหลายงานวิจัยอาจมี
ผลลัพธหลักที่ประกอบดวยมาตรวัดหลายตัวมารวมกัน (composite endpoints) เชน การเกิด myocardial infarction 
(MI) หรือ การนอนโรงพยาบาลเนื่องจากหัวใจลมเหลว หรือ การเสียชีวิต โดยการวัดผลลัพธหลักคือ จะเกิดเหตุการณใดใน
มาตรวัดหนึ่งก็นับเปนการเกิดผลลัพธหลักเชนกัน และจะนับเฉพาะเหตุการณที่เกิดกอนเทานั้น 
การกำหนดผลลัพธ (outcome) ที่ดีนาเชื่อถือ ควรเปนผลลัพธที่สามารถวัดไดเปนรูปธรรม (objective outcome) 
มีเกณฑการประเมินผลลัพธที่ชัดเจนเพื่อใหผูประเมินแตละทานแตละสถาบันเขาใจตรงกันไมเกิดอคติในการประเมิน โดย
เฉพาะอยางยิ่งในการวิจัยที่เปนแบบ multi­centered trials กรณีที่ผลลัพธการศึกษาเปนนามธรรม (subjective outcome) 
ซึ่งไดแกอาการของโรคหรือการทำงานของรางกาย เชน ปวดทอง ปวดหัว หรือคุณภาพชีวิต เปนตน  
แหลงที่คนหาคำตอบ ในสวนของวิธีการศึกษาจะระบุผลลัพธหลัก (primary outcome) และรายละเอียดของวิธีการ
วัดหรือประเมินผลลัพธ 
2. ผูปวยและทีมที่ใหการดูแลรักษาไดรับการปกปดขอมูลของกลุมที่ไดรับจากการสุมเลือกหรือไม 
อคติ (bias) จะเกิดขึ้นไดจากหลายทิศทางเมื่อทราบวาผูปวยที่เขารวมการศึกษารายไหนอยูในกลุมการรักษาใด การ
วิจัยทางคลินิกที่ดีนั้น ทั้งผูปวย ทีมดูแลรักษา และนักสถิติที่ทำการวิเคราะหผลจะตองไมทราบวาผูปวยอยูในกลุมใดหลังสุม
เลือก โดยขอมูลจะปกปด (blind) จนการวิเคราะหขอมูลสิ้นสุด หากผูปวยเชื่อวาตนเองไดรับยาใหมที่มีราคาสูงอาจจะให
ขอมูลในทางบวกวาอาการดีขึ้นกวาที่เปนจริง  
ในแงของแพทยผูใหการรักษาผูปวย หากทราบวาผูปวยอยูกลุมใดก็จะมีผลตอวิธีการจัดการดูแลรักษา ตัวอยางเชน  
ถาทราบวาผูปวยอยูในกลุมที่การรักษามีประสิทธิภาพดอยกวา แพทยอาจจะใหการดูแลเพิ่มเติมและเขมงวดใสใจมากขึ้นเพื่อ
ชดเชยโอกาสที่สูญเสียไปเมื่อเทียบกับอีกกลุมที่เหนือกวา ถาการรับรูกลุมการรักษามีผลตอการจัดการดูแลทั้งหมดในภาพรวม  
ก็จะทำใหเกิดอคติไดดวยเชนกัน  
นอกจากนี้แลว อคติอาจเกิดไดในขั้นตอนการประเมินผลลัพธ หากแพทยผูรักษาหรือผูที่ทำการประเมินผลลัพธ
ทราบวา ผูปวยอยูในกลุมใด โดยเฉพาะการประเมินผลลัพธที่เปนนามธรรม ซึ่งการประเมินขึ้นกับการตีความหรือการให
ขอมูล ก็จะประเมินใหเกิดประโยชนตอกลุมที่ตนคาดหวังไวได ในขณะที่ผลลัพธที่เปนรูปธรรมจะมีการกำหนดเกณฑการ
ประเมินที่ชัดเจน การปกปดขอมูลการสุมเลือกอาจไมจำเปนมากนัก  
สำหรับนักสถิติหรือผูวิเคราะหขอมูล หากทราบผลการสุมเลือกแตละกลุม ก็จะสงผลใหผูวิเคราะหเสาะหาความแตก
ตางของขอมูลเพื่อที่จะนำไปสนับสนุนกลุมที่ตนตองการได ขอมูลใดที่ไมสนับสนุนผลการรักษาตามที่ตองการ ผูวิเคราะหก็จะ
ปดบังขอมูลนั้นไมรายงานผลวิเคราะหนั้น แตจะรายงานผลการวิเคราะหที่สนับสนุนตามสมมติฐานที่ตนเองตั้งไวเทานั้น การ
บิดเบือนขอมูลในการวิเคราะก็ถือเปนอคติในการศึกษาดวยเชนกัน  
แหลงที่คนหาคำตอบ ถางานวิจัยนั้นกลาวถึงการปกปองการรับรูวิธีการรักษา (masking of treatment) ขอมูลเหลานี้
จะอยูในสวนของวิธีการศึกษา เชน การใหยาหลอก (placebo) ที่มีลักษณะทางกายภาพเหมือนกัน (same appearance) กับ
ยาที่สนใจศึกษา กรณีที่เปนการเปรียบเทียบยาสองกลุมที่มีรูปแบบยาที่แตกตางจากยาที่สนใจศึกษา เชน ยาฉีด กับยาเม็ด 
แตละกลุมจะตองไดรับยาครบทั้งรูปแบบฉีดและเม็ด โดยการใหยาเม็ดหลอกในกลุมที่ไดรับยาฉีด และใหยาฉีดหลอกในกลุมที่
ไดรับยาเม็ดซึ่งเรียกวาการทำ double dummy  
ในกรณีที่กลุมใดกลุมหนึ่งตองไดรับการตรวจเพิ่มเติมมากกวาอีกกลุม จะตองมีการทำ sham therapy โดยใหการ
รักษาหลอก หรือทำการตรวจเชนเดียวกันทุกกลุม แตใหผลการตรวจหลอกในกลุมควบคุม เพื่อปกปดการรักษามิใหแพทยผู
รักษาตลอดจนผูวิเคราะห คาดเดาการสุมเลือกได  

What were the results? 


เมื่อประเมินบทความในสวนของ randomization, allocation และ measurement แลว หากงานวิจัยนั้นวิธีการ
วิจัยที่มีคุณภาพ นาเชื่อถือ ตัวบทความนั้นถือมีคุณคาตอการอาน การประเมินในสวนตอไปคือ การประเมินผลการศึกษาวามี
ประโยชนหรือไม มากนอยเพียงใด และมีความแมนยำเที่ยงตรงในการนำไปใชเพียงใด  
1. ผลการศึกษามี treatment effect มากนอยเพียงใด? 
ผลลัพธของการศึกษาสวนใหญจะนำเสนอในรูปของ dichotomous outcome คือมีสองคำตอบ เชน ใชหรือไมใช  
เกิดหรือไมเกิด ตายหรือรอด เปนตน และบางงานวิจัยก็มีการรวมผลลัพธหลายอยางเปนผลลัพธหลัก (primary outcome) 
ดังที่ไดกลาวมาแลวขางตน การนำเสนอผลการศึกษาวิจัยทางคลินิกสามารถนำเสนอในรูปแบบตางๆ ไดหลากหลาย ไดแก  
relative risk (RR), absolute risk reduction (ARR), relative risk reduction (RRR) และ number needed to treat 
(NNT) เปนตน ในบทความนี้จะกลาวถึงการคำนวณหลักๆ ของ RR, ARR, RRR และ NNT โดย 
● Relative Risk (RR) 
= risk of  the outcome in the treatment group / risk of  the outcome in the control group    
ซึ่งคา RR จะแสดงผลวา กลุมทดลองจะเกิดผลลัพธเปนกี่เทาเมื่อเทียบกับกลุมควบคุม RR = 1 หมายถึงทั้งสองกลุมไมแตกตาง
กัน RR < 1 หมายถึงการให intervention นั้นลดความเสี่ยงในการเกิดผลลัพธ ถา RR > 1 หมายถึง การให intervention  
เพิ่มความเสี่ยงตอการเกิดผลลัพธนั้น 
● Absolute Risk Reduction (ARR) 
= risk of  the outcome in the control group  −  risk of  the outcome in the treatment group    
คา ARR จะบอกคาความแตกตางสมบูรณของอัตราการเกิดผลลัพธระหวางสองกลุม ซึ่งจะบอกถึง baseline risk และ 
treatment effect คา ARR เทากับ 0 หมายถึงไมมีความแตกตางกันระหวางสองกลุม กลาวคือ การให intervention ไมเกิด
ผลใดๆ 
● Relative Risk Reduction (RRR)  
= absolute risk reduction / risk of  the outcome in the control group   หรือ = 1  −  relative risk    
คา RRR เปนคาประกอบของ RR และมักจะนำมาใชในการรายงานผลของ treatment effect โดยจะบอกถึงการลดลงของ
อัตราการเกิดผลลัพธในกลุมที่ไดรับ intervention เทียบกับกลุมควบคุม  
● Number Needed to Treat (NNT) = 1/ARR    

คา NNT นี้จะบงบอกถึงจำนวนผูปวยที่เราจะตองใหการรักษาดวย intervention นั้นๆ เปนระยะเวลาตามที่ระบุในการศึกษา 


เพื่อที่จะปองกันการเกิดผลลัพธที่แยหนึ่งเหตุการณ ซึ่งการคำนวณหา NNT นี้จะคำนวณเมื่อใหผลที่แตกตางอยางมีนัยสำคัญ
ทางคลินิก แตการจะนำคา NNT ไปใชจะตองพิจารณาถวงน้ำหนักคูกันกับการเกิดเหตุการณไมพึงประสงคจากการรักษานั้น  
หรือคำนวณเปน number nedded to harm (NNH) ตอไป 
ยกตัวอยางการวิจัยที่เปรียบเทียบการให intervention เทียบกับยาหลอก โดยใหยาตอเนื่องกันนาน 2 ป พบวา
กลุมควบคุมมีอัตราการเสียชีวิตรอยละ 15 และกลุมที่ไดรับ intervention เสียชีวิตรอยละ 10 คำนวณคา RR, ARR, NNT ได
ดังนี ้
 
Treatment  คาที่ได   หมายถึง 
effect 
RR  0.67  เนื่องจาก RR < 1 กลาวคือ การไดรับ intervention ลดความเสี่ยงตอการเสียชีวิต  
ARR  0.05  absolute benefit ของการไดรับ intervention คือลดอัตราการเสียชีวิตได 5% 
RRR  0.33  การให intervention ลดความเสี่ยงของการเสียชีวิตลงได 33% เมื่อเทียบกับกลุมควบคุม  
NNT  20  เราตองใหการรักษาที่เปน intervention ผูปวยจำนวน 20 รายเปนระยะเวลา 2 ป เพื่อที่จะ
ปองกันการเสียชีวิต 1 ราย 
 
2. คาประมาณการของ treatment effect มีความถูกตอง แมนยำเพียงใด? 

ความเสี่ยงของการเกิดผลลัพธที่แทจริงของประชากรนั้นเราไมสามารถทราบได ซึ่งวิธีที่ดีที่สุดเราทำไดเพียงประมาณ
คาความเสี่ยงที่แทจริงจากกลุมผูปวยตัวอยางที่อยูในการศึกษานั้น การประมาณการนี้เรียกวา point estimate เราสามารถวัด
หรือประมาณคาใหใกลเคียงกับคาแทจริงโดยดูที่ชวงความเชื่อมั่น (confidence interval, CI) ของแตละคาที่ตองการ ถา CI มี
ชวงแคบ เราเชื่อมั่นไดวาคา point estimate ที่ไดนั้นมีความแมนยำสะทอนคาที่แทจริงของกลุมประชากรได นอกจากนี้แลว  
คา CI ยังใหขอมูลเกี่ยวกับการมีนัยสำคัญทางคลินิกของผลการศึกษาดวย ถาคาที่ไดไมมีคาของ no effect ตกอยูนอกชวง
ความเชื่อมั่นที่ 95% ถือวาผลนั้นมีนัยสำคัญทางสถิติที่ p value = 0.05 ในทางกลับกันถาคาของ no effect ตกอยูในชวง CI 
ผลการศึกษานั้นไมมีนัยสำคัญทางสถิติ  

External Validity 
เมื่อประเมินบทความวิจัยทางการแพทยที่มีรูปแบบการศึกษาเปน RCT ในขั้นตอน internal validity ผานแลว จึง
จะมาประเมินในสวนที่เปน external validity หรือการนำไปใช (applicability) ในการวางแผนการรักษา  
Will the results help me in caring for my patient?  
กอนนำผลการศึกษามาใชในการดูแลผูปวย ควรตอบคำถามสามขอนี้เกี่ยวกับผูปวยและบริบทการดูแล ดังนี้  
1. ผูปวยที่เราดูแลมีความแตกตางจากผูเขารวมวิจัยมากจนไมสามารถนำไปใช ใชหรือไม 
พิจารณาคุณลักษณะของผูปวยตามเกณฑคัดเขาของการศึกษา วามีความแตกตางกันหรือไม ถาแตกตางกันก็ไมควร
นำ ผลการศึกษามาปรับใช กรณีที่คุณลักษณะผูปวยของเราเขากันไดกับเกณฑคัดเขาใหพิจารณาตอวา ผูปวยมีลักษณะตรงกับ
เกณฑคัดออกหรือไม ถาตรงกับเกณฑคัดออกก็ไมควรนำผลมาประยุกตใชดวยเชนกัน  
 
 
2. การใหการรักษาดูแลนั้น มีการใหบริการที่สถาบัน/องคกรที่ทานดูแลหรือไม? 
หากผูปวยที่ดูแลมีลักษณะเชนเดียวกับผูเขารวมวิจัยในการศึกษานั้น ตอมาใหประเมินวา intervention ที่ใหในการ
ศึกษานั้น ในองคกรของเรามีหรือไม นอกเหนือจาก intervention แลว จะตองพิจารณาองคประกอบอื่นๆ ดวยเชนกัน เชน  
การตรวจคาทางหองปฏิบัติการตางๆ เครื่องมือตางๆ ที่ใชในการวัดและประเมินผล เปนตน   
3. การใหการรักษาดูแลนี้กอใหประโยชนแกผูปวยมากกวาการเกิดความไมปลอดภัยตอผูปวย ใชหรือไม? 
เพื่อใหผูปวยไดรับประโยชนสูงสุดจากการไดรับการรักษาดูแลตาม intervention ที่ใหผลในการวิจัยนั้น จะตอง
พิจารณาในสวนของความปลอดภัยในการใหการรักษาดวย ซึ่งการประเมินวาไดประโยชนมากกวาความไมปลอดภัยนั้น จะ
ตองมองในหลายมุม มิใชมุมของผูใหการรักษาแตเพียงอยางเดียว ควรมองในมุมมองของผูปวยรวมดวย เชน การใหการรักษา
บางอยางมีผลดีแตผูปวยตองทนตออาการไมพึงประสงคที่รายแรง หรือผูปวยตองเดินทางมาติดตามผลการรักษาบอย ซึ่งบาง
ครั้งอาจจะไมสะดวกและคาใชจายเพิ่มสูงขึ้น เปนตน ในขณะเดียวกันการนำไปใชในผูปวยในวงกวางขึ้น ควรพิจารณาคาใช
จายตอแผนการรักษาตอคนอัตราการเจ็บปวย ซึ่งเปนในมุมมองของผูบริหารรวมดวย 

บรรณานุกรม 
1. Greenhalgh T. How to read a paper: The basics of evidence­based medicine. John Wiley & Sons; 
2014 Apr 7. 
2. Crombie IK. The pocket guide to critical appraisal: a handbook for healthcare professionals. 
London: BMJ Pub. Group. 1996. 
3. Courcier­Duplantier S, Falissard B, Fender P. Subjective Outcome Measures of Drug Efficacy. 
Thérapie. 2003 May 1;58(3):267­73. 
4. Centre of Evidence­based Medicine, University of Oxford. Critical Appraisal Sheet: Randomised 
Controlled Trials. 
5. Sackett DL, Rosenberg WM, Gray JM, Haynes RB, Richardson WS. Evidence based medicine: what it 
is and what it isn't. 
6. Boutron I, Moher D, Altman DG, Schulz KF, Ravaud P. Extending the CONSORT statement to 
randomized trials of nonpharmacologic treatment: explanation and elaboration. Annals of internal 
medicine. 2008 Feb 19;148(4):295­309. 
7. Rosenberg W, Donald A. Evidence based medicine: an approach to clinical problem­solving. BMJ: 
British Medical Journal. 1995 Apr 29;310(6987):1122. 

You might also like