You are on page 1of 15

บทที่ 15

บทความทบทวนวรรณกรรม
อยางเปนระบบ
อิศรางค นุชประยูร

15.1 บทนํา
บทความทบทวนวรรณกรรมในทางการแพทย (review articles) มี
อยู 2 ประเภท ทบทวนความฟนฟูวิชาการโดยทั่วไป (Narrative review)(1)
เปนการรวบรวมขอสรุปจากนิพนธตนฉบับ (original articles) หลายๆ
บทความรวมทั้งขอมูลลาสุด และความเห็นสวนตัวของผูนิพนธเพื่อทําการ
สังเคราะหใหไดเปนองคความรู โดยทั่วไปจะไมมีกฎเกณฑที่แนนอนวาการ
ทบทวนบทความต อ งทํ า อย า งไร โดยมากมั ก กํ า หนดเพี ย งจํ า นวน
เอกสารอ า งอิง ดัง นั้ น คุณ ภาพและความนา เชื่ อ ถือ ไดจึง แตกตา งกั น มาก
ผูอานบทความทบทวนวรรณกรรมจึงตองพิจารณาดวยตนเองโดยการสืบคน
เอกสารอางอิงกอนที่จะเชื่อขอสรุปที่ผูนิพนธเขียนขึ้น

บทความฟนฟูวิชาการอีกประเภทหนึ่ง คือ “การทบทวนวรรณกรรม


อยางเปนระบบ” (Systematic reviews)(2) เปนการทบทวนหลักฐานทางการ
แพทย คือขอมูลจาก original articles โดยไมมีความเห็นของผูนิพนธอยู มัก
ทบทวนเฉพาะการทดลองทางคลินิก (Clinical trials) แบบสุมและมีกลุม
ควบคุม (Randomized controlled trials, RCT) เทานั้น เนื่องจากเปน
หลักฐานการแพทยที่นาเชื่อถือที่สุด(3) ในกรณีที่มีการทดลองทางคลินิกแบบ
RCT หลากรายงานที่ไดทําไวตางวาระกันในอดีตแตมีลักษณะเหมือนกัน ก็
จะสามารถรวมขอมูลกันได แลวทําการวิเคราะหใหมโดยใชวิธีทางสถิติที่
เรียกวา Meta-analysis(4) เพื่อสรุปขอมูลรวมกัน ดังนั้น meta-analysis จึง
เปนสวนหนึ่งของ systematic reviews ซึ่งครอบคลุมทุกการทดลองไมวาจะ
รวมกันไดหรือไม ความสัมพันธของบทความฟนฟูวิชาการแบบตางๆ แสดง
ในภาพที่ 15.1

15.1 บทนํา
15.2 การทบทวนวรรณกรรมอยางเปนระบบ
15.3 Meta-analysis
15.4 สรุป
ภาพที่ 15.1 แผนภูมิแสดงความสัมพันธของการทบทวนวรรณกรรมทางการแพทยแบบตางๆ (5)

การทบทวนวรรณกรรมอาจทํ า ขึ้ น เพื่อ ทบทวน ดาน นอกจากนี้ผูนิพนธมักใหความเห็นสวนตัวปะปน ใน


การรั ก ษาโรค สาเหตุ ข องโรค การวิ นิ จ ฉั ย โรค หรื อ การ การสรุปจากทบทวนวรรณกรรม
พยากรณโรค บทความฟนฟูวิชาการโดยทั่วไป อาจมีอคติ
ได เนื่องจากปจจัยหลายอยางดังนี้ 15.1.3 คุณภาพของงานวิจัยที่ถูกอางอิง ผูทํา
1 5 . 1 . 1 ค ว า ม ลํ า เ อี ย ง ใ น ก า ร ตี พิ ม พ การทบทวนวรรณกรรมอาจนํ า เพี ย งข อ สรุ ป ของแต ล ะ
(Publication biases) วรรณกรรมทางการแพทยแบบ รายงานมาเสนอโดยมิไดสนใจคุณภาพของแตละรายงานก็
นิ พ นธ ต น ฉบั บ ที่ ไ ด รั บ การตี พิ ม พ มั ก จะเป น การศึ ก ษาที่ ได ดังนั้นขอสรุปจากงานวิจัยที่มีอคติ หรือจํานวนตัวอยาง
บรรณาธิการเห็นวามีประโยชนตอผูอานวารสารนั้น เชน ในการทําวิจัยนอย จึงไดรับการนําเสนอในรูปแบบเดียวกับ
งานวิจัยที่ไดผลวาปจจัยอยางหนึ่งเกี่ยวของกับโรคอยาง ขอสรุปจากงานวิจัยที่ดี โดยที่ผูอานไมสามารถแยกแยะได
หนึ่ง มีผลการทดลองทางคลินิกของยาหรือการรักษาอยาง โดยเฉพาะขอ สรุป ในเชิ ง บวกจากการศึ กษาที่มี อ คติ มั ก
หนึ่ ง ในทางบวก (6) มี โ อกาสได รั บ การตี พิ ม พ ม ากกว า ไดรับความสนใจมากกวา ขอสรุปในเชิงลบจากการศึกษา
งานวิจัยที่ไดผลการทดลองวาไมตางกัน ‘negative result’ ที่มคี ุณภาพดี
งานวิจัยอยางหลังนี้แมไดทํามากอนแตก็อาจไมมีโอกาสได
ตีพิมพเพราะบรรณาธิการของวารสารอาจไมเห็นวาจะมี 15.1.4 ขนาดตั ว อย า งของการทดลองทาง
ผลกระทบตอวิชาชีพหรือสังคม ดังนั้นผูเขียนบทความและ คลินิกควรจะมีผลตอความนาเชื่อถือของผลสรุปของ
ผูอานบทความทบทวนวรรณกรรมก็จะทราบเพียงขอมูลใน งานวิจั ย งานวิ จัย ประเภทการทดลองทางคลิ นิกหลาย
ดานบวกมากกวาดานลบ อยางไรก็ดี เมื่อไดมีการตีพิมพ รายงานที่ศึกษาผลของยาหรือการรักษาชนิดเดียวกันมักได
ผลในเชิงบวกแลว การศึกษาอยางเดียวกันแตใหผลตรง ข อ สรุ ป ไม ต รงกั น ว า การรั ก ษาอย า งใดอย า งหนึ่ ง ได ผ ล
ข า มจึ ง มี โ อกาสตี พิ ม พ ภ ายหลั ง ได แต มั ก จะช า กว า กั น หรือไม การทดลองทางคลินิกขนาดใหญนั้นทําไดยากและ
หลายป ใชเวลานาน มักจะมีจํานวนรายงานไมมากเทาการทดลอง
ทางคลินิกที่มีขนาดเล็กกวา หากผูทบทวนวรรณกรรมมิได
15.1.2 ความลําเอียงในการอางอิง (Citation ใหความสนใจกับขนาดตัวอยาง แตเลือกสรุปตามผลของ
biases) ผูนิพนธบทความทบทวนวรรณกรรมอาจเลือกที่ รายงานทุกชิ้นที่ไดอาน ผูทําการทบทวนวรรณกรรมสอง
จะกลาวถึงงานวิจัยบางชิ้น ที่มีขอ สรุปเขา ขางความเห็น คนอาจไดขอสรุปไมตรงกันแลวแตวาจะเลือกเชื่อรายงาน
ของตน(7) เพราะไมมีหลักประกันวาตองเสนอขอมูลทั้งสอง การทดลองใด
f 210 e
ทบทวนวรรณกรรมอยางเปนระบบ
15.2 การทบทวนวรรณกรรมอยางเปนระบบ ในปจจุบัน (พ.ศ. 2553) มีรายงานการทดลอง
(Systematic review) ทางคลินิกแบบ RCT ในเรื่องตาง ๆ กวา 530,000 เรื่อง(12)
Archie Cochrane เป น ผู ที่ ชื้ ใ ห เ ห็ น ถึ ง ความ การทบทวนวรรณกรรมประเภท RCT อยางเปนระบบ หรือ
สํา คั ญ ของผลการทดลองทางคลิ นิ ก แบบสุ ม และมี ก ลุ ม Systematic review จึงทวีความสําคัญตอแพทยทั่วไปมาก
ควบคุม (RCT) วา เปน หลั ก ฐานทางการแพทยที่มีค วาม ขึ้น
นาเชื่อถือมากมาตั้งแตป ค.ศ. 1972(8) และเปนผูที่ชี้ใหเห็น
ปญหาของแพทยผูรักษาซึ่งมักไมคอยจะมีเวลาไปคนควา การทบทวนวรรณกรรมอยางเปนระบบประกอบดวย
ผลงานวิจัย RCT เพื่อมาใชตัดสินใจในการดูแลรักษา รายละเอียดและวิธีการโดยสังเขป ดังนี้
ผู ป ว ย แพทย ทั่ ว ไปมั ก ได อ า นเพี ย งบทความทบทวน 15.2.1 ตั้ ง วั ต ถุ ป ระสงค ข องการทบทวน
วรรณกรรม ซึ่งในสมัยนั้นยังไมไดมีการรวบรวมหลักฐาน วรรณกรรม โดยคําถามทางคลินิกที่ตองการคําตอบอยาง
จาก RCT ใหเปนระบบและงายตอการสืบคน ตอมาจึงไดมี ชัดเจน โดยระบุรายละเอียด 5 ประการ วาจะประเมินผล
แพทย ผู ส นใจทํ า การทบทวนวรรณกรรมอย า งเป น ของยาหรื อ การรั ก ษาชนิ ด ใด ในประชากรกลุ ม ใด โดย
ระบบ เรียกวา Systematic review ซี่งทําใหการทบทวน เปรียบเทียบกับอะไร โดยวัดผลดีผลเสียแบบใด ดวยการ
วรรณกรรมเปนวิทยาศาสตรขึ้นมาและนาเชื่อถือไดโดยมี ทดลองแบบใด (study design) ยอวา PICOS ดังนี้
การวางแผนในการทําเชนเดียวกับการทําการทดลองทาง P = Participant (ประชากร) พึงระบุวา เปนผูปวยโรค
คลิ นิ ก ระบบการทบทวนวรรณกรรมเช น นี้ เรี ย กว า อะไร หรือเปนประชากรปกติ เด็กหรือผูใหญ
Cochrane collaboration( 9 ) ซึ่ ง ทํ า โ ด ย แ พ ท ย แ ล ะ I = Intervention (ยาหรื อ การรั ก ษา) ที่ ต อ งการจะ
นักวิทยาศาสตรผูสนใจจากนานาชาติ ทําการทบทวนแต ประเมินประสิทธิศักย (efficacy) นั้นคือยาอะไร
ละเรื่องและแกไขปรับปรุงเพิ่มขอมูลใหมในการทบทวน ยากลุมใด หรือเปนการรักษาชนิดใด
เรื่องเดียวกันนั้นเปนประจําเพื่อใหทันสมัยอยูเสมอ และ C = Comparison (กลุ ม เปรี ย บเที ย บ) อาจจะเป น
โดยเผยแพร ผ า นเทคโนโลยี ส ารสนเทศในรู ป ของ ยาหลอก (placebo) ยาหรื อ การรั ก ษาที่ เ ป น
Cochrane database of systematic reviews ทําให มาตรฐานเดิม (control group) หรือกลุมที่ไมได
ขอสรุปนาเชื่อถือมากกวาการทบทวนวรรณกรรมทั่วไป การรักษาใดๆ
บทความฟ น ฟู วิ ช าการ ซึ่ ง ได จ ากการทบทวน O = Outcome (การประเมิ น ผลดี ผ ลเสี ย ) นั้ น จะวั ด
วรรณกรรมทั่วไปอยางไมเปนระบบ มักไมใหความสําคัญ อะไรบ า งที่ มี ค วามหมายทางคลิ นิ ก เช น นั บ
กับ RCT เทาที่ควร ตัวอยางเชน การศึกษาเปรี ยบเทียบ จํานวนผูปวยที่ตาย วัดระดับสารอะไรในเลือด วัด
การดู แ ลผู ป ว ยโรคหั ว ใจขาดเลื อ ดในป 1985(10) พบว า อัตราการหายขาด หรือจํานวนวันที่รอดชีวิต ใน
ผู เ ชี่ ย วชาญโรคหั ว ใจส ว นมากแนะนํ า การดู แ ลผู ป ว ย บางการศึกษาก็เลือกประเมินผลขางเคียงที่เกิด
โรคหั ว ใจขาดเลื อ ดแตกต า งจากข อ สรุ ป ที่ ไ ด จ ากการ จากยา
ทบทวนวรรณกรรมอย า งเป น ระบบซึ่ ง สนใจเฉพาะ S = Study design (การทดลอง) แบบใดที่จะยอมรับ
หลั ก ฐานที่ เ ชื่ อ ถื อ ได จ าก RCT การทบทวนวรรณกรรม เขามาในกระบวนการทบทวนวรรณกรรม ในบาง
ทั่ ว ไปอย า งไม เ ป น ระบบ ทํ า ให ก ารรั ก ษาที่ ไ ด ผ ลดี ถู ก กรณีพึงยอมรับเฉพาะการทดลองทางคลินิกแบบ
นํามาใชกับผูปวยสวนใหญชาเกินควร และในบางครั้ง การ สุมที่มีกลุมควบคุมโดยที่ผูรว มวิจัย ไมรูวา ไดยา
รักษาที่ไมไดผลหรือมีอันตราย ยังคงมีการแนะนําใหใชอยู ชนิ ด ใด (blinded RCT) เท า นั้ น จึ ง จะถื อ ว า
เป น เวลานาน แม ว า จะได มี ก ารพิ สู จ น ว า ไม ไ ด ผ ลโดย นาเชื่อถือ แตในบางกรณีก็ไมจําเปนตองปกปด
RCT(11) ยาหรือวิธีการรักษา

f 211 e
ทบทวนวรรณกรรมอยางเปนระบบ
15.2.2 การวางแผนการทบทวนวรรณกรรม y จากการติดตอนักวิจัยเกี่ยวของกับเรื่องนั้นซึ่งอาจมี
อยางเปนระบบ (review protocol) ซึ่งประกอบดวย ขอมูลที่ไมไดตีพิมพ โดยอาจไดชื่อมาจากรายงาน
เหตุผลที่มาของคําถาม วิธีการสืบคน และวิธีการทบทวน โครงการวิ จั ย ของหน ว ยงานที่ ใ ห ทุ น หนั ง สื อ การ
วรรณกรรม (ดู ข อ 3-8) ที่ ไ ด ว างแผนไว ในการทบทวน ประชุมตางๆ ที่เกี่ยวของ วิทยานิพนธของนิสิต
วรรณกรรมในเครือขายของ Cochrane collaboration นั้น y ขอมูลจากวารสารภาษาอื่นๆ ที่สืบคนไดวาอาจมี
ผูวิจัยจะสงแผนการวิจัยทบทวนวรรณกรรมที่ไดเขียนขึ้นให ขอมูลที่เกี่ยวของกับหัวขอที่จะทบทวน เชน ใน
แพทย นั ก วิ จั ย ที่ ส นใจการทบทวนวรรณกรรมอย า งเป น ประเทศไทยมี Thai index medicus เปนตน เมื่อได
ระบบของกลุม Cochrane review group ที่ตรงกับประเด็น ต น ฉบั บ มาแล ว เช น วารสารภาษาจี น ก็ ทํ า การ
ไดทําการชวยอานแผนการวิจัย (peer review) เสียกอนวา แปลภาษาเพื่ อ ให ส ามารถประเมิ น คุ ณ ภาพของ
ขั้นตอนการวางแผนที่จะทํานั้นถูกตองเหมาะสม ไมมีอคติ วิธีการทําและขอมูลของการทดลอง
เมื่อนักวิจัยผูอื่นก็เห็นดวยกับแผนการดําเนินงานแลว จึง
เริ่มทํากระบวนการการทบทวนตามขั้นตอนตอไป แผนการ ตารางที่ 15.1 ตัวอยางการคนหาวรรณกรรมจากฐานขอมูล
ทบทวนวรรณกรรมที่ไ ดผา นการอา นโดยนักวิจัยในกลุ ม MEDLINE เรื่อง “snake bites”(13)
Cochrane review group แลวจะไดรับการลงทะเบียนและ set Search
ตีพิมพใ น Cochrane library เพื่อใหผูอื่น ทราบวา คําถาม 001 exp snake bites/
002 randomized controlled trial.pt.
การวิ จั ย นั้ น ๆ มี ผู ที่ กํ า ลั ง ดํ า เนิ น การอยู จ ะได ไ ม ทํ า งาน 003 randomized controlled trials/
ซ้ําซอนกัน 004 controlled clinical trial.pt.
005 random allocation
006 double blind method/
15.2.3 การสืบคนวรรณกรรม คือการรวบรวม 007 single blind method/
รายงานผลการวิ จั ย ทางคลิ นิ ก จากทั่ ว โลก ตามที่ ไ ด ตั้ ง 008 or/2-7
เกณฑ (criteria) ไวกอนวาจะเลือกวรรณกรรมประเภทใด 009 clinical trial.pt.
010 exp clinical trials/
มาทบทวน (เชน เลือกแตการศึกษาชนิด RCT เทานั้น) 011 (clin$ adj25 trial$).tw.
จากแหล ง ข อ มู ล ใดบ า ง โดยวิ ธี ก ารสื บ ค น ที่ มี แ บบแผน 012 ((singl$ or doubl$ or trebl$ or tripl$) adj25
แนนอน (ตารางที่ 15.1) ซึ่งในมาตรฐานของระบบทบทวน (blind$ or mask$)
013 placebos/
วรรณกรรมนี้ จะครอบคลุมทั้งขอมูล 4 แหลง เพื่อลดอคติ 014 placebo$.tw.
ในการตีพิมพ (Publication bias)(6) คือ 015 random$.tw.
y จ า ก ฐ า น ข อ มู ล ที่ มี ดั ช นี ไ ด แ ก ฐ า น ข อ มู ล 016 research design/
017 or/9-16
MEDLINE, ฐานขอมูล EMBASE, ฐานขอมูลของ 018 comparative study/
การทดลองทางคลินิก (Cochrane controlled 019 exp evaluation studies/
trials register)(12), และฐานขอมูลอื่นที่เกี่ยวของกับ 020 follow up studies
021 prospective studies
เรื่องจะทบทวน 022 (control$ of prospectiv$ or volunteer$).tw.
y จากการสื บ ค น เอกสารอ า งอิ ง ในการทบทวน 023 or/18-22
วรรณกรรมที่เคยมีผูทําไวกอน และเอกสารอางอิงที่ 024 animal/not (human/ and animal/)
025 8 or 17 or 23
อยู ใ นรายงานต น ฉบั บ แต ล ะรายงาน ซึ่ ง อาจลง 026 25 not 24
ตีพิมพในวารสารที่ไมไดอยูใน MEDLINE เปนตน 027 1 and 26
028 27

f 212 e
ทบทวนวรรณกรรมอยางเปนระบบ
15.2.4 การคัดกรองวรรณกรรม และเกณฑ ย า ที่ ใ ช ท ด ล อ ง ห รื อ เ ป น ก ลุ ม ค ว บ คุ ม
การคั ด วรรณกรรมเข า สู ก ระบวนการทบทวน (Performance bias) หรือไม
(inclusion criteria) เมื่อไดวรรณกรรมจากการสืบคนขอมูล ค. การวั ด ผล ทํ า โดยผู วั ด ผลไม ท ราบการรั ก ษา
แล ว พึ ง ทํ า การอ า นวรรณกรรมทุ ก ชิ้ น เพื่ อ ตั ด สิ น ว า (blinded outcome assessment) ห รื อ ไ ม
เขาเกณฑ inclusion criteria หรือไม การตั้งเกณฑการคัด กล า วคื อ อาจมี อ คติ ที่ เ กิ ด เนื่ อ งจากผู วั ด ผลการ
วรรณกรรมเขาซึ่งไดทําไวกอนในชวงที่วางแผนการวิจัย พึง ทดลองทราบว า ผู ป ว ยได รั บ การรั ก ษาหรื อ เป น
ระบุรายละเอียดของ PICOS, ระยะเวลาการติดตามผูปวย กลุมควบคุม (Detection bias) หรือไม
เปนตน เมื่ออานคัดกรองวรรณกรรมแลวพึงแยกวรรณกรรม ง. การวิ เ คราะห ข อ มู ล ได มี ก ารวั ด ผลผู ร ว ม
ที่เขาเกณฑไวเขาสูกระบวนการทบทวนวรรณกรรมตอ และ โครงการวิจัยทุกรายแมในรายที่ถอนตัวจากการ
แยกวรรณกรรมที่ไมเขาเกณฑแตไดมาพรอมกับการสืบคน ทดลอง (intent to treat analysis) หรือไม
ไวตางหาก วรรณกรรมที่มักไมเขาเกณฑ ไดแก การทดลอง จํานวนผูปวยที่ถอนตัวออกจากกลุมทดลอง หรือ
ทางคลินิกที่ไมมีกลุมควบคุม (uncontrolled studies) การ กลุมควบคุมไมเทากัน (Attrition bias) หรือไม
ทดลองทางคลินิกที่ไมไดเปนแบบสุม (non-randomized เมื่อวิเคราะหถึงอคติที่อาจเกิดขึ้นแลว ผูทบทวน
studies) รายงานซ้ํ า ซ อ นโดยใช ข อ มู ล ชุ ด เดี ย วกั น ซึ่ ง ผู วรรณกรรมจะลงผลการประเมินรายงานการทดลองทาง
ทบทวนจะต อ งใช เ พี ย งรายงานเดี ย วในการวิ เ คราะห คลินิกแตละชิ้นโดยใหเกรดวามีคุณภาพดีนาเชื่อถือเพียงใด
ทบทวน การทดลองที่ไดรับการรักษาหลายอยางพรอมกัน (16)
และบันทึกขอมูล ของแตละรายงานการทดลองลงในละ
ซึ่งทําใหสรุปผลของการรักษาที่สนใจไมชัดเจน เปนตน ชิ้นโดยใหเกรดวามีคุณภาพดีนาเชื่อถือเพียงใด และบันทึก
ขอ มูล ของแตล ะรายงานการทดลองในฟอรมที่เ ตรียมไว
15.2.5 ประเมิ น คุ ณ ภาพของวรรณกรรมที่ กอน และเปรียบเทียบผลการประเมินของผูทบทวนแตละ
เข า เกณฑ (14) การทบทวนวรรณกรรมนั้ น จะทํ า โดยผู คนซึ่งทําการวิเคราะหรายงานโดยเปนอิสระจากกัน หากผล
ทบทวนอยางนอย 2 คน โดยอานรายละเอียดของรายงาน การประเมินไมตรงกัน จะตองหาผูประเมินอีกคนหนึ่งเพื่อ
การทดลองทางคลินิกแตละชิ้นโดยใชวิจารณญานวิเคราะห ตั ด สิ น และรายงานไว หรื อ จะเลื อ กอภิ ป รายกั น จนได
วา มีผูปวยที่เขารวมในการทดลองกี่ราย ไดรับการรักษา ความเห็นที่ตรงกันทั้งคูก็ได
แบบที่ผูทบทวนไดตั้งคําถามตั้งแตแรกกี่ราย (intervention
group) ไดการรักษาในลักษณะกลุมควบคุมกี่ราย (control 1 5 . 2 . 6 ดึ ง ข อ มู ล จ า ก ร า ย ง า น (data
group) กลุ ม ควบคุ ม ได รั บ การรั ก ษาแบบใดหรื อ ไม extraction) ลงในแบบฟอรมที่ใชเก็บขอมูลที่ไดวางแผน
(placebo) วิธีการทําการทดลองอาจมีอคติใดๆ ในขั้นตอน กอนไวตามวัตถุประสงคของการทบทวน โดยทั่วไปรายงาน
ของการทําวิจัยดังตอไปนี้บาง(15) การทดลองทางคลิ นิ ก แบบ RCT จะมี ร ายละเอี ย ดมาก
ก. วิธีกําหนดการรักษาแบบสุม (randomization) พอที่จะคํานวณกลับไปไดวา ขอมูลดิบกอนที่จะสรุปผลนั้น
เหมาะสมหรือไม กลาวคือ อาจมีอคติในวิธีการ มีรายละเอียดอยางใด (ตารางที่ 15.2) แตหากรายงานมี
เลื อ ก ผู ป ว ย ที่ จะ ให กา รรั ก ษ า โ ด ย ก า ร สุ ม รายละเอียดที่ไมสมบูรณพอ ก็พึงติดตอผูนิพนธรายงานนั้น
(Selection bias) โดยไมไดปกปดผูปวยวาอยูใน โดยตรงเพื่อสืบหาขอมูลดิบมาวิเคราะหใหม เพื่อรวมกับ
กลุมทดลองหรือกลุมควบคุมใหดี (concealment รายงานอื่นที่รวมกันได
of allocation) หรือไม ห า ก มี RCT ที่ เ ข า เ ก ณ ฑ แ ล ะ มี คุ ณ ภ า พ
ข. วิ ธี ดํ า เนิ น การทํ า วิ จั ย อาจมี อ คติ ที่ เ กิ ด จาก นาเชื่อถือได เพียงหนึ่งรายงานก็พึงนําเสนอผลของการ
แพทยผูรักษาทราบวาผูปวยไดรับการรักษาดวย ทบทวนวรรณกรรม ในประเด็นที่ไดตั้งคําถามวิจัยไวตั้งแต

f 213 e
ทบทวนวรรณกรรมอยางเปนระบบ
แรก และกลาวถึง RCT อื่นที่มิไดรวมเนื่องจากอาจมีอคติ คลินิก (implication to practice) และในดานความจําเปน
ในการทําการทดลอง โดยไมพึงทํา meta-analysis เพราะ ที่จะตองทําการวิจัยตอ (implication to research) ผู
การรวมขอมูลจากการวิจัยที่มีอคติ ยอมไดผลที่มีอคติ ทบทวนบันทึกขอมูลทั้งหมดและขอสรุป สงใหบรรณาธิการ
ของกลุม Cochrane review group ที่เหมาะสมไดทําการ
15.2.7 การวิ เ คราะห ร วมข อ มู ล (Meta- peer review อีกครั้งหนึ่ง ผูทบทวนแกไขตามขอเสนอแนะ
analysis) ในกรณีที่มีรายงานการทดลองทางคลินิกแบบ จากบรรณาธิ ก าร จนกว า จะเห็ น ด ว ยกั น ทุ ก ฝ า ย เมื่ อ ผู
RCT ที่ เ ข า เกณฑ แ ละมี คุ ณ ภาพน า เชื่ อ ถื อ มากกว า หนึ่ ง ประเมิ น เห็ น ว า ผลการดํ า เนิ น การทบทวนวรรณกรรม
รายงาน ที่มีลักษณะของการทดลองเหมือนกันทั้งหมดหรือ น า เชื่ อ ถื อ ได ก็ จ ะสามารถตี พิ ม พ ใ นฐานข อ มู ล ของการ
บ า ง ส ว น ดั ง นี้ คื อ วิ ธี ก า ร คั ด เ ลื อ ก ผู ป ว ย เ ข า ร ว ม ทดลองทางคลินิก (Cochrane library) เพื่อใหผูอานทั่วโลก
โครงการวิจัยเหมือนกัน (inclusion criteria) ผูปวยเปนโรค สามารถเขาถึงผลงานไดอยางกวางขวาง การรายงานการ
แบบเดียวกัน (case definition) วิธีการวัดผลก็เหมือนกัน ทบทวนวรรณกรรมอย า งเป น ระบบนั้ น ควรได รั บ การ
วิธีการรักษาก็เหมือนกัน และการวางแผนการวิจัย (study รายงานตามรูปแบบที่เรียกวา Preferred Reporting
design) แบบเดียวกัน ก็จะนําสามารถขอมูลมารวมกัน Items for Systematic Reviews and Meta-Analyses(17)
และวิเคราะหใหมดวยสถิติ Meta-analysis (ดูดานลาง) (PRISMA, ตารางที่ 15.2) ผูทบทวนจะทําการทบทวนเรื่อง
เดิมทุกๆ 3 ปหรือตามความเหมาะสม เพื่อใหการทบทวน
15.2.8 การสรุปผล ผูทบทวนทําการสรุปผลตาม ทันสมัยอยูเสมอ
ประเด็นที่ไดระบุไวในวัตถุประสงค ในดานการนําไปใชทาง

ตารางที่ 15.2 การรายงานผลการทบทวนวรรณกรรมอยางเปนระบบและ meta-analysis ในรูปแบบ PRISMA(17)


หัวขอ ลําดับที่ รายละเอียด
TITLE
Title 1 มีวลีที่ทําใหผูอานรูวารายงานนี้เปน systematic review, meta-analysis หรือทั้งสองอยาง.
ABSTRACT
Structured 2 มีบทคัดยอที่มีแบบแผน ไดแก background; objectives; data sources; study eligibility criteria,
summary participants, and interventions; study appraisal and synthesis methods; results; limitations;
conclusions and implications of key findings; systematic review registration number.
INTRODUCTION
Rationale 3 บรรยายเหตุผลที่ทําการทบทวนวรรณกรรม ในบริบทของความรูในปจจุบัน
Objectives 4 ระบุปญหาที่ตองการจะตอบอยางชัดเจน วาจะประเมินยาหรือการรักษาชนิดใด ในประชากรกลุมใด เทียบ
กับอะไร โดยวัดผลดีผลเสียแบบใด ดวยการทดลองแบบใด (PICOS).
METHODS
Protocol and 5 ระบุวาไดมีการเขียนแผนการวิจัย (review protocol) หรือไม และจะสามารถคนมาอานไดหรือไมจากแหลง
registration ใด หรือไดลงทะเบียนไวที่ใดพรอมรายละเอียดและเลขทะเบียน
Eligibility criteria 6 ระบุเกณฑการคัดวรรณกรรมเขาสูกระบวนการทบทวน (เชน PICOS, ระยะเวลาการติดตามผูปวย) ลักษณะ
ของรายงาน (เชน ปที่ทําการศึกษา ภาษา การตีพิมพ) พรอมทั้งเหตุผล
Information sources 7 บรรยายแหลงขอมูลที่สืบคนทั้งหมด (เชน ใชฐานขอมูลใดระหวางปใดถึงปใด ติดตอผูทําการวิจัยเพื่อสืบคน
งานวิจัยที่ยังไมตีพิมพหรือไม) พรอมทั้งวันสุดทายที่ไดทําการสืบคน
Search 8 ใหรายละเอียดของวิธีการที่ใชสืบคนจากฐานขอมูลอยางนอยหนึ่งฐาน โดยมีรายละเอียดเพียงพอที่ผูอานจะ
ทําตามและไดผลเชนเดียวกัน
Study selection 9 ใหรายละเอียดระเบียบวิธีคัดเลือกวรรณกรรมที่นํามาทบทวน (เชน วิธีคัดกรอง เกณฑท่ใี ชในการยอมรับเขา

f 214 e
ทบทวนวรรณกรรมอยางเปนระบบ
มาทบทวน และรวมขอมูลในการวิเคราะห meta-analysis)
Data collection 10 บรรยายวิธีเก็บขอมูลจากวรรณกรรม (เชน การใชแบบฟอรม การเก็บขอมูลทําโดยผูวิจัยสองคนโดยไมขึ้นตอ
process กันหรือไม) และขั้นตอนการสืบคนขอมูลหรือยืนยันขอมูลจากผูวิจัยของรายงานโดยตรง
Data items 11 ใหรายละเอียดของตัวแปรที่เก็บ (เชน PICOS, แหลงทุน) การอนุมาน และการปรับปรุงขอมูลที่รายงานให
เปนไปตามโครงการวิจัย
Risk of bias in 12 บรรยายวิธีประเมินความเสี่ยงที่จะเกิดอคติในแตละรายงาน (รวมถึงประเด็นวา การประเมินทั้งรายงาน หรือ
individual studies เฉพาะวิธีที่วัดผลดีผลเสียของแตละการทดลอง), และไดใชผลการประเมินนี้ในการสังเคราะหขอมูลเพื่อการ
ทบทวนวรรณกรรมอยางไร
Summary measures 13 ระบุวิธีสรุปขอมูล (เชน risk ratio, difference in means).
Synthesis of results 14 บรรยายวิธีจัดการขอมูล และรวมขอมูลเพื่อการวิเคราะหตามที่เหมาะสม รวมถึงวิธีประเมินความเขากันได
(เชน I2) ในกรณีทที่ ําการวิเคราะหแบบ meta-analysis.
Risk of bias across 15 ระบุวิธีประเมินความเสี่ยงที่จะเกิคอคติในการรวมขอมูล (เชน ความลําเอียงในการตีพิมพ และการรายงาน
studies เฉพาะบางประเด็น)
Additional analyses 16 บรรยายวิธีวิเคราะหขอมูลเพิ่มเติม ถามี (เชน การวิเคราะหความไว การวิเคราะหกลุมยอย และ meta-
regression) และระบุวาการวิเคราะหนั้นไดวางแผนไวตั้งแตตนหรือไม
RESULTS
Study selection 17 ระบุจํานวนรายงานที่ไดรับการคัดกรองวาเขาเกณฑหรือไม และจํานวนรายงานที่เขาเกณฑการรับเขา
จํานวนรายงานที่เขาเกณฑคัดออก และจํานวนรายงานที่ไดรับการประเมินโดยสมบูรณเพื่อเก็บขอมูล พรอม
ทั้งเหตุผลสําหรับรายงานที่ถูกคัดออกในแตละขั้นตอน โดยควรแสดงในรูปแบบไดอะแกรม
Study 18 นําเสนอรายละเอียดของแตละรายงานในประเด็นที่ไดรับการเก็บขอมูล (เชน ขนาดของการศึกษา PICOS,
characteristics ระยะเวลาการติดตามผูปวย เปนตน ) พรอมกับการอางอิง
Risk of bias within 19 นําเสนอผลการประเมินความเสี่ยงที่จะเกิคอคติในการรวมขอมูลของแตละรายงาน โดยเฉพาะสําหรับผลดี
studies ผลเสีย ที่เปนคําถามของการวิจัย (โดยวิธีที่ไดแสดงไวในลําดับที่ 12)
Results of individual 20 นําเสนอผลการวิจัยของแตละรายงาน ตามจุดประสงคของการทบทวนวรรณกรรม ทั้งผลดีและผลเสีย โดย
studies นําเสนอผลของยาหรือการรักษาแตละอยางในรายงานแตละชิ้น ในรูปแบบที่ดูงาย และทั้งผลและชวงคา
ความเชื่อมั่นของแตละรายงาน ในรูปแบบเดียวกัน ซึ่งควรเปนรูปแบบกราฟ forest plot.
Synthesis of results 21 นําเสนอผลการวิจัยของ meta-analysis รวมทั้งชวงคาความเชื่อมั่น และความเขากันไดของรายงานที่ได
นํามารวมกันวิเคราะห
Risk of bias across 22 นําเสนอผลการประเมินความเสี่ยงที่จะเกิดอคติในการรวบรวมขอมูล (โดยวิธีที่ไดแสดงไวในลําดับที่ 15)
studies
Additional analysis 23 นําเสนอผลการวิเคราะหขอมูลเพิ่มเติม ถามี (เชน การวิเคราะหความไว การวิเคราะหกลุมยอย และ meta-
regression) โดยวิธีที่ไดแสดงไวในลําดับที่ 16
DISCUSSION
Summary of 24 สรุปผลการทบทวนวรรณกรรมในประเด็นที่ไดตั้งไวเปนวัตถุประสงคหลัก รวมทั้งความหนักแนนของหลักฐาน
evidence ที่ไดรวมรวมมา รวมถึงในมุมมองกับผูใ ชผลงานการทบทวนวรรณกรรม (เชน แพทยผูใหการดูแลรักษาผูปวย
ผูกําหนดนโยบาย)
Limitations 25 อภิปรายขอจํากัดของการทบทวนวรรณกรรม (เชน ความเสี่ยงที่จะเกิดอคติ), และขอจํากัดทางเทคนิกของ
การทํางาน (เชน ไมสามารถหาผลงานที่เขาเกณฑมาได หรือการคนพบอคติในรายงาน)
Conclusions 26 ระบุผลสรุป รวมทั้งความหมายของผลสรุปที่ได ในบริบทของหลักฐานอื่น ๆ ที่เกี่ยวของกับประเด็นที่ทบทวน
ความจําเปนและแนวทางที่ควรทําวิจัยตอในอนาคต
FUNDING
Funding 27 บรรยายแหลงทุนที่สนับสนุนการดําเนินการทบทวนวรรณกรรมอยางเปนระบบ การสนับสนุนแบบอื่น (เชน
การชวยใหไดมาซึ่งขอมูล) บทบาทของผูใหทุน

f 215 e
ทบทวนวรรณกรรมอยางเปนระบบ
ขอสรุปที่ไดจากการทบทวนวรรณกรรมอยางเปน บันทึกใหผูอื่นรูวาเปนสมมติฐานที่คิดไดหลังจากไดขอมูล
ระบบ ตามแบบแผนของ Cochrane collaboration จึงนับ มาแลว (post-hoc analysis)
ไดวาเปนสุดยอดแหงหลักฐานทางการแพทยในแตละเรื่อง
(18)
เปนหลักฐานที่เชื่อถือไดมากที่สุดในปจจุบันที่จะนําไป 15.3 Meta-analysis
พิจารณาประกอบการทําแนวทางเวชปฏิบัติ (clinical ในขั้นตอนของการทบทวนวรรณกรรมอยางเปน
practice guidelines) อยางไรก็ดีเนื่องจากขั้นตอนที่ ระบบ หากมีขอมูลที่รวมกันได ก็สามารถรวมขอมูลจาก
เขมงวดในการทบทวนวรรณกรรมอยางเปนระบบเทียบพอ หลายรายงานและวิ เ คราะห ใ หม โ ดยใช ส ถิ ติ ที่ เ รี ย กว า
กับการทําวิจัยตนฉบับ ทําใหปจจุบันมีเพียง 5676 เรื่อง Meta-analysis(19,20) หลักการสําคัญของการวิเคราะหแบบ
เทานั้นที่ไ ดรับการทบทวนอยางเปนระบบและตีพิมพใ น นี้ คือ การใหน้ําหนักของการทดลองทางคลินิกที่มีจํานวนผู
ฐานขอมูล Cochrane database of systematic review(12) รวมวิจัยมากมากกวาการทดลองทางคลินิกที่มีจํานวนผู
แลว โดยมีการปรับปรุงเพิ่มเติมทุก 3 เดือน และเผยแพร รวมวิจัยนอย (weighted average) ผลการวิเคราะหรวม
ผานทาง CD-ROM ชื่อ The Cochrane Library และ ย อ มได จํ า นวนผู ร ว มวิ จั ย มากขึ้ น กว า การทดลองใดๆ
World Wide Web (http:/www.cochrane.org) ขอสรุปที่ไ ดจาก Meta-analysis จึงหนักแนนกวาผลการ
การทบทวนอยางเปนระบบ มักใหความสําคัญ วิ จั ย แต ล ะชิ้ น การทํ า meta-analysis ที่ น า เชื่ อ ถื อ นั้ น
แกการทดลองทางคลินิกแบบ RCT เปนอยางสูง อยางไรก็ จําเปนตองวิเคราะหมาจากงานวิจัยที่มีคุณภาพ มีความ
ดีสําหรับคําถามทางคลินิกบางอยางที่ไมเคยมีผูใดรายงาน นาเชื่อถือ เทานั้น ไมพึงรวมเอางานวิจัยที่อาจจะมีอคติใน
RCT ไวเลย ผูทําการทบทวนอยางเปนระบบก็สามารถใช การทําวิจัยเขามารวมดวย
หลั ก ฐ า น ที่ ดี ที่ สุ ดที่ มี อ ยู ในกา รสรุ ป ผ ล ใ น รู ป ข อ ง การทบทวนวรรณกรรมไม พึ ง ต อ งใช Meta-
qualitative review (รูปที่ 15.1) ได พรอมขอเสนอแนะวา analysis เสมอไป หากการทําทบทวนวรรณกรรมแลวไม
ควรจะมี ก ารทํ า RCT เพื่ อ ให ไ ด ห ลั ก ฐานที่ มี น้ํ า หนั ก พบวา มีรายงานวิจัยที่นา เชื่อถือเลย หรือมีแ ตร ายงานที่
นอกจากนี้ยังมีผูคิดทําการทบทวนวรรณกรรมในสาขาอื่น นาเชื่อถือเพียงรายงานเดียว ก็ไมพึงทําการวิเคราะหแบบ
เชน การวิเคราะหรวมเพื่อหาอุบัติการณของโรคหรือภาวะ Meta-analysis หรือถาหากไดลองทําการวิเคราะหแลวจะ
ตา งๆ ที่ ไ ด มี ก ารทํ า การสํ า รวจหลายครั้ ง เป น ต น แต ใ น ได ข อ สรุ ป ที่ ทํ า ให ผู อ า นเข า ใจผิ ด ได การวิ เ คราะห แ บบ
บทความนี้จะมิไดกลาวในรายละเอียด Meta-analysis ยอมไมเหมาะสม(20)
การทบทวนวรรณกรรมอยา งเปน ระบบจึง มิ ใ ช
เปนเพียงการทบทวนวรรณกรรมเทานั้น แตเปนงานวิจัย วิ ธี ก ารทางสถิ ติ ที่ เ กี่ ย วข อ งกั บ การทํ า meta-analysis ที่
ชนิดหนึ่งที่จะตองมีสมมติฐาน และการทดสอบสมมติฐาน สําคัญ มีดังตอไปนี้
ที่ไดตั้งขึ้นไวกอนเริ่มการทําวิจัย (a priori hypothesis) มี 15.3.1 Mean estimate of treatment effect
การวางแผนการวิจัย (proposal) ลวงหนาวาจะเก็บขอมูล วิธีที่ใชวิเคราะหผลรวม ขึ้นอยูกับลักษณะของขอมูล ใน
วรรณกรรมอย า งไร จะวิ จ ารณ ว รรณกรรมอย า งไร การวิเคราะหผลที่ไดจากการทําการทดลองทางคลินิกนั้น
จะวิ เ คราะห อ ย า งไร และในระบบของ Cochrane มั ก รายงานผลของยาหรื อ intervention ด ว ยค า odds
collaboration นั้ น จะส ง ให ผู อื่ น อ า นเสีย ก อ น (peer ratio (OR, ตารางที่ 15.2) หรือ relative risk (RR, ตาราง
reviewed) วาแผนการทบทวนวรรณกรรมนั้นนาเชื่อถือ ที่ 15.2) ตอผลที่เกิดขึ้น (outcome) หลังจากการรักษา
และได ม าตรฐานสากล แล ว จึ ง เริ่ ม ทํ า การวิ จั ย ทบทวน แบบหนึ่ง (treatment group) เทียบกับไมไดรับการรักษา
วรรณกรรม เหมือนอยางที่ไดเขียนไวในแผนการวิจัยทุก (placebo group) การรักษาที่ไดผลคือโอกาสเสี่ยงที่จะ
ประการ หากไดคนพบความคิดใหมในระหวางการทําก็พึง เกิดผลเสีย (เชนการเสียชีวิต) ถาไดรับการรักษานอยลง

f 216 e
ทบทวนวรรณกรรมอยางเปนระบบ
กวาถาไมไดรับการรักษานั้นๆ (OR or RR <1.0) อยางไรก็ ชวงความเชื่อมั่น 95% กวางซึ่งแสดงเปนเสนยาว สวนผล
ดี แม ว า ค า RR เป น ค า ที่ มี ค วามหมายในทางคลิ นิ ก ที่ จากการทดลองทางคลินิ ก ขนาดใหญจ ะแสดงดว ยมีจุ ด
เหมาะสม แตในการวิเคราะหแบบ Meta-analysis นิยม สี่เหลี่ยมขนาดใหญและชวงความเชื่อมั่น 95% แคบซึ่ง
แสดงผลในรูป odds ratio เนื่องจากวิธีการคํานวณแบบนี้ แสดงเปนเสนสั้นๆ ในบรรทัดสุดทายจะเปนผลรวมของการ
ใหผลที่เที่ยงตรงและไมคอยถูกรบกวนโดยขอมูลที่มีคาสูง ทดลองทุ ก รายงานเข า ด ว ยกั น แสดงเป น สี่ เ หลี่ ย มข า ว
มากหรือต่ํามาก (robust statistics) หลามตัดที่มีสวนหนาที่สุดตรงกับผลรวมของยาหรือการ
รักษา และความกวางคือชวงความเชื่อมั่น 95% ซึ่งมักจะ
15.3.2 Confidence interval (CI) หรือชวง แคบลงกวาเสนตรงของการทดลองแตละรายงาน
ความเชื่อมั่น 95% ของ OR เปนคาสถิติที่แปรผกผันกับ เสนทึบในแนวตั้งของ Forest plot จะตัดกับสเกล
จํ า นวนผู เ ข า ร ว มการทดลอง ถ า มี จํ า นวนผู เ ข า ร ว มการ ที่แสดงคา OR หรือ RR = 1 ซึ่งแสดงวายาหรือการรักษา
ทดลองนอย ชวงความเชื่อมั่นกวางและอาจครอบคลุมคา ไมมีผลดีหรือผลเสียแตอยางใด (no effect line) ในกรณีที่
1.0 ซึ่งแปลวาการไดหรือไมไดรับการรักษาใหผลไมตางกัน แสดงผลเสีย (เชน อัตราตาย) คาที่อยูทางซายของเสนทึบ
เมื่อมีการรวมขอมูลในการทํา meta-analysis จะทําให ในแนวตั้งนี้ คือ OR หรือ RR <1 แสดงวายาหรือการรักษา
ชว งความเชื่ อ มั่ น แคบลง จนถ า OR < 1.0 และ CI ทํ า ให ผ ลเสี ย น อ ยลง แสดงว า ยาหรื อ การรั ก ษานั้ น มี
ไมครอบคลุมคา 1.0 จึงสรุปไดวาการรักษาไดผลดีจริง ประโยชน สวนคาที่อยูทางขวาของเสนทึบในแนวตั้งนี้ คือ
การนําเสนอผลการวิเคราะหมักทําเปน รูปกราฟ OR หรือ RR > 1 แสดงวายาหรือการรักษาทําใหผลเสีย
ที่เรียกกันวา ‘Forest plot’ โดยแสดงผลการรักษาเปนจุด มากขึ้น กลุมที่ไมไดรับยาหรือการรักษากลับ ดีกวา หาก
สี่เหลี่ยมจตุรัสทึบอยูตรงกลางของชวงความเชื่อมั่น 95% เสนตรง หรือสี่เหลี่ยมขาวหลามตัดของการทดลองใดคาบ
ซึ่งแสดงเปนเสนตรง มาตราสวนเชิงลอการิทึม ผลจากการ เสน ทึบในแนวตั้งนี้ ก็แสดงวาผลการทดลองไมสามารถ
ทดลองทางคลินิกขนาดเล็กจะมีจุดสี่เหลี่ยมขนาดเล็กและ สรุปไดวายาหรือการรักษานั้นดีกวากลุมควบคุม

ภาพที่ 15.2 ตัวอยางรูปแบบ Forest plot แสดงผลของของยาหรือการรักษา (intervention) เทียบกับยาหลอก (placebo)


หรือกลุมควบคุม (control group) ที่ไดจากการทดลองทางคลินิกแตละรายงานและผลการวิเคราะหรวม,
# เปนตัวเลขที่แสดงในกราฟ

f 217 e
ทบทวนวรรณกรรมอยางเปนระบบ
สถิ ติ ที่ ใ ช วิ เ คราะห ขึ้ น อยู กั บ ชนิ ด ของข อ มู ล ระดับสารในเลือด ก็อาจใชสถิติความแตกตางถวงน้ําหนัก
(ตารางที่ 15.3, 15.4) หากเปนขอมูลแบบทวิภาค เชน (weighted mean difference) หรือ standardized mean
ตายหรือไมตาย หายหรือไมหาย ก็อาจใชสถิติ odds ratio, difference ตามความเหมาะสม หากเปนขอมูลของผูปวย
relative risk, หรือ risk difference ตามความเหมาะสม แตละรายก็พึงใช odds ratio
หากเป น ข อ มู ล ที่ เป น ตั ว เลข ต อ เนื่ อ ง เช น ความสู ง

ตารางที่ 15.3 คาสถิติที่เกี่ยวของกับการทํา meta- analysis20

การรักษา (treatment) หรือ จํานวนผูปวยทีเ่ กิดผลเสีย จํานวนผูปวยทีไ่ มเกิดผลเสีย รวม


การไดรับเหตุ (exposure) (event) (no event)
ไดรับ (treatment group) A B A+B
ไมไดรับ (control group) C D C+D
รวม A+C B+D N

OR Odds ratio = (A / B)
(C / D)

(A / (A + B))
RR Relative risk = RR reduction = 1 – RR
(C / (C + D))

ARR Absolute risk reduction = (A / (A+B)) – (C / (C+D)) NNT, Number needed to treat = 1 / ARR

⎛ O −E ⎞
Peto Odds ratio, PetoORi = exp ⎜ i i ⎟
⎝ Vi ⎠

สถิ ติ ที่ ใ ช แ ต ล ะอย า ง ก็ มี แ บบจํ า ลองของการ คือ 1/variance) หากเปนขอมูลทวิภาคก็ใชสถิติโดยวิธีของ


วิเคราะหสองแบบ(21) (ภาพที่ 15.3) แบบจําลองหรือโมเดล แมนเทล-แฮนเซล หรือปโต (ตารางที่15.3)
‘Fixed effect model’ อนุมานวาในทุกการทดลองทาง สวนแบบจําลองการวิเคราะหหรือโมเดลทางสถิติ
คลินิกนั้นจะมีผลที่แทจริงของยา (true effect) เชนเดียวกัน ‘Random effect model’ (ภาพที่ 15.3) อนุมานวาในการ
หากการทดลองนั้นมีผูรวมการวิจัยมากๆ ยอมไดผลแบบ ทดลองทางคลินิกแตครั้ง นั้นมีผลที่แทจริงของยาในแตละ
เดียวกันที่แทจริงนั้น แตเนื่องจากการทดลองแตละครั้งมีผู ประชากรที่ศึกษาไมเหมือนกัน (trial specific effect) ถึง
ร ว มวิ จั ย จํ า นวนจํ า กั ด จึ ง ได ผ ลมากบ า งน อ ยบ า ง ความ การทดลองนั้นจะมีผูรวมการวิจัยมากๆ ผลก็จะออกมาไม
แตกตางของผลการทดลอง (result) นั้นเกิดโดยบังเอิญ เหมือนกันอยูดี ในความเปนจริงผลการทดลองทางคลินิก
อยางสุม (random error) ดังนั้นความเที่ยงตรงของผลการ แตละรายงานยอมไมมีทางเหมือนกันเพราะเหตุนี้รวมกับ
ทดลองทางคลินิกจึงขึ้นกับจํานวนของผูรวมวิจัยคือเปน การที่จํานวนผูรวมวิจัยที่จํากัดยอมทําใหผลที่เกิดขึ้นอาจ
สวนกลับของการกระจายของขอมูล (inverse variance แตกตางเพราะปจจัยอื่นที่เกิดขึ้นอยางสุมดวย ผลการ
วิ เ คราะห ร วมจึ ง ได เ ป น ค า เฉลี่ ย ของผลที่ แ ท จ ริ ง (true

f 218 e
ทบทวนวรรณกรรมอยางเปนระบบ
mean effect) และชวงความเชื่อมั่นชวงหนึ่ง สถิติใน ratio และ คาความเชื่อมั่นที่ 95% ของ odds ratio ดังกลาว
โมเดลนี้ไดแก สถิติของเดอรซิโมเนียนและแลรด (ตารางที่ ของแตละการทดลอง และจากขอ มูลที่รวมกัน วิเคราะห
15.4) และสรางกราฟ forest plot และเลือกสถิติอื่นๆ ที่ใชการ
ในทางปฏิบัติ เราอาจใชซอฟทแวรโปรแกรมชื่อ วิ เ คราะห meta-analysis ได ซอฟท แ วร ที่ ส ามารถใช
Review Manager (Revman) 5.0 เพื่อลงขอมูลที่ไดจาก วิเคราะห meta-analysis ก็มีอยูใน SAS version 9
แตละรายงาน โปรแกรมจะทําการคํานวณคา Peto odds

ตารางที่ 15.4 การเลือกใชสถิติสําหรับการวิเคราะหแบบ meta- analysis(20)


ชนิดของขอมูล สถิติที่ใชสรุปSummary แบบจําลอง วิธีคํานวณสถิติ
Statistics Model Method
ขอมูลแบบ ทวิภาค Odds ratio (O-E) Fixed effect Peto, Mantel-Haenszel
(Dichotomous) Random effect DerSimonian & Laird
Relative risk Fixed effect Mantel-Haenszel
Random effect DerSimonian & Laird
Risk difference Fixed effect Mantel-Haenszel
Random effect DerSimonian & Laird
ขอมูลแบบตอเนื่อง Weighted mean Fixed effect Inverse variance
(Continuous) difference Random effect DerSimonian & Laird
Standardized mean Fixed effect Inverse variance
difference Random effect DerSimonian & Laird
ขอมูลผูปวยแตละราย
Odds ratio (O-E) Peto
(Individual patient data)

ภาพที่ 15.3 ความแตกตางของแบบจําลองการวิเคราะหทางสถิติที่ใชใน Meta-analysis (21)


f 219 e
ทบทวนวรรณกรรมอยางเปนระบบ
1 5 . 3 . 3 ก า ร ท ด ส อ บ ค ว า ม เ ข า กั น ไ ด สามั ญ สํ า นั ก และสติ ป ญ ญาของผู วิ เ คราะห ป จ จั ย ที่
(Homogeneity test) ของรายงานการทดลองทาง อาจจะเปนเหตุไดแก ขนาดของยาหรือการรักษาที่ใชที่ไม
คลินิกที่มารวมกันวิเคราะห ดังที่ไดกลาวขางตนแลววา เทากันทีเดียวนัก เวลาที่ใหยานานไมเทากัน ยาที่ใชรวมกัน
การตัดสินใจเลือกรายงานการทดลองทางคลินิกเพื่อรวม ในระหวางการทดลองทางคลินิก กลุมอายุของผูเขารวม
ขอมูลกันแลววิเคราะหนั้นเปนขั้นตอนที่สําคัญยิ่ง การที่จะ วิจัย (เชน ผูใหญหรือเด็ก) เชื้อชาติของผูเขารวมวิจัย เปน
ตัดสินใจจะนําขอมูลมารวมกันไดหรือไมนั้น นอกจากจะใช ตน เมื่อไดแนวคิดวาปจจัยใดอาจเปนเหตุ ก็ลองใชปจจัย
วิจารณญานของผูวิเคราะหระเบียบวิธีทดลองทางคลินิก นั้ น จํ า แนกกลุ ม ของรายงานการทดลองออก เรี ย กว า
ของแต ล ะรายงานว า เหมื อ นกั น แล ว ยั ง อาจทํ า การ stratification แลววิเคราะหใหม หาก heterogeneity
ตรวจสอบทางสถิติ วาคา OR และ CI ที่ไดจากการทดลอง หายไปก็รายงานไววาปจจัยนี้อาจจะอธิบายความแตกตาง
สองรายงานนั้น แตกตางกันมากเสียจนไมควรนําขอมูลมา ให ผู อ า นทราบ นอกจากนี้ อ าจลองวิ เ คราะห ด ว ยสถิ ติ ที่
รวมกันหรือไม ดวยสถิติที่เรียกวา homogeneity test(20) เรียกวา meta-regression(23)
หากพบวาแตกตางกันอยางมีนัยสําคัญ แสดงวาวิธีการทํา
การทดลองทางคลินิกแตละรายงานนั้น มีความแตกตาง 15.3.4 การวิ เ คราะห ก ลุ ม ย อ ย (Subgroup
กันในวิธีการทําวิจัยมากเกินไป ทําใหผลการศึกษาตางกัน analysis)(20) การทดลองทางคลินิกบางอยางพบวาไมพบ
มากเกินวาจะอธิบายไดดวยความบังเอิญอันเกิดจากการ ความแตกตางของผลการรักษา แตเมื่อวิเคราะหแบงกลุม
สุมตัวอยาง ยอยตามปจจัยบางอยาง (Subgroup) เชน อายุ เปนเด็ก
สถิ ติ ที่ ใ ช ท ดสอบความเป น เอกภาพของการ หรือผูใหญ แลวพบวาในบางกลุมยอยนั้นพบวาการรักษามี
ทดลองทางคลินิก ไดแก Cochran’s Q test ซึ่งเปนการ ผลดี ห รื อ ผลเสี ยที่ มีนัย สํา คัญ เนื่ อ งจากกลุ มยอ ยย อ มมี
ทดสอบแบบ χ2 ชนิดหนึ่งโดยมีสมมติฐานวา ผลการ จํานวนผูรว มวิจัยนอยกวา การศึ กษาทั้ง หมดนั้น การทํา
ทดลองของทุ ก รายงานนั้ น ไม ต า งกั น (homogenous) meta-analysis จึงทําใหมีขอมูลมากพอที่จะจําแนกกลุม
หากพบวาคา Q ที่ไดสูงเกินการกระจายปกติก็แสดงวามี ยอย และรวมขอมูลเฉพาะในกลุมยอยเพื่อทําการวิเคราะห
ความแตกตางกัน (มี heterogeneity) ซึ่งจําเปนตองสืบหา รวม เพื่อไดขอสรุปของผลในกลุมยอยที่แนชัดยิ่งขึ้น เปน
ตอไปวา ปจจัยอะไรนาจะเปนเหตุที่อธิบายความแตกตาง ตน
ระหวางการทดลองคลินิกที่เราพยายามจะวิเคราะหรวมกัน การวิเ คราะหกลุ มย อ ยนั้น จะไดผ ลที่ น า เชื่ อ ถื อ
นั้น นอกจากสถิตินี้แลวยังอาจใชคา I2 index(22) เพื่อบงชี้ ก็ตอเมื่อเปนการวิเคราะหที่ไดมีการวางแผนไวตั้งแตแรก
วาความหลากหลาย (variability) ในการวิเคราะหรวมนั้น หรือเปน a priori hypothesis ของการทบทวนวรรณกรรม
เกิ ด จากความหลากหลายของการทดลองคลิ นิ ก สั ก กี่ หากเปนการวิเคราะหที่ไดลองทําเมื่อไดเก็บขอมูลไปแลว
เปอรเซ็นตของ หาก I2 index = 0% แสดงวาความ เพราะว า ดู ข อ มู ล แล ว เพิ่ ง คน พบว า อาจได ข อ สรุ ป ใหม ที่
หลากหลายล ว นเกิ ด ขึ้ น จากความบั ง เอิ ญ ในการสุ ม นาสนใจ ก็พึงรายงานไววาเปนการคนพบภายหลังการทํา
ตัวอยาง หาก I2 index = 50% แสดงวาความหลากหลาย วิจั ย (post-hoc analysis) ขอ สรุป ที่ไ ด มาดว ยวิธีก ารนี้
ครึ่งหนึ่งเกิดจากความไมเหมือนกัน (heterogeneity) ของ ยอ มไม มี น้ํ า หนั ก มากเท า กั บ อย า งแรก แต ก็ อ าจจะเป น
แตละการทดลอง รายงานสวนใหญจะใชสถิติเหลานี้เพื่อ แนวคิ ด เพื่ อ การพิ สู จ น ใ นการทํ า การทดลองในอนาคต
ช ว ยเสริ ม ให ผู อ า นเห็ น ด ว ยว า วิ ธี ก ารที่ ผู นิ พ นธ ใ ช คั ด นอกจากนี้ ผลการวิ เ คราะห จ ะน า เชื่ อ ถื อ ถ า หากว า การ
วรรณกรรมมารวมกันวิเคราะหนั้นนาเชื่อถือจริง วิเ คราะหกลุมยอ ยนั้น ไดจากข อ มูลกลุมยอ ยจากหลาย
ในกรณีที่พบ heterogeneity ระหวางการทดลอง การศึกษารวมกันมากกวาผลการวิเคราะหกลุมยอยที่เปน
ทางคลินิกหลายรายงาน เราพึงสืบหาปจจัยที่อาจจะเปน บวกเพราะเป น ข อ มู ล จากการศึ ก ษาเพี ย งชิ้ น เดี ย ว
เหตุใหเกิดความแตกตางกันนั้น(20) การคิดหาปจจัยที่ทําให เปรี ย บเที ย บกั บ กั บ การศึ ก ษาอื่ น นอกจากนี้ ค วาม
แตกตางนั้น ไมมีสูตรสําเร็จ ตองอาศัยความคิดสรางสรรค

f 220 e
ทบทวนวรรณกรรมอยางเปนระบบ
นาเชื่อถือของการวิเคราะหจะเพิ่มขึ้นถามีทฤษฎีอื่นรองรับ วิเ คราะห เ พิ่ ม เติ ม โดยลองตั ด ข อ มู ล จากเฉพาะรายงาน
ดวย ที่นาสงสัยนั้นออกและวิเคราะหรวมเฉพาะรายงานอื่นที่
15.3.5 Sensitivity analysis(20) การทํา meta- เหลือเสียใหม หากผลการวิเคราะหยังไดขอสรุปเชนเดิม
analysis จากการทดลองที่มีหลายรายงานนั้น ในกรณีที่ ก็ จ ะทํ า ให ข อ สรุ ป ของการวิ เ คราะห นั้ น น า เชื่ อ ถื อ ยิ่ ง ขึ้ น
พบวาบางรายงานไดผลตางจากรายงานอื่นๆ อยางมาก แตห ากทํา การวิเ คราะหใ หมแ ลว ไดขอ สรุป ต า งจากเดิ ม
หรื อ มี ร ายงานที่ มี ข นาดใหญ ม ากกว า รายงานที่ เ หลื อ ก็พึงรายงานไวตามที่ไดวิเคราะหทั้งสองอยาง เพื่อใหผูอาน
ทั้งหมด หรือมีรายงานที่นาจะสําคัญแตที่นาสงสัยวาจะ ใชวิจารณญานของตนวาจะเชื่อถือขอสรุปแบบใด
ดอยคุณภาพกวามาตรฐานที่เรายอมรับ เราจึงควรทําการ

ภาพที่ 15.4 ตัวอยาง Funnel plot โดยการแสดงความสัมพันธระหวางขนาดตัวอยาง (study weight or sample size)
กับผลสรุป (odds ratio) จากรายงานที่นํามารวมกันวิเคราะหแบบ meta-analysis, ภาพซายมือมีลักษณะ
เหมือนกรวยคว่ําแสดงวา ไมนาจะมีปญหาเรื่องความลําเอียงในการตีพิมพ สวนภาพขวามีแตรายงานที่
odds ratio สูงกวาประมาณ 1 แสดงวาอาจมีปญหาเรื่องความลําเอียงในการตีพิมพ

1 5 . 3 . 6 ค ว า ม ลํ า เ อี ย ง ใ น ก า ร ตี พิ ม พ ในกรณี ข องข อ มู ล ต อ เนื่ อ งก็ ทํ า scattergram


(Publication biases) ในการรวบรวมวรรณกรรม เรา ระหวางขนาดของผลที่วัดบนแกนนอน กับสวนกลับของ
อาจจะทําการประเมินเพื่อใหมั่นใจวา ไดคนพบวรรณกรรม สวนเบี่ยงเบนมาตรฐานของคาเฉลี่ย (1/SE) บนแกนตั้ง
ทั้งที่เกี่ยวของไดครบ ถวน(24) โดยการทํา ‘Funnel plot’
(ภาพที่ 15.4) ซึ่งเปน scattergram แสดงความสัมพันธ 15.4 สรุป
ของขนาดของการศึกษากับคา risk ratio โดยมีหลักการอยู การทบทวนวรรณกรรมอย า งเป น ระบบ และ
ที่ ว า การศึ ก ษาขนาดใหญ ย อ มได ค า risk ratio ที่ ใ กล Meta-analysis จึงเปนการวิจัยสาขาหนึ่งที่มีวิทยาการวิจัย
‘ความจริง’ ในขณะที่การศึกษาขนาดเล็กหลายอันจะไดคา ที่เปนรูปแบบเฉพาะตัว เพื่อสรางหลักฐานทางการแพทยที่
risk ratio ที่มากกวาหรือนอยกวาความจริงกระจัดกระจาย นาเชื่อถือที่สุดในประเด็นตางๆ(26) ตอยอดจากการทดลอง
อยูทางดานลางของกราฟ ดังนั้นเมื่อมีการศึกษาหลายชิ้น ทางคลินิก เพื่อการใชประโยชนในการสรางแนวทางเวช
กราฟแสดงความสัมพันธของขนาดของการศึกษากับคา ปฏิบัติทางคลินิก อยางไรก็ดี นอกจากการวิเคราะหแบบ
risk ratioจะเปนรูป กรวยคว่ํา แตหากไมไดรูปกรวยคว่ํา ก็ Meta-analysis สําหรับการทดลองทางคลินิกแลว มีผู
แสดงวา อาจจะมีปญหาเรื่องความลําเอียงในการตีพิมพ ประยุกตวิทยาการวิจัยนี้ในการวิเคราะหรวมผลการวิจัย
วามีแตเฉพาะรายงานที่ไดผลบวกเทานั้นหรือไม(25) แบบอื่นๆ เชน การวิเคราะหอุบัติการณ การวิเคราะหการ
วิจัยทางสังคมศาสตรไดอีกดวยเชนกัน เพื่อใหผลการวิจัย
ที่ทําซ้ํากันไดขอสรุปนาเชื่อถือยิ่งขึ้น
f 221 e
ทบทวนวรรณกรรมอยางเปนระบบ
เอกสารอางอิง
1. Oxman AD, Cook DJ, Guyatt GH for the Evidence-based Medicine Working Group. User’s guides to the
medical literature- VI. How to use an overview. JAMA 1994;272(17):1367-71.
2. Mulrow CD, Oxman AD (eds). How to conduct a Cochrane systematic review – Cochrane Collaboration
Handbook [updated September 1997]. In: The Cochrane Library [database on disk and CDROM].
3. Guyatt GH, Sackett DL, Sinclair JC, Hayward R, Cook DJ, Cook RJ for the Evidence-based Medicine
Working Group. User’s guides to the medical literature- IX. A method for grading health care
Recommendations. JAMA 1995;274(22):1800-4.
4. L’Abbe KA, Detsky AS, O’Rourke K. Meta-analysis in clinical research. Ann lntern Med 1987;107:224-233.
5. Peng LH. Meta-analysis-a passing fad or an absolute necessity. Second Asian Clinical Trial meeting
Handbook. 1999. National University of Singapore.
6. Dickersin K. The existence of publication bias and risk factors for its occurrence. JAMA 1990;269:2749-53.
7. Gotsche PC. Reference bias in reports of drug trials. BMJ 1987;295:654-6.
8. Cochrane AL. Effectiveness and Efficiency. Random reflection on health services. London: Nuffield
Provincial Hospital trust, 1972.
9. The Cochrane Collaboration. The Cochrane Collaboration Brochure. In: The Cochrane Database of
systematic review. Oxford: Update Software, 1995 Issue 1
10. Antman EM, Lau J, Kupelnick B, Mosteller F, Chalmers TC. A comparison of results of meta-analysis of
randomized control trials and recommendations of clinical experts. JAMA 1992;268:240-8.
11. Liberati A, Apolone G, Nicolucci A, Confalonieri C, Fossati R, Grlli R, Torri V, Mosconi P, Alexanian A. The
role of attitudes, beliefs, and personal characteristics of ltalian physicians in the surgical treatment
of early breast cancer. Am J Public Health 1991;81:38-42.
12. The Cochrane Collaboration. The Cochrane Library, Issue 1, 2010. Oxford: Update Software. Also available
at http://mrw. interscience.wiley.com/cochrane/cochrane_clcentral_articles_fs.html
13. Nuchprayoon I, and Garner P. Interventions for preventing reactions to antivenom (Cochrane Review). In:
The Cochrane Library, Issue 2, 2000. Oxford: Update Software.
14. Williamson JW, Goldschmidt PG, Colton T. The quality of medical literature: analysis of validation
assessment. In: Bailar JC, Mosterler F, eds. Medical Uses of Statistics. Waltham, Massachusette:
NEJM Books 1986;970-91.
15. Chalmer TC, Celano P, Sacks HS, Smith H. Bias in treatment assignment in controlled trials. N Eng J Med
1983;309:1358-61.
16. Jadad AR, Moore RA, Carroll D, Jenkinson C, Reynolds DJ, Gavaghan DJ, et al. Assessing the quality of
reports of randomized clinical trials: is blinding necessary? Control Clin Trials. 1996;17:1-12.
17. Moher D, Liberati A, Tetzlaff J, Altman DG, The PRISMA Group (2009) Preferred Reporting Items for
Systematic Reviews and Meta-Analyses: The PRISMA Statement. PLoS Med 6(7): e1000097.
doi:10.1371/journal. pmed.1000097

f 222 e
ทบทวนวรรณกรรมอยางเปนระบบ
18. Peto R. Why do we need systematic review of randomized trials? Stat Med 1987;6:223-40.
19. Chalmer TC, Berrier J, Sacks HS et al. Meta-analysis of clinical trials as scientific discipline, ll: replicate
variability and comparison of studies that agree and disagree. Stat Med 1987;6:733-44.
20. Higgins JPT, Green S, editors. Cochrane Handbook for Systematic Reviews of Interventions Version 5.0.2
(updated September 2009) 2009. [online]. Available from:URL:http://www.cochrane-handbook .org
[cited 2010].
21. Perera R, Heneghan C. Interpreting meta-analysis in systematic reviews. Evid Based Med 2008;13:67-69.
22. Higgins JP, and Thompson SG. Quantifying heterogeneity in a meta-analysis. Stat Med 2002;21:1539-58.
23. Thompson SG, and Higgins JP. How should meta-regression analysis be undertaken and interpreted? Stat
Med 2002;21:1559-73.
24. Easterbrook PJ, Berlin JA, Gopalan R, Matthews DR. Publication bias in clinical research. Lancet 1991;
337:867-72.
25. Sutton AJ, Duvall SJ, Tweedie L, Abrams KR, Jones DR. Empirical assessment of effect of publication bias
on meta-analysis. BMJ 2000;320:1574-1577.
26. GRADE working group. Grading quality of evidence and strength of recommendations BMJ 2004;328:1-8.

f 223 e
ทบทวนวรรณกรรมอยางเปนระบบ

You might also like