You are on page 1of 52

การทบทวนวรรณกรรมอย่ างมีระบบ และการวิเคราะห์ แบบเมต้ า

(Systematic Review and Meta-analysis)


น. พ. กุลธร เทพมงคล1, น.พ. อัคริ นทร์ นิมมานนิตย์2, น.พ. กมล อุดล3

1 ภาควิชารังสี วท
ิ ยา คณะแพทยศาสตร์ศิริราชพยาบาล, 2 ภาควิชาอายุรศาสตร์ คณะแพทยศาสตร์ศิริราชพยาบาล
และ 3 ภาควิชาเวชศาสตร์ป้องกัน คณะแพทยศาสตร์ศิริราชพยาบาล

เพือ่ เข้าใจและสามารถปฏิบตั ิการทํา Systematic Review และ Meta-analysis ได้ โดยเข้าใจ


หลักการ และสามารถปฏิบตั ิตามขั้นตอนแบบง่าย ๆ ดังต่อไปนี้
1. Concept of systematic review
a. Narrative vs. systematic review
b. Why is it important?
2. Question and inclusion criteria formulation
a. Patients
b. Intervention
c. Outcome
d. Methodology
3. Publication bias
4. Study identification
Comprehensive literature search
Why is it important ? -Concept
Database
Keyword from context and from methodology filter
Short literature search in some database (pubmed)
Comprehensive literature search
5. Study selection
6. Validity assessment
7. Data extraction
8. Analysis
a. Choices of effect measures
b. Heterogeneity, : concept
c. Statistical model for meta-analysis: Random
vs. Fixed effect model, concept, when ?
d. Example
9. Interpretation
Overview from clinical question regarding evidence
แนวความคิดเกีย่ วกับการทบทวนวรรณกรรมอย่ างมีระบบ
(Concept of Systematic Review)
- Systematic Review คืออะไร
Systematic review เป็ นผลงานวิจยั ที่เกิดจากการรวบรวมผลลัพธ์ของงานวิจยั ชนิ ดปฐมภูมิ โดยมี
จุดมุ่งหมายเพือ่ ตอบปั ญหาทีจ่ าํ เพาะ ซึ่งการรวบรวมผลลัพธ์น้ นั ต้องทําอย่างเป็ นระบบ (systematic) และมี
หลักเกณฑ์ในการเลือกการศึกษาชนิดปฐมภูมิอย่างชัดเจน เริ่ มตั้งแต่การค้นหาการศึกษาที่ตอ้ งครอบคลุม
ผลงานวิจยั ทั้งหมดที่มขี ณะนั้น จากนั้นจึงคัดเลือกเฉพาะผลการศึกษาที่มีคุณภาพตามเกณฑ์ท่ีกาํ หนดไว้มาศึกษา
หากผลลัพธ์จากงานวิจยั ปฐมภูมิเหล่านั้นสามารถนํามาคํานวณรวมกันในเชิงปริ มาณ (quantitative) ได้
การศึกษานั้นก็เรี ยกว่า Meta-analysis กล่าวอีกนัยหนึ่ง Meta-analysis ก็คือ ส่วนหนึ่งของ systematic
review นัน ่ เอง

- Systematic Review vs. Narrative Review

Systematic review แตกต่างจาก review ชนิ ดอื่นๆในหลายๆด้าน ดังนี้


1. Systematic review มีการตั้งคําถามวิจยั ที่เฉพาะเจาะจง
2. Systematic review มีการคํานวณผลรวมของการศึกษาชนิ ดปฐมภูมิในเชิงปริ มาณ
(quantitative) เมื่อสามารถทําได้
3. ที่สาํ คัญที่สุดคือ Systematic review เป็ นการรวมรวม คัดเลือกและสังเคราะห์ขอ้ มูลอย่าง
เป็ นระบบและครบถ้วน

- ความสําคัญของ Systematic review

ในการทํางานวิจยั การคํานวณจํานวนผูป้ ่ วย (sample size calculation) เป็ นสิ่ งจําเป็ นและสําคัญ


มากในการป้ องกันการเกิด type I error (การยอมรับว่าการรักษาใหม่ดกี ว่าทั้งที่ความจริ งไม่ใช่) และ type II
error (สรุ ปว่าการรักษาใหม่ไม่ ดกี ว่าทั้งที่จริ งๆแล้วดีกว่า) การคํานวณนี้ ความแตกต่างของผลการรักษาที่
ยอมรับว่ามีความสําคัญทางคลินิก เช่น การรักษาใหม่สามารถลดอัตราการตายได้ 10%, 20% หรื อ 50% เมื่อ
เทียบกับการรักษาเก่า มีความสําคัญมากต่อจํานวนผูป้ ่ วยที่ตอ้ งการในการศึกษา ผลที่ได้รับจากการคํานวณโดยใช้
เกณฑ์ความสําคัญทางคลินิกที่แตกต่างกันทําให้ผลลัพธ์ท่ีแตกต่างกันได้มาก กล่าวคือความแตกต่าง(เช่นอัตราการ
ตายของกลุ่มการรักษาใหม่เทียบกับกลุ่มการรักษาเก่า)ที่น้อยกว่ าต้องการจํานวนผูป้ ่ วยที่มากกว่ า ดังตัวอย่างการ
คํานวณในตารางที่ 1
ตารางที่ 1. แสดงผลการคํานวณจํานวนผู้ป่วยทีต่ ้ องการในการวิจยั (Sample Size Calculation)
อัตราตายในกลุ่มการ อัตราตายในกลุ่มการรักษา Relative risk จํานวนผู้ป่วยทีต่ ้ องการให้
reduction (RRR)
รักษาเก่ า ใหม่ ทค่ี าดไว้ การศึกษา(คน)
20% 18% 10% 12,280
20% 16% 20% 2,994
20% 10% 50% 438
คํานวนโดยกําหนด type I error = 0.05 และ power ที่ 80%
จากตารางที่ 1 จะเห็นว่าแม้ค่าความสําคัญทางคลินิกจะมีขนาดแตกต่างกันไม่มาก (RRR =10% ,
20% และ 50%) ก็ทาํ ให้จาํ นวนผูป้ ่ วยที่ตอ้ งมีในการวิจยั นั้นแตกต่างกันได้มากหลายเท่าตัว โดยจํานวนผูป้ ่ วย
ในงานวิจยั ที่ตอ้ งการเปรี ยบเทียบความแตกต่างของอัตราการตายระหว่างกลุ่มการรักษาเก่าและการรักษาใหม่ท่ี
น้อยกว่าจะต้องการจํานวนผูป้ ่ วยมากกว่าการวิจยั ที่ตอ้ งการเปรี ยบเทียบความแตกต่างของอัตราการตายระหว่าง
กลุ่มการรักษาเก่าและการรักษาใหม่ท่ีมากกว่า ดังตัวอย่างตารางที่ 1 หากต้องการเปรี ยบเทียบความแตกต่าง
RRR ที่ร้อยละ 10 จะต้องการขนาดกลุ่มตัวอย่างมากกว่าการเปรี ยบเทียบความแตกต่าง RRR ร้อยละ 20 และ
ร้อยละ 50 ถึงประมาณ 4 เท่าและประมาณ 30 เท่าตามลําดับ จํานวนผูป้ ่ วยขนาดมากมายนี้ยอ่ มต้องการ
งบประมาณและบุคลากรในการทํางานวิจยั จํานวนมากเช่นเดียวกัน ยิง่ ไปกว่านั้นอาจเป็ นไปไม่ได้เลยที่จะได้
ผูป้ ่ วยมากพอในการศึกษาเดียว
ปั ญหาดังกล่าวข้างต้น สามารถนํา Systematic review และ Meta-analysis มาช่วยแก้ไขได้ทาํ
ให้สามารถได้คาํ ตอบซึ่งไม่สามารถได้จากงานวิจยั งานใดงานหนึ่งเพียงงานเดียว ซึ่งช่วยประหยัดค่าใช้จ่ายและที่
สําคัญยิง่ กว่า คือ ทําให้ได้คาํ ตอบที่แท้จริ งและแม่นยํา
หากมองความก้าวหน้าทางการแพทย์ในปัจจุบนั นี้ จะเห็นว่าการรักษาวิธีใหม่ๆ หรื อการรักษาใหม่ๆนั้น
ไม่ได้มีผลการรักษาที่ดีแตกต่างจากการรักษาเดิมอย่างมากมายเช่นการค้นพบการรักษาในอดีต ดังเช่นเมื่อเกือบ
ร้อยปี ก่อนที่เริ่ มนํายาปฏิชีวนะมาใช้ พบว่าผลการรักษาโรคติดเชื้อแบคทีเรี ยโดยให้ยาปฏิชีวนะดีกว่าไม่ได้รับยา
อย่างชัดเจน ทําให้อตั ราตายในผูท้ ่ีได้รับการรักษาลดลงถึงร้อยละ 80-90 แต่ผลการรักษาใหม่ๆในปั จจุบนั ไม่ได้
ดีกว่าการรักษาเดิมมากมายเช่นนั้นอีก เช่นการรักษาใหม่อาจลดอัตราการตายจากโรคหัวใจขาดเลือดได้เพียงร้อย
ละ 10 เมื่อเทียบกับการรักษาเก่า เป็ นต้น อย่างไรก็ดีการลดอัตราการตายเพียงร้อยละ 10 นี้ก็อาจมีความสําคัญ
ถ้าโรคนั้นมีความชุกและอุบตั ิการณ์สูง เช่นมีผปู ้ ่ วยเป็ นจํานวนล้านคนทัว่ โลก อัตราการตายที่ลดเพียงร้อยละ 10
ก็สามารถลดการเสี ยชีวติ ได้จาํ นวนนับแสนราย
อีกประเด็นที่ตอ้ งเน้นยํ้าคือ Systematic review และ Meta-analysis ไม่ได้ทาํ เพือ่ ให้ได้คาํ ตอบ
ว่าการรักษาใหม่ๆนั้นได้ผลดีเท่านั้น หากแต่จุดประสงค์ท่ีสาํ คัญคือเพือ่ ให้ทราบผลการรักษาที่ถกู ต้องแม่นยําที่
แท้จริ งดังตัวอย่าง Meta-analysis ที่ตีพิมพ์ในวารสารทางการแพทย์ The Lancet ฉบับเดือนตุลาคม พศ.
2547 พบว่าจากการศึกษาเดิมชนิ ด observational หลายการศึกษาพบว่าสาร Antioxidant ได้แก่ beta
carotene, vitamins A, C, E สามารถป้ องกันการเกิดโรคมะเร็ งทางเดินอาหารได้ ในบทความนี้ ผลของ
Systematic review และ Meta-analysis ของการศึกษาชนิ ด Controlled trial กลับพบว่าสาร
Antioxidant เหล่านี้ไม่ได้มีประโยชน์ในการป้ องกันโรคมะเร็ งทางเดินอาหารเลย อีกทั้งการรับ
Antioxidant กลับอาจทําให้โอกาสจะเป็ นมากกว่าไม่ได้รับด้วยซํ้าไป
คําถามเพือ่ การทบทวนวรรณกรรม และการเลือกการศึกษาชนิดปฐมภูมิ

(Question and inclusion criteria formulation for


selecting the primary studies)

หัวใจสําคัญที่สุดในการเลือกการศึกษาชนิดปฐมภูมิ คือ การตั้งคําถามที่เฉพาะตรงตามเป้ าหมายที่ตอ้ งการคําตอบ


ส่วนประกอบที่สาํ คัญของคําถามที่ดีได้แก่ ประชากรที่ตอ้ งการศึกษา (Population), การรักษาหรื อการมีปัจจัย
ที่มีผลทําให้เกิดโรคที่ตอ้ งการศึกษา (Intervention/Exposure), การรักษาหรื อการไม่มีปัจจัยที่มีผลทําให้
เกิดโรคที่ตอ้ งการเปรี ยบเทียบ (Comparison) และ ผลลัพธ์หรื อโรคในกรณี ศึกษาที่ตอ้ งการศึกษาปั จจัยเสี่ ยง
(Outcome) หรื อที่รู้จกั กันทั้วไปว่าหลัก PICO1

ตัวอย่ างที่ 1. ส่ วนประกอบต่ างๆของคําถามวิจยั กรณีการศึกษาการรักษา (therapy)


1. ประชากร: ผู้ป่วยโรคมะเร็งตับทีไ่ ม่ สามารถรักษาโดยการผ่าตัด
2. การรักษา: Transarterial therapy คือการรักษาโดยใช้ สายสวนทางหลอดเลือดแดงเข้ าสู่
บริเวณทีเ่ ป็ นมะเร็งตับและฉีดยาเคมีหรือสารอุดหลอดเลือดเพือ่ กําจัดมะเร็งโดยตรง
3. การรักษาเปรียบเทียบ: การรักษาตามอาการเท่ านั้น
4. ผลลัพธ์ : อัตราการรอดชีวติ 1 ปี หลังจากเริ่มรับการรักษา
เมื่อนําส่วนต่างๆมาประกอบกันจะได้คาํ ถามที่เฉพาะเจาะจงว่า ‘การรักษาโดยวิธี Transarterial therapy ใน
ผูป้ ่ วยโรคมะเร็ งตับที่ไม่สามารถรักษาโดยการผ่าตัด สามารถเพิ่มอัตราการรอดชีวติ ที่เวลา 1 ปี หลังการรักษาเมื่อ
เทียบกับการรักษาตามอาการเท่านั้นหรื อไม่’

ตัวอย่ างที่ 2. ส่ วนประกอบต่ างๆของคําถามวิจยั ในกรณีการศึกษาปัจจัยเสี่ยง (risk factor/etiology)


1. ประชากร: ผู้ไม่ สูบบุหรี่
2. ปัจจัยที่ทาํ ให้ เกิดโรค: การได้ รับควันบุหรี่จากผู้อน ื่ (passive smoking)
3. การเปรียบเทียบ: การไม่ ได้ รับควันบุหรี่จากผู้อนื่
4. ผลลัพธ์ : โรคหลอดเลือดหัวใจ
เมื่อนําส่วนต่างๆมาประกอบกันจะได้คาํ ถามที่เฉพาะเจาะจงว่า ‘ผูไ้ ม่สูบบุหรี่ ท่ีได้รับควันบุหรี่ จากผูอ้ ่ืนมีโอกาส
เป็ นโรคหลอดเลือดหัวใจสูงกว่าผูไ้ ม่สูบบุหรี่ ท่ีไม่ได้รับควันบุหรี่ จากผูอ้ ่ืนหรื อไม่’

1
Richardson et al. The well-built clinical question: a key to evidence-based decisions.
Counsell C. Formulating questions and locating primary studies for inclusion in systematic
reviews. Ann Intern Med 1997;127:380-7
การเลือกการศึกษาชนิดปฐมภูมิเป็ นการนําส่วนประกอบแต่ละส่วนที่สาํ คัญของคําถามวิจยั มาขยายความ ร่ วมกับ
การกําหนดรู ปแบบของการศึกษาเพื่อให้ได้เกณฑ์คดั เข้า (Inclusion criteria) ที่จาํ เพาะกับการศึกษาที่ตรงกับ
คําถามวิจยั
ตัวอย่างการกําหนดเกณฑ์คดั เข้า สําหรับคําถามวิจยั ตัวอย่างข้างต้นเกี่ยวกับการรักษาโรคมะเร็ งตับ
1. ประชากร: การศึกษาชนิ ดปฐมภูมิท่ีเลือกนั้นต้องทําการศึกษาในกลุ่มประชากรที่ตอ้ งการ ข้อควรปฏิบตั ิ
ในการกําหนดกลุ่มประชากรมี 2 ประการ คือ
1.1. กลุ่มประชากรนี้ตอ้ งได้รับการวินิจฉัยว่ามีภาวะที่ตอ้ งการศึกษาอย่างชัดเจนในกรณี ได้แก่
1.1.1. ผูป้ ่ วยโรคมะเร็ งตับที่วนิ ิจฉัยโดยทางพยาธิวทิ ยา หรื อ
1.1.2. ผูป้ ่ วยโรคมะเร็ งตับที่วน ิ ิจฉัยโดยการตรวจทางภาพ (Imaging study เช่น
Ultrasonography, CT หรื อ MRI scan) ร่ วมกับระดับ alpha
fetoprotein ในเลือด
1.2. อาจเพิ่มข้อกําหนดที่สนใจศึกษาอีก ข้อกําหนดนี้ ตอ้ งมีเหตุผลรองรับว่าผูป้ ่ วยกลุ่มนี้แตกต่างจาก
กลุ่มอื่น เช่น อายุ เพศ ลักษณะของโรค ในกรณี ได้แก่
1.2.1. ผูป้ ่ วยโรคมะเร็ งตับที่ไม่สามารถรักษาโดยการผ่าตัด
2. การรักษา: การศึกษาปฐมภูมิน้ น ั ต้องเป็ นการศึกษาการรักษาที่ตอ้ งการ อาจรวมเป็ นประเภทของการ
รักษากว้างๆขึ้นอยูก่ บั คําถามวิจยั เช่นยากลุ่ม beta blocker ทุกชนิด การผ่าตัดเปลี่ยนเส้นเลือดหัวใจ
ทุกวิธี เป็ นต้น ตัวอย่างในกรณี น้ ีคือ
2.1. Transarterial therapy ซึ่ งเป็ นการรักษาหลักที่มีการรักษาที่แตกต่างในรายละเอียดปลีกย่อย
อีก ในตัวอย่างได้ กําหนดเกณฑ์คดั เข้าให้คลอบคุมทุกการรักษาที่เกี่ยวข้อง คือ
2.1.1. Transarterial chemoembolization หรื อ
2.1.2. Transarterial embolization หรื อ
2.1.3. Transarterial chemotherapy
2.2. ควรต้องมีการกําหนดการรักษาอื่นๆที่ผป
ู ้ ่ วยได้รับ (co-intervention)ด้วยเพือ่ ป้ องกัน
ผลลัพธ์ท่ีไม่ได้เกิดจากการรักษาที่สนใจจริ ง ยกตัวอย่างกรณี น้ ีได้แก่
2.2.1. หากมีการรักษาอื่นร่ วมด้วยผูป้ ่ วยทั้งกลุ่มทดลองและกลุ่มควมคุมต้องมีโอกาส
ได้รับเท่าๆกัน (การรักษาร่ วมเช่นยาแก้ปวด อาหารเสริ ม เป็ นต้น)
3. การรักษาที่ตอ้ งการเปรี ยบเทียบ: การศึกษาปฐมภูมิน้ น ั ต้องมีการรักษาของกลุ่มควบคุมที่ตอ้ งการเปรี ยบเทียบ
ตามที่กาํ หนด ในตัวอย่างนี้ได้แก่
3.1. กลุ่มเปรี ยบเทียบต้องได้รับการรักษาตามอาการเท่านั้น
4. ผลลัพธ์: คือผลของการรักษาที่ตอ้ งการเปรี ยบเทียบ การศึกษาปฐมภูมิน้ น ั ต้องมีศึกษาผลลัพธ์ท่ีสาํ คัญใน
การตัดสิ นใจการรักษาเสมอ โดยผลลัพท์น้ ีไม่จาํ เป็ นต้องเป็ นผลลัพธ์เดียว ตัวอย่างกรณี ได้แก่
4.1. อัตราการรอดชีวติ 1 ปี หลังจากเริ่ มรับการรักษา (one-year survival)
4.2. การตอบสนองต่อการรักษาของก้อนมะเร็ ง (tumor response)
4.3. ผลแทรกซ้อนของการรักษา (adverse effect)
5. รู ปแบบของการศึกษา: เนื่ องจากรู ปแบบการศึกษาชนิ ด Randomized Controlled Trial (RCT)
เป็ นรู ปแบบการศึกษาที่มีอคิตินอ้ ยทีส่ ุดจึงเป็ นที่ยอมรับว่าการทํา systematic review ควรรวบรวมข้อมูล
จากการศึกษาปฐมภูมิรูปแบบนี้ อย่างไรก็ดีเนื่องจาก RCT ไม่สามารถใช้กบั การศึกษาปั จจัยเสี่ ยงหรื อ
สาเหตุของโรคได้จากข้อจํากัดทางจริ ยธรรม การทํา systematic review เพือ่ ศึกษาสาเหตุและปั จจัย
เสี่ ยงของโรคจึงอาจจําเป็ นต้องรวบรวมข้อมูลจากการศึกษปฐมภูมิชนิด Observational studies เช่น
การศึกษาประเภท case-control, cohort หรื อ cross-sectional ซึ่งเป็ นการศึกษาที่มีอคิติได้
ค่อนข้างมาก ดังนั้นการทํางานวิจยั และการแปลผล systematic review ประเภทนี้จึงจําเป็ นต้องทําด้วย
ความระมัดระวังเป็ นอย่างสูง
ตัวอย่างในกรณี น้ ี ได้แก่
5.1. รู ปแบบการศึกษาต้องเป็ น Randomized Controlled Trial เท่านั้น

เมื่อได้เกณฑ์คดั เข้าสําหรับการศึกษาปฐมภูมิตามคําถามวิจยั ที่ต้ งั ไว้แล้วขั้นตอนต่อไปก็คือการสื บค้นการศึกษา


ปฐมภูมิที่ตรงกับเกณฑ์ โดยใช้ keywords ตามเกณฑ์คดั เข้านั้นเอง
Publication Bias
Systematic review และ Meta-analysis ก็เช่นเดียวกับงานวิจยั ประเภทอื่นที่มีโอกาสเกิดอคติ
ขึ้นได้ถา้ ขาดความระมัดระวัง อคติท่ีสาํ คัญที่สุดของการทํา systematic review และ meta-analysis ก็คือ
Publication bias
Publication bias คือความโน้มเอียงที่ผท
ู ้ าํ วิจยั หรื อบรรณาธิการ จะตีพิมพ์ผลงานวิจยั ที่ได้ผลลัพธ์ที่
‘ดี’ หรื อเป็ นไปตามสมมุติฐานเท่านั้น ด้วยเหตุที่สิ่งใหม่ๆซึ่ งแตกต่างหรื อดีกว่าเดิมจะได้รับความสนใจมากกว่า
สิ่ งที่ไม่แตกต่างหรื อเท่าเดิม ดังนั้นงานวิจยั ที่แสดงผลว่าการรักษาใหม่แตกต่างหรื อดีกว่าการรักษาเดิม
(positive trials) จึงมีโอกาสที่จะได้ตีพมิ พ์ในวารสารมากกว่างานวิจยั ที่ไม่ได้แสดงผลว่าการรักษาใหม่
แตกต่างจากการรักษาเดิม (negative trials) เหตุท่ีเป็ นดังนี้อาจเกิดได้จากหลายปั จจัย ที่สาํ คัญคือตัวผูว้ จิ ยั เอง
และบรรณาธิการของวารสารต่างๆที่ไม่เห็นความสําคัญของ negative trial กล่าวคือผูว้ จิ ยั หยุดงานวิจยั หรื อ
แม้กระทัง่ ทํางานวิจยั เสร็ จแล้วก็ไม่ส่งตีพมิ พ์ หรื อบรรณาธิการอาจไม่รับ negative trial พิมพ์ในวารสารของ
ตน
ถ้า Systematic review และ Meta-analysis รวบรวบเฉพาะการศึกษาปฐมภูมิท่ีได้รับการตีพมิ พ์
เท่านั้นก็เป็ นไปได้ท่ีจะมีเฉพาะการศึกษาที่เป็ น positive trial เท่านั้น ผลที่ตามมาก็คือ การสรุ ป
ความสําคัญทางสถิติและทางคลินิกของการรักษาที่ศึกษาไม่ถูกต้อง โดยที่ผลของการรักษานั้นมักดีเกินความเป็ น
จริ ง (overestimate)
อย่างไรก็ตาม มีวธิ ีการต่างๆหลายอย่างที่สามารถนํามาใช้เพือ่ ประเมินว่า Systematic review และ
Meta-analysis นั้นมี publication bias หรื อไม่ วิธีท่ีนิยมแพร่ หลายที่สุดคือ Funnel plot ซึ่ งโดย
หลักการแล้วคือการ วาดจุด (plot graph) โดยให้แกนนอน (X) คือ ค่าที่แสดงถึงขนาดของประสิ ทธิภาพของ
การรักษา และ แกนตั้ง (Y) คือ ค่าที่แสดงถึงจํานวนผูป้ ่ วยในงานวิจยั ปฐมภูมิแต่ละงาน แนวคิดก็คืองานวิจยั ปฐม
ภูมิท่ีศึกษาการรักษาชนิดเดียวกัน การศึกษาที่มีจาํ นวนผูป้ ่ วยน้อยกว่าย่อมมีผลลัพธ์ของการทดลองที่แม่นยําน้อย
กว่าการการศึกษาที่มีจาํ นวนผูป้ ่ วยมากกว่า ดังนั้นค่าผลลัพธ์ท่ีได้จากงานวิจยั ขนาดเล็กจึงควรจะมีการกระจาย
รอบๆแกนตั้งกลางเท่าๆกัน โดยแกนตั้งกลางนี้ก็คือผลลัพธ์ท่ีได้จากการทํา Meta-analysis นั้นเอง จะสังเกต
ได้วา่ การศึกษายิง่ มีขนาดใหญ่ข้ ึนเท่าใด ความกว้างของการกระจายก็ยง่ิ จะลดน้อยลงเท่านั้น เพราะการการศึกษา
ที่ขนาดใหญ่กว่าให้ผลทีแม่นยําขึ้น ดังภาพประกอบ
Pooled Estimate
of treatment effect

ค่ าแสดงขนาดของ Sample Size

Favor Intervention Favor Control

ขนาดของผลการรั กษา
รู ปที่ 1: Funnel Plot รู ปสมมาตรแสดงถึง Meta-Analysis ที่อาจไม่มี Publication Bias

Biased estimate Unbiased estimate


(publication biased)
ค่ าแสดงขนาดของ Sample Size

Favor Intervention Favor Control

ขนาดของผลการรักษา

รู ปที่ 2: Funnel Plot ที่ไม่สมมาตรแสดงถึง Meta-Analysis ที่อาจมี Publication Bias

ดังนั้นหากการ Meta-analysis นั้นไม่มี publication bias การกระจายของจุดต่างๆควรมีลกั ษณะ


เป็ นรู ปกรวย (funnel) ซึ่งสมมาตรกันบนแกนกลางตั้งที่เป็ นผลรวมของ meta-analysis นั้น หากการกระจาย
ไม่เป็ นรู ปกรวยที่สมมาตรกันให้นึกถึงว่าอาจมี publication bias
อย่างไรก็ตามต้องพึงระลึกอยูเ่ สมอว่า publication bias ไม่ใช่สาเหตุเดียวที่ทาํ ให้การกระจายไม่เป็ น
รู ปกรวย ยังมีสาเหตุอ่ืนอีกอันเช่น language biases คือ negative trial ได้รับการตีพมิ พ์ในภาษาอื่นที่ไม่ใช่
ภาษาอังกฤษ ดังนั้นหากสื บค้นงานวิจยั จํากัดเฉพาะภาษาอังกฤษก็จะไม่พบ negative trials, งานวิจยั ขนาดเล็ก
มีคุณภาพตํ่ากว่า และ งานวิจยั ขนาดเล็กแตกต่างจากงานวิจยั ใหญ่มากจนไม่ควรนําผลมารวมกันกล่าวคืองานวิจยั
ขนาดเล็กทําในกลุ่มผูป้ ่ วยที่ได้ประโยชน์จากการรักษาได้สูงกว่างานขนาดใหญ่ และการควบคุมงานวิจยั ขนาดเล็ก
ทําได้ง่ายกว่า ผูป้ ่ วยจึงได้รับการรักษาที่สมํ่าเสมอและตรงตามแผนมากกว่า เป็ นต้น
การป้ องกัน Publication bias สามารถทําได้โดยการสื บค้นงานวิจยั ปฐมภูมิอย่างครบถ้วน ทุกภาษา
และควรพยายามสื บค้นงานวิจยั ที่ไม่ได้รับการตีพมิ พ์ (unpublished trial) ด้วย ในปั จจุบนั ได้เริ่ มมีการตั้ง
หน่วยงานในต่างประเทศเพือ่ จดทะเบียนการวิจยั ตั้งแต่เริ่ มต้นโดยมีเป้ าหมายว่าในอนาคตการสื บค้นผลงานทั้งที่
ได้รับการตีพมิ พ์และไม่ได้รับการตีพมิ พ์จะสะดวกและครบถ้วน
การค้ นหาการศึกษาเพือ่ การทบทวนวรรณกรรม (Study Identification)

หลังจากการตั้งคําถามเฉพาะเพือ่ การทบทวนวรรณกรรมแล้ว (Population, Intervention,


Comparison, Outcome หรื อ PICO) ขั้นต่อไปคือการค้นหาการศึกษาอย่างเป็ นระบบที่จะนํามาตอบ
คําถามนั้น ๆ

- ความสําคัญ
ขั้นตอนนี้มีส่วนสําคัญทําให้ systematic review ต่างจาก narrative หรื อ traditional review
อย่างชัดเจน โดย narrative review มีข้ นั ตอนการนําการศึกษามาอ้างที่ไม่เป็ นระบบ แต่เป็ นไปตามความพึง
พอใจของผูท้ าํ การทบทวน โดยเฉพาะบางครั้งก็มีความลําเอียง เลือกเฉพาะการศึกษาที่นาํ มาสนับสนุน
แนวความคิดของตนเท่านั้น ในทางตรงกันข้าม systematic review มีข้ นั ตอนการเลือกการศึกษาที่เป็ นระบบ
ซึ่งจะทําให้ตดั ความลําเอียงดังกล่าวออกไป ในขั้นตอนแรกคือ การค้นหาการศึกษา จะได้กล่าวในส่วนนี้ ส่วนอีก
ขั้นตอนหนึ่งคือการเลือกการศึกษาจะได้กล่าวในตอนต่อไป
อนึ่งผูเ้ ขียนจะได้แนะนําการค้นหาเป็ น 2 แบบคือแบบง่าย ๆ ซึ่งน่าจะประยุกต์ใช้กบั การทบทวนวรรณกรรม
เพือ่ การนําไปใช้ทางคลินิกแบบง่าย ๆ หรื อการทบทวนวรรณกรรมแบบไม่เป็ นทางการ และแบบโดยละเอียด ซึ่ง
น่าจะเหมาะกับการทบทวนวรรณกรรมเพือ่ การศึกษาแบบเป็ นทางการ

- การค้ นหาการทบทวนวรรณกรรมทีม่ อี ยู่แล้ ว (Existing reviews)


ก่อนที่จะเริ่ มกระบวนการทบทวนวรรณกรรมทั้งหมด สมควรเป็ นอย่างยิง่ ที่จะค้นหาการทบท วน
วรรณกรรมที่มีอยูแ่ ล้ว โดยเฉพาะที่ ตั้งคําถามเฉพาะเพือ่ ตอบคําถามเดียวกัน ทั้งนี้เพือ่ ไม่ให้เกิดการทําซํ้าโดยไม่
เกิดประโยชน์ และเพือ่ การทบทวนวรรณกรรมครั้งใหม่ท่ีดีกว่า โดยต้องตอบคําถามให้ได้วา่ จุดเด่น จุดด้อย ของ
การทบทวนวรรณกรรมที่มีอยูแ่ ล้วเป็ นอย่างไร การทบทวนครั้งใหม่จะทําให้ดีข้ ึนได้อย่างไร หรื อจะก่อให้เกิดองค์
ความรู ้ท่ีเพิ่มขึ้นอย่างไร
o การค้นหาการทบทวนวรรณกรรมแบบง่าย ๆ ค้นหาใน PUBMED ดังแสดงในรู ปข้างล่าง
นี้โดยใช้ keyword เฉพาะสําหรับเนื้อหา และกรองด้วย methodology filters ของ
PUBMED “clinical queries” ในส่ วนของ Systematic reviews

และจึงแสดงผลได้ดงั รู ป
o การค้นหาการทบทวนวรรณกรรมโดยละเอียด ได้แก่ การค้นหาใน PUBMED รวมกับ
ฐานข้อมูลมาตรฐาน หรื อฐานข้อมูลพิเศษอื่น ดังตัวอย่างข้างล่างนี้
- ฐานข้อมูลพิเศษ Evidence Based Medicine Reviews จากห้องสมุด
รพ.ศิริราช

- ฐานข้อมูลพิเศษ “ Clinical Evidence” หรื อ “UP-TO-DATE”


- ฐานข้อมูลพิเศษเฉพาะบางสาขาวิชาเช่นสําหรับมะเร็ งอาจค้นจาก
Cancer Care Ontario : Clinical Practice Guidelines

หรื อ American Society of Clinical Oncology ในส่วนของ Practice Guideline

-
- ฐานข้อมูลมาตรฐาน และใช้ methodology filter ได้แก่ Search Strategies
ของ Shojania KG และของ Haynes B

Shojania KG, Bero LA. Taking advantage of the explosion of systematic reviews: an
efficient MEDLINE search strategy. Eff Clin Pract. 2001 Jul-Aug;4(4):157-62.
1. (review or review, tutorial or review, academic).pt.
2. (medline or medlars or Embase).ti,ab,sh.
3. (scisearch or psychinfo or psycinfo).ti,ab,sh.
4. (psychlit or psyclit).ti,ab,sh.
5. cinahl.ti,ab,sh.
6. (hand search$ or manual search$).tw.
7. (electronic database$ or bibliographic database$).tw.
8. (pooling or pooled analys$).tw.
9. (peto or der simonian or dersimonian or fixed effect or mantel haenszel).tw.
10. or/2-9
11. 1 and 10
12. meta-analysis.pt.
13. meta-analysis.sh.
14. (meta-analy$ or metaanaly$ or meta analy$).tw,sh.
15. (systematic$ adj25 review$).tw,sh.
16. (systematic$ adj25 overview$).tw,sh.
17. (quantitative$ adj25 review$).tw,sh.
18. (quantitative$ adj25 overview$).tw,sh.
19. (methodologic$ adj25 review$).tw,sh.
20. (methodologic$ adj25 overview$).tw,sh.
21. (integrative research review$ or research integration).tw,sh.
22. (quantitative$ adj25 synthesi$).tw,sh.
23. or/12-22
24. 11 or 23
25. (random$ or placebo$).tw,sh,pt.
26. (clinical trial or controlled clinical trial).pt.
27. double blind.tw,sh,pt.
28. 25 or 26 or 27
29. 24 and 28
30. 1 or 23
31. exp asthma/
32. 24 and 31
33. 29 and 31
34. 30 and 31

Haynes RB, Wilczynski N, McKibbon KA, Walker CJ, Sinclair JC. J Am Med
Inform Assoc. 1994 Nov-Dec;1(6):447-58. Developing optimal search strategies
for detecting clinically sound studies in MEDLINE. ดังแสดงผลข้างล่าง
ทั้งนี้ methodology filter นอกจาก MEDLINE ดังกล่าวยังสามารถปรับไปใช้ฐานข้อมูล

มาตรฐานอื่น ๆ อีกได้แก่ EMBASE, CINAHL, HealthSTAR

สําหรับการหาการทบทวนวรรณกรรมที่มีอยูแ่ ล้ว ดังข้างต้น ผูเ้ ขียนขอสรุ ปคําแนะนําเพือ่ ขั้นตอนในการค้นอีก


ครั้งดังนี้

1. เตรี ยม Keyword สําหรับการค้นหา “เนื้ อหา “ การศึกษาที่ตอ้ งการ รวมกับ “methodology


filter” ( กรองหรื อเลือกเฉพาะการศึกษาแบบใด ซึ่ ง ณ ที่น้ ี คือ systematic review, meta-
analysis)
a. Keyword สําหรับการค้นหา “เนื้ อหา” ได้แก่ Hepatocellular Carcinoma,
Hepatoma, Transarterial Chemoembolization Keyword ตรงส่ วนนี้อาจมา
จากได้หลายส่วนเช่น
- การวางคําถามการทบทวนในส่ วนข้างต้น (PICO),
- จากตัวอย่างของการศึกษาและค้นหาว่าถูก index ด้วย keyword ใด โดยดูจาก
ในการศึกษานั้น ๆ เองหรื อในฐานข้อมูลที่ได้มาในส่วน subject heading
- หรื อจากการค้นหาด้วยคําของตนเองในฐานข้อมูลแล้วฐานข้อมูลนั้น ๆ มี
กระบวนการอัตโนมัติท่ีพยายามจะ index คํานั้น ๆ และผูค้ น้ หาเลือกคําที่
ความหมายใกล้เคียงกับที่ตอ้ งการมากที่สุด
b. Keyword สําหรับ methodology filter ซึ่ งจะได้กล่าวต่อไป
2. ค้นหาการทบทวนวรรณกรรมแบบง่าย ๆ โดยใช้ PUBMED ก่อนโดยใช้การค้นหาในส่ วนของ
“clinical queries” ในส่ วนของ systematic reviews ซึ่ งเป็ น methodology filter ที่
National Library of Medicine ทําการศึกษาจากผลงานของ Dr.Haynes B et al,
McMaster University, Canada ทั้งนี้เนื่ องจากเป็ นฐานข้อมูลที่เข้าง่ายที่สุด แพร่ หลายที่สุด
ดังนั้นสําหรับขั้นตอนนี้เพียงใช้ Keyword สําหรับ “เนื้อหา” เท่านั้น
3. หลังจากนั้นค้นหาในฐานข้อมูลสําหรับการทบทวนวรรณกรรมโดยเฉพาะ เช่น ฐานข้อมูล Evidence
Based Medicine Reviews ซึ่ งประกอบด้วย Cochrane Library และ Database of
Abstracts of Reviews of Effects หรื อฐานข้อมูลอื่น ๆ เช่น Clinical Evidence และ UP-
to date เนื่ องจากฐานข้อมูลนี้ จะมีเฉพาะ systematic review / meta-analysis ดังนั้นจึงใช้
Keyword สําหรับ “เนื้ อหา” เท่านั้น
4. ค้นหาในฐานข้อมูลสําหรับสาขาวิชานั้น ๆ ซึ่ งจะทราบจากผูเ้ ชี่ยวชาญของสาขานั้น ๆ หรื อบรรณารักษ์
ห้องสมุด หรื อใช้การค้นหาด้วยตนเองใน search engine ต่าง ๆ หรื อบาง web site
ได้แก่ http://www.shef.ac.uk/scharr/ir/netting/ ฐานข้อมูลดังกล่าวเช่น Cancer Care
Ontario Clinical Practice Guidelines หรื อ American Society of Clinical
Oncology

เมื่อสิ้นสุดขั้นตอนนี้ผวู ้ จิ ยั พบว่า มี Systematic review อยู่ 3 ฉบับแต่พบว่าปั จจุบนั มีหลักฐาน


การแพทย์ใหม่เป็ นจํานวนมาก และผลยังคงขัดแย้งกัน ยิง่ ไปกว่านั้นผูว้ จิ ยั พบว่าการรายงานผลน่าจะใช้อตั รา
การอยูร่ อดชีวติ ที่ 1 ปี จะมีความหมายทางคลินิกมากกว่าที่ 2 ปี จึงเป็ นเหตุผลของการทบทวนวรรณกรรม
ครั้งใหม่ดงั รายละเอียดต่อไปนี้
From our review of review, currently there are three meta-analyses addressing this
method of treatment Simonetti (5) in 1997, Mathurin (6) in 1998 and Comma (7) in 2002. The
first and the second meta-analysis included 3 and 6 RCTs which compared TAE or TACE with no
active treatment or co-intervention in both treatment and control groups. Simonetti et al. reported
border-line significant therapeutic benefit (Odd ratio of 1-year survival rate = 2.0, 95% CI 1.1-3.6)
in the set of 3 RCTs where embolization was compared to no treatment or to intravenous 5-FU in
1997. In 1998, Mathurin et al reported the result from a meta-analysis of 6 RCTs, comparing
TACE or TAE with no active treatment or tamoxifen or intravenous 5-FU, which failed to show a
benefit of TACE on 1-year survival (Risk difference=0.3%, 95%CI = -11 to 12 %). In this year,
2002, instead of reporting the result of 1-year survival, Comma reported the benefit of 2-years
survival of 5 RCTs meta-analysis (OR = 0.54, 95% CI = 0.33-0.89).
Since hepatocellular carcinoma is the fatal disease with only 20% survival rate at
one-year (8-10). For this reason, one year-survival rate would be the better information in the
decision making for both HCC patients and the treating physicians. Therefore, we conducted this
meta-analysis on the updated and comprehensive searched for the RCTs by using the overall one-
year survival as the end point.

- การค้ นหาการศึกษาปฐมภูมิ

เช่นเดียวกับการค้นหาการทบทวนวรรณกรรม ทั้งนี้มีจุดประสงค์ในการค้นหาการศึกษาให้ “ครบถ้วน”


และมีระเบียบวิธีวจิ ยั คือ “ทําซํ้าได้” โดยใช้ Keyword เดียวกันแต่ต่างกันที่ methodology filter
เท่านั้น (คือการค้นหา randomized controlled trial แทนที่ systematic review และ meta-
analysis)
o การค้นแบบง่าย ๆ ได้แก่ การค้นจาก PUBMED (national library of medicine)
ดังนี้โดยใช้ “clinical queries” ในส่วนของ “therapy” , “specific search” ดัง
ตัวอย่างข้างล่างนี้
สําหรับขั้นตอนนี้เช่นเดียวกับเป็ นการปรับใช้จากผลงานของ Dr.Haynes โดยมีท่ีมาของ Keyword
ดังต่อไปนี้

o เช่นเดียวกันกับการหาทบทวนวรรณกรรม การค้นหาแบบละเอียดได้แก่ การค้นหาโดยใช้


PUBMED รวมกับการค้นในฐานข้อมูลพิเศษ ได้แก่ Cochrane Central Register
of Controlled Trials
o และฐานข้อมูลมาตรฐานโดยใช้ methodology filter ดังตัวอย่างข้างล่างนี้

สําหรับ methodology filter ข้างต้นใช้ “Cochrane maximally sensitive search


strategy for RCTS” สําหรับ Medline ดังนี้

1. randomized controlled trial.pt.


2. controlled clinical trial.pt.
3. randomized controlled trials.sh.
4. random allocation.sh.
5. double blind method.sh.
6. single blind method.sh.
7. or/1-6
8. (animal not human).sh.
9. 7 not 8
10. clinical trial.pt.
11. exp clinical trials/
12. (clin$ adj25 trial$).ti,ab.
13. ((singl$ or doubl$ or trebl$ or tripl$) adj25 (blind$ or mask$)).ti,ab.
14. placebos.sh.
15. placebo$.ti,ab.
16. random$.ti,ab.
17. research design.sh.
18. or/10-17
19. 18 not 8
20. 19 not 9
21. comparative study.sh.
22. exp evaluation studies/
23. follow up studies.sh.
24. prospective studies.sh.
25. (control$ or prospectiv$ or volunteer$).ti,ab.
26. or/21-25
27. 26 not 8
28. 27 not (9 or 20)
29. 9 or 20 or 28
30. exp asthma/
31. 29 and 30

Lines 30 and 31 for illustration only.

ทั้งนี้ Search Strategies ดังกล่าวสามารถนํามาปรับใช้กบั ฐานข้อมูลมาตรฐานอื่นๆ อีกเช่นกัน

แหล่ งฐานข้ อมูลอืน่ ทีน่ ่ าสนใจสําหรับการค้ นหาการศึกษาปฐมภูมได้


ิ แก่

ั ทัว่ ไป ผูว้ จิ ยั จําเป็ นต้องพิจารณาได้แก่ กลุ่มโรคที่อาจพบบ่อยมากใน


1.ฐานข้อมูลอื่น ๆ ที่ไม่ได้ใช้กน
บางประเทศ และอาจมิได้ตีพมิ พ์เป็ นภาษาอังกฤษ หรื ออยูใ่ นฐานข้อมูลมาตรฐานข้างต้น เช่นการทบทวน
วรรณกรรมเรื่ องมะเร็ ง nasopharynx ซึ่งพบบ่อยมากในประเทศจีน การทบทวนวรรณกรรมเรื่ องสมุนไพร
ไทย อาจจําเป็ นต้องสื บค้นในวารสารประเทศไทย หรื อตํารายาไทย เป็ นต้น

2. การศึกษาที่มิได้ตีพมิ พ์ ซึ่ งอาจต้องติดต่อผูเ้ ชี่ยวชาญในสาขานั้น ๆ เพือ่ สอบถามในวงกว้างถึงผูท้ ่ี


ทํางานวิจยั เรื่ องดังกล่าวว่ามีหรื อไม่ มีผลเป็ นอย่างไร และจะขออนุญาตเพือ่ ทําการเก็บข้อมูลไว้ดว้ ย ทั้งนี้ขอ้ มูล
เบื้องต้นได้แก่ บทคัดย่อต่าง ๆ จากการประชุมนานาชาติของผูเ้ ชี่ยวชาญในสาขานั้น ๆ

3. การค้นด้วยมือ (hand searching) และการค้นหาการศึกษาปฐมภูมิจากเอกสารอ้างอิง


(Reference lists) ของการศึกษาปฐมภูมิอ่ืน ๆ ในบางครั้งอาจมีความจําเป็ น ทั้งนี้โดยเฉพาะในกรณี ท่ี
การศึกษาเพือ่ ตอบคําถามดังกล่าวมีจาํ นวนน้อย
เมื่อสิ้นสุดขั้นตอนนี้ผวู ้ จิ ยั จะได้ขอ้ มูลชุดหนึ่งจาก search strategies ดังกล่าว ซึ่งจะต้องผ่าน
กระบวนการการเลือกหาการศึกษาที่มีคาํ ตอบ และเป็ นที่ตอ้ งการตามคําถามที่ต้ งั ไว้ล่วงหน้า โดยไม่ใช้ความรู ้สึก
ส่วนตัวในการเลือก และจึงตามด้วยการดึงข้อมูลรวมถึงคุณภาพของการศึกษา เพือ่ ตอบคําถามนั้น ๆ ตามระเบียบ
วิธีวจิ ยั ที่ต้ งั ไว้
การคัดเลือกงานวิจยั เพือ่ นํามาทําการทบทวน (Study selection)
หลังจากทําการค้นหางานวิจยั ที่น่าจะเกี่ยวข้องอย่างครอบคลุมโดยใช้วธิ ีการต่าง ๆ ดังกล่าวไปแล้ว
ผลลัพธ์ท่ีได้คือบัญชีรายชื่องานวิจยั ที่น่าจะเกี่ยวข้องทั้งหมดซึ่งมักมีเป็ นจํานวนมาก ขั้นตอนต่อไปในการทํา
systematic review คือการคัดเลือกเอาเฉพาะงานวิจยั ที่มีคุณสมบัติครบตามเกณฑ์ท่ีได้กาํ หนดไว้เท่านั้นมาทํา
การทบทวน (review) เกณฑ์ในการคัดเลือกงานวิจยั (selection criteria) เพือ่ นํามา review นั้นต้อง
กําหนดไว้ล่วงหน้าก่อนการคัดเลือกงานวิจยั เกณฑ์ดงั กล่าวได้มาจากคําถามการวิจยั และมักจะประกอบด้วย
องค์ประกอบ 4 ประการคือ
1. ประชากรที่ศึกษาวิจยั (study population) คือการระบุลกั ษณะของประชากรเช่นการมีโรคหรื อภาวะ
ผิดปกติ ระดับหรื อความรุ นแรงของโรค เกณฑ์ในการวินิจฉัยโรค เพศหรื ออายุของผูป้ ่ วย เป็ นต้น
2. มาตรการที่สนใจในการศึกษาวิจยั (study intervention) คือการระบุมาตรการที่สนใจศึกษาซึ่ งอาจเป็ น
การรักษาโรคด้วยยา การผ่าตัด การป้ องกันโรค หรื อมาตรการอาจเป็ นปั จจัยต่าง ๆ ที่มีผลต่อการเกิดโรค
(risk factor) หรื อต่อการพยากรณ์โรค (prognostic factor) หรื ออาจเป็ นการวินิจฉัยโรคด้วยวิธีการ
ต่าง ๆ (diagnostic test)
3. ผลลัพธ์ที่สนใจ (outcomes) คือการระบุถึงสิ่ งที่เปลี่ยนแปลงไปอันสื บเนื่ องมาจากมาตรการที่สนใจใน
การศึกษาวิจยั เช่นหากมาตรการในการศึกษาวิจยั เป็ นการรักษาโรค ผลลัพธ์ท่ีสนใจก็อาจจะเป็ นการหาย
จากโรค การเสี ยชีวติ ระดับความรุ นแรงของโรค ภาวะแทรกซ้อนจากโรค การกลับเป็ นซํ้าของโรค
หรื อคุณภาพชีวติ ของผูป้ ่ วย หากมาตรการเป็ นปั จจัยเสี่ ยงต่อการเกิดโรค ผลลัพธ์ท่ีสนใจก็เป็ นการเกิดโรค
เป็ นต้น
4. ระเบียบวิธีวจิ ยั ที่ใช้ในการศึกษาวิจยั (research methodology) คือการระบุรูปแบบการศึกษาวิจยั ที่จะ
นํามา review เช่นระบุวา่ จะทําการ review เฉพาะการศึกษาชนิด randomized controlled trials
เป็ นต้น

เนื่องจากรายชื่องานวิจยั ที่น่าจะเกี่ยวข้องซึ่งค้นมาได้มกั จะมีเป็ นจํานวนมาก จึงเป็ นไปได้ยากในทาง


ปฏิบตั ิท่ีจะศึกษารายงานฉบับเต็มของงานวิจยั ทุกเรื่ องว่ามีคุณสมบัติครบตามเกณฑ์ท่ีกาํ หนดไว้ในการคัดเลือก
งานวิจยั ที่จะนํามา review หรื อไม่ วิธีการที่ใช้ในการคัดเลือกงานวิจยั เพือ่ นํามา review จึงเริ่ มต้นด้วยการ
อ่านชื่อเรื่ องและบทคัดย่อของงานวิจยั ที่คน้ มาได้ก่อน หากปรากฏชัดเจนจากชื่อเรื่ องและ/หรื อบทคัดย่อว่าเรื่ อง
ดังกล่าวมีคุณสมบัติไม่ครบตามเกณฑ์ (selection criteria) แน่นอนก็สามารถตัดเรื่ องนั้นออกจากบัญชีได้1 0

หลังจากนั้นจึงทําการค้นรายงานฉบับเต็มของงานวิจยั ที่เหลือทุกฉบับเพือ่ นํามาศึกษาว่ามีคุณสมบัติครบตามเกณฑ์


ที่กาํ หนดไว้ในการคัดเลือกงานวิจยั ที่จะนํามา review หรื อไม่ และทําการคัดเลือกเฉพาะงานวิจยั ที่มีคุณสมบัติ
ครบตามเกณฑ์การคัดเลือกงานวิจยั เท่านั้นไปทํา review ต่อไป และควรมีการแสดงเหตุผลที่ไม่เลือกงานวิจยั ที่
เหลือด้วย

1
หากยังไม่ชดั เจนหรื อมีความคลุมเครื อว่าเรื่องดังกล่าวมีคณ
ุ สมบัติครบตามเกณฑ์การเลือกงานวิจยั มาทําการทบทวนหรื อไม่ก็ยงั
ไม่ควรตัดรายชื่องานวิจยั ดังกล่าวออกจากบัญชีในขันนี ้ ้
แม้วา่ จะได้มีการกําหนดเกณฑ์ในการคัดเลือกงานวิจยั เพือ่ นํามา review ไว้ล่วงหน้าอย่างชัดเจนแล้ว
การที่จะเลือกหรื อไม่เลือกงานวิจยั เรื่ องใดเรื่ องหนึ่งยังคงขึ้นอยูก่ บั การตัดสิ นใจของผูท้ ่ีทาํ หน้าที่คดั เลือกงานวิจยั
ผูค้ ดั เลือกงานวิจยั คนหนึ่งอาจเลือกงานวิจยั ชุดหนึ่งมาทําการ review ในขณะที่หากให้ผคู ้ ดั เลือกงานวิจยั อีกคน
หนึ่งทําหน้าที่คดั เลือกงานวิจยั เรื่ องเดียวกันนั้นโดยใช้เกณฑ์การคัดเลือกเดียวกันอาจจะได้งานวิจยั อีกชุดหนึ่งซึ่งมี
งานวิจยั หลายเรื่ องไม่ซ้ าํ กับที่ผคู ้ ดั เลือกคนแรกเลือกไว้ ผลการคัดเลือกงานวิจยั (ซึ่งย่อมจะมีผลต่อผลของ
systematic review ด้วย) จึงไม่น่าเชื่อถือเพราะขึ้นอยูก่ บั ว่าใครเป็ นผูค้ ดั เลือกงานวิจยั การเกิดกรณี เช่นนี้ ถือ
เป็ นอคติ (bias) ชนิดหนึ่ง หากมีขอ้ มูลที่แสดงให้เห็นว่าไม่วา่ จะให้ใครทําหน้าที่คดั เลือกงานวิจยั ก็จะได้
งานวิจยั ชุดเดียวกันหรื อมีความใกล้เคียงกันมากมาทํา review ผลการคัดเลือกงานวิจยั นั้นก็ยอ่ มมีความ
น่าเชื่อถือ ดังนั้นในการทํา systematic review ควรมีการประเมินความน่าเชื่อถือ (reliability หรื อ
reproducibility) ของกระบวนการคัดเลือกงานวิจยั เพือ่ นํามา review ด้วย วิธีการดังกล่าวทําได้โดยให้มีผู ้
คัดเลือกงานวิจยั อย่างน้อย 2 คนทําหน้าที่คดั เลือกงานวิจยั โดยต่างคนต่างคัดเลือกอย่างเป็ นอิสระต่อกัน (คือผู ้
คัดเลือกแต่ละคนไม่ทราบว่าอีกคนหนึ่งเลือกงานวิจยั เรื่ องใดบ้าง) โดยใช้เกณฑ์ในการคัดเลือกเดียวกัน แล้วนํา
ผลที่ได้จากการคัดเลือกของแต่ละคนมาเปรี ยบเทียบกันและคํานวณหาค่าดัชนีท่ีแสดงถึงแนวโน้มในการตัดสิ นใจ
เหมือนกันที่ไม่ได้เกิดจากความบังเอิญที่เรี ยกว่า chance corrected agreement โดยใช้ค่าสถิติ kappa (κ)
สมมติวา่ หลังจากค้นหางานวิจยั ที่อาจเกี่ยวข้องแล้วพบว่าได้รายชื่องานวิจยั ที่อาจเกี่ยวข้อง 100 เรื่ อง
นํามาให้ผคู ้ ดั เลือกงานวิจยั 2 คนทําการคัดเลือกอย่างเป็ นอิสระต่อกัน ผูค้ ดั เลือกคนที่ 1 คัดเลือกงานวิจยั เพือ่
นํามา review เป็ นจํานวน 20 เรื่ อง ส่วนผูค้ ดั เลือกคนที่ 2 คัดเลือกไว้ 25 เรื่ อง โดยมีเรื่ องที่ผคู ้ ดั เลือกทั้ง 2
คนคัดเลือกไว้เหมือนกันอยู่ 18 เรื่ อง ดังแสดงในตารางที่ 2

ตารางที่ 2 ผลการคัดเลือกงานวิจยั เพือ่ นํามาทํา review ของผู้คดั เลือก 2 คนโดยต่ างคนต่ างคัดเลือก
ผูค้ ดั เลือกคนที่ 1
เลือก ไม่เลือก รวม
เลือก 18 7 25
a b a+b
ผูค้ ดั เลือกคนที่ 2
ไม่เลือก 2 73 75
c d c+d
รวม 20 80 100
a+c b+d n

จากตารางที่2 จะเห็นว่าผูค้ ดั เลือกทั้ง 2 คนตัดสิ นใจเหมือนกัน (คือเลือกหรื อไม่เลือกเหมือนกัน) ใน 18


+ 73 = 91 เรื่ องจากงานวิจยั 100 เรื่ อง ค่า 91/100 นี้เรี ยกว่าความเหมือนในการตัดสิ นใจที่เกิดขึ้นจริ ง
(observed agreement หรื อ raw agreement) แต่ค่านี้ไม่ได้แสดงถึงแนวโน้มจริ งในการตัดสิ นใจ
เหมือนกันระหว่างผูค้ ดั เลือกทั้ง 2 คนเนื่องจากว่าบางเรื่ องที่ผคู ้ ดั เลือกทั้ง 2 เลือกหรื อไม่เลือกเหมือนกันนั้นอาจ
เกิดขึ้นโดยความบังเอิญ (chance)
ผูค้ ดั เลือกคนที่ 1 คัดเลือกงานวิจยั 20 ใน 100 เรื่ องหรื อเท่ากับ 20 % ส่วนผูค้ ดั เลือกคนที่ 2
คัดเลือกงานวิจยั 25 ใน 100 เรื่ องหรื อเท่ากับ 25 % หากผูค้ ดั เลือกทั้ง 2 คนไม่มีแนวโน้มในการตัดสิ นใจ
เหมือนกันเลย (คือไม่มี agreement กันเลย) ในงานวิจยั 25 เรื่ องที่ผคู ้ ดั เลือกคนที่ 2 ตัดสิ นใจเลือกนั้น ผู ้
คัดเลือกคนที่ 1 ควรจะตัดสิ นใจเลือก 5 เรื่ อง (เท่ากับ 20 % ของ 25 เรื่ อง) และในงานวิจยั 75 เรื่ องที่ผู ้
คัดเลือกคนที่ 2 ตัดสิ นใจไม่เลือกนั้น ผูค้ ดั เลือกคนที่ 1 ควรจะตัดสิ นใจไม่เลือก 60 เรื่ อง (เท่ากับ 80 % ของ
75 เรื่ อง) ดังนั้น แม้ผคู ้ ดั เลือกทั้ง 2 คนไม่มีแนวโน้มในการตัดสิ นใจเหมือนกันเลยก็ตามก็จะยังคงมีโอกาส
เลือกหรื อไม่เลือกงานวิจยั เหมือนกันใน 5 + 60 = 65 เรื่ องจาก 100 เรื่ อง (ตารางที่ 3) ค่า 65/100 นี้เรี ยกว่า
ความเหมือนในการตัดสิ นใจที่เกิดขึ้นโดยบังเอิญ (chance agreement หรื อ expected agreement)

ตารางที่ 3 ผลการคัดเลือกงานวิจยั เพือ่ นํามาทํา review ของผู้คดั เลือก 2 คนโดยต่ างคนต่ างคัดเลือก ในกรณีที่
ผู้คดั เลือกทั้ง 2 คนไม่ มแี นวโน้ มในการตัดสินใจเหมือนกันเลย
ผูค้ ดั เลือกคนที่ 1
เลือก ไม่เลือก รวม
เลือก 5 20 25
ผูค้ ดั เลือกคนที่ 2
ไม่เลือก 15 60 75
รวม 20 80 100

ดังนั้นในการพิจารณาแนวโน้มในการตัดสิ นใจเหมือนกันของผูค้ ดั เลือกทั้ง 2 คนจึงต้องคํานึงถึงความ


เหมือนในการตัดสิ นใจที่เกิดขึ้นโดยบังเอิญนี้ดว้ ย โดยพิจารณาว่าในความเป็ นไปได้ท้ งั หมดที่จะตัดสิ นใจ
เหมือนกันโดยที่ไม่ได้เกิดจากความบังเอิญนั้น ผูค้ ดั เลือกทั้ง 2 คนตัดสิ นใจเหมือนกันจริ ง ๆ โดยที่ไม่ได้เกิดจาก
ความบังเอิญมากแค่ไหน kappa คืออัตราส่วนระหว่างความเหมือนในการตัดสิ นใจนอกเหนือไปจากความ
บังเอิญที่เกิดขึ้นจริ งกับความเหมือนในการตัดสิ นใจนอกเหนือไปจากความบังเอิญที่เป็ นไปได้ทง้ ั หมด ความ
เหมือนในการตัดสิ นใจนอกเหนือไปจากความบังเอิญที่เกิดขึ้นจริ งเท่ากับ observed agreement – chance
agreement ส่ วนความเหมือนในการตัดสิ นใจนอกเหนื อไปจากความบังเอิญที่เป็ นไปได้ท้ งั หมดจะเท่ากับ 1 –
chance agreement ดังนั้นจึงเขียนเป็ นสมการได้วา่

observed agreement − chance agreement


kappa =
1 − chance agreement
โดยที่
(ดูตารางที่ 2)
a+d
observed agreement =
n
chance agreement =
(a + c )(a + b ) + (b + d )(c + d )
n2
จากตัวอย่างข้างต้น kappa =
(91 / 100) − (65/100) = 0.74
1 − (65/100)
kappa เป็ นดัชนี บอกว่าบุคคล 2 คนมีแนวโน้มในการตัดสิ นใจในเรื่ องเดียวกันได้เหมือนกันมากน้อย
เพียงใด kappa มีค่ามากที่สุดเท่ากับ 1 โดยถ้า kappa เท่ากับ 1 แสดงว่าบุคคลทั้ง 2 นั้นมีแนวโน้มในการ
ตัดสิ นใจเหมือนกันทุกประการ กล่าวคือผูค้ ดั เลือกงานวิจยั เพือ่ นํามา review ทั้ง 2 คนคัดเลือกงานวิจยั เรื่ อง
เดียวกันทุกประการ ถ้า kappa เท่ากับ 0 แสดงว่าบุคคลทั้ง 2 ไม่มีแนวโน้มในการตัดสิ นใจเหมือนกันเลย การ
ที่เห็นว่าบุคคลทั้ง 2 ตัดสิ นใจเหมือนกันบ้างนั้นเป็ นไปโดยความบังเอิญเท่านั้น ถ้า kappa มีค่าเป็ นลบแสดงว่า
บุคคลทั้ง 2 มีแนวโน้มในการตัดสิ นใจตรงกันข้ามกัน โดยทัว่ ไปถ้า kappa มีค่าใกล้เคียง 1 มากเท่าไหร่ ก็แสดง
ว่ากระบวนการคัดเลือกงานวิจยั มาทํา review มีความน่าเชื่อถือมากเท่านั้น
เมื่อผูค้ ดั เลือกงานวิจยั ตั้งแต่ 2 คนขึ้นไปตัดสิ นใจคัดเลือกงานวิจยั เรื่ องใดไม่เหมือนกัน (เช่นคนหนึ่ง
เลือกแต่อีกคนหนึ่งไม่เลือก) จําเป็ นต้องมีการตัดสิ นใจขั้นสุดท้ายว่าจะเลือกหรื อไม่เลือกงานวิจยั เรื่ องนั้น การ
ตัดสิ นใจขั้นสุดท้ายนี้ทาํ ได้โดยให้ผคู ้ ดั เลือกงานวิจยั ทัง้ 2 คนปรึ กษาหารื อกันเพื่อตัดสิ นใจร่ วมกัน
(consensus) โดยอาจหาข้อมูลเกี่ยวกับงานวิจยั เรื่ องนั้นเพิ่มเติมจากผูท้ าํ การวิจยั โดยตรงก่อน ในบางกรณี ผู ้
คัดเลือกงานวิจยั ทั้ง 2 คนอาจไม่สามารถสรุ ปความเห็นร่ วมกันได้วา่ จะเลือกหรื อไม่เลือกงานวิจยั นั้น กรณี น้ ี
จําเป็ นต้องตัดสิ นใจขั้นสุดท้ายโดยการหาบุคคลอื่นซึ่งมีความรู ้ในเรื่ องที่จะ review เป็ นอย่างดีและมีความรู ้เรื่ อง
ระเบียบวิธีวจิ ยั มาช่วยตัดสิ น โดยทัว่ ไปแนะนําให้ผคู ้ ดั เลือกงานวิจยั ทุกคนพยายามสรุ ปความเห็นร่ วมกันให้ได้
(consensus) จะเหมาะสมกว่าการใช้บุคคลอื่นมาช่วยตัดสิ น
ในทางทฤษฎีมีความเป็ นไปได้วา่ การที่ผคู ้ ดั เลือกงานวิจยั เพือ่ นํามา review ทราบว่างานวิจยั ที่ตนเอง
กําลังคัดเลือกนั้นทําโดยผูว้ จิ ยั ท่านใด จากสถาบันใด ตีพมิ พ์ในวารสารการแพทย์อะไร และผลเป็ นอย่างไร
อาจมีผลต่อการตัดสิ นใจเลือกหรื อไม่เลือกงานวิจยั นั้นเพือ่ นํามาทํา systematic review ด้วยเหตุผลนี้บาง
ท่านจึงแนะนําว่าในการคัดเลือกงานวิจยั นั้น ผูค้ ดั เลือกงานวิจยั ไม่ควรทราบว่างานวิจยั ที่ตนเองกําลังตัดสิ นใจ
คัดเลือกนั้นทําโดยใคร จากสถาบันไหน ตีพมิ พ์ในวารสารอะไร และมีผลอย่างไร เพือ่ ลดอคติ (bias) ในการ
คัดเลือกงานวิจยั การที่จะบรรลุวตั ถุประสงค์ดงั กล่าวสามารถทําได้โดยนํางานวิจยั ที่คน้ มาได้มาทําการลบ
รายละเอียดเกี่ยวกับรายชื่อผูว้ จิ ยั สถาบันที่ทาํ การวิจยั ชื่อวารสารที่ตีพมิ พ์ และผลการวิจยั ก่อนที่จะนําไปให้
ผูค้ ดั เลือกงานวิจยั ทําการคัดเลือก หรื อในบางกรณี อาจต้องจัดทําสําเนารายงานวิจยั ขึ้นมาใหม่เนื่องจากผูค้ ดั เลือก
งานวิจยั ยังอาจจะทราบชื่อวารสารที่ตีพมิ พ์ได้จากรู ปแบบการตีพมิ พ์แม้จะไม่มีช่ือวารสารให้เห็น จะเห็นได้วา่
ในทางปฏิบตั ิการกระทําดังกล่าวมีความยุง่ ยาก สิ้นเปลืองเวลาและทรัพยากรมาก นอกจากนี้ยงั ไม่มีขอ้ มูลยืนยัน
ให้เห็นได้ชดั ว่าการที่ไม่กระทําวิธีการดังกล่าวส่งผลให้เกิดอคติอย่างมากจนทําให้ผลการ review ไม่ถกู ต้อง
ดังนั้นคําแนะนําดังกล่าวจึงยังไม่เป็ นยอมรับกันโดยทัว่ ไป
ปั ญหาอีกประการหนึ่งซึ่งอาจเกิดขึ้นในขั้นตอนการค้นหาและคัดเลือกงานวิจยั เพือ่ นํามาทํา
systematic review คือการคัดเลือกงานวิจยั เรื่ องเดียวกันที่ได้รับการตีพมิ พ์มากกว่า 1 ครั้ง (duplicate
publication) โดยอาจเป็ นการตีพมิ พ์ในวารสารต่างกัน หรื อเป็ นการตีพมิ พ์ในช่วงระยะเวลาที่ต่างกัน เช่น
ผูว้ จิ ยั อาจรายงานผลการวิจยั ครั้งแรกหลังจากทําการวิจยั ไปได้ 3 ปี หลังจากนั้นเมื่อทําการวิจยั ไปได้ครบ 5 ปี
ผูว้ จิ ยั อาจรายงานผลการวิจยั อีกครั้งโดยรวมเอาข้อมูลที่ได้รายงานไปแล้วเมื่อ 3 ปี ไว้ดว้ ย หรื อผูว้ จิ ยั อาจรายงาย
ผลการวิจยั ครั้งแรกในรู ปแบบของบทคัดย่อในการประชุมทางวิชาการต่าง ๆ (ซึ่งจะตีพิมพ์ในหนังสื อบทคัดย่อ
ของการประชุมนั้น ๆ) หลังจากนั้นจึงส่งไปตีพมิ พ์ในวารสารการแพทย์อีกครั้ง การคัดเลือกงานวิจยั เรื่ อง
เดียวกันที่ได้รับการตีพมิ พ์ซ้ าํ มาทํา review ย่อมทําให้ผลการ review เบี่ยงเบนไปจากความเป็ นจริ งได้
เนื่องจากงานวิจยั เรื่ องนั้นจะได้รับนํ้าหนักมากกว่าเรื่ องอื่น ดังนั้นหลังจากคัดเลือกงานวิจยั ที่จะนํามาทําการ
review ได้แล้วจึงต้องมีการตรวจสอบว่ามี duplicate publication หรื อไม่ การตรวจสอบดังกล่าวทําได้
โดยการสังเกตจากชื่อเรื่ อง ชื่อคณะผูว้ จิ ยั และสถาบันที่ทาํ การวิจยั ลักษณะประชากรที่ศึกษาวิจยั (โดยดูจาก
เกณฑ์ในการคัดเลือกประชากร) รายละเอียดของมาตรการที่ทาํ การศึกษาวิจยั และผลลัพธ์ท่ีศึกษาวิจยั เป็ นต้น
หากไม่แน่ใจว่ารายงานวิจยั หลายเรื่ องที่เลือกมาเป็ นรายงานที่ซ้ าํ กันหรื อไม่ก็จาํ เป็ นต้องติดต่อสอบถามจากผูว้ จิ ยั
โดยตรง หากพบว่ามี duplicate publication สิ่ งที่ควรปฏิบตั ิคือการคัดเลือกงานวิจยั นั้นมาทํา review
เพียงรายงานเดียว โดยอาจเลือกรายงานที่ตีพมิ พ์ล่าสุด หรื อรายงานที่มีความสมบูรณ์ของข้อมูลมากที่สุด
การประเมินความถูกต้ อง (validity assessment หรือ quality
assessment) ของงานวิจยั ทีน่ ํามาทบทวน
เมื่อคัดเลือกงานวิจยั ที่จะนํามา review แล้ว ขั้นตอนต่อไปของการทํา systematic review คือ
การประเมินคุณภาพของงานวิจยั ที่เลือกมา โดยเฉพาะในแง่ของความถูกต้อง (validity) ซึ่งหมายถึงการที่
ผลงานวิจยั น่าจะเป็ นความจริ งหรื อใกล้เคียงความเป็ นจริ งมากที่สุด ซึ่งการประเมินดังกล่าวทําได้โดยการ
ประเมินว่างานวิจยั แต่ละเรื่ องมีวธิ ีการหลีกเลี่ยงความผิดพลาด (error) มากน้อยเพียงใดโดยเฉพาะความผิดพลาด
เชิงระบบ (systematic error)หรื ออคติ (bias) (ตารางที่ 4)

ตารางที่ 4 วิธีการทีใ่ ช้ ในการหลีกเลีย่ งอคติในงานวิจยั 2


1

งานวิจยั เกีย่ วกับมาตรการในการรักษาหรือป้ องกันโรค (treatment or prevention)


1. การเลือกให้ประชากรในการศึกษา (subject) อยูใ่ นกลุ่มศึกษาหรื อกลุ่มควบคุมใช้วธิ ี การสุ่ ม
(randomization) ซึ่งก็คือการใช้รูปแบบการวิจยั ชนิดสุ่มโดยมีกลุ่มควบคุม (randomized
controlled trial)
2. การสุ่ มเลือกมาตรการในการศึกษาเป็ นแบบ concealed randomization (คือผูว้ จิ ยั ไม่ทราบล่วงหน้า
ว่า subject รายต่อไปจะอยูใ่ นกลุ่มศึกษาหรื อกลุ่มควบคุม)
3. ผูว้ จิ ยั ประชากรในการศึกษา และผูป้ ระเมินผลลัพธ์ ไม่ทราบว่าประชากรในการศึกษาอยูใ่ นกลุ่มศึกษา
หรื อกลุ่มควบคุม (คือมี blinding)
4. มีการติดตามประชากรในการศึกษาว่าเกิด outcome หรื อไม่อย่างครบถ้วนสมบูรณ์ (completeness
of follow-up)
5. วิเคราะห์ขอ้ มูลของ subject ให้อยูใ่ นกลุ่มที่ subject ได้รับการสุ่ ม (กลุ่มศึกษาหรื อกลุ่มควบคุม) ถึงแม้
subject รายนั้นอาจจะได้รับหรื อไม่ได้รับมาตรการที่ศึกษาตามที่ได้รับการสุ่ ม (กล่าวคือวิเคราะห์ขอ้ มูล
โดยใช้ intention-to-treat principle)
งานวิจยั เกีย่ วกับมาตรการในการวินิจฉัยโรค (diagnostic test)
1. ผูป้ ่ วยในการศึกษามีลกั ษณะเหมือนผูป้ ่ วยที่ตอ้ งการนํา diagnostic test นั้นไปใช้ช่วยวินิจฉัยโรคใน
ชีวติ จริ ง
2. มีการเปรี ยบเทียบผลของ diagnostic test กับผลการวินิจฉัยที่เป็ นมาตรฐาน (gold standard) ใน
ผูป้ ่ วยทุกรายในการศึกษา
3. ผูท้ ่ีแปลผล diagnostic test ไม่ทราบผลของ gold standard และผูท้ ่ีแปลผล gold standard ไม่
ทราบผลของ diagnostic test (blind comparison)
งานวิจยั ทีเ่ กีย่ วกับปัจจัยเสี่ยงในการเกิดโรคหรือสาเหตุของโรค (risk factor หรือ etiology) หรือปัจจัยที่
เกีย่ วกับการพยากรณ์ โรค (prognostic factor)
1. ใช้รูปแบบการวิจยั ที่เหมาะสม เช่น รู ปแบบการวิจยั ชนิ ด cohort study ย่อมมีโอกาสเกิดอคติ (bias)
น้อยกว่ารู ปแบบชนิด case-control study

2
ดัดแปลงจาก Guyatt H, Rennie D, editors. The Evidence-Based Midicine working Group. Users’ guides to the medical
literature: A manual for evidence-based medicine clinical practice. AMA Press, 2002.
2. ประชากรในกลุ่มที่มีและไม่มีปัจจัยที่สนใจศึกษามีลกั ษณะอื่น ๆ ที่สาํ คัญที่มีผลต่อการเกิดโรคหรื อการ
พยากรณ์โรคเหมือนหรื อใกล้เคียงกัน หากลักษณะดังกล่าวมีความแตกต่างกันระหว่างประชากรทั้ง 2
กลุ่มจะต้องมีการใช้เทคนิคทางสถิติในการปรับลักษณะดังกล่าวในการวิเคราะห์ขอ้ มูล
3. ประชากรมีโอกาสที่จะได้รับการประเมินปั จจัยที่สนใจศึกษา (exposure assessment) เหมือน ๆ กัน
ด้วยวิธีการที่เหมือนกัน ข้อนี้จะมีความสําคัญมากในกรณี การศึกษาชนิด case-control study
4. ประชากรได้รับการประเมินการเกิดโรคหรื อการพยากรณ์โรค (outcome assessment) ด้วยวิธีการที่
เหมือนกัน
5. มีการติดตามประชากรในการศึกษาอย่างครบถ้วนสมบูรณ์ (completeness of follow-up)

วิธีการประเมินความถูกต้องของงานวิจยั ที่คดั เลือกมาทํา systematic review อาจทําได้ใน 2


ลักษณะคือการใช้เครื่ องมือในการประเมินคุณภาพงานวิจยั ที่มีผอู ้ อกแบบไว้แล้วในรู ปแบบของ scale ต่าง ๆ
และการประเมินเป็ นรายข้อ ในการใช้เครื่ องมือประเมินที่มีผอู ้ อกแบบไว้แล้วนั้น จะมีการให้คะแนนงานวิจยั
ตามลักษณะด้านต่าง ๆ ที่ใช้ในการหลีกเลี่ยงอคติ เมื่อรวมคะแนนเหล่านั้นเข้าด้วยกันก็จะได้คะแนนคุณภาพรวม
ของงานวิจยั แต่ละเรื่ อง เครื่ องมือในการประเมินคุณภาพของงานวิจยั มีมากมายหลายแบบและไม่มีการศึกษา
เปรี ยบเทียบว่าแบบใดดีกว่าแบบใด ตัวอย่างเครื่ องมือที่นิยมใช้เช่น Jadad scale 3 และ Chalmers scale 4
ส่วนการประเมินเป็ นรายข้อเป็ นการประเมินตามหัวข้อวิธีการที่ใช้ในการหลีกเลี่ยงอคติตามที่แสดงในตารางที่ 4
จากการศึกษาวิธีการต่าง ๆ ในการประเมินคุณภาพงานวิจยั ยังไม่สามารถแสดงให้เห็นได้วา่ วิธีใดดีกว่ากัน ดังนั้น
ในปั จจุบนั จึงยังไม่มีขอ้ ยุติวา่ ควรใช้วธิ ีใดในการประเมินคุณภาพของงานวิจยั ที่จะนํามาทํา systematic
review
การประเมินคุณภาพงานวิจยั ที่นาํ มา review มีประโยชน์อีกประการหนึ่งในกรณี ท่ีพบว่าผลงานวิจยั
เหล่านั้นมีความแตกต่างกันมากหรื อมี heterogeneity (ดูรายละเอียดในเรื่ องการวิเคราะห์ขอ้ มูล) เหตุผลหนึ่ง
ซึ่งอาจอธิบายความแตกต่างดังกล่าวคือความแตกต่างของคุณภาพงานวิจยั เหล่านั้น
ในการประเมินคุณภาพงานวิจยั ก็ควรมีการประเมินความเชื่อถือได้ (reliability หรื อ
reproducibility) ของกระบวนการประเมินเช่นเดียวกับการคัดเลือกงานวิจยั โดยใช้วธิ ี การเดียวกัน คือให้มี
ผูท้ าํ หน้าที่ประเมินคุณภาพงานวิจยั อย่างน้อย 2 คนทําหน้าที่ประเมินงานวิจยั อย่างเป็ นอิสระต่อกัน แล้วนําผลที่
ได้มาคํานวณค่าสถิติ kappa

การบันทึกข้ อมูลจากงานวิจยั (data extraction)


จากงานวิจยั ที่คดั เลือกไว้สาํ หรับทํา systematic review จําเป็ นต้องมีการบันทึกข้อมูลจากงานวิจยั
เพื่อนําไปวิเคราะห์เป็ นผลของ systematic review ข้อมูลที่ควรบันทึกจากงานวิจยั ได้แก่
1. ข้อมูลทัว่ ไปของงานวิจยั นั้น เช่นชื่อเรื่ อง ชื่อผูว้ จิ ยั สถาบันและประเทศที่ทาํ งานวิจยั ชื่อวารสารที่ตีพมิ พ์
ปี ที่ตีพมิ พ์ เป็ นต้น
2. ข้อมูลเกี่ยวกับการประเมินคุณภาพของงานวิจยั

3
Jadad AR, Moore RA, Carroll D, Jenklinson C, Reynolds DJM, Gavaghan DJ, McQuay HJ. Assessing the quality of
reports of randomized clinical trials: Is blinding necessary?. Controlled Clinical Trials 1996; 17: 1 – 12.
4
Chalmers TC, Smith H Jr, Blackburn B, Silverman B, Schroeder B, Reitman D, Ambroz A. A method for assessing
the quality of a randomized control trial. Controlled Clinical Trials 1981; 2: 31 – 49.
3. ข้อมูลเกี่ยวกับประชากรที่ทาํ การศึกษาวิจยั เช่นสัดส่ วนของเพศ อายุเฉลี่ย เกณฑ์การวินิจฉัยโรค ระดับ
ความรุ นแรงของโรค ระยะเวลาที่เป็ นโรค ลักษณะทางประชากรอื่น ๆ ที่มีความสําคัญต่อการเกิดผลลัพธ์ท่ี
สนใจ จํานวนประชากรในกลุ่มศึกษาแต่ละกลุ่ม
4. ข้อมูลเกี่ยวกับมาตรการที่สนใจในการศึกษาวิจยั เช่นขนาดและวิธีการให้ยาที่ศึกษาวิจยั ระยะเวลาที่ให้ยา
มาตรการที่ใช้ในกลุ่มควบคุม เช่นยาหลอก
5. ข้อมูลเกี่ยวกับผลลัพธ์ท่ีสนใจในการศึกษาวิจยั เช่นวิธีการและเวลาในการประเมินผลลัพธ์ จํานวน
ประชากรที่เกิดผลลัพธ์ในกลุ่มศึกษาแต่ละกลุ่มซึ่งควรบันทึกข้อมูลเป็ นข้อมูลดิบ ตัวอย่างเช่นในกลุ่มศึกษา
150 คนมีจาํ นวนคนที่เกิดผลลัพธ์ 30 คนหรื อเท่ากับ 20 % ในกรณี น้ ีควรบันทึกข้อมูลการเกิดผลลัพธ์
30 คนจากประชากร 150 คน ไม่ควรบันทึกข้อมูลเป็ นการเกิดผลลัพธ์ 20 % อีกประการหนึ่ งในการ
บันทึกข้อมูลผลลัพธ์ที่สนใจใน systematic review ที่เกี่ยวกับมาตรการในการรักษาหรื อป้ องกันโรคนั้น
ควรบันทึกข้อมูลตามหลัก intention-to-treat principle คือบันทึกข้อมูลผลลัพธ์ของผูป้ ่ วยหรื อ
subject ตามกลุ่มมาตรการที่เขาได้รับการสุ่ มเลือกโดยไม่ตอ้ งคํานึ งว่าเขาจะได้รับมาตรการนั้นจริ ง ๆ
หรื อไม่ ตัวอย่างเช่นงานวิจยั เปรี ยบเทียบการรักษาโรคด้วยการผ่าตัดกับการไม่ผา่ ตัดโดยมีผลลัพธ์ท่ีสนใจ
คือการเสี ยชีวติ หากผูป้ ่ วยรายหนึ่งได้รับการสุ่มเลือกให้อยูใ่ นกลุ่มที่ได้รับการผ่าตัดแต่ปรากฏว่าผูป้ ่ วยราย
นั้นไม่ได้รับการผ่าตัดเนื่องจากเสี ยชีวติ ก่อนถึงกําหนดผ่าตัด ควรบันทึกข้อมูลให้ผปู ้ ่ วยรายนี้อยูใ่ นกลุ่ม
ผ่าตัดแม้วา่ ในรายงานวิจยั ผูว้ จิ ยั อาจตัดข้อมูลผูป้ ่ วยรายนี้ออกจากการวิเคราะห์ขอ้ มูล (ซึ่งเป็ นสิ่ งที่ไม่ควร
กระทํา)

ก่อนการเก็บข้อมูลควรออกแบบฟอร์มสําหรับเก็บข้อมูลให้ครบถ้วนสมบูรณ์และทําการทดสอบการเก็บ
ข้อมูลโดยใช้แบบฟอร์มดังกล่าวก่อนเพือ่ หาข้อบกพร่ องและทําการแก้ไขตามความเหมาะสม ในแบบฟอร์มการ
เก็บข้อมูลอาจมีส่วนหนึ่งสําหรับบันทึกข้อมูลที่ไม่ชดั เจนหรื อขาดหายไปเพือ่ จะได้ทาํ การติดต่อสอบถามจาก
ผูว้ จิ ยั โดยตรงอีกครั้งในภายหลัง
ในการบันทึกข้อมูลควรมีผบู ้ นั ทึกข้อมูลอย่างน้อย 2 คนทําการบันทึกข้อมูลอย่างเป็ นอิสระต่อกันแล้ว
นําผลที่ได้มาเปรี ยบเทียบกันเพือ่ หลีกเลี่ยงความผิดพลาดที่อาจเกิดขึ้นได้ในการบันทึกข้อมูล หากมีความแตกต่าง
ของข้อมูลที่ต่างคนบันทึกมาได้ก็ควรมีการตรวจสอบว่าข้อมูลที่ถกู ต้องเป็ นอย่างไร แต่ในกรณี การบันทึกข้อมูล
นี้ไม่มีความจําเป็ นต้องแสดงถึง reliability หรื อ reproducibility ของกระบวนการบันทึกข้อมูลเนื่องจาก
เป็ นกระบวนการที่ไม่ได้ใช้การตัดสิ นใจของผูบ้ นั ทึกข้อมูล ความแตกต่างของการบันทึกข้อมูลที่เกิดขึ้นมักเกิด
จากการมองข้ามหรื อการดูตวั เลขผิดไปมากกว่าที่จะเกิดจากการตัดสิ นใจที่ไม่เหมือนกัน

การติดต่ อกับผู้วจิ ยั โดยตรงเพื่อสอบถามข้ อมูลเพิ่มเติม


ในบางกรณี รายละเอียดในรายงานวิจยั ที่ได้รับการตีพมิ พ์อาจไม่มากพอหรื ออาจมีความคลุมเครื อไม่
ชัดเจน ทําให้ไม่สามารถตัดสิ นใจได้วา่ งานวิจยั ดังกล่าวมีคุณสมบัติครบตามเกณฑ์การคัดเลือกงานวิจยั หรื อไม่
หรื อไม่สามารถประเมินคุณภาพงานวิจยั ได้ หรื อข้อมูลที่สาํ คัญขาดหายไปหรื อไม่ชดั เจน กรณี น้ ีควรมีการ
ติดต่อกับผูว้ จิ ยั เรื่ องนั้นโดยตรง (corresponding author) เพือ่ สอบถามข้อมูลเพิ่มเติมหรื อเพือ่ ยืนยันความ
ถูกต้องของข้อมูล การติดต่ออาจทําได้โดยการพบปะส่วนตัว ทางโทรศัพท์ ทางจดหมาย หรื อไปรษณี ยอ์ ิเลค
โทรนิคส์ (e-mail) เป็ นต้น หากการติดต่อครั้งแรกไม่ประสบผลสําเร็ จคือยังไม่ได้ขอ้ มูลที่ตอ้ งการอาจ
จําเป็ นต้องมีการติดต่อซํ้า หากติดต่อซํ้าหลายครั้งแล้วยังไม่ประสบผลสําเร็ จก็จาํ เป็ นต้องตัดสิ นใจเองอย่างดีท่ีสุด
โดยอาศัยข้อมูลเท่าที่มีอยูใ่ นรายงานการวิจยั นั้น ๆ แล้วทําการทดสอบดูวา่ ผลการตัดสิ นใจที่แตกต่างกันจะมีผลต่อ
ผลของ systematic review หรื อไม่โดยการทํา sensitivity analysis (ดูรายละเอียดในเรื่ องการวิเคราะห์
ข้อมูล)
แผนการวิเคราะห์ ผลการทบทวนวรรณกรรม

( Plan of Analysis of Systematic Reviews)

โดยทัว่ ไปสําหรับแบบแผนการวิเคราะห์อาจมีดว้ ยกัน 4 แบบใหญ่ ๆ ดังนี้ (อ้างจาก Cochrane


Reviewer’s Handbook 4.2.4 March 2004)

1.การเปรียบเทียบผลการรักษา 2 แบบ ซึ่ งเป็ นแบบง่ายที่สุด และตรงไปตรงมา เช่น การศึกษาอัตราการ


รอดชีวติ ของผูป้ ่ วยมะเร็ งตับเมื่อรักษาด้วย transarterial chemotherapy เปรี ยบเทียบกับการรักษาแบบ
ประคับประคอง (supportive treatment) การวิเคราะห์แบบนี้คือ
- ศึกษาว่าผลการรักษาไปทางด้านใด (direction of effect ) เช่น อัตราการรอดชีวติ ของผูป้ ่ วย
มะเร็ งมากกว่าเมื่อรักษาด้วยวิธีใด transarterial chemotherapy หรื อ supportive treatment
- ศึกษาว่าขนาดของผลการรักษามีมากเพียงใด ( size of effect ) เช่น อัตราการรอดชีวติ ของผูป้ ่ วย
มะเร็ งเมื่อใช้ transarterial chemotherapy มีมากกว่า supportive care เป็ นปริ มาณเท่าไร 10%, 20%
หรื อ 50%
- ศึกษาว่าผลการรักษาแต่ละการศึกษาเป็ นไปในทิศทางเดียวกันหรื อไม่ หรื อตรงกันมากน้อยแค่ไหน
(heterogeneity)
2.การเปรียบเทียบผลการรักษาหลาย ๆ แบบ เช่น การศึกษาอัตราการรอดชีวติ ของผูป้ ่ วยมะเร็ งตับเมื่อ
รักษาด้วย transarterial chemotherapy เปรี ยบเทียบกับ transvenous chemotherapy หรื อ การรักษา
แบบประคับประคอง (supportive treatment) หรื อ การรักษาด้วยฮอร์โมน
แผนการวิเคราะห์แบบนี้เป็ นการศึกษาเพือ่ รวบรวมผลการรักษาไว้ท้ งั หมด แล้วพิจารณาการเปรี ยบเทียบ
ระหว่างกลุ่มในภายหลัง โดยทัว่ ไปการพิจารณาว่าจะเปรี ยบเทียบการรักษาแบบใด หรื อรวมกลุ่มแบบใด
เปรี ยบเทียบกับกลุ่มแบบใด จะใช้วจิ ารณญาณจากองค์ความรู ้โดยการพิจารณาของผูว้ จิ ยั และในแง่ของผูใ้ ช้
ผลการวิจยั หรื อ แพทย์ผรู ้ ักษา
3.การเปรียบเทียบผลการรักษาในแนวกว้ าง เช่น การใช้ส่ื อต่าง ๆ โดยรวม เช่นแผ่นพับ โทรทัศน์ วิทยุ
ในการเปลี่ยนแปลงพฤติกรรมเด็กที่เป็ นโรค
แผนการวิเคราะห์แบบนี้ตอ้ งระมัดระวังการรวมผลต่าง ๆ และแปลผลด้วย meta-analysis
โดยเฉพาะการนํา “ขนาด” ของผลรวมนั้นไปใช้อธิบายหรื อปรับใช้ในภาวะต่าง ๆ ทั้งนี้เพราะผลนี้ประกอบจาก
การใช้ส่ื อต่าง ๆ ที่กว้างมาก ๆ
4.การเปรียบเทียบขนาดของผลการรักษาและลักษณะของการศึกษาต่ าง ๆ เช่นขนาดของผลการรักษา
ผูป้ ่ วยมะเร็ งตับด้วย transarterial chemotherapy จะมากหรื อน้อยขึ้นกับชนิดของ chemotherapy
หรื อไม่
โดยทัว่ ไปแผนการวิเคราะห์แบบนี้จะเป็ นจุดประสงค์รอง มากกว่าจุดประสงค์หลักในการวิเคราะห์

ณ ที่น้ ีจะขอกล่าวเฉพาะแบบแผนการวิเคราะห์แบบที่ 1 ซึ่งเป็ นแบบที่ใช้มากที่สุด สําคัญที่สุด และยัง


ปรับใช้กบั แผนการวิเคราะห์แบบอื่น ๆ ได้ดว้ ย โดยมีขน้ ั ตอนดังต่อไปนี้
1.กําหนดชนิ ดของข้อมูลผลการศึกษา (Type of outcome data)
2.กําหนดวิธีการเปรี ยบเทียบผลการศึกษา (Effect measures)
3.กําหนดการรวมผลการศึกษา (Summarising effects across studies / Meta-analysis)
4.การศึกษาความไม่ตรงกันของผลจากแต่ละการศึกษา (Heterogeneity)
5.การศึกษาความไวของผลการทบทวนวรรณกรรมต่อการเปลี่ยนแปลงของปั จจัยต่าง ๆ (Sensitivity
Analysis)

• การกําหนดชนิดของข้ อมูลผลการศึกษา (Type of outcome data)


โดยทัว่ ไปข้อมูลผลการศึกษาอาจแบ่งเป็ น 5 ประเภทได้ดงั นี้
o Dichotomous หรื อ binary data เมื่อผลการรักษาเป็ นอย่างใด อย่างหนึ่ ง
ในสองอย่างเท่านั้น เช่น หายจากโรค หรื อไม่หายจากโรค
o Continuous data เมื่อผลการรักษาเป็ นตัวเลข เช่น ระดับนํ้าตาลในเลือด
หรื อ ระดับความดันโลหิ ต เป็ นต้น
o Ordinal data เมื่อผลการรักษาถูกแบ่งเป็ นกลุ่มที่จดั อันดับได้ หรื อช่วง ๆ
เช่น measurement scales เป็ นต้น
o Counts และ Rates โดยคํานวณจากการนับเหตุการณ์ท่ีเกิดขึ้นในแต่ละ
บุคคล โดยเฉพาะเกิดเหตุการณ์น้ นั ๆ หลายครั้งในแต่ละบุคคล
o Time- to- event data (หรื อ survival data) คือการคํานวณเวลาจน
เกิดเหตุการณ์ ทั้งนี้อาจไม่ท้ งั หมดของผูป้ ่ วยที่จะเกิดเหตุการณ์ (มี censored
data)

สําหรับกรณี ศึกษาข้างต้น ข้อมูลที่กาํ ลังศึกษาเป็ น survival data (คือระยะเวลา


ปลอดเหตุการณ์จากโรคมะเร็ งตับ-disease free survival หรื อ ระยะเวลาที่ยงั ไม่เสี ยชีวติ -
overall survival) อย่างไรก็ตาม Meta-analysis ที่เป็ นการรวมเหตุการณ์ที่เป็ น survival data
นั้นที่ดีท่ีสุดคือการวิเคราะห์จากการเก็บข้อมูลแบบ individual patient data หรื อไม่ใช้
individual patient data แต่มี assumption เรื่ อง constant hazard ratio ตลอด follow
up period แต่ ณ ที่นี้ซ่ ึ งเป็ น literature-based data และต้องการเทียบ fixed data ที่ 1 year
survival จึงเลือกเป็ น Dichotomous หรื อ binary data (เหตุการณ์ตาย หรื อไม่ตาย มีโรค
หรื อไม่มีโรค ณ จุดที่ตอ้ งการศึกษา)

• กําหนดวิธีการเปรียบเทียบผลการศึกษา
โดยทัว่ ไปกําหนดจากชนิดของข้อมูลเป็ นหลักได้แก่
o Dichotomous or binary data
 Risk ratio (RR) หรื อเรี ยก relative risk
 Odds ratio (OR)
 Risk diferrence (RD) หรื อเรี ยก absolute risk reduction
(ARR)
 Number needed to treat (NNT)
*ตารางจาก Cochrane reviewer’s handbook

โดยทัว่ ไปสามารถใช้ได้ท้ งั 4 แบบการเปรี ยบเทียบ อย่างไรก็ตามมีขอ้ ควรระวังสําหรับ Odds ratio ซึ่งจะทํา


ให้เกิดความแตกต่างกับค่า RR และถ้านําไปเทียบเคียงเป็ น RR อาจทําให้แปลผลผิดพลาดได้ โดยเฉพาะใน
กรณี ที่ initial risk สูงโดยเฉพาะมากกว่า 20%
o Continuous data
 Mean difference
 Standardised mean difference
o Ordinal data
 Proportional odds ratio (ไม่มีใน Cochrane review
manager)
 อาจใช้เหมือน Continuous data หรื อ Binary data
o Counts and rates
 Rate ratio

สําหรับกรณี ศึกษาของการทบทวนวรรณกรรมผูป้ ่ วยมะเร็ งตับข้างต้น ผูว้ จิ ยั ได้คาํ นึงถึง


ข้อจํากัดของ Odds ratio ในกรณี น้ ีและเลือก Risk ratio

• กําหนดการรวมผลการศึกษา (Summarising effects across studies /


Meta-analysis)

o ควรรวมผลการศึกษาเข้าด้วยกันหรื อไม่ (ควรทํา Meta-analysis หรื อไม่)


โดยทัว่ ไป Meta-analysis มีประโยชน์เนื่องจากสามารถเพิ่ม statistical power และทําให้ทราบ
ผลการศึกษาโดยที่มีจาํ นวนประชากรเพียงพอในการตอบคําถามนั้น ๆ นอกจากนี้ยงั ทําให้มีช่วงผลการศึกษาที่
แม่นยํา (precision) มากขึ้น สามารถตอบคําถามอื่น ๆ ที่อาจตอบไม่ได้จากการศึกษาเพียงการศึกษาเดียว หรื อ
อย่างน้อยอาจให้สมมติฐานใหม่ท่ีน่าสนใจ และยังสามารถสรุ ปคําตอบสุดท้าย หรื อขจัดปั ญหาที่การศึกษาปฐมภูมิ
ขัดแย้งกัน
อย่างไรก็ตาม Meta-analysis มีขอ้ จํากัด และไม่สามารถใช้ได้เสมอไป การนําผลมารวมทุกครั้ง
ไม่ได้คาํ นึงถึงการทดสอบการรวมกันได้ทางสถิติเท่านั้น แต่จะต้องคํานึงถึงองค์ความรู ้ทางการแพทย์เสมอ คง
เป็ นไปไม่ได้ และไม่มีประโยชน์อนั ใดเลยในการรวมการรักษาทุกอย่างทั้งการผ่าตัด รังสี รักษา และเคมีบาํ บัด เพื่อ
รักษามะเร็ งทุกชนิด และหาคําตอบว่าการรักษาได้ผลหรื อไม่ นอกจากนี้ถา้ คุณภาพของการศึกษาไม่เป็ นมาตรฐาน
หรื อได้รับการออกแบบมาไม่ดีนกั หรื อมี publication bias จะต้องใช้ความระมัดระวังเป็ นอย่างยิง่ ในการรวม
ผลการศึกษาเข้าด้วยกัน
จากกรณี ศึกษาข้างต้นผูว้ จิ ยั ได้วางคําถามที่เฉพาะตั้งแต่ตน้ เพือ่ การรวมผลการศึกษา และดังนั้นจึง
วางแผนรวมผลการศึกษาด้วยวิธี Meta-analysis อย่างไม่มีขอ้ สงสัยใด ๆ

o หลักการของ Meta-analysis
Meta-analysis อาศัยหลักการคํานวณเป็ น 2 ขั้นตอนคือ ขั้นตอนแรกคํานวณ treatment effect
ของแต่ละการศึกษาจากข้อมูลที่กาํ หนด และขั้นตอนที่สองคือการคํานวณผลรวมของ treatment effect
(pooled results) ทั้งนี้โดยการให้น้ าํ หนักของแต่ละการศึกษาไม่เท่ากัน

โดยทัว่ ไปมี model ทางสถิติอยูส่ องแบบใหญ่ ๆ ในการให้น้ าํ หนักแต่ละการศึกษานี้ คือ Random


effect model และ Fixed effect model ซึ่ งมีสมมติฐานต่างกัน สําหรับ Random effect model มี
สมมติฐานคือ การรวมผลการศึกษาเข้าด้วยกันนี้ มิได้หวังวัดผลการศึกษา (treatment effect) ที่เหมือนกันทุก
ประการ อย่างไรก็ตามเป็ นผลการศึกษาที่ยงั คงเป็ นไปตามการแจกแจง หรื อการกระจาย (distribution) ใน
รู ปแบบเดียวกัน หรื อผูว้ จิ ยั คาดการณ์วา่ จะมี heterogeneity ไม่วา่ จะเป็ น clinical heterogeneity หรื อ
statistical heterogeneity ในทางตรงกันข้าม Fixed effect model ถือว่าในแต่ละการศึกษาประเมินผล
การศึกษาเดียวกันทุกประการ โปรดดูตารางที่โปรแกรม review manager ของ Cochrane Library ใช้
model ทางสถิติในการคํานวณ
จากกรณี ศึกษาข้างต้นผูว้ จิ ยั ได้คาดการณ์วา่ มี heterogeneity จากการให้ intervention และ กลุ่ม
ประชากรที่มีความแตกต่างกัน จึงได้วางแผนใช้ Random effect model

• การลงข้ อมูล และการวิเคราะห์ใน review manager โดยสังเขป

สําหรับขั้นตอนนี้มีจุดประสงค์เพือ่ สาธิตให้เห็นวิธีการลงข้อมูลและการวิเคราะห์แบบง่าย ๆ โดยใช้


software ของ Cochrane Library ที่เรี ยกว่า Review Manager อนึ่ ง Review Manager เป็ น
software ที่ผวู ้ จิ ยั การทบทวนวรรณกรรมใช้ติดต่อกับ Cochrane Library และจึงใช้ลงรายละเอียดทั้งหมด
ทั้งแต่ระเบียบวิธีวจิ ยั , Protocol รวมถึงการวิเคราะห์ขอ้ มูล สําหรับขั้นตอนที่จะสาธิตต่อไปนี้เป็ นเฉพาะการลง
ข้อมูลและการวิเคราะห์เท่านั้น (Version 4.2.2)

ขั้นตอนแรกคือตั้งชื่อการทบทวนวรรณกรรมโดย click ขวาแล้วเลือก “add” ใส่ชื่อการทบทวน


วรรณกรรม และเวลาสําหรับ next stage (วันใดก็ได้ )
ต่อไปคือการใส่ช่ือการศึกษาโดยการคลิกลงมาที่ tree “reference” และเข้าไปสู่ included
studies และ click ขวาเพือ่ เติมชื่อการศึกษาและปี ที่ตีพมิ พ์
หลังจากนั้นเข้ามาที่ tables  comparisons and data และเพิ่มชื่อการเปรี ยบเทียบโดยการ
click ขวา ณ ที่น้ ี คือ “one year overall survival”

แล้ว click ขวาอีกครั้งที่ “one year overall survival” เพือ่ เลือกชนิดของข้อมูล ณ ที่น้ ีคือ
dichotomous data ( death/alive at one year) อนึ่ งข้อมูล ณ ตรงนี้ได้จากกระบวนการ
Data extraction จากข้อมูลจํานวนผูป้ ่ วยตายโดยตรง หรื อการใช้ plot จาก survival curve
หลังจากนั้นเป็ นการใส่รายละเอียดของ outcome ดังกล่าว ได้แก่ description ณ ที่น้ ีคือ “TACE
TAE TAC vs palliative care” , statistical โดย ณ ที่น้ ีเลือก Relative risk, 95%
confidence interval และ Random effect model สําหรับในส่ วนของ graph ใช้ค่าเดิมที่ต้ งั
ไว้โดยตัวโปรแกรม

หลังจากนั้น click ขวาที่ title นั้น “TACE TAE TAC vs palliative care” และเลือก
การศึกษาจาก “included studies” และลงข้อมูลแต่ละการศึกษาแล้ว save และ close ดังในรู ป
สําหรับขั้นตอนต่อไปคือการวิเคราะห์เริ่ มโดยการ click toolbar ที่ “Analysis”

จะได้หน้าต่างใหม่ให้double click ที่ “TACE TAE TAC vs palliative care”


และจะได้ Forest Plot ซึ่งเป็ นกราพที่แสดง treatment effect ของแต่ละการศึกษา และ
treatment effect ของการรวมผลการศึกษาเข้าด้วยกันเป็ นรู ปสี่ เหลี่ยมขนมเปี ยกปูนในบรรทัด
สุดท้ายดังรู ป

• Heterogeneity

o Heterogeneity คืออะไร
Heterogeneity คือ ความแตกต่างของการศึกษาที่นาํ มารวมกัน ทั้งนี้อาจเนื่ องจากหลายสาเหตุได้แก่
ประการแรก อาจมาจาก ประชากร การรักษา และการวัดผลการรักษา ซึ่งเรี ยกว่า clinical diversity หรื อ
clinical heterogeneity ประการที่สอง อาจมาจากระเบียบวิธีวจิ ยั ของแต่ละการศึกษา ซึ่งเรี ยกว่า
methodological diversity หรื อ methodological heterogeneity ส่ วนคําว่า statistical
heterogeneity นั้นเป็ นผลจากการทดสอบด้วยสถิติ ซึ่ งจะเป็ นผลมาจากของทั้งสองปั จจัยข้างต้น อย่างไรก็ตาม
เป็ นที่ทราบกันดีวา่ การทดสอบนี้มี power ตํ่า และจึงใช้ค่า p value ที่ 0.1 แทนที่จะใช้ท่ี 0.05 เหมือนค่า p
โดยทัว่ ไป และดังนั้นจึงไม่สามารถอิง heterogeneity แต่เพียงค่าสถิติเท่านั้น องค์ความรู ้ในการประกอบการ
พิจารณาและการใช้วจิ ารณญาณ ทั้ง clinical heterogeneity และ methodological heterogeneity จึง
เป็ นส่วนสําคัญอย่างยิง่ ที่จะขาดไม่ได้
o ทําอย่างไรเมื่อพบ Statistical heterogeneity
ดังที่กล่าวข้างต้นก่อนการทํา Meta-analysis จะต้องคาดการณ์หรื อใช้วจิ ารณญาณว่าน่าจะมี
heterogeneity หรื อไม่ ถ้ามีน่าจะเกิดจากสาเหตุใด และตั้งสมมติฐานนั้น ๆ ไว้ เพือ่ เป็ นการเตรี ยมการไว้
ล่วงหน้า (Priori hypothesis) ซึ่งจะลดความลําเอียงจากการเห็นข้อมูลแล้วทําการวิเคราะห์หาสาเหตุ (Post
hoc analysis) เมื่อพบ Statistical heterogeneity อาจพิจารณาดังนี้ คือ
• ตรวจสอบการลงข้อมูลอีกครั้ง ว่าลงถูกต้องหรื อไม่
• ตรวจสอบและพิจารณาอีกครั้งถึง clinical heterogeneity และ
methodological heterogeneity ว่ายังสมควรใช้ meta-analysis
หรื อไม่
• ค้นหาสาเหตุของ heterogeneity โดยการทํา subgroup analysis
หรื อสถิติข้ นั สูงคือ meta-regression
• Ignore heterogeneity โดยการใช้ Fixed effect model ซึ่ ง
โดยทัว่ ไปไม่แนะนําให้กระทํา
• ใช้ Random effect model เพือ่ คํานึงถึงการคาดการณ์วา่ จะมี
heterogeneity อย่างไรก็ตามไม่แนะนําให้ใช้เพียงอย่างเดียว และเป็ น
การทดแทนโดยมิได้หาสาเหตุของ heterogeneity ยกเว้นไม่สามารถ
หาสาเหตุต่าง ๆ ได้
• เปลี่ยน effect measures โดยเฉพาะอาจเป็ นสาเหตุของการรวม
continous outcome โดยใช้มาตรวัดคนละแบบ
• ตัดบางการศึกษาออกไป อย่างไรก็ตามจะต้องระมัดระวังอย่างยิง่ และ
อธิบายให้ได้วา่ การศึกษาที่ตดั ออกไปนั้นเพราะอะไร ต่างจากการศึกษา
อื่นอย่างไร และจะทําให้เกิดความลําเอียงในการตัดการศึกษานั้นออก
หรื อไม่

สําหรับกรณี ศึกษาผูป้ ่ วยมะเร็ งตับนั้น ดังในรู ปข้างต้น test for heterogeneity , p =


0.05 หรื อมีนยั สําคัญทางคลินิก (ใช้เกณฑ์ < 0.1 ) และดังนั้นจึงแปลผลว่ามี statistical heterogeneity
และดังนั้นผูว้ จิ ยั ได้ทาํ การ explore heterogeneity ดังตัวอย่างข้างล่างนี้

Subgroup Analysis of Transarterial Chemoembolization, Embolization, Chemotherapy Versus


Symptomatic treatment: One-Year Overall Survival (Random Effect Model) by inclusion of poor prognostic
patients
Subgroup Analysis of Transarterial Chemoembolization, Embolization, Chemotherapy Versus
Symptomatic treatment: One-Year Overall Survival (Random Effect Model) by type of intervention

Subgroup Analysis of Transarterial Chemoembolization, Embolization, Chemotherapy Versus


Symptomatic treatment: One-Year Overall Survival (Random Effect Model) by Type of Chemotherapy
Subgroup Analysis of Transarterial Chemoembolization, Embolization, Chemotherapy Versus
Symptomatic treatment: One-Year Overall Survival (Random Effect Model) by Application of Co-
intervention

ผูว้ จิ ยั พบว่า test of heterogeneity ไม่มีนยั สําคัญในกลุ่มย่อยดังกล่าว โดยเฉพาะ poor prognostic


factors และ type of intervention และจึงตั้งเป็ นสมมติฐานว่าสองปั จจัยดังกล่าวอธิ บายเรื่ อง
heterogeneity ในการทบทวนวรรณกรรมครั้งนี้

o การวิเคราะห์ ความไวของผลการทบทวนวรรณกรรม (Sensitivity Analysis)


เนื่องจากอาจมีระเบียบวิธีวจิ ยั หลายแบบในการทํา meta-analysis ผูว้ จิ ยั จึงควรถามคําถามเสมอว่า
ผลการทบทวนวรรณกรรมนี้จะเปลี่ยนแปลงไปหรื อไม่ เมื่อวิธิวจิ ยั เปลี่ยนไป และผลการทบทวนวรรณกรรมนี้จะ
ยังคงสภาพ (robust) หรื อไม่ไวต่อการเปลี่ยนแปลงวิธีวจิ ยั หรื อไม่ ถ้าผลนี้ยงั คงสภาพอยู่ ก็จะยิง่ ทําให้แน่ใจว่า
ผลการศึกษานี้ไม่ข้ ึนกับปั จจัยนั้น ๆ โดยทัว่ ไปอาจเปลี่ยนปั จจัยต่าง ๆ ได้แก่
• เปลี่ยนเกณฑ์นาํ เข้าในการคัดเลือกการศึกษา
• นําเข้าหรื อคัดออกบางการศึกษา โดยเฉพาะการศึกษาที่คลุมเครื อตาม
เกณฑ์ท่ ีผวู ้ จิ ยั กําหนด
• วิเคราะห์ผลการศึกษาด้วยข้อมูลที่มากหรื อน้อยกว่าที่เป็ นอยู่ โดยเฉพาะ
ข้อมูลที่อาจคลาดเคลื่อนหรื อไม่ได้กล่าวไว้อย่างแน่ชดั ในการศึกษานั้น ๆ
ทั้งนี้โดยเฉพาะกรณี ท่ีไม่สามารถติดต่อผูแ้ ต่ง เพือ่ ยืนยันข้อมูลนั้น ๆ ได้
• วิเคราะห์ผลการศึกษาด้วยวิธีทางสถิติท่ีเปลี่ยนไปได้แก่ Fixed effect
model และ Random effect model

สําหรับกรณี ศึกษาข้างต้นได้ทาํ sensitivity analysis โดยคํานึงถึงปั จจัยต่าง ๆ ได้แก่ประชากรที่มี


poor prognostic factors, type of intervention- embolization or chemotherapy or both,
type of chemotherapy, methodological issues, best case and worst case scenario of
some studies ดังตัวอย่างข้างล่างนี้
Sensitivity Analysis of Transarterial Chemoembolization, Embolization, Chemotherapy Versus
Symptomatic treatment: Removing the Trial with Ambigous Allocation Concealment, One-year Overall
Survival (Random Effect Model)

Sensitivity Analysis of Transarterial Chemoembolization, Embolization, Chemotherapy Versus


Symptomatic treatment: Best Case Scenario of Madden, 1993 (61)

Sensitivity Analysis of Transarterial Chemoembolization, Embolization, Chemotherapy Versus


Symptomatic treatment: Worst Case Scenario of Madden, 1993 (61)
Sensitivity Analysis of Transarterial Chemoembolization, Embolization, Chemotherapy Versus
Symptomatic treatment: Madden, 1993 (61) All patient in both treatment and controlled group were death

ตามรู ปเมื่อคัดบางการศึกษาที่ allocation concealment ไม่ชดั เจนออกไป พบว่าผลการรักษาไม่มี


นัยสําคัญทางสถิติ สําหรับการทํา sensitivity analysis สําหรับการศึกษา Madden, 1993 ที่
ข้อมูลการศึกษาไม่ชดั เจนนั้นผูว้ จิ ยั ได้กล่าวไว้ดงั นี้ และพบว่าผลการศึกษาอาจเปลี่ยนเป็ นไม่มีนยั สําคัญ
เมื่อใช้ worst case scenario
“While we are waiting for the complete one-year over all survival data of Madden (61), the sensitivity analyses
assuming three scenarios were also carried out. The scenarios are as follows:
1. Best case scenario; All of the surviving patients at 150 days in the TAC group were still alive, but all of the surviving
patients at 150 days in controlled group were dead at one year
2. Worst case scenario; All of the surviving patients at 150 days in the TAC group were dead, but all of the surviving
patients at 150 days in controlled group were alive at one year
3. The study did not contribute any weight for the pooled estimate i.e. all patients in TAC and controlled group were
dead at one year. “
The significant difference in one-year overall survival in favor of patients who received the transarterial interventions
was not changed in the best case and unweighted scenario but disappeared in the worst case scenario.

เอกสารอ้ างอิง
Alderson P, Green S, Higgins JPT, editors. Cochrane Reviewers’ Handbook 4.2.2
[updated March 2004]. In: The Cochrane Library, Issue 1, 2004. Chichester, UK:
John Wiley & Sons, Ltd.
การนําเสนอผลการทบทวนวรรณกรรม
(Presenting Results of Systematic Reviews)
การนําเสนอผลการทบทวนวรรณกรรมถือเป็ นส่วนสําคัญอย่างยิง่ อีกส่วนหนึ่ง ได้มีความเห็นร่ วมจาก
ผูเ้ ชี่ยวชาญ (QUOROM) ในการทบทวนการรายงานของการศึกษาแบบนี้ และได้ให้คาํ แนะนําเพือ่ การรายงาน
การศึกษาเป็ น checklist ตามตารางที่ 5 และ trial flow ข้างล่างนี้

ตารางที่ 5 Checklist ในการทบทวนวรรณกรรม


เอกสารอ้ างอิง
Moher D. Cook DJ, Eastwood S et al. Improving the quality of reports
of meta-analyses of randomized controlled trials: the QUOROM
statement. Lancet 1999;354:1896-900.
การแปลผลการทบทวนวรรณกรรม
( Interpreting Results )

คําแนะนําสําหรับการแปลผลการทบทวนวรรณกรรมอย่างมีระบบ โดยคํานึงถึงคําถาม
ดังต่อไปนี้ (Cochrane Reviewer’s handbook)
1.ทิศทางการผลการศึกษาไปทางใด (What is the direction of effect ?)
ตัวอย่างที่ให้ต้ งั แต่ตน้ เอกสารได้แก่ ผลการเปรี ยบเทียบอัตราการรอดชีวติ (survival ) ระหว่างการใช้
transarterial chemotherapy กับ supportive care ในผูป้ ่ วย hepatocellular carcinoma คําถาม
คือการรักษาแบบไหนมีอตั ราการรอดชีวติ มากกว่ากัน

การแปลผล (RR=0.85; 95% CI = 0.74 to 0.99; p=0.04) คือ:


ทิศทางของผลการศึกษาพบประโยชน์ของอัตราการรอดชีวติ ของผูป้ ่ วยมะเร็ งตับ จาก transarterial
chemotherapy อย่างไรก็ตามผลการศึกษาดังกล่าวมีนยั สําคัญทางสถิติแบบ marginal และมีค่าทางสถิติที่
แสดงถึงผลการศึกษาแต่ละการศึกษาอาจไม่สามารถรวมกันได้ (heterogeneity)
2. ขนาดของผลการศึกษาเป็ นอย่ างไร (What is the size of the effect ?)
จากตัวอย่างเดิม เมื่อการรักษาแบบหนึ่งมีอตั ราการรอดชีวติ มากกว่า คําถามคือมากกว่ากันเท่าไร 10% ,
20% หรื อ 50%
การแปลผล ขนาดของผลการศึกษาพบว่าผูป้ ่ วยมะเร็ งตับที่ได้รับ transarterial chemotherapy มี
อัตราการตายเป็ น 0.85 เท่าของผูป้ ่ วยที่ได้รับ supportive treatment อย่างไรก็ตามอาจไม่มีนยั สําคัญทาง
คลินิก (clinical importance) เนื่องจาก ค่าบนของความเชื่อมัน่ อยูท่ ่ี 0.99
3. ผลการศึกษาในแต่ ละการศึกษาตรงกัน หรือไปทิศทางเดียวกันหรือไม่ (Is the effect
consistent across the studies ? )
จากตัวอย่างเดิม เมื่อการรักษานั้น ๆ มีอตั ราการรอดชีวติ มากกว่า คําถามคือทุกการศึกษาปฐมภูมิให้ผล
การศึกษาที่ตรงกันหรื อไปทิศทางเดียวกันหรื อไม่
การแปลผล เนื่องจาก test for heterogeneity, p =0.05 ซึ่งเกณฑ์ของการทดสอบทางสถิติน้ ีถือ
ค่านัยสําคัญที่ <0.1 ดังนั้นผลการศึกษานี้โดยรวมมีความไม่เข้ากัน (heterogeneity) หรื อแต่ละการศึกษาอาจ
ให้ผลที่ไม่ตรงกัน
4. ความน่ าเชื่อถือของหลักฐานการแพทย์ อยู่ในระดับใด (What is strength of the
evidence of the effect ? )
จากตัวอย่างเดิม เมื่อผลสรุ ปออกมาข้างต้น คําถามคือหลักฐานดังกล่าวน่าเชื่อถือมากเพียงใด ทั้งนี้เมื่อ
มองภาพรวมจาก 3 ข้อข้างต้นประกอบกับรู ปแบบของการศึกษา (study design) คุณภาพของการศึกษา
(quality of the studies)
การแปลผล: การทบทวนวรรณกรรมนี้มีความน่าเชื่อถือสูง เนื่องจากรู ปแบบของการทบทวน
วรรณกรรมนี้เป็ นการรวบรวมการศึกษาแบบสุ่ม (Randomized Controlled trials) และไม่พบว่ามี
publication bias จากการทดสอบมาตรฐาน อย่างไรก็ตามอาจมีขอ้ จํากัดดังต่อไปนี้
o การทบทวนวรรณกรรมนี้พบ heterogeneity ซึ่ งหมายความว่าการรายงานผลการศึกษาใน
ภาพรวมอาจไม่เป็ นตัวแทนที่ดีนกั
o หลังจากการปิ ดการเก็บข้อมูลเพื่อทบทวนวรรณกรรม (ประมาณ 1 ปี ) ได้มีผลการศึกษาใหม่
ๆ ตีพมิ พ์ใหม่อีก รวมทั้งมีการทบทวนวรรณกรรมซํ้าตีพมิ พ์ใหม่อีกหลายการศึกษา น่าจะมี
ความจําเป็ นที่ตอ้ ง update ข้อมูลใหม่
o เนื่ องจาก effect measures เป็ น survival data และดังนั้นข้อมูลที่น่าเชื่อถือที่สุดในการ
วัด survival outcome คือ Individual patient data Meta-analysis อย่างไรก็
ตามการทบทวนวรรณกรรมนี้เป็ นเพียง Literature-based Meta-analysis และมี
ข้อจํากัดที่สามารถรวมผลการศึกษาเป็ นช่วงเวลาบางจุดเท่านั้น เช่น 1 ปี และดังนั้นในช่วง
ระยะเวลา 6 เดือน หรื อ 1 เดือนอาจมีผลที่แตกต่างออกไปได้
5.การนํามาปรับใช้ ในทางคลินกิ
การนํา transarterial chemotherapy มาใช้กบั คนไข้มะเร็ งตับจริ ง โดยหลักการข้อแรก
คือนอกจากพิจารณาจากข้อมูลจากผลการศึกษาว่าเชื่อถือได้หรื อไม่แล้ว (validity) ต้องคํานึงถึงข้อมูลที่ให้น้ นั
”ครบ”แก่การตัดสิ นใจทั้งข้อดีขอ้ เสี ยหรื อไม่ นัน
่ คือต้องคํานึงถึงประโยชน์ทางคลินิกที่จะได้รับเมื่อเทียบกับ
ความเสี่ ยงของผลข้างเคียง ทั้งนี้ในฐานะแพทย์ผรู ้ ักษาโรคมะเร็ งจะคาดหวังประโยชน์ทางคลินิกคือ มีชีวติ ยืนยาว
ขึ้น โอกาสโรคลุกลามช้าลง (Prolongation of overall survival, disease free survival or
progression free survival ) และด้วยการอยูอ่ ย่างมีคุณภาพของชีวติ (more quality of life score)
และโดยมีผลข้างเคียงของการรักษาที่นอ้ ยที่สุด (tolerable toxicity of chemotherapy)
หลักการข้อที่สองคือการปรับใช้ได้จริ งหรื อไม่ โดยดูจากประชากรในการศึกษา และการรักษา
ที่ให้วา่ เหมือนกับสภาพการณ์ของโรงพยาบาลที่อยู่ หรื อประเทศไทยหรื อไม่ หรื อไม่จาํ กัดอยูใ่ นกลุ่มที่
ทําการศึกษาเท่านั้นแต่คาํ นึงต่อไปว่าน่าจะปรับใช้ในกรณี ใดบ้าง หรื อกรณีใดที่ใกล้เคียง หรื อคาดการณ์วา่
ประชากรกลุ่มใดอาจได้ประโยชน์มากที่สุด ทั้งนี้ตอ้ งคํานึงถึงปั จจัยต่าง ๆ ได้แก่ patient, intervention and
disease variation รวมถึง biologic and cultural variation, variation in compliance,
variation in baseline risk
และเมื่อพิจารณาดังกล่าวแล้ว สรุ ปเป็ น implication ที่แนะนําใน Cochrane
reviewer’s handbook 4.2.2 ได้แก่
สําหรับกรณี ศึกษาการทบทวนวรรณกรรมในผูป้ ่ วยมะเร็ งนี้ และด้วยข้อมูลที่ให้ ณ ที่น้ ีได้
รายงานข้อมูลที่สาํ คัญที่สุดคือ overall survival ณ เวลาที่ 1 ปี และมีนยั สําคัญทางสถิติแบบ marginal ทั้งนี้
มีขอ้ คํานึงคืออาจไม่มีความสําคัญทางคลินิก ผลการรักษาอาจมีความไม่เข้ากันระหว่างการศึกษาและผลรวมอาจ
ไม่สามารถเป็ นตัวแทนการศึกษาทั้งหมดได้ และผลการศึกษาโดยรวมนี้ไวต่อการศึกษาหนึ่งที่ได้ขอ้ มูลไม่
ครบถ้วน ประโยชน์ทางคลินิกอื่น ๆ อาจมีความยากลําบากในการรวมเนื่องจากรายงานหรื อวัดคนละวิธี หรื อไม่
สามารถรวมได้เนื่องจากไม่ได้รายงาน แต่มีความสําคัญได้แก่ disease free หรื อ progression free
survival, quality of life score และผลข้างเคียงของยาเคมีบาํ บัด ซึ่ งข้อมูลอาจไม่ครบถ้วนทั้งในแง่ขอ้ ดี
และผลข้างเคียงเพื่อช่วยในการตัดสิ นใจ
สําหรับการปรับใช้ในการทบทวนวรรณกรรมนี้ เมื่อดูท่ีประชากรในการศึกษาพบว่า อายุ
ไม่ได้แตกต่างอย่างสําคัญกับผูป้ ่ วยในประเทศไทย รวมทั้งการรักษาด้วย transarterial chemotherapy ก็ใช้
วิธีท่ ีคล้ายกัน เพียงแต่อาจต่างกันในแง่ยาเคมีบาํ บัดในบางการศึกษา อย่างไรก็ตามอาจต้องค้นรายละเอียดลงลึกใน
แต่ละการศึกษาโดยเฉพาะ inclusion criteria เพือ่ ทําให้การปรับใช้ตรงนี้กระจ่างขึ้น อนึ่งพบหลักฐานจาก
subgroup analysis และอาจเป็ นสมมติฐานสําหรับการศึกษาต่อไปว่า TACE อาจเหมาะสมและได้
ประโยชน์มากกว่า TAE หรื อ TAC
ดังนั้นจากการศึกษานี้ (ในความเป็ นจริ งแนะนําให้อาศัยข้อมูลจาก systematic review
และ meta-analysis อื่น ๆประกอบด้วย ) สรุ ปได้วา่ อาจมีหลักฐานไม่เพียงพอในการแนะนําการรักษานี้แก่
เนื่องจากผลการรวมการศึกษายังไม่แน่นอนด้วยทั้งเหตุผลที่เป็ น marginal significance และมี
heterogeneity และผลการศึกษายังมีความไวต่อข้อมูลที่ยงั ไม่ครบถ้วน อีกทั้งยังไม่มีขอ้ มูลด้านผลข้างเคียงที
ช่วยในการตัดสิ นใจชัง่ นํ้าหนัก
สําหรับการแปลผลในส่วนนี้ อาจต้องอาศัยผูเ้ ชี่ยวชาญเป็ นผูพ้ จิ ารณาด้วย อย่างไรก็ตามผูเ้ ขียน
มีจุดประสงค์สาํ หรับนักศึกษาแพทย์ คืออย่างน้อยให้เข้าใจแนวคิด และขอบเขตการวิจารณ์ ว่ามีหลักการอย่างไร
จะวิจารณ์อะไร เมื่อได้เรี ยนเป็ นแพทย์เฉพาะทาง หรื อแพทย์เวชศาสตร์ครอบครัว และกลับมาฟื้ นการอ่านการ
ทบทวนวรรณกรรมอย่างมีระบบ จะได้มีความเข้าใจ อ่านบทความประเภทนี้ และสามารถคิดวิเคราะห์ดว้ ยตนเอง

You might also like