You are on page 1of 5

Kaplan-Meier Curve

เวลาอ่านเปเปอร์ตา่ งๆน้องๆจะเจอคานี้บอ่ ยมาก Kaplan-Meier


พร้อมกับกราฟหน้าตาเป็ นเส้นไต่ขน ึ้ หรือเส้นไต่ลงเทียบกันสองเส้นสามเส้นหรือสีเ่ ส้น
บ่อยครัง้ จะมีตวั หนังสือเขียนว่า HR มีตวั เลข ค่า 95% CI และ p-value ทัง้ หมดทีว่ า่ มานัน
้ คืออะไร?
เราจะอ่านกราฟแบบนี้ยงั ไง? อย่างเช่นกราฟทีพ ่ เี่ อามาให้ดูเป็ นตัวอย่างจาก DANISH ทีล่ งใน NEJM
ฉบับของสัปดาห์นี้และนาเสนอใน ESC 2016

Survival Analysis คืออะไร?

คือการวิเคราะห์ อัตราการรอดชีวต ิ ของประชากรสองกลุม ่ อย่างใน clinical trial จะมีการให้ intervention


สองกลุม ่ ทีไ่ ม่เหมือนกัน และประเมิน outcome ถ้า outcome ทีอ่ ยากรูเ้ ป็ นอัตราการรอดจาก event
ทีเ่ ราสนใจตามเวลาทีผ ่ า่ นไป event ทีว่ า่ อาจจะเป็ น การตาย การเกิด MI การกลับมานอนรพ.ด้วย HF
หรืออะไรก็ได้ทเี่ ราสนใจ การวิเคราะห์ขอ ้ มูลแบบนี้เราเรียกว่า survival analysis ครับ
เมือ่ ประชากรถูกคัดเลือกเข้าการศึกษา เราตามไป เมือ่ เกิด event ทีเ่ ราสนใจ คือจบ
ถือว่าผูป ้ ่ วยคนนัน
้ ออกจากการวิเคราะห์ไป เราจึงเรียกการวิเคราะห์แบบนี้วา่ time-to-event analysis ใน
analysis แบบดัง้ เดิมสืง่ แรกทีเ่ ราสนใจคืออัตราการรอดจาก event
เมือ่ เวลาผ่านไปเรือ ่ ยๆของทัง้ สองกลุม่ ว่าเป็ นอย่างไร มี cumulative survival เท่าไหร่
และแตกต่างกันหรือไม่ แค่นน ้ั

Kaplan-Meier คืออะไร?

ใน Survival Analysis ทีก


่ ล่าวไปข้างต้น เนื่องจากประชาการทีเ่ ริม
่ เข้าการศึกษานัน
้ เข้ามาไม่พร้อมกัน
ออกไปก็ไม่พร้อมกัน บางคนเกิด event บางคนหายไป
การวิเคราะห์ขอ ้ มูลทีไ่ ม่ครบแบบนี้ทาได้ลาบากมาก Kaplan และ Meier
เสนอวิธวี เิ คราะห์และประมาณอัตราการรอดชีวต ิ ของข้อมูลทีไ่ ม่ครบถ้วนแบบนี้ในปี 1958
ด้วยหลักการของ conditional probability คือ ความน่ าจะเป็ นในการรอดในแต่ละช่วงเวลา
อิงจากเวลาก่อนหน้า และ พลอตออกมาเป็ นกราฟ แกนตัง้ คือ probability of survival (0 → 1.0)
แกนนอนคือเวลาทีต ่ ามคนไข้ไป (0 → ) กราฟทีไ่ ด้เรียก Kaplan Meier Curve

ถ้าอย่างนัน
้ เส้นกราฟก็ตอ้ งเริม
่ จาก 1.0 แล้วไต่ลงมาเรือ
่ ยๆ?

ถูกครับ survival curve หรือ KM curve จะเริม ่ จาก 1.0 และลดลงมาเรือ ่ ยๆ แต่ถา้ คิดย้อนกลับคือเอา prob
ของแต่ละช่วงหักออกจาก 1.0 ก็คอ ื probability of event (not survival) ถ้านาค่านี้มาพลอตใหม่
หน้าตาจะออกมาเป็ นกราฟไต่ขน ึ้ ทีเ่ ราเห็นบ่อยๆในเปเปอร์ แต่หลักคิดยังคงเป็ น KM และกราฟก็ยงั เรียก
KM curve เช่นกัน แต่แกนตัง้ จะเปลีย ่ นจาก prob of survival เป็ น cumulative incidence หรือ prob of event
เพือ
่ ให้เห็นภาพชัดเจนขึน ้ สาหรับ clinician และค่า cumulative สุดท้ายทีไ่ ด้เรียกว่า Kaplan Meier risk estimate

การจะเปรียบเทียบ Survival Curve สองเส้นว่าต่างกัน ทาได้อย่างไร?


ดูดว้ ยตาไม่ได้ครับ ต้องใช้วธิ ีทางสถิตใิ นการบอกว่าม้นต่างกันหรือไม่ วิธีทางสถิตท ิ น
ี่ ิยมใช้เรียกว่า log-
rank test หลักการของ log-rank statistic เป็ นการสมมุตเิ อาว่าสองกลุม่ นี้เป็ นเสมือนกลุม
่ เดียวกัน และตัง้ Null
Hypothesis เอาไว้แบบนัน ้ คิดค่า expected event rate ของแต่ละกลุม
่ ออกมาเพือ ่ หาความแตกต่างจาก event
้ จริง สะสมไปเรือ
rate ทีเ่ กิดขึน ่ ยๆจน ถึง จุดสิน้ สุดการศึกษาหรือปลายทางของ KM curve (เน้นนะครับ ณ
ปลายทางของ KM curve) หาค่า p-value ของ chi-square ถ้า reject null hypothesis ได้ (p < 0.05) แปลว่า
สองเส้นนี้จริงๆแล้วมันต่างกัน บอกว่าโดยรวมแล้วมันต่างกันแค่นน ้ั
ไม่ได้บอกว่าแต่ละช่วงเวลาเป็ นอย่างไร

log-rank test ใช้บอกว่ามันต่างกันหรือไม่แค่นน


้ั แต่ไม่ได้บอกว่าต่างกันเท่าไหร่?

ถูกต้องครับ log-rank test บอกได้แค่วา่ survival curve สองเส้นนี้ไม่สามารถมาจากกลุม ่ เดียวกันได้


มันมีความแตกต่างทีม ่ ากกว่าจะเกิด by chance alone เนื่องจากการเกิด event คือเกิดกับไม่เกิด เป็ น binary
response การเปรียบเทียบระดับของความแตกต่าง ไม่สามารถทาได้ดว ้ ย log-rank statistic

ถ้าเราจะบอกระดับของความแตกต่างระหว่าง survivial curve สองเส้นต้องทายังไง?

นิยมใช้ Hazard Ratio ครับ

มันก็คอ
ื ตัวเลข Hazard Ratio หรือ HR ทีน
่ ิยมพิมพ์ไว้ขา้ งๆ KM curve ทีเ่ ราเห็นในเปเปอร์?

ใช่ครับ

Hazard Ratio ก็คอ


ื KM risk estimate ตอนท้ายนั่นเอง?
ไม่ใช่ครับ ไม่เกีย่ วเลย KM risk estimate คือ risk ทีส่ น
ิ้ สุดการศึกษา ว่าเมือ่ ตามไปถึงเวลานี้
แต่ละกลุม ่ มีโอกาสเกิด event กี่ % เอามาหักลบกันคือ absolute risk reduction แต่ HR คือ Hazard ratio
เป็ นค่าทีค่ านวณแยกออกมาต่างหาก มันคือ odd หรือโอกาสทีผ ่ ูป
้ ่ วยจะเกิด event
เมือ่ เทียบกับกลุม ่ ควบคุมในทุกช่วงเวลา ทีอ่ นุมานไว้วา่ ต้องเท่ากันตลอดทุกช่วง เนื่องจาก Hazard ratio
ในงานวิจยั ทางคลีนิกเกือบทัง้ หมดจะใช้โมเดลแบบง่ายๆในการคานวณ ก็คอ ื Proportional Hazard Model ที่
assumption ของมันเป็ นแบบนี้ หรือ Cox Proportional Hazard Model ทีเ่ ราคุน ้ หูน่ น
ั เอง

Hazard Ratio แตกต่างจาก Event Rate Reduction ยังไง?

เปรียบเทียบให้เห็นภาพมากขึน ้ เวลาปล่อยม้าแข่งออกจากซอง โอกาสทีม ่ า้ เบอร์นี้จะชนะ คือ Hazard ratio


ซึง่ โอกาสทีว่ า่ นี้ตอ
้ งเท่ากันตลอดตัง้ แต่ปล่อยตัวออกไปจนถึงเส้นชัย (ถ้าเราใช้ Cox Proportional model)
แต่จะแตะเส้นชัยห่างจากทีส่ องกีเ่ มตร ขึน ้ กับ สภาพสนาม อากาศ อุณหภูมิ ความชื้น ในวันแข่งด้วย
ระยะทีต ่ า่ งกันตอนแตะเส้นชัยคือ Event Rate Reduction นั่นเอง ยกตัวอย่างการศึกษา ARISTOTLE ทีใ่ ช้
Kaplan-Meier method และคานวณ Hazard ratio ด้วย Cox Proportional Hazard model ได้คา ่ mean HR ของ
primary composite endpoint ระหว่าง apixaban กับ warfarin ออกมาที่ 0.79 (0.66 - 0.95), p < 0.001 นั่นแปลว่า
ในทุกช่วงเวลา จะเป็ นช่วงเวลาไหนก็แล้วแต่ กลุม ่ ทีไ่ ด้ apixaban จะมีโอกาสเกิด stroke
้ ในช่วงเวลาต่อไปเท่ากับ 0.79 เท่าของ warfarin เสมอ แต่ไม่ได้บอก magnitude
ขึน
ของเวลาทีต ่ า่ งกันนะครับ ตรงนี้เป็ นประเด็นทีน ่ ้องๆเข้าใจผิดบ่อยมาก Hazard rate ไม่ใช่ velocity ดังนัน

โอกาสเป็ น 0.79 เท่า ไม่ได้แปลว่าเวลาในการเกิด event จะช้ากว่า warfarin 100/79 = 1.26 เท่า
เพราะเวลาทีต ่ า่ งกันหรือ event rate ทีต ้ กับอีกหลายปัจจัย เช่น ธรรมชาติของโรคและ outcome
่ า่ งกัน ขึน
ทีป่ ระเมินในบริบทของคนไข้ทท ี่ าการศึกษา Hazard ratio คือความชันของ slope
ของความแตกต่างระหว่างสองกลุม ่ แต่ไม่ได้บอก magnitude ของความแตกต่างบนแกน x
หรือแกนเวลาเสมอไป

ทาไมถึงต้องใช้ Cox Proportional Hazard Model ในการคานวณ Hazard Ratio?

เพราะมันทาได้งา่ ยครับ แต่บนความง่ายก็จะมีความอ่อนไหวอยูเ่ สมอ จุดอ่อนทีส่ าคัญของ Proportional


Hazard Model คือ assumption ทีว ่ า่ เราคานวณ Hazard Ratio โดยอนุมานว่า HR
จะเป็ นสัดส่วนทีเ่ ท่ากันหรือมีคา่ คงทีใ่ นเวลาทีผ ่ า่ นไป ในทุกๆชัน
้ ของปัจจัยร่วมอืน ่ (time-dependent
่ ไม่จาเป็ นต้องเป็ นจริงตามนัน
covariate) ซึง ้ เสมอไป ถ้าไม่จริงเรียกว่าเกิด Proportional Hazard violation ค่า
Hazard Ratio ทีไ่ ด้ก็ไม่น่าเชือ
่ ถือ

จะรูไ้ ด้ยงั ไงว่าไม่จริงหรือมี violation?

ต้องใช้วธิ ีทางสถิติ ซึง่ ทาได้หลายวิธค


ี านวณได้ดว้ ยโปรแกรมทางสถิติ แต่มกั จะไม่พูดถึงในเปเปอร์
แต่ที่ DANISH พูดถึงเพราะลักษณะของประชากรและวิธีการศึกษาของ DANISH มีโอกาสสูงที่ Hazard Ratio
ไม่จาเป็ นต้องเท่ากันตลอดช่วงเวลาทีต ่ ด
ิ ตาม เพราะภาวะ Heart Failure
ของผูป ้ ่ วยเปลีย่ นแปลงไปได้ไม่เท่ากัน ซึง่ ถือเป็ น time-dependent covariate ตัวหนึ่ง วิธีทางสถิตท
ิ ี่ DANSIH
ใช้คอ
ื Schoenfeld

Schoenfeld คืออะไร?

เป็ นหลักการทางสถิตท ิ ห
ี่ าส่วนต่างในแต่ละ covariate ครับ เรียกว่า Schoenfeld residual หากนาค่านี้มา plot
ตามเวลาทีเ่ ปลีย่ นไป ถ้า Hazard ratio มีสดั ส่วนทีเ่ ท่ากันจริง ค่าความชันของ Schoenfeld residual ต้องเป็ น 0
แต่ถา้ ไม่ใช่ 0 ถือว่ามี PH violation การทดสอบทางสถิตน ิ ี้เรียกว่า Schoenfeld residual test ถ้า reject null
้ ใน DANISH ได้ Schoenfeld p value ออกมา 0.054
hypothesis ได้ (p < 0.05) ถือว่ามี violation เกิดขึน
ถือว่าเกือบๆ

▒▒▒▒▒▒▒▒▒▒
วิธีอา่ น Kaplan-Meier Curve, step-by-step

1. อ่านสองแกนของกราฟก่อนเสมอว่า unit of measurement คืออะไร แกน y มีได้สามแบบคือ cumulative


survival, cumulative probability (event rate) และ cumulative Hazard rate (ไม่ใช่ Hazard ratio นะครับ
ดังนัน
้ จะมีสองเส้นแยกกันได้ ทีน ่ ้องโน่ ถามพีใ่ นห้อง) ส่วนแกน x เป็ นเวลา ถ้าสเกลในแกน y
ใหญ่เกินไป หรือ cumulative rate ทีไ่ ด้จากการศึกษาน้อยมากๆ อาจจะมีการขยายแกน y
สร้างกราฟอีกรูปวางซ้อนลงไปเรียกว่า inset แกน y อาจจะถูกตัดทอนแทนการใช้ inset
เพือ
่ แสดงความแตกต่างให้เห็นชัดขึน ้ ในการ plot แบบทีแ ่ สดง cumulative survival

2. ด้านล่างจะมีตวั เลข No. at risk สะสม อย่างทีพ


่ ใี่ ห้น้องๆทัง้ 10 คนเขียนตอนสร้างกราฟ
เหมือนกันทุกอย่างเลยครับ ตัวเลขนี้สาคัญยังไง? ถ้าตัวเลขเหลือน้อยลงไปเรือ ่ ยๆ ความแม่นยาของ
survival function จะลดลงหรือเรียกว่า attenuation ดังนัน ้ ใน protocol
ระยะเวลาในการติดตามต้องไปให้นานกว่า เวลาทีเ่ ราจะคานวณ cumulative survival เสมอ
เช่นในโจทย์ของน้องๆให้คด ิ cumulative risk ที่ 12 เดือน แต่ใน protocol
ต้องตามไปให้นานกว่านัน ้ พอสมควร เวลาอ่าน survival curve วิธีประเมินคร่าวๆให้น้องๆมองหา minimal
follow up time (ไม่ใช่ median follow up time) ของการศึกษาทีเ่ ขียนไว้ใน manuscript บนแกน x
จากนัน ้ ลากเส้นแนวดิง่ สมมุตข ึ้ ไป ทางด้านขวาของเส้นสมมุติ ให้น้องๆ aware ไว้วา่ การแแปลผล
ิ น
survival rate จะต้องทาด้วยความระมัดระวังมากขึน ้ เป็ นเทคนิคเล็กๆน้อยๆนะครับ
ในกรณี ทม ี่ น
ั ออกมาไม่ชดั เจน

3. การบอกความแตกต่างของ survival curve สองเส้น บอกด้วยตาเปล่าไม่ได้นะครับ


ต่อให้ดูตา่ งกันมากก็ตาม อย่างของน้องกิก ๊ จะเห็นว่ามันแยกออกจากกันอย่างชัดเจน กระนัน

้ งใช้วธิ ีทางสถิตใิ นการบอก ซึง่ มีอยูส
ก็ตอ ่ องวิธีหลักๆทีน
่ ้องๆควรรู ้

→ log-rank test หลักการคือพยายามหาหลักฐานมา reject null hypothesis ทีว


่ า่ สองเส้นนี้ไม่ตา่ งกัน ถ้า reject
ได้สาเร็จ (p < 0.05) ก็แสดงว่าต่างกัน บอกได้แค่นน ้ ั ว่าต่างหรือไม่ตา่ ง วิธีคด
ิ เราจะทาการ pool
ข้อมูลของทัง้ สองกลุม ่ มาด้วยกัน เอา interval ทีเ่ กิด event ทัง้ หมดมา union กัน อย่างในโจทย์ของน้องๆ
ถ้าเขียนใหม่ก็คอ ื interval ไหนซา้ กันก็นบ
ั อันเดียว อันไหนไม่ซา้ ก็ลากเขียนไล่ลงมาทัง้ หมด จากนัน ้ คิด
probability ของ survival ทุก interval โดยคิดจากฐานจานวนประชากรรวมสองกลุม ่ เมือ่ ได้คา่ ออกมา
ค่อยเอาไปคูณกับ n ในแต่ละกลุม ่ เพือ
่ หา estimated event rate ในแต่ละช่วงเวลา หักลบออกจาก event rate
้ จริงๆจากแต่ละกลุม
ทีเ่ กิดขึน ่ sum ทุกช่วงเวลา เพือ ่ นาไปหาค่า χ 2 ด้วย degree of freedom = 1 (มาจาก n - 1)
จริงๆพีต ่ ง้ ั ใจจะทาให้ดูบนกระดานแต่เวลาไม่พอ

→ Cox Proportional Hazard model ต่างจาก log-rank test ตรงทีไ


่ ม่ได้บอกแค่ตา่ งกันหรือไม่ตา่ ง
แต่บอกด้วยว่าต่างกันมากน้อยเท่าไหร่ null hypothesis คือ Hazard ratio = 1.0 ถ้า reject ได้สาเร็จ (p < 0.05)
ก็แสดงว่า Hazard ratio ไม่เท่ากับ 1 แค่นน ้ ั ตรงไปตรงมา, Hazard ratio คือ สัดส่วนของ Hazard rate
ในแต่ละช่วงเวลาระหว่างสองกลุม ่ , Hazard rate คืออะไร? Hazard rate คือโอกาสทีจ่ ะเกิด event ใน next
interval โดยดึง interval ให้เข้ามาใกล้ 0 มากทีส ่ ด
ุ เพือ
่ ให้ขยับเข้าใกล้ instantaneous Hazard rate

You might also like