You are on page 1of 7

綜 說 缺血性腦中風取栓器械療效之比較 − 非劣性試驗之臨界值的影響

缺血性腦中風取栓器械療效之比較–非劣性試驗之
臨界值的影響

林浚仁

國立陽明交通大學醫學院醫學系神經科
臺北榮民總醫院神經醫學中心腦血管科

前  言 warfarin,新型抗凝血劑不需定期監測血中INR
(international normalized ratio),服藥期間飲食的
近年來,於合適的急性缺血性腦中風 禁忌也較少,使用起來比較方便。所以只要新
合併大血管阻塞個案採用動脈內血栓移除術 型抗凝血劑能夠通過非劣性試驗證明療效不亞
(Endovascular thrombectomy〔EVT〕)治療已 於warfarin,即可核准上市。本文將就非劣性試
是標準治療。隨著血管內介入治療的發展與進 驗在急性缺血性腦中風EVT相關試驗的應用,
步,這幾年新世代的取栓器械不斷的問世。 以及其臨界值的選定來加以簡單介紹與闡述。
然而,醫學上任何新的治療或器械在批准上市
前,都需與現有的標準治療或器械比較優劣, 非劣性試驗(non-inferiority trial)
證明新的治療/器械之效果與安全性並不亞於現
有的標準治療/器械,才能被廣泛使用。驗證一 非劣性試驗是採取統計學的方式,分析並
個治療或器械的療效以及安全性,需有客觀評 確認一種治療並不劣於另一種治療(通常是現有
估的標準。 的標準治療手段)。若新治療可以被證明療效與
有別於比較一種新治療相對於控制組(另一 安全性不劣於現有標準治療,甚至有額外的優
種治療或是安慰劑)是否有顯著差異的較優性試 點,那就值得上市、推廣。因為非劣性試驗只
驗(superiority trial),非劣性試驗(non-inferiority 驗證非劣性,所以控制組的選擇就非常重要。
trial)是在探討新治療與現有治療(控制組)的療 非劣性試驗的控制組需要是目前還廣泛使用的
效差距是否不超過一個事先選定的差距(即為 治療手段(活性控制組,而非安慰劑),並其療
非劣性臨界值)。若能夠在非劣性試驗中表現 效已被設計良好的臨床試驗證實過。
出不劣於控制組的療效,則可宣稱這個新治療 缺血性腦中風取栓器械不斷推陳出新,故
表現上不亞於現有的治療。而當一種新的治療 新器械在被批准上市之前,需要與現有並廣泛
有著比現有標準治療額外的優點時(例如:新 使用的器械進行非劣性試驗來驗證其療效與安
治療侵入性較小,新治療較便宜,或新治療較 全性。在非劣性試驗中,研究者必須訂定一個
容易遵從…等),即適合進行非劣性試驗。舉 有意義的臨界值。只要試驗結果新舊治療的效
例來說,新型抗凝血劑與warfarin一樣都可以 果或安全性的差距小於該值(95%信賴區間的上
預防心房顫動所造成的心因性血栓。但相對於 端未超過臨界值),即代表新治療不劣於原有的

通訊作者:林浚仁醫師,臺北榮民總醫院神經醫學中心腦血管科
E-mail: zenlin1981@hotmail.com
DOI: 10.6318/FJS.202103_3(1).0003

37
缺血性腦中風取栓器械療效之比較 − 非劣性試驗之臨界值的影響

圖1 95%信賴區間之上端若未超過非劣性臨界值(M),則可宣稱非劣性(non-inferiority, NI)。

治療,而可宣稱其療效相當(圖1)。由此可知, 臨床有意義之最小差距(minimal clinically


臨界值的制訂攸關試驗成功與否。臨界值訂得 important difference〔MCID〕)為不同治療對疾
太嚴格,會讓非劣性很難達到。相反的,若把 病的結果帶來可以被病患或治療者視為臨床上
臨界值訂的太寬鬆,則太容易讓試驗呈現非劣 有意義的最小差距3。反過來說,若兩種治療對
性1。臨界值的選定需要參考過往的研究,並同 某個疾病結果的效果差距小於MCID,則可謂
時考量統計學以及臨床意義。為了保障新治療 兩種治療在臨床療效上並無重要的差別。過去
仍是顯著優於安慰劑的,所以臨界值的訂定需 MCID比較常被用在風濕病治療對於疼痛、或
要確保新治療保存了活性控制組一定程度的療 生活功能的改變效果之評估,近年來也開始被
效(以免落入與安慰劑沒有顯著差異的程度)。 使用在其他疾病對不同治療的反應4, 5。
一般而言在選定臨界值時,研究人員會參考過 理論上,非劣性試驗臨界值的設定應該參
往多個試驗或是統合分析計算出現有治療與安 考MCID:若兩種治療(A治療與B治療)對某種
慰劑療效之間的差距(M1),再選定一個比這差 疾病結果的治療效果差距小於MCID,則可代
距更小的數字當作臨界值(M2)。至於M2要比 表A治療的效果不劣於B治療。然而,針對合併
M1小多少才合理則需考量所研究的事件結果 大血管阻塞之缺血性腦中風,取栓器械之血管
(outcome)之發生率、結果嚴重度以及活性控 打通率的MCID則尚未被明確定義過。取栓器
制組療效。發生率越高、事件結果越嚴重,或 械的治療效果以血管打通率為評估基準,例如
活性控制組療效越高,M2就要比M1小越多, 把成功打通血管定義為mTICI 2b-3。若現有器
才能確保新治療更加「不劣於」活性控制組。目 械達到成功再通的比率為80%,新的為78%,
前,許多心血管事件之非劣性試驗把M2訂在 則兩種器械之療效差距為2%。根據幾個比較
M1之50%。相對的,許多抗生素之非劣性試驗 取栓器械的非劣性試驗來看,過往業界的非劣
2
則把M2訂在M1之10-15% 。 性臨界值多訂為8-15%,然而這個範圍稍嫌寬
鬆,且沒有良好的證據來加以支持。

臨床有意義之最小差距
(minimal clinically important 急性缺血性腦中風取栓器械
difference) MCID之判定
38
缺血性腦中風取栓器械療效之比較 − 非劣性試驗之臨界值的影響

為了了解急性缺血性腦中風取栓器械血管 表1 取栓器械血管再通率的MCID合適範圍的
全球腦血管疾病專家的線上調查研究
成功再通率的MCID,我們進行了一個針對全
球腦血管疾病專家所做的線上調查研究。我們 Number (%),
Characteristic
n=58
查閱了目前學界發表有關EVT的試驗,由文獻
Sex, Male 56 (96.6)
中提供的全球重要收案醫學中心名單系統性地 Geographic Location
找出200位腦血管疾病專家。針對這些專家,我 North America 36 (62.1)
們提供了一個臨床場景,以線上問卷的方式詢 Europe 20 (34.5)
Asia-Pacific 2 (3.5)
問他們認為的取栓器械血管再通率MCID為何 Specialties
範圍才是合適的6。 Interventional Neuroradiology 20 (34.5)
在兩週內回覆的58位專家當中,大多來自 Endovascular Neurosurgeon 6 (10.3)
Interventional Neurology 18 (31.0)
歐美。約3/4為介入領域的專家,包括介入性神
Non-Interventional Vascular Neurology 14 (24.1)
經放射科、神經科以及神經外科醫師,而1/4則 Current Appointment Level
為非介入領域的腦血管神經科醫師(表1)。結果 Clinical Instructor 4 (6.9)
顯示這些腦血管疾病專家認為適當之MCID中 Junior Faculty 10 (17.2)
Midcareer 17 (29.3)
位數落在3.1-5%的範圍,但事實上最多人所選
Senior Faculty 27 (46.5)
擇的範圍則是5.1-10%,這顯示出這個議題仍 Years of Practice
未有很明確的共識(圖2)。然而,前述目前被廣 0-5 7 (12.1)
6-10 15 (25.9)
泛使用在取栓器械非劣性試驗8-15%之臨界值
11-15 13 (22.4)
較此結果所得到的MCID (3.1-5%,或甚至5.1- >15 23 (39.7)
10%)顯著來的寬鬆,也比心血管疾病相關試驗 Proportion of Practice Devoted to Stroke
常使用的4-5%寬鬆。於是我們想了解若使用不 <10% 0 (0)
10-50% 19 (32.8)
同的非劣性臨界值來重新分析過往的非劣性試
51-90% 20 (34.5)
驗,是否會有不同的結果。 91-100% 19 (32.8)

圖2 腦血管疾病專家線上問卷之結果顯示其所認同之缺血性腦中風取栓器械血管再通率MCID的中
位數落於3.1-5%。

39
缺血性腦中風取栓器械療效之比較 − 非劣性試驗之臨界值的影響

不同臨界值對非劣性試驗 然而臨床實務上,病患的病灶千變萬化,
醫療人員仍需多種不同器械以供彈性使用。若
結果之影響
一味採用嚴格的臨界值,會使新器材的研究因
我們將之前所有比較新舊取栓器械的臨床 為需要更多的個案數而需要更大量的資源,致
試驗進行統合分析,針對血管再通率以及臨床 使發展速度大幅變慢。所以我們提出別於非
功能性預後兩個結果,分別以寬鬆的(15%)與 劣性試驗的另一種試驗:RAPT—Reasonably
嚴格的(4%或5%與1.3%)臨界值重新分析。結果 Adequate Performance Trial (合理性適當表現試
發現不管是哪一個結果,如果採用寬鬆的臨界 驗)。RAPT可根據過往經驗訂定一個臨床判斷
值,所有的試驗皆有通過非劣性的檢驗。但若 合理,但比真正的MCID寬鬆一些的臨界值(例
改採用嚴格的臨界值,則只有一半的新器械相 如目前使用的15%)。若新器械通過此類試驗,
比原有的標準器械達到統計學上顯著的非劣性 則可宣稱該器械的臨床效果是適當且合理的(但
7
(圖3、4) 。因此,我們認為若要真正要驗證非 不能宣稱達統計上的顯著非劣性)。反之,只有
劣性,研究者仍應該將臨界值訂在符合專家認 真正通過以MCID為臨界值的非劣性試驗,才
同的MCID且較嚴謹的數值(3-5%),才不會讓非 可宣稱其新器械相對於原有的器械已到顯著非
劣性試驗的結果失真。 劣性。此RAPT試驗與既存的非劣性試驗可以

圖3 採用不同非劣性臨界值對於非劣性試驗之影響:缺血性腦中風取栓器械血管再通率。在使用
寬鬆的臨界值(-0.15)的情況下,所有的試驗結果都達到非劣性。然而,若改採較嚴謹的臨界
值(-0.04),則發現包括ASTER, COMPASS以及Penumbra 3D皆未達到非劣性。

40
缺血性腦中風取栓器械療效之比較 − 非劣性試驗之臨界值的影響

圖4 採用不同非劣性臨界值對於非劣性試驗之影響:臨床功能性預後(90天mRS 0-2之比率)。在使
用寬鬆的臨界值(-0.15)的情況下,所有的試驗結果都達到非劣性。然而,若改採較嚴謹的臨
界值(-0.05或-0.013),則發現包括ASTER, COMPASS, Penumbra 3D以及ASTER 2皆未達到非劣
性。

同時存在。在醫材監管單位的規範中,只有通 的制定須符合統計學與臨床意義。而要達到上
過非劣性試驗的器械才能獲准為常規第一線使 述兩個目標,研究者要盡可能將非劣性臨界值
用的器械,但在某些情況之下,例如病患的特 訂在接近要研究的疾病結果之MCID。這研究
殊需求(例如血栓形式、解剖構造…等),或手 也提醒我們在研讀任何一個非劣性試驗時,除
術者的經驗及偏好,通過RAPT的器械可當作 了看其發佈的結果有無達到統計學意義之外,
一個合理的替代品。如此一來,既能讓新發展 更要注意其方法學裡所提之臨界值選定的依
的器械能順利進入市場,維持市場上取栓器械 據。若該非劣性臨界值過份寬鬆,則我們就該
的多樣性,也能為科學嚴謹度把關,不致犧牲 對其研究之結論打個問號,小心解讀。
7
非劣性的原始統計意義 。

參考文獻
結  語
1. Piaggio G, Elbourne DR, Pocock SJ, Evans
由此研究可以發現非劣性臨界值的選定可 SJ, Altman DG, Group C. Reporting of
以顯著地影響非劣性試驗的結果。而這臨界值 noninferiority and equivalence randomized

41
缺血性腦中風取栓器械療效之比較 − 非劣性試驗之臨界值的影響

trials: extension of the CONSORT 2010 Clin Proc 2002;77:371-383.


statement. JAMA 2012;308:2594-2604. 5. Cranston JS, Kaplan BD, Saver JL. Minimal
2. A d m i n i s t r a t i o n U S D o H a H S F a D . N o n - clinically important difference for safe and
inferiority clinical trials to establish simple novel acute ischemic stroke therapies.
effectiveness: guidance for industry. https:// Stroke 2017;48:2946-2951.
www.fda.gov/downloads/Drugs/Guidances/ 6. Lin CJ, Saver JL. The Minimal clinically
UCM202140.pdf2016. important difference for achievement of
3. Jaeschke R, Singer J, Guyatt GH. Measurement substantial reperfusion with endovascular
of health status. Ascertaining the minimal thrombectomy devices in acute ischemic stroke
clinically important difference. Control Clin treatment. Front Neurol 2020;11:524220.
Trials 1989;10:407-415. 7. Lin CJ, Saver JL. Noninferiority margins
4. Guyatt GH, Osoba D, Wu AW, Wyrwich KW, in trials of thrombectomy devices for acute
Norman GR, Clinical Significance Consensus ischemic stroke: is the bar being set too low?
Meeting G. Methods to explain the clinical Stroke 2019;50:3519-3526.
significance of health status measures. Mayo

42
缺血性腦中風取栓器械療效之比較 − 非劣性試驗之臨界值的影響

Comparison of Thrombectomy Device for Acute Ischemic


Stroke – The Impact of Margins in Non-inferiority Trials
Chun-Jen Lin

Department of Neurology, School of Medicine, National Yang Ming Chiao Tung University, Taipei, Taiwan.
Department of Neurology, Neurological Institute, Taipei Veterans General Hospital, Taipei, Taiwan.

ABSTRACT
Novel endovascular thrombectomy (EVT) devices for acute ischemic stroke are often cleared by
regulatory agencies on the basis of non-inferiority trials. Defining non-inferiority margins is an essential
step for designing non-inferiority trials. However, the relation between the non-inferiority margins used in
these trials and the minimal clinically important difference (MCID) determined by experts has never been
studied. We performed an online survey to international neuro-interventionalists and noninterventional
vascular neurologists and investigate their opinions of MCID for the substantial reperfusion of endovascular
thrombectomy devices. According to the reply from 58 international experts, the median MCID for
substantial reperfusion was 3.1–5%. Thereafter, we performed systematic searches to identify all non-
inferiority design or non-inferiority-presented stroke-EVT trials. Stroke-EVT trial results were reanalyzed
using the broad non-inferiority margins originally used and narrower non-inferiority margins derived
from formal MCID studies. For both reperfusion and functional outcomes, all 7 trials demonstrated non-
inferiority with the broadest non-inferiority margin, but only 4 and 3 trials demonstrated non-inferiority
with actual expert-derived margins for reperfusion and functional outcome, respectively. In conclusion,
non-inferiority margins may significantly impact the results of non-inferiority trials. The rationale of margin
selection in non-inferiority trials needs to be closely reviewed when interpreting the results of the non-
inferiority studies.

Keywords: endovascular thrombectomy (EVT), minimal clinically important difference (MCID), non-
inferiority margin, ischemic stroke

Corresponding author: Dr. Chun-Jen Lin, Department of Neurology, Neurological Institute, Taipei Veterans General Hospital,
Taipei, Taiwan.
E-mail: zenlin1981@hotmail.com

43

You might also like