Professional Documents
Culture Documents
解开手动肌肉测试和应用运动机能学:文献综述的批评和重新解释
解开手动肌肉测试和应用运动机能学:文献综述的批评和重新解释
去:
背景
作者应该因综合这一庞大文献的努力而受到认可。然而,该综述
在检索方法、纳入标准、质量评估、有效性定义、研究解释、文献
综合、研究结果的普遍性和结论表述方面存在严重错误,值得重
新考虑作者的研究结果。最重要的是,很容易引起对该评论的误
解,因为作者没有区分手动肌肉力量测试的一般用途和区分 AK
脊椎按摩疗法的具体应用。本评论的目的是对审查进行批判性评
估,以揭露重要缺陷,提出与审查和省略的文献一致的结论,
并将关于 AK 的结论,特别是关于 MMT 的结论区分开来。请注
意,我们尚未进行全面的系统审查。
去:
讨论
评价要素
此次 MMT 审查的有效性不可避免地取决于审查过程的质量。作
者似乎无意对文献进行全面系统的综述,我们也不要求他们遵
守这一标准。然而,诊断测试的良好系统评价的设计要素[ 2-
4],以及测量评估文献的批判性评价[5-14 ],都与当前的讨论
相关。即使是更传统的叙事评论也有许多这些要素[ 15 ]。我们整
理了必须考虑的问题,以便对 AK 诊断程序的有用性做出有效
推断(表(表格 1);1);这些问题基于上述引文中的研究和综
合方法。这几个问题的答案对作者关于 AK 有用性的结论提出了
严峻的挑战。
表格 1
测量评估(测试有用性)
1. AK 诊断程序的可靠性是否足够?
2. 是否已确定 AK 程序的结构有效性?
3. AK 诊断用于识别临床程序的敏感性和特异性或似然比是否足够?
4. 是否评估了 AK 诊断程序的临床效用?
5. AK 诊断程序的有效性是否已确定?
在单独的窗口中打开
AK 纠缠
AK 在脊椎按摩疗法方面拥有悠久而丰富的历史 [ 1 , 16 ]。许多
脊椎按摩师报告以某种形式使用该技术 [ 17 , 18 ]。显然,AK 的
支持者认为它不仅仅是标准的骨科/神经肌肉测试。由脊椎按摩
师进行的 MMT 在执行和解释上不一定与按物理医学应用标准执
行和解释的手动肌肉测试不同。对于任一从业者来说,肌肉无力
可能表明原发性肌肉或神经病理学。然而,AK 技术使用手动肌
肉测试不仅可以评估肌肉和神经供应的功能完整性,而且还可
以作为“诊断结构[和功能]、化学和精神功能障碍[ 1 ]”的手段。其
一些独特的诊断程序包括使用激发试验(即 AK 激发和治疗定
位)结合 MMT 来确定神经肌肉骨骼、器质性和代谢病症的治疗
需求 [ 19 - 21 ]。肌肉无力也被认为是临床前/亚临床器质性、非
神经肌肉骨骼疾病的诊断。
MMT 是神经肌肉骨骼体检的标准组成部分[ 22 ]。我们同意作者
的观点,即 MMT 可用于评估与疼痛、损伤和神经肌肉骨骼疾病
直接相关的肌肉无力。然而,由于多种原因,将 MMT 属性外推
到独特的 AK 应用是有风险的。 MMT 针对特定神经肌肉骨骼疾
病的可靠性/有效性可能无法推广到其他应用,例如器质性疾病
的识别。 MMT 对于单独的肌肉力量评估可能是可靠/准确的,
但与脊柱挑战(施加于椎骨关节的力)或用于特定 AK 诊断的
其他激发测试结合使用时则不然。作者还混淆了有效性一词的两
种用法:测试准确性和诊断有效性。测试可能非常准确,例如以
牛顿为单位的肌肉力的测力评估,但对于特定病症的诊断仍然
没有敏感性或特异性 [ 5 , 6 ]。Cuthbert 和 Goodheart 将 AK 的证
据与标准骨科 MMT 的可靠性/有效性的证据混为一谈。MMT 的
可靠性和准确性并不能证明 MMT 对其独特的 AK 应用的有用性。
搜索策略和纳入标准
作者表示,他们根据相关性选择研究,但没有包括操作性定义。
看来任何关于疼痛相关疾病的 MMT 文章都被认为是相关的。目
前尚不清楚在选择过程中如何使用“可靠性/有效性”和“MMT”。
负面研究肯定被忽略了。如果作者使用搜索词“肌肉测试”并纳入
MANTIS 数据库,他们就不会无法识别专门设计用于评估 AK 挑
战程序对 MMT 结果的贡献的随机试验 [ 23 - 25 ]。无论如何,作
者应该知道 1982 年 Triano 的研究,该研究是在国际应用运动
学学院的帮助下进行的 [ 23 ],并受到 Goodheart 在给编辑的一
封信中的批评 [ 26 ]。
一项选择标准在审查中引入了明显且重大的偏见。仅当评估可靠
性或有效性时报告 kappa ≥ 0.5 时,才纳入研究(尽管 kappa 通
常不是有效性指标)。显然,这一纳入标准并未得到统一应用,
因为许多纳入的研究没有解决可靠性问题,因此没有报告
kappa 值。更重要的是,这一标准的使用是基于 Swinkles 等人的
误解[ 27 ]。这些作者使用该标准来制定标准来确定某些工具是
否具有良好的结构效度;他们没有使用 kappa ≥ 0.5 的阈值来确
定系统审查的资格。 Cuthbert 和 Goodheart 使用此 kappa 选择
标准的结果是排除了除具有中等至优秀可靠性/有效性的研究之
外的所有研究。有偏见的纳入标准显然建立了一个同义反复,预
先确定了关于 MMT 有用性的积极结论。
质量评估和证据综合
研究质量评估是文献综述的一个重要方面[ 15 , 28 ],当然有很
多方法可以做到这一点[ 29 ]。卡斯伯特和古德哈特在方法部分
写道,进行了质量评估。直到论文结束,作者才承认内部和外部
效度尚未经过严格评估。作者没有正式的标准或算法来综合文献
来得出关于一般 MMT 和具体 AK 的结论。如果没有质量评估,
具有重大价值的研究不可避免地不会比具有严重设计缺陷和无
支持结论的研究得到更多重视。特别是,不建议从表面上看作者
从收录文章中得出的结论。出现误解。脊椎按摩疗法文献中的一
些结论与研究设计和结果不一致的例子在几篇评论中得到了证
实[ 9,30,31 ]。
治疗研究的证据
Cuthbert 和 Goodheart 试图从积极治疗结果的研究中推断 MMT
诊断的临床相关性。作者在表 4 中引用的一个例子是 Moncayo
等人的一项观察性研究 [ 32 ]。隐含的逻辑是,如果 AK 程序用
于确定治疗需求并且患者获得积极结果,则有证据表明 AK 程
序是一种有价值的诊断工具。这种推理的缺陷在于,尽管使用了
诊断程序,患者仍然可以改善。这实际上已经在一项随机试验中
得到了证明,该试验评估了常用的脊椎按摩疗法诊断程序的功
效[ 33 ]。有效的治疗(例如脊柱推拿)不需要有效或有效的诊
断测试作为治疗指标[ 7 , 33 ]。
随机试验的证据
诊断测试和操作指标的功效(对患者结果的贡献)可以而且应
该在盲法随机试验中进行评估[ 7,33,34 ] 。因此,我们同意作者
的说法,即需要更多的随机试验来验证 MMT 的 AK 应用。然而,
正如作者所说,治疗效果的随机试验不会验证 AK 诊断。
盲法随机试验不仅可用于评估测试效果,还可用于研究结构有
效性以及激发测试(例如联合挑战)对 MMT 结果的贡献。 AK
中使用的测试的几个构建有效性试验将在下面的构建有效性下
讨论 [ 23 , 24 ]。
可靠性
可靠性通常被认为是确定诊断测试有效性的必要但不充分的条
件[ 5 , 6 ]。也就是说,较差的可靠性通常会排除测试的有用性
(至少在如何测量的背景下[ 25 ]),但良好的可靠性并不能确
保有用性。如上所述,我们并不质疑骨科/神经学 MMT 的可靠
性,而只对 MMT 独特的 AK 应用的可靠性感兴趣。综述中省略
了几项此类双盲研究 [ 25 , 35 - 37 ]。
审查中未包括的其他可靠性研究如下所述。这些要么设计不当,
要么产生负面结果。
彼得森在一项关于情绪唤起的研究中发现可靠性很差。当考虑到
混杂变量时,可靠性显着提高[ 39 ]。然而,这项研究的设计很
糟糕,因为使用半结构化访谈来识别和事后消除负面混杂因素,
而没有寻找积极混杂因素。 Kenney 等人由 3 名训练有素的肌肉
测试员检查了 11 名受试者是否需要补充 4 种不同的营养素(锌、
维生素 C、硫胺素和维生素 A)[ 40 ]。检查者之间意见不一致,
他们的任何个人结果也与实验室测试没有相关性,肌肉力量的
手动和机械测量也没有任何相关性(可靠性和有效性都很差)。
Rybeck 和 Swenson 发现手动肌肉测试(使用背阔肌)能够区分
舌下放糖和不放糖,而机械肌肉测试则不然 [ 41 ]。应该指出的
是,受试者没有被蒙蔽。尽管弗里德曼和韦斯伯格试图测试某些
AK 程序,但他们的研究只是列出了数据,缺乏任何统计分析,
因此难以解释[ 42 ]。
建构效度
Leboeuf 等人研究了所谓的臂窝测试,这是一种用于骶枕技术
(SOT) 的手动肌肉测试方法 [ 43 ]。他们评估了 SOT 结构,即臂
窝测试(AK 型肌肉测试与相关挑战测试)对正确规定的阻断治
疗有反应,但在不正确或不治疗后无反应(不变)(N = 45)。
随访后,测试结果恢复正常的参与者分别为 73%、37.5% 和
14%。这项评估者盲法研究的结果好坏参半。为了支持这一观点
经过适当治疗的受试者比未经治疗的受试者更有可能获得正常
的随访。与预测相反,事后测试显示,正确治疗组和未正确治疗
组之间,或治疗不当组和未治疗组之间没有差异 (P > .025)。只
有经过适当治疗的组才表现出与单纯猜测不同的后续测试结果。
需要指出的是,由于样本量小且受试者未设盲,证据并不充分。
Triano 进行了两项双盲实验(使用交叉随机试验设计)来评估
AK 结构,即背阔肌较弱与胰腺营养补充的需要相关 [ 23 ]。更具
体地说,研究的两个理论结构是,用胰腺组织提取物进行舌下
或皮肤刺激可以使背阔肌 MMT 恢复正常。对照挑战是心脏、胸
腺和睾丸提取物,AK 从业者认为这些提取物不太可能影响
MMT。提取物之间的攻击后阳性测试率没有差异,表明胰腺提
取物攻击与背阔肌强度没有关系。Triano 建议,未来的临床 AK
研究应该以 AK 机制的基础科学研究开发的结构为基础。
Haas 等人对有背痛和无背痛的参与者进行了一项双盲随机试验,
以评估 MMT 反应与刺激性脊椎挑战和脊柱操作的关系 [ 24 ]。
他们研究了 AK 结构,即 MMT 与脊柱刺激可用于监测对脊柱操
作的反应。研究的第一阶段是交叉设计,比较梨状肌对椎体挑战
和假挑战的 MMT 反应。该研究的第二阶段是平行组设计,旨在
比较接受脊柱操纵或未接受脊柱操纵的参与者对脊椎挑战的
MMT 反应。有趣的是,在治疗前各椎段的阳性测试率一致(平
均值= 5.6%),以及干预后在椎体水平上进行操作后,前测试
阳性和前测试阴性 MMT(8%至 10%)的治疗组和对照组的阳
性测试率是一致的。作者总结道:“对于所研究的人群来说,肌
肉反应似乎是一种随机现象,与可操纵的半脱位无关。就其本身
而言,肌肉测试对于脊柱筛查和调整后评估的用途似乎值得怀
疑[ 24 ]。”
标准有效性
卡斯伯特和古德哈特没有为任何假定与同一肌肉的神经肌肉骨
骼状况无关的状况(神经肌肉骨骼或其他)相关的 MMT 建立有
效性标准。因此,他们没有提供任何 AK 挑战或治疗定位测试标
准有效性的证据。
作者确实引用了 Pollard 等人的一项治疗定位测试研究,该研究
利用患者的手接触“回盲瓣点”并结合三角肌 MMT 来识别腰痛患
者(金标准)[ 44 ]。该研究显示该测试具有较高的敏感性和特
异性。然而,与使用三角肌的不同人群的治疗定位和 MMT 相关
的独特效果是混淆的,并且这两种成分的效果都没有得到评估。
例如,观察到的有效性可能是由于患有和不患有腰痛的人的基
础阳性测试率不同而导致的,与治疗定位测试无关。不同的阳性
测试率可能与背痛本身的注意力分散或不适有关,因此可以从
任何肌肉获得相同的结果。不保证参与者对研究目的一无所知。
这些问题可以通过如上所述的随机试验来解决。最后,由于两个
原因,这项特定研究的高敏感性和特异性在临床上并不引人注
目。它并不表明任何具体的治疗方法,并且有一种完全准确、具
有成本效益且易于执行的测试:腰痛患者报告。
评论和批评
作者没有承认之前对 AK 的评论和批评。 Teuber 和 Porch-
Curren 指出,一些研究反驳了 AK 诊断食物过敏的观点,他们
得出的结论是:“迄今为止的证据表明,这种诊断方式在经过严
格审查时并未得到验证[ 46 ]。” Tschernitschek 和 Fink 审查了
AK 程序,包括牙科中使用的程序。他们的结论是,缺乏 AK 有
效性、可靠性和有效性的证据 [ 47 ]。Haas 发现,由于已发表研
究的方法和统计限制,MMT 的可靠性在 1991 年之前无法得到
证实 [ 9 ]。 Klinkoski 和 LeBoeuf 回顾了国际应用运动学学院
1981 年至 1987 年间发表的科学论文 [ 48 ]。作者的结论是,由
于基于明确的样本量、纳入标准、盲目和幼稚受试者、可靠的测
试方法、盲目评估者和统计分析的方法学质量不足,无法得出任
何结论。Motyka 和 Yanuck 发现 AK 研究的主体是模棱两可的,
有时证实了可靠性和有效性,有时则没有证实,并且由于各种
设计缺陷而常常根本不相关[ 49 ]。
临床前和亚临床疾病的诊断
AK 支持者声称能够诊断临床前和亚临床病症 [ 1 , 16 ]。要证明
MMT 对于此类疾病的有效性,需要与具有很强的疾病预测有效
性的标准进行比较,或者证明基于 AK MMT 结果的预防性护理
相对于未经治疗的对照组可以预防或减少疾病的发展。我们找不
到这样的研究。
去:
结论
卡斯伯特和古德哈特进行了一项审查,但发现了重要的方法缺
陷。当应用运动机能学中使用的手动肌肉测试与标准骨科/神经
肌肉测试分离时,评估特定 AK 程序的少数研究要么反驳或不
能支持 AK 程序作为诊断测试的有效性。特别是,使用 MMT 来
诊断器质性疾病或推定的临床前/亚临床病症是不支持的。
去:
利益争夺
作者声明他们没有利益冲突。
去:
作者的贡献
去:
参考