You are on page 1of 42

2021年第29卷(第1期)

·87·

机器审判

[美]安德里娅 · 罗斯 * 著 董帅 *,张弛 *,阳平 * 译 汪诸豪 * 校

【摘 要】本文探讨了刑事裁判中“机器”的兴起。如今,人证常常让位于机器装置和解析软件,陪
审团对道德归责性的复杂判断也让位于犯罪构成的机械化指标,而法官的复杂裁判则让位于量刑指南和
精算工具。尽管机器化具有提高刑事司法客观性和准确性的光明前景,但由于当前机器化司法的开发和
应用水平不均衡、不成体系,该前景仍未实现。目前,司法证明、责任认定和量刑方面的机器化现状存
在着可预见但却未受到认真对待的自动化缺陷:
“黑箱”程序中潜藏着主观性和错误;对归责问题设置的
指标过于简化(而且往往非常不准确)造成决策失真;人类安全阀所保护的价值(例如,尊严、公平和
仁慈)受到减损;在某些方面,机器本可以成为强大的消除偏见的工具,但由于公共政策层面的动因不
足,其开发和应用水平却甚显不足。例如,政府一方面在提高通常会使匹配数据更具有罪倾向的 DNA 解
析软件的客观性,另一方面却又信奉指印和工具痕迹分析人员所作的主观判断;而在上述软件面前,这
些分析人员对身份同一性的主张可能会显得苍白无力。同样,在庭审中,当测谎结果通常仅由被告提供
时,政府指责测谎仪是“不可靠”的设备;但在撤销缓刑听证会上 , 政府却又经常使用测谎仪,彰显其作
为“真相机器”的传统地位。本文最后提出一种系统化的解决方案,即“人机交互审判”,用以防范机器
自动化的病理缺陷;同时,通过“衡平监控”和其他手段来对机器化中的明显缺失进行盘查。
【关键词】机器;算法;法庭证据;DNA
【中图分类号】D915.13
【文献标识码】A
【文章编号】1674-1226(2021)01-0087-42
Trial by machine. Andrea Roth. Professor, UC Berkeley School of Law. Translated by Dong Shuai (Institute of
Evidence Law and Forensic Science, CUPL), Zhang Chi (Leiden University, Advanced LLM in Law and Digital
Technologies), Yang Ping(Assistant Researcher, China Academy of Discipline Inspection and Supervision), Wang
Zhuhao (Institute of Evidence Law and Forensic Science, China University of Political Science and Law, Beijing,
China, 100088).
【Abstract】This Article explores the rise of "machines" in criminal adjudication.Human witnesses now often
give way to gadgets and interpretive software, juries' complex judgments about moral blameworthiness give way to
mechanical proxies for criminality, and judges' complex judgments give way to sentencing guidelines and actuarial

*
安德里娅 · 罗斯(Andrea Roth),加州大学伯克利分校法学院教授。原文(Trial by Machine)载《乔治城法律评论》
第 104 卷,2016 年第 5 期。本文已得到安德里娅 · 罗斯教授的书面授权。
董帅,中国政法大学证据科学研究院博士研究生,邮箱:dongshuaimail@163.com。
张弛,荷兰莱顿大学法学和数字技术高等硕士。
阳平,中国纪检监察学院助理研究员。
汪诸豪,中国政法大学证据科学研究院副教授。
Evidence Science Vol.29 No.1 2021
·88·

instruments. Although mechanization holds much promise for enhancing objectivity and ccuracy in criminal justice,
that promise remains unrealized because of the uneven, unsystematic manner in which mechanized justice has
been developed and deployed. The current landscape of mechanized proof, liability, and punishment suffers from
predictable but underscrutinized automation pathologies: hidden subjectivities and errors in "black box" processes;
distorted decision making through oversimplified--and often dramatically inaccurate--proxies for blameworthiness;
the compromise of values protected by human safety valves, such as dignity, equity, and mercy; and even too little
mechanization where machines might be a powerful debiasing tool but where little political incentive exists for
their development or deployment. For example, the state promotes the objectivity of interpretive DNA software that
typically renders match statistics more inculpatory, but lionizes the subjective human judgment of its fingerprint
and toolmark analysts, whose grandiose claims of identity might be diluted by such software. Likewise, the state
attacks the polygraph as an unreliable lie detector at trial, where results are typically offered only by defendants,
but routinely wields them in probation revocation hearings, capitalizing in that context on their cultural status as
"truth machines. " The Article ultimately proposes a systems approach--"trial by cyborg" --that safeguards against
automation pathologies while interrogating conspicuous absences in mechanization through "equitable surveillance"
and other means.
【Key Words】machine, algorithm, forensic evidence, DNA

引 言
在“醉酒程度检测仪”(一种用来检测驾驶员醉酒情况的小型机器)刚问世之际,有位法学家于
1953 年写道:
“长久以来,人类一直梦想能实现某种‘自动售货机式的证明’,即输入‘案件事实’
后便能得出‘正确裁判’”。1 至今这个梦想依然没有实现,但这肯定不是因为缺乏尝试所致。从银
版照相成像到醉酒程度检测仪,再到 DNA,美国法院和执法机关以其对诸多被吹捧为“真相机器”
的犯罪侦测装置的开放态度而感到自豪。如今,在醉驾案件中各州已经转变为“机器化责任”制度,
以尽力约束那些非理性的外行陪审团—他们不知道有“实验室证据”证明,即便是低血液酒精浓
度也存在风险。2 美国立法者也在追求强制最低刑、量刑指南,以及循证量刑 *,以加强对人为自由
裁量的控制,并提高刑罚的统一性和真实性。尽管如此,人们似乎普遍认为,人类法官和陪审团在
软化机器化的鲁钝方面有其自身的作用,也就是说,他们扮演着“国家司法机器中的电闸”。3 引入
机器法官和陪审团的呼声通常会遭到嘲笑,理由是机器无法开展必要的个性化人为判断,即通过综
合考量复杂的事实认定、衡平裁量和仁慈,从而充分评估行为的可谴责性。的确,在刑事审判中,
测谎仪几乎被普遍排除使用,理由通常是其会召唤来“机器审判的幽灵” 。4 考虑到与机器化刑事裁

1
Dillard S. Gardner, Breath-Tests for Alcohol: A Sampling Study of Mechanical Evidence, 31 TEX. L. REV. 289, 289 (1953).
2
See COMM. ON PUB. WORKS, 90TH CONG., 1968 ALCOHOL AND HIGHWAY SAFETY REP. 122 (Comm. Print
1968) [ 以下简称 1968 REPORT].
*
译者注:循证量刑(evidence-based sentencing, EBS)通常由如下构成:对风险性因素的评估(增加再犯可能性的
因素);对保护性因素的评估(降低再犯可能性的因素);对犯罪需求的评估(“临床疾病或功能障碍如果得到改善,
将大大降低罪犯再犯的可能性”);通过使用经过科学验证的风险评估工具和方法,对再犯风险进行评估(参照特
定的再犯类型,在特定的时间范围和背景下进行定义);依据特定罪犯的风险性因素、保护性因素和犯罪需求,确
定最有效的(即预防再犯)量刑选项和干预措施(包括矫正和治疗方案)。See Richard E. Redding, Evidence-Based
Sentencing: The Science of Sentencing Policy and Practice, Chapman Journal of Criminal Justice, Vol. 1, No. 1, pp. 1-19,
2009.
3
Blakely v. Washington, 542 U.S. 296, 306 (2004).
4
United States v. Bursten, 560 F.2d 779, 785 (7th Cir. 1977).
2021年第29卷(第1期)
·89·

决兴起相伴的那些值得称颂的目标,以及立法者和法院在保障受到人为干预所保护的复杂性和“软”
价值 5 方面所作的明显约束,似乎我们司法系统的机器化进路是均衡且运行良好的。
然而,正如本文所认为的, “机器化”刑事裁决兴起的方式实际上是疑云重重。机器化形式的证
明和决策在刑事司法中的运用通常被执法机关或利益集团所主导,他们关注的是特定类型的客观性
和准确性,即减少“漏判” (false negatives)*。在刑事语境中,“漏判”指的是未能侦破犯罪、错误
无罪开释或过度从轻量刑之类的不准确性。尝试用机器化的愿景来减少这些不准确性,无疑是一个
值得赞扬的目标。然而目前出现的机器化进程却往往似乎是杂乱无序的,甚至是事与愿违,而不是
系统性地专注于防范不准确性和偏见。正如以下探讨所证实的,有时候, “机器”的外延是什么,或
者我们应当将“机器”视为一种尊称还是一个诨号,似乎并非取决于程序的内在特质,而是取决于
“机器”这个标签是否增强了该程序对公共合法性的诉求。尤其是,除了呼气酒精检测仪这种明显
的例外情况,立法者和执法机关有时对那些也可以用来减少“误判”(false positives)的机器化方式
却视而不见(甚至对之产生敌对情绪)。实际上,恰恰是(或者主要是)当“人类主观判断”这种
自由裁量会减少“漏判”而不是“误判”时,执法者似乎会夸大其重要性。同时,在机器化会减少
“漏判”之处,机械化形式的证明或惩罚和归责机制(不得自由裁量、基于规则)中可预见的自动
化缺陷看起来是最容易被容忍的。而这些缺陷最终会威胁到机器化兴起背后的目标—准确性和客
观性。
在刑事司法中,机器化的发展与运用并不均衡而且依赖于社会力量和政治力量,这个事实并不
令人感到惊讶。相反,这符合科技研究学术界的主流公理,即新技术的发展与理念“是高度争议性
的,取决于特定的局部环境,同时承载着关于其所在社会环境的潜在假定”。6 我们也不应感到惊讶,
执法机关会主要以减少“漏判”、解读和控制罪犯的眼光来看待机器化。7 尽管如此,法学家们还没
有全面审查机器化刑事司法发展的不均衡性和或然性,以及这种不平衡所产生的后果。
本文第一部分对机器化刑事审判的兴起进行了综述,进而说明这种兴起通常是不平衡的,反映
的是那些控制或运用机器化来减少“漏判”的人的主要关注点。例如,当类似机器形式的证明会提
高犯罪侦破率、犯罪行为的可确定指标会增加定罪率,或精算工具会增加拘留时长时,执法机关通
常会标榜其“机械化”的优点。但另一方面,那些主要是减少“误判”(而不是“漏判”)的机器化
形式,则常常因其过于“机械化”而明显的被避而不谈或躲闪。
以测谎仪为例。测谎仪并不能直接识别谎言;这种机器测量的是特定的生理现象,例如皮肤电
导率、心率和收缩压,然后由人类分析员将其解释为是否在说谎。的确,当现代测谎仪发展问世
时,那个时期的欺骗术检测专家们对于媒体把欺骗测试称为“谎言侦破者”感到非常恼火。8 但是,

5
此处的“软”价值,笔者指的是那些深深地根植于证成美国司法制度结构的辞藻中,但是其利益难以量化或测量
的价值,例如尊严、公平、仁慈,以及系统合法性。See, e.g., Richard A. Bierschbach, Proportionality and Parole, 160
U. PA. L. REV. 1745, 1785 (2012) ( 此文对“标准的”可测量刑罚目标〔例如威慑〕和“软价值” 〔比如“对人的价值
和潜力的自我认可”〕进行了对比 )(citation omitted).
*
译者注:False negatives/False positives,直译为“假阴性 / 假阳性”,此处为便于理解,译为“漏判 / 误判”。需注意
的是,译者此处的“漏判 / 误判”,是相对于犯罪者依法应得的判罪和量刑而言的“漏”或“误”,应按照本文中作
者所阐明的范围理解。
6
SHEILA JASANOFF, SCIENCE AT THE BAR: LAW, SCIENCE, AND TECHNOLOGY IN AMERICA, at xiv (1995).
7
See infra Section I.C; see generally MICHEL FOUCAULT, “SOCIETY MUST BE DEFENDED”: LECTURES AT THE
COLL?GE DE FRANCE, 1975-76, at 239, 242-43, 259 (Arnold I. Davidson et al. eds., David Macey trans., Picador Books
1st ed. 2003) (1997) ( 此文讨论了将仪器和监视用作“生物权力”的工具,来“规训”独立个体和“规制”人类群
体 ); Herbert L. Packer, Two Models of the Criminal Process, 113 U. PA. L. REV. 1, 9 (1964) ( 此文描述了理想的“正当
程序”和“犯罪控制”刑事诉讼模式,并且指出,根据后者, “抑制犯罪行为是迄今为止刑事程序最重要的功能”).
8
See KEN ALDER, THE LIE DETECTORS: THE HISTORY OF AN AMERICAN OBSESSION 80-81 (2007).
Evidence Science Vol.29 No.1 2021
·90·

到了“基勒测谎仪”9 这种被准许销售的标准化仪器问世时,在社会公众的眼中,它就成为了一种
“真相机器”。10 如今,在定罪后的假释或撤销缓刑程序中,政府依然日常性地吹捧测谎仪是对抗被
告的可靠“测谎机器人”(在敏感的国家安全事务中更是如此)。然而,在刑事审判中,当测谎仪检
测结果通常是由被告人提供作为无罪证据,而不是由控方提出作为有罪证据时,检控方则经常会以
“不可靠”为由寻求将该测谎证据予以排除。11
其他机器化形式中也存在类似情况。在可采性听证的争辩中,控方和政府承包商对解析 DNA
混合物的概率软件被夸大的客观性和准确性进行鼓吹。这种软件程序已经大量存在,有些当地执法
机构甚至开发了自己的程序。12 但是,对于指纹、工具痕迹或类似的法庭科学学科,却没有迫切的
这种软件开发需求—专家们通常被准许作证说,根据他们的“判断和经验”,被告人确定无疑就
是证据的来源。13 在量刑语境中,强制最低刑和量刑指南实际上加大了量刑中的种族差异,并大大
增加了刑期,14 却被执法机关称赞为控制司法自由裁量权的客观、合理手段。然而,对于大幅降低
了美国某些地区审前拘留率的最近的“智能”保释改革算法,检察官们却表示担忧。这不仅仅是因
为成本问题,而是因为,就这些方法所考虑的特性来说,它们看起来过于简单和机械化了。15
接下来,第二部分从三个方面依次指出,机器化刑事审判的这种不平衡、结果导向的进路有着
高昂的代价。首先,这种进路允许机器化以隐藏的主观性和错误的方式发展。如果某种机器的运用
是倾向于减少“漏判”,政府就有动力以最引人注目的方式来打造它。例如,给欺骗检测贴上“谎
言侦破者”的标签就迎合了美国人的工具崇拜主义。与此同时,在那些揭示机器的内部运行机制会
产生“对其科学复杂性的不信任”风险的地方,16 机器发明者反而可能会有借口将其隐藏在层层硬
件和专有代码之下。在那些程序中,不仅存在随机的机器错误和代码误译,还有程序员和政策制定
者自身关于“哪些科学理论是有效的、哪些数据应该被考虑,以及哪种层面的错误可以被接受”的
隐藏假设。一些看似“机器化”的程序实际上是人类主观判断的产物,即所谓的“幕后人”。例如,
测谎仪和量刑指南为量刑系统提供了“统一性”的虚假外观,但该系统主要是由检察官自由裁量性
的决策所主导的。此外,犯罪行为的许多机械化指标,比如最近尝试制定的“涉毒驾驶法规”本身,
要么是过于简化,要么就是完全缺乏合法的科学依据。但是,如果这些指标能够大大提高起诉的成
功率,或者立法者将成功起诉视为解决紧迫社会问题或应对执法压力的关键,立法者往往会缺乏动
机对这些指标进行仔细审查。另一方面, (DUI alcohol)这个语境为理性的机器证明和责
“醉酒驾驶”
任机制提供了一个可能不甚完善,但却富有前景的模板;鉴于执法部门之外的公共卫生官员在帮助
创建该机制方面发挥的作用,这或许并非巧合。
当然,任何追求减少“漏判”的成功都能带来实质性的公共利益。对发现、控诉和惩罚犯罪能
力的提升,无论是基于功利主义还是基于报应论都具有正当性—这两者传统上都被援引来令惩罚
具有合法性。同时,机器化也确实减少了“误判”;比如说,若无政府对 DNA 分型鉴定的重用, “无
辜者运动”也就不可能存在。然而,政府却经常试图对被告人尝试将 DNA 鉴定用作脱罪工具横加

9
Id. at 80.
10
笔者从以下著作借用了“真相机器”一词,GEOFFREY C. BUNN, THE TRUTH MACHINE: A SOCIAL HISTORY
OF THE LIE DETECTOR (2012).
11
笔者将在本文第一、 (一)部分认真考虑并反驳其他理论,以解释这一差异。
12
See ERIN E. MURPHY, INSIDE THE CELL: THE DARK SIDE OF FORENSIC DNA 98-101 (2015).
13
See infra Section I.D.
14
See infra Section II.C.
15
See Shaila Dewan, Judges Replacing Conjecture with Formula for Bail, N.Y. TIMES, June 28, 2015, at A18 ( 此文讨论了
一种算法,该算法旨在帮助法官根据再犯可能性和潜逃风险来设定保释金的合适数额 ).
16
Jennifer L. Mnookin & Nancy West, Theaters of Proof: Visual Evidence and the Law in Call Northside 777, 13 YALE J.L.
& HUMAN. 329, 363 (2001).
2021年第29卷(第1期)
·91·

阻挠。17 当前形势下,因为机器化而减少的“误判”也时常似乎是偶然,而非系统性的。
认为机器化的这种结果导向的运用存在问题的第二个原因,是它损害了其他的重要制度价值。
美国国家研究委员会最近的一份关于大规模监禁的报告指出,保护公民的“人格尊严”是公正刑
罚制度的一项核心原则。18 关于会威胁到人格尊严的机器的一个典型例证,就是政府使用的“阴
茎体积描记器”—这种机器通过测量受试者的勃起来检测他是否存在病态的性欲。19 我们的司
法制度也声称要认真对待对“公平”的需求(即针对个案特殊情况进行法外考量),将其作为“矫
正”或“完善”正义的一种方式;同样的还有对“仁慈”的需求,即纯粹是出于恩典而非为了诉求
正义而给予宽大处理。20 归责或刑罚的规则涵盖的范围越广,作为“安全阀”的衡平裁量权就越
是重要。21 以司法自由裁量权和陪审团弃法权形式存在的“安全阀”,却由于指标罪名、取消陪审
团审判的“精简”法律、自动执行系统、强制起诉政策和量刑指南等机器证明的权威性质而全部
遭到了损害(或至少是面临压力)。当然,法院和政策制定者如何决定哪些做法违反上述价值,会
因时空变化而各有不同。但是,当机器化主要是被视作为一种减少错误宽大处理的手段时,我们
可以预料,这些价值会因不受重视而遭到折损。
最后,认为机器化的这种或然性进路存在问题的第三个原因,是它往往会导致如下结果:在机
器化本可以减少“误判” (错误定罪和过度惩罚)方面成为强有力消除偏见工具的领域,机器化的实
际水平却很低。例如,我们的司法系统在聚集热情以监督执法机关和某些拥有经济或政治权势的群
体方面一直行动迟缓,而在证人、陪审团和法官的独立判断已然倾向于偏袒政府之处,我们的司法
系统在驾驭专家证人制度方面也是进展缓慢。
虽然本文并不旨在提出一个宏大、统一的有关机器化司法的理论,本文第三部分依然给出了一
套“生物技术”22 原则,以此引导机器化时代的刑事审判制度。首先,它解释说我们有必要破除现
(人类更善于 / 机器更善于)思维,23 转向与医疗和宇航中所用类似的“系统
有的“MABA-MABA”
进路”。24 随后,笔者提出了“人机交互审判”的进路,具体建议包括:确保前端的监管和对抗性保
障措施能够打开“黑箱”程序以进行仔细审查,系统性地考量新机器程序对软价值的影响,以及通
过确保机器化的合理、公平运用,系统性地“审视自动化的缺失”问题。
本文最后提出了关于人工智能和刑事审判未来的一些思考。机器化的兴起可能预示着一场巨
大变革,类似于约翰 · 郎本所总结的,那场由“被告人说话”的审判向“律师主导”的审判的转
变。25 即便它不会根本性地改变我们刑事司法制度的结构,机器化也正在发生,并且正在对刑事

17
See infra Section I.D.
18
NAT ‘L RESEARCH COUNCIL OF THE NAT’ L ACADS., THE GROWTH OF INCARCERATION IN THE UNITED
STATES: EXPLORING CAUSES AND CONSEQUENCES 328 (Jeremy Travis et al. eds., 2014).
19
See infra section II.B. 1.
20
Martha C. Nussbaum, Equity and Mercy, 22 PHIL. & PUB. AFF. 83, 93–94 (1993) ( 此文将亚里士多德的“公平”概念
描述为与“正义”相一致 ); see also infra section II.B.2.
21
See generally FREDERICK SCHAUER, PLAYING BY THE RULES: A PHILOSOPHICAL EXAMINATION OF RULE-
BASED DECISION-MAKING IN LAW AND IN LIFE, at xv (1991) ( 作者认为,规范性规则通常是“概率性的概
括……遵循该规则在特定的情况下会产生次优甚至明显错误的决定”).
22
该术语借鉴自刘易斯 · 芒福德(Lewis Mumford),他用“生物技术”(biotechnic)来描述“以目标为中心的机器
化” ,而不是“以机器化为中心的目标”。See generally LEWIS MUMFORD, THE PENTAGON OF POWER: THE
MYTH OF THE MACHINE, VOL. II (1970) .
23
See, e.g., Sidney W.A. Dekker & David D. Woods, MABA-MABA or Abracadabra? Progress on Human-Automation
Coordination, 4 COGNITION, TECH. & WORK 240 (2002).
24
See generally DAVID A. MINDELL, DIGITAL APOLLO: HUMAN AND MACHINE IN SPACEFLIGHT (2008) ( 作者
论述了太空航行中人机界面的历史 ).
25
See JOHN H. LANGBEIN, THE ORIGINS OF ADVERSARY CRIMINAL TRIAL 48–61, 67-68, 106-10 (2003) ( 作者追
溯了现代“律师主导”的刑事审判模式的历史演变 ).
Evidence Science Vol.29 No.1 2021
·92·

司法制度的许多核心价值产生巨大冲击。无论未来会如何变化,这篇文章旨在将一套话语体系和
一系列问题引入“学界”供讨论,26 以便为进一步研究机器化司法提供框架。

一、机器化刑事审判的非均衡与或然性兴起
本部分对机器化刑事审判的兴起作了综述。笔者认为,这种兴起是不均衡的而且不成体系,主
要取决于制造、部署这些机器的机构和研发人员的需求。特别是,笔者认为,尽管执法者、立法者
以及推动“真相机器”、机器指标和机器量刑机制的利益集团的动机,通常是追求客观性和准确性,
但这种追求却通常是针对特定类型的准确性的,即减少“漏判”。这里所说的“漏判”,包括:未侦
破犯罪、错判无罪,或量刑过轻。为支持上述主张,笔者以仪器、软件和机器指标为例。执法机关
对它们的开发和运用主要是出于如下明确需求,即减少上述“漏判”。随后,笔者以证明、归责和
刑罚的某些机器化形式受到的待遇不均为例,表明执法机关存在如下倾向:当“机器化”减少“误
判”而不是“漏判”时,执法机关会回避“机器化”;而当“人类判断”可能减少“漏判”时,他
们却对其进行美化。
尽管本部分并不旨在对刑事司法中的机器设备进行社会法律史的探讨,笔者确实借鉴了科技研
究领域的学术成果,以表明机器化刑事审判发展的这种不均衡性并不令人意外。在确定什么是(或
不是)道德的、权威的、“合法的专业意见”27 或“好科学”28 方面,制度动力学和学科视角扮演着
关键的角色。由此可想而知,在刑事司法制度中,对于什么是(或不是) “机器”,以及哪些机器是
认知权威的合法来源,答案将取决于“谁”寻求从这种待决的证明、归责和惩罚机制中受益。

(一)机器证言
在过去的 150 年里, 。29 诚然,在现代刑事
“人类感官的重要性”已经让位于“仪器的无声证言”
审判中仍然存在人证,但是“证据法中的科学性仪器”30 和解析式法庭科学软件的兴起,降低了感知
和人证在证明罪行方面的作用。虽然“在 18 世纪,当庭证人证言可能是证明罪行的最佳手段”,31
现在的检察官们却会选择依赖“机械”式的证据—支持者们通常称其为“真相机器” 。32
这些新兴的证据形式极大地提高了对过去事实进行认定的准确性、客观性、精确性和认知能力。
得益于这些技术,现在我们可以更好地获知一个人是否闯了红灯、车祸是否是醉酒造成的,以及强
奸案物证袋中的精液是否属于被告人;而在早些时候,陪审团的事实认定通常是基于目击证人的主
观陈述和存在潜在问题的口供。然而,正如本节所示,执法机关对许多“真相机器”的开发或运用,
是明确将其作为减少“漏判”的一种方式。而当“真相机器”的开发或运用可以提供防范“误判”
的有力手段时(唐娜 · 哈拉维可能称之为“背叛了它们‘以政府为中心’起源的……私生子”)33,

26
MARY POOVEY, A HISTORY OF THE MODERN FACT: PROBLEMS OF KNOWLEDGE IN THE SCIENCES OF
WEALTH AND SOCIETY, at xiii (1998).
27
See JASANOFF, supra note 6, at xiii.
28
Eric Biber, Which Science? Whose Science? How Scientific Disciplines Can Shape Environmental Law, 79 U. CHI. L.
REV. 471, 547 (2012); see also id. at 501-12 ( 作者引用了科技研究领域的成果,这些文章探讨了学科视角和规范性
假设是如何影响气候辩论和其他环境问题中科学主张的提出和评估 ).
29
MIRJAN R. DAMAŠKA, EVIDENCE LAW ADRIFT 143 (1997).
30
See Scientific Gadgets in the Law of Evidence, 53 HARV. L. REV. 282 (1939) ( 此文探讨了法庭对血样检测、呼气酒精
检测、影像技术和测谎仪的兴起所作的回应,并建议,法律不应太热衷于采用尚未得到验证的新兴科学技术 ).
31
WILLIAM J. STUNTZ, THE COLLAPSE OF AMERICAN CRIMINAL JUSTICE 227 (2011).
32
See, e.g., BUNN, supra note 10; MICHAEL LYNCH ET AL., TRUTH MACHINE: THE CONTENTIOUS HISTORY OF
DNA FINGERPRINTING (2008); Cf. Mnookin & West, supra note 16, at 347 ( 它将影像技术称为“真相机器”).
33
Donna Haraway, A Cyborg Manifesto: Science, Technology, and Socialist-Feminism in the Late Twentieth Century, in THE
CYBERCULTURES READER 291, 293 (David Bell & Barbara M. Kennedy eds., 2000).
2021年第29卷(第1期)
·93·

政府却常常加以抗拒,或者对此毫无兴趣。
1. 测谎仪
关于政府使用仪器来侦查、测量或控制犯罪嫌疑人的身体这种现象,现有的研究成果颇为丰
富。米歇尔 · 福柯(Michel Foucault)曾谈到,在 17 和 18 世纪,发生了从政府控制生死向“政府
控制生理”34 的权力转变,其中就包括“权力技术的出现”,以及“以独立个体为中心”并“可以
用于控制身体”的“仪器”。35 随着美英两国的刑罚政策从道德准则转向关注犯罪的自然起因,“治
理的机会—借助管控机制将矛头对准罪犯的躯体和意志”只会增加,不会减少。36 此后,人们发
明了“颅相生理仪”(Phreno-physiometer)—一种号称可以通过测量耳眉夹角来预测犯罪的仪器;
它带有明显的种族歧视性,并且很快就被彻底戳穿了。37“‘犯罪的烙印’可以从身体上明显看出”,
或“犯罪必然是‘反常’的标志,而非正常人的不道德行为”—随着这些观点的逐渐式微,犯罪
学家和心理学家开始质疑与欺骗有关的情绪是否可以被测量。38
在这种背景下,作为谎言侦测器的现代“测谎仪”具有与执法者利益相互交织的起源也就不
足为奇。测谎仪的前身之一是心理学家威廉 · 莫尔顿 · 马斯顿(William Moulton Marston)(“神奇女
侠”的创作者)发明的一种粗糙仪器,它通过测量血液收缩压来评测焦虑。39 但是 1920 年代加州
伯克利市的一名警探约翰 · 拉森(John Larson)首次发表了关于焦虑检测仪如何“可以应用于现实
生活中犯罪”的论文。40 也正是拉森的助理(也是其未来的竞争对手)莱昂纳德 · 基勒(Leonarde
Keeler),为“测谎仪”申请了专利并将其推向市场—警察可以用它来讯问犯罪嫌疑人,而且可以
通过传唤测谎员出庭作证,使得定罪更加稳妥。41 从一种测量物理现象手段的不起眼的起源开始,
测谎仪“逐渐被塑造成了一种关乎真相的技术”。42
可以肯定的是,促进现代测谎仪之发展的伯克利警察“曾希望测谎仪能够让他们如机器一般地
公正执法”。43 其目标是准确地评估受测对象是否在撒谎。但是,人们对这种机器的强烈欲望是源
于这样一种信念,即犯罪嫌疑人是在撒谎,因此可以通过这种新奇的机械化手段予以揭露;而非源
自于另一种直觉,即嫌疑人是被错误指控的,可以通过这种仪器为其洗脱罪名。简而言之,这种欲
望是由对特定的某种不准确性(“有罪的犯罪嫌疑人被错放”)的担忧所驱动的,这种担忧亟需一种
机器化的解决方案。
庭审中,政府将测谎仪的检测结果用作有罪证据的问题在于,如果测谎是强制进行的,那么至
少根据 1930 年代中期就已确立的宪法判例,该测谎结果在庭审中将不具有可采性。44 但是,测谎
仪的威力已经延伸到了法庭之外:警察可以合法地利用测谎仪的威胁,或甚至可就其检测结果撒谎,

34
FOUCAULT, supra note 7, at 240.
35
Id. at 242 ( 它特别指出,这些针对身体的“权力技术” “包括所有用于确保独立个体空间分布的仪器”,这意味着其
“分隔性、对准性、连续性和监视性”).
36
BUNN, supra note 10, at 11 (citation omitted).
37
See id. at 13-14.
38
See id. at 4, 64-65. 邦恩还建议,对这种追求的理解应当结合以下背景:过去的犯罪学家曾试图破译和掌握“女性
的知觉”,尤其是认为女性对疼痛不敏感。See id. at 65.
39
See Adam B. Shniderman, You Can’t Handle the Truth: Lies, Damn Lies, and the Exclusion of Polygraph Evidence, 22
ALB. L.J. SCI. & TECH. 433, 435-37 (2012). See generally Jill Lepore, On Evidence: Proving Frye as a Matter of Law,
Science, and History, 124 YALE L. J. 1092 (2015) ( 此文更广泛地探讨了测谎仪的历史 ).
40
ALDER, supra note 8, at 81.
41
Id. at 126-27, 130.
42
BUNN, supra note 10, at 5; see also Shniderman, supra note 39, at 437 ( 此文记录了基勒在测谎仪的发展过程中所扮演
的角色 ).
43
ALDER, supra note 8, at 106.
44
See, e.g., Brown v. Mississippi, 297 U.S. 278, 285 (1936) ( 本案认为,美国联邦宪法“第十四修正案”关于采纳非自
愿供述的正当程序禁令,可适用于州法院的刑事指控 ).
Evidence Science Vol.29 No.1 2021
·94·

以便获得在法庭上可用的口供。45 因此,无法在庭审中依靠测谎仪的检测结果,对于将测谎仪用作
罪行侦测器来说只不过是一个小小的障碍。
然而,被告人在提供测谎仪检测结果作为无罪证据方面并不受到这种宪法性的约束。在关于测
谎仪之可采性的决定中,自 1923 年开创性的“弗莱伊诉合众国”案开始,刑事被告人就已开始接
受其检测结果是具有真实性的证据;本案中,马斯顿亲自对申请人进行了检测。46 但是,在弗莱伊
案及其后续大量案件中,检察官成功的阻止了测谎仪进入审判程序,理由是其检测结果不仅不可靠,
还会篡夺陪审团决定可信性的角色,47 其模式与神经成像测谎中出现的模式相似。48 即便测谎仪成
为“美国的机器良知”,49 在美国的审判中,测谎仪也会成为“证据弃儿”。50
尽管政府反对在庭审中采纳测谎证据,在定罪后的程序中,政府却广泛地将测谎仪用作有罪证
据。缓刑和假释的裁决部门经常要求被定罪的罪犯接受测谎仪检测,以此作为接受治疗的条件(尤
其是在性犯罪案件中);在假释或缓刑的撤销听证中,他们也经常提供测谎仪检测人员的证言作为
罪犯欺骗行为的证据。51 美国国防部也非常依赖测谎仪,将其用于背景调查和其他关乎国家安全的
敏感问题。52 事实上,道格 · 威廉姆斯(Doug Williams)这位曾公然教人“打败”测谎仪的专家,
最近面对联邦妨害司法罪的指控,就作了有罪答辩。53
执法机关对待测谎仪的这种态度明显不一致,可以通过如下信念来解释:刑事审判的高证明标
准 * 值得我们对该仪器进行更高级别的审查。然而,缓刑或假释的撤销听证会中的可能监禁时间往

45
See, e.g., United States v. Blake, 571 F.3d 331, 346-47 (4th Cir. 2009).
46
293 F. 1013 (D.C. Cir. 1923). 所谓的“弗莱伊检验”成为了许多州法院(以及几乎所有联邦法院)认定新型科学证
据可采性的标准,直到最高法院作出“多伯特案”[Daubert v. Merrill Dow Pharmaceuticals, 509 U.S. 579 (1993)] 裁
决。
47
See, e.g., United States v. Scheffer, 523 U.S. 303, 307 (1998) ( 法院认定,将测谎仪证据排除本身并未侵犯被告人基于
联邦宪法第六修正案的辩护权 ); United States v. Alexander, 526 F.2d 161, 170 (8th Cir. 1975) ( 法院认定,审判法院拒
绝采纳测谎仪的检验结果为证据是正确的,因为测谎仪“目前并没有得到普遍的科学接受,也……没有被证明是
充分可靠的”); Brief for the United States at 26-28, Scheffer, 523 U.S. 303 (No. 96-1133), 1997 WL 367053 ( 作者认为,
测谎仪削弱了法官和陪审团的功能 ); see also Shniderman, supra note 39, at 469-70 ( 作者推测说,考虑到测谎结果
通常是由被告提供,测谎仪的不利地位可能与“法官对控方的尽力帮助”有关 ).
48
类似“No-Lie MRI”这样的公司会提供商业测谎服务。See Henry T. Greely, Law and the Revolution in Neuroscience:
An Early Look at the Field, 42 AKRON L. REV. 687, 698 (2009) (“在美国,至少已有两家公司在出售功能性核磁
共振成像测谎(fMRI-based lie detection)服务”). 神经成像测谎证据已在三起美国案件中被提交过,这些证据
全部是由被告人提出,也全都因可靠性问题而遭到排除。See William A. Woodruff, Evidence of Lies and Rules of
Evidence: The Admissibility of fMRI-Based Expert Opinion of Witness Truthfulness, 16 N.C. J.L. & TECH. 105, 108-09
nn.4-6 (2014) (citing United States v. Semrau, No. 08-10074 Ml/P, 2010 WL 6845092, at *14 (W.D. Tenn. June 1, 2010);
Wilson v. Corestaff Servs., L.P., 900 N.Y.S.2d 639, 642 (Sup. Ct. 2010); Memorandum Opinion and Order, Maryland v.
Smith, No. 106589C (Montgomery Cty., Cir. Ct., M.D. Oct. 3, 2012)).
49
ALDER, supra note 8, at xiv.
50
Witherspoon v. Superior Court, 183 Cal. Rptr. 615, 621 (Ct. App. 1982).
51
See, e.g., Douglas C. Maloney, Lies, Damn Lies, and Polygraphs: The Problematic Role of Polygraphs in Postconviction
Sex Offender Treatment, 84 TEMP. L. REV. 903, 907-08 (2012); DIANE PATRICK ET AL., NAT’L INST. OF
JUSTICE, HOW IS THE POST-CONVICTION POLYGRAPH EXAMINATION USED IN ADULT SEX OFFENDER
MANAGEMENT ACTIVITIES? 39-40 (2000); Paula Reed Ward, Lie Detector Tests Being Used to Monitor Sex Offenders
and Guide Treatment, PITTSBURGH POST GAZETTE (May 17, 2015, 12:00 AM), http://www.post- gazette.com/news/
state/2015/05/17/Lie-dete/stories/201505030109 ( 它指出,罪犯可能因未参加测谎而被撤销缓刑 ).
52
See Scheffer, 523 U.S. at 318 (Kennedy, J., concurring).
53
See Drake Bennett, Man vs. Machine: The True Story of an Ex-Cop’s War on Lie Detectors, BLOOMBERG BUS. (Aug. 4,
2015), http://www.bloomberg.com/graphics/2015-doug-williams- war-on-lie-detector/.
*
译者注:此处的原文为 burden of proof(证明责任),但结合上下文,作者可能想说的是 standard of proof,即“证
明标准”。
2021年第29卷(第1期)
·95·

往比许多审判中的还要长。此外,如果如 1998 年“合众国诉谢弗”案中它劝说联邦最高法院的那


样,政府真的相信,测谎仪的准确率“比掷硬币好不到哪儿去”,54 人们会希望政府完全不去使用
这些测谎仪,更不要说在有高风险的情况下。
这种不一致,也可以通过检察官希望维护陪审团自身作为“测谎者”的角色来解释。但是,无
论其价值如何,法官和审后程序中的假释委员会也都将复杂的人为判断带入了其可信性决断。此外,
政府有时会协定采纳测谎仪结果,允许陪审团在这些案件中得到该机器的协助。55 考虑到陪审团在
决定可信性方面的能力不足, “测谎仪会过度干涉陪审团决定可信性的角色”这个令政府兴致勃勃的
56
论点,似乎也有些奇特。 事实上,陪审团只是(刑事司法)系统的“测谎者”,是因为在认识到
宣誓不能可靠的保证证言真实性之后,我们别无选择,只能在“陪审团评议”这个既便利又神秘莫
测的“黑箱”中寻求庇护,以维持判决的合法性。57 无论如何,正如本文第二、 (三)部分所论,法
院对于测谎仪是一种“机器审判”的一再担忧,尽管是可以理解的,但是应予以重新审视。
2. 影像证据
1839 年,当银版摄像术(Daguerreotype)
(摄影的前身)被发明时,美国公众的反应主要是对这
项具有破案潜能的“真相机器”新技术进行庆祝。58 当年报纸上的一篇文章感叹: “那些可怜的小偷
啊,当他们看到自己在作案现场行窃时的影像竟被作为证明其有罪的证据呈上法庭,他们会变成什
么模样!”59
此后不久,一些国家的执法机关就迫不及待地开始使用照片证据。60 虽然通过身体测量来研究
犯罪和识别个体的生物识别技术要早于摄影,但是这种新型摄影媒介的出现,使得我们能够对罪犯
和那些被视为可能犯罪的人群进行前所未有程度的审查和监视。用福柯的话来说就是,正如身体测
量技术是一种通过“规训的权力”进行政府控制的方式,监视技术(包括生物识别技术)使得政府
能够通过“生物权力技术”来“规制” “人的多样性”。61 因此也就不必惊讶,从 19 世纪开始,警察
部门就在收集“流氓画廊” (也就是已知罪犯的照片)—这不仅仅是为了追踪罪犯,并暗中将他们
视为新犯罪的罪魁祸首,同时也是作为拟人化研究的基础,以求识别出犯罪的明显表现。62 作为法
医生物识别鉴定之父,阿尔方斯 · 贝蒂隆(Alphonse Bertillon)就是一名警方摄影师,他推广了“罪
犯档案照片”和犯罪现场摄影技术。63
如今在美国,影像证据是进行监控和犯罪侦查的一种主要工具。在城市中,摄像头无处不在,
用来捕捉和起诉犯罪甚至低层级的违法行为。64 红灯摄像机录像被用于犯罪侦查,它会生成可以搜
索特定物体、面孔或车牌照的监控录像。65 例如, “阿维斯塔智能传感器” (Avista Smart Sensor)就使
66
用“机器学习” 技术,基于数千个变量对监控录像进行分析,并在其认为有犯罪发生时向警方报
54
Scheffer, 523 U.S. at 310 (citation omitted).
55
See Shniderman, supra note 39, at 442.
56
See George Fisher, The Jury’s Rise as Lie Detector, 107 YALE L.J. 575, 578-79 (1997).
57
See id. at 578-79 ( 作者认为,刑事司法系统通过让陪审团充当“测谎者”,来“保护其自身的合法性”).
58
See Mnookin & West, supra note 16, at 347.
59
New Discovery in the Fine Arts, NEW YORKER, Apr. 13, 1839, at 49 (citation omitted).
60
See SIMON COLE, SUSPECT IDENTITIES: A HISTORY OF FINGERPRINTING AND CRIMINAL IDENTIFICATION
20 (Harvard Univ. Press 2002).
61
FOUCAULT, supra note 7, at 242, 247.
62
See, e.g., COLE, supra note 60, at 20-22.
63
See Most-Wanted Photography, ECONOMIST, Feb. 7, 1998, at 115.
64
See, e.g., Steve Henn, In More Cities, a Camera on Every Corner, Park and Sidewalk, NPR (June 20, 2013, 7:07 AM),
http://www.npr.org/sections/alltechconsidered/2013/06/20/191603369/The-Business-Of- Surveillance-Cameras.
65
See, e.g., Memorandum from Oakland Police Dep’t to Office of the City Adm’r on Red Light Camera Enforcement Sys.,
City of Oakland Agenda Report, at 1 (Nov. 10, 2009) (on file with author) [ 以下简称“OPD 备忘录”].
66
“机器学习”是指“有能力随着时间‘学习’或改进其在某些任务中的表现的电脑算法”。Harry Surden, Machine
Learning and Law, 89 WASH. L. REV. 87, 88 (2014).
Evidence Science Vol.29 No.1 2021
·96·

告。67
当然,监控和影像文件对侦破犯罪能力的这种提升,对于事实认定的准确性和客观性来说在许
多方面都大有裨益。但是再一次,政府希望通过使用影像技术来提高准确性和客观性的愿景,虽然
值得称赞,其主要的关注点却是减少“漏判”,而非减少“误判”或凸显执法机关自身的不端行为。
因此,
“热点”监控和红灯摄像机往往集中在犯罪高发区域,以便最大限度地提高发现犯罪的可能性。
虽然犯罪高发区域的“热点”监控录像有时也会导致被告人脱罪而不是被指控,68 但这些脱罪的小
插曲却不过是国家监控的副产品,而非其目的。此外,行车记录仪和警察执法记录仪的摄影录相,
既可以令被告人脱罪,也可以令其被指控(也还可以暗示国家工作人员存在不端行为);然而,这
主要是在犯罪被害人和被告人的持续倡议下,警察部门才开始使用执法记录仪和行车记录仪。69 同
样,被告人维权团体进行了旷日持久的诉讼,也才做到要求警察部门对讯问犯罪嫌疑人进行录像;
例如,直到 2014 年之前,FBI 一直都“抵制对认罪供述和面谈过程进行录制”。70
在此,笔者既不是要主张说,如果我们的目标是通过公共监控来侦查犯罪,那么关注犯罪高发
区域是不合理的;也不是要主张,对所有的 FBI 犯罪嫌疑人的面谈过程进行录像必然是一项好政策。
相反,笔者的主张只是,影像证据作为一种机器化(或至少表面上是机器化的 71)的证据形式,执
法机构对它的运用主要是出于渴望减少某种特定类型的不准确性,即“漏判”。
3. 醉酒检测仪
就像其他许多仪器那样,美国执法机关寻求一种通过驾驶者的呼吸来检测其醉酒状况的机器,
也是由对“漏判”的担忧(即司机醉驾而未被检出,也未受到惩罚)所驱动。在 1940 年代之前,
在醉酒驾驶案件中,警方很难仅依据一名警官关于司机醉酒情况的主观证言来确保定罪。72 在呼气
检测法之前,警方曾尝试过创制“清醒程度现场检测”形式的醉酒情况“机器”检测方法,比如倒
背字母表和单腿站立。但是,这些检测方法的“漏判率”很高,有些醉酒驾驶者完成的很出色。73
而尽管化验师已经开发出了“血液酒精检测法”,由于需要医生的协助,其在执法中的使用很有限。
正是那些执法领域的人,例如尸检化验师、警方顾问和兼任发明家的警察,会开发并生动地给最初

67
See, e.g., Digital Justice, Digisensory Technologies Avista Smart Sensors, YOUTUBE (Sept. 14, 2012), https://www.
youtube.com/watch?v=JamGobiS5wg [https://perma.cc/J8T4-97VN].
68
See, e.g., Joshua Sabatini, San Francisco’s Crime Cameras Zoom in on the Innocent, S.F. EXAMINER (July 8, 2011),
http://www.sfexaminer.com/sanfrancisco/san-franciscos-crime- cameras- zoom-in-on-the-innocent/Content?oid=2177815
[https:/ /perma.cc/5DJB-SJM2]( 据报道,在“热点”城市监控录像显示该男子当时是正在帮助一名残疾妇女后,政
府撤回了对他提起的杀人罪指控 ).
69
尽管现在有许多警察工会支持使用摄像机作为保护警察免受虚假的滥用职权控告的手段,政府自身却并不像其
布设大规模公共监控时那样努力。在 1980 年代人们开始买得起移动录像机之后,“妈妈反对酒驾”组织旋即开始
为警察巡逻车购买行车记录仪,以便于更容易的起诉酒后驾车。See LILIAN DRAISIN, UNIV. CENT. FLA., PUB.
ADMIN. DEP’T, POLICE TECHNOLOGY: AN ANALYSIS OF IN-CAR CAMERAS AND BODY WORN CAMERAS
6 (2011); INT’L ASS’N OF CHIEFS OF POLICE (IACP), THE IMPACT OF VIDEO EVIDENCE ON MODERN
POLICING: RESEARCH AND BEST PRACTICES FROM THE IACP STUDY ON IN-CAR CAMERAS 5 (William
Albright et al. eds., 2004).
70
Carrie Johnson, New DOJ Policy Urges Agents To Videotape Interrogations, NPR (May 21, 2014, 6:49 PM), http://www.
npr.org/sections/thetwo-way/2014/05/21/314616254/new-doj-policy-calls-for-videotaping-the-questioning-of-suspects
[https://perma.cc/GK5E-XKQ3].
71
在本文第二、 (一)部分,笔者认为,影像证据(包括对犯罪嫌疑人的录像),就是易受人为操控和隐藏的主观性
影响的“假机器”的一个实例。
72
See Andrea Roth, The Uneasy Case for Marijuana as Chemical Impairment Under a Science-Based Jurisprudence of
Dangerousness, 103 CAL. L. REV. 841, 849-50 (2015).
73
See id. at 850.
2021年第29卷(第1期)
·97·

的呼气检测仪命名,1938 年为“醉酒程度检测仪”,1954 年为“呼气分析仪”。74 从出现的那一刻


起,这些仪器就被誉为“真相机器”。1955 年,
《大众科学》杂志激动的评论道: “通过分析驾驶员呼
出的气体,科学仪器可以告知警察该名驾驶员的醉酒情况,警方凭直觉和‘走直线’的老式方法正
在被取代!”75 此后,正是因为能够侦测出程度虽低但仍然具有危险性的血液酒精浓度,呼气检测
仪无疑挽救了成千上万的生命。
如果呼气检测结果显示血液酒精浓度低或者为零,呼气酒精检测仪也可能导致被指控为醉驾
的司机脱罪;一些州也赋予被指控为公开醉酒 * 的被告人权利,可以请求在其被逮捕后的两小时内
进行“化学检测”。76 当然,依据传统的醉酒驾驶法或公开醉酒法,对于低血液酒精浓度的嫌疑人,
警察依然可以选择进行逮捕,检察官也依然可以选择进行指控。77 尽管在 1930 年代,公共卫生官
员建议各州对低血液酒精浓度创设“驾驶能力无减损(或未醉)”的法律推定,然而到现在还没有
哪个州这样做。78 将低血液酒精浓度的人指控为醉酒驾驶,可能存在完全合理的理由,例如检测存
在延迟,或有理由相信该司机缺乏在任何饮酒状态下驾驶的经验。但是,这种对“驾驶能力受损
(或醉酒)”的个体化、非机械化判定,只会在单一方向上起作用,即指向检控。而与此同时,被害
人群体和被告人对于在醉酒驾驶案件中用警察行车记录仪和执法记录仪来补强检测结果的要求,几
十年来却一直未能得到满足—直到最近。79
相对于测谎仪的情况,政府对呼气醉酒检测仪的科学性权威(甚至在脱罪方面)所作的间歇性
让步简直令人惊奇。正如下文更为详细探讨的,通过诉讼以及管控检测条件的法定保障措施、监管
保障措施,呼气检测仪在其可靠性方面同样受到了重大(虽然并不必然充分)的审查。对呼气检测
仪进行高级别审查的一种潜在解释可能是,与那些被控为其他犯罪的被告人相比,醉酒驾驶的被告
人群体享有相对的社会特权;更具体地说就是,酒精倾向于是中产阶级和上流社会美国白人所钟情
的精神麻醉品,醉酒驾驶的被告人比一般的刑事被告人更能够引发共鸣。80 不管怎样,稍后笔者将
论证,对于以透明、可靠的方式利用科学来提高事实认定和归责的准确性来说,酒驾案例在特定的
有限层面上是一个不错的模板。
4. DNA 分型鉴定
正如前司法部长约翰 · 阿什克罗夫特(John Ashcroft)在 2002 年所言,DNA 分型鉴定是“执

74
最早的呼气检测仪是由芝加哥的一位“尸检化验师” (Coroner’s chemist)发明的。See id. at 853.“醉酒程度检测仪”
(Drunk-O-Meter)是由罗拉 · 哈格尔博士(Dr. Rolla Harger)发明的,他是印第安纳波利斯的一名生物化学家和
警察顾问;而“呼气分析仪”(Breathalyzer)则是 1954 年由一名前警官和业余科学家罗伯特 · 博肯斯坦博士(Dr.
Robert Borkenstein)发明的。See id. at 853, 861.
75
Joseph Dorlaque, New Machines Get Drunks Off the Road, POPULAR SCI. MONTHLY, Oct. 1955, at 166.
*
译者注: “公开醉酒”(Public intoxication,也称 public drunkenness)是一种酒精犯罪。在公共场所醉酒可以被指控
为公开醉酒,即使其他人不在场,或已达到法定饮酒年龄。参见:https://www.legalmatch.com/law-library/article/
what-is-public-intoxication.html(最后登陆时间:2020 年 11 月 01 日)。美国各州关于公开醉酒行为的立法各有不
同,例如,加利福尼亚州刑法典将公开醉酒行为定性为“轻罪”,参见 CAL. PENAL CODE § 647(f) (West 2014);
在印第安纳州,公开醉酒是 B 级轻罪,最高可处 180 天监禁,并处 1000 美元罚款,参见 IN. ANN. CODE § 7.1-
5-1-3;而明尼苏达州则并未将其规定为犯罪,参见 Minnesota Statute 340A.902。
76
See, e.g., IOWA CODE § 123.46(3), (4) (2011).
77
See, e.g., CAL. VEH. CODE § 23152(a), (b) (West 2014).
78
See Roth, supra note 72, at 859.
79
See supra text accompanying note 69; see also Patrick Moore, Smile... You’re (Probably Not) on Camera, WINNEBAGO
CTY. BAR ASS’N NEWSLETTER, Mar. 2010, at 18-19 ( 作者强调,在醉酒驾驶案件中,辩护律师对提交摄像机录
像的要求没有得到理会 ).
80
See, e.g., Roth, supra note 72, at 846-47.
Evidence Science Vol.29 No.1 2021
·98·

法的真相机器,它通过识别有罪之人和使无辜者脱罪来维护正义”。81 毫无疑问,与主要是在执法
背景下发展起来的法庭科学门类(如工具痕迹分析和指印分析)相比,DNA 具有相对令人印象深
刻的科学基础。82 在侦破犯罪 83 和保护无辜者 84 方面,它具有前所未有的力量。而关于 DNA 确定
性的言论,也导致“广泛的公众意见认为 DNA 的检测结果是决定性的”。85
DNA 技术已经得到了政府的积极利用和认可,被政府用作侦查和成功起诉犯罪的准确而可靠
的手段;同时,它也将大量人口置于永久的基因监测之下。但是,作为一种使无辜者脱罪的手段,
政府对它的利用和认可却没有如此积极。例如,当被告人申请对政府决定不检测的那些生物检材进
行检测,并请求 FBI(它运行着 CODIS* 国家罪犯数据库)通过 CODIS 运行 DNA 图谱结果,以检
验是否另有犯罪嫌疑人与之匹配时,FBI 通常以没有法院令状而拒绝。86 FBI 也拒绝了许多独立研
究人员想要匿名访问 CODIS,以检验该数据库所报告的匹配统计数据的准确性的请求—这些数
据因错误地解释各种遗传标记的频率而饱受批评。87 许多检察官还抵制“无辜者保护法案”,该法
案允许大多数州的被告人坚决要求对生物检材进行留存或检测。88 在一些口供或目击证人辨认存疑,
而决定性的 DNA 证据被提交用于排除被告人作案嫌疑的案件中,检察官则倾向于拒绝无罪释放,
相反,他们却会依据勉强的“巧合”理论来对 DNA 证据进行解释。89 证明“DNA 证据的所谓绝对
可靠不过是一个巧妙编造的‘真相’”90 的最佳证据,就是当该证据与有罪的案情不符时,政府有
多大的意愿去否决 DNA 的权威。
最近,政府开发了一种新工具来减少 DNA 分析中的“漏判”,即 DNA 混合物解析概率软件。
由于 DNA 分型方法的进步,犯罪现场的少量 DNA 和部分降解的 DNA 也可以被发现、放大及检测
了。这种新功能的缺点是,DNA 混合物变得更难解析了。例如,某个特定的 DNA 标记或“等位
基因”91 在被告人的 DNA 中存在,但是在从犯罪现场发现的刀子上提取的 DNA 混合物中却没有,
这个事实可能意味着被告人并非该混合物的来源。又或者,这也可能意味着被告人是该 DNA 混合
物的次要来源,但是其 DNA 含量过低,或者已经过度降解,以至于有一个或更多的等位基因已经

81
Press Release, John Ashcroft, U.S. Att’y Gen., U.S. Dep’t of Justice, DNA Initiative (Mar. 4, 2002) (transcript available at
http://www.justice.gov/archive/ag/speeches/2002/030402newsconferncednainitiative.htm [https://perma.cc/88ZJ-SJA3]).
82
See generally NAT’L RESEARCH COUNCIL OF THE NAT’L ACADS., STRENGTHENING FORENSIC SCIENCE IN
THE UNITED STATES: A PATH FORWARD (2009) ( 此报告论述,这些学科大多都无法独立于它们的执法根源 ).
83
据 FBI 统计,超过 210,700 件调查通过使用 DNA 罪犯数据库得到了“协助”。 See Combined DNA Index System
(CODIS): National DNA Index (NDIS) Statistics, U.S. FED. BUREAU OF INVESTIGATION, www.fbi.gov/about-us/lab/
biometric- analysis/codis/ndis-statistics [https://perma.cc/L6GR-GH6T] (last visited Jan. 24, 2016).
84
自 1989 年 以 来, 美 国 已 有 超 过 300 名 被 定 罪 的 被 告 人 借 助 DNA 检 测 得 以 公 开 宣 告 无 罪。See INNOCENCE
PROJECT, www.innocenceproject.org [https://perma.cc/ZE3U-JXRD](last visited Jan. 24, 2016).
85
Jay D. Aronson & Simon A. Cole, Science and the Death Penalty: DNA, Innocence, and the Debate over Capital
Punishment in the United States, 34 LAW & SOC. INQUIRY 603, 617 (2009) (citation omitted).
*
译者注:Combined DNA Index System,DNA 联合索引系统。
86
See Andrea L. Roth & Edward J. Ungvarsky, Data Sharing in Forensic Science: Consequences for the Legal System, 2009
JOINT STATISTICAL MTG., AMER. STATISTICAL ASS’N 469, 473.
87
D.E. Krane et al., Letter to the Editor, Time for DNA Disclosure, SCI., Dec. 18, 2009, at 1631.
88
See, e.g., Nancy Marion & Marvin Zalman, Towards a Theory of Innocence Policy Reform, in CONTROVERSIES IN
INNOCENCE CASES IN AMERICA 175,184 (Sarah Lucy Cooper ed., 2014).
89
See generally Andrea Roth, Defying DNA: Rethinking the Role of the Jury in an Age of Scientific Proof of Innocence, 93
B.U. L. REV. 1643 (2013) ( 此文讨论了几起类似案件 ).
90
See JASANOFF, supra note 6, at 56.
91
在法医 DNA 分析中,分析人员关注的是研究对象基因链上的位点,这些位点在人类群体中变化很大。在每个
位点上,他们对特定遗传密码的重复次数进行计算;重复的次数就是个体在该位点上的“等位基因”。See Erin
Murphy, The Art in the Science of DNA: A Layperson’s Guide to the Subjectivity Inherent in Forensic DNA Typing, 58
EMORY L.J. 489, 495 (2008).
2021年第29卷(第1期)
·99·

“脱离”。92 这些判断至关重要,因为它们意味着报告两个样本是“匹配”还是“不匹配”的差别。
直到最近,分析人员才作出了这些解释性的决定,并使用一个相对简单的方案来确定一个随机
个体的 DNA 图谱与混合物中的等位基因相一致的概率。但是,决定性的一击(coup de grâce)最终
还是到来了,这就是 TrueAlleleTM 软件(一种“解析 DNA 证据的计算器”93)。TrueAllele 声称要在
复杂混合物的解析方面完全消除人类因素,方法是将等位基因“脱离”的概率包含在内并给出一项
统计数据—“似然比”。 “似然比”就是在给定的“某特定个体是或不是该混合物的来源”的竞争
性假设下,出现该特定等位基因混合物的机率。2009 年,TrueAllele 被用于给一名被告人定罪,这
意味着“自动化的计算机解析结果首次被法院采纳作为证据”。94 此后,它被应用于美国和英国的
大量刑事案件审判;95 而现在,其他几家公司也开发了与之竞争的相似软件。96
可以肯定的是,像 TrueAllele 这样的软件所给出的结果很可能是“无罪”。例如,请思考这样
的案件,被告人的某些等位基因并不存在于 DNA 混合物中,人工方法却错误的假定,由于降解或
其他情况,这些等位基因已经“脱离”了。而另一方面,TrueAllele 可能会正确地解析该混合物从
而排除被告人。但是,软件的结果也可能比老式的人工方法更能使嫌疑人被指控,因为软件所报告
的匹配统计数据的数量级通常远远高于老式的方法。97 在该公司的网站上,几乎所有新闻记录的都
是法院采纳控方提供的该软件解析结果的判决。98
同时,在除 DNA 之外的其他模式化证据的自动专业解释方面,各州却一直进展缓慢。当然,
部分原因可能在于成本。但是,部分原因也可能在于,在各州鉴定人中普遍存在某种情绪,即认为
他们的经验和判断要优于计算机程序。正如一位辩方工具痕迹顾问所言,存在一种“刻板的印象:
杰出的、头发花白之人站在证人席上说, ‘我的观点是基于我在这一领域多年的经验’”。99 专家基于
自身“无以言传的,心灵之眼的判断”来对一项完美的匹配作证。100 在鉴定工具痕迹界,有些人认
为,鉴于他们所受到的培训和经验,人类检验人员在确定检材来源的概率方面可以做得更好: “工
具痕迹专家的意见应当比统计学专家的意见更具份量,尽管统计学专家能够更容易地给陪审团留下
深刻印象—因为数字总是看起来那么科学!”。101
面对鉴定人给出的是“确定被告人就是该模式证据的来源的主观性主张”,而不是“给予陪审
团一个关于‘匹配’的统计学意义上的评估”(相较而言,这可能没那么令人印象深刻!),反而,
正是控方会从中受益。当前,鉴定人员被允许告知陪审团,被告人的枪在子弹上留下的某种痕迹

92
See, e.g., NUFFIELD COUNCIL ON BIOETHICS, THE FORENSIC USE OF BIOINFORMATION: ETHICAL ISSUES
19, 23 (2007) ( 作者讨论了使用少量 DNA 样本的分析技术所存在的问题 ).
93
See TrueAllele Casework Process Overview Video, at 0:04, CYBERGENETICS, May 1, 2013, http://www.cybgen.com/
systems/casework.shtml [https://perma.cc/6EFT-S3VX].
94
See History, CYBERGENETICS, http://www.cybgen.com/company/history.shtml [https://perma.cc/LRD8-3YPA] [https://
perma.cc/J295-L3Q9](last visited Jan. 24, 2016).
95
See, e.g., Newsroom, CYBERGENETICS, http://www.cybgen.com/information/newsroom/page.shtml (last visited Jan. 24,
2016).
96
See MURPHY, supra note 12, at 102.
97
See Mark William Perlin, Inclusion Probability for DNA Mixtures Is a Subjective One-Sided Match Statistic Unrelated to
Identification Information, 6 J. PATHOLOGY INFORMATICS 59, 62 (2015).
98
See Press Releases, CYBERGENETICS, http://www.cybgen.com/information/press- release/page.shtml [https://perma.
cc/78ND-QR96](last visited Jan. 24, 2016).
99
Adina Schwartz, Challenging Firearms and Toolmark Identification-Part One, 9 THE CHAMPION 10, 14 (2008) (quoting
Christophe Champod & Ian W. Evett, A Probabilistic Approach to Fingerprint Identification Evidence, 51 J. FORENSIC
IDENTIFICATION 101, 106 (2001)).
100
Id. at 14.
101
See, e.g., Miguel Descheênes et al., Statistics and Toolmarks Comparisons, 27 AFTE J. 140, 141 (1995).
Evidence Science Vol.29 No.1 2021
·100·

“达到了弹道确定性的合理程度”,或者“足以排除世界上的所有其他枪支”。102 直到最近,指印鉴
定人员仍被允许声称“零误差率”,并断定,因为达到了合理的科学确定性程度,该潜在指印是由
被告人留下的。虽然被告人能够对政府的分析人员进行交叉询问,他们却沦为只能批评该意见是主
观的,而不是直接以更客观的(或许也没那么致命)、概率软件生成的匹配统计数据对其进行反驳。

(二)机器裁决
与机器证据一样, “机器归责”机制的兴起往往与执法机关或利益集团对减少“漏判”的需求有
关。同样,这种需求并非是出于对客观性和准确性的担忧,而是狭隘的针对某一特定类型的不准确
性,即对道德可责行为(morally blameworthy)未能予以指控或定罪的困扰。
两百年前,美国的刑事陪审团在进行定罪时曾经拥有很大的余地来作出复杂的道德决定。普通
法所列出的罪名相对较少,而且只包含那些涉及本质上不道德行为的犯罪。这些罪名具有严格的犯
意要件,要求认定被告人有伤害之故意,或者至少知晓其行为可能引起伤害之后果。这些要件常常
以生动但不精确的方式表述,例如“心灵堕落”、 “邪恶不良”、
“恣意任性”等,这就允许陪审员们在
定罪时能够通盘考虑可责性问题,而不是只抓住“故意的法律定义”等技术性问题。103
然而,在如今的法庭中,被告人被指控的原因不仅包括“非法入侵”,也还包括单纯的“持有
入室盗窃工具”。104 持有枪支的重罪犯所触犯的是严重的联邦犯罪。105 而醉酒驾驶法现在则将单纯
的驾车时血液酒精浓度或其他药物水平达到某一特定值的行为列为犯罪,无需陪审团对其“醉酒”
状态的危险性作任何认定。这些初期的罪名并非没有合法性理论(予以支撑),它们的证成理由与
犯罪预备完全一致。但从本质上说,它们是一种过度包容性的对在惩罚方面犯错的尝试。106
在有些情况下,立法者则以效率为由完全的取消了陪审团。具有高度可确定性的要件以及没有
严格的犯意要件的现代犯罪,例如未经法律授权进入某建筑物,通常会被起诉为轻罪或低级重罪。
有些司法辖区通过取消对这些犯罪的陪审团审判,已经“简化”了他们的刑法典。107 至少有一位学
者已经呼吁取消醉酒驾驶案件中的陪审团审判,并明确的指出其所担忧的是陪审员的“宽容”。108
如今,在交通案件方面已经有了完全自动化的法律机制,这消除了事实认定者施以任何法外恩惠的
能力。109 红灯摄像机虽然可能会挽救生命和节省金钱,也可能最终体现出是一项很好的政策,但它
们无疑会优先考虑效率,并在过度惩罚方面出错。
事实上,基于指标或基于规则的归责在现代社会中的扩张是如此广泛,以至于一些学者将其与
大规模监禁的增加联系在一起。正如乔纳森 · 西蒙(Jonathan Simon)所说:

如果说普通法审判的运作曾经像殖民地时期的燧发枪那样,开火时如果离得足够近将
一击致命,但是准确性差,而且通常是单发,那么现代美国刑事诉讼程序的运作就更像是

102
See, e.g., United States v. Diaz, No. CR 05-00167 WHA, 2007 WL 485967, at *13-14 (N.D. Cal. Feb. 12, 2007); see also
Commonwealth v. Pytou Heang, 942 N.E.2d 927, 929, 945 (Mass. 2011) ( 法院认可了工具痕迹专家使用这种措辞向陪
审团解释的做法,认为这是一种可接受的专家“基于经验的主观意见”).
103
See STUNTZ, supra note 31, at 303.
104
See, e.g., CAL. PENAL CODE § 466 (West 2008).
105
See 18 U.S.C. § 922(g)(1) (2012).
106
See 1968 REPORT, supra note 2, at 122.
107
See, e.g., Omnibus Criminal Justice Reform Amendment Act of 1994, 1 D.C. Law 10-151, 41 D.C. Reg. 2608 ( 它将各种
低级别罪行的法定刑期从一年降低到了 180 天,以便不再触及任何要求陪审团审判的法定权利或宪法权利 ).
108
See Adam M. Gershowitz, 12 Unnecessary Men: The Case for Eliminating Jury Trials in Drunk Driving Cases, 2011 U.
ILL. L. REV. 961, 971-76 (2011) ( 作者通过展示统计数据来支持如下发现,即在醉酒驾驶案件中,陪审团往往比法
官更为宽容 ).
109
See infra section II.B.2.
2021年第29卷(第1期)
·101·

一架全自动机关枪,检方能够用它来喷射火力,其威力几乎足以压制任何抵抗。110

利用指标罪名(proxy crime)来压制抵抗的最戏剧性的历史事例,或许是 1723 年的“黑匪法”


(Black Act of 1723)*。当时,后封建时代英格兰的英国贵族和乡绅们发现自己陷入了与当地人的土
地纠纷;这些当地人大多是穷人,他们声称有权在当地的林地上狩猎和放牧。一些当地人开始在夜
间化装打猎。为了严厉打击这些滋扰者,英国议会给“在森林中头戴黑色面具,同时携带武器”的
行为创设了一项“罪名”,并可以判处死刑。111
基于指标的刑事责任的扩张,也可以视作政府对刑罚合法性的证成从“道德评判”向“降低
风险”转变的一部分。这种转变可能具有减轻某些惩罚或将某些形式的惩罚去合法化的效果,但是
效果也可能是将刑事责任扩大到其传统范围之外。福柯提出的“生理政治学”的一个方面,即是
当代通过“规制生命”对政府控制的巩固,其中包括旨在“通过消除事故来改善生活”的政府干
预—对此,他指出,“在警察这样的机构中,很容易呈现出中央集权的特色”。112 詹姆斯 · 斯科特
(James Scott)同样论述了政府进行“大幅度简化”的倾向,即,在尝试通过涉及测量和排序的方
法来进行社会工程时,将一个复杂的社会问题进行计划周密的过度简化。113 以此,各州隔离出了容
易衡量的“单独的工具性价值因素”,而忽略了那些更为复杂的因素或驯化不足的知识形态。驯化
(domesticated)的过程越是“复杂难懂”,前述简化就越成问题。114
政府在刑法中运用此类指标来减少“漏判”和提高效率,这与一种更为普遍的简化模式相契合,
即将“法律决策”简化为“可确定的要素”。这种方式着眼于效率和准确性,但存在过度简化或强
化现有偏见的倾向。在行政法语境中,对于现在的各政府机构来说, “即便当有着强烈的实体法理由
支持使用更细致的方法时,它们也愈加倾向于采用由简单问题和答案组成的易于转换为代码语言的
政策”。115 一位人工智能辅助法律推理方面的评论员表示担忧,“立法者可能会考虑制定更多的正式
规定,并确定那些以前不太确定的法律领域,以使计算机可以处理这些问题”。116 而关于使用精算
数据来确定哪些嫌疑人应被截停、搜身,或哪些罪犯应被予以严厉惩罚,学者们警告说,这种“精
算正义”模型其实是自我循环的:仅仅是统计数据的存在,就足以诱使刑事司法人员选择“更适合
预测”和测量的侦查手段和惩罚模式。117

110
Jonathan Simon, Uncommon Law: America’s Excessive Criminal Law & Our Common-Law Origins, 143 DAEDALUS
62, 67 (2014); see also STUNTZ, supra note 31, at 303.
*
译者注: “黑匪法” (英格兰古法) ,是 1722-1723 年通过的一项法令,因其用以镇压在埃塞克斯郡沃尔瑟姆(Waltham,
今“埃平” (Epping) )森林附近出没面部涂黑的匪徒而得名。这伙匪徒将面部涂黑或在其他形式的伪装下,猎杀森林
的鹿,抢劫兔场、鱼塘和盗伐林木,并进行其他犯罪活动。该法将这些罪行定为重罪,教士对该项罪名亦不享有豁
免权,并规定了对受损财产所有人的赔偿金额数。该法于 1827 年废止。其所针对的犯罪者被称为“沃尔瑟姆黑匪”
(Waltham Blacks) 。参见 薛波主编: 《元照英美法词典》 ,法律出版社 2003 年版,第 155、1411 页。
111
See E. P. THOMPSON, WHIGS AND HUNTERS: THE ORIGIN OF THE BLACK ACT 188-89, 192 (1975) (“‘黑匪法’
给这些人赋予了前所未有的法律权力—他们没有笼统的、受托于他人的利益,例如维持秩序,或维护他们自身所
属阶级的特权,但是在给滋扰他们的人定罪方面有着直接的个人利益。”).
112
FOUCAULT, supra note 7, at 247-50. Cf. Jonathan Simon, Driving Governmentality: Automobile Accidents, Insurance,
and the Challenge to Social Order in the Inter-War Years, 1919 to 1941, 4 CONN. INS. L.J. 521, 559–60 (1998) ( 此文探
讨了车祸对国家秩序和治理的挑战,并论述了车辆限速法富有争议的兴起 ).
113
See JAMES C. SCOTT, SEEING LIKE A STATE: HOW CERTAIN SCHEMES TO IMPROVE THE HUMAN
CONDITION HAVE FAILED 8 (1998).
114
Id. at 21.
115
Danielle Keats Citron, Technological Due Process, 85 WASH. U. L. REV. 1249, 1255 (2008) (citation omitted).
116
Harry Surden, The Variable Determinacy Thesis, 12 COLUM. SCI. & TECH. L. REV. 1, 89 (2011).
117
See BERNARD E. HARCOURT, AGAINST PREDICTION: PROFILING, POLICING, AND PUNISHING IN AN
ACTUARIAL AGE 3 (2007); see generally Malcolm M. Feeley & Jonathan Simon, The New Penology: Notes on the
Emerging Strategy of Corrections and Its Implications, 30 CRIMINOLOGY 449 (1992) ( 此文描述了刑罚学从“经验
性、报复性的判断”向“概率性、精算性的评估”的转变 ).
Evidence Science Vol.29 No.1 2021
·102·

(三)机器量刑
最后,政府对机器化司法决策的追求,还受到强化惩罚的统一性和合理性这个愿望的驱动—
但这通常是在某个特定的方向上,即避免不适当的从轻处理。在当代追求确定且统一的量刑运动之
前,法官在立法机关所设定的法定最高刑范围内,通常享有广泛的自由裁量权,可以依照传统的刑
罚目的作出判刑。118 法官们会作出一个刑期跨度宽泛的“不确定”的量刑,从而将是否在刑期满之
前释放罪犯的决定下放给假释委员会。119
1984 年,联邦系统中这种自由裁量权的时代结束了;当时,国会通过了“量刑改革法案”,废
除了联邦假释制度,并成立了量刑委员会来发布法官在作出“确定性”量刑时必须遵守的强制性指
南。这些指南形成了一个网格—也就是一套方格,除了少数例外情况,它会根据罪犯的前科记录、
犯罪事实和类似的可确定的输入项,明确地设定量刑。事实上,这个网格机器味十足,联邦官员为
此开发了一套“非智能”计算机程序来执行它们,也就是人们常说的“应用量刑系统”。120 在量刑
委员会的领导下,有 21 个州制定了类似的指南。121 而与此同时,强制最低刑也是联邦和大多数州
的量刑制度的固定要求,可以说同样使法官沦为了“量刑机器”。122
诚然,在美国,量刑的钟摆已经向“复杂判断”这一端略微回摆。这种转变部分是源于,最高
法院认为,如果这些强制性的指南是基于那些并非由陪审团“排除合理怀疑”而认定的案件事实来
确定量刑范围,它们就不具有合宪性。123 此外,这也部分是两党共同推进减轻刑罚,以及对非暴力
的毒品犯罪取消强制最低刑的结果。124 然而,法官们仍在继续循例遵守这些指南。125 甚至在行使
自由裁量权时,许多法官也用精算风险评估工具或“循证量刑”126 来增强或替代其自身决策。依据
“循证量刑”,罪犯会收到一个代表他们再犯风险的数字分数,该分数是基于其前科记录、就业情况
和犯罪环境等变量得出的。
强制最低刑主要是为了减少不当轻罚,这一点似乎是显而易见的。但是,要说量刑指南同样是
基于这种目的,这可能就没那么明显了。在旧制度下,将近一半的联邦罪犯会被处以缓刑,除非并
且直到缓刑被撤销,否则任何监禁期间都会被中止计算。在起草新的指南时,量刑委员会既考虑了
减少获判缓刑的罪犯数量,也考虑到了对于的确受到监禁的罪犯来说,新的确定的量刑范围将不会

118
See STEPHANOS BIBAS, THE MACHINERY OF CRIMINAL JUSTICE 25-26 (2012) ( 作者描述了“量刑法中的真
理” 〔truth-in-sentencing laws〕和假释委员会相关指南的兴起 ). 虽然自 1790 年代以来,国会在一定程度上使用了
强制最低刑,但是从 20 世纪中叶开始,附有强制最低刑的联邦犯罪的刑期长度、适用普遍性和种类多样性才显
著增加。 See U.S. SENT’G COMM’N, REPORT TO THE CONGRESS: MANDATORY MINIMUM PENALTIES
IN THE FEDERAL CRIMINAL JUSTICE SYSTEM 22–31 (2011).
119
See BIBAS, supra note 118, at 25.
120
See generally Eric Simon et al., ASSYST: The Design and Implementation of Computer-Assisted Sentencing, 55 FED.
PROBATION 46 (1991) ( 此文描述了“应用量刑系统”〔the Applied Sentencing System, ASSYST〕以及其在刑事量
刑中的可能用途 ).
121
See generally NEAL B. KAUDER & BRIAN J. OSTROM, NAT’L CTR. FOR STATE COURTS, STATE
SENTENCING GUIDELINES: PROFILES AND CONTINUUM 3 (2008) ( 作者对 21 个州级量刑指南系统作了简述 ).
122
See Lee Anne Fennell, Between Monster and Machine: Rethinking the Judicial Function, 51 S.C. L. REV. 183, 209 (1999).
123
See United States v. Booker, 543 U.S. 220, 220 (2005); Blakely v. Washington, 542 U.S. 296, 296 (2004).
124
例如,德克萨斯州公共政策基金会的“犯罪权利”项目(Right on Crime project)支持的是“保守的刑事司法进
路”,其中包括量刑改革以及对强有力的贫困刑事辩护的自由论证成。See RIGHT ON CRIME, http://rightoncrime.
com [https://perma.cc/6VCA-RT7A](last visited Feb. 17, 2016).
125
See, e.g., Lynn Adelman, What the Sentencing Commission Ought to Be Doing: Reducing Mass Incarceration, 18 MICH.
J. RACE & L. 295, 304 (2013) (“法官们生性谨慎,他们非常重视量刑委员会的建议,即便这种重视态度往往是不
必要的。”).
126
See generally Sonja B. Starr, Evidence-Based Sentencing and the Scientific Rationalization of Discrimination, 66 STAN.
L. REV. 803 (2014) ( 此文对“循证量刑”系统作了描述,并依据宪法和政策对它们进行了批评 ).
2021年第29卷(第1期)
·103·

比类似情况下假释委员会根据旧制度给予罪犯的最终时间更为宽松。用凯特 · 斯蒂斯(Kate Stith)


和何塞 · 卡布拉斯法官(Judge José A. Cabranes)的话来说,即便是“惩罚性”的,这些也都是源
自于“对审判的恐惧”127 的“合理”的选择。然而,正如本文第二部分更充分地讨论的那样,量刑
委员会在尝试将其反对宽大处理的愿望转化为数字时,犯了一个明显的错误。
尽管政府已经接受了强制最低刑、量刑指南和循证量刑,检察官们对于采用减少了(而不是增
加了)监禁的机器化司法决策却反应迟缓。2015 年,一种用于保释决定的精算工具在全国 21 个司
法辖区首次亮相,该工具描述了 10 种常见的风险因素—基于研究人员对超过 500,000 个案件的
研究,这些因素被视为再犯或潜逃的最佳预测因子。128 值得注意的是,该工具没有选择依据“法官
和检察官通常认为与保释相关”的那些因素,包括就业状况、社群关系和药物滥用史。129 该工具
也并非由执法机关资助,而是受资助于一个私人基金会;该基金会认为,在审前,有太多的对中低
级罪犯的拘留是毫无必要的。一位对该程序“最初持怀疑态度”的人士—北卡罗莱纳州的一名检
察官,惊喜地发现,经过为期一年执行该程序的试验后,监狱中的人数大幅减少了,而且没有造成
“不良影响”。130

二、机器化愿景的落空
第一部分探讨了刑事司法机器化是如何以一种不平衡的方式出现,并反映着执法机关、利益
集团和立法者对减少特定的某种不准确性(即“漏判”)的关注。本部分认为,这种不平衡的进路
已经可以预见会导致三个问题: (1)
“黑箱”程序中隐藏的主观性和错误,被错误地贴上“人类”或
“机器”的标签;(2)尊严、公平和仁慈等“较软”但至关重要的价值受到损害;以及,讽刺的是,
(3)在机器化更为公平的运用本可进一步提高准确性和客观性的那些领域,机器化的程度却很低。

(一)隐藏的主观性与错误
1. 黑箱
如果刑事司法人员使用“机器”(字面上或比喻的)的主要目的是减少“漏判”,而且机器能够
成功的做到这一点,那么司法人员就有动力去提升这种机器的认知权威。这种激励机制的体现之
一,就是用彰显其优点或机器客观性的名称来为犯罪侦查设备命名—“醉酒程度检测仪” (Drunk-
O-Meter)、
“呼气分析仪” (Breathalyzer)、
“酒精浓度检测仪 8000”
(Intoxilyzer 8000)、
“‘真’等位基因”
(TrueAllele)。这些花哨的小玩意无疑会迎合美国人的“工具崇拜主义”。131 事实上,这种崇拜主义
有着悠久的历史;在过去几个世纪里,对于寻求皇家赞助的数学家来说,发明有趣而且精巧的工具
至关重要;对于天文学和其他数学科学之兴起成为具有“文化威望”的学科来说,同样如此。132

127
KATE STITH & JOSÉ A. CABRANES, FEAR OF JUDGING: SENTENCING GUIDELINES IN THE FEDERAL
COURTS 169 (1998).
128
该工具被称为“公共安全评估”,是由“劳拉与约翰 · 阿诺德基金会”(Laura and John Arnold Foundation)这个非
营利性组织开发的。See Public Safety Assessment, LAURA & JOHN ARNOLD FOUND., http://www.arnoldfoundation.
org/initiatives/case- studies/public-safety-assessment-2/ [https://perma.cc/N7VY-WQL4](last visited Jan. 24, 2016);
see also LAURA & JOHN ARNOLD FOUND., DEVELOPING A NATIONAL MODEL FOR PRETRIAL RISK
ASSESSMENT: RESEARCH SUMMARY (Nov. 2013), http://www.arnoldfoundation.org/wp-content/uploads/2014/02/
LJAF-research-summary_PSA-Court_4_1.pdf [https://perma.cc/K7MZ-TD47]( 此文描述了“公共安全评估”这种工具
的起源与发展 ).
129
See Dewan, supra note 15, at A18.
130
Id.
131
BUNN, supra note 10, at 188.
132
POOVEY, supra note 26, at 138-39, 141.
Evidence Science Vol.29 No.1 2021
·104·

然而,机器的权威也可能因其技术复杂性而遭到减损。关于 1948 年黑色电影《反案记》(Call


Northside 777) 对 测 谎 仪 的 刻 画, 詹 妮 弗 · 姆 诺 金(Jennifer Mnookin) 和 南 希 · 韦 斯 特(Nancy
West)在其描述中注意到,对机器图表的特写以及对测谎过程“充满专业术语”的解释, “‘有效地’
拉远了观众与影片明显希望他们予以膜拜的这种机器之间的距离,向观众灌输了一种对测谎仪的科
学复杂性的不信任”。133
许多犯罪侦查设备和软件往往会被包裹在“神秘莫测的黑箱”中,而这些黑箱则“将其工作原
理隐藏”在闪亮的金属装置或计算机代码之下。134 由于有着机器的外观和明显简单的输出,这些
“黑箱”程序也有着“客观性”和“确定性”的虚假外表。它们不仅模糊了“香肠”的制成过程,
还将它们输出的是“香肠”这个东西也变得模糊了。事实上,这些程序都有着隐藏的主观性和错误,
往往不为人所知也未受到检查,从而也潜在地“助长了隐藏在重重镜片和指标背后的不正当、不合
法的歧视”。135
最终,所有机器都是“有着严格预设结果的有目的的组织”,136 根据人类操作员输入的数据或
材料来执行人类程序员的指令。因此,它们反映的是其创造者的事实假设和价值选择。对机器的理
解需要认识到, “人类意图、计划和假设总是内置其中”137。即便是一个简单的数据列表也可以解释
为,它“体现了关于‘应当计算什么,如何理解客观现实,以及量化是如何有助于系统地了解世界’
的理论假设”。138 环境法学者曾写过“科学字谜”的问题(即试图以纯科学的方式作出实际上涉及
价值选择争议的决策)139,以及尽管环境模型看似客观,但其中却嵌入了对人类行为或环境恶化对
经济增长影响的主观假设。140 甚至在“机器人道德”这个涉及机器依据数千种因素来作出复杂伦理
“判断”的新兴领域中,141 也是人类在输入这些因素。到目前为止,只有“人”能够解决那个古老
的“道德 101”难题,即“列车长是否应该扳动车闸,以一人之死为代价,换取五人之生命”。142
在刑事司法语境之外,学者们已经认识到了法律中的算法所隐藏的主观性。在信用评分中,
看似客观的“分数”其实是精心挑选的因素的产物,这些因素几乎总是与种族、性别和阶层紧密
相关。143 肯 · 班伯格(Ken Bamberger)指出,在设计用来确保遵守风险管理法规的软件中,可

133
Mnookin & West, supra note 16, at 363-64.
134
NICHOLAS CARR, THE GLASS CAGE: AUTOMATION AND US 163 (2014); see also Omer Tene & Jules Polonetsky,
Judged by the Tin Man: Individual Rights in the Age of Big Data, 11 J. TELECOMM. & HIGH TECH. L. 351, 366 (2013)
(“对隐藏在黑箱中的程序,很难进行审查、质疑和修改。”).
135
Tene & Polonetsky, supra note 134, at 358 (citation omitted).
136
MUMFORD, supra note 22, at 87.
137
DAVID A. MINDELL, OUR ROBOTS, OURSELVES: ROBOTICS AND THE MYTHS OF AUTONOMY 10 (2015).
138
POOVEY, supra note 26, at xii; see also Itiel Dror, Editorial, The Ambition to be Scientific: Human Expert Performance
and Objectivity, 53 SCI. & JUSTICE 81, 81 (2013) (“即使是使用量化和统计工具,人类因素依然扮演着至关重要的
角色……在采样和决定哪些‘数据’可以作为仪器和统计模型的输入方面,也受到动机偏见和期望偏见的高度影
响。”).
139
See, e.g., Holly Doremus, Listing Decisions Under the Endangered Species Act: Why Better Science Isn’t Always Good
Policy, 75 WASH. U. L. Q. 1029, 1035-36 & n.17 (1997) ( 此文认为,濒危物种法案〔Endangered Species Act〕所
授权的“严格科学”,由于未能说明客观“科学”作为一种解决政策争端的手段的局限性,从而引起了“字谜游
戏”。) (citing Wendy E. Wagner, The Science Charade in Toxic Risk Regulation, 95 COLUM. L. REV. 1613 (1995)).
140
See, e.g., James D. Fine & Dave Owen, Technocracy and Democracy: Conflicts Between Models and Participation in
Environmental Law and Planning, 56 HASTINGS L.J. 901, 928-29 (2005).
141
See Robin Marantz Henig, Death by Robot, N.Y. TIMES MAG., Jan. 9, 2015, at MM16.
142
Id.
143
See Danielle Keats Citron & Frank Pasquale, The Scored Society: Due Process for Automated Predictions, 89 WASH. L.
REV. 1, 10-16 (2014) ( 此文批评了自动信用评分系统的“不透明、结果武断,以及会对妇女和少数族群产生不同
影响”).
2021年第29卷(第1期)
·105·

能存在有利于企业自身利益的“自动化偏见”。144 在法律研究中,WestlawNext 算法被认定为具有


“改变法律的潜力”,因为其检索结果会偏离那些“不那么受欢迎的法律先例”并使其“有效地变
得不可见”。145 在投票问题上,学者们记录了重罪排除名单中的错误和种族偏见,而这些名单是在
商业软件的帮助下创建的。146
这种隐藏的主观性在犯罪侦查机器中也很普遍。在用于证明与罪行相关的事实的简单算法中,
例如证明醉酒状况的清醒程度现场检测(比如,倒背字母表),其缺陷或偏见可能相对容易发现。
陪审员可以通过倒背字母表的个人经验(即便是清醒状态下的),来理解这种“现场检测”可能会
出现较高的“误判率”。147 但是,当一个程序涉及多层的自动化或相对难以触及的代码和其他技术
时,人类操作员和事实认定者可能会发现,对这个程序进行有意义的审查本身就是不可能的。
例如,请考虑呼气酒精检测仪。基于红外线技术的“Intoxilyzer 8000”生成的只是一种报告血
液酒精浓度的“打印卡”,148 这使得对其结果进行深入审查非常困难。在俄亥俄州,一个被告人组
织注意到:一方面,这种机器产生了异常高的“周遭环境读数故障”(ambient fail)—当仪器吸入
空气以补偿存在的干扰物质时,这是一种常见的结果;另一方面,这种设备的编程也并不完全正确,
无法区分口腔中残留的酒精和深肺气体中的酒精,因此有可能导致“误判”。149 在尝试对该设备进
行有效性检验后,至少有两个州的官员已经拒绝授权使用该设备,150 俄亥俄州的一个审判法庭也拒
绝在审判中采纳其结果。151
迄今,只有一组诉讼当事人成功获取了呼气酒精检测仪的源代码,而那也还是在政府最初拒绝
公开代码之后依据法院命令得到的。152 在明尼苏达州的一组合并审理案件中,辩方专家组在审查了
“Intoxilyzer 5000”长达 1113 页的代码之后发现,该机器没有包含误差范围,即基于一项人为的高
呼吸量要求,出现错误的“样本不足”读数的可能性;此外,它也未能针对无线电频率和电压突然

144
See, e.g., Kenneth A. Bamberger, Technologies of Compliance: Risk and Regulation in a Digital Age, 88 TEX. L. REV.
669, 676 (2010).
145
Ronald E. Wheeler, Does WestlawNext Really Change Everything? The Implications of WestlawNext on Legal Research,
103 LAW LIBR. J. 359, 368 (2011).
146
See Guy Stuart, Databases, Felons, and Voting: Errors and Bias in the Florida Felons Exclusion List in the 2000
Presidential Elections, 119 POL. SCI. Q. 453, 454 (2004) ( 作者分析了从选民排除名单中产生的大量数据,以“解释
出错的范围、偏见的来源,以及围绕着名单数据用途的党派性”).
147
See BARRON H. LERNER, ONE FOR THE ROAD: DRUNK DRIVING SINCE 1900, at 49-62 (2011) ( 作者讨论了
“清醒程度现场检测”的历史,并指出在早期的程序中普遍存在着错误 ).
148
See People v. Miller, 125 Cal. Rptr. 341, 342 (1975) ( 本案指出,尽管“呼气分析仪” 〔Breathalyzer〕时代的被告人有
权要求保存呼吸样本,这项权利却不适用于“酒精浓度检测仪 8000”〔Intoxilyzer 8000〕,因为该仪器只会生成一
张打印卡 ).
149
See, e.g., Jon Saia, The Inconvenient Truth About the Intoxilyzer 8000 Breath Alcohol Testing Instrument, LAW OFFICES
OF SAIA & PIATT, INC., http://www.888oviohio.com/Articles/OVI- Tests-Evidence/2007/The-Inconvenient-Truth-of-
Standardized-Field-Sob.aspx [https://perma.cc/LS7J-B844](last visited Jan. 25, 2016).
150
See Memorandum from Mark Gwyn, Ass. Dir., Tenn. Bureau of Investigation, on Evaluation of Breath Alcohol
Instruments, to Larry Wallace, Dir., Tenn. Bureau of Investigation (Sept. 18, 2003) (on file with author). 田纳西州有关部
门拒绝推荐将“Intoxilyzer8000”用于本州的检控,因为它在准确测定血液酒精含量方面“未能产生令人满意的
结果”。See also Terrence R. Rudes, Intoxilyzer 8000 (OH-5): What You Need to Know, in OHIO STATE BAR ASS’N,
2012 ANNUAL CONVENTION, TRAFFIC LAW COMM., INTOXILYZER 8000, at § 2.1, § 2.2 (2012) ( 此文指出,
阿拉斯加州已拒绝为“Inoxilyzer 8000”在该州的使用进行认证 ).
151
See Alan Johnson, Judge Finds Breathalyzer Not Scientifically Reliable, COLUMBUS DISPATCH (Aug. 22, 2013, 9:08
AM), http://www.dispatch.com/content/stories/local/2013/08/22/judge-finds-breathalyzer-not-scientifically-reliable.html
[https://perma.cc/T7VW-92SJ].
152
See In re Source Code Evidentiary Hearings in Implied Consent Matters, 816 N.W.2d 525, 529 (Minn. 2012).
Evidence Science Vol.29 No.1 2021
·106·

变化的干扰向操作者发出警告。153
影像证据同样具有隐藏着偏见的可能性。19 世纪的哲学家将照片视为“人类美德……之典范” ,
因为在最佳情境下, “机器可以提供免受意志—蓄意干预—影响的自由” ,而这些干预是“主观性
中最危险的方面” 。 然而,摄影师对镜头或滤镜的选择会极大地影响它所展现的真相版本。155 研究
154

人员发现,录像讯问中“摄影机视角的简单变化” ,就会对庭审的结果产生重大影响。156 红灯摄像机


系统中,代码的准确性决定着任意一段镜头上时间戳的精准度;而正是程序员决定着违章罚款算法的
“宽限期”157 是多长。但是,这些选择也隐藏在专有的源代码中,158 这导致一些公众将限速拍照雷达
和红灯摄像机系统作为“机器审判”进行批判。159
甚至连 DNA 分型鉴定也在各个层面上存在隐藏的错误和主观性。例如,在报告样本中发现法
医 DNA 图谱时,是程序员决定着要考虑图表上的哪些峰值。如果一个峰值很小,它可能是检验程
序或软件的人工产物,也可能是降解的或其他受损样本中的一个真正的遗传标记。关于为了认定或
排除某人的作案嫌疑,而给峰值被算作“真正遗传标记”设定哪种“分析阈值”的决定,是一种同
时立足于事实观假设(一个小峰值可能是真正遗传标记的概率)和价值观假设(谁应当承担错误
“匹配”决定的代价)的选择。160 这些选择与医学诊断算法中的价值选择是相似的;在后者的算法
中,软件设计师必须做出价值选择,以决定在多大程度上容忍“漏判”和“误判”。161 然而,在阅
读通常会在审前证据开示程序中移交给被告的报告和图表时,却很难看出这些选择。相反,想要发
现它们,被告必须要求并获得带有原始数据的计算机光盘,购买这种软件或咨询持有该软件的专家,
然后使用替代阈值和假设来重新运行分析程序,以观察有哪些可能被政府分析师忽视的新峰值出现。
基因型概率软件(如 TrueAllele)所报告的“似然比”的基础假设,也被掩藏在专有代码中。
TrueAllele 软件的开发者马克 · 佩林(Mark Perlin)对其超过 170,000 行的源代码进行了超过 25 次
的修改,却没有公开的文件对其所修改的内容和修改的原因予以说明。162 在涉及假想混合物的会议

153
See id. at 544-45. 关于酒精浓度检测仪(Intoxilyzer)及其类似机器的问题(包括深入了解源代码的重要性)的进
一步讨论,see generally Charles Short, Note, Guilt by Machine: The Problem of Source Code Discovery in Florida DUI
Prosecutions, 61 FLA. L. REV. 177, 179 (2009) ( 此文探讨了醉酒驾驶被告人提出的源代码开示问题 ).
154
Lorraine Daston & Peter Galison, The Image of Objectivity, 40 REPRESENTATIONS (SPECIAL ISSUE) 81, 83 (1992).
155
See Benjamin V. Madison III, Seeing Can Be Deceiving: Photographic Evidence in a Visual Age-How Much Weight Does
It Deserve?, 25 WM. & MARY L. REV. 705, 740-41 (1984).
156
G. Daniel Lassiter et al., Videotaped Interrogations and Confessions: A Simple Change in Camera Perspective Alters
Verdicts in Simulated Trials, 87 J. APPLIED PSYCHOL. 867, 867 (2002); see also RICHARD A. LEO, POLICE
INTERROGATION AND AMERICAN JUSTICE 304-05 (2008).
157
See, e.g., Baltimore Motorists Caught by Red Light Cameras, WBALTV (May 8, 2003, 8:18 AM), http://www.wbaltv.
com/Baltimore-Motorists-Caught-By-Red-Light-Cameras/8934064 [https://perma.cc/FUR3-NNYM]( 此文注意到,居民
们抱怨,巴尔的摩红灯摄像机系统的“宽限期”—“从红灯亮起到摄像机快门按下的时间”,是十分之一秒,这
比其他城市都要短 ).
158
See e.g., Scott Calvert & Luke Broadwater, City in $2 Million Dispute With Xerox Over Camera Tickets, BALT. SUN (Apr.
24, 2013), http://articles.baltimoresun.com/2013-04-24/news/bs- md-xerox-dispute-20130424_1_brekford-corp-81-red-
light-cameras-xerox-state [https://perma.cc/54X8-MJ9X]( 据报道,施乐〔Xerox〕拒绝对其享有专利权的红灯摄像机
软件的源代码进行披露 ).
159
Jay Romano, Speeders Beware: New Device Looms, N.Y. TIMES (Sept. 1, 1991), http://www.nytimes.com/1991/09/01/
nyregion/speeders-beware-new-device- looms.html?pagewanted=all [https://perma.cc/4HZ3-SVDP]( 作者注意到,一些
人把红灯摄像机称为“机器审判”,因为在被证明是无辜的之前,被告人通常会被认定为有罪 ).
160
See Murphy, supra note 91, at 491, 510-11 ( 作者讨论了等位基因调用中的主观性 ); cf. MINDELL, supra note 137, at
207 ( 它指出,自动驾驶汽车的算法体现的是一种“体现人类对优先级的判断的成本函数”).
161
See Felicitas Kraemer et al., Is There an Ethics of Algorithms?, 13 ETHICS & INFO. TECHNOL. 251, 251 (2011).
162
See Joe Palazzolo, Defense Attorneys Demand Closer Look at Software Used to Detect Crime-Scene DNA, WALL ST. J.
(Nov. 18, 2015, 5:17 PM), http://www.wsj.com/articles/defense-attorneys- demand-closer-look-at-software-used-to-detect-
crime-scene-dna-1447842603?mg=id-wsj [https://perma.cc/E73R-5W3Z].
2021年第29卷(第1期)
·107·

模拟中,TrueAllele 和几种竞争程序在猜测混合比上得出了不同的结果。163 正如 TrueAllele 的开发


者所说,这些程序“会根据分析人员如何设置输入参数来给出不同的答案”164。尽管 TrueAllele 已
经受到同行评议对其有效性的研究,165 这些研究却只有简要的结果,而未提供可供独立审查者查看
的基础数据。166
由于只能获得针对某些类型的混合物所进行的有效性研究结果,因此很难评估这种软件对于
涉及模糊和临界数据的案件的适应能力;在这些案件中,由于样本受损或样本来源人数众多,它应
该根本不报告任何统计数字。软件开发者吹嘘 TrueAllele“总是会给出答案”、总是会“充分利用”
数据,甚至在“最具挑战性”的混合物中也会报告统计结果,167 这可能正标志着其对算法的过度
解读。正如一位辩方专家所警告的那样, “TrueAllele 被用来处理我们所遇到的最危险、信息量最少
的样本,而且通常是在最重要的案件中”。168 尽管如此,TrueAllele 的开发者还是以商业秘密为由,
甚至援引保护性法令,拒绝向被告人开示其源代码;法院也至今一直不愿意对这些代码进行强制披
露。169
对于算法决策中隐藏的主观性来说或许还有一个终极机会,就是完全(而且真正)机器化的陪
审团。1983 年,一位评论员在某份科技杂志上,对一家人工智能公司试图创建电脑陪审团的做法
进行了批评,(他)预测道: “机器人陪审团将会由盈利性的公司推向市场—这些公司有动力去开
发偏爱于定罪的程序,因为政府机构会是意向中的购买者”。170
隐藏的偏见在用于量刑的算法中也很常见。在所谓的“循证量刑”中使用的质量粗糙的精算工
具,可能会导致某些没有量刑指南的司法辖区的法官,将量刑建立在可疑的、带有种族偏见的关于
被告人未来危险性和可责性的指标之上,例如,家庭稳定性和前科记录的长度。171 反过来说,纽约
阿诺德基金会的“公共安全评估”工具在减少不必要的审前拘留方面积累的宝贵经验(趋势是犯罪
率没有上升 172)表明,在量刑中使用这些比较陈旧且与种族有关的变量很可能增加了(而不是减少
了)刑罚。
除了隐藏的偏见,算法中还不可避免的含有错误录入或误译等随机错误。173 任何曾盲目遵循

163
See, e.g., L. Prieto et al., Euroforgen-NoE Collaborative Exercise on LRmix to Demonstrate Standardization of the
Interpretation of Complex DNA Profiles, 9 FORENSIC SCI. INT’L: GENETICS 47, 47 (2013); see also Michael D.
Coble, Nat’l Inst. Standards Tech., MIX13: An Interlaboratory Study on the Present State of Mixture Interpretation in the
United States, 5th Ann. Prescription for Criminal Justice Forensics, Fordham Univ. School of Law (June 6, 2014), http://
www.cstl.nist.gov/strbase/pub_pres/Coble-ABA2014-MIX13.pdf [https://perma.cc/BZ84-QWH2]. 尽管“MIX 13”研究
中的所有软件包都正确的识别出了混合物的来源,但只有一套程序(查尔斯·布伦纳〔Charles Brenner〕的“DNA
View”)猜出了正确的混合比。See id.
164
See Letter from Mark W. Perlin, Chief Sci. and Exec. Officer, Cybergenetics, to Jerry D. Varnell, U.S. Dep’t of Justice,
Procurement Section, at 3 (Apr. 1, 2015), http://www.cybgen.com/information/newsroom/2015/may/Letter_to_FBI.pdf
[https://perma/cc/2SKL-YC2Z] [ 以下简称 Perlin Letter].
165
See, e.g., People v. Super. Ct. ex rel. Chubbs, No. B258569, 2015 WL 139069, at *7 (Cal. Ct. App. Jan. 9, 2015).
166
See Palazzolo, supra note 162 ( 此文引用了辩方专家丹 · E. 克兰〔Dan E. Krane〕的话—他审查了这些有效性研究,
并作证反对采纳 TrueAllele 证据。原话是: “我不知道它〔TrueAllele〕是如何得出它的答案的”).
167
See Perlin Letter, supra note 164, at 3.
168
Palazzolo, supra note 162.
169
See, e.g., Chubbs, 2015 WL 139069, at *6.
170
Bruce M. Tindall, Robot Jury Neither Impartial Nor Randomly Selected, INFOWORLD, Apr. 25, 1983, at 65.
171
See Starr, supra note 126, at 803; Feeley & Simon, supra note 117, at 461.
172
See supra note 128 and accompanying text.
173
将“法律”译为“机器代码”过程中的“误译”的一个有趣(也可能令人不安)的艺术表现形式,是超现实主义
的戏剧翻拍电影《单向摆》 (One Way Pendulum) (伍德福尔电影公司,1965 年出品)。剧中,有一名古怪的保险职
员创建了一个电子法庭,该法庭按照字面意义解释所有的语言(包括习语),结果导致他的儿子被控为谋杀而受
审,而主要的证据是他穿着黑色的衣服。
Evidence Science Vol.29 No.1 2021
·108·

Google 地图指令走进死胡同的人,或者见证过美国职棒大联盟的新系统“PITCHf/x”造成的险些引
起罢工的巨大错误的人,174 都会意识到机器可能会出错,以及算法中可能会包含漏洞。175 法学家
们记录了刑事司法领域之外的这类错误。在行政法中,计算机辅助的法律推理是利益评估的主要形
式,而在将福利法翻译为“计算机代码”时却引起了一些问题。例如,程序员将授权法规中根本不
存在的规则,以及实际上违反州法和联邦法律的规则,嵌入到了科罗拉多州自动食品券和医疗补助
资格判定的代码中。176
在刑事领域中同样会出现漏洞。例如,用于依据联邦量刑指南计算量刑的软件“应用量刑系
统”(ASSYST),就曾存在长期未得到纠正的不准确之处,这正是 1990 年代其被中止使用的一个主
要原因。177 同样,美国红灯摄像机的批评者认为,这些系统“容易受到漏洞或黑客的影响”,或者
可能“未能公正、恰当地”将交通法规“翻译成计算机代码”。178 在第四修正案背景下,最高法院
一再讨论(并维持) “计算机出错”所导致的搜查的合法性问题,例如,已经过时的逮捕令却被错误
地保留在州警察数据库中。179 苹果公司的应用程序“查找我的 iPhone”也出现了相关问题;在刑事
案件中,该程序被用来证明对盗窃案和抢劫案的犯罪嫌疑人进行扣留具有正当性。180 由于斯普林特
公司的定位追踪服务出了故障,该应用程序将许多人错误地指引到了内华达州某个人的住处,这使
他(不得不)在门上贴了块牌子,上书“没有丢失的手机!”。181 而基因型概率程序“STRMix”中
的一个“小小的错误编码”,则潜在的影响了澳大利亚一些案件的匹配统计数据。182
当然,这些漏洞终究都是人类在编程和输入中出错的产物。但这些错误通常很难仅仅从机器的
输出中辨别出来。当我们遵照 Google 地图却最终把车开进河沟里,或者当机器人裁判员作出疯狂
的判决时,我们知道机器出错了;但是,我们可能不会意识到拒绝给予行政福利是代码错误的结果,
直到几个月或几年后有人费心进行复查时才知道。
2. 幕后人
虽然上一部分描述了算法设计和建模人员的隐藏的主观判断,但是有些貌似“机器”的,却根
本不是机器或算法;它们的“主观性”并非是仅仅被融入了用来驱动其他机器程序的程序中,而是

174
See Ben Lindbergh, Rise of the Machines?, GRANTLAND (Nov. 8, 2013), http://grantland.com/features/ben-lindbergh-
possibility-machines-replacing-umpires/[https://perma.cc/5KDA-B4YC].
175
一些坠机事件也被归咎为是机器错误和人类飞行员的“自动化自满”相结合的结果。See MINDELL, supra note
24, at 267.
176
See Citron, supra note 115, at 1268.
177
See, e.g., Steven R. Lindemann, Commentary, Published Resources on Federal Sentencing, 3 FED. SENT’G REP. 45, 45-
46 (1990); see also U.S. SENT’G COMM’N, ANNUAL REPORT—YEAR IN REVIEW (1996) ( 作者指出,1996 年版
的 Assyst 2.1 软件可能是该软件的最后一个版本 ).
178
Jay Stanley, The Three Dimensions of the Privacy Apocalypse, AM. CIVIL LIBERTIES UNION (Nov. 13, 2013, 11:34
AM), https://www.aclu.org/blog/three-dimensions-privacy-apocalypse [https://perma.cc/SU6Z-W4JU].
179
See, e.g., Florence v. Bd. of Chosen Freeholders, 132 S.Ct. 1510, 1511 (2012) ( 法院认为,依据计算机系统中错误保留
的令状进行的脱衣搜查,是合法的 ); Herring v. United States, 555 U.S. 135, 135 (2009) ( 法院认为,在依据计算机
系统中错误保留的令状进行逮捕时获得的物品,不能依据宪法第四修正案予以排除 ); Arizona v. Evans, 514 U.S. 1,
6 (1995) (same).
180
See, e.g., Pickett v. State, 112 A.3d 1078, 1090 (Md. Ct. Spec. App. 2015); People v. Banks, No. B260917, 2015 WL
7568560, at *2 (Cal. Ct. App. Nov. 24, 2015).
181
See Lawrence Mower, If You Lose Your Cellphone, Don’t Blame Wayne Dobson, LAS VEGAS REV.-J. (Jan. 13, 2013,
1:59 AM), http://www.reviewjournal.com/news/las-vegas/if-you-lose-your-cellphone-dont-blame-wayne-dobson [https://
perma.cc/BF3A-FFQ5].
182
See David Murray, Queensland Authorities Confirm ‘Miscode’ Affects DNA Evidence in Criminal Cases, COURIER
MAIL (Mar. 20, 2015, 8:34 AM), http://www.couriermail.com.au/news/queensland/queensland-authorities-confirm-
miscode-affects-dna-evidence-in-criminal-cases/news-story/833c580d3f1c59039efd1a2ef55af92b [https://perma.cc/3EAP-
94BE].
2021年第29卷(第1期)
·109·

实际上就是个性化的人类判断或操纵的产物。在提高所呈交的证据的认知权威方面,诉讼当事人有
时会提交错误地贴有“机器”标签的证据—幕后之人被错误地当成了奥兹男巫 *。
测谎仪或许是美国司法中“假机器”的典型。历史学家建议,测谎仪应当被作为众多身体测量
“仪器”之一来理解;这些“仪器”通过错误地暗示它们相对于“人类观察”的“无可置疑的优越性” ,
来“淡化操作人员的作用” 。183 事实上,测谎仪并不是侦测谎言的机器;相反,它只是测量人体的生
理特征,然后检验人员会基于判断、经验以及与嫌疑人的互动,用它们来推断被检对象是否具有欺骗
性。在检验人员是执法机关成员、 “欺骗”的推论可能导致监禁的案件中,政府是在以一种几乎无形的
方式对该“机器”检测结果施加控制。政府的“权力通过将自身隐匿于其体系结构中进行伪装” 。184
最能决定测谎仪的错误率的,恰恰是检验人员的技能;而毫无疑问,仅凭心率、血压和皮肤电导率自
身,是无法作为“欺骗”的优良指标的。185 在受过严格训练和认证要求的熟练检验人员手中,至少与
其他日常采纳的证据相比或与陪审团相比,测谎仪在测谎方面的表现一点也不差。186 这里的重点是,
对测谎仪的判断应当根据它“是什么” (得到机器测量的数据辅助的、主观的检验人员证言)来作出,
而不是把它当作“谎言侦测器”、因其是一种“机器审判”而崇拜或惧怕之。
与测谎仪一样,照片也可能是个性化主观判断的产物,它甚至可能超出相机和摄像设计中(例
如,镜头和滤镜)已然置入的主观要求。在摄影的早期阶段,法庭和诉讼当事人似乎就认识到了这
种媒介的可操纵性,采纳这种证据的条件是摄影师本人就图像的生成过程作证并证明其准确性。187
现在,只要一张照片没有被明显篡改,并且证人对其描述其所呈现内容的准确性予以鉴真,法院就
会“欣然接受”并“对拍摄过程的可靠性给予实质性的信任”。188 然而,摄影是极易被操纵的,189
能够被“篡改或变动”,190 甚至能通过计算机设计程序进行模拟。191
其他的犯罪侦查机器也存在这样的问题。在基因型概率软件中,有些程序允许分析人员在完成
分析之前看到比对参考信息,即犯罪嫌疑人的样本和案件相关信息。192 这个漏洞会开启另外一项自
动化进程,该进程虽然没有基于案例信息的主观性,但却有个体化的语境偏见。193 呼气检测仪也有

*
译者注:电影《绿野仙踪》中的奥兹男巫(the Wizard of Oz)有魔力实现一切愿望。
183
BUNN, supra note 10, at 71 (citation omitted).
184
William Bogard, Simulation and Post-Panopticism, in ROUTLEDGE HANDBOOK OF SURVEILLANCE STUDIES 30,
31 (Kristie Ball et al. eds., 2012).
185
See United States v. Scheffer, 523 U.S. 303, 333-34 (1998) (Stevens, J., dissenting); United States v. Piccinonna, 885 F.2d
1529, 1540 (11th Cir. 1989) (Johnson, J., concurring in part and dissenting in part) ( 它指出, “检验人员的技能和训练水
平”对于确定“检测结果的可靠性”至关重要。(citation omitted)).
186
See Shniderman, supra note 39, at 434 ( 作者承认,许多学者认为测谎仪并不比人们日常采纳的其他法庭科学证据
更不可靠 ).
187
See Jennifer L. Mnookin, The Image of Truth: Photographic Evidence and the Power of Analogy, YALE J.L. & HUMAN.
1, 39 (1998) (citing Hollenbeck v. Rowley, 90 Mass. (8 Allen) 473 (1864)); see also Mnookin, supra, at 40 n.143 ( 作者引
用了一些案件,其中法庭要求提供熟悉照片所绘主题的人所作的证言 ).
188
Madison, supra note 155, at 714-15.
189
See, e.g., Zachariah B. Parry, Note, Digital Manipulation and Photographic Evidence: Defrauding the Courts One
Thousand Words at a Time, 2009 U. ILL. J.L. TECH. & POL’Y 175, 175-76 (2009); Karen D. Williams, Comment,
Disparity in Copyright Protection: Focus on the Finished Image Ignores the Art in the Details, 58 AM. U. L. REV.
169, 172 (2008) (“随着设计和摄影软件的进步,摄影和平面设计之间的界限越来越模糊。”); Raphael Winick,
Intellectual Property, Defamation and the Digital Alteration of Visual Images, 21 COLUM.-VLA J.L. & ARTS 143, 150
(1997) (“现在,计算机可以消除众多的不一致之处,以及其他会泄露先前改变视觉图像的方法的内部线索。”).
190
Scott v. Harris, 550 U.S. 372, 378 (2007).
191
See, e.g., Ashcroft v. Free Speech Coal., 535 U.S. 234, 254–55 (2002) ( 法院指出,虚拟儿童色情作品通常是如此真实,
以至于即便是专家也无法将其与真实的照片区分开来 ).
192
See Perlin Letter, supra note 164, at 3.
193
See generally Itiel E. Dror & Greg Hampikian, Subjectivity and Bias in Forensic DNA Mixture Interpretation, 51 SCI. &
JUST. 204, 204–08 (2011) ( 此文论证了案件特定事实信息给 DNA 分析人员解释混合物造成的“偏见效应”).
Evidence Science Vol.29 No.1 2021
·110·

过一段易受操纵的历史;法院曾对早期呼气检测仪的可靠性表示担忧,部分原因是,有报告称,警察
可以操纵它们的“Dial-a-Drunk”控制盘,从而使一个清醒的司机显得“醉酒” 。194 而一些用于在量
刑或精神健康听证会中评估罪责或危险性的精算工具,虽然其意在赋予此类评估以客观性,但它们
却包含一些数字“分数”—这些“分数”是基于临床医生对受试者的油腔滑调、浮夸不实和其他
主观变量的个人评估而得出的。这些变量可能是高度相关的,但依此作出的认定却并不是“机器的” 。
在量刑指南方面, “幕后之人”则是作出指控和逮捕决定的检察官和警察。这些指南旨在保持不
同法官之间以及同一名法官的各个案件之间量刑标准的统一;但是它们的存在,也为检察官以会引
发他们认为“公正”的那种量刑的方式、创造性地起诉案件制造了机会。195 反过来,除了在检察官
之间确立指控规范的内部备忘录,这种指控决定完全是自由裁量的。196 与此类似,尽管表面上看
来,强制最低刑是一种惩罚特定类别罪犯的统一方式,但与相似处境下的白人罪犯相比,黑人罪犯
却更可能被以会触发强制最低刑的方式起诉。197 甚至警务人员也有依据指南来决定量刑的“自由裁
量权”,因为他们会有意识地并精确地设计“钓鱼执法”或采用“假藏毒屋抢劫案”的圈套抓捕行
动,来引发基于“所涉麻醉药品或毒品的数量和类型,以及犯罪活动是否涉及共谋”的、特定的强
制最低刑或从重量刑。198
“幕后人”问题的反面—“虚假的人性化”,也同样存在。一个机器程序会涉及某种程度的人
工干预这个事实,并不意味着人类就是在进行完全独立于机器的复杂个性化判断。与机器接触的人
类操作员或受众往往太过倾向于“遵从算法的智慧”,199 这形成了技术学者所称的“自动化自满”
(Automation complacency)现象。200 结果是,当机器出错或故障时他们却无法接管,而机器出错或
故障是不可避免的。例如,习惯于依赖自动驾驶程序的人类飞行员忘记了如何驾驶,从而导致不必
要的飞机失事。201 而尽管每个人都知道不要往河沟里开车或者在单行道上逆向行驶,却有许多司机
一旦开始按照卫星导航地图的指令行驶,就失去了“情境意识”202,忘记了保持正确的方向有时也
需要他们的人为判断。在这种意义上,该难题与“黑箱难题”还有些渊源,即机器越是神秘莫测,
人与机器之间的感觉也就越亲近, “自满”现象也就越严重。203
在机器化刑事审判中, “自动化自满”的现象也很明显。在法医潜在指印分析中,现有的计算机
模型可以寻找潜在匹配的指印,然后允许专家在其中进行选择,但这实际上会导致语境偏见和错误

194
See JEANNE SWARTZ, AM. PROSECUTORS RESEARCH INST., BREATH TESTING FOR PROSECUTORS:
TARGETING HARDCORE IMPAIRED DRIVERS 11 (2004).
195
See, e.g., Máximo Langer, Rethinking Plea Bargaining: The Practice and Reform of Prosecutorial Adjudication in
American Criminal Procedure, 33 AM. J. CRIM. L. 223, 279 (2006).
196
See, e.g., BIBAS, supra note 118, at 41-42 ( 作者讨论了检察自由裁量权的广泛性 ).
197
See M. Marit Rehavi & Sonja B. Starr, Racial Disparity in Federal Criminal Sentences, 122 J. POL. ECON. 1320, 1323-
24 (2014).
198
See, e.g., Bruce Hay, Sting Operations, Undercover Agents, and Entrapment, 70 MO. L. REV. 387, 390–91 (2005) ( 此
文 对 钓 鱼 执 法 活 动 进 行 了 论 述 ); Brad Heath, ATF Uses Fake Drugs, Big Bucks To Snare Suspects, USA TODAY
(June 28, 2013, 11:26 AM), http://www.usatoday.com/story/news/nation/2013/06/27/atf-stash-houses-sting-usa-today-
investigation/2457109/ [https://perma.cc/H757-9ZJ2]( 此文对“假藏毒屋案件”进行了解释 ).
199
CARR, supra note 134, at 2.
200
See Raja Parasuraman & Dietrich H. Manzey, Complacency and Bias in Human Use of Automation: An Attentional
Integration, 52 HUMAN FACTORS 381, 381 (2010).
201
See id. at 382.
202
See, e.g., CARR, supra note 134, at 43.
203
See Matthew B. Crawford, Shop Class as Soulcraft, NEW ATLANTIS, Summer 2006, at 7 ( 此文称,新的汽车引擎中
“到处都是隐瞒”,就像“电影《2001 太空漫游》开场中吸引住原始人的那块闪闪发亮、平淡无奇的黑石板。本
质上,在护罩的下面还有另外一层护罩。”).—译者注: 《2001 太空漫游》中的“黑石板”疑为外星人所放,用来
引导人类产生智慧和走向太空;其外观虽然平平无奇,但是不管人类如何提高测量精度,其长宽高尺寸的比例都
始终是精准的 1:4:9(前三个整数的平方),以此彰显其科技水平。
2021年第29卷(第1期)
·111·

归因。204 计算机倾向于选择最接近的潜在匹配者,这也意味着最具潜在混淆性的案件。专家假定计
算机选择的案件之一必定是指印的来源,因此从中选择看起来最符合的。205 而虽然某种程度上,有
些人类判断可能有助于提高 TrueAllele 软件的准确性,“自动化自满”的迹象也已经显现—最近,
纽约的 12 名科学家就被发现在 TrueAllele 资格考试中作弊。206 其中一名科学家正准备次日在一起
刑事案件中作证,但在最后关头由一名主管替代了;该案辩方律师被禁止在陪审团面前询问这件丑
闻。207 而在量刑方面,法官们则倾向于遵从精算工具的结果,或允许使用这些结果来夸大他们量刑
计算中再犯风险的重要性,使其超出法官本人可能会赋予此类因素的权重。208
3. 指标漂移与量化诱惑
从本质上讲,所有的规则要么是包容过度,要么就是包容不足。209 一些关于刑事责任和惩罚
的规则是包容不足的;例如,立法机关给罪名设定的最高刑规则,为法官的量刑设定的是最高上限
(而非下限)。其他的规则则是包容过度的,它们扩大而不是缩小了犯罪的范围。当一个指标与其所
指代的道德可责性行为或危险行为契合的相当紧密且合理时(例如醉酒驾驶法),其过度包容性可
能不会过分冒犯其他的价值,例如在减少“误判”方面的准确性。
但正如以下示例所表明的,为犯罪设定的可确定指标通常会契合得不紧密或不合理;这些指标主
要是用来尽量减少对有罪者的无罪释放,而不是作为一种使归责制度更为准确的系统性的方式。虽然
其他法律领域可能会容忍不准确的指标,但是在刑法领域, “误判”之幽灵却令人惊恐。例如,学生们
被教导, “宁愿错放十个有罪之人,也不要冤枉一个无辜之人”210。此外,与其他法律领域的责任宣告
不同,刑事定罪的独特之处在于,它承载着表达“社群集体的道德谴责”211 这一严肃目的。虽然有监
管和公共福利法规的低层次“罪名”对上述规范提出挑战,但目前来说,它们只不过是刑法中受到严
格限制的、特殊的角落。因此,我们需要强烈担忧的,应当是不合理的或过于宽泛的可责性指标。
在醉酒驾驶罪方面,该罪的确切定义已经从“醉酒”这个需要陪审团复杂的个性化道德判断
的复杂事实,转变为了“血液酒精浓度为 0.08%”。 “0.08%”这个指标自身并没有什么问题,数十年
认真的流行病学研究表明,以“0.08% 的血液酒精浓度”驾驶会增加相对的事故风险。212 但是,新
的“涉毒驾驶法规”本身试图类推醉酒驾驶法却是非常有问题的。在最近的合法化浪潮之前,各州
对涉毒驾驶(DUI marijuana)的定义,要么是通过主观的“异常”标准,要么就是基于这种药物的
非法性,采取“零容忍”的方式。213 在合法化后,“零容忍”的法律不再有效。取而代之的是,一

204
See Simon A. Cole, More Than Zero: Accounting for Error in Latent Fingerprint Identification, 95 J. CRIM. L. &
CRIMINOLOGY 985, 1064-65 n.394 (2005).
205
See id.
206
See Brendan J. Lyons, Cheating Scandal Fouls State Police Test, ALBANY TIMES UNION (Jan. 17, 2015, 8:26 AM),
www.timesunion.com/news/article/Cheating-scandal-fouls-State-Police- test-6021600.php [https://perma.cc/WQY8-
45HU].
207
MURPHY, supra note 12, at 102.
208
Starr, supra note 126, at 866–68 ( 作者引用了一些文献,认为决策者往往遵从“他们并不真正理解的科学模型”,
并建议用精算工具来推动司法量刑决定 ).
209
See generally SCHAUER, supra note 21, at 31-34 ( 此文对规则的“过度包容性”与“包容性不足”进行了讨论 ).
210
Alexander Volokh, n Guilty Men, 146 U. PA. L. REV. 173, 174 (1997) (quoting 4 WILLIAM BLACKSTONE,
COMMENTARIES * 352).
211
Henry M. Hart, Jr., The Aims of the Criminal Law, 23 L. & CONTEMP. PROBS. 401, 406 (1958); see also BIBAS, supra
note 118, at xxiv (“在大众的想象中,刑事司法比任何其他法律领域都更富有道德性,其道德意义与其合法性是
密切相关的。”).
212
最高时增长到了 0.15%,但这些年以来其阈值已经降低,尤其是在 1970 年代和 1980 年代。 See Roth, supra note
72, at 870-72.
213
See, e.g., ARIZ. REV. STAT. § 28-1381 (2012) ( 对于吸毒驾驶“零容忍”). 亚利桑那州最高法院自此予以明确, “零
容忍”法仅适用于四氢大麻酚(THC)及其损害代谢物。 See State ex rel. Montgomery v. Harris, 346 P.3d 984, 985
(Ariz. 2014).
Evidence Science Vol.29 No.1 2021
·112·

些州的政策制定者试图类推使用“0.08%”并从数字上定义涉毒驾驶罪,为血液中的四氢大麻酚
(THC)* 确立法律阈值。214 然而,与血液酒精浓度和增加的相对事故风险之间的线性、可预测
的关系不同,在类似的事故测算和血液四氢大麻酚水平之间并不存在这种关系;虽然某种程度上
确实存在这种研究,但它们表明,血液中仅含四氢大麻酚的驾驶员对于数量不成比例的致命车祸
事故不负有责任。215 无论动机有多好,这种不合理的法律的通过反映的都是对减少“漏判”的狭
隘关注,以及屈从于莎莉 · 梅瑞(Sally Merry)所说的“量化诱惑”216—为了可测量性而选择
数字化;而这种做法的代价,便是极高的“误判率”。
量刑指南也是“模糊数学”的一个示例;当对数字指标的搜寻是由反对宽大处理的单方面愿景
(而不是系统性地遏制不准确性)所驱动时, “模糊数学”就会出现。在将其愿景投入运作,以确保
依据指南判处的新监禁刑期不会低于过去的平均刑期方面,量刑委员会犯了一个明显的错误:它
将 1977 年以来的假释委员会决定进行了平均,并将平均值作为所有惩罚的新法定范围的“基准数
字”。217 在只考虑假释委员会对被监禁罪犯的平均量刑的情况下,量刑委员会的计算中还仅包括了
那些附有数字(即,监禁期限)的判决。它彻底而且不合理地忽略了缓刑判决。218 结果是,几乎一
夜之间,刑期大幅增加了:联邦囚犯的平均服刑时间从 13 个月增加到了 43 个月。219 与此相似,在
制定盗窃和欺诈的法定刑期范围时,该委员会将“损失的金额”作为可责性的一项指标,从而导致
了不通情理的结果,例如,受雇于上市公司的、有同情心的初犯者被判处终身监禁。220

(二)
“软”价值面临的压力
本文第二、 (一)部分提到:机器化刑事司法呈现的或然性、以结果为导向的进路,已经可预见
的会允许自动化病理缺陷不受控制,从而危及“客观性”和“准确性”—而据称正是这两者最初
推动了机器化的兴起。但是,追求机器化如果仅狭隘地关注发现更多犯罪、给有罪者定罪和惩罚有
责之人,就还会有其他代价,其中包括会威胁到我们的制度应当并且声称要保护的其他制度性价值,
例如尊严、公平和仁慈。与准确性相比,这些价值的优点可能更难以定义和量化,而这可能正是我
们在追求“真相”时,无意中将其搁置的原因。但是,这些优点在美国刑事司法中依然有着纯正的
历史。
违反这些原则甚至可能是无意之举。一旦政府将一个复杂的社会问题简化为一个关键的可确定
因素,那么“任何妨碍关键因素高效生产的事物”都倾向于会被从决策过程中“无情地消除” ,从
221
而导致价值扭曲。 在最近的《自动化与我们》 (Automation and Us)一书中,作者尼古拉斯 · 卡尔
(Nicholas Carr)就以不区分“灰尘团”和“蟋蟀”的吸尘机器人为例:如果亲手扫地的话,有些人可

*
译者注:四氢大麻酚(Tetrahydrocannabinol, THC)是大麻中的主要精神活性物质,已知大麻素的一种。
214
See Roth, supra note 72, at 882-84.
215
Id. at 887–88, 897-912.
216
See generally SALLY ENGLE MERRY, THE SEDUCTIONS OF QUANTIFICATION: MEASURING HUMAN
RIGHTS, GENDER VIOLENCE, AND SEX TRAFFICKING (2016) ( 作者探讨了在人权语境下追求可测量指针的扭
曲效应 ).
217
See U.S. SENT’G COMM’N, SUPPLEMENTAL REPORT ON THE INITIAL SENTENCING GUIDELINES AND
POLICY STATEMENTS 22 (1987).
218
Adelman, supra note 125, at 297 (citation omitted).
219
Id. (citation omitted).
220
See id. at 303 n.59 (“根据这些指南,在上市公司中可能除了最微不足道的欺诈行为,其余的都可能会触发相当于
终身监禁的判决……”(citing United States v. Ebbers, 458 F.3d 110, 129 (2d Cir. 2006))).
221
因此,虽然一个社会可能会对“人权”有预先存在的承诺,在尝试解决问题时基于善意的目标,然而一旦它走上
简化之路,最终都可能会无意中侵犯人权。斯科特就是以坦桑尼亚为例:坦桑尼亚最初是出于统一和社会控制的
目的而尝试对全体公民进行说明和登记,但后来却变成了一种强迫村庄化的侵略性的甚至有时是暴力性的管理体
制。 See SCOTT, supra note 113, at 223.
2021年第29卷(第1期)
·113·

能会饶过蟋蟀一命;而当交由机器人吸除灰尘时,我们也就放弃了事关(蟋蟀)生死的道德决定。222
1. 尊严
在其近期发布的一份关于大规模监禁的报告中,美国国家研究委员会阐述了它所认为的公正刑
罚制度的必要原则。223 其中一项是“公民资格”,它被定义为包含“人格尊严的最低标准”。224 该
报告引证了美国众多的法律机构和矫正机构,这些机构同样将尊严或“人道” (humanity)定义为一
225
种价值。 托马斯 · 霍布斯(Thomas Hobbes)甚至坚信,对惩罚的“抵抗权”以及“自保权”是
人所固有的。226 虽然宪法中没有出现“尊严”这个词,最高法院却不时地会对其表示认同,227 最
近还在布朗诉普拉塔案(Brown v. Plata)中对监狱过度拥挤的问题进行了谴责。228 最高法院还谴
责了侵犯嫌疑人的身体、以有损尊严的方式提出证据的行为。在罗钦诉加利福尼亚州案(Rochin v.
California)中,最高法院对那些给吞下吗啡胶囊的囚犯强行催吐的警察予以警告,认为对犯罪嫌
疑人身体“隐私的强行闯入”远远不止是“对有洁癖的神经脆弱者或私人的多愁善感主义的冒犯”,
它“震撼了我们的良心”。229 与此同时,最高法院指出,这样的判决反映出人类法官的必要性,并
总结说, “没有生命的机器不适合作出宪法裁决”。230
正如第一部分讨论的,执法机关已经在运用仪器“解读”和“规训”罪犯的身体,以及“监控”
和“调控”人群中所发现的人体多样性。因此,这些仪器具有侵犯隐私和有辱人格的特殊风险。实
际上,关于测谎仪的最为著名的司法判决,就是引用了“人格”的概念,将其检验结果从审判中予
以排除。俄勒冈州最高法院的林德大法官(Justice Linde),在一起双方当事人约定承认测谎仪结果
的案件中对排除该结果提出了并存意见,认为使用该机器侵犯了被检对象的人格。他写道,无论其
可靠性如何,测谎仪都违反了如下原则: “当事人和证人被作为人来对待,由其同类人决定相信或
不相信;而不是被当作电化学系统,由机器来认定是诚实还是撒谎”。231
但是,刑事领域中长期使用的其他侵犯身体的装置,则要花费更长的时间才能受到司法的审查。
以阴茎体积描记器(the penile plethysmograph, PPG)为例,它是一种根据观看性刺激图像时的勃起
量来检验男子性冲动的仪器。232 PPG 最初是作为一种研究同性恋的方法,于 1950 年代由捷克精神
病学家科特 · 福伦德(Kurt Freund)所创造的;233 然而近些年来,该机器被执法机关用来检验获得
假释的性犯罪者是否依然对未成年人存在兴趣。在一起特别有同情心的案件中,第二巡回法院撤销
了一项要求犯罪者接受 PPG 检测的缓刑要求,并指出:这种情况不具有康复目的,是对犯罪者“人

222
See CARR, supra note 134, at 185.
223
See NAT’L RESEARCH COUNCIL, supra note 18, at 320-33. 美国国家研究委员会是著名的美国国家科学院的分支
研究机构,后者是一家非官方的非营利性机构,经常与美国政府要员就以科学为导向的政策问题展开合作。See
Overview: NAS Mission, NAT’L ACAD. OF SCIS., http://www.nasonline.org/about-nas/mission/ [https://perma.cc/D4LJ-
2KNB] (last visited Jan. 26, 2016).
224
NAT’L RESEARCH COUNCIL, supra note 18, at 327-28.
225
See id. at 328-29 (citing AM. BAR ASS’N, ABA STANDARDS FOR CRIMINAL JUSTICE, TREATMENT OF
PRISONERS, at 201 (3d ed. 2011) ( 它宣称,囚犯不应受到“骚扰”或“贬低”的对待 ).
226
Alice Ristroph, Respect and Resistance in Punishment Theory, 97 CAL. L. REV. 601, 605 (2009).
227
See, e.g., Furman v. Georgia, 408 U.S. 238, 273 (1972) (Brennan, J., concurring) ( 惩罚不应“有损人格尊严”).
228
131 S. Ct. 1910, 1928 (2011) (“囚犯仍保有每个人所固有的‘人格尊严’的本质。对这种尊严的尊重符合宪法第
八修正案反对残忍和不寻常惩罚的禁令。”).
229
342 U.S. 165, 172 (1952).
230
Id. at 171-72.
231
State v. Lyon, 744 P.2d 231, 238 (Or. 1987) (Linde, J., concurring).
232
See Jason R. Odeshoo, Of Penology and Perversity: The Use of Penile Plethysmography on Convicted Child Sex
Offenders, 14 TEMP. POL. & CIV. RTS. L. REV. 1, 2 (2004).
233
Kurt Freund, Reflections on the Development of the Phallometric Method of Assessing Sexual Preference, 4 ANNALS OF
SEX RESEARCH 221, 223 (1991).
Evidence Science Vol.29 No.1 2021
·114·

格”的侮辱,而且看起来其被强加仅仅是因为这是“标准”做法。234 然而,与此同时,这种做法在
其他地方仍继续存在。235
这些案件最令人困扰的地方,并不在于缓刑部门会选择让人接受这种古怪的、有损尊严的程序。
相反,问题在于这种程序是“标准的”,单是这种机器的存在就足以给将其用于罪犯的身体提供正
当理由,并且一旦它提供了有助于撤销假释的证据,没有现成的激励措施能用来检查为适应其使用
而发生的隐性价值转变。
虽然在罗钦案中最高法院谴责了给犯罪嫌疑人洗胃的行为,五年后在布雷哈特诉亚伯兰案
(Breithaupt v. Abram)中,该法院却支持对失去意识的酒驾嫌疑人进行强制血液检验。236 同样,值
得注意的并不是最高法院的多数派最终支持了对无意识者进行强制化学检验的合宪性,而是最高法
院将“有如此多的州使用(血液)检验来检测醉酒程度”这个事实,视为其表明“该做法‘会对
被检者形成冒犯’这种暗示”并非真的。237 在 DNA 方面,有问题的做法—例如在 DNA 数据库
中对犯罪者的亲属进行“族系搜索”(familial searching)238,以及使用包含了受害者、尸检嫌疑人
(autopsy suspects)和无意中在公共场合遗落 DNA 者的“流氓”数据库 239—都被正当化了,这部
分是基于如下循环逻辑:这些做法使得 DNA 分型作为一种犯罪侦破工具更加有用,而且侵犯性的
生物识别数据库业已存在。240
2. 公平与仁慈
美国的刑事司法制度设置了理念上的安全阀—“国家司法机制中的断路器”。241 至少在理论
上,刑事制度的每个层面都为行使所谓的“衡平”裁量权留有空间,即:根据“严格的法律正义”,
对犯罪行为不予存档或记录、不得逮捕、不予起诉、不予定罪、不施以惩罚的裁量权,因为考虑到
具体的个案情况,这样做是不公正的。242 判决“旨在实现个案的公平”243。衡平裁量权的优点源于
这样一个现实,即刑法本质上是过度包容性的,并没有打算会被完全执行。事实上,如果全面执行
的话,我们的制度几乎将会停止运作。法律的过度包容性是不可避免的;法律无法通过成文法或司
法意见以一种完全具体的方式来获得,也因而毫无争议的是,成文法并不能完全体现“正义”。因
此,衡平裁量权并非如道德哲学家所理解的那样,是对法律的一种藐视,而是使法律之为完整的一

234
See United States v. McLaurin, 731 F.3d 258, 263 (2d Cir. 2013) (citation omitted).
235
See, e.g., United States v. Dotson, 324 F.3d 256, 261 (4th Cir. 2003) ( 法院支持使用 PPG 检测,认为这符合联邦成文
法 (citing 18 U.S.C. § 3583(d) (2012)); Jason Molinet, Ex-NFL Star Darren Sharper To Undergo Bizarre Penile Testing
as Part of Plea Deal in Serial Sex Assault Case, N.Y. DAILY NEWS (Apr. 10, 2015, 10:10 AM), http://www.nydailynews.
com/news/crime/darren-sharper-subject-penile-plethysmograph-testing-article-1.2180158 [https://perma.cc/S8WR-5F8Z]
( 这篇新闻讨论了达伦 · 沙柏〔Darren Sharper〕的亚利桑那州案件 ).
236
352 U.S. 432, 436-37 (1957).
237
Id. at 437 n.3.
238
See Erin Murphy, Relative Doubt: Familial Searches of DNA Databases, 109 MICH. L. REV. 291, 291, 297-300 (2010)
( 此文讨论了“族系搜索”程序的机制,并出于“平等、准确、隐私、种族歧视和民主责任”方面的担忧而反对
该程序 ).
239
MURPHY, supra note 12, at 168.
240
See, e.g., Maryland v. King, 133 S. Ct. 1958, 1968 (2013) ( 法院承认 DNA 数据库是合理的,因为类似的数据库是“已
在全国广泛使用的正在扩展的技术”) ; Transcript of Oral Argument at 35, King, 133 S. Ct. 1958 (No. 12-207) (statement
of Alito, J.) ( 它将案件描述为“也许是几十年来……最重要的刑事诉讼案件”).
241
Blakely v. Washington, 542 U.S. 296, 306-07 (2004).
242
See Nussbaum, supra note 20, at 93 (“特殊判决在灵活性上要优于一般的法律规定,其判决应视案件情况而定。”)
(footnote omitted).
243
Josh Bowers, Legal Guilt, Normative Innocence, and the Equitable Decision Not To Prosecute, 110 COLUM. L. REV.
1655, 1723 (2010).
2021年第29卷(第1期)
·115·

个必要部分;也就是说,公平“可以被视为是对法律正义的‘矫正’和‘完善’”。244 那么从逻辑上
来说,刑事责任和惩罚的规则越是潜在的过于宽泛,对公平的需求也就越大。245
美国刑事司法的历史,以及主流的道德哲学,也都表明陪审团和法官的“仁慈”在缓和刑事责
任和惩罚方面具有重要作用。公平是使过度包容性的法律变得公正的一个必要部分,而仁慈则是在
正义自身所要求甚至允许的范围之外,拜私人恩典所赐的宽大处理。当法官充满仁慈时,他“所施
加的苦难……要少于犯罪者的罪有应得”246。玛莎 · 努斯鲍姆(Martha Nussbaum)将其描述为“超
出适当比例的温柔”247,尽管它超出了正义,但“仁慈缓和了正义”248。它是一种“重要的道德优
秀品质”,249 表现的是同情心和共同的人性;它“帮助审视”我们“狭隘和自我关注的倾向”。250 它
也是我们的历史所信奉的一种优秀品质。在大多数重罪都被处以死刑的殖民地时期,为了使罪犯免
于被处死,或者当根据罪犯的行为,“正义”要求如此时,陪审团经常会给被告人判处较轻的罪名
(通常是在法官的提示下)。251“仁慈”依然充满活力地存在于我们的赦免和豁免制度中,存在于陪
审团弃法权 * 中,以及换种方式来看的话,也还存在于检察官和警察的决定中—这并非是因为起
诉或逮捕可能会不公正,而是出于对一个有同情心之人类同胞的怜悯。252
公众关于“美国刑事司法对公平和仁慈的需求”以及“机器化对其构成的潜在威胁”的认知,
体现在这些年来人们对以下建议的愤慨,即用机器人和计算机来替代陪审员和法官—尤其是在
人工智能风头正劲的早期阶段。1983 年,一份计算机杂志提出了用机器人替代刑事陪审员的建议,
这促使一位评论员回应说: “如果当时审判约翰 · 彼得 · 曾格(John Peter Zenger)的是机器人陪审
团,我们哪还会有新闻自由?”253 而作为对哈罗德·斯帕思(Harold Spaeth)的著名研究的回应—
该研究在为期两年的时间里成功预测了最高法院 34 项判决中的 33 项,1974 年的一篇题为“计算
机化的司法”的社论宣称, “无论人类法官们有多么失败,当他们让位于机器之日,也就是社会分崩

244
Nussbaum, supra note 20, at 93 & n.19 ( 作者解释说,公平是“正义”的一部分,特别是“公平正在将法律变成它
最渴望的状态”).
245
See generally Bowers, supra note 243 ( 此文解释了“衡平裁量权”的纯正概念,并探讨了检察官普遍缺乏关于行使
这种裁量权的相关因素的专业知识 ).
246
Jeffrie G. Murphy, Mercy and Legal Justice, in JEFFRIE G. MURPHY & JEAN HAMPTON, FORGIVENESS AND
MERCY 162, 166 (1998).
247
Nussbaum, supra note 20, at 97 (emphasis in original)( 作者讨论了亚里士多德 ).
248
WILLIAM SHAKESPEARE, THE MERCHANT OF VENICE, act 4, sc. 1 (Jay L. Halio ed., Oxford Univ. Press 2008)
(1993).
249
Murphy, supra note 246, at 176.
250
Id.
251
See BIBAS, supra note 118, at 6-9, 23-24.
*
译者注:陪审团弃法权(jury nullification)是指在刑事案件中,虽然证据表明被告人是有罪的,但是陪审团仍然
决定判决其无罪,原因可能是陪审员认为法律本身不公正,检察官在本案中错误地适用了法律,或者违反该法所
可能带来的惩罚过于严苛。有的陪审团同样会出于其自身有利于被告人的偏见而拒绝宣判有罪。更详细的信息可
参见:https://legal-dictionary.thefreedictionary.com/jury+nullification(最后登录日期:2020 年 11 月 01 日)。也有译
为“陪审团的拒绝”,参见薛波主编: 《元照英美法词典》,法律出版社 2003 年版,第 758—759 页。
252
See, e.g., United States v. Acosta, 149 F. Supp.2d 1073, 1075–76 (E.D. Wis. 2001) ( 本案讨论了刑事被告人获得一般判
决的权利,以及特殊判决形式在刑事案件中“不受欢迎”这个事实 ).
253
Tindall, supra note 170, at 65. 曾格(Zenger)是殖民地时期美国的一名颠覆性的新闻记者。在撰写了一份关于殖民
地统治者的令人不快的报告之后,他成为了政治性指控的受害者,但由于陪审团弃法而得救—尽管从技术层面来
说,面对诽谤罪指控曾格是明显有罪的。在那时,“说的是实话”并不能成为诽谤罪的辩护理由。See The Trial of
John Peter Zenger, U.S. NAT’L PARK SERV., http://www.nps.gov/feha/learn/historyculture/the-trial-of-john-peter-zenger.
htm [https://perma.cc/T6UH-HNYU](last visited Jan. 26, 2016).
Evidence Science Vol.29 No.1 2021
·116·

离析之时。……如果要接受审判,我们应抓住每一次由人类审判的机会。”254
虽然机器人陪审团和机器人法官距离现实尚远,但是政府使用机器化来弥补侦查、定罪和惩罚
中的法律漏洞,在某些方面明显给该制度捍卫“公平”和“仁慈”的能力造成了压力。首先,权威
证据本身可能会使得仁慈的施行更加罕见。学者们推测,如果通过使用 DNA 或神经科学的技术,
有罪证明变得越来越确定,陪审团弃法(权)可能会成为一种罕见的事件。255 在通常的案件中,当
陪审团弃法时,这种一般的“无罪”判决中不会有信号表明,“宣告无罪”是基于法外因素的考量,
还是基于法律上无罪的信念。证明方式越是变得权威,“宣告无罪”是“弃法”的产物也就越明显。
通过不会触发“要求陪审团审判的权利”的低层级指标犯罪,审判程序实现了向“高效精简”的转
变;当然,这种转变也使得事实认定者行使衡平裁量权和仁慈裁量权的频率更低了。法官可能会想
要行使弃法权;但与陪审团不同,法官不是“黑箱”。他必须在公开的法庭上将他的事实认定记录
在案,接受上诉审查。
从规范层面来说,在涉及权威证据的案件中这种对“弃法”的背离,可能总体上是可取的;陪
审团会出于种种道德上令人厌恶的原因而行使弃法权,而频繁的弃法则会对法治造成侵害。在“法
律上有罪”的证据不容抵赖的情况下,这种担忧可能会加剧,从而使得“弃法”的案例更加明显。
尽管如此,林德大法官似乎认为,陪审团应当享有在刑事审判的“中心神话”中扮演其角色的机会,
无需受到机器测谎仪的束缚,无论它多么可靠。256 无论如何,这种转变是值得注意的,因此我们没
有关闭其他的安全阀,并假设“在这个证明方式日益权威性的时代,陪审团弃法权将会捍卫‘公平’
和‘仁慈’”。
“红灯摄像机”这种权威证据,为说明“解除安全阀”会怎样成为“有罪的权威证据”与“在
指控和惩罚方面没有安全阀的机器化归责机制”相结合之下一个潜在的、无意的结果,提供了一
个奇怪但是富有启发性的示例。在 1839 年银版摄像术发明后的头几年,法院就已经开始担忧这
种新媒介会使得陪审团被淘汰。通过“既承诺又威胁要提供权威知识”,照片“既承诺又威胁着要
从法律事实认定过程中消除人类判断”。257 在 21 世纪,红灯摄像机证明了这些担忧确实有先见之
明。尽管它们数量庞大 258,红灯摄像机受到了来自相当比例美国民众的强烈批评,被称为“机器
审判”259 或“机器罚款”260。新泽西州“美国公民自由联盟”的主任抱怨说:“至于我超速是因为
我的妻子就要分娩了,还是说我超速是因为我喝醉了,机器可做不出这种区分”。261 归根结底,这
种担忧在保障公平和仁慈方面是合理的;它已经得到了支持:有 10 个州禁止使用红灯摄像机,另

254
Computerized Justice, VICTORIA ADVOCATE, Sept. 13, 1974, at 4A; see generally KATJA FRANKO AAS,
SENTENCING IN THE AGE OF INFORMATION: FROM FAUST TO MACINTOSH 63-105 (2005) ( 作者讨论了“计
算机化的司法”这种趋势 ).
255
See Julie Seaman, Black Boxes: fMRI Lie Detection and the Role of the Jury, 42 AKRON L. REV. 931, 932, 938 (2009)
( 作者推测说,随着基于神经影像学的测谎变得更加可靠,陪审团弃法可能会减少 ); see also Roth, supra note 89,
at 1693 ( 此文指出,在给定的案件中,关于 DNA 的确定性质或其他科学证据的陪审团指示,可能会阻止“弃
法”).
256
State v. Lyon, 744 P.2d 231, 240 (Or. 1987) (en banc) (Linde, J., concurring).
257
Mnookin & West, supra note 16, at 376 (emphasis added).
258
截至 2016 年 1 月,在美国有 439 个社区有红灯摄像机,139 个社区有超速监控摄像机。See Printable List of Cities
with Red Light and Speed Cameras, INS. INST. FOR HIGHWAY SAFETY, HIGHWAY LOSS DATA INST., http://www.
iihs.org/iihs/topics/laws/printablelist?print-view [https://perma.cc/H4AG-RH44](last visited Jan. 27, 2016).
259
See, e.g., Romano, supra note 159 and accompanying text.
260
Dennis Romero, Dreaded Red Light Camera Tickets Are Legit, California High Court Rules, L.A. WEEKLY (Dec.
11, 2013, 12:44 PM), http://www.laweekly.com/news/dreaded-red-light-camera-tickets-are-legit-california-high-court-
rules-4174342 [https://perma.cc/LT48-CBTA].
261
Romano, supra note 159 (emphasis added).
2021年第29卷(第1期)
·117·

有 13 个州禁止使用超速监控摄像机,尽管存在一些例外。262 其他州则将出台法案停止其使用资
金,263 或者有规定禁止执法机关和保险公司将摄像头拍到的违规行为用作不利于当事人的驾照或
费率的“积分”。264 而最新的联邦交通授权法案则禁止各州将联邦资金用于此类系统。265
红灯摄像机系统并不必然就是一种侵犯性的机器化归责机制。实际上,它也可能会节省金钱和
挽救生命,或者经证明是一种强大的工具 , 可以消除人类官员做出的交通违章罚款决定所带的偏见。
这些实证问题超出了本研究的范围。收到红灯违章通知单也不是什么带有犯罪耻辱的罪行。但是,
如果有一台无所不知的机器,它能够检测出路上每一位血液酒精浓度超过 0.08% 的司机—例如某
种可以关闭发动机的点火装置 266—并通过邮件自动发送刑事审判传票,公众可能就会感到愤怒。
弗吉尼亚州饱受争议的鲁莽驾驶法(reckless driving law)对时速超过 80 英里的行为施以刑事处罚,
如果它被交由自动逮捕和自动惩罚的机制来施行,类似的结果可能就会发生。267 但是无可否认,一
些非刑事的自动执法机制显然受到其过度包容性的困扰。例如,美国的一些校区使用自动化出勤系
统,在学生的缺勤次数累积到一定量时,该系统会自动将该学生转交到逃学法庭 *。正如某个残疾
人权利组织的投诉所指出的,该系统的自动执法功能导致“当某次缺席是与学生的残疾有关因而应
当得到谅解时,却毫无纠正的余地”。268 最终,如果机器指标是着眼于最大限度地减少“漏判”,并
在没有安全阀的情况下自动的被触发和执行,那么,即使是最看似无害的机器指标也会系统性地过
度惩罚。
法律中还存在大量其他的如下机器指标,即如果它们与权威证据或强制性的起诉或惩罚政策相
结合的话,将会损害公平和仁慈。就其中某些而言,这种结合已经发生。以法定强奸罪(statutory
rape laws)* 为例,许多人将其视为“指标在刑事实体法中的合理使用”。虽然该法几个世纪前所针
对的典型犯罪者是那些觊觎年轻女孩的年长男子,但情况可能已经不再如此。例如,加利福尼亚州
1999 年被以法定强奸罪起诉的人中,有 58% 年龄是在 20 岁以下;有些州甚至起诉了双方均为未成
年人的合意性行为。269 法学家最近指出,按照某些法定强奸罪的规定,甚至遭到未成年犯罪者非合

262
See Speed and Red Light Camera Laws, GOVERNORS HIGHWAY SAFETY ASS’N (Jan. 2016), http://www.ghsa.org/
html/stateinfo/laws/auto_enforce.html [https://perma.cc/28Q8-DA5W].
263
See, e.g., Illinois Bills Seek to Ban Red-Light Cameras Drivers Hate, CHI. SUN-TIMES (FEB. 12, 2015, 5:16 PM), http://
chicago.suntimes.com/news-chicago/7/71/365165/illinois-bills-seek-ban-red-light-cameras-drivers-hate [https://perma.
cc/3AUL-W4FZ].
264
See Red Light Running, INS. INST. FOR HIGHWAY SAFETY, HIGHWAY LOSS DATA INST. (May 2015), http://www.
iihs.org/iihs/topics/t/red-light-running/qanda#cite-text-0-27 [https://perma.cc/7SNV-BGJA].
265
See Moving Ahead for Progress in the 21st Century Act, Pub. L. No. 112-141, § 1533, 126 Stat. 405, 584 (2012).
266
现有的点火“互锁”装置会在呼气检测结果为“不含酒精”时才准许启动汽车。 See Jim Gold, Curbing Drunken
Drivers: Should Ignition Interlock Be Required on Every Car?, NBC NEWS (Jan. 5, 2012, 8:49 AM), http://usnews.
nbcnews.com/_news/2012/01/05/9957132-curbing-drunken-drivers-should-ignition-interlock-be-required-on-every-car.
[https://perma.cc/4QL8-AFED]
267
See VA. STAT. ANN. § 46.2-862 (2012). 根据弗吉尼亚的法规,驾驶员也会因超过规定的车速限制 20 英里 / 小时
或以上而被认定为犯有鲁莽驾驶罪。See id.
*
译者注:逃学法庭(Truancy court),处理学生长期逃学方面案件的少年法庭。美国有的州制定了学生逃学方面
的法律,并给逃学的学生及其父母规定了责任。例如,依据俄亥俄州的规定,对于逃学学生的父母,最高可处
以罚款或社区服务;而违反该法的逃学学生,则可能被关进少年拘留所。参见: “Truancy Law in Ohio”,https://
legalbeagle.com/8567463-truancy-law-ohio.html(最后登录时间:2020 年 11 月 01 日)。
268
Letter from Dustin Rynders et al., Disability Rights Tex., to Cindy Swain, Tex. Educ. Agency, Div. Fed. & State Educ.
Policy, at 2 n.3 (May 27, 2015), http://youthlaw.org/wp-content/uploads/2015/05/TEA-FTAS-Force-Out-Complaint-Final-
May-27-2015.pdf [https:perma.cc/Z9TZ-7DPP].
*
译者注:也称“强奸幼女罪”,但结合上下文,这里的未成年人似乎也包含幼童。
269
See Kate Sutherland, From Jailbird to Jailbait: Age of Consent Laws and the Construction of Teenage Sexualities, 9
WM. & MARY J. WOMEN & L. 313, 316 (2003) (citation omitted); see also Charles A. Phipps, Misdirected Reform: On
Regulating Consensual Sexual Activity Between Teenagers, 12 CORNELL J.L. & PUB. POL’Y 373, 391 (2003).
Evidence Science Vol.29 No.1 2021
·118·

意强奸的成年受害人也可能被认定为有罪。270 对这种荒谬起诉的担忧并非假想的;在某些案例中,
具有严重认知障碍的成年女性在能够表明她们没有同意的情况下仍被指控为“法定强奸”。271 这些
有争议的起诉似乎是这种检察指控政策的结果:这些政策没有为衡平裁量权留有充足的空间。但
是,这种政策如此成问题的原因,则在于它与机器化的归责机制相结合了—该机制通过将年龄用
作“缺乏合意”的指标,消除了陪审团阶段复杂的人类判断,而这本应是陪审团考虑的问题。可以
想象,同样的问题也会发生在州刑法典的其他机器指标中,包括基于“受害人年龄”的量刑加重,272
基于“损失金额”的盗窃罪和毁坏财物责任的区别,273 基于“药物剂量”的药物违规和药物轻罪的区
别,274 基于“已扣税款金额”的偷税责任,275 以及那些将“未成年人饮酒”规定为犯罪的法律。276
最后,对司法自由裁量权的限制,显然也会对刑事司法制度本该拥有的某种层次的衡平裁量权
和仁慈裁量权构成威胁。我们很难驳斥如下观点,即联邦量刑指南(确实能够由计算机程序执行)
与法官相结合时,法官不过就是一种“自动机器”277。尽管如此,在布克案之前,审判人员批评该
指南是“机器司法”或“按键司法”的频繁尝试都失败了。278 对于指南和强制最低刑的支持者来
说,这种限制是一种特色,而不是一种缺陷。而尽管如此,关于真实的联邦陪审团的研究发现,陪
审员所建议的量刑要明显低于量刑指南所规定的范围 279—这进一步证实,推进量刑的统一性会导
致过度惩罚。无论如何,与其他没有自由裁量的制度一样,取消衡平裁量权和仁慈裁量权都变得更
有问题了,因为在案件到达法官之前,制度的其余部分同样变得更加机器化了。

(三)缺失的机器化
“以结果为导向”的机器化实践,其最终而且带有讽刺意味、问题重重的一个结果是,在有些
领域存在着机器化的缺失—在这些领域中,作为一种减少“漏判”的工具其功用并不明显,但它
仍是一种提高刑事审判准确性和客观性的有力工具。

270
See Russell L. Christopher & Kathryn H. Christopher, The Paradox of Statutory Rape, 87 IND. L.J. 505, 506-09 (2012)
(discussing Heynard v. State, 689 So. 2d 239 (Fla. 1996)).
271
See Christopher & Christopher, supra note 270, at 547-49.
272
See, e.g., CAL. PENAL CODE § 368(2)(B), (3)(B) (West 2014) ( 如果受害者年满 70 岁或以上,则将刑期增加 5 年
或 7 年 ).
273
See, e.g., id. § 487(b)(3) ( 如果代理人、佣人或雇员在十二个月内盗窃的金额总计达到 950 美元,则认定为重大盗
窃罪 ); id. § 594(b)(1) ( 对损失超过 400 美元的行为增加故意毁坏财物罚款 ).
274
See, e.g., CAL. HEALTH & SAFETY CODE § 11357(b)-(d) (West 2014) ( 根据持有量是否超过 28.5 克来区分大麻违
规行为 ).
275
See, e.g., CAL. REV. & TAX CODE § 19701(a) (West 2014) ( 对导致 15000 美元以上税务责任的伪造文件行为指定
罚款 ).
276
See, e.g., CAL. BUS. & PROF. CODE § 25662(a) (West 2014) ( 将未成年人饮酒归为轻罪,可通过罚款或社区服务
予以处罚 ).
277
See STITH & CABRANES, supra note 127, at 169; see also Lee Anne Fennell, Between Monster and Machine:
Rethinking the Judicial Function, 51 S.C. L. REV. 183, 208 (1999) ( 作者称,这些指南将法官变成了“司法机器”).
278
See, e.g., People v. Kincaid, 316 N.E.2d 220, 225 (Ill. 1974) ( 反对量刑计划,被告人将实施强制最低刑称为“计算
机化的司法”); Editorial, House Without Mercy, WASH. POST, Apr. 4, 2003, at A20 ( 此文将一份限制司法自由裁量
权的修正案称为“机器化司法”); Editorial, Machine Justice, WASH. POST, June 6, 1953, at 6 ( 此文将提议的强制
最低刑描述为“机器司法”); Editorial, The Injustice of Push-Button Justice, L.A. TIMES, Apr. 28, 1974, at F2 ( 此文
将强制最低刑称为“机器的、按键司法”); George Robeson, Comment, Heading Toward Push-Button Justice, LONG
BEACH PRESS-TELEGRAM, Sept. 12, 1995, at B9 ( 作者将加利福尼亚州的“三振出局法”称为“按键司法”)(译
者注:三振出局法〔Three-strikes law〕即,若三次犯罪则入狱的法律,源自棒球中击球手三次击球不中即出局);
Carolyn Susman, Computerized Justice Frustrates Judge Cohen, PALM BEACH POST, Mar. 6, 1989, at 1B ( 作者引用
了一位法官将州量刑指南称为“计算机化的司法”的说法 ).
279
See, e.g., James S. Gwin, Juror Sentiment on Just Punishment: Do the Federal Sentencing Guidelines Reflect Community
Values?, 4 HARV. L. & POL’Y REV. 173 (2010).
2021年第29卷(第1期)
·119·

1. 无偏私化证言
机器化作为潜在的、更强大的偏见消除工具,可能因立法者、执法机关和利益集团对“漏判”
的不均衡的关注而被扼杀的第一种情形,就是提供证据。在美国,缺乏系统的、全国性的政策来给
每一名警察配备执法记录仪,这是想象力的失败,也是政策的失败。在成本、保存和开示程序方面,
以及确保警察不能决定何时、何地关闭记录仪方面,有大量的问题必须解决。但是,两党对于运用
它们的共识似乎在不断增强,而这个事实即这从 1980 年代录像带首次出现时就已经开始,某种程
度上似乎是机器化或然性进路的一个可预见的结果。未能准予被告人更多的机会来获得潜在的权威
性的、可检索的证据,例如 DNA 数据库和面部识别软件,以支持其“犯罪者另有他人”的辩护或
检查执法机关用于证明“识别”的模式匹配证据中统计数据的准确性,这同样是政府数据收集的一
个可预见的结果; “就像贪吃者那样,政府将收集它所能收集的一切;但又像吝啬鬼那样,它会将数
据及其运行进行保密”。280
在除了 DNA 之外的鉴定模式证据科目中,匹配调用和匹配统计报告中自动化的缺失,同样提
高了陪审团面前的“误判率” ,或至少是增加了虚假的有罪证据描述。法医指印和工具痕迹分析中
的主观人类判断会潜在的以至少三种方式导致错误。首先,是通过背景偏见。人类分析员的匹配决
定会因不相关的案件有关信息或者因看到过参照样本而受到影响。281 正如美国国家科学院在 2009
年的一份报告中所总结的, “没有充足的证据表明,法庭科学界做出了足够的努力来解决这个偏见问
282
题”。
其次,基于不精确性和人为错误,主观判断也可能通过匹配决定中的不准确性而导致错误。
例如,工具痕迹分析人员(以及面部识别等类似学科的专家)是根据他们的专业判断和经验,使
用“观察法” (Look method)来确定枪弹与特定枪支是否匹配。正如一位研究人员在其工具痕迹分
析软件的专利申请中所指出的, “观察法”是“非常耗时的”,其可信性依赖于“高水平的培训和技
283
能”。 在潜在指印分析中,鉴定人必须对两个样本之间的偏差是真正的差异还是受损样本的人工
产物(例如污迹)作出艰难的主观判断决定。一位研究法庭科学检验中的“偏见”的研究者发现,
当前后两次分析相同的潜在痕迹时,只有 16% 的指印专家观察到了相同数量的细节特征点,而接
近一半的专家在两次检验中存在三处以上的差异。284
最后,基于错误的假设或对人群中模式多变性的无知,主观的鉴定模式识别分析也可能错误
地作出同一认定推论。指印、工具痕迹和面部识别的鉴定人描述“匹配”意义的方式是高度主观性
的,例如“合理程度的弹道确定性”或宣称一项匹配“足以排除世界上所有其他枪支”。285 但充其
量,工具痕迹分析所涉及的人类鉴定人员“通常无法量化他(或她)的确定程度或得出错误结论的
概率”。286
在有适当的保障措施以确保其代码和假设的透明度和准确性的情况下,专家解析软件将有助于
最大限度地减少导致人为错误的所有上述三种来源。首先,计算机软件能够以如下方式进行编程,
即排除掉“查询”里的所有不相关的案件有关信息,并按照顺序来显示有关细节。而根据在某些节

280
Jane Bambauer, Collection Anxiety, 99 CORNELL L. REV. ONLINE 195, 205 (2013) (citing Jack M. Balkin, The
Constitution in the National Surveillance State, 93 MINN. L. REV. 1, 17 (2008)).
281
See, e.g., Itiel E. Dror et al., Cognitive Issues in Fingerprint Analysis: Inter- and Intra-Expert Consistency and the Effect
of a “Target” Comparison, 208 FORENSIC SCI. INT’L 10, 16-17 (2011).
282
NAT’L RESEARCH COUNCIL OF THE NAT’L ACADS., supra note 82, at 8-9 n.8.
283
’Automated Sys. and Method for Toolmark Analysis, U.S. Patent No. 7,212,949 B2, at [1-2] (filed Aug. 31, 2005) (issued
May 1, 2007) [ 以下简称 Automated Sys. Patent].
284
See Dror, supra note 281, at 16-17.
285
See DANIEL L. CORK ET AL., BALLISTIC IMAGING: COMMITTEE TO ASSESS THE FEASIBILITY, ACCURACY,
AND TECHNICAL CAPABILITY OF A NATIONAL BALLISTICS DATABASE 84 (2d ed. 2008) (citations omitted).
286
Automated Sys. Patent, supra note 283, at [2].
Evidence Science Vol.29 No.1 2021
·120·

点案件有关信息应当被考虑的程度,在完成对证据的更为客观的评估后,可在最后将其添加。其次,
通过使用设定的标准,如 DNA 遗传标记、指纹上的“螺旋”和“环”,以及工具脊和枪弹条纹,计
算机程序和数据库有助于统一地为模式特征贴标签,从而使得宣告匹配更加客观。围绕基于三维图
像来判定工具痕迹匹配的自动化程序,有些公司已经获得了相关专利。287 最后,通过评估一般人群
中各种特征的多变性和稀有性,软件和数据库可以用来帮助确定一项匹配的统计意义。在 DNA 方
法中,大量关于人口统计的工作已经完成,这正是 DNA 分析人员能够向陪审团报告匹配概率,而
不是只能陈述同一性“达到了合理程度的确定性”的原因。如果适当的接受可靠性保障措施和人工
检查的话,自动化解析软件似乎有望使模式软件的专业解释更加准确,这对于政府和被告人来说将
是双赢。
2. 无偏私化陪审团
虽然政府对减少“漏判”的关注,引起了以犯罪的机器指标为形式的对陪审团复杂的人类判断
的审查,但它也扼杀了那些可以被视为会侵犯陪审团“决定可信性”角色的机器化的发展。在首度
提倡“机器人陪审团”的人工智能运动中,曾有过一些崇高(即使不切实际)的目标,记住这些目
标是有帮助的。在 1983 年,通用机器人公司开启了一项全国性的运动,他们为联邦刑事案件的诉
讼当事人提供了选择,可以将案件交由“电子陪审团”而不是人类陪审团进行裁决。虽然看起来语
气近似嘲弄,该公司还是在标榜机器人陪审团的公正性和客观性:

我们正尝试用一个冷冰冰的、死气沉沉的机器人陪审团取代温暖的、活生生的人类陪
审团,以便公民们对他们的纠纷可以获得简单而迅速的裁决或仲裁……我们的口号是“法
律下的平等正义”,这对于任何曾经接受过陪审团审判的人来说都将是一种广受欢迎的解
脱……我们想要对这个情绪化的、带有偏见的过程进行量化并使其变得客观。288

虽然真正的机器人陪审团会因为前面所讨论的原因而问题重重,但是禁止这种可能有助于消除
陪审团可信性决定中的“偏见”的机器化却是错误的。目前的障碍是,在审判中法院几乎普遍地拒
绝所谓的针对可信性的测谎证据,理由是其不可靠,或者说即使可靠,它也会篡夺陪审团“决定可
信性”的角色。在其最近关于测谎仪的声明中,最高法院的多数派认为,不仅陪审员“被假定是适
合”通过“他们关于人和人的行为方式的天生智慧和实践知识”来“确定(证人)证言的分量和可
信性”的,289 而且不管怎样, “我们刑事审判制度的基本前提是, ‘陪审团才是测谎者’”290。
虽然这两种反对意见都值得我们认真对待,但它们都有答案,291 而且也都不应阻挡立法者或法
院创造性地思考,即如何以不那么专横的方式将可信性辅助设备的结果纳入审判的反偏见措施。事
实上,关于陪审团在谎言检测方面非常不准确这一点,很少有争议。292 除了其他弱点,陪审团还
会受到隐含的种族偏见的污染;很大比例的白人观众认为凶杀案被害人特雷沃恩 · 马丁(Trayvon
Martin)的女友瑞秋 · 让特尔(Rachel Jeantel)作为证人“不可信”这个事实,可能就是一个有据
可查的跨种族“行为鸿沟”的例子,293 而不是陪审员的“天生智慧”的结果 294。不过,公众也并

287
See, e.g., id. at [7]; see generally CORK, supra note 285, at 194-95 ( 作者提到了采用三维工具痕迹成像的新专有算法 ).
288
David Needle, Computer Dispenses Justice: Impartial Terminal, Not Jury, Gives Verdict, INFOWORLD, Feb. 28, 1983, at
1, 6 ( 这段话引自该公司的发言人,他同时也是该项目的创始人 ).
289
United States v. Scheffer, 523 U.S. 303, 313 (1998) (quoting Aetna Life Ins. Co. v. Ward, 140 U.S. 76, 88 (1891)).
290
Id. at 313 (quoting United States v. Barnard, 490 F.2d 907, 912 (9th Cir. 1973)) (emphasis added).
291
See supra Section I.A.1.
292
See Fisher, supra note 56, at 707.
293
See generally Joseph W. Rand, The Demeanor Gap: Race, Lie Detection, and the Jury, 33 CONN. L. REV. 1, 3 (2000)
(“我们的司法制度将‘决定可信性’委托给了陪审员,然而陪审员在尝试作出这些决定时,却很可能经常会被
欺骗性的证人所误导,或错误地不信任讲真话的证人。”)(footnote omitted).
294
Scheffer, 523 U.S. at 313.
2021年第29卷(第1期)
·121·

非必须相信陪审团有能力识破谎言。在依据科学进行定罪和脱罪的时代, “我们的陪审团最擅长的就
是检测谎言”295 这个神话可能不再站得住脚。而正如最近关于目击证人辨认证言的实证研究所表明
的,陪审团也并不特别擅长确定证人何时是“虽然真诚,但却是错误的”。296
有些法院表示担忧,由于测谎仪具有明显的机器本源,测谎鉴定人的证言可能会对陪审团造成
迷惑性并因而有偏见的影响。正如本文第二部分关于“幕后人”现象的讨论所表明的,这种担忧是
可以理解的。但是,如果测谎仪作为“机器”的状态是一个“以此为起点”的“社会建构”,人们
会认为它也可以被“解构”。法官可能会准许关于皮肤电导率及其与“欺骗”的有限联系的专家证
言,并用明确的陪审团指示来防止这种证言的滥用。在 1980 年代,有一位法学家就提供了相关的
指引,以帮助陪审员使用贝叶斯推理将测谎仪检验结果纳入其可信性决定,而不会过度受到它们的
左右。297 有了这种保障措施,测谎鉴定人的证言在这方面与如下专家证言就没有实质性的差别:目
击证人辨认、虚假供述、精神错乱、帮会习俗或其他陪审员必须根据“基准率”作出推论的问题
(例如,估量跨种族目击证人辨认的错误比例的研究)。而正如一些学者所建议的,法院也可以有选
择性地仅当测谎鉴定人的证言是由被告提供时对其采纳。298 毕竟,基于是在检测真话还是谎言,一
些自动化的测谎仪具有不同的错误率。299 一位辩方神经影像专家在近期的一场可采性听证中作证
说,“No-Lie MRI”* 的“漏判率”只有 7%。300 各州也可以通过披露被告人参加检测的次数来有条
件的采纳测谎仪的检测结果,以消除对被告人通过接受任意次数的检测就能获得无罪结果的担忧。
如果我们关心的是减少“误判”(错误定罪),并且有理由相信陪审团是相当无能的测谎者,那么我
们就不是很清楚,为什么当教育陪审团的保障措施到位时,对测谎仪“可靠性”的些许挥之不去的
担忧竟会完全阻止其被采纳。
3. 无偏私化法官
毫无疑问,如果只能完全依靠自身的话,人类法官经常会基于反映种族偏见的因素或与归责性
和风险无关的其他考量而以带有偏见的、不合理的方式作出判决。301 如果机器化可以加强司法决
策,使其真正的更加统一并且反映惩罚的合法目的,其机器本质就不应成为其不被司法系统所使用
的理由。例如,州量刑指南似乎增加了量刑的统一性,而同时没有以似乎并不体现社区规范的方式
显著地、立即地增加监禁。302 本文第一部分所讨论过的阿诺德基金会的“公共安全评估”工具,就
是一个可用于量刑和保释场景的很好的理性专家系统候选方案。值得注意的是,该评估工具避免了
依赖学者们认为在“循证量刑”语境下可反驳的那些不相关因素,并且降低了监禁率而没有对公共

295
Fisher, supra note 56, at 577.
296
See Max Minzner, Detecting Lies Using Demeanor, Bias, and Context, 29 CARDOZO L. REV. 2557,2573 n. 81 ( 此文所
引用的研究成果表明,陪审员会给目击证人的辨认证言赋予过高的价值 ).
297
See James A. Finder, Statistical Implications of Reasoning with Polygraph Evidence: Developing Instructions for the Trier
of Fact, 3 CARDOZO L. REV. 581, 582 (1982).
298
See, e.g., Seaman, supra note 255, at 939 (“为了保留某些合法性观念或保护陪审团的事实认定而牺牲真相是不可接
受的,比如说,判定一个事实上无辜的被告人有罪”); George C. Thomas, “Truth Machines” and Confessions Law
in the Year 2046, 5 OHIO ST. J. CRIM. L. 215, 227 (2007).
299
See, e.g., Tommaso Fornaciari & Massimo Poesio, Automatic Deception Detection in Italian Court Cases, 21
ARTIFICIAL INTELLIGENCE & LAW 303, 320 (2013) ( 此文描述了一种文本分析软件,它在 53% 的情况下准确
检测出了谎言,在 75% 的情况下准确检测出了真话 ).
*
译者注: “No-Lie MRI”是一家位于圣地亚哥的公司,自 2006 年以来一直使用功能性磁共振成像对外提供脑部扫
描测谎服务。
300
See United States v. Semrau, No. 07-10074 Ml/P, 2010 WL 6845092, at *4 (W.D. Tenn. June 1, 2010).
301
See, e.g., Sonja B. Starr & M. Marit Rehavi, Mandatory Sentencing and Racial Disparity: Assessing the Role of
Prosecutors and the Effects of Booker, 123 YALE L.J. 2, 4-6 (2013) ( 作者发现,在合众国诉布克案 [United States v.
Booker, 543 U.S. 220 (2005)] 之后,种族差异并没有增加,但是随着司法自由裁量权的扩张仍继续存在 ).
302
See Langer, supra note 195, at 278-79 & n.219.
Evidence Science Vol.29 No.1 2021
·122·

安全造成负面影响。然而,只要有影响力的量刑指南和“循证量刑”能够保证更为严厉的惩罚,那
么至少在州立法机构这个部分,肯定不会有多少政治意愿想要资助、实施(更不用说“要求”)一
种有效的对量刑的“公共安全评估”。
在美国,人们对所谓的“量刑信息系统”也没有什么明显的兴趣。量刑信息系统通过使用计算
机软件,向法官们展示了他们本人或其他法官在类似案件中的做法,试图以此提高独立法官决策中
的统一性。303 该系统也将提高法官对道德归责性的评估的统一性,而不仅仅是风险评估;对于后者,
批评者主张,通过使用精算工具它被过分强调了。然而目前为止,在美国只有一个司法辖区曾尝试
过使用量刑信息系统。304 关于这种程序,可能还存在一些严肃的问题,包括对自动化偏见的担忧,
但它们在其他国家很受欢迎。实际上,一些国家的法官已经认可了计算机辅助量刑是维护司法独立
的一种手段,而不是屈服于量刑指南的“机器复杂性”。305

三、迈向“生物技术”的刑事审判
本部分为机器时代刑事判决的系统化进路提出了指导性的原则,它有意识地寻求在其最能推
进系统价值之处促进人机协同,并允许人和机器互相帮助、各自充分发挥“自我”。这个目标是
一种“生物技术”的进路,而不是一种“超技术”的进路。其中,前者是刘易斯 · 芒福德(Lewis
Mumford)关于如下范式的一个术语—在该范式中,机器化增强了预先存在的人类目标;而后者
这种进路对机器化的追求,则要么是为了其自身利益,要么就是为了有权者的定义狭隘的战略利
益。306

(一)
“人机交互审判”:一种系统进路
大卫 · 布鲁克斯(David Brooks)最近提出,“我们作为人类的身份,是由机器和其他动物无法
做到的事所形塑的”307。那么有人可能会认为,为未来设计刑事判决制度的方式,不过就是列出人
和机器的比较优势,然后给他们各自分派任务:可信性的决定由陪审团作出,惩罚由计算机作出,
等等。在 1951 年,美国国家研究委员会开发了一种名为“菲茨列表” (Fitts'List)的启发式算法,它

303
See, e.g., Richard V. de Mulder & Helen M. Gubby, Legal Decision Making by Computer: An Experiment with
Sentencing, 4 COMPUTER L.J. 243, 245 (1983); Maria Jean J. Hall et al., Supporting Discretionary Decision-Making
with Information Technology: A Case Study in the Criminal Sentencing Jurisdiction, 2 U. OTTAWA L. & TECH. J. 1,
4 (2005). 这些程序旨在“建造一个量刑决策支持系统”,它会为人类法官作出公正的判决提供协助。See Uri J.
Schild, Criminal Sentencing and Intelligent Decision Support, 6 ARTIFICIAL INTELLIGENCE & LAW 151, 151 (1998)
(emphasis in original).
304
See Michael A. Wolff, Missouri's Information-Based Discretionary Sentencing System, 4 OHIO ST. J. CRIM. L. 95, 99
n.19 (2006) ( 据称,密苏里州的系统其目的与量刑信息系统〔Sentencing Information Systems, SISs〕的相似,即,
为法官们提供类似案件中的法官量刑信息 )(citation omitted). 然而,法官们并没有广泛的使用该系统。See Ryan W.
Scott, How (Not) to Implement Cost as a Sentencing Factor, 24 FED. SENT’G REP. 172, 174 (2012) ( 此文报告说,在
考虑认罪协议时,只有 13.5% 的密苏里州法官“经常”使用州数据库中的信息 )(citation omitted).
305
See Cyrus Tata & Neil Hutton, Beyond the Technology of Quick Fixes: Will the Judiciary Act to Protect Itself and Shore
Up Judicial Independence? Recent Experience from Scotland, 16 FED. SENT’G REP. 67, 67 (2003).
306
See generally MUMFORD, supra note 22 ( 作者对盲目追求机器化发出警告,并讨论了为了机器化而追求机器化
的社会所存在的内在危险 ). 笔者承认,芒福德自己对人机交互的理论化所费时间不多,并因忽视控制论而受
到 批 评。See, e.g., DAVID A. MINDELL, BETWEEN HUMAN AND MACHINE: FEEDBACK, CONTROL, AND
COMPUTING BEFORE CYBERNETICS 1–3 (2002). 尽管如此,笔者还是援用芒福德的“生物技术”概念(而不
仅仅是“人机交互”这个比喻)来展现芒福德关于某种系统的想象—该系统将工具和算法视为一种手段,用以推
进预先存在的对刑事司法核心价值的承诺。
307
David Brooks, Op-Ed, Our Machine Masters, N.Y. TIMES, Oct. 30, 2014, at A31.
2021年第29卷(第1期)
·123·

试图将人与机器的“认知定位”308 简化为一套规则,而这个列表正如人们所期望的那样:人类擅长
的是需要领悟策略和知识的复杂的个性化判断,机器则在权重、速度、统一性和精确性方面表现出
色。309
但是,正如之前的部分所表明的,有的时候,当人们受到机器的检查或与机器紧密相联时才能
充分发挥自我,反之亦然。在系统工程方面,研究人员论述了所谓的“MABA-MABA”* 列表具有
的危险。310 而相反,人机界面设计师应当关注的是人和机器在得到彼此的支持时可以做什么,然
后问:“我们如何让他们更好地相处?”311 历史学家大卫 · 明德尔(David Mindell)写道,
“最先进的
(也是最困难的)技术并非那些与人相分离的技术,而是那些最深入地嵌入人类及其社交网络,并
对此做出回应的技术”。312
相应地,我们可以将我们的制度看作一种“人机交互审判”(trial by cyborg)—仿生的专家、
陪审团和法官,给出的是强化版的人道正义。考虑到过去国家选用机器化的方式,“人机交互审判”
的概念可能看起来有些乌托邦。但是,正如唐娜 · 哈拉维(Donna Haraway)在她的《赛博格宣言》
(Cyborg Manifesto)中所写的那样,或许我们应该对下述任何“技术恶魔学”持怀疑态度:其否认
了我们有能力想象一种“人机交互图像”—这种图像“暗示了一条摆脱二元论迷宫的路径”,而
正是该二元论迷宫导致了压迫性的刑事司法实践。313
“人机交互审判”的概念,应该有望揭示增强证言以及“陪审团和法官”决策的一系列新的可
能性。与其接受当前由人类法警、书记员、缓刑官员或假释委员会成员来完成的每项工作,并思考
如何通过自动化将其替代,我们也可以接受每项工作并思考如何通过自动化来增强其人性特点。或
许我们应该使用带有数据库的专家系统(就像“量刑信息系统”所用的那些),来协助确定科学证
据的可采性 314—这种证据的语境似乎带有支持起诉的偏见 315。或许,我们应该使用文本分析软
件(欧洲目前正在对这种软件进行公测),将其作为另一个帮助陪审员确定证人是否在撒谎的数据
点。316 也许,我们应该欣然接受 IBM 的工作成果(它是在电视问答游戏“危险边缘”中赢得冠军
的计算机“华生”的创造者)—该成果就是建造了可以对证人在证人席上所作陈述进行实时的事
实检查的超级计算机。317
这些建议最终是否明智,将取决于这种自动化是否可以被纳入决策过程,并同时预防自动化的
病理缺陷以及所有的常见政策问题,即“准确性”、“统一性”或“效率”的提高,是否值得所付出
的其他价值成本。当前的要点是,通过摆脱“MABA / MABA”的思路,我们使得自己能够考虑通

308
Richard N. Langlois, Cognitive Comparative Advantage and the Organization of Work: Lessons from Herbert Simon’s
Vision of the Future 23 (U. Conn., Dep’t Econ. Working Papers, No. 200220, 2002).
309
See Mary (Missy) Cummings, Man Versus Machine or Man + Machine?, IEEE INTELLIGENT SYS,, Sept./Oct. 2014,
at 2-3 (citing NAT’L RESEARCH COUNCIL, COMM. AVIATION PSYCHOL., HUMAN ENGINEERING FOR AN
EFFECTIVE AIR NAVIGATION AND TRAFFIC CONTROL SYSTEM, (Paul M. Fitts ed., 1951)).
*
译者注:Men-are-better-at/machines-are-better-at,人类更善于 / 机器更善于。
310
See, e.g., Dekker & Woods, supra note 23, at 240.
311
See id.
312
MINDELL, supra note 137, at 9.
313
Haraway, supra note 33, at 316.
314
See, e.g., Pamela S. Katz, Expert Robot: Using Artificial Intelligence to Assist Judges in Admitting Scientific Expert
Testimony, 24 ALB. L. J. SCI. & TECH. 1, 3 (2014).
315
See, e.g., Susan D. Rozelle, Daubert Schmaubert: Criminal Defendants and the Short End of the Science Stick, 43 TULSA
L. REV. 597, 597-98 (2007).
316
See Fornaciari & Poesio, supra note 299, at 303.
317
See Robert C. Weber, Opinion, Why ‘Watson’ Matters to Lawyers: Computer’s Artificial Intelligence Could Be a Boon
to Legal Research, NAT’L L.J. (Feb. 14, 2011), http://www.nationallawjournal.com/id=1202481662966/Why-Watson-
matters-to-lawyers [https://perma.cc/R9R2-EQ8H].
Evidence Science Vol.29 No.1 2021
·124·

过“生物技术”来改进判决,而无需拘泥于浪漫化的或陈旧的“人类自身可以做什么”的观念,以
及基于恐惧的“机器自身可以做什么”的观念。

(二)确保客观性和准确性
1. 前端的设计与监管保障措施
我们的刑事司法制度应该系统性地实施前端监管保障措施,以更好地确保机器证据和算法证
据的公平性和准确性。在宪法第四修正案语境下,考虑到现代监控体系的实际状况与第四修正案分
析中的“一次性交易”本质之间存在脱节,达夫纳 · 瑞南(Daphna Renan)讨论了行政保障措施对
“监控对隐私的影响”进行评估的必要性。318 关于呼气酒精检测仪的大量法规,与遵循“科学家的
最佳实践指南”的要求一起,使我们得以一窥监管保障措施的可能性。319 其他的示例则还有:达成
要求使用特定的镜头视角和照明条件来摄录供述的协议,对录像进行计时从而消除官员的裁量权,
以及禁止编辑等。
各州在现有的有效性研究之外,也可以开发、设计和披露软件证据的有关保障措施,例如,针
对“流氓程序员”故意错误编码的检验规则,320 以及无论源代码是否仍受到专利保护,对软件和精
算工具背后的假设和价值判断进行“无情的公开审查”。321 此外,在软件界面的设计上,还可以使
要做出的价值选择很明确,并将这种选择委托给人类操作员。大卫 · 明德尔以 Google 自动驾驶汽
车为例,在这种汽车中,人类驾驶员可以转动一个标有“风险”字样的旋钮,从而更快的行驶以便
准时到达会场,但这同时需要忍受更高的事故发生率。322 人们可以为 TrueAllele 设想一个类似的界
面,以便操作人员、诉讼当事人和陪审员了解使用严重受损的 DNA 样本得出明确结论的风险。这
些前端保障措施应当是“动态的”而不是“静态的”,并依据关于该项技术的范围和效果、执法机
关的需求以及遵从的层级等方面的新信息,由当地的利益相关方和审查人员进行持续更新。323
我们也应当执行最佳的实践做法,以及或许还有如下法定要求,即防止机器的人类操作员或合
作者、机器和机器输出的消费者中出现“自动化自满”现象。在这样做时,我们应该借鉴人体工程
学、“人因工程”和“适应性自动化”等新兴领域来设计自动化, “为人与计算机之间的工作关系注入
一剂人性”。324 用来确保人类判断不被机器所取代的技术,包括“定期反馈”、提供相关信息但“不
推荐特定行动方案”,以及提供“可供选择的解释、假说或选项”。325 例如,某位法学家建议将刑事
判决分成两个部分,首先是法官作出基于道德归责性的判决,然后在第二个独立的阶段,则使用精

318
See generally Daphna Renan, The Fourth Amendment as Administrative Governance, 68 STAN. L. REV. (forthcoming
2016) ( 作者解释了这种必要性,即用“程序化的”可能原因分析来管理大规模搜索政策和算法,而不是用传统
的基于交互的可能原因分析来做这件事 ).
319
例如,加利福尼亚州要求法医酒精分析师获得该州卫生部门颁发的证书,The California Code of Regulations, Title
17, §§ 1215.1(k), 1216(a), 1216.1 (2014), 并强制要求,如果要使用该机器的话,技术人员应每天运行一次空白样
本,该样本显示的血液酒精浓度要低于 0.01%。See id. §§ 1220.1-3. 美国国家公路交通安全管理局禁止各州使用
联邦公报所列明批准以外的机器。See Conforming Products List of Alcohol Screening Devices, 77 Fed. Reg. 35,747,
35,748 (June 14, 2012).
320
See Jane Huffman Hayes & Jeff Offutt, Recognizing Authors: An Examination of the Consistent Programmer Hypothesis,
20 SOFTWARE TESTING, VERIFATION & RELIABILITY 329, 330 (2010) ( 作者讨论了根据其相应编程风格识别
特定软件程序员的可能性 ).
321
See Doremus, supra note 139, at 1148 ( 作者主张,相对于正式的科学同行评议,公众监督是对联邦机构行为进行审
查的更好方式 ).
322
See MINDELL, supra note 137, at 207.
323
See Bamberger, supra note 144, at 730 ( 作者建议在企业合规方面采用确保算法客观性的“动态账户”,而不是一套
可能“只会导致‘表面遵守’陷阱”的“静态外部规则”)(citation omitted).
324
See CARR, supra note 134, at 164–65.
325
Id. at 165-66.
2021年第29卷(第1期)
·125·

算工具来确定“受监管的释放”(supervised release)的条件,或确定罪犯中有哪些虽然应受谴责但
是可能符合分流的方案。326 有了这些保障措施,概率模型和可测量的信息就可以“提供一个人们作
出判断的框架”,而不是取代这种判断。327 有了正确的保障措施, “‘只重视那些可测量的东西’就不
328
再是使用精算方法的必然结果” 。
我们的制度还需要对政府在将“道德归责性的复杂判断”转化为“可确定的指标”方面的无能
倾向进行系统检查。一种解决方案是作出如下假定,即反对使用那些加重量刑的机器可测量的数字
指标或基础,除非它们受到某种程度的科学同行评议—比如说,被提交给美国国家研究委员会或
者备受尊重的、两党都支持的美国国家法庭科学委员会。329 很难想象,当前的涉毒驾驶法浪潮,以
及那些迄今认为“经销冰毒”要比“经销粉末可卡因”严重得多的联邦量刑加重措施,会通过这种
同行评议。
需要明确的是,我们的解决之策并不是要完全摒弃机器指标。机器可以成为我们解决复杂问题
的盟友;这并非因为它们会使事情变得更简单,而是因为它们能够用感知、速度和精确的力量,来
增强我们独特的人类经验—对人类而言,在没有帮助的情况下这是不可能梦想实现的。这正是呼
气检测仪为形成“0.08% 血液酒精浓度”法律标准的事故风险研究所作的贡献—在美国刑法中,
这可能是最为接近“人机交互归责机制”的了。这也是“公共安全评估”明显正为一些城市的保释
决定在做的事。而这或许也是一些新机器(也许还有待发明)将为吸毒驾驶问题所做的。
2. 终端的对抗性保障措施
至少在理论上,美国的刑事诉讼法和证据法提供了确保人类证人可靠性的重要方法:从宣誓 330,
到对质条款 331,到传闻证据规则 332,到促进弹劾的规则,到联邦詹克斯法案(Jencks Act)333 及其
州层面的相似法案—这些法案都规定了以弹劾为目的的对证人的先前陈述进行披露。但是,这些
为人类证人设计的法庭保障措施,在使被告能够有效地检验非个体化的证据(例如法医毒品报告)
的可靠性方面却收效甚微。334 正如大卫 · 斯克兰斯基(David Sklansky)所指出的,在本国数百个
凭借 DNA 脱罪的错误定罪中,似乎没有哪个是因为被告人没有能力对鉴定人进行交叉询问而导致
的。335 而且,这些法庭保障措施套用在机器身上似乎也有些别扭。336“酒精浓度检测仪” (Intoxilyzer)
的打印结果有可被用来弹劾的“可信性”吗?再者说,它又怎么可能与它所“指控”的被告人进行

326
See Jennifer Skeem, Risk Technology in Sentencing: Testing the Promises and Perils (Commentary on Hannah-Moffat,
2011), 30 JUSTICE Q. 297, 299 (2013).
327
Katherine Y. Barnes, Against Judgment, 93 CORNELL L. REV. 689, 697 (2008) (reviewing BERNARD E. HARCOURT,
AGAINST PREDICTION: PROFILING, POLICING, AND PUNISHING IN AN ACTUARIAL AGE (2007)).
328
Id. at 696.
329
But see Doremus, supra note 139, at 1146-47 ( 作者指出了正式科学同行评议的局限性 ). 强有力的公众监督也可以与
这种评议同时进行。See id. at 1148.
330
想要被视为“有资格”在法庭上作证,证人必须宣誓。See, e.g., FED. R. EVID. 603. 当然,有些“证人”是传闻
陈述人,他们的陈述可能会根据一项传闻例外而被采纳,即便这些陈述并非是在宣誓后作出的。
331
按照最高法院当前的解释,联邦宪法第六修正案的“对质条款”禁止检方提出不在场陈述人的“证言性传闻”,
除非该陈述人已无法获得并且被告人先前有机会对他进行交叉询问。See Crawford v. Washington, 541 U.S. 36, 68-
69 (2004).
332
See, e.g., FED. R. EVID. 801, 802 ( 这些规则排除了陈述人用以证明陈述中所主张事项真实性的庭外陈述,但存在
许多例外 ).
333
See 18 U.S.C. § 3500(b) (2012) ( 本规定要求,出于潜在的弹劾价值,证人在作证之前需要就其证言主题的先前陈
述进行基本上逐字逐句的披露 ).
334
See, e.g., Erin E. Murphy, The Mismatch Between Twenty-First Century Forensic Evidence and Our Antiquated Criminal
Justice System, 87 S. CAL. L. REV. 633, 657 (2014).
335
See David Alan Sklansky, Hearsay’s Last Hurrah, 2009 SUP. CT. REV. 1, 18.
336
See Brian Sites, Rise of the Machines: Machine-Generated Data and the Confrontation Clause, 16 COLUM. SCI. &
TECH. L. REV. 36, 42 (2014) ( 遗憾的是,对质条款没有赋予“对许多现代机器的操作员进行交叉询问的权利”).
Evidence Science Vol.29 No.1 2021
·126·

“质证”呢?
一些涉及机器证据的案件中的被告人辩称, “对质条款”和“传闻证据规则”要求披露源代码和
其他对评估机器输出结果的可靠性至关重要的材料。学者们也提出,有必要将“对质条款”扩张解
释为“保护被告人对用于反对他的证据进行探究和反击的能力”,337 而不单是确保对在场证人的交
叉询问和当面对质。根据这种解释, “对质”应当要求,用于立案进行逮捕、定罪或惩罚的算法必须
是开源的,其公开程度至少必须能允许科学界和法学界有效地仔细审查其中可能隐藏的人为错误、
暗中操纵和主观性。338 其他研究者则充满激情的写道,有必要将科学研究中使用的任何计算机程序
源代码公开,以确保对这些源代码最低程度的获取和审查。339 然而,到目前为止,每个处理过该问
题的法院都作出裁定,认为“机器的输出结果”或“源代码”不是可适用传闻证据规则的“主张”
(assertion),也不是可适用对质条款的“证言性的”内容。340 由于指控者只是一台“机器”而不是
一个“人”,无论是宪法第六修正案还是传闻证据规则,首先都并没有谈到任何与“机器吐出的原
始数据”或“为其编程的代码”进行对质的能力。341 正如某家法院所说的,“算法不能够被交叉询
问”。342
关于传统的弹劾原则和对质原则适用于机器证人的问题,笔者会在未来的作品中讨论。对该主
题的详细论述超出了本研究的范围。这样说足矣,无论是通过法定权利还是宪法义务,对机器和算
法的对抗式检验,都将需要辩方和研究人员有效地获取那些检验算法可靠性所必需的材料。

(三)保护“软”价值
在机器时代,一个公正的刑事审判制度也将对尊严、公平和仁慈所受到的威胁进行系统检查。
显然,这项任务既不容易也不简单,对它进行充分讨论也超出了本文的范围。它肯定会需要借鉴一
系列工具,例如宪法执行、司法意见的书写以及陪审团指示的转变、法定的和监管性的保障措施、
通过教育和雇佣实践的机构文化转变,以及公共教育和直接行动。解决方案甚至可能来自于市场,
或者对市场形成压力。例如,身体测量设备必然会有其制造商。 “Monarch 21 PPG”就是由行为科技
公司制造的;它是一种“经美国食品药品监督管理局认可的阴茎体积描记器”,其盛放护目镜的“便
携手提箱”上印有蝴蝶标志。343 公众可以向该公司施压,使其不得出售其产品用于缓刑和撤销假释
的听证会,就像他们以前向制药商施压不得将产品出售给各州用于注射死刑那样。344
也许有些讽刺的是,对“侵害尊严”进行审查的一种方式,是扩大某种潜在的侵入性机器化形
式的范围,以覆盖那些本来享有犯罪特权的人群—在“热点”监控和主观的“个别怀疑”警务框
架组合现状下,他们目前还没有受到监控。例如,学者们建议,可以通过对高收入城区进行随机监

337
Sklansky, supra note 335, at 71.
338
See also Murphy, supra note 334, at 661 ( 作者认为,刑事被告人应当有能力对在私人公司的帮助下产生的技术复杂
的证据进行有效抗辩,并且“在可能危及私人专有信息的情况下, ‘完全透明性’的要求也可能会需要调和物,例
如禁言令、有条件的采纳证据或限制性披露”).
339
See, e.g., Darrel C. Ince et al., The Case for Open Computer Programs, 482 NATURE 485, 485 (2012).
340
See, e.g., People v. Goldsmith, 326 P.3d 239, 249-50 (Cal. 2014) ( 法院认为,红灯摄像机拍摄的照片、视频、数据和
时间戳不是“传闻”,因此可以被采纳为证据 ).
341
See Karen Neville, Programmers and Forensic Analyses: Accusers Under the Confrontation Clause, 10 DUKE L. &
TECH. R. 1, 9-10 (2011); see also Bullcoming v. N.M., 131 S. Ct. 2705, 2722 (2011) (Sotomayor, J., concurring).
342
State v. Melsky, 2013 WL 1776037, at *4 (N.J. Super. Ct. App. Div. Apr. 26, 2013).
343
See Monarch 21 PPG, BEHAVIORAL TECH., INC., https://www.btimonarch.com/page.php/monarch21PPG/Monarch-
21-PPG.html [https://perma.cc/Q9RZ-7SK6](last visited Jan. 29, 2016).
344
See Mary D. Fan, The Supply-Side Attack on Lethal Injection and the Rise of Execution Secrecy, 95 B.U. L. REV. 427, 429
(2015).
2021年第29卷(第1期)
·127·

测 345 或采用通用 DNA 数据库 346,来消除警务活动中的偏见。与困扰着“基于怀疑的刑事侦查”347


的人为错误不同,机器程序中的随机错误带有“鲜明的民主色彩”348。顺着这个思路,保罗 · 巴特
勒(Paul Butler)指出,
“电子鼻”这种用来检测麻醉药的新设备, “可能具有令人感兴趣而且有益的
349
潜力,能够使毒品执法活动平等化,并减少种族差异”。 虽然这些建议可能效率低下、费用昂贵,
其自身也有待进行“输入偏见”检查,350 但是,这些思虑将会引起人们关于“尊严”利益的更为公
开和诚实的辩论,而这种利益在侵犯性的基因实践操作或图像监控实践操作中常有涉及。
各州也可以要求寻求资助(或使用)身体测量设备或监控技术的机构,要首先提交一份“尊严
影响声明”351,注明其可能会对相关主体的尊严产生哪些影响。这个解决方案,则需要深思熟虑如
何避免行政法学者所说的“继发性授权”问题—在这种问题中,机构对决策过程要求的遵守,反
而会因其完成主要任务的愿望而被妥协。352 对于这个问题,答案可能在于:确保负责设计机器的机
构相对于执法机关的独立性,提高选项的公开透明性,以及通过引入标准或培训改变机构文化。
如果立法方面不出现史无前例的远离指标定罪的转移,那么捍卫归责和惩罚中的“人类安全阀”
就将需要增加其他司法主体(包括警察、检察官、陪审团和法官)的权力,来行使衡平裁量权和仁
慈裁量权。353 法官(或公众通过宪法公投)可以更明确地将陪审团弃法权作为一项法律权利,甚至
也可以向陪审员披露可能判处的量刑,354 从而减轻在涉及权威证据的案件中遵守规则所面临的压
力。检察官应当接受关于精神疾病、药物滥用、警务隐性偏见以及与行使指控裁量权潜在相关的许
多其他因素的培训,甚至可以像乔什 · 鲍尔斯(Josh Bowers)所建议的那样,将该决定交由陪审员
作出。355 对于“红灯摄像机难题”而言,即现代“基于规则的归责”和权威证据的相互作用竟无意
中导致了衡平裁量权的丧失,也只有这样的系统进路才能确保该难题在刑事语境下不会继续重复。

(四)盘查自动化的缺失
正如本文第二、
(三)部分所探讨的,如果自动化的病理缺陷能够受到检查,那么在刑事侦查和
证明中,机器的运用就可以成为一种强大的工具,能用来避免那些基于依赖人类见证和解释的证据
类型(例如供述和目击证人)而作出的错误定罪。它也可以成为一种纠正陪审团和法官隐性的或显
性的种族偏见和其他偏见的强大工具。因此,在机器时代,一个公正的刑事审判制度将系统性地评

345
See Jane Bambauer, Hassle, 113 MICH. L. REV. 461, 507–08 (2015) ( 作者提倡进行随机搜索 ); Bernard E. Harcourt &
Tracey L. Meares, Randomization and the Fourth Amendment, 78 U. CHI. L. REV. 809, 866 (2011).
346
See Andrea Roth, Maryland v. King and the Wonderful, Horrible DNA Revolution in Law Enforcement, 11 OHIO ST. J.
CRIM. L. 295, 309 (2013).
347
See HARCOURT, supra note 117, at 2-3.
348
Jane Bambauer, Defending the Dog, 91 OR. L. REV. 1203, 1207 (2013). But see Lisa Lit et al., Handler Beliefs Affect
Scent Detection Dog Outcomes, 14 ANIMAL COGNITION 387 (2011) ( 作者认为,警犬训导员相信现场存在的气味
会影响狗是否在某个位置发出警报 ).
349
PAUL BUTLER, LET’S GET FREE: A HIP-HOP THEORY OF JUSTICE 156-57 (2009).
350
例如,Erin E. Murphy 认为,基于警方选择从哪些犯罪现场以及哪些案件开始收集 DNA,通用 DNA 数据库仍可
能会导致不公平的警务行为。See MURPHY, supra note 12, at 260-62.
351
See Osagie K. Obasogie, The Return of Biological Race? Regulating Innovations in Race and Genetics Through
Administrative Agency Race Impact Statements, 22 S. CAL. INTERDISC. L.J. 1, 55 (2012) ( 作者支持对以下生物技术
使用“种族影响声明”:这种技术要么会主张种族的生物学意义,要么会“不恰当地影响少数群体”).
352
See supra note 139 and accompanying text.
353
See generally BIBAS, supra note 118, at 133–65 ( 作者提出了各种方法来增强公众对惩罚决定的参与 ).
354
在得知没有法律禁止这样做之后,佐治亚州的一名法官最近在一起抢劫案中告诉陪审员,该有罪判决的最高刑
罚可导致被告人被判处终身监禁且不得假释。See Bill Rankin, Are They Out of Order? DA, Judge Feuding in Fulton,
ATLANTA J.-CONST. (Sept. 10, 2015, 12:03 AM) http://www.myajc.com/news/news/crime-law/are-they-out-of-order-
da-judge-feuding-in-fulton/nnbw4/[https:perma.cc/4QLS-R3UZ].
355
See Josh Bowers, The Normative Case for Normative Grand Juries, 47 WAKE FOREST L. REV. 319, 321 (2012).
Evidence Science Vol.29 No.1 2021
·128·

估某种机器化形式是否作为消除偏见的工具而被充分的运用。如果在 DNA 方面有 TrueAllele,但是


在工具痕迹方面却没有这样的程序,或者说,如果监控摄像机在特定的情境中存在而在其他情境下
却没有,那么为什么是这样,又是谁将从这种机器化的缺失或未增强的人类判断的浪漫中受益?如
果是强权利益受益,那么我们就应该考虑某些形式的“衡平监控”。356 有些“衡平监控”已经是确
实必不可少的了(例如,执法记录仪),而当时机成熟时,其他的“衡平监控”形式也终将广为人
知。

结 论
当《华尔街日报》的一位记者问计算机 A.L.I.C.E.*,
“她”是否会出任陪审员时,A.L.I.C.E. 回答
357
说:
“我不是很确定我是否想出任陪审员”。 有谁可以责备她吗?对刑事被告人的道德谴责是而且
也应当是困难的。据一位历史学家所说,人们发现对刑事被告人进行道德谴责是如此困难,以至于
人们创造出了“合理怀疑”这个指示来诱哄犹豫不决的陪审员,在达不到形而上学的绝对确定性的
情况下,对被告人判以死刑。358 但是,在机器化是以一种非系统性的方式发展,且其发展偏向于过
度惩罚的图景中,我们对待陪审员和法官的方式,就好像他们完全不需要进行道德判断似的。也就
是说,他们就像机器那样被对待。虽然机器化在提高判决的准确性和公平性方面具有很大的潜力,
我们也不应允许它从裁判的天平中消去道德谴责。相反,我们应当利用它,以更好地识别对哪些人
值得(或不值得)进行道德谴责。
当然,科学家们现在谈论的是所谓“奇点”的不可避免性,也就是总有一天计算机会变得比人
更聪明。359 当那一天到来时,我们可能也会有机器人作为证人、陪审员和法官。事实上,我们的整
个存在可能都会成为虚拟的。然而,在此之前,如果我们希望道德谴责保持其稀有性、严肃性和信
号效应的话,希望复杂的个性化判断作为刑事审判的一部分,同时也将机器化作为一种强大的消除
偏见工具的话,那么我们将需要接受一种“人机交互”模式下的专家证人、陪审团和法官新视界。
我们应当拒绝的,不仅是那种强调没有外界辅助的人类司法有其独特优点的浪漫主义观点,同时也
是那种强调机器司法有其独特优点的盲目崇拜或集权主义观点。随着机器化兴起的推进,至少就
目前来说,我们真正所要畏惧的“机器审判”,并不是偏执的工具崇拜主义者所设想的那样。相反,
用波戈(Pogo)的话来说,我们已经看到了这种机器—那就是“我们”。
(收稿:2020-06-11,修回:2021-01-10)
(责任编辑:刘鑫)

356
Cf. FRANK PASQUALE, THE BLACK BOX SOCIETY: SECRET ALGORITHMS THAT CONTROL MONEY AND
INFORMATION 218 (2015) ( 作者指出,在公司犯罪方面,“与其针对美国公民使用监控技术,政府也可以为了公
民的利益而运用这种技术”).
*
译者注:全称为 The Artificial Linguistic Internet Computer Entity,人工语言互联网计算机实体。
357
Jacob Gershman, Could Robots Replace Jurors?, WALL ST. J. L. BLOG (Mar. 6, 2013, 1:30 PM), http://blogs.wsj.com/
law/2013/03/06/could-robots-replace-jurors/ [https:perma.cc/S65V-W9LX].
358
See JAMES Q. WHITMAN, THE ORIGINS OF REASONABLE DOUBT: THEOLOGICAL ROOTS OF THE
CRIMINAL TRIAL 12-13 (2008).
359
See Eric Molinsky, Soon, Computers Will Become More Intelligent Than Us. Then What?, PUB. RADIO INT’L (Jan.
26, 2014, 4:30 PM), www.pri.org/stories/2014-01-26/soon-computers-will-become-more-intelligent-us-then-what
[https:perma.cc/QJ5W-Y9BF].

You might also like