交互式音乐书中文

Composing Interactive Music
Techniques and Ideas Using Max
Todd Winkler
1. Introduction,History,andTheory
1）.Introduction and Background

交互是一条双向的街道。没有什么比良好的对话更具互动性的了：两
个人分享文字和想法，双方参与。想法似乎飞速发展。一个想法自发
地影响下一个想法。对话的参与者假设了很多过去的经验，并在分享
的经验中找到了兴奋。
计算机模拟交互。计算机继续进入家庭和工作场所，不是因为它们每
秒能够进行数百万次计算，而是因为它们是聪明的模仿者，能够代表
来自现实世界和想象世界的图像、声音和动作.计算机通过允许用户改
变他们当前状态和行为的各个方面来模拟这个构建的世界中的交互。
当计算机影响用户的进一步动作时，这个交互循环就完成了。
交互意味着行动。计算机程序或多或少是交互的，这取决于它们如何
响应人类行为以及它们如何参与人类响应。交互性来自于一种参与感，
其中可能的动作范围是已知的或直觉的，其结果具有显着而明显的效
果，但仍保持着足够的神秘感来激发好奇心和探索。电视还不是很互
1
动。观众不必改变节目的各个方面，除了切换频道、改变音量或改变
颜色、色调和水平保持的控制。媒体将变得更具互动性观众的行为会
对作品的内容和结构产生有意义的影响。
这本书描述了创建交互式计算机音乐的技术（以下简称为交互式音
乐）。交互式音乐在这里被定义为一种音乐作品或即兴创作，其中软
件解释现场表演以影响由计算机生成或修改的音乐。通常这涉及演奏
者在演奏乐器的同时，计算机创作的音乐在某种程度上由表演塑造。
这是一个广泛的定义，涵盖了广泛的技术，从预先确定的音乐材料的
简单触发，到高度互动的即兴系统，这些系统可以从一次表演中改变
他们的行为到下一个。交互式音乐也可以应用在商业多媒体软件和
CD-ROM 标题中，例如教育或娱乐标题，用户（“表演者”）使用计
算机键盘和鼠标控制音乐选择和作曲过程的各个方面。
表演者参与互动作品的创作，部分是通过他们必须在计算机的响应中
产生重要结果的自由度。例如，通过允许表演者控制单个乐谱，可以
使一个完整的、预先确定的乐谱具有轻微的互动性。计算机生成音乐
的参数，例如速度。在更复杂的互动作品中，表演者控制许多重要的
音乐参数，并且作品可以根据他们的解释发生巨大变化。在最极端的
例子中，表演者可以自由演奏任何类型的音乐，而计算机有足够的
“智能”以一种有意义的方式做出反应，并自然地鼓励表演者继续。
就像好的对话一样，交互式作品通过鼓励自发性而成功，同时驻留在
看起来完整和引人入胜的动态文本的边界内。
交互式音乐是长期合作历史的自然延伸。音乐一直是一种互动艺术，
音乐家在演奏时相互回应，无论是管弦乐队的指挥，摇滚乐队的主唱，
2
还是爵士组合或弦乐四重奏的成员。表演者在演奏时互相倾听，根据
他们听到的内容不断地改变和塑造他们的表演。许多传统的音乐关系
可以用计算机模拟。这些模型可能是交互式作品的宝贵起点。更重要
的是，交互式技术可能会提出一种新的音乐流派，即计算机的能力所
在。在这种流派中，计算机的能力被用来创建新的音乐关系，这种关
系可能只存在于数字世界中的人和计算机之间。
形容词“虚拟”是一个流行的流行语，它描述了计算机模拟的事物，
这些事物的行为类似于现实世界的物体、情况和现象。描述这种模拟，
布伦达·劳雷尔写道，“虚拟世界可能看起来不像我们所知道的那样, 但
其表现的说服力使我们能够对它做出反应，就好像它是真实的一
样。”（1933 年）交互式音乐技术可用于对制作和聆听音乐的许多关
键元素进行建模：乐器、表演者、作曲家、和听众。虚拟乐器的行为
有点像真正的乐器，可以通过计算机键盘、MIDI 控制器或作为传统乐
器的扩展来演奏。虚拟表演者可以与人类表演者一起演奏，与音乐智
能互动“在二重奏中，组合，或伴奏角色。
虚拟作曲家根据真实作曲家指定的灵活且有时不可预测的过程创作原
创音乐。这些过程
可能代表作曲家为了创作原声乐器作品而可能选择的相同音乐理念。
其他过程可能是专门为利用计算机的功能而设计的。最后，虚拟听众
或虚拟评论家可以通过对表演的最终结果做出反应和改变来做出判断
（Rowe 1993）。这样的评论家可能被设计为分析表演的准确性，或引
导作品的输出远离重复。
这些虚拟实体的行为必须由程序员来描述，他们必须回答以下问题：
虚拟乐器是如何演奏的？虚拟表演者如何响应音乐输入？虚拟作曲家
3
如何生成、处理和构建音乐材料？虚拟评论家判断表演或音乐成败的
标准是什么？程序员的意见无法脱离最终结果。作曲家和其他艺术家
需要有一个令人信服的理由参与软件的创作，以及为什么需要像 Max
这样的程序来让艺术家更容易接触到软件创作。除其他外，艺术家是
创造生动的想象世界的专家，这些世界吸引了心灵和感官。这些人才
在创造丰富和引人入胜的计算机环境方面是特别需要的。计算机不是
智能的。他们仅从创建他们运行的软件的人的知识和经验中获得他们
的智能外观。
Components of an Interactive System 交互式系统的组成部分
从广义上讲，交互式音乐通过让计算机解释表演者的动作以改变音乐
参数（例如速度、节奏或管弦乐）来工作。这些参数由立即响应音乐
数据（例如单个音符或动态）或手势信息（例如按键压力、脚踏板或
计算机鼠标移动）的计算机音乐过程控制。交互式软件通过模拟人类
的听觉、理解和反应来模拟智能行为（Rowe 1993）。反应必须是可信
的，因为它似乎适合所采取的行动，适合音乐风格。这个过程有点类
似于爵士即兴或其他音乐对话中发生的不同活动：聆听、解释、作曲
和表演。图 1.1 描述了创建交互式作品的五个步骤：
1. 人类输入，仪器——人类活动被转化为数字信息并发送到计算机。
2. 计算机聆听、演奏分析——计算机接收人类输入并分析演奏信息的
时间、音高、动态或其他音乐特性。
3. 解释——软件解释计算机听众信息，生成将影响作曲的数据。
4. 计算机作曲——计算机程序，负责计算机生成音乐的各个方面，都
是根据计算机对演奏结果的演绎。
4
5.声音的产生和输出，性能——计算机播放音乐，使用内部产生的声音，
或通过向产生声音的设备发送音乐信息。
前两个步骤非常实用，也很有限，主要处理事实。该软件的分析应该
是准确的，因此，必须了解有关人类表现的某些事情。最后三个步骤
是仅受作曲家技巧和想象力限制的艺术决定，因为有无数种方式可以
解释演奏信息以创作原创音乐和声音。
Enhancing the Roles of Performer and Composer

加强表演者和作曲家的作用
另一种观察互动音乐过程的方式是审视作曲家和表演者的传统角色，
这些角色在互动作品中经常变得模糊。表演者可能会被要求发明将成
为计算机作品不可或缺的一部分的音乐材料。作曲家可以在音乐会期
间通过使用计算机键盘和鼠标操纵音乐参数来演奏他们的作品。通过
5
从计算机终端改变参数和控制过程，甚至“观众”也可以在设计为在
屏幕上观看的作品中扮演作曲家和表演者的角色。
是什么造就了一个伟大的音乐表演者？用于“西方艺术音乐”的符号
系统传达了关于音高的特定信息，关于速度和节奏的特定信息较少，
关于乐句、颤音和动态的信息更少——本质上是关于如何创作音乐的
一套松散的指导。表演者的艺术性弥补了乐谱中缺失的细微差别，使
音乐栩栩如生。即兴演奏者还通过相同的富有表现力的音乐元素将音
乐带入生活，同时提供用于在特定风格的范围内创作音乐的音高和节
奏信息。这些诠释元素赋予音乐“感觉”。
除了精湛的技艺，这些也是音乐家最看重的品质，无论是爵士独奏的
激进标点、女高音对咏叹调倒数第二个音符的处理，还是电吉他独奏
的冗长高潮。虽然所有优秀的演奏者都具备这些品质，但计算机最难
生成的恰恰是这些元素，因为它们不仅来自音乐的背景，而且来自情
感体验以及一生的音乐创作。尽管研究人员发现了一些可能赋予计算
机音乐音乐性的规则，但还没有模型能够接近人类创造的复杂微妙之
处。
使用互动作曲技术，现场表演的元素可以被用来将人类的音乐感传授
给机器，通过表达信息的解释，形成通向过去音乐传统的桥梁。同时，
计算机为音乐家提供了新的可能性，可以超越乐器的物理限制来扩展
他们的能力。这些技术邀请我们最受尊敬的音乐家继续发挥他们最大
的才能，同时参与计算机时代的音乐制作过程。
作曲家也可以使用许多互动的表演方法来尝试创意，同时创作新作品。
作曲家一直使用过程从简单的音乐材料中生成大型音乐结构。卡农
（轮曲）是一个简单且广泛使用的音乐过程的示例：从一个歌手开始
一段旋律，从第二个歌手开始同一旋律，同时第一个歌手继续，依此
类推。许多类型的音乐过程可以很容易地在软件中通过算法、用于完
成特定任务的分步指令来表示。交互式技术为实时探索音乐过程提供
6
了一个直观的平台。这种生成和操作音乐材料的即时性为作曲家提供
了一个交互式实验室，在这里可以快速实现和完善音乐理念和时变的
作曲过程。从这种实验中获得即时听觉反馈的好处怎么强调都不为过。
在这个实验室环境中，作曲家可以为声学作品生成乐谱，创造与其他
音乐家即兴创作的情境，或者创作直接从计算机上播放的独奏作品。
相同的工具可以帮助在排练或表演期间现场塑造交互式作品，甚至可
以用于控制音乐会演示的非音乐方面，例如视频显示或照明系统的控
制。
Audience Reception and Participation

观众接待和参与
未受过计算机或作曲复杂性培训的观众可能对软件设计的复杂性、音
乐过程的复杂性或计算机中的内存量不感兴趣。他们来听音乐会的原
因多种多样，尤其是为了欣赏现场表演的戏剧性。观看伟大表演者的
音乐技巧，见证乐团成员之间的互动，并欣赏盛大的服装、仪式、灯
光和舞台人物，是令人兴奋的（Wishart 1995）。
现场互动音乐包含一种魔法元素，因为计算机音乐对表演者的反应是
“无形的”。当计算机和表演者的角色被明确定义时，当一个人的行
为对另一个人的行为产生可观察到的影响时，戏剧性就会增强，尽管
过于简单的方法会很快消退。另一方面，受表演者间接影响的复杂反
应可能会产生非常成功的音乐效果，但如果没有一些可观察到的联系，
观众就会失去戏剧性的关系。
在音乐会和录音室环境之外，互动技术邀请参与者参与音乐制作过程。
安装、电脑游戏和 CD-ROM 上的作品可能需要观众或用户输入来选择
和处理音乐，让非音乐家有积极参与创作音乐的感觉。计算机用户可
7
能会被要求成为表演者，从计算机键盘或其他计算机输入设备上播放
音乐。他们也可能被要求成为作曲家，从屏幕控制中选择、排序和生
成计算机音乐。业余爱好者和学生可以通过直接参与音乐制作来更好
地理解音乐。当声音立即响应用户的动作时，交互式电影、游戏、网
站和教育标题都更具吸引力。通过将它们与导致它们发展的开创性工
作相结合，可以更好地理解这些最近的发明。
A Brief History of Interactive Composition

交互式作曲简史
在录音发明之前，所有的音乐在某种程度上都是互动的。也就是说，
所有的音乐都是现场演奏的；音乐家与介绍、历史和理论进行了互动
彼此，用他们的乐器，和他们的听众。二十世纪的技术创新减少了观
众和表演者之间的机会；由于随时随地都可以听到音乐，因此失去了
当下的焦点以及创造它所需的能量。多轨磁带技术进一步消除了音乐
家之间的互动，使得工程师可以录制一个乐队，每个成员在不同的场
合出现在录音室，将他们的部分录制在不同的轨道上（尽管许多乐队
更喜欢在现场互动中捕捉他们的兴奋工作室）。录音室音乐家可能会
对预先录制的音乐做出反应或反应，而不是与现场演奏者互动。他们
的主要互动是通过与制作人或工程师的反馈。这种创作音乐的模式最
近已经蔓延到使用预先录制的磁带的大型流行音乐会中，舞台上的音
乐家扮演的角色最少，甚至口型同步，这样声音就尽可能接近原始录
音室录音。
然而，计算机音乐并不是作为一种互动艺术形式开始的。
第一个通用计算机音乐程序是由 MaxMathews 在 60 年代初在贝尔实
验室创建的（Dodge 和 Jerse 1985 年）。第一个计算机音乐系统无法
设计用于交互，因为原始设备无法处理现场表演所需的大量计算。
8
这些系统需要数小时的编程和等待才能听到一首短旋律。对一些作曲
家来说，部分吸引力在于对作品的所有方面都有绝对的控制权，将每
一个细节都指定给计算机，进而完美地实现它们。有趣的是，这些系
统的局限性和软件的实验性质产生了不可预测的结果，这确实导致了
作曲家和计算机之间有意义的“交互”。作曲家对他们认为会听到的
内容进行编程；计算机对数据的解释不同，作曲家听到结果常常感到
惊讶。然后他们要么调整数据听起来更像他们的初衷，要么决定他们
对自己的“错误”感到高兴，并继续朝着新的方向前进。不少作曲家
表示，他们的一些最佳作品是通过系统缺陷或输入错误数据无意中发
现的。早期计算机作品的最终成果是磁带，作为录音分发，或通过扩
音器播放给观众。
许多作曲家继续创作磁带作品，更喜欢在最佳的录音室环境中工作，
以实现具有非常详细、复杂和微妙的作品的理想版本。由于交互式系
统通常受到实时运行要求的限制，计算机生成音乐中的一些最先进的
技术只能在非实时系统上使用（尽管更快的计算机处理器正在缩小这
一差距）。
对一些人来说，缺乏视觉刺激可能会给在音乐会环境中播放磁带音乐
带来问题。音乐家与磁带一起演奏为音乐会演示增加了有趣的人类成
分，但可能会限制表演者对节奏和乐句的解释，因为无论表演者的解
释多么热情或不寻常，磁带总是保持不变。然而，对于大量计算机音
乐作品，磁带仍然是最可行、最持久和最可靠的媒介。因此，交互式
作曲代表了计算机和电子音乐领域的一个有趣的子集。
Early Analog Experiments
9
早期的模拟实验
在 60 年代和 70 年代初期，用于创作计算机音乐的第一批设备非常昂
贵，并且只安装在哥伦比亚大学、斯坦福大学和贝尔实验室等少数研
究机构中。与此同时，在音乐会环境中使用模拟电子设备来处理乐器
的声音并实时创建合成声音。所谓的现场电子系统在 60 年代初开始使
用，并在整个 70 年代激增。其中许多作品使用磁带延迟技术或通过包
含在“模块”中的专门构建的电子电路处理模拟乐器，每个模块以特
定方式改变声音，例如添加失真或混响。一些作曲家展示了交互式系
统的前景，其中系统在不同的音乐输入下表现不同，允许表演者不仅
触发预设过程，还可以塑造它们。
约翰凯奇的早期电子作品影响了六十年代许多尝试“现场电子”音乐
的作曲家。
他们对即兴创作和不确定性的兴趣自然导致了第一个交互式电子系统。
Gordon Mumma 的 Hornpipe (1967) 展示了很有前途的音乐思想新方
式。 Mumma 将 Hompipe 描述为“针对独奏喇叭、网络音波控制台和
表演空间的交互式现场电子作品”。他创造了赛博声波这个术语，被
描述为根据表演者的输入改变和创造声音的交互式电子电路。
Mumma 的“网络声波控制台”包含麦克风，用于“聆听”喇叭发出的
声音以及分析空间的声学共振。在乐曲中，小号手自由地选择了以不
同方式影响电子处理的音高。因此，喇叭手的演奏和由此产生的声音
被房间的声学所改变，形成了一个交互循环，该循环由电子设备进一
步处理（Cope 1977）。
在 60 年代中期，电压控制合成器的引入为交互技术开辟了道路。控制
电压是可用于自动化模拟合成器过程的电信号。几乎任何可以在模拟
合成器模块上更改的东西都可以通过电压进行控制。电压的量和持续
时间成为可以应用于许多参数的抽象概念。使用控制电压合成器，键
10
盘可以为较高的音调产生较高的电压，为较低的音调产生较低的电压。
例如，来自键盘的电压可以重新定向，以便每个音高可以产生不同的
颤音率。包络跟随器将任何类型的模拟信号，甚至是通过麦克风播放
的声音，转换为电压。通过这种方式，动态电平的变化可以应用于任
意数量的参数，从而影响合成器。例如，在他从 Touch 开始的几首磁
带作品中，作曲家 Morton Subotnick 使用他的声音来控制 Buchla 模拟
合成器上合成声音的各种参数，通过包络将他的拱形短语和短重音音
节的幅度转换为电压追随者。尽管最终的结果是一个只存在于磁带上
的工作室作品，但在作曲过程中应用的交互技术赋予了一种否则会缺
失的人性化元素。
Subotnick 后来与长期合作者和电气工程师 Donald Buchla 合作，开发
了一个早期的数字/模拟混合系统，可以处理来自模拟输入信号的控制
电压。结果是一个晚上长度的多媒体“歌剧”，Ascent Into Air
1983 )，以现场乐器和计算机生成的音乐的交互式计算机处理为特色，
所有这些都在两位大提琴手的控制下，他们是舞台上一小群音乐家的
一部分。在另一部大型舞台作品《饥饿》（Hungers，1986）中，除了
音乐过程之外，音乐家还控制了多个视频图像的播放和显示。
Subotnick 与作曲家/程序员 Marc Coniglio 合作为 Hungers 创建了软件，
该软件最终成为 Inter actor，一个用于交互式作曲的大型计算机程序。
Early Computer Experiments

早期的计算机实验
七十年代计算机音乐的大部分研究和创作都集中在使用大型计算机制
作磁带的声音合成和处理方法上。一个值得注意的例外是 GROOVE
系统，这是由贝尔实验室的 Max Mathews 和 F. Richard Moore 开发的
实时计算机系统的开创性工作。
11
1968 年至 1979 年在贝尔实验室使用的 GROOVE 系统具有一个指挥
程序，该程序使人们能够控制具有预定乐谱知识的计算机合奏的节奏、
动态水平和平衡。表演者使用该系统来研究旧音乐中的表演细微差别，
以及作曲家（如 Emmanuel Ghent 和 Laurie Speigel）用于进行原创作
品（Dodge 和 Jerse 1985）。
David Behrman 是另一位互动作曲的先驱，他早期职业生涯的大部分时
间都在创作以实时处理原声乐器为特色的作品。他是七十年代中期首
次使用微型计算机时开始使用的少数作曲家之一。在约翰·舍弗斯
(John Schaefers) 的著作《新声音》(New Sounds) 中，贝尔曼解释说：
“我将计算机用作我构建的一些制作电子音乐的电路与一个音高感应
设备之间的接口，该设备可以监听原声乐器的音高。”他坚持认为他
的作品“是计算机程序和硬件的形式”。在他的作品 Figure in a
Clearing 中，一位大提琴手即兴创作了一组音符，计算机根据这些音符
的顺序和选择创建和声和音色。当表演者对和声做出反应时，即兴创
作会触发一组新的计算机声音（Schaefer 1987）。
作曲家 Joel Chadabe 自 1967 年开始在他的音乐中采用交互概念，当

时他开始为 Moog 模拟系统创作作品，该系统涉及自动控制音色和节
奏（Chadabe 1989）。十年后，他与 Roger Meyers 一起开发了交互式
音乐软件，为首批便携式数字系统之一提供动力。在 1983 年的一篇文
章“交互式作曲：概述”中，Chadabe 描述了他的作品节奏：
在 Rhythms 中，计算机自动生成旋律和节奏模式，其发音让人联想到
印度尼西亚、加勒比和非洲打击乐器。我通过在终端键盘上按键来执
行，从而移调和弦，改变和弦内的音高关系，触发旋律变化，改变节
奏模式，重叠声音，并引入随机音符。但是虽然我触发了每组更改开
始，但我无法预见每个更改的细节。在决定下一步做什么时，我必须
12
对听到的内容做出反应。交互式作曲的一个显着特点是表演者在决定
每个连续的表演动作时，会对系统自动生成的信息做出反应。
许多在七十年代末和八十年代初建造的早期交互式计算机系统实际上
是数字/模拟混合系统，由一个简单的计算机组成，向模拟合成器发送
电压。著名的爵士长号演奏家 George Lewis 于 1979 年开始构建这样
的系统，使用一台具有 1 KB RAM 的计算机来控制 Moog 合成器。他
的程序发展并继续发展，成为一个更精细的系统，使他能够利用他的
即兴技巧与计算机进行真正的对话（Lewis 1994；见第 3 章）。
Early MIDI Systems
早期的 MIDI 系统
八十年代初计算机技术的快速发展导致交互式作曲技术的显着改进。
首先，小型、廉价和复杂的个人计算机的可用性使许多音乐家和程序
员能够开始自己探索交互式计算机音乐，而无需大型机构的支持。公
司开始将音乐软件商业化，并推出了第一台计算机音乐音序器、编辑
器和乐谱程序。其次，一组著名的乐器制造商商定了一种以数字方式
发送和接收音乐信息的标准方法，将 MIDI（乐器数字接口）确立为通
用标准。第三，研究人员开始解决以前计算机音乐程序员无法解决的
交互式音乐的一些核心问题：如何实时安排音乐事件，如何让计算机
跟随乐谱，以及如何让计算机识别音乐输入（见第 9 章）。
许多乐谱跟踪问题首先由在 IRCAM 和 MIT 工作的 Barry Vercoe 和在

卡内基梅隆大学工作的 Roger Dannenberg 独立解决，他们在 1984 年
国际计算机音乐会议上展示了他们的发现。他们的工作对后来的交互
音乐系统研究产生了很大的影响（两年后开发了许多交互程序，包括
Max、Jam Factory 和 Inter actor）。
13
其他方法已经尝试过即兴创作，计算机立即响应任何未知的音高或动
态信息。两场有影响力的研讨会在 STEIM 工作室举行
1984 年和 1986 年在阿姆斯特丹举办的 STEIM 互动作曲和现场电子音
乐研讨会，汇集了一批有影响力的研究人员和作曲家，分享和讨论他
们的作品。
会谈的重点是新的计算机技术以及新电子仪器的设计和性能（见第 10
章）。
MIDI 的发展对便携式交互系统的普及产生了直接影响，这些系统可以
在音乐会环境中轻松可靠地使用。 MIDI 控制器提供了一种向计算机
表达演奏细微差别和其他物理手势的一致方式。通过 MIDI 传输的有
限数据量使普通个人计算机能够实时处理音乐。然而，这些相同的限
制意味着关于音色、颤音和其他不断变化的细微差别的重要音乐信息
没有得到很好的体现。
受到个人计算机系统的可用性和新潜力的鼓舞，Chadabe 成立了一家名
为 Intelligent Music 的公司，为 Apple 的 Macintosh 计算机提供交互式
作曲软件的出路。加入 Chadabe 公司的是 David Zicarelli，他是一位顶
级的 Macintosh 音乐程序员，因他为其他 MIDI 软件的创新界面设计
而闻名。公司的第一个软件包 M 和 Jam Factory 于 1986 年发布
（Zicarelli 1987）。 Zicarelli 创建了 Jam Factory，并成为 Chadabe 的
M 合作者之一。这两个应用程序都通过软件控制 MIDI 系统，该软件
使用图形和手势界面提供即时反馈，以修改正在进行的音乐过程。这
些程序依靠表演者的动作来创建和操纵软件生成的音乐模式。 MIDI
设备或 Macintosh 键盘和鼠标可用于实时影响音乐参数，同时聆听由
此产生的变化。 Zicarelli 写道：“我编写 Jam Factory 的动机是我有兴
趣创建一个程序，该程序可以收听 MIDI 输入并以某种熟练程度立即
‘即兴创作’，同时让我提高其能力。”
14
米尔斯学院也是八十年代中期交互式系统开发的中心。分层音乐规范
语言 (HMSL) 是 Mills 开发的一种面向对象的编程语言，已广泛用于
交互式音乐创作和即兴创作。进一步的添加增加了在音频媒体或
SoundTools 卡上使用 Motorola 56000 处理器的声音合成功能，使
HMSL 能够控制声音生成电路，同时还控制 MIDI 设备（Polansky 和
Rosenboom 1987）。
到 1990 年，许多高度可编程的交互式 MIDI 系统已被证明在音乐会情
况下是成功的。这方面的工作在麻省理工学院继续进行，生产了 Tod
Mach over 的 Hyper instrument 系统和 Robert Rowe 的 Cypher。
Cypher 与 Daniel Oppenheim 的 Dmix 和 Karla Scaletti 的 Kyma 一起
具有图形界面，可鼓励作曲家快速实现音乐创意，而编程语言（例如
Cor Lisp）的许多细节和复杂性对用户来说是隐藏的。所有这些程序都
会生成 MIDI 数据，但 Kyma 添加了合成和声音处理功能作为集成组
合包的一部分。 Max 是迄今为止使用最广泛的此类程序。
History and Development of Max

Max 的历史与发展
Max 于 1986 年在巴黎的 Institute de Recherche et Coordination
Acoustioue/Musioue (IRCAM) 开发。主要作者是 Miller Puckette，
他是麻省理工学院的毕业生，最初设计 Max 来控制 IRCAM 强大的 4X
合成器。 4X 是由一个工程师团队创建的，他们花费数年时间生产出
15
一种昂贵的数字合成器，可以实时处理复杂的声音合成。 4X
Puckette (1991) 写道：
尽管最初的想法是建立一个振荡器库（用于声音合成），但到 1985
年，大多数尝试使用 4X 的作曲家都对“信号处理”感兴趣，使用该
术语表示在某些情况下转换现场乐器的声音方法。这种焦点的变化是
机会和必要性的产物。机会，因为“信号处理”能够产生比纯合成更
丰富的声音结果，并且如果电子设备对现场声音本身起作用，则更容
易在现场演奏者和电子设备之间建立音乐连接。必要性，因为很明显，
经过八年的改进数字振荡器，我们缺乏软件来指定所需细节级别的有
趣实时音色控制。相比之下，信号处理通常可以仅从少数控制参数产
生有趣的结果。
根据 Puckette 的说法，同步现场玩家和计算机的主要挑战有两个部
分。首先，计算机需要从表演者那里获取音高信息。其次，在检测到
音符流之后，计算机需要使用“乐谱跟踪”技术来了解演奏者在乐谱
中的位置并做出适当的反应。
几年前，Puckette 曾与 MIT 的 Barry Vercoe 一起研究分数跟踪问
题。那些年，1982-1984，恰逢麦金塔电脑的推出和 MIDI 的发展。虽
然对于键盘乐器来说，音符检测的物理问题很容易解决，每个键都是
一个实际的女巫，但对于其他乐器来说却相当困难。被称为音高检测
器的硬件设备通过麦克风给出声学乐器演奏的音高指示，但由于每种
乐器的起音和频谱的性质如此不同，这些设备尚未被证明是准确的。
1984 年，与 Vercoe 一起在 IRCAM 工作的长笛演奏家 Lawrence
Beauregard 采用标准长笛并在琴键上添加开关，以便计算机可以检测
演奏者的指法。由于每个指法会根据乐器的吹奏强度产生多个音高，
因此添加了一个声学音高检测器来推断正确的音高，使其足够可靠，
可以在音乐会中使用。
16
使用 Beauregard 长笛和 4X 展示了乐谱跟随技术，制作了第一批音
乐会作品大约花了三年时间。 1987 年的音乐会以 Philippe Manoury
的 Jupiter 和 Thierry Lancino 的 Aloni 为特色。由于 4X 的编程
困难，Max 被开发为 4X 的控制软件，在 Macintosh 计算机上运行。
4X 被设置为 MIDI 设备，Max 控制相当于数百个 MIDI 控制器，使制
作更轻松、更高效。
从那里开始，Max 成长为一种多功能的图形编程语言，专为实时控制
MIDI 设备而设计。 “其他为 Max 的早期开发做出贡献的程序员包括
LeeBoynton、Cort Lippe 和 Zack Settel。1990 年，Max 的持续发
展分为两个不同的方向。一条路径导致了 David Zicarelli，他开始
开发 Max 的商业版本 Max 在 Zicarelli 的著作下进行了扩展，并最
终由 Opcode Systems, Inc. 于 1991 年作为全功能 Macintosh 编程
环境发布，具有改进的屏幕图形、标准 MIDI 文件的播放、多媒体功
能和大量新的由于其易用性和可用性，Max 已被大量作曲家采用，尤
其受到那些因非实时音乐系统的制作时间缓慢而苦恼的人，或曾被 Max
的成功很大程度上归功于程序员和作曲家社区的贡献通过 Opcode 免
费分发的附加功能的自定义库以及通过 Internet 自由交换的更多功
能，极大地扩展了程序的功能。
同时，IRCAM 继续开发新的硬件系统，以满足作曲家对交互式实时信
号处理的需求。 1990 年，IRCAM 信号处理工作站 (ISPW) 被引入以
取代 4X 系统。 Puckette 为 ISPW 改编了 Max，添加了一个信号处
理对象库。除了控制音乐事件，Max 现在还可以影响音频信号的产生
和处理，控制采样、振荡器、和声器、延迟线、滤波和音高跟踪
（Lindeman
1990）。 ISPW 代表了一个灵活而强大的硬件环境，取代了对 MIDI
设备的需求，Max 作为一个统一的“前端”来控制音乐制作的各个方
面（Lippe 和 Puckette 1991）。 ISPW 是交互式作曲的一大进步，
17
但成本太高，大多数人都负担不起。不幸的是，ISPW 的寿命很短，因
为它依赖于 NeXT 计算机来运行。在 ISPW 完成几年后，NeXT 停止制
造计算机。
ISPW 上用于信号处理和合成的主要软件是 FTS（"比声音更快"）。
IRCAM 继续开发 FTS，作为一个在多个硬件和软件平台上运行的系统。
最近，Miller Puckette 的新软件系统 Pd(Pure Data)提供了 Max 和
FTS 的主要功能，同时解决了原 Max 范式的一些缺点。通过利用更快的
处理器速度，Pd 能够将音频合成和信号处理与视频处理和 3-D 图形整
合在一个实时软件环境中。图形程序 GEM（多媒体图形环境）是由
Mark Danks 编写的，以便在 Pd 环境中运行。这为作曲家和视觉艺术家
探索互动和统一的视听媒介带来了巨大的希望。
这些新功能为使用现成设备的作曲家提供了一个复杂的交互系统，不
仅可以处理 MIDI 数据，还可以处理实时声音合成、音色分析、跟踪
和信号处理（有关此主题的更多信息，请参阅章节 8）。由于该软件的
大部分仍处于开发阶段，因此本文的主要部分演示了使用 Max 的
Opcode 版本和常用 MIDI 硬件的交互式音乐的概念。这些技术在 Max
的未来版本和其他交互系统中应该仍然可行。
2）Interaction: Defining Relationships between Computers

and Performers
交互：定义计算机和表演者之间的关系
无论音乐风格或技术如何，所有互动音乐的作曲家面临的一个核心问
题是人机互动的戏剧性。人类和计算机之间的关系是什么？
强烈而清晰的音乐理念或外在的背景将为这种关系提出适当的范式。
计算机扮演什么角色？它是一个平等的伙伴，以 "自己的思想 "进行
18
即兴创作？它是一个奴隶，通过跟随或模仿人类表演者的一举一动来
接受他们的所有命令？它是一个元作曲家，吸收音乐材料并以无尽的
变化来发展它？
由于互动关系在传统音乐组合的表演者之间自然发生，对传统表演和
作曲模式的研究将为计算机互动提供丰富的材料。希望基于计算机独
特能力的新思维模式能够从对已知表演模式的仔细观察中发展出来。
本章将研究对交互式作曲有用的三种类型的模型：演奏模型、乐器模
型和作曲模型。
表演模式
音乐符号需要由表演者进行 "解释"，或使之成为 "音乐"。虽然在传
统的古典音乐中，音高和节奏的一般选择是不需要解释的，但大部分
的音乐信息是由表演者提供的。这种持续变化的众多参数，如节奏、
颤音或动态，需要几个演奏者之间的互动。在排练作品的过程中，音
乐家们经常讨论这些参数：音调、节奏、分句、音色制作、颤音和动
态平衡。
积极的双向聆听可以让每个演奏者了解音乐的当前状态，并建议采取
适当的方式进行。每种音乐风格和技术的适当性都有不同的定义。表
演者对特定风格的隐含规则的认识有助于创造出令人满意的音乐效果。
例如，大多数即兴音乐给予表演者更广泛的行动自由，因为他或她可
以同时扮演解释者和作曲家的角色，与其他音乐家进行对话。通常这
是在一个预先确定的框架内，包含在已知的音乐结构中呈现的基本音
乐材料，以及基于集体持有的风格规则假设的变奏技巧。即兴演奏者
的选择改变了乐曲的结构，而合奏者则聆听并作出反应。交互式作品
能够做出即兴的反应，因为它们创造了灵活的结构，根据音乐输入产
生作曲材料。通过放弃对某些音乐参数的绝对控制，作曲家可以希望
增加表演者的参与性和自发性。
即使在最呆板的音乐传统中，控制问题也会引起争论。谁在负责？谁
跟随，谁领导？小组成员有多大的 "话语权"？作曲家有多大的发言权？
19
哪些任务和决定是留给表演者的？现场表演的趣味和戏剧性部分在于
这些权力的平衡。每个参与者所扮演的角色都意味着对他们能做什么
或不能做什么的一系列约束。由于计算机对协议或个性无动于衷，作
曲家必须为计算机和表演者定义角色，通过在两者之间建立权力关系
来赋予计算机音乐特性。在互动表演过程中出现的戏剧是由人类和计
算机之间的关系决定的，这种关系是灵活的，在作品的过程中可能会
发生变化。
互动方案从高度可预测的、精心制作的结构，到开放、自由和自发的
表达都有。类似的关系存在于所有类型的音乐中，在西方艺术音乐
（古典音乐）和爵士乐的传统中可以清楚看到。虽然许多二十世纪的
创新显示了重新设计表演关系的有希望的新想法，但爵士乐即兴表演
为互动音乐提供了最完整的工作模式，因为它包含了如此广泛的表演
技术：记谱、基于和声或旋律框架的即兴表演、自由即兴表演和引语。
但没有一个传统的模型是完整的或完全适合于计算机的，所有类型的
音乐都提出了各种关系，可能证明对作曲家有用。对现实世界模型的
模拟，只是为数字媒介的原创设计提供了一块踏脚石。下面的模型考
察了三种传统的控制问题：交响乐团、弦乐四重奏和爵士乐组合，并
对计算机作品的控制设计提出了建议。
指挥家模式--交响乐团
在交响乐团的模式中，指挥是主控人，是音乐表达的管道，是一种人
格。指挥家遵循并解释乐谱，通过引导时间流向、塑造动态、调整声
学平衡，作为协调演奏者行动的唯一来源。指挥家和乐团之间的共生
关系将所有关于解释的大的、全局性的决定权交给了指挥家，他依靠
演奏家的技能和判断来进一步解释。乐团的反馈，以音乐制作和面部
表情的形式，不断地告知指挥家当前和未来的行动。
在交响乐环境中，时间和动态平衡尤为关键。由于有这么多人需要协
调，所有参与者都要有良好的时间观念和一套良好的耳朵，这很重要。
指挥家的沟通方式光是清晰明确是不够的。为了获得影响演奏者所需
20
的权威，指挥家必须通过展示技能来证明其可靠，并通过展示知识来
证明其可信度。劣质的指挥在很大程度上会被演奏者忽视，他们认为
自己对作品的解释会更成功。当乐团成员对指挥的手势做出反应时，
当他们互相倾听时，当指挥把乐团作为一个个体的集合体来倾听时，
好的乐团是互动的。
指挥家模式已被广泛用于交互式作曲。事实上，互动技术的早期研究
之一就是致力于一个目标：找到一种方法，让音乐家实时控制预先确
定的计算机音乐 "乐谱 "的节奏。在指挥模式下，音乐材料是预先确
定的，表演者扮演着指挥的角色。表演者向计算机提供节拍（节奏）。
指挥脉冲可以来自任何 MIDI 设备，如敲击脚踏板或用一只手演奏简单
的四分音符，或来自表演者使用节拍跟踪算法，该算法从表演的实时
分析中得出节拍。(见第 6 章中的计时分析。)一种方法是使用乐谱跟
踪技术，即计算机在其内存中同时包含表演者的乐谱和计算机的乐谱。
计算机通过将演奏者的音符与存储在内存中的相同部分相匹配来跟随
乐谱。匹配的音符使计算机在乐曲中定位，并触发存储在计算机乐谱
中的音符（见第 9 章）。在最小程度上，这种方法要求演奏者实时控
制计算机音乐的节奏。更加发达的系统包括对额外参数的控制，如动
态、颤音和音色。
例如，在 Tod Machover 的 Bug Mudra 中，一个特别设计的手套允许指
挥者在指挥三个表演者的同时控制计算机音乐的混合水平、混响和平
移。(Machover 1991)。
其他专门设计的指挥装置，如 Max Mathews 的无线电棒，使音乐家能
够使用一个或两个棍子（棒子）来控制存储在计算机中的乐谱的节奏
和其他音乐方面（Mathews 和 Schloss 1989）。最近，Guy Garnett 的
《长笛幻想曲》最初是为长笛和磁带写的，为了使音乐更加灵活，对
演奏者的反应更加灵敏，使用 Max 重新设计了一个指挥的角色，使用
21
基于 Donald Buchla 的 Lightning 设备的 MIDI 指挥棒来控制计算机的
节奏、乐句和动态（Garnett 1992）。
在交响乐团或大合奏的互动作品中，计算机音乐的实际 "指挥 "可能
是键盘手或合奏团的其他成员。在 Pierre Boulez 的 Explo-sante
Fixe 的修订版中，一个指挥家指挥着一个大合奏，而一支长笛被计算
机跟踪，使用乐谱跟踪技术来触发 ISPW 和 MIDI 采样器上的所有电子事
件。
(关于指挥模式的简单演示，请看 CD-ROM 上的例子，《指挥肖邦》，
第 6 章的节奏跟随器部分。它允许演奏者在调制轮控制动态水平的同
时，通过敲击脚踏板来控制储存在计算机内存中的肖邦前奏曲的速
度）。
室内乐模式--弦乐四重奏
室内乐模式中的互动更为复杂，因为几个音乐家会相互影响对方的演
奏。以弦乐四重奏为例，尽管第一小提琴手经常被认为是乐团的有效
"领导者"（即指挥），但实际上，音乐家之间的相互作用显示出共同
的控制力。音调、乐句和节奏不断变化，控制权经常传递给拥有最突
出音乐材料的音乐家。这种控制权的获取和让渡，使弦乐四重奏如此
充满活力，这也是作曲本身的一个强烈特征。这是一部关于四位音乐
家关系的戏剧，每个人都能通过在乐谱中加入自己的音乐个性而表现
出性格和独立性。这些关系在即兴表演中显示得更加生动。
互动式作曲中的室内乐模式的例子很多。例如，为单簧管和电脑而作
的《蛇蝎美人》（Winkler 1991）的第一乐章，以一个设定为固定动
态水平的电脑引子开始。当单簧管进入时，它能够在短时间内影响计
算机部分的动态水平，之后计算机停止 "聆听 "演奏者，继续自己的
演奏。这种取舍在演出中多次出现，计算机偶尔的爆发会使单簧管演
奏者提高动态水平以配合计算机。类似的方法也被用来从计算机那里
获得或拿走对节奏和其他参数的控制权（Rowe 1993）。
22
即兴创作模型--爵士乐组合
爵士乐组合为计算机模拟提供了大量成熟的互动例子。传统的爵士乐
作品提供了一个结构和一个共同的概念框架，音乐家们在其中相互影
响，既影响对书面音乐的解释（头），又影响对主要作曲材料的即兴
创作（独奏）。即使是一首曲子的基本和声结构，也可以由演奏者进
行无限的解释。
演奏者会选择和声和变体来适应乐曲的直接情绪。例如，爵士乐贝斯
手最喜欢的一个技巧是在既定和弦的根部下面弹三分之一，这样就把 E
半减和弦变成 C9 和弦。音乐家们交换对音乐的控制权，将他们的独奏
变成自发的个人陈述，改变和影响周围的伴奏。当两个成员交换即兴
演奏时，或者第三个成员瞬间跳到了对话的前台时，关系就会经常变
化。
这种关系之所以能够产生听起来不像是随意胡言乱语的音乐，是因为
有大量的共同假设和基于多年集体经验的隐含规则。这种音乐智能可
以用交互式软件在一个非常简单的层面上进行模拟。计算机可以识别
模式，识别诸如音阶类型、和弦进行、节奏和旋律模式以及节奏等内
容。利用这些信息，一组规则和假设可以被编码到计算机算法中，使
其产生新的音乐，看起来很自然，对表演者的材料有反应。就像爵士
乐组合对独奏者不断变化的情绪作出自然的反应一样，互动作品也可
以对表演者作出反应；每次表演都是一个独特的、不可预测的事件，
或多或少都在剧本的范围内进行。对可能的参数变化范围的限制使音
乐更加集中，使其具有独特的特征。
自由即兴演奏
六十年代的自由爵士乐运动产生了高度互动、自发、富有表现力和不
可预测的表演。这样的音乐提供了一个最高水平的互动性的复杂模型。
计算机可以与表演者进行微妙或隐秘的互动，自行创造可听的音乐，
似乎独立于现场表演者。表演者和计算机都不可能 "控制"，但每个人
23
都会对对方的反应产生一些影响。自由即兴创作的模式带来了艺术和
技术上的挑战，可能会产生新的音乐形式，与互动作曲的技术相适应。
这种 "虚拟 "表演者的想法在作曲家和即兴表演者乔治-刘易斯的作品
中可以看到一个很好的例子，他描述了他在 70 年代末用 Forth 编程语
言编写的互动系统创作和表演的早期经历。来自一个强调音乐中集体
即兴表达的传统（非裔美国人），这种用计算机做音乐的方式似乎很
自然。计算机被认为是 "乐队中的另一个音乐家"。在调整阶段花了几
个小时，听和调整计算机的实时输出，寻找与人类音乐家兼容的行为
范围。所谓兼容，我的意思是，音乐会传递有关其来源的信息。一个
即兴演奏者（任何人，真的）把某些声音活动的存在或不存在作为正
在发生的事情的指南（刘易斯 Lewis 1994）。
刘易斯的策略允许计算机和表演者之间有很大的独立性，建立起不直
接控制对方的音乐个性，而是相互影响，为即兴创作的最终结果做出
贡献。他的目标是将计算机的 "演奏 "视为独立于表演者的行为，使
其可作为音乐独立聆听。他解释说。
对我来说，这种独立性是必要的，以便给即兴音乐家一些思考的东西。
后来，当我谈到与这个计算机程序的一些后期模型的音乐 "互动 "时，
我的意思是，这种互动是以两个有自己 "个性 "的即兴演奏者的方式
进行的。程序从我的活动中提取的重要特征并没有被直接重新引入，
而是被用来制约和指导一个独立的实时算法构成过程。
表演者与这一过程的可听结果进行互动，就像程序与我在音乐上思考
的可听结果进行互动一样；交流的任何一方都没有最终的权力来强迫
某种结果，没有人 "负责"。我只通过自己的音乐行为与这种程序交流。
因此，由软件识别的表演特征被间接地应用到计算机音乐中，造成的
反应并不总是那么明显，但仍然受到表演者行为的影响。要成功地处
理这样一种收费形式，需要表演者有很高的技巧，而表演者在很大程
24
度上也是作曲家。更多的时候，作曲家会创造一个或多或少的刚性框
架或结构，在其中展开互动。
Musical Form and Structure
音乐的形式与结构
音乐是一种时间性的艺术，一种以时间为主要媒介的艺术。希望大多
数作曲家都有产生有趣的音乐材料的天赋。正是在这些材料的构成中，
更深层次的艺术才得以展现。在这种情况下，作曲是关于音乐结构、
音乐形式，特别是时间。戏剧性的情节就是这样产生和展开的。音乐
是关于什么的（人物、场景、情节）？什么变化？它是如何变化的
（戏剧性动作）？何时变化（戏剧性的时间）？剥夺一些表演者的控
制权可能会产生一个精确制作的作品，其结构和时间对作品的实现至
关重要。如果增加表演者的控制权，就会增加自发表达和偶然结果的
机会。在一个精心描述的结构中进行表演，同时又允许表演者在这些
范围内自由发挥，这是可行的。例如，流行的摇滚歌曲可能会在一个
严格的结构中出现即兴的吉他独奏。虽然表演者在自由即兴的表演中
可能会体验到极大的自由和联系，但概念性或结构性的框架给了音乐
一个连贯的形状和风格上的一致性，为表演者和观众提供了一个路标。
因此，互动作品的作曲家面临的新挑战之一是在灵活的音乐结构基础
上创造出可塑性强的形式，对人的输入做出反应。
Levels of Indeterminacy
不确定性的层次
当开始形成理解互动关系的概念基础时，传统模型可能是有用的。然
而，由于计算机的优点是它可以做人类表演者不能做的事情，因此必
须摆脱传统模型的限制，开发新的形式来利用计算机的能力。最值得
关注的是区分预定的和不确定的行动。
预先确定的动作在表演开始前就已经知道了，对表演者来说是一个记
谱，对计算机来说是一个序列（或一个产生固定结果的算法）。预先
25
确定的动作通常更容易实现，非常可靠，可以在创作时非常注意细节，
并且可以代表作曲家对作品的理想化设想--一个抛光的、完成的版本。
然而，即使在传统的演奏家的乐谱中，也有许多不确定的因素可以解
释（如音调、时间、分句和衔接的微妙之处）。因此，根据预测表演
最终结果的能力，不确定性存在于几个层面上。然而，它通常是一个
术语，表示没有精确固定或事先确定的重要音乐特征。
对过程、关系、行动和对话感兴趣的作曲家可能更喜欢高度不确定的
行动，这些行动是即兴的或基于具体结果未知的过程。结果可能从完
全令人惊讶的结果到一系列已知的可能性。与预先确定的行动相比，
不确定的行动往往更加自发、富有表现力和互动。它们也可能更难实
施，更难控制，更不可靠。例如，当一个表演者即兴表演时，输入对
系统来说是意想不到的，而对于记谱来说，计算机可能包含一个表演
者的乐谱版本并寻找预期的输入。
(见第九章的乐谱。）即兴表演的作品需要软件来识别表演的特征或条
件来触发事件。
同样，计算机的输出也可能是不确定的，从产生微小差异的变化的高
度约束过程到不断给表演者带来惊喜的疯狂随机结果。不确定性往往
是由于将一些控制权交给了具有广泛变化的行为的不可预测的过程。
即兴演奏的过程具有高度的不确定性，因为音乐特征并不是事先精确
固定或确定的。不确定性的概念非常适合于计算机音乐，因为它的随
机性程度和随机参数的范围可以被精确指定（见第 7 章）。作曲家约
翰-凯奇（John Cage）在四、五十年代开创了不确定的作曲技术，他
创造了非常严格的规则（算法），为原声合奏和电子磁带作品生成大
的乐谱。为了创作他的一些作品，他用随机程序在许多作曲选项中挑
选一个，或设置音乐参数。他还试验了表演中的不确定性，向表演者
提供口头指示或图形图像来代替传统的乐谱。许多作品使用了 "机会
26
操作"，如投掷硬币，来创造从最小的细节到较大的音乐结构的一切
（Nyman 1980）。
许多作曲家都受到凯奇作品的影响，并以不同的、富有想象力的方式
实施他的一些想法。特别值得注意的是厄尔-布朗的作品，他的 "开放
形式 "作品受到亚历山大-考尔德的摩天大楼的启发。凯奇使用随机程
序来摆脱他自己对音乐材料的影响，而布朗则使用他的作曲技巧来事
先创造他所有的音乐材料，让音乐家们在一个有意模糊的形式中从这
些材料中选择。两部名为《可用的形式》（1962-63）的管弦乐队作品，
由许多标有大数字的短段音乐组成。在演出过程中，指挥家即兴选择
和安排音乐材料，通过举起代表音乐片段的手指数量来选择音乐段落
和乐器，并提示独奏者、乐段或整个乐队。
在《可用形式》中，乐谱片段完全是写出来的，但乐器、密度、时间
和预写材料的选择则完全由指挥家掌握。通过这种方式，音乐以可变
化的形式表现出来，就像考尔德的摩拜单车，其材料从未改变，但其
形式却随着各部分的旋转而不断变化（格里菲斯，1981）。
欧洲作曲家，最引人注目的是卡尔海因茨-斯托克豪森，也创作了移动
形式的作品，使用精心设计的不确定过程来创造音乐材料和形式。维
托尔德-卢托斯劳斯基（Witold Lutoslawski）的管弦乐作品以短小的
准预演时刻为特色，周围是较大的、仔细记谱的部分，这些部分在大
尺度上定义了形式。因此，在一个预先确定的结构中存在着不确定的
事件。五十年代和六十年代的开创性实验作品值得研究，因为它们是
互动和不确定性的模型，可能对电脑音乐家有用。
Linear vs. Nonlinear Structures
线性结构和非线性结构
一部完成的作品的结构最常由多个部分组成，局部事件决定了一个音
符或声音与下一个音符或声音的联系。局部事件和较大的作曲结构都
27
可能或多或少地被预先确定或不确定。交互式软件的设计将取决于互
动的类型以及在大结构和小事件中所需要的自由度。
作曲结构可以被认为是线性的，像传统的乐谱那样按顺序排列，也可
以是非线性的，每次演出时，由演奏者输入或计算机处理决定的不同
部分的排列（见图 2.1）。在每个大的部分中，较小的 "局部 "事件可
能像传统的乐谱一样被预先确定和排序，或者它们可能包含不确定的
方面。
非线性结构的部分，其顺序在演出前并不确定，在任何时候都有几个
部分的组成。例如，一个乐谱可能包含五个乐段，可以按任何顺序演
奏。因此，选择章节的方式，或浏览大量材料的方法，将对作品的形
式产生重要影响。根据用户的输入对音乐章节进行计时和排序，需要
新的作曲思维模式，挑战传统的形式和凝聚力的概念。结构、形式、
时间、顺序、发展和过渡。这些是传统乐谱的作曲家们最关心的一些
问题。采用非线性结构的作曲家必须愿意放弃对这些重要的作曲决定
的完全控制，把它们委托给表演者或即兴的计算机程序。如果这些部
分看起来毫无联系或目的地突然出现，就有可能失去作品作为一个完
整的整体的感觉，也就失去了使一些音乐具有连贯的戏剧性结构的连
接的、向前推动的动力。获得的是一种可塑性强的形式，充满了自发
性和发明性，由熟练的表演者赋予其形状。类似的非线性结构的概念
可以在 CD-ROM 标题、超文本和多媒体作品中看到，其中的导航问题影
响了凝聚力和体验。
一个具有许多高度互动参数的单一大型计算机程序也可以作为一个非
线性结构，而不需要指定章节，因为这样一个复杂的系统可以一直
"开着"，以许多不可预测的方式对表演者的输入做出反应。
这个模型假设计算机的反应将是丰富多样的，是一个能够做出明智音
乐决定的虚拟实体。
这样的程序结构似乎暗示了自由即兴演奏的输入，但这绝不是唯一的
选择。事实上，表演者在一个非常自由的交互式计算机环境中演奏传
28
统的书面乐谱可能会产生令人信服的结果，乐谱解释的微妙之处反映
在计算机音乐中，而计算机反过来又影响到表演者对乐谱的解释。
预先确定的与即兴的事件
Predetermined vs. Improvisational Events
音符、短语、节奏、声音、动态和衔接构成了较小的音乐事件，
形成较大的部分。就像它们所创造的结构一样，表演者和计算机
的音乐事件可以是预先确定的，也可以是即兴的。(对于不确定的
音符到音符的事件来说，即兴演奏是一个比非线性更好的术语，
因为在这个微观层面上的音乐通常看起来是线性的）。演奏者的
书面乐谱与计算机的固定序列是对应的。在这里，一个序列不仅
可以被视为预先录制的表演，也可以被视为每次运行时产生相同
音乐结果的任何计算机程序。例如，储存在计算机中的音高组和
29
节奏值或数学函数可以作为输入，为每次表演产生相同的音乐段
落。
即兴演奏是一个巨大的主题，超出了本书的范围。
关于爵士乐即兴演奏的大量文献值得研究，以寻找适用于互动作
品的概念。表演者的即兴表演可以与计算机的即兴表演过程结合
起来，模拟两个或更多形成者之间的对话。即兴演奏也可以通过
指定目标音符来触发储存在计算机中的预定事件数据，这些目标
音符可以用来触发诸如预定宽音符的短序列或提供储存的和声伴
奏。
计算机可以处于即兴创作的 "状态"，等待任何输入而不需要表演
者的期望，并包含产生连续变化或其他不可预知结果的随机变量。
一个高度即兴的作品可以有几个部分，每个部分的行为都是静态
的，即它总是 "开着"，对演奏者的输入不断做出反应。因此，在
一个部分中可以有大量的活动和变化，但每个部分的特征都是不
同的，基于选定的计算机程序。因此，每次演出都是熟悉的，但
又是不同的。即兴演奏部分也可以发展，音乐参数随着时间的推
移逐渐变化。
在严格预设的音乐和 "自由 "即兴创作之间，存在着结合这两种
技术的策略。通常情况下，作曲家可能希望将一些章节划定为线
性结构，以控制时间、节奏或和声运动的感觉，而在这个大结构
中的小事件则可以进行即兴创作和惊喜。
需要记住的一点是，要成功地创造一个完全 "自由 "的表演，需
要非常高水平的即兴表演技巧和艺术性。当使用未受过即兴艺术
训练的表演者时，最好是使用书面乐谱或指导性的即兴表演，提
供音乐模型或指令，以限制材料的选择。一些 "自由 "的部分，
30
即音乐家对电脑音乐作出纯粹的反应以创造一种对话，可以与更
多预先确定的部分混合。
这些关于控制和期望的问题，以及它们所创造的戏剧性，都是成
熟的探索，暗示着许多类型的关系在互动媒介中是独特的习惯。
例如，一个表演者可能正在控制计算机的节奏，突然间节奏被计
算机接管，迫使表演者 "跟上 "它，由此产生的挣扎产生了可听
的紧张。或者，表演者的部分即兴表演可能成为计算机变化的基
础，因为它们被发送到各种转换算法中。这些技术为交互式作曲
带来了巨大的希望，提出了一种新的音乐创作范式。耐人寻味的
是，演奏者必须努力学习计算机算法的个性，以便与计算机进行
对话，而计算机音乐也可能反过来 "学习 "演奏者的音乐个性，
纳入他或她的人类特质和微妙的演奏风格。
Instrument Design and Limitations
乐器设计和局限性
控制也可以从表演者和他们的乐器之间更直接的层面来看。每件
乐器独特的发声机制的物理限制，需要物理技能，使乐器难以控
制。这有助于创造出与该乐器相关的特质，也就是赋予其特性的
品质。许多二十世纪的作曲家，为了追求新的声音，通过突破正
常的演奏方法来挑战乐器的物理限制。例如，约翰-凯奇（John
Cage）为预制钢琴创作了一些作品，要求演奏者在钢琴弦上插入
金属螺栓、橡皮筋和纸片来改变乐器的声音。其他作曲家使用这
种扩展技术来演奏铜管乐器，将铜锣放在水盆中，或敲击弦乐器
的木质琴身。
具有讽刺意味的是，计算机音乐以其创造新声音的无限能力，缺
乏对演奏技术的物理限制，沙子的声音产生机制是负责在原声音
乐中产生如此丰富和特征。因此，当应用于反映其特异性的声音
31
和计算机音乐过程时，由特定器乐技术塑造的表演姿态成为有价
值的数据。此外，通过限制计算机对音域或动态水平的反应，改
变发音，或创造一个稍微不均匀的节奏，可以模拟这些物理限制
的某些方面。第七章将介绍定义乐器和 "人性化 "技术的想法。
人机互动始于研究产生音乐的物理动作和响应这些动作的乐器的声学
特性。用手臂给大提琴鞠躬与对着萨克斯风吹气是完全不同的物理活
动，这些动作有助于产生特定乐器的特有声音。管弦乐队通过考虑每
种乐器独特的发声方法和演奏技巧所产生的细微差别，来利用各种乐
器的优势和劣势。
MIDI 设备可分为几类。大多数专用的 MIDI 控制器都是以声学乐器为模
型，如键盘合成器、电子鼓垫或管乐器控制器。这些设备利用了音乐
家对乐器的专业知识。它们作为数字声音模块的熟悉界面，可能是乐
器的一个组成部分，如大多数 MIDI 键盘，也可能是一个独立的机架式
单元，由外部控制器访问。
虽然大多数 MIDI 乐器不产生原声，但混合 MIDI/原声乐器，如 Zeta
MIDI 小提琴或雅马哈 MIDI 大钢琴，试图拥有两方面的优点：由传统乐
器产生的真实原声，以及准确和可靠的 MIDI 控制器。这使演奏者能够
发挥多年来在实践中形成的所有微妙的音色制作和解释的变化，同时
还能发送数字信息。许多这类乐器有专门设计的硬件开关，从演奏的
物理方面确定 MIDI 信息，如弦乐器的手在颈部的位置或管乐器的阀门
位置。
音高-MIDI 转换器也用于混合 MIDI/声学乐器，以跟踪音高和动态，但
其主要用途是在传统的声学乐器上增加 MIDI 功能，将其通过麦克风接
收的音频信号转换为 MIDI 数据。虽然这看起来很理想，但声音的复杂
性和原声乐器的各种演奏技巧使得从原声领域到数字领域的转换变得
困难。到目前为止，独立的音高-MIDI 转换器已被证明不如专门设计的
MIDI 仪器准确。
32
连续控制器设备通过增加脚踏板、数据滑块、触后和调制轮，增强了
MIDI 乐器的性能。连续控制器为合成器参数增加了物理挂钩，塑造了
声音的各个方面，应该被认为是对传统乐器模型的重要和表现力的补
充。Max 可以跟踪每个控制器，因为它在 O a 和 127 之间发送连续值。
有些控制器甚至可以向 Max 提供关于音色模块如何产生音色和颤音变
化的线索，因为这些参数的控制通常被分配给触后、呼吸控制和调制
轮。
一些非常规的 MIDI 设备已经被开发出来，有望成为人类与计算机互动
的新方式。这些设备大多被设计成将身体运动和身体位置变成 MIDI 数
据。(详见第 10 章最后一部分)这些专用的 MIDI 控制器为非音乐家与作
曲家的互动提供了令人兴奋的艺术可能性。因此，可以根据舞者的动
作产生音乐，利用专业的身体控制和对身体的表现力使用。对人的存
在作出反应的运动探测器，允许人们 "走过 "主动声音装置，通过
MIDI 触发声音。
不应低估打字键盘和鼠标作为塑造和产生音乐的设备，因为它们具有
大量专家用户的优势。打字员已经可以执行快如闪电的击键；甚至儿
童在玩挑战手眼协调的电脑游戏时，也能迅速获得专业知识。键盘为
输入准确和不连续的数据提供了一个简单的布局，而鼠标则代表了手
的运动，用熟悉的手势顺利地描述了连续的数据。这种技术不应该与
音乐家多年来在传统乐器上塑造乐句的经验相提并论，因为使用键盘
和鼠标，乐器的许多表现力会丧失。此外，舞台上的表演者毫不费力
地在电脑键盘上打字的戏剧性，缺乏音乐家演奏乐器时的努力和优雅
的视觉兴趣和戏剧性。然而，计算机的控制为许多人打开了创作和表
演的大门，否则他们可能永远不会积极参与到音乐创作中。它还迫使
训练有素的音乐家进入新的领域，使他们不可能退回到与乐器相关的
根深蒂固的习惯中去。许多作曲家使用这些标准的计算机输入设备进
33
行练习，以便在表演中控制软件，在表演中计算机可以作为独奏乐器，
也可以作为其他乐器（或其他计算机）合奏的一部分。
这里描述的众多类型的输入设备都有其优点；作曲家的需要将决定哪
种设备最有效。应该考虑到用于向计算机发送数据的各种物理手势，
以及特定的人类动作如何能最好地服务于一个作品。基于原声乐器的
模型，不仅有先前音乐经验和训练的好处，而且还有与该特定乐器相
关的所有旧习惯和态度。用旧乐器演奏新的声音，只有在旧技术对作
品有效的情况下才有意义。
音乐史表明，新技术总是影响着乐器的设计并引发新的音乐思想。肖
邦和李斯特的钢琴音乐就是受到新钢琴设计的巨大戏剧性声音的启发。
1825 年左右，一体式铸铁框架的开发使较粗的琴弦的光亮和响亮成为
可能。留声机唱片和磁带激发了皮埃尔-谢弗在 1940 年代末开始的具
体音乐实验。1930 年代吉他拾音器的发明是后来摇滚乐发展的核心。
因此，在今天，随着数字技术提供新的声音和表演能力，旧的乐器正
在演变，新的乐器正在制造，以充分实现这种新的潜力，这是合理的。
新的作曲理念需要新的技术资源，许多技术创新都是由作曲家的音乐
理念推动的。
第二章：Programing Foundation 编程基础
3.Graphic Programing with Max
用 Max 进行图形编程
34

交互式音乐书中文

Uploaded by

Document Information

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

交互式音乐书中文

Uploaded by

Copyright:

Available Formats

Composing Interactive Music

Techniques and Ideas Using Max

1）.Introduction and Background

Components of an Interactive System 交互式系统的组成部分

Enhancing the Roles of Performer and Composer

Audience Reception and Participation

A Brief History of Interactive Composition

Early Analog Experiments

Early Computer Experiments

作曲家 Joel Chadabe 自 1967 年开始在他的音乐中采用交互概念，当

许多乐谱跟踪问题首先由在 IRCAM 和 MIT 工作的 Barry Vercoe 和在

History and Development of Max

2）Interaction: Defining Relationships between Computers

You might also like

交互式音乐书 中文

Uploaded by

Document Information

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

交互式音乐书 中文

Uploaded by

Copyright:

Available Formats

Composing Interactive Music

Techniques and Ideas Using Max

1）.Introduction and Background

Components of an Interactive System 交互式系统的组成部分

Enhancing the Roles of Performer and Composer

Audience Reception and Participation

A Brief History of Interactive Composition

Early Analog Experiments

Early Computer Experiments

作曲家 Joel Chadabe 自 1967 年开始在他的音乐中采用交互概念，当

许多乐谱跟踪问题首先由在 IRCAM 和 MIT 工作的 Barry Vercoe 和在

History and Development of Max

2）Interaction: Defining Relationships between Computers

You might also like

交互式音乐书中文

交互式音乐书中文