You are on page 1of 22

Introduccin

El audio digital acaba de cumplir cuarenta aos.


Ms de uno se asombrar con semejante afirmacin, pero lo cierto es que la aplicacin de la
informtica al sonido es casi tan antigua como los propios ordenadores. Lo que tal vez no
prevean aquellos visionarios pioneros era la importancia que este fenmeno ira tomando con
el tiempo. Tanta, que hoy en da, el ordenador est presente en todas las facetas de la
creacin musical, en la composicin, la interpretacin, la grabacin, la produccin y la
reproduccin.
Lo que durante aos fue casi un secreto en manos de centros de investigacin privados o
universitarios, sufri una primera democratizacin hace algo ms de una dcada, con la llegada
del MIDI y del disco compacto, dos muestras muy diferentes de las posibilidades del
ordenador en el campo de la msica. Desde entonces, pocos son los msicos profesionales
que no aprovechan en alguna medida el enorme potencial del MIDI y, muchos menos, los
aficionados que siguen reproduciendo aquel rito consistente en sacar el vinilo de su funda
flexible y levantar con cuidado el brazo del tocadiscos.
La segunda revolucin se est produciendo ahora mismo, y su lder tiene un nombre:
multimedia. Como todos los cambios, ste tiene su aspecto positivo y su aspecto negativo.
Por un lado, ha abierto la posibilidad terica de que cualquiera pueda participar, casi en
igualdad de condiciones, en la vorgine del mercado musical y, lo que es ms importante, est
fomentando el surgimiento de nuevas formas de entender y de crear la msica. Como
contrapartida, los ordenadores se han llenado de muchas musiquillas totalmente
prescindibles, trivializando al mximo el fenmeno de la creacin musical. Y en consecuencia,
han proliferado tambin en revistas especializadas en multimedia un sinfn de artculos poco
claros y nada rigurosos, en muchos casos plagados incluso de incorrecciones y barbaridades,
que han colaborado a enmaraar este campo y a confundir totalmente al aficionado.
Para hacer msica, no hay desde luego nada como saber msica, pero este conocimiento
(cada vez ms relativo) no es ni estrictamente necesario ni siquiera suficiente. Hasta hace
poco, cuando uno senta esta necesidad y no posea demasiados conocimientos, sola
plantearse dos opciones: o ponerse a estudiar, o coger una guitarra, un micro o una batera. Y
la historia ms reciente nos demuestra que por este ltimo camino tambin se puede llegar a
obtener resultados muy loables. Ahora, puede adems, coger un ordenador.
Como cada medio, ste posee sus propias reglas, exigencias y peculiaridades. Desde este
libro no le podemos ensear a hacer msica interesante, pero s al menos a que conozca las
herramientas de que dispone, las principales mejoras que podra incorporar a su sistema
informtico-musical, y los muchos trucos que le permitirn enriquecer cualquier resultado. Y le
ayudaremos tambin a tener nuevas ideas, ya que stas surgen con mayor facilidad, cuando
mejor se conoce el medio con el que se trabaja. Tenga en cuenta que, en la msica
informtica, la agilidad mental es ms importante que la agilidad digital1.
Y si usted no siente deseos, o no se cree capacitado para componer, probablemente tiene la
curiosidad de saber cmo funcionan estas cosas, de conocer ms a fondo para qu sirve la
tarjeta que se oculta en las entraas de su ordenador (si no fuera as, no estara leyendo esta

1
De dedo no de dgito!

Sergi Jord Puig, Audio digital y MIDI, Guas Monogrficas Anaya Multimedia, Madrid 1997
introduccin). En este caso, su curiosidad quedar satisfecha. Y quin sabe, tal vez incluso le
acabe picando el gusanillo
Despus estn los programadores, que intuyen el potencial que se oculta tras el MIDI y el
audio digital, pero no encuentran la informacin necesaria. Para ellos, dedicamos dos extensos
captulos a la programacin MIDI, con ejemplos operativos en Visual Basic y en lenguaje
C.
Por ltimo, este libro tambin tiene bastante que aportar a los msicos que trabajan con el
MIDI desde hace tiempo, y que dominan con soltura sus aspectos ms prcticos. Aquellos
que acaban de cambiar de ordenador, y que se han decidido a jubilar aquel Atari que tan
buenos momentos y resultados les ha proporcionado, podrn descubrir todas las prestaciones
de un sistema que, como el PC de hoy en da, es mucho ms potente y abre un sinfn de
nuevas posibilidades (samplers econmicos, grabacin multipista a disco duro, etc.). Y los
que deseen consolidar sus conocimientos y profundizar en los aspectos ms tericos de las
tecnologas que usan a diario, tambin encontrarn aqu una importante fuente de
conocimientos, as como una rpida referencia para muchas de las dudas que les puedan ir
surgiendo. Varios cursos de informtica musical, impartidos a estudiantes de cierto nivel, me
han evidenciado que muchos conocimientos, supuestamente bsicos, no siempre estn tan
claros como cabra esperar.

Sergi Jord Puig, Audio digital y MIDI, Guas Monogrficas Anaya Multimedia, Madrid 1997
Cmo usar este libro

La idea de este libro surgi a raz de varios cursos de informtica musical y programacin
MIDI impartidos en el Institut Universitari de lAudiovisual, de la universidad Pompeu
Fabra de Barcelona, al observar que la bibliografa sobre el tema, sigue siendo hoy bastante
reducida. La mayora de libros interesantes estn en ingls y no son adems fciles de
conseguir. Los pocos publicados en castellano, son, salvo honrosas excepciones, demasiado
superficiales o han quedado desfasados. La intencin inicial era dar una base slida y
completa tanto para el msico que comienza, como para el que desea consolidar sus
conocimientos, en el rea de la informtica musical.
Por otro lado, es innegable que con el auge del multimedia, existen muchos nuevos usuarios
con inquietudes y disposicin, que no encuentran la informacin necesaria para comenzar a
adentrarse en estos terrenos. Por ello, este libro intenta combinar los aspectos tericos
fundamentales que rigen el sonido digital y la msica por ordenador, con las posibilidades
prcticas que los ordenadores multimedia ofrecen hoy en da. Cuando ha habido que elegir
una plataforma y un sistema en los que mostrar los ejemplos y los productos actualmente
disponibles, la eleccin ha recado sobre el PC y el sistema operativo Windows
(especialmente la versin 95).
Los productos cambian muy rpido, y es por ello peligroso aconsejar determinadas
aplicaciones o dispositivos de hardware, pero creemos que el salto cuantitativo importante
que se ha producido en el terreno de los ordenadores PC compatibles durante los aos 1995
y 1996, dejar sus secuelas durante cierto tiempo.

Material necesario

Se asume que el lector dispone de un ordenador y de una tarjeta de sonido. Si no fuera as, en
los captulos 11 y 12 se estudian las tarjetas de sonido en profundidad, lo cual puede servir de
ayuda a la hora de adquirir una. En los captulos 5 y 6 es conveniente la utilizacin de un
software editor de sonido para aplicar los conceptos tratados. El libro no sigue ninguno en
particular, aunque en esos captulos, se recomiendan varias utilidades shareware. Ms
adelante se estudia el software secuenciador, tambin de forma genrica, por lo que sera muy
conveniente que el usuario dispusiera de uno, as como de un teclado MIDI. Muchos de los
programas shareware o de dominio pblico que se mencionan a lo largo de la obra pueden
obtenerse en Internet, y en un apndice se incluyen algunas direcciones interesantes.

Esquema general de la gua

Como reza el ttulo, este libro trata dos grandes temas, que en la prctica se combinan, pero
que estn conceptualmente separados: el audio digital y el MIDI. Nos ha parecido
incuestionable comenzar por el audio digital, para pasar despus al MIDI, y mostrar
finalmente en el ltimo captulo el inmenso potencial que ofrece el uso combinado de ambas

Sergi Jord Puig, Audio digital y MIDI, Guas Monogrficas Anaya Multimedia, Madrid 1997
tecnologas; posibilidad que en el terreno de los ordenadores compatibles est disponible, a
nivel masivo, slo desde 1996.
Aconsejamos una lectura progresiva, aunque el lector impaciente podr saltar de un tema a
otro intentando respetar los bloques que se indican a continuacin. Asimismo muchos de los
captulos podrn ser utilizados para consultas posteriores, por lo que hemos dedicado un
especial esfuerzo en facilitar la localizacin y el acceso a informaciones puntuales.
El audio digital se trata en los captulos 1 a 6. El captulo 1 estudia principios bsicos de
acstica musical y el captulo 2, los aspectos fundamentales del audio digital. Aunque en
ambos se han evitado complejas frmulas y demostraciones matemticas, incluyen todo lo
necesario para la comprensin de lo que sigue. Un lector con conocimientos en ambos
campos podra tal vez saltrselos, pero un breve repaso le ayudar a refrescar la memoria y a
aclarar conceptos.
El captulo 3 explica las peculiaridades y el uso del audio digital en los ordenadores, de forma
totalmente independiente de cualquier plataforma. El captulo 4, se centra en cambio en la
implementacin que del audio digital hace Windows 95 (indicando cuando las hubiera, las
particularidades de Windows 3.1), y aunque su contenido terico es muy escaso, ayudar a
cualquier usuario de este sistema, a configurar bien el ordenador, a comprender sus
peculiaridades y a realizar las operaciones ms bsicas (digitalizacin de sonido, control del
mezclador, etc.) algunas de ellas fundamentales para el resto de la obra. Un usuario de otra
plataforma (Apple, Unix, etc.) podr saltarse este tema.
En los captulos 5 y 6 se explican los procesos tpicos disponibles en un programa editor de
sonido. En ambos se describen ejemplos con varios programas de Windows (en su mayora
de dominio pblico), por lo que para seguirlos sera conveniente que el lector dispusiera de
algunos de ellos. Las tcnicas descritas en el captulo 5 pueden considerarse ms bsicas,
mientras que las del captulo 6 implican un contenido terico superior. Por ello, se discuten
tambin de forma sencilla algunos conceptos de proceso digital de seal.
Los captulo 7 a 14, tratan del MIDI en general. El captulo 7 es una introduccin al tema, que
podrn saltarse los que lleven tiempo trabajando con l. El captulo 8, trata en cambio todos
los mensajes MIDI en profundidad, por lo que es de lectura (y relectura) obligada. En algunos
puntos se asumen ciertos conocimientos informticos bsicos (sistema binario), por lo que es
posible que, en el primer acercamiento, este capitulo pueda parecer un tanto denso, pero est
estructurado de forma que permita una utilizacin como referencia rpida. Por ello, si la
primera lectura se le hace excesivamente farragosa, podr volver a l siempre que necesite
reafirmar sus conocimientos.
El captulo 9 cubre la sntesis digital. En principio est enfocada a los sintetizadores MIDI y al
sampler, pero tambin podra leerse como continuacin del captulo 6. En cualquier caso
incluye muchos aspectos fundamentales que sern desarrollados en los captulos 11 y 12,
dedicados a las tarjetas de sonido.
Los captulos 10, 11 y 12 se dedican al hardware MIDI. En el 10, se tratan brevemente
desde los dispositivos ms frecuentes (como el teclado) a otros que no lo son tanto. No se
trata de adquirirlos todos, sino de obtener una visin global de la multiplicidad de enfoques
permitidos y de las posibilidades actuales. Los captulos 11 y 12 se centran en las tarjetas de
sonido. Primero de forma ms terica, estudiando los diversos tipos y sus caractersticas, para
realizar, en el captulo 12, un anlisis comparativo de los modelos ms aconsejables,
disponibles a principios de 1997.

Sergi Jord Puig, Audio digital y MIDI, Guas Monogrficas Anaya Multimedia, Madrid 1997
Los captulos 13 y 14, tratan sobre el software MIDI. El primero se dedica por completo al
secuenciador, el programa ms importante de todo estudio MIDI, mientras que en el segundo,
se contemplan los restantes tipos de programas disponibles. En ambos casos se analizan las
prestaciones de varios paquetes disponibles para Windows.
Los captulos 15, 16 y 17, cubren varios aspectos de la configuracin, gestin y programacin
MIDI en Windows. El primero es obligado para entender las peculiaridades de este sistema
operativo en lo que al MIDI se refiere. Los dos siguientes se reservan para los
programadores. El captulo 16 trata el uso de comandos MCI, mientras que el 17 se centra en
la programacin MIDI de bajo nivel. Ambos pueden estudiarse de forma independiente. En
los dos casos puede resultar conveniente repasar previamente el captulo 8.
Finalmente, en el captulo 18 se abordan las nuevas posibilidades de integracin del MIDI y el
audio digital, para finalizar con un repaso de los dispositivos analgicos imprescindibles en
todo estudio de msica por ordenador.
Termina el libro con tres apndices. El primero, destinado a aclarar algunos trminos y
conceptos musicales, est pensado para el lector con escasa formacin musical. En el segundo
se presentan en modo de tablas, algunas especificaciones tcnicas referentes al MIDI,
mientras que en el tercero se incluye una lista comentada de direcciones en Internet,
relacionadas con la informtica musical.

Sergi Jord Puig, Audio digital y MIDI, Guas Monogrficas Anaya Multimedia, Madrid 1997
Agradecimientos

Me gustara dar las gracias a todas aquellas personas que a lo largo de los ltimos diez aos
me han ayudado o encaminado a seguir en el campo de la informtica musical, y en especial a
Adolfo Nuez del Laboratorio de Informtica y Electrnica Musical de Madrid y a Xavier
Serra de la Fundaci Phonos de Barcelona. Tambin quisiera agradecer a Marisa Manchado
y a Gabriel Brncic por haberme animado a seguir componiendo en algunos momentos en que
no lo he tenido tan claro, a Marcel.l Antnez que me fuerza, con sus propuestas, a descubrir
cada da nuevos horizontes informtico-creativos y a Cristina Casanova que ha colaborado en
las imgenes del libro y con sus apreciaciones, sugerencias y acertados comentarios.

Sergi Jord, Barcelona 1997.

Sergi Jord Puig, Audio digital y MIDI, Guas Monogrficas Anaya Multimedia, Madrid 1997
1. Principios de acstica

1.1. Introduccin

Aunque se puede hacer msica sin tener demasiados conocimientos de acstica, parece
imposible comprender lo que es el sonido digital si no se tiene una idea de lo que es el sonido
en general. Por ello, este captulo describe de forma bsica los aspectos fsicos y matemticos
de las ondas sonoras que, junto con sus consecuencias psicolgicas, son la base de toda
experiencia musical. Empecemos pues por el principio.

1.2. Que es el sonido?

Lo que entendemos por sonido es fruto de una compleja interaccin entre un objeto vibrante,
un medio transmisor (frecuentemente el aire), el odo, y el cerebro. Para que la vibracin sea
audible para un ser humano, este objeto debe oscilar aproximadamente entre 20 y 20.000
veces por segundo. Al oscilar, el objeto desplaza el aire que lo rodea, comprimiendo y
descomprimiendo peridicamente las molculas que lo integran, y modificando por
consiguiente la presin del aire de forma peridica. Dado que las molculas desplazadas van
empujando a las contiguas, la variacin peridica de la presin se propaga originando lo que
recibe el nombre de ondas sonoras. Cuando las ondas llegan al odo, el cerebro interpreta
estas variaciones de presin como sonido. Si la presin del aire que circunda el odo se
mantiene constante, no omos nada, u omos el silencio.
Las ondas sonoras se propagan en el espacio, formando invisibles esferas centradas en el
objeto que oscila. Conforme aumenta la distancia al origen y el radio de estas ondas, aumenta
tambin el volumen y la masa de aire que stas deben desplazar, por lo que las oscilaciones se
hacen cada vez ms dbiles (la presin del aire vara cada vez menos, aunque siga hacindolo
con la misma frecuencia) hasta que, a una cierta distancia, se tornan imperceptibles.
Este principio es vlido independientemente del objeto oscilador, que puede ser por ejemplo
una cuerda (guitarras, violines, pianos, cuerdas vocales, etc.), una columna de aire
semicerrada y excitada por una caa o una boquilla (saxofones, flautas, trompetas, rganos,
etc.), una pieza de madera, metal, piel, piedra, etc. golpeada (percusiones), o un cono de
papel (altavoces). En muchos casos, los objetos que entran en vibracin son en realidad
varios, como es el caso de la guitarra (o de la voz) donde lo que omos es la suma de las
vibraciones de las cuerdas y de la caja.
Asimismo, cuando estas ondas encuentran un obstculo, parte de las molculas que las
componen son absorbidas por el material, mientras que las restantes son reflejadas. Este
fenmeno origina que en la mayora de los casos, lo que nos llega al odo sea una suma del
sonido directo combinado con mltiples reflexiones de este sonido, ligeramente retardadas1.

1 El tiemp o de estos retardos ser proporcional a la distancia adicional recorrida, teniendo en cuenta que la
velocidad del sonido en el aire, es de aproximadamente 344 m/s.

Sergi Jord Puig, Audio digital y MIDI, Guas Monogrficas Anaya Multimedia, Madrid 1997
1.3. Caractersticas de los sonidos musicales

Para describir un sonido musical se utilizan tres trminos: altura, timbre e intensidad. Todo
sonido tiene una duracin y, a lo largo de sta, cualquiera de estos tres parmetros puede
variar (los sonidos naturales jams son perfectamente estables o constantes).

1.3.1. La altura y la frecuencia

La altura est directamente relacionada con la frecuencia de la oscilacin, pero ambos


trminos no son sinnimos. De hecho, muchos sonidos (como los percusivos) no tienen una
altura definida. El motivo de esta aparente paradoja es que, mientras la frecuencia es una
propiedad fsica indisociable de todo aquello que, como el sonido, vibra u oscila, la altura es
una cualidad subjetiva que percibimos slo en algunos sonidos2. Si golpeamos, por ejemplo,
un bombo o un platillo, podremos sin duda afirmar que el platillo suena ms agudo que el
bombo, pero no podremos decir si estos sonidos correspondan a un Do o a un La.
Que es lo que hace que un sonido posea o no una altura clara? Bsicamente, su
periodicidad. Es necesario que un sonido sea aproximadamente peridico, es decir que su
frecuencia de oscilacin no vare (o vare poco) dentro de un determinado lapso de tiempo,
para que lleguemos a percibir una altura. En una escala temporal mayor, la frecuencia s que
puede variar, y en este caso, lo que percibiremos son alturas variables en el tiempo.

Figura 1.1. Variacin de la presin en funcin del tiempo en un sonido peridico

En la figura 1.1 se muestra un sonido peridico, ya que la forma de la onda se repite


claramente. La frecuencia de este sonido vendr dada por el tiempo que dura este perodo, ya
que ambas magnitudes son inversas. Si este perodo durase por ejemplo una centsima de
segundo, su frecuencia sera de 100 Hz3.

2Por este motivo hemos aadido el epteto "musicales", en el ttulo de este apartado. Eso no significa que
estos sonidos sean los nicos vlidos para hacer msica, y la percusin es un claro ejemplo de ello.
3El Hz o hertzio es la magnitud fsica que mide la frecuencia, e indica el nmero de veces por segundo que
se repite determinado fenmeno.

Sergi Jord Puig, Audio digital y MIDI, Guas Monogrficas Anaya Multimedia, Madrid 1997
1.3.2. La octava y las notas

Un fenmeno muy importante relacionado con la apreciacin de las alturas, es el de la octava.


Si escuchamos dos sonidos cuyas frecuencias guardan una relacin de 2:1 (por ejemplo 400
Hz y 200 Hz), nos sonarn muy cercanos. El motivo es que entre los dos dista exactamente
una octava. Dado que cada vez que se dobla la frecuencia se sube una octava, un sonido de
880 Hz estar dos octavas por encima de uno de 220 Hz. Esta idea de octava se repite en
casi todas las culturas, a lo largo de la historia. Lo que s vara enormemente de una cultura a
otra es el nmero de subdivisiones que se aplican a la octava.
En la msica occidental, la octava se divide en doce alturas o semitonos, de las cuales siete
tienen nombre propio y corresponden a las teclas blancas de un piano. Las cinco restantes
(que corresponden a las teclas negras) pueden tomar el nombre de la inmediatamente anterior,
en cuyo caso se les aade el smbolo # (sostenido), o de bien la posterior, en cuyo caso se les
aade el smbolo b (bemol). De esta forma las doce notas de una octava pueden nombrarse
de dos maneras diferentes ( do, do#, re, re#, mi, fa, fa#, sol, sol#, la, la# y si, o bien do,
reb, re, mib, mi, fa, solb, sol, lab, la, sib y si). En la nomenclatura sajona las notas se
designan mediante letras maysculas, de acuerdo con la siguiente equivalencia (que conviene
tener presente, dado que, como se ver en la segunda parte de este libro, los programas
MIDI la utilizan profusamente)4.

Do Re Mi Fa Sol La Si
C D E F G A B

Conviene indicar que antes de J.S.Bach (siglo XVIII), la divisin de la octava se basaba en las
teoras del filsofo griego Pitgoras, segn la cual los intervalos formados por cada nota y la
siguiente no eran siempre idnticos. Para simplificar la construccin de instrumentos, en el siglo
XVIII se decidi dividir la octava en doce partes iguales, por lo que actualmente, la relacin
de frecuencias entre cualquier nota y la siguiente es siempre igual a 21/12 (1.05946). De esta
forma, al avanzar doce semitonos (una octava), obtenemos un factor de (21/12)12 que es
efectivamente igual a 2.

1.3.3. El timbre y los armnicos

El timbre podra definirse como el "color" de un sonido, y es lo que nos ayuda a caracterizar y
distinguir diferentes tipos de instrumentos, o a reconocer a las personas por su voz. Un La de
440 Hz en una clarinete suena diferente que el mismo La en un saxo; aunque ambos tienen la
misma altura, sus timbres no son iguales. La figura 1.2, que muestra fragmentos de estos dos
sonidos, junto con un tercer fragmento correspondiente a onda sinusoidal pura de la misma
altura, nos puede ayudar a comprender la naturaleza fsica del timbre. En los tres fragmentos,
el perodo es el mismo (pues tienen la misma altura), pero sus formas son diferentes.

4 En el apndice B se indican las frecuencias de todas las notas MIDI, y se puede observar como
efectivamente, estas frecuencias se duplican en cada nueva octava.

Sergi Jord Puig, Audio digital y MIDI, Guas Monogrficas Anaya Multimedia, Madrid 1997
Figura 1.2. Fragmentos de tres sonidos de la misma altura (La de 440 Hz) en un
clarinete (a), un saxofn (b) y una onda sinusoidal pura (c)

El motivo de esta diferencia de forma, es que las ondas de los sonidos naturales son ms
complejas porque vibran con varias frecuencias simultneas. En la naturaleza no se encuentran
sonidos puros con una sola frecuencia, como el de la figura 1.2.c; stos slo son obtenibles
por medios electrnicos.
En los sonidos naturales, la frecuencia de vibracin ms grave es la que determina
normalmente el perodo y la altura, y se denomina frecuencia base. Las restantes frecuencias,
que suelen ser mltiplos de la frecuencia base se denominan armnicos, y cada tipo de
instrumento tiene, por su construccin, una serie diferente de armnicos de amplitudes
diferentes, que son los que definen su timbre y otorgan las "seas de identidad" al instrumento.

Sergi Jord Puig, Audio digital y MIDI, Guas Monogrficas Anaya Multimedia, Madrid 1997
Las matemticas relacionadas con este concepto, fueron establecidas en el siglo XIX por el
fsico Jean-Baptiste Fourier, que descubri que toda seal peridica, por compleja que esta
sea, puede descomponerse como una suma de seales sinusoidales armnicas, es decir de
frecuencias mltiplos de la original. En la figura 1.3 se muestra la descomposicin de una onda
peridica (d) en sus varias ondas sinusoidales simples armnicas, de amplitudes diferentes.
Dicho de otro modo, la seal d es la resultante de sumar de las seales a, b y c.

Figura 1.3. Descomposicin de Fourier de una seal peridica en varias seales


sinusoidales

Cuando el sonido no es peridico, su descomposicin no puede llevarse a cabo mediante


frecuencias mltiplos por lo que los factores dejan de ser nmeros enteros. En estos casos
tenemos sonidos inarmnicos, en los cuales se hace difcil apreciar una altura precisa.

Sergi Jord Puig, Audio digital y MIDI, Guas Monogrficas Anaya Multimedia, Madrid 1997
1.3.4. La intensidad y los decibelios

Si la altura viene determinada por el nmero de oscilaciones por unidad de tiempo, la


intensidad depende del cuadrado de la amplitud de estas oscilaciones, o la diferencia entre las
presiones mxima y mnima que la onda puede alcanzar. La percepcin de la intensidad
sonora es, en realidad, un fenmeno auditivo muy complejo, mucho ms que el de la altura, y
lo que sigue es una inevitable simplificacin.
Las intensidades de diferentes sonidos pueden variar, aunque parezca increble, en varios
millones de rdenes de magnitud (es decir, el sonido ms intenso que podamos or, lo ser
varios millones de veces ms, que el ms tenue). Por ello, la intensidad se mide en una escala
logartmica, los decibelios (dB), de acuerdo con la siguiente frmula

Nivel de intensidad en decibelios (dB) = 10 x log10 (amplitud2/amplitud referencia2)

Esta expresin determina un nivel o diferencia de intensidad entre dos amplitudes. El origen (0
dB) corresponde al umbral de audicin (mnimo sonido audible). Por debajo de este valor
tenemos el autntico silencio, aunque en el mundo en que vivimos la experimentacin del
silencio se hace francamente difcil, por lo que muchos de nosotros probablemente no
lleguemos a conocer nunca el significado real de esta palabra. Por encima de los 130 dB se
produce una sensacin dolorosa. Valores superiores prolongados llegan a destrozar el
tmpano. En la tabla 1.1 siguiente se muestran algunos valores tpicos.
.
Descripcin Nivel (dB) Relacin de intensidad
Despegue de cohete espacial 190 1019
Despegue de un reactor 150 1015
Umbral de dolor 130 1013
Concierto de heavy metal 120 1012
Martillazos sobre una plancha metlica (a 50 cm) 110 1011
Trfico en calle concurrida 70 10.000.000
Conversacin normal (a 1 m) 60 1.000.000
Restaurante concurrido 50 100.000
Casa en la ciudad 40 10.000
Iglesia vaca 30 1.000
Estudio de grabacin 20 100
Umbral de audicin 0 1

Tabla 1.1. Ejemplos de niveles sonoros en dB.

He aqu algunas consideraciones adicionales:


El odo no es normalmente capaz de distinguir diferencias inferiores a 3 dB.
La intensidad de un sonido decrece aproximadamente en 6 dB cada vez que se dobla la
distancia.

Sergi Jord Puig, Audio digital y MIDI, Guas Monogrficas Anaya Multimedia, Madrid 1997
1.3.5 El rango dinmico

La diferencia entre los valores mnimos y mximos en dB, que un sistema puede producir se
denomina rango dinmico. En la tabla 1.2 se indican algunos valores tpicos.

Clarinete 86
Piano 94
Disco compacto 96
Trombn 107
Orquesta sinfnica 120

Tabla 1.2. Varios ejemplos de rangos dinmicos (en dB).

En la mayora de dispositivos de audio (amplificadores, pletinas de casete, reproductores de


compactos, altavoces, etc.) este valor figura entre las especificaciones tcnicas, como rango
dinmico o relacin seal/ruido5. En un aparato electrnico, el rango dinmico indica la
diferencia entre el nivel mximo que el dispositivo puede emitir, y el nivel del ruido existente
cuando no hay seal (el ruido de fondo). Cuanto mayor sea esta diferencia, ms limpio ser el
sonido del dispositivo. En una cadena de varios dispositivos de audio (emisor, amplificador,
altavoces, etc.) el valor real, es decir el mximo rango dinmico que podremos llegar a
apreciar, corresponder al del dispositivo con peores caractersticas.
En aparatos de cierta calidad, este valor suele estar comprendido entre los 80 y los 95 dB.
Tal como se indica en la tabla 1.2, en los reproductores de compactos, y en cualquier otro
dispositivo de sonido digital de 16 bits, este valor no podr nunca ser superior a 96 dB (en el
prximo captulo explicaremos la razn), pero incluso pocas veces se alcanza este mximo
terico, ya que la circuitera analgica presente en el dispositivo tiende a aadir ruido.

1.4. El sonido analgico

Hasta la aparicin de los ordenadores, el sonido se grababa siempre de forma analgica. Pero
qu significa exactamente este trmino?
El trmino analgico se utiliza actualmente en contraposicin a digital. Las seales analgicas
son funciones de variables continuas (frecuentemente del voltaje) cuyas evoluciones
temporales imitan (son una analoga de) las seales originales. La representacin grfica de
un sonido grabado analgicamente tendr aproximadamente la misma forma que el sonido
original, pero la curva indicar variaciones de voltaje, en lugar de variaciones de presin de
aire. Estas nuevas seales analgicas se obtienen por medio de transductores, trmino con el
que se designa a todo dispositivo capaz de convertir una magnitud fsica en otra.
El micrfono y los altavoces son los dos transductores bsicos utilizados en la grabacin y
reproduccin del sonido. En primer lugar, el micrfono convierte la variacin de la presin de

5 Aunque ambos trminos no son exactamente idnticos, de momento podemos obviar la diferencia.

Sergi Jord Puig, Audio digital y MIDI, Guas Monogrficas Anaya Multimedia, Madrid 1997
aire ejercida sobre su membrana, en una seal de voltaje variable en el tiempo. Este voltaje
puede ser grabado, utilizando diferentes tecnologas, sobre una cinta magntica o en los surcos
de un disco de vinilo. Cuando deseamos reproducir el sonido, la seal elctrica generada por
el cabezal de la pletina o la aguja del tocadiscos, es amplificada y enviada a los altavoces,
donde un nuevo transductor la convierte en un campo magntico capaz de desplazar y de
hacer oscilar (con las frecuencias originales) los conos de papel de los altavoces.
Conviene resaltar que aunque la grabacin se realice digitalmente, tal como se describe en el
prximo captulo, Principios de sonido digital, se seguirn llevando a cabo las
transducciones analgicas en el micrfono y en los altavoces. En la figura 1.4 se esquematizan
los dos procesos de grabacin alternativos.

Figura 1.4. Esquema de los procesos de grabacin analgica y digital

Al contrario de lo que opina la mayora, una grabacin analgica no tiene por qu sonar peor
que una grabacin digital (en condiciones ptimas, suena de hecho mejor). Sus inconvenientes
radican en que la seal analgica se degrada mucho ms rpidamente (las cintas magnticas se
desmagnetizan, y los surcos en el vinilo se desgastan), y que en cada nueva generacin se
produce una pequea pero inevitable perdida, de forma que, a cada nueva copia, la seal se
parece cada vez menos a la original.

Sergi Jord Puig, Audio digital y MIDI, Guas Monogrficas Anaya Multimedia, Madrid 1997
Por estas razones el sonido digital ha tomado definitivamente el relevo del analgico. Al
margen de la discutible cuestin de la calidad, en este libro se ver porque el sonido digital
aporta un sinfn de nuevas y excitantes posibilidades en la manipulacin, creacin y
experimentacin sonoras.

Sergi Jord Puig, Audio digital y MIDI, Guas Monogrficas Anaya Multimedia, Madrid 1997
2. Principios del sonido digital

2.1 Introduccin

El principio fundamental del audio digital consiste en discretizar las seales sonoras continuas
(como las emitidas por un micrfono) para convertirlas en secuencias de nmeros. La
discretizacin de estas seales se lleva a cabo en dos niveles diferentes, el temporal y el de la
amplitud. En la figura 2.1 se muestra una seal continua, discretizada slo en el tiempo
(cuadros blancos) y en el tiempo y la amplitud (puntos negros). Cuanto menor sea la
cuadrcula, mayor similitud existir entre la seal original y la seal digitalizada.

Figura 2.1. Discretizacin de una seal continua.

2.2. Comparacin con el cine y el vdeo digital

Para aclarar algunos conceptos, haremos una analoga con el cine y el vdeo digital. En ambos
medios, existe una discretizacin temporal (incluso en el caso del cine que no es un medio
digital). En el cine, la unidad de discretizacin temporal es el fotograma (24
fotogramas/segundo), mientras que en el vdeo esta unidad se suele denominar con el trmino
ingls frame (dependiendo del sistema, este valor suele ser de 25 30 frames/segundo). Esto
correspondera, en el audio, a la discretizacin temporal.
Pero en el caso del vdeo digital se producen dos discretizaciones adicionales. La segunda
convierte cada frame en una matriz de puntos (por ejemplo 800x600), y la tercera asigna un
nmero (de entre un conjunto finito de valores) a cada punto, de forma que cada uno de estos
nmeros corresponde a un color y un brillo determinado.

Sergi Jord Puig, Audio digital y MIDI, Guas Monogrficas Anaya Multimedia, Madrid 1997
Es obvio que cuantos ms puntos apliquemos, y cuantos ms nmeros utilicemos para cada
punto, mayor ser la similitud entre la seal analgica original y la seal digitalizada. Si
disponemos de pocos puntos, la imagen aparecer cuadriculada, y si el nmero de valores
posibles para cada punto es pequeo, perderemos matices en los colores y en los brillos. En
la figura 2.2 se muestran estos casos. Algo parecido sucede con el sonido.

Figura 2.2. Ejemplos de imgenes deficientemente digitalizadas.

Sergi Jord Puig, Audio digital y MIDI, Guas Monogrficas Anaya Multimedia, Madrid 1997
2.3. Muestreo del sonido - Frecuencia de muestreo

La palabra muestreo es el equivalente del trmino ingls sampling, y se utiliza para indicar la
accin de tomar muestras a intervalos de tiempo regulares. Para digitalizar un sonido es
necesario muestrearlo, pero con qu frecuencia? En el apartado anterior comentbamos que
para la imagen animada, la frecuencia de muestreo suele estar entre los 24 y los 30 fotogramas
por segundo. Con esta frecuencia se consigue engaar a la retina, hacindole creer que lo que
recibe no son imgenes discontinuas, sino un flujo continuo de luz, pero estos valores son
totalmente insuficientes en el caso del sonido.
Para comprender este fenmeno observemos la figura 2.3 que representa una seal sinusoidal
de 30 Hz. (el ciclo se repite 30 veces por segundo) Que ocurre si la muestreamos a una
frecuencia de 20 Hz? En este caso, estaremos tomando el valor de la onda original cada 0,05
segundos (corresponden a los seis cuadros de la figura). La nueva seal obtenida juntando los
puntos muestreados tiene un perodo aparente de 0,1 segundos, es decir una frecuencia de
10 Hz, lo cual no se corresponde en absoluto con la seal original!

Figura 2.3. Seal muestreada incorrectamente.

Cual sera la mnima frecuencia de muestreo correcta?


El teorema del muestreo o teorema de Nyquist, afirma que para muestrear
correctamente una seal de X Hz, se requiere como mnimo una frecuencia de muestreo
de 2X Hz.

En nuestro ejemplo anterior, una frecuencia de 60 Hz hubiese pues bastado para muestrear
correctamente la seal original. Pero tal como indicamos en el captulo 1,Principios de
acstica, el odo humano es capaz de detectar frecuencias sonoras de hasta
aproximadamente 20.000 Hz, por lo que, para muestrear correctamente cualquier sonido se
necesitar una frecuencia de muestreo superior o igual a 40.000 Hz. De aqu proceden los
famosos 44.100 Hz. utilizados en los discos compactos!

Sergi Jord Puig, Audio digital y MIDI, Guas Monogrficas Anaya Multimedia, Madrid 1997
2.4. Muestreo con frecuencias inferiores - El aliasing

Si muestreamos a una frecuencia inferior, como por ejemplo a 30.000 Hz, los resultados que
obtengamos podrn ser correctos para las frecuencias por debajo de los 15.000 Hz (la mitad
de la frecuencia de muestreo). Para las aplicaciones que no precisen de la mxima fidelidad,
esto es ms que suficiente. El sonido ser un poco menos brillante, pero se parecer todava
bastante al original, pues la zona frecuencial con mayor energa suele estar aproximadamente
entre los 1.000 y los 3.000 Hz.
Existe, sin embargo un problema adicional, algo complicado de entender. Tal como vimos en
el ejemplo grfico anterior, al muestrear con frecuencias inferiores, surgen frecuencias
fantasmas que realmente no estn en el sonido original (como los 10 Hz que aparecan
misteriosamente en nuestro ejemplo) y que alteran el sonido muestreado. Este fenmeno
recibe el nombre de aliasing.
Si lo que sigue le parece excesivamente complicado, no se preocupe: volveremos a tratar el
tema con ms detalle en el apartado 5.7. Efectos simples aplicables a la frecuencia, pero
para los ms impacientes, he aqu un pequeo adelanto.
El aliasing inventa frecuencias de valores aproximados a la diferencia entre la frecuencia
original y la frecuencia de muestreo. Para evitarlo, cuando se desee muestrear a frecuencias
inferiores a 44.100 Hz, se debera filtrar previamente la seal entrante, eliminando todos sus
valores por encima de la mitad de la frecuencia de muestreo. Si decidimos muestrear a 20.000
Hz, deberamos filtrar la seal original, eliminando todos sus componentes por encima de
10.000 Hz. Esto no siempre es posible si no se dispone del hardware adecuado, ya que la
mayora de tarjetas de sonido no permiten modificar el filtro de entrada. Existe una solucin
para realizar todo este proceso por software, consistente en:

muestrear a 44.100 Hz
filtrar por software el sonido obtenido, a la mitad de la frecuencia deseada (e.g. 10.000
Hz)
reconvertir por software el sonido a la frecuencia deseada (e.g. 20.000 Hz)

Parece muy complicado, pero no se apure; como veremos, la mayora de editores de sonido
facilitan bastante esta tarea.

2.5. Nmero de bits, resolucin y rango dinmico

Hasta aqu, hemos resuelto la primera parte terica de la digitalizacin, consistente en obtener
una serie de muestras a intervalos regulares. Falta todava la segunda parte, que consiste en
asignar a cada una de estas muestras un valor numrico que pueda ser manejado por un
ordenador. Para ello, volveremos momentneamente al ejemplo del vdeo digital, que para
muchos lectores resultar ms familiar. La resolucin de color de una imagen (y de las tarjetas
de vdeo) se mide en bits. As, una imagen de 8 bits, podr incluir 256 (28) colores diferentes,
mientras que una de 24 bits podr representar ms de 16 millones (224) de colores. Con el
sonido sucede algo parecido: cuantos ms bits apliquemos, ms niveles o escalones tendr el

Sergi Jord Puig, Audio digital y MIDI, Guas Monogrficas Anaya Multimedia, Madrid 1997
sonido digitalizado y ms parecido ser en consecuencia al sonido analgico original (que al
ser continuo, posea un nmero infinito de niveles).
El rango dinmico en decibelios viene dado aproximadamente por la frmula:

rango dinmico en dB = 10 x log10 (amplitud mxima2/amplitud mnima2)

Si en un sistema digital consideramos la amplitud mxima como 2bits y la amplitud mnima


como 1, tendremos que un sistema de conversin de 8 bits posee un rango dinmico de
aproximadamente 48 dB, mientras que en uno de 16 bits, el rango dinmico es de 96 dB.
Dado que el umbral de dolor no se sita hasta alrededor de los 130 dB, sera deseable que un
sistema de alta fidelidad pudiese alcanzar este rango dinmico. Para ello seran necesarios
unos 22 bits de resolucin. Todos sabemos que no es ste el estndar que se ha adoptado,
que ha quedado establecido en 16 bits. Por ello, todo sistema digital convencional posee
un rango dinmico mximo de 96 dB (valor terico que en la prctica se ve disminuido por
factores de circuitera).

2.6. La calidad del sonido digital

Estos valores de 44.100 Hz y 16 bits adoptados en el disco compacto y otros dispositivos


digitales, son los que nos llevan a afirmar que el sonido digital de alta fidelidad no es todo lo
bueno que podra ser, ya que ciertos equipos analgicos superan estas cotas. No se puede
negar sin embargo que el sonido digital ofrece muchas ventajas, entre las que hay que destacar
el menor desgaste y sobretodo, la posibilidad de realizar copias idnticas, es decir, sin ninguna
prdida. El formato digital permite adems, tal como iremos viendo, muchas ms posibilidades
de manipulacin y procesado.
Por otro lado, cuando no se necesite una calidad de alta fidelidad, se pueden utilizar
especificaciones inferiores. En este sentido, una frecuencia de muestreo de 11.025 Hz y una
resolucin de 8 bits, ofrecen una calidad comparable a la de una lnea telefnica convencional,
por lo que sern suficientes para algunas aplicaciones de voz, donde lo que se busque sea la
comprensin de un mensaje, al margen de preocupaciones estticas.

2.7. Los conversores A/D y D/A

Hasta aqu la teora. Veamos ahora como funciona un sistema digitalizador de sonido. El
sistema se compone de dos conversores: un conversor analgico/digital (a partir de ahora
A/D) en la entrada, y un conversor digital/analgico (a partir de ahora D/A) en la salida.
Ambos estn controlados por un reloj digital que determina la frecuencia de muestreo. Para
evitar el aliasing se coloca en la entrada un filtro pasa-bajo (vase apartado 6.4.3), que
elimina de la seal analgica todos los componentes con frecuencias superiores a los 22.050
Hz. En el proceso de digitalizacin, el conversor A/D genera un nmero binario (de 8 16
bits) a cada pulso del reloj. Este nmero es almacenado en la memoria o grabado en un disco
duro. Para la audicin de esta seal digital, es necesaria la reconversin inversa, de forma que

Sergi Jord Puig, Audio digital y MIDI, Guas Monogrficas Anaya Multimedia, Madrid 1997
los nmeros almacenados son enviados a un conversor D/A que los convierte en voltajes, a la
misma frecuencia de reloj. Esta seal analgica es suavizada mediante un nuevo filtro,
amplificada y enviada a unos altavoces, que con su vibracin, convierten finalmente los
voltajes en variaciones de presin de aire. La figura 2.4 esquematiza este proceso.

Figura 2.4. Esquema de un sistema de conversin A/D y D/A

Sergi Jord Puig, Audio digital y MIDI, Guas Monogrficas Anaya Multimedia, Madrid 1997
2.8. Breve historia del audio digital

Los primeros experimentos en audio digital datan de finales de los cincuenta, cuando Max
Mathews obtuvo en los laboratorios Bell los primeros sonidos generados por ordenador. En
esta poca, la escasa potencia de las computadoras no permita una velocidad suficiente para
digitalizar el sonido. Los experimentos consistieron en obtener sonidos sintticos, generando
los nmeros en el ordenador.
Tras muchos experimentos que ayudaron a comprender mejor la naturaleza del sonido digital,
el primer grabador comercial, el Sony PCM-1, vio la luz en 1977. El conversor era de 13 bits
y utilizaba como soporte cintas de vdeo Beta (al ao siguiente, el modelo PCM-1600, ya
utilizaba conversin de 16 bits). En 1982 apareci el disco compacto, desarrollado
conjuntamente por Sony y Philips, con un xito fulminante.
A principios de los ochenta aparecieron tambin los primeros sintetizadores digitales y los
primeros samplers, pero de ello hablaremos profusamente en el captulo 9, Sntesis y
generacin digital de sonido.
Los primeros sistemas domsticos de grabacin digital no llegaron hasta finales de los
ochenta, inicialmente con la cinta DAT (Digital Audio Tape), y posteriormente con el DCC
(Digital Compact Cassette), el MiniDisc, la grabacin a disco duro, los CD-R (grabadores de
discos compactos) y varios formatos de multipistas digitales (Alesis, Tascam, etc.). Las
tarjetas de sonido para ordenadores, dotadas de conversores A/D y D/A, aparecidas en los
ltimos aos, han supuesto la definitiva democratizacin del sonido digital. A ellas dedicamos
el prximo captulo.

Sergi Jord Puig, Audio digital y MIDI, Guas Monogrficas Anaya Multimedia, Madrid 1997