You are on page 1of 47

Grabación y Edición Sonora

Luis Alfonso Torres Mancilla

Departamento de Composición y Dirección de Orquesta • Conservatorio Superior de


Música de Málaga • Curso 2010-11

Luis Torres • ltorresmancilla@gmail.com • Conservatorio Superior de Música de Málaga 1


Grabación y Edición Sonora - Luis Alfonso Torres Mancilla

El Sonido I
Su Naturaleza y condiciones de existencia

! Se puede definir como todo agente físico que impresiona el sentido del oído. Se produce por
vibraciones de los cuerpos, vibración en forma de movimiento ondulatorio.
! Para obtener sonido es necesario que el cuerpo material, sólido, líquido o gaseoso, realice un
determinado tipo de movimiento
denominado Vibratorio.
! Además del cuerpo productor, es
necesario la presencia de un medio
transmisor (debiendo ser material,
pudiendo ser igualmente sólido, líquido o
gaseoso) y de un elemento receptor.
! Una definición más técnica del
sonido es “La sensación experimentada
cuando llegan al oído ondas producidas
por determinados movimientos
vibratorios”.
! La moderna ciencia
electroacústica ha permitido la separación
en el tiempo y en el espacio de los tres
elementos necesarios para la existencia
del sonido. La grabación de señales
acústicas posibilita el que un determinado
sonido pueda ser recibido en un momento posterior a su producción y en otro lugar distinto al que se ha
producido.
! Movimiento Vibratorio – Movimiento Oscilatorio – Movimiento Periódico

Movimiento periódico

Es cuando un cuerpo realiza movimientos a intervalos regulares de tiempo pasando por los mismo puntos con
idénticos sentidos: movimientos de los astros, planetas, satélites; péndulo de un reloj, las estaciones del año, etc.
Cualquier clase de movimiento que se repita a intervalos de tiempo iguales.
Dado la gran diversidad de movimientos periódicos existentes, éstos se clasifican en grupos, atendiendo a
características comunes entre ellos, quedando definidos por sus magnitudes, que lo identifican particularmente
y le diferencian del resto de los de su grupo. Dichas magnitudes son de dos clases:

• Espacio.- Ciclo, Elongación y Amplitud.


• Tiempo.- Período, Fase y Tiempo de Amplitud.

• Frecuencia.- Relaciona espacios con tiempos

Las siguientes magnitudes se definen de la siguiente manera:

✗ Ciclo (c).- Es el recorrido realizado por el cuerpo desde una posición cualquiera de su trayectoria hasta volver
a ella con el mismo sentido. Es independiente la medida del ciclo del punto elegido para su inicio, ya que
inexorablemente el cuerpo ha de realizar el recorrido completo. El ciclo se mide en unidades de longitud.
En el sistema de unidades S.I. la unidad es el metro (m).

Luis Torres • ltorresmancilla@gmail.com • Conservatorio Superior de Música de Málaga 2


Grabación y Edición Sonora - Luis Alfonso Torres Mancilla

✗ Elongación (x).- Es la distancia en un instante dado entre el cuerpo y su posición de equilibrio o reposo. Se
mide igualmente en unidades de longitud. La elongación es una magnitud variable en el tiempo, es decir en cada
momento es diferente.
✗ Amplitud (A).- Es la distancia entre el punto de equilibrio y cada uno de los puntos extremos. La distancia
entre las posiciones extremas es por tanto 2A. Se mide en unidades de longitud. La amplitud también es la
elongación máxima, ya que es lo máximo que el cuerpo se puede separar de la posición de equilibrio. El ciclo es
igual a cuatro amplitudes: c = 4A.
✗ Período (T).- Es el tiempo transcurrido entre dos pasadas consecutivas por el mismo punto en el mismo
sentido. Se mide en unidades de tiempo, es decir en segundos (s). El período es a su vez el tiempo del ciclo.
✗ Fase.- Es el tiempo necesario para que el cuerpo se desplace desde la posición de equilibrio hasta una posición
cualquiera de su trayectoria, o viceversa, siempre por el camino más corto. Se mide en segundos. La fase, igual
que la elongación, es una magnitud variable ya que en cada punto de su trayectoria, el tiempo para desplazarse a
la posición de equilibrio es distinto.
✗ Tiempo de Amplitud (tA).- Es el tiempo que tarda el cuerpo en ir desde la posición de reposo a cada uno de los
extremos. Es también la mayor fase que dicho cuerpo puede tener en un momento determinado. Se deduce que
el período es igual a cuatro veces el tiempo de la amplitud: T = 4tA
✗ Frecuencia (f).- Se denomina frecuencia del Movimiento Periódico al número de veces que en la unidad de
tiempo, el cuerpo pasa por una misma posición en el mismo sentido. Es decir, el número de veces que realiza el
ciclo en la unidad de tiempo. Luego la frecuencia se mide en ciclos por segundos.
El ciclo por segundo (c/s) se denomina Hertz o Herzio (Hz).

Movimiento oscilatorio

El caso más importante de movimiento periódico es aquel en el que el


móvil se desplaza siguiendo una trayectoria rectilínea o curvilínea
recorriéndola alternativamente en un sentido y en sentido contrario. En este
tipo de movimiento, el paso consecutivo del móvil por un mismo punto en el
mismo sentido se denomina oscilación, en lugar de ciclo; La frecuencia es el
número de oscilaciones por segundo, a la que también se le llama Herzio o Hertz (Hz). En este tipo de
movimiento la velocidad en cada punto de la trayectoria no es la misma, tratándose por lo tanto de un
movimiento acelerado; ya que cada medio período el móvil ha de cambiar su sentido de desplazamiento, viéndose
obligado a pasar por puntos en los que la velocidad es cero, puntos extremos, en los que se para y así poder
efectuar dicho cambio de sentido, disminuyendo la velocidad paulatinamente, decelerando. La velocidad es
máxima al pasar por el punto de reposo y es mínima en los extremos.

Movimiento vibratorio armónico simple

Un caso particular de un movimiento oscilatorio rectilíneo. Las oscilaciones son muy pequeñas, denominadas
vibraciones, dando lugar al denominado Movimiento Vibratorio definido como movimiento oscilatorio
rectilíneo de oscilaciones muy pequeñas.
Se dice que un movimiento es armónico cuando los desplazamientos del cuerpo son directamente
proporcionales a las fuerzas que provocan dichos desplazamientos.
También recibe el nombre de armónico en general, cada una de las componentes de un proceso periódico
cuya frecuencia es múltiplo de la frecuencia fundamental y que se produce simultáneamente con ésta.
Cuando el cuerpo vibra siguiendo una sola trayectoria se denomina simple. En caso contrario se le llama
complejo o compuesto.
Los cuerpos vibran también aunque no se actúe directamente sobre ellos, cuando vibre otro cuerpo sonoro
cuya frecuencia es igual o parecida a la suya y esté relativamente próximo. En este caso se dice que el cuerpo
vibra por Influencia, Simpatía o Resonancia.

Movimiento vibratorio complejo, teorema de Fourier

Prácticamente todos los sonidos son producidos por movimientos vibratorios complejos, es decir la
composición de movimientos de distintas direcciones.
El teorema de Fourier, relaciona los movimientos vibratorios, cualquiera que sea su grado de complejidad, con
movimientos armónicos simples: un movimiento vibratorio cualquier, de período T y frecuencia f, es siempre
expresable como una suma de movimientos armónicos simples cuyos períodos son T, T/2, T/3, T/4, etc. y
frecuencia f, 2f, 3f, 4f, etc.

Luis Torres • ltorresmancilla@gmail.com • Conservatorio Superior de Música de Málaga 3


Grabación y Edición Sonora - Luis Alfonso Torres Mancilla

Cualquiera que sea la curva periódica compleja, puede ser descompuesta en un número indefinido de
sinusoides. La suma de varios movimientos armónicos simples de distintos períodos, da como resultado un
movimiento vibratorio complejo.

Movimiento vibratorio amortiguado

El roce y la resistencia del medio en el cual se realiza el movimiento, hace que dichas características vayan
variando en el tiempo, siguiendo las leyes del Movimiento Vibratorio Amortiguado. La amplitud disminuye en
cada vibración con un decrecimiento que se llama logarítmico.
El período se conserva constante dentro de ciertos límites de amortiguamiento. Si rebasa estos límites, las
vibraciones se hacen aperiódicas.

Interferencias

Por efecto del principio de superposición, las partículas del medio por donde pasan los trenes de ondas, se
realizan movimientos que provienen de la composición de los movimientos que esas ondas imprimen por
separado a cada partícula. Existen diferentes tipos de interferencias, dependiendo de las características de las
ondas que se superponen:
• Misma frecuencia y por lo tanto el mismo período y la misma longitud de onda, viajando en el mismo sentido y
estando en concordancia de fase. La onda resultante tiene las mismas características pero su amplitud será la
resultante de sumar algebraicamente las amplitudes de las dos ondas superpuestas.
• Cuando las dos ondas que interfieren están en oposición de fase, la onda resultante tendrá una amplitud
diferencia de las amplitudes de las ondas componentes y estará en fase con la mayor amplitud.
Luis Torres • ltorresmancilla@gmail.com • Conservatorio Superior de Música de Málaga 4
Grabación y Edición Sonora - Luis Alfonso Torres Mancilla

• Un caso interesante se presenta cuando las ondas que interfieren en oposición de fase y tienen iguales
amplitudes. En este caso la resultante es nula y se produce una interferencia total.

Ondas estacionarias

Un caso especial de interferencia se presenta


cuando en un medio elástico se propagan dos
ondas de igual frecuencia y amplitud,
que se desplazan con la misma
dirección pero en sentido contrario.
Se llama así por ser ondas que
nacen, crecen y desaparecen sin
cambiar de posición, pareciendo que
están siempre inmóviles.
Esta aparente inmovilidad es debida a la forma
de producirse la onda resultante, en la cual siempre
existen unos puntos en los que la amplitud varía desde un mínimo
cero a un máximo de valor doble de la amplitud de la onda originaria del fenómeno.

Pulsaciones

Cuando en un medio elástico se propagan simultáneamente dos ondas de frecuancia ligeramente distinta e
igual amplitud, la amplitud de la onda resultante pasará periódicamente por máximos y mínimos. Esto será
perceptible por aumentos y disminuciones periódicas de la intensidad, siempre que la frecuencia de ambas no
difiera demasiado.

Luis Torres • ltorresmancilla@gmail.com • Conservatorio Superior de Música de Málaga 5


Grabación y Edición Sonora - Luis Alfonso Torres Mancilla

El Sonido II
Propagación del Sonido

Propagación de las ondas sonoras

Una oscilación que se propaga en un medio (con velocidad finita) recibe el nombre de onda. Dependiendo de la
relación que exista entre el sentido de la oscilación y el de la propagación, hablamos de ondas longitudinales,
transversales, de torsión, etc. En el aire el sonido se propaga en forma de ondas longitudinales, es decir, el
sentido de la oscilación coincide con el de la propagación de la onda.

Medio.- Podemos definir a un medio como un conjunto de osciladores capaces de entrar en vibración por la
acción de una fuerza.
Cuando hablemos de un medio, y a no ser que se indique específicamente otra cosa, nos estaremos refiriendo al
aire. Esto se debe nuevamente a razones prácticas, en la medida en que el aire es el medio más usual en el que se
realiza la propagación del sonido en los actos comunicativos por medio de sistemas acústicos entre seres
humanos, ya sea mediante el habla o la música.
Para que una onda sonora se propague en un medio, éste debe cumplir como mínimo tres condiciones
fundamentales: ser elástico, tener masa e inercia.
Las ondas sonoras no se propagan en el vacío, pero hay otras ondas, como las electromagnéticas, que sí lo
hacen.
El aire en tanto medio posee además otras características relevantes para la propagación del sonido:
• la propagación es lineal, que quiere decir que diferentes ondas sonoras (sonidos) pueden propagarse
por el mismo espacio al mismo tiempo sin afectarse mutuamente.
• es un medio no dispersivo, por lo que las ondas se propagan a la misma velocidad independientemente
de su frecuencia o amplitud.
• es también un medio homogéneo, de manera que el sonido se propaga esféricamente, es decir, en
todas las direcciones, generando lo que se denomina un campo sonoro.

Propagación.- Como ya mencionáramos, un cuerpo en oscilación pone en movimiento a las moléculas de aire
(del medio) que lo rodean. Éstas, a su vez, transmiten ese movimiento a las moléculas vecinas y así
sucesivamente. Cada molécula de aire entra en oscilación en torno a su punto de reposo. Es decir, el
desplazamiento que sufre cada molécula es pequeño. Pero el movimiento se propaga a través del medio.
Entre la fuente sonora (el cuerpo en oscilación) y el receptor (el ser humano) tenemos entonces una
transmisión de energía pero no un traslado de materia. No son las moléculas de aire que rodean al cuerpo en
oscilación las que hacen entrar en movimiento al tímpano, sino las que están junto al mismo, que fueron puestas
en movimiento a medida que la onda se fue propagando en el medio.
El (pequeño) desplazamiento (oscilatorio) que sufren las distintas moléculas de aire genera zonas en las que
hay una mayor concentración de moléculas (mayor densidad), zonas de condensación, y zonas en las que hay una
menor concentración de moléculas (menor densidad), zonas de rarefacción. Esas zonas de mayor o menor
densidad generan una variación alterna en la presión estática del aire (la presión del aire en ausencia de sonido).
Es lo que se conoce como presión sonora.

La distancia entre las barras representa las zonas de mayor o menor presión sonora

Luis Torres • ltorresmancilla@gmail.com • Conservatorio Superior de Música de Málaga 6


Grabación y Edición Sonora - Luis Alfonso Torres Mancilla

Si el cuerpo que genera la oscilación realiza un movimiento armónico simple, las variaciones de la presión en al
aire pueden representarse por medio de una onda sinusoidal. Por el contrario, si el cuerpo realiza un
movimiento complejo, las variaciones de presión sonora deberán representarse por medio de una forma de onda
igual a la resultante de la proyección en el tiempo del movimiento del cuerpo.

Variaciones de presión en el aire (condensación y rarefacción) en el caso de un movimiento armónico simple.


Los puntos representan las moléculas de aire.

Como dijimos, en el aire el sonido se propaga esféricamente, es decir en todas direcciones. Podemos
imaginarnos al sonido propagándose como una esfera cuyo centro es la fuente sonora y que se va haciendo cada
vez más grande. O, lo que es lo mismo, que va aumentando cada vez su radio. Por razones de comodidad, para
estudiar el sonido podremos hacerlo desde uno de esos dos puntos de vista, a veces como una esfera creciendo, o
como un radio (eventualmente todos los radios) de la misma (rayos).
Imaginemos entonces una cadena de partículas (moléculas) entre la fuente sonora y el receptor (un rayo). Entre
el instante en que la fuente sonora pone en movimiento a la partícula más cercana y el instante en que la primer
partícula transmite su movimiento a la segunda transcurre un tiempo determinado. Es decir, cuando la primer
partícula entra en movimiento, la tercera -por ejemplo- aún está en su posición de reposo. Recordemos también
que las partículas de aire sólo oscilan en torno a su posición de reposo.
Podemos decir entonces que cada partícula se encontrará en una situación distinta del movimiento oscilatorio.
Es decir, cada partícula tendrá una situación de fase (ángulo de fase) distinta. En algún lugar de la cadena
encontraremos una partícula cuya situación de fase coincide con la de la primera, aunque la primer partícula
estará comenzando su segundo ciclo oscilatorio, mientras que la otra recién estará comenzando su primer ciclo.
La distancia que existe entre dos partículas consecutivas en igual situación de fase se llama longitud de onda
( ). También podemos definir la longitud de onda como la distancia que recorre una onda en un período de
tiempo T. La longitud de onda está relacionada con la frecuencia f (inversa del período T) por medio de la
velocidad de propagación del sonido (c), de manera que c = ∙ f. Las ondas sonoras tienen longitudes de onda
de entre 2 cm y 20 m aproximadamente.
No debemos confundir la velocidad de propagación de la onda con la velocidad de desplazamiento de las
partículas. Éstas realizan un movimiento oscilatorio muy rápido, cuya velocidad es distinta a la velocidad de
propagación de la onda.
La velocidad de propagación de la onda sonora (velocidad del sonido) depende de las características del medio
en el que se realiza dicha propagación y no de las características de la onda o de la fuerza que la genera. En el
caso de un gas (como el aire) es directamente proporcional a su temperatura específica y a su presión estática e
inversamente proporcional a su densidad. Dado que si varía la presión, varía también la densidad del gas, la
velocidad de propagación permanece constante ante los cambios de presión o densidad del medio.
Pero la velocidad del sonido sí varía ante los cambios de temperatura del aire (medio). Cuanto mayor es la
temperatura del aire mayor es la velocidad de propagación. La velocidad del sonido en el aire aumenta 0,6 m/s
por cada 1º C de aumento en la temperatura.
Luis Torres • ltorresmancilla@gmail.com • Conservatorio Superior de Música de Málaga 7
Grabación y Edición Sonora - Luis Alfonso Torres Mancilla

La velocidad del sonido en el aire es de aproximadamente 344 m/s a 20º C de temperatura, lo que equivale a
unos 1.200 km/h (1.238,4 km/h, para ser precisos). Es decir que necesita unos 3 s para recorrer 1 km. (Como
posible referencia recordemos que la velocidad de la luz es de 300.000 km/s.)
El sonido se propaga a diferentes velocidades en medios de distinta densidad. En general, se propaga a mayor
velocidad en líquidos y sólidos que en gases (como el aire). La velocidad de propagación del sonido es, por
ejemplo, de unos 1.440 m/s en el agua y de unos 5.000 m/s en el acero.

Luis Torres • ltorresmancilla@gmail.com • Conservatorio Superior de Música de Málaga 8


Grabación y Edición Sonora - Luis Alfonso Torres Mancilla

El Sonido III
Percepción del sonido. Cualidades del sonido

La sensación sonora

Hemos definido el sonido como la sensación que se produce en el sentido del oído por el movimiento
vibratorio de los cuerpos, transmitiendo por un medio elástico como es el aire. Es decir, no se puede hablar de
sonido mientras no se produzca tal sensación.
El proceso de recepción de una señal y su posterior interpretación por el sentido de la audición, se divide en
tres partes:
• El estímulo.- es el agente externo que provoca que los elementos del oído externo sean perturbados. Esta
perturbación empieza en la membrana del tímpano.
• La excitación.- es el proceso por el cual los órganos del oído captan el estímulo, haciendo que los elementos
del oído medio e interno queden impresionados.
• La sensación.- es la impresión que la excitación produce en el cerebro.

Sonido y Ruido

El SONIDO, en su sentido restringido, es toda sensación agradable producida por movimientos vibratorios de
altura definida y de proveniencia fácil de establecer. En una apreciación muy parcial, serían sonidos todos
aquellos complejos sonoros que obedecieran a la ley de Fourier: la composición de una frecuencia fundamental
con su serie de armónicos propios.
El RUIDO es la mezcla compleja de sonidos de frecuencias diferentes. Un sonido de gran complejidad,
resultante de la superposición inarmónica de sonidos provenientes de muy variantes fuentes, no admitiendo
ninguna ley u orden de formación.

Altura y tono

La Altura de un sonido es la cualidad que quiere expresar cuando se dice que un sonido es más agudo o más
grave que otro. La característica subjetiva de la altura es lo que se denomina Tono de un sonido. Depende
principalmente de la frecuencia del movimiento vibratorio que lo originó.
El oído no reacciona ante todas las frecuencias posibles de movimientos vibratorios, sino sólo transforma en
sonidos una pequeña parte de ellas. La gama de frecuencias aptas para ser transformadas en sonidos por el oído
humano, abarca desde los aproximadamente 16 Hz a los 20.000 Hz.

Audiofrecuencias.- A la gama de frecuencias audibles se la denomina Banda de Audiofrecuencias. No son


exactos ni fijos para todas las personas. La práctica musical sólo emplea como sonidos fundamentales aquellos
incluidos entre aproximadamente 30 y 12.000 Hz.
La frecuencia de un sonido y su longitud de onda son cantidades recíprocas siempre que la velocidad de
propagación se mantenga constante. Es decir, para sonidos agudos corresponden longitudes de onda cortas y
para sonidos graves longitudes de onda largas.
La amplitud de una onda afecta con cierta medida también a la altura del sonido. Los sonidos de baja frecuencia
- hasta los 500 Hz - parecen más graves cuando aumenta su amplitud, ocurriendo lo contrario con los sonidos de
alta frecuencia - sobre los 4000 Hz -, sufriendo los sonidos de frecuencia media poca variación.
Los movimientos vibratorios cuya frecuencia queda por encima del límite superior de la audición se denominan
Ultrasonidos, denominándose Infrasonidos a aquellos cuya frecuencia está por debajo del límite, sobre los 15 Hz.
Si el fenómeno vibratorio es complejo, se podrá percibir los armónicos superiores componentes de dicho
complejo sonoro.

Luis Torres • ltorresmancilla@gmail.com • Conservatorio Superior de Música de Málaga 9


Grabación y Edición Sonora - Luis Alfonso Torres Mancilla

Los Filtros de Frecuencia se emplean para atenuar las frecuencias no deseables de una onda, sin modificar las
frecuencias útiles de la señal.

La mínima variación de frecuencia para ser percibida por el oído, recibe el nombre de Vibrato. Esta variación
no es igual para todas las frecuencias, presentando los valores máximos para las bajas frecuencias. Entre los 500
y los 5.000 Hz se mantiene constante con un valor de 0,3%, creciendo para las altas frecuencias tomando un
valor para los 16.000 Hz de 0,8%. Por su parte para las bajas frecuencias también crece, siendo para los 60 Hz
de 1%.
Esto significa que para un sonido de 1000 Hz, el siguiente sonido agudo que se puede oír será:

1.000 + (1000 x 0,3/100) = 1.003 Hz

La relación armónica de dos sonidos depende de la frecuencia, independientemente de la tesitura en que se


encuentran los sonidos en cuestión. Esto es , todos los sonidos que estén en relación 2 a 1, por ejemplo,
formarán una octava, independientemente de que sean graves, medios o agudos.

Se llama oído absoluto la cualidad que poseen ciertas personas de reconocer un sonido basándose únicamente
en su altura. La mayoría de los músicos que creen poseer esta cualidad, sólo la tienen para su instrumento y
cuando los sonidos varían de forma continuada, la identificación de uno determinado es mucho más difícil, ya
que el oído responde muy mal cuando se le presenta un barrido de frecuencias.

Intensidad y Sonoridad

La Intensidad de un sonido es la cualidad que se quiere expresar cuando se dice que un sonido es más fuerte o
más débil que otro. Su traducción en el sentido de la audición es lo que se conoce con el nombre de Sonoridad.
Según con el vigor o la fuerza que la perturbación produce en las moléculas en vibración, el sonido será más o
menos intenso. Este vigor se traduce en una mayor o menor amplitud de la oscilación en la vibración molecular.
Luego la intensidad depende en primera aproximación de la amplitud del movimiento vibratorio que lo origina.

El Umbral de audibilidad para un sonido de frecuencia dad, es el valor que debe alcanzar la intensidad de dicho
sonido para empezar a ser oído.
Dado que el oído es un sistema mecánico destinado a la transformación de energía, necesita unos niveles
mínimos de ella para realizar su función. Por debajo de un determinado nivel, el oído no reacciona a los
estímulos sonoros que se le ofrecen. Este punto mínimo de energía es el denominado Umbral de Audición para
ese sonido.
El oído presenta un característica muy particular que consiste en que estos niveles mínimos de audición varían
de unos sonidos a otros. En la banda de los 3.000 Hz es donde presenta un mínimo, aumentando tanto para las
frecuencias graves como para las agudas.
La Cima de las intensidades es el punto donde éstas no pueden aumentar sin cambiar de especie,
convirtiéndose en sensaciones dolorosas.

La Potencia Acústica es la energía que dicha fuente sonora pone a contribución del fenómeno acústico y la
Intensidad Acústica es la energía que llega a un punto determinado.
Los niveles de Potencia utilizados en acústica son extremadamente pequeños comparados con los empleados
en otras manifestaciones físicas.
La Intensidad se define como la energía que atraviesa, en la unidad de tiempo, la unidad de superficie
perpendicular a la dirección de propagación de las ondas. En consecuencia la unidad de Intensidad es W/m2.

El efecto producido cuando a un sonido de frecuencia fija se le hace variar su intensida alternativamente dentro
de unos valores próximos, se denomina Trémolo. Para que dicho efecto sea percibido por el oído, la variación de
intensidad debe tener un cierto valor. Ese valor mínimo se denomina Sensibilidad Diferencial para las
Intensidades, siendo mayor para las bajas intensidades.

Experimentalmente se demuestra que las variaciones de sensación sonora no son proporcionales a las
variaciones de intensidad (estímulo) que el oído percibe. Si al oído se le presentan estímulos que varían de tal
forma que cada uno es el doble del anterior, por ejemplo, las sensaciones que se producen no guardan esta
misma proporción.

Luis Torres • ltorresmancilla@gmail.com • Conservatorio Superior de Música de Málaga 10


Grabación y Edición Sonora - Luis Alfonso Torres Mancilla

La relación entre estímulo y sensación se define como: cuando los estímulos o intensidad crecen en progresión
geométrica, las sensaciones o sonoridades crecen en progresión aritmética, es decir, que la magnitud de una
sensación sonora crece con el logaritmo del estímulo.
El oído transforma en sensación el logaritmo del estímulo. Ello supone un crecimiento muy reducido para
grandes incrementos de intensidad sonora.
Se define la unidad Bel como la sensación experimentada cuando el estímulo, a una frecuencia determinada,
tiene una intensidad 10 veces mayor que en el umbral de audibilidad. Cuando un sonido multiplica por 10 su
intensidad, la sensación aumenta 1 Bel. Dado que el Bel es una unidad demasiado grande, ya que supone
aumentos de intensidad de 10 veces, se utiliza un submúltiplo 10 más pequeño llamado decibel o decibelio (dB).
La escala de la intensidad relativa está comprendida entre 0 y 140 dB.

Para la determinación de niveles sonoros se emplea un instrumento de medida denominado Sonómetro. En


esencia, consta de un micrófono que transforma las variaciones de presión acústica en variaciones
proporcionales de tensión eléctrica, y un voltímetro calibrado en dB. Ya que el oído es más sensible a frecuencias
entre 2.000 y 4.000 Hz, es necesario tener en cuenta esta circunstancia al medir niveles sonoros. por ello
incorporan filtros o redes de ponderación que tratan de imitar al oído, atenuando las medidas para las
frecuencias bajas.

Si durante la audición de dos sonidos de distinta frecuencia, la intensidad de uno de ellos supera a otro en una
medida suficiente, el menos intenso puede llegar a dejar de oírse. Esta anulación que produce el más intenso, se
llama Enmascaramiento. El sonido menos intenso se llama enmascarado y el más intenso enmascarante. El
enmascaramiento no sólo hace difícil la audición del sonido más débil, sino que dificulta la correcta audición del
más fuerte, ocasionando un problema para localizar la fuente sonora.
El efecto de enmascaramiento se acusa especialmente cuando las frecuencias de los sonidos que intervienen
son parecidas. Esto es de especial importancia para orquestar, debiendo de tener en cuenta el separar los
instrumentos graves para que entre ellos no se produzca el efecto de enmascaramiento, ya que las frecuencias de
estos sonidos graves están muy próximas entre sí.

El oído no es igualmente sensible para una misma intensidad a frecuencias distintas. Aunque tengan el mismo
nivel acústica, el oído no percibe en ellos la misma sensación sonora. Dado que la intensidad absoluta necesaria
para llegar al umbral de audibilidad es diferente para cada sonido, no pueden compararse las intensidades
relativas de dos sonidos de frecuencias diferentes. Por ello se creó la Escala de la Sonoridad, cuyo umbral se
encuentra en la frecuencia de 1.000 Hz. La unidad de esta escala se denomina el Fonio y equivale al dB mientras
se refieran a sonidos de 1.000 Hz.
Para tener la misma sensación con sonidos de distintas frecuencias, se necesitan niveles distintos para cada una
de ellas. Por ejemplo, 40 Fonios se obtienen a 1.000 Hz con 40 dB, pero son necesarios 45 dB para 500 Hz, 60
dB a 200 Hz, 75 dB a 50 Hz, 50 dB a 10.000 Hz, etc. Todas estas intensidades determinan en el oído un mismo
nivel sonoro.

Forma y Timbre

El Timbre de un sonido es la cualidad que permite diferenciar dos sonidos de igual altura e intensidad, pero de
diversa procedencia. La Forma es la cualidad física que determina el carácter subjetivo del Timbre. El timbre
depende del grado de complejidad del movimiento vibratorio que origina dicho sonido. Esta cualidad, a
diferencia de la altura y la intensidad, no es mensurable, ni existe por tanto una unidad que permita comparar
timbres de distintos sonidos. Según el teorema de Fourier, un cuerpo que realiza un movimiento vibratorio
complejo se puede considerar que realiza simultáneamente los movimientos armónicos simples en que ese
movimiento se puede descomponer. Por lo tanto, si el movimiento vibratorio complejo es productor de sonido,
éste se puede descomponer en los sonidos puros que provienen de los movimientos armónicos simples
componentes.
Un mismo cuerpo sonoro puede producir varios sonidos según las condiciones en que vibre. El más grave de
esos sonidos es el fundamental y los demás se llaman parciales, que pueden ser armónicos, si son semejantes a la
serie armónica derivada de la misma fundamental, también llamados concordantes o alicuotas, o bien, si los
parciales no son semejantes a la serie armónica, éstos serán discordantes y no se les llaman armónicos,
recibiendo el sobre de sobretonos.
Los armónicos que se pueden escuchar de cada uno de estos sonidos serán distintos en cuanto a intensidad y la
distribución de energía entre ellos. Los dos sonidos tienen los mismos armónicos en frecuencias, pero la
distribución de las intensidades es distinta.

Luis Torres • ltorresmancilla@gmail.com • Conservatorio Superior de Música de Málaga 11


Grabación y Edición Sonora - Luis Alfonso Torres Mancilla

Existen dos limitaciones que hacen imposible percibir los, en teoría, infinitos armónicos producidos por un
sonido complejo según establece en el Teorema de Fourier:
1. armónicos cuya frecuencia quede por encima del límite superior de la audición
2. cuando su nivel de intensidad quede por debajo del umbral de audibilidad para esa frecuencia.
Estas dos limitaciones hacen que el número de armónicos que el oído puede percibir de un sonido, quede
limitado a un número relativamente reducido, denominándose armónicos presentes y constituyen lo que se llama
Formante de un Sonido.
Hay una característica del movimiento vibratorio que produce una diferencia entre sonidos con la misma
intensidad y altura, variando la elongación en función del tiempo en el intervalo de un período, característica que
se conoce con el nombre de Forma de Onda, es decir, la figura que presenta la onda vista a través de un
analizador de señales.
Existen unas ondas características, cuyos sonidos tienen timbres muy diferentes. Estas formas de onda se
agrupan en ondas senoidales - que provienen de sonidos puros, de un solo movimiento vibratorio - y ondas no
senoidales - donde se encuentran las ondas cuadradas, las triangulares, de diente de sierra y los impulsos -.

Otras cualidades del Sonido

La Duración de una sensación sonora depende directamente de la duración del movimiento vibratorio que
origina el sonido, aunque, debido a las características del oído, esta sensación persista después de cesar el
estímulo. Cuando la duración es muy pequeña afecta a la percepción de la altura. Por ejemplo, un sonido de
1.000 Hz cuya duración sea de 0,01 Sg produce una sensación igual a la de un sonido de 842 Hz de duración 1,5
Sg.
El Volumen es una sensación que depende conjuntamente de la frecuencia y de la amplitud. Al aumentar la
amplitud parece aumentar el volumen y disminuye al crecer la frecuencia. Por ejemplo, una nota de flauta parece
tener menos volumen que una nota de contrabajo con la misma intensidad.
La Densidad de un sonido es una sensación que producen ciertos sonidos de ser más compactos o más densos
que otros. Esta característica parece depender directamente de la frecuencia, aumentando con ella como
consecuencia de la mayor velocidad con que se producen las vibraciones en los sonidos agudos.

Luis Torres • ltorresmancilla@gmail.com • Conservatorio Superior de Música de Málaga 12


Grabación y Edición Sonora - Luis Alfonso Torres Mancilla

La Cadena de Audio I
Introducción a la microfonía

Introducción

El mundo de la microfonía es extenso y nada fácil hoy en día, debido a la gran variedad de tipos, modelos y
marcas que existen hoy en día en el mercado. Todos ellos giran alrededor de las mismas características, más o
menos 3 db (más o menos ganancia en ciertas frecuencias), sensibilidad ( más o menos captación según
intensidad), calidad , respuesta de frecuencia, etc...
En este capítulo se explicarán las bases y pasos básicos para poder usar correctamente casi al cien por cien el
micrófono dentro del HOME STUDIO actual, puesto que hay una gran variedad de instrumentos a grabar,
condiciones acústicas a las que ajustarse, material diverso de grabación del cual disponemos y material de
reproducción y variedades de micrófonos; por eso voy generalizaremos en casi todos los asuntos que se
expondrán y se tratará de aplicar partes comunes a una misma definición.

¿Qué es un micrófono? Micrófono es el término genérico que se usa para hablar de los elementos que
transforman la energía acústica, (sonido - fuente original : guitarra, voz), en energía eléctrica, (la señal de audio -
ya sea Digital o analógica).
El micrófono es un tipo de transductor, un dispositivo, que transforma energía de una forma a otra.
Es decir estas teorías dicen que el micrófono se usa para amplificar la señal de audio original, la cual
reproduciremos o copiaremos (ya sea similar o distorsionada) a otra por medio de dispositivos eléctricos,
teniendo en cuenta que nunca volverán a ser como habían sido en un principio (por muy buen micro que se

Luis Torres • ltorresmancilla@gmail.com • Conservatorio Superior de Música de Málaga 13


Grabación y Edición Sonora - Luis Alfonso Torres Mancilla

tenga, nunca se logrará el sonido original que emite la fuente), es decir, no existe el micro perfecto y nunca
reproduciremos el sonido original como la fuente nos a lo ha hecho llegar, pero según el micro lograremos mas
calidez, semejanza, cercanía, cuerpo, etc…
Todo aquello que nos rodea, que es lo que nos va a afectar en la grabación y hay que tenerlo en cuenta en la
elección de un micrófono, ya sea la localización, cableado, mesa, conversores, dinámica, acústica de la sala de
captación, etc…

! Tipos de micrófonos

! Dicho esto, aclararé que la calidad que genera un micrófono en su representación eléctrica del sonido,
depende en gran parte de: EL METODO EN QUE SE HACE LA CONVERSION DE ENERGIA. En otras
palabras, la calidad depende del tipo de micrófono, o sea la membrana que utilicemos. Históricamente ha habido
muchísimos modos de captación del sonido, y hoy en día existen en el mercado una gran variedad de tipos de
micrófonos y una gran parte de esta pueden ser usados en una misma situación.
! Los 6 tipos de micros que existen en la actualidad son:

Dinámicos
Condensador
Condensador-Electret
Cinta
Carbono
Piezo-eléctrico

! De estos 6 tipos de micrófonos, los más usados (más o menos el 95 % ) y los que tendréis más oídos son
los dinámicos y los de condensador, de los cuales haremos una pequeña introducción.

1. Dinámicos

! Es el tipo de micrófono más común y usado actualmente. Diremos que el micrófono dinámico es igual
a un pequeño altavoz en miniatura, (ciertos elementos dinámicos son usados como ambas cosas: micrófonos y
altavoces, p. ej. Intercoms).
! Los micrófonos dinámicos son los más versátiles, ya que son los más duros contra los golpes, los que
menos sonido ambiente recogen, ya que no son tan sensibles como los de condensador (por estas dos
características son los reyes del directo), pero por otro lado se sacrifica la calidad que tendría uno de
condensador.
! Los dinámicos se pueden utilizar en todas las aplicaciones, y así se hace ya sea en directo o en estudio,
y por que no son los que mas usaremos en el "Home Studio" sin duda alguna, ya que seguro que nuestro Home
studio no cuenta con un aislamiento acústico maravilloso y por ello son una buena opción , por el poco ruido
ambiente que captan. Los dinámicos no son los mejores micros en cuanto a calidad, eso esta claro, ya que no hay
comparación con los de condensador, pero son una buena opción calidad - precio.

2. Condensador

! Al igual que los dinámicos son los condensadores también son micrófonos muy comunes, su estructura
es mas compleja que la del dinámico y esta construida de la siguiente manera:

Luis Torres • ltorresmancilla@gmail.com • Conservatorio Superior de Música de Málaga 14


Grabación y Edición Sonora - Luis Alfonso Torres Mancilla

! Un diafragma de plástico revestido con un pequeño baño de oro, montado sobre un metal conductivo,
el diafragma y el metal están separados por una pequeña capa de aire y forman un componente eléctrico llamado
capacitador o condensador, un voltaje polarizante de entre 9 y 48 v. es aplicado al diafragma por corriente
externa cargándolo con un voltaje estático y fijo.
! Cuando el diafragma vibra en respuesta a algún sonido se mueve cerca de el metal posterior y cuando
esto sucede la carga eléctrica que induce la placa de metal va cambiando proporcionalmente, el voltaje fluctuante
del metal posterior es entonces una representación del movimiento del diafragma.
! Los elementos de un micrófono de condensador producen una señal de voltaje sin casi energía, por eso
presentan una gran impedancia (ya que los elementos que forman la estructura de un micrófono de condensador,
no representan apenas resistencia al sonido o si lo preferis a los cambios de presión en el aire), por eso todos los
micrófonos de condensador incorporan un amplificador, el cual conduce el micrófono linealmente.

! Los condensadores más antiguos llevaban tubos amplificadores y por eso físicamente eran súper
largos, (ahora se están empezando a usar tipo retro), los modernos son diferentes ya que usan amplificadores de
transistores y pueden fabricarse mucho más pequeños (también los hay de tubo, muy usados actualmente,
aunque uno de estos de calidad media alta nos será casi inalcanzable económicamente).
! La respuesta de un micrófono de condensador es generalmente excelente y son usados en casi todos
los instrumentos en estudio, uno de los porqués es porque el diafragma de los micrófonos de condensador no
esta construido en espiral (como los dinámicos), y eso les hace responder mas rápido y de forma más fina a
cualquier sonido.
! En cuanto a calidad de sonido los condensadores son los mejores no hay duda de ello y este será el tipo
de micrófono que tendremos que comprar si queremos hacer una grabación con el mínimo de garantías eso esta
claro, pero hay que tener en cuenta que son los mas susceptibles al ruido y ello hace que para el "Home Studio"
no nos valla al 100% bien este tipo de micros ya que recoge casi todo el ruido ambiente que hay en nuestro
estudio.

Luis Torres • ltorresmancilla@gmail.com • Conservatorio Superior de Música de Málaga 15


Grabación y Edición Sonora - Luis Alfonso Torres Mancilla

La Cadena de Audio II
Conexiones

En el campo del audio, una línea es un camino de ida y vuelta (circuito) que transporta la señal de audio
desde un punto de origen (equipo, dispositivo) a otro de llegada.
Una línea indistintamente, sirve para enviar la señal o recibirla, dependiendo de lo que haya conectado al
principio y al final de la misma. La línea siempre lleva la señal desde la salida (Out) de un equipo a la entrada de
otro (In). Hay que tener en cuenta que si se conecta entrada con entrada o salida con salida la línea no transporta
señal alguna.
Al definir la línea como camino de ida y vuelta, queda establecido que la línea siempre está constituida por dos
conductores, en los que la señal que parte de A, llega a B y termina su recorrido (cierra el circuito) nuevamente
en A.
No hay que confundir línea con cable. La línea sigue una ruta a través de cables, patch o conectores, etc. La
línea forma parte del cable, no es el cable en sí: En las líneas no balanceadas, dentro del cable hay un conductor
que transporta la señal de ida (conductor vivo o caliente), mientras que el cierre del circuito (conductor de
retorno o frío) se hace por la malla que recubre al anterior. Un caso típico de línea desequilibrada es la formada
por un par coaxial.
En las líneas balanceadas, dentro del cable hay dos conductores idénticos, uno para la ida y otro para el retorno.
Casos típicos de líneas balanceadas son las constituidas mediante par simétrico o par trenzado.
Tampoco hay que confundir línea de audio con canal de audio.
Además del concepto retorno de la señal o más exactamente cierre del circuito que antes se ha definido, hay
ciertas líneas especiales que reciben el nombre de retorno, pero ambas cosas aunque son conceptos próximos,
no son sinónimos.
El retorno es una línea propiamente dicha a través de la cual el equipo devuelve, hacia el punto de origen, la
señal tras ser procesada.
Por ejemplo... este concepto se usa mucho en radio, donde el locutor escucha lo que sale de la propia mesa (lo
que sale al aire tal como sale) a través de los cascos.
La línea no balanceada también es conocida como línea no equilibrada.
Se trata de una línea de audio en la que el retorno de la señal (señal retorno o frío) se produce a través de la
malla exterior que cubre el conductor de ida (señal vivo o caliente), protegiéndolo contra interferencias
electromagnéticas externas, aunque no las elimina completamente.
Las líneas no equilibradas terminan normalmente con conectores RCA, DIN o JACK.
Normalmente, las líneas no balanceadas no se utilizan para el audio profesional, porque cuando se requiere
longitud de cable, el efecto acumulativo de las interferencias puede producir tal nivel de distorsión que el sonido
final sea inemitible por su pésima calidad.
Otro problema con una longitud de cable grande es que se puede formar el llamado bucle de tierra. Este efecto
se puede producir en las líneas no balanceadas porque la malla exterior del cable está conectada a tierra en ambos
extremos.
La resistencia del conductor que constituye la línea, normalmente, no supone un problema, porque es unas
100 veces inferior a la impedancia del equipo al que está conectado.
Lo habitual es que los fabricantes de cable faciliten el valor de la resistencia para corriente continua de un
metro de cable. Un valor estandarizado de resistencia de cable es 0,012 ohmios para 5 metros.
La resistencia del cable sólo puede ser vital cuando se trata de altavoces, donde las impedancias habituales son
4, 8 y 15 ohmios. Por ello, los altavoces requieren cables de mucha sección, con resistencias sensiblemente
inferiores (del orden de 0,04-0,08 Ω) para evitar que se pierda una parte considerable de la potencia antes de
que la señal alcance el altavoz.
Un caso típico de línea desequilibrada es la formada por un par coaxial.
El término línea balanceada es un anglicismo derivado de Balance, (que significa Equilibrio), por ello también
se le conoce como línea equilibrada. Las líneas son equilibradas mediante transformadores o electrónicamente.

Luis Torres • ltorresmancilla@gmail.com • Conservatorio Superior de Música de Málaga 16


Grabación y Edición Sonora - Luis Alfonso Torres Mancilla

En una línea equilibrada tanto el camino de ida (señal vivo o caliente) como el retorno (señal retorno o frío) lo
forman conductores idénticos independientes que van cubiertos por la malla del cable, por lo que la pantalla no
forma parte del circuito de audio. Con esta disposición, se logra mejorar la respuesta ante las interferencias que
ofrece la línea no balanceada de audio. La diferencia entre ambas es considerable, pudiendo llegar a los 80 dB
(más cuando se trata de líneas microfónicas de alta calidad).
Dicha mejora se fundamenta en que si una interferencia logra atravesar la malla, inducirá una corriente (o
ruido) de la misma magnitud en ambos conductores de la línea, pero como esta corriente inducida circula por los
dos conductores en el mismo sentido, cuando se encuentran en el extremo receptor, se anulan mutuamente. A
este tipo de interferencia se la conoce como señal de modo común. Precisamente, en muchas especificaciones
aparece como dato el CMRR que es la relación de rechazo del modo común (CMR) y como ha quedado dicho, su
valor debe ser, al menos, de 80 dB.
Esta buena respuesta ante el ataque de interferencias es la razón por la que las líneas balanceadas se utilizan en
el campo profesional.
Casos típicos de líneas balanceadas son las constituidas mediante par simétrico o par trenzado
Los cables de pares simétricos son utilizados en la transmisión de señales telefónicas y los distintos tipos,
según la aplicación son:

Cables de acometida
Cables terminales
Cables de distribución
Cables de enlace
Cables de interiores de abonado

Las partes fundamentales de un cable de par simétrico usados en las redes telefónicas públicas son:
Conductor. Usualmente son de cobre obtenido por procedimientos electrolíticos y luego recocido.
El calibre del conductor es proporcional a la distancia a enlazar, siendo los calibres usuales en España
0,405, 0,51, 0,64 y 0,91 mm.
Aislamiento: Salvo en los antiguos cables que era de papel, la capa de aislamiento es fabricada con un polímero
para evitar la exposición del conductor al medio ambiente y que la señal se disperse. Las características
importantes de la capa aislante son:

• Alta capacidad de aislamiento eléctrico


• Excelente procesabilidad
• Buenas propiedades mecánicas
• Alta resistencia al envejecimiento térmico.
Formación de pares y núcleo. El paso de pareado (longitud de la torsión) es diferente para reducir
desequilibrios de capacidad y por tanto la diafonía entre pares, los pares a su vez se cablean entre sí para formar
capas concéntricas. En algunos casos, los intersticios existentes entre los hilos se rellenan con petrolato, de
forma que se evite la entrada de humedad, o incluso de agua, en caso de producirse alguna fisura en la cubierta
del cable.
Capa envolvente - Pantalla - Cubierta negra. Usualmente constituida de capas de aluminio y polietileno, la
cubierta negra proporciona soporte mecánico al núcleo.
Un Cable de par trenzado es uno de los tipos de cables de pares compuesto por hilos, normalmente de
cobre, trenzados entre sí. Hay cables de 2, 4, 25 o 100 pares de hilos e incluso de más. El trenzado mantiene
estable las propiedades eléctricas a lo largo de toda la longitud del cable y reduce las interferencias creadas por
los hilos adyacentes en los cables compuestos por varios pares.
Aún teniendo trenzado a veces es necesario apantallar estos cables con un recubrimiento metálico o incluso
apantallar cada par trenzado dentro del cable completo para evitar interferencias entre estos. Definimos 3 tipos
básicos de pares trenzados según su recubrimiento:

UTP: (Unshielded Twisted Pair) Sin ningún tipo de recubrimiento metálico.


STP: (Shielded Twisted Pair) Recubrimiento metálico alrededor del cable completo.
S/STP: (Screened STP) Recubrimiento metálico alrededor de cada par trenzado y del cable completo.

Luis Torres • ltorresmancilla@gmail.com • Conservatorio Superior de Música de Málaga 17


Grabación y Edición Sonora - Luis Alfonso Torres Mancilla

CONECTOR XLR-3

El XLR-3 o canon es un tipo de conector balanceado. De hecho, es el conector


balanceado más utilizado para aplicaciones de audio profesional, y también es
usado por algunas marcas fabricantes de equipos de iluminación espectacular,
para transmitir la señal digital de control "DMX". Su apodo canon, por el que
es más conocido en España se debe a que los primeros que se usaron en este
país, estaban fabricados por la marca ITT/CANON, y llevaban "canon"
grabado en el chasis.
XLR son las siglas en inglés de Xternal Live Return; en español, Externo Vivo Retorno. El 3 indica que dispone
de 3 pines, ya que posteriormente a su aceptación como estándar se introdujeron los conectores de 4,5,6,7 y 8
pines.
Cuenta con tres patillas y su conexión habitual en Europa para señales de audio es la siguiente:
para la pantalla o malla.
- para la señal de ida, conocida como vivo o caliente
- para la señal de vuelta, conocida como retorno o frío.
En los EEUU y en UK hasta hace pocos años se utilizaba con las señales de los pines 2 y 3 invertidas,
por lo que es importante conocer el estándar utilizado por los equipos que queremos conectar para no cruzar las
señales e invertir su fase.

CONECTOR RCA
! ! ! ! !
El conector RCA es un tipo de conector eléctrico común en el mercado
audiovisual. El nombre "RCA" deriva de la Radio Corporation of America,
que introdujo el diseño en los 1940.
En muchas áreas ha sustituido al conector típico de audio (jack), muy usado
desde que los reproductores de casete se hicieron populares, en los años
1970. Ahora se encuentra en la mayoría de televisores y en otros equipos,
como grabadores de vídeo o DVDs.
El conector macho tiene un polo en el centro (+), rodeado de un pequeño
anillo metálico (-) (a veces con ranuras), que sobresale. El conector hembra
tiene como polo central un agujero cubierto por otro aro de metal, más pequeño que el del macho para que éste
se sujete sin problemas.
Ambos conectores (macho y hembra) tienen una parte intermedia de plástico, que hace de dieléctrico.
Un problema del sistema RCA es que cada señal necesita su propio cable. Otros tipos de conectores son
combinados, como el euroconector (SCART), usado exclusivamente en Europa.
La señal de los RCA no es balanceada por lo que corresponde generalmente a -10dBu. Esto hace que no se
utilicen profesionalmente.

CONECTOR JACK

De izquierda a derecha: mono de 2,5 mm.;mono y estéreo de 3,5 mm.; estéreo de 6,3 mm.

El conector Jack es un conector de audio utilizado en numerosos dispositivos para la transmisión de


sonido en formato analógico.
Hay conectores Jack de varios diámetros: 2.5mm, 3.5mm y 6.35mm. Los más usados son los de 3.5mm, también
llamados minijack; son los que se utilizan en dispositivos portátiles, como los mp3, para la salida de los cascos. El

Luis Torres • ltorresmancilla@gmail.com • Conservatorio Superior de Música de Málaga 18


Grabación y Edición Sonora - Luis Alfonso Torres Mancilla

de 2.5mm es menos utilizado, pero se utiliza también en dispositivos pequeños. El de 6.35mm se utiliza sobre
todo en audio profesional e instrumentos musicales eléctricos.
Un Jack de audio puede llevar dos canales de audio por separado, por lo que es un conector estéreo, o bien uno
sólo mono. El Jack estéreo lleva tres pines para soldar y por tanto tres divisiones metálicas en su cuerpo, una para
cada canal y una más que sería la masa o malla. El jack de tres pines también puede mandar una señal mono
balanceada al igual que los Bantham. El jack mono lleva dos pines y por tanto, dos divisiones metálicas en su
cuerpo.
En los Jacks stereo el extremo (tip) se considera siempre el canal izquierdo (L), el anillo (ring) se considera el
canal derecho (R), y la base es siempre masa (GND -de GrouND-).
Existen Jacks de 4 vías, usados para aplicaciones de audio-vídeo.
Las tarjetas de sonido de los ordenadores comunes utilizan este tipo de conectores, siempre de tipo hembra, al
que hay que conectar los altavoces u otros dispositivos por medio de un conector macho Jack de 3.5mm de
diámetro. En el caso de los ordenadores, como tienen varios conectores de este tipo, se utiliza un código de
colores para distinguirlos:

● Verde: Salida de línea estéreo para conectar altavoces o cascos.


● Azul: Entrada de línea estéreo, para capturar sonido de cualquier fuente, excepto micrófonos.
● Rosa: Entrada de audio mono, para conectar un micrófono.

Los ordenadores dotados de sistema de sonido envolvente 5.1 usan además estas conexiones:

● Gris: Salida de línea para conectar los altavoces delanteros.


● Negro: Salida de línea para conectar los altavoces traseros.
● Calabaza: Salida de línea para conectar el altavoz central o el subwoofer (subgrave).

Luis Torres • ltorresmancilla@gmail.com • Conservatorio Superior de Música de Málaga 19


Grabación y Edición Sonora - Luis Alfonso Torres Mancilla

La Cadena de Audio III


Preamplificación y Amplificación

Preamplificador

Un preamplificador es un tipo de amplificador electrónico utilizado en la cadena de audio, durante la


reproducción del sonido.
Como en todo amplificador, la finalidad de un preamplificador es aumentar el nivel de la señal y, para ello,
actúa sobre la tensión de la señal de entrada.
Cuando las señales salgan del preamplificador, habrán alcanzado el nivel de línea, estandarizado en los 0dB.
El preamplificador se encarga de nivelar la tensión eléctrica que le llega de las distintas fuentes de audio (cada
equipo tiene una tensión de salida diferentes), para luego, una vez igualadas, enviarlas, como señal de entrada, a
otro equipo (generalmente, una etapa de potencia).
La relación entre nivel de salida y de entrada es la ganancia. Así, la ganancia, expresada en decibelios, indica el
grado de amplificación de una señal.
Algunos equipos preamplificados poseen controles que les permiten, además de regular la tensión de salida,
regular el tono, el balance, etc. Además de reforzar la sonoridad con bajo volumen (loudness).
A pesar de lo dicho, normalmente, los equipos para audiófilos (Persona interesada en la tecnología relativa a la
reproducción fiel del sonido) no incluyen ninguno de estos controles, pues pueden distorsionar la señal original.
Estas actuaciones se pueden realizar, sin introducir pérdidas en la señal durante el proceso, más adelante, en la
etapa de potencia, en la mesa de mezclas o, incluso, en el altavoz.
Etapa de potencia
Etapa de potencia, amplificador de potencia o etapa de ganancia son los nombres que se usan para
denominar a un amplificador de audio. La función del amplificador es aumentar el nivel de una señal,
incrementando, para ello, la amplitud de la señal de entrada mediante corrientes de polarización (voltaje
negativo, voltaje positivo) en el transistor de salida.
El amplificador necesita de un transformador, pues, internamente, trabaja con corriente continua.
Cuando se diseña un amplificador, es fundamental la ventilación del mismo. Por ello, siempre encontraremos
rejilla de ventilación y los fabricantes habrán instalado en su interior ventiladores (como en el ordenador). Esto
es porque durante el procesado de la señal, en su interior, se desprende gran cantidad calor.
Físicamente, cuando vemos un amplificador, nos encontramos con un equipo en el que, habitualmente, sólo hay
un botón: el power para enchufarlo o apagarlo.
En la parte posterior, no obstante, esta el panel con las correspondientes entradas y salida que estarán en
función de la cantidad de señales que puede soportar un determinado modelo de amplificador.
Las características técnicas de cada modelo determinarán la calidad del amplificador:
! ! Impedancia
La impedancia es la resistencia (oposición) que presenta cualquier dispositivo al paso de una corriente
alterna.
La impedancia de entrada de un amplificador debe ser de, al menos, 10 kΩ. Estos 10 kΩ se dan para que en el
caso de posicionar 10 amplificadores en paralelo la carga total sea de un kΩ. (10 kΩ / 10 = 1 kΩ).

Luis Torres • ltorresmancilla@gmail.com • Conservatorio Superior de Música de Málaga 20


Grabación y Edición Sonora - Luis Alfonso Torres Mancilla
!
Factor de amortiguación
Indica la relación entre la impedancia de salida del amplificador y la impedancia nominal del altavoz al
que va conectado.
Cuanto mayor sea el factor de amortiguamiento mejor, pero por encima de doscientos, puede significar que el
amplificador está deficientemente protegido contra cargas reactivas que pueden deteriorarlo.
El factor de amortiguamiento se expresa: 200 sobre 8 Ω, lo que significaría que este factor de amortiguamiento
es de 0,04 Ω (8/200).
Muchos fabricantes incluyen el factor de amortiguamiento para graves, lo que resulta muy útil, porque sabemos
que ésa es la respuesta en frecuencia crítica. Vendría indicado como 150 sobre 8 Ω a 40 Hz.
! Potencia de salida
Hace referencia a la potencia eléctrica, no confundir con la potencia acústica.
Como en el altavoz, es la cantidad de energía que se puede introducir en la etapa de potencia antes de que
distorsione en exceso o de que pueda sufrir desperfectos.
Se especifica la potencia máxima del amplificador en función de una determinada impedancia, generalmente, 8
Ω. Por ejemplo: 175 W sobre 8 Ω).
Si el amplificador es estéreo, hay que tener en cuenta si esa potencia se refiere a cada uno de los canales o a
ambos. Por ello, en las especificaciones técnicas, se añade una de estas dos indicaciones:
Con los dos canales alimentados.
Por canal.
En el ejemplo anterior con una potencia de salida de 175 W sobre 8 Ω, si se añade con los dos canales
alimentados significa que por canal la potencia será la mitad (87,5 W sobre 8 Ω).
Por el contrario, con una potencia de salida de 175 vatios sobre 8 ohmios por canal, tendremos 350 W sobre 8 Ω
con los dos canales alimentados.
En los equipos que permiten modificar la impedancia de entrada, también hay que tener en cuenta las
modificaciones que el variar este parámetro introducen en la potencia. En este caso, se hacen aproximaciones
cercanas, nunca son absolutas, porque, en el estado actual de los amplificadores, esto no es posible. Así, si
tenemos un amplificador en el que en las especificaciones técnicas figura 175 W sobre 8 Ω, si reducimos la
impedancia a 4 Ω, la potencia será cercana al doble, los 350 W (en un amplificador ideal, debería ser justamente
estos 350 W).
Dentro de la potencia se diferencia entre potencia nominal y potencia de pico.
! Potencia máxima
Potencia máxima eficaz, o potencia media a régimen continuo es la potencia eléctrica real verificable
con instrumentos que puede proporcionar la etapa de salida durante un minuto a una frecuencia de 1 KHz (kilo
hertcio) sobre la impedancia nominal especificada por el fabricante (normalmente 4, 6 u 8 Ohmnios) y viene
dada por la expresión Po= Vo(rms)²/Zo. Donde:
! Po.- es la potencia de salida.
! Vo.- es el voltaje (tensión electrica) eficaz de salida.
! Zo.- es la impedancia nominal del amplificador
Nota: para medir la potencia se emplea una resistencia de igual valor, pues una impedancia compleja altera el
desempeño del amplificador.
! Potencia máxima útil
La potencia eficaz esta limitada por la distorsión del equipo, ya que esta crece con la potencia, de modo
que se especifica la potencia útil a un nivel de distorsión nominal, como 1, 2 ó 5% (10% en amplificadores de baja
calidad) o menos de 0.25% en otros de alta calidad, esta medida es inferior a la anterior.
! Potencia de pico, admisible o musical

Luis Torres • ltorresmancilla@gmail.com • Conservatorio Superior de Música de Málaga 21


Grabación y Edición Sonora - Luis Alfonso Torres Mancilla

Potencia máxima impulsiva (un pico de señal'), que puede soportar cada cierto tiempo el amplificador
antes de deteriorarse.
Algunos fabricantes en lugar de especificar la potencia nominal, especifican la potencia de pico, para maquillar el
alcance del amplificador, pues la potencia de pico siempre es superior a la potencia nominal. Hay que estar alerta
a este detalle y tener en cuenta que la potencia de pico de un amplificador es 1,4142 (raíz cuadrada de 2) veces su
valor nominal.
! Relación señal/ruido
Hace referencia al voltaje de ruido residual a la salida y se expresa en dB.
Para que la relación señal /ruido esté por debajo del umbral de audición, debe ser de al menos 100 dB. Mayor,
110 dB, en el caso los amplificadores de alta potencia (por encima de los 200 vatios) la cual surge al hacer
frotación
! Acoplamiento
Indica la forma en que el amplificador está conectado al altavoz. Se habla de “acoplamiento directo”,
cuando ambos esta acoplados directamente, sin pasos intermedios.
Internamente, el amplificador funciona con tensión continua, pero a la salida convierte la señal en corriente
alterna. Cuando conectamos directamente un amplificador con el altavoz, este acoplamiento directo debe
hacerse de forma que la corriente continua residual (DC offsets) sea lo más baja posible, no superando los 40
milivoltios. (Los más habituales están en 15 milivoltios).
! Respuesta en frecuencia
Calcula el límite dentro del cual el amplificador responde de igual forma (respuesta plana) a las
audiofrecuencias (20 a 20.000 Hz) con una potencia muy baja.
La respuesta en frecuencia en los amplificadores se mide en dB tomando como referencia potencia de 1 vatio con
una impedancia de 8 ohmios. Para obtener una óptima respuesta en frecuencia, ésta debe estar en torno a 5 dB
por encima (+ 5 dB) o por abajo (- 5 dB).
Muchos fabricantes, en lugar de usar sólo las audiofrecuencias, para proteger a los amplificadores de
perturbaciones suprasónicas o subsónicas, lo que hacen es medir la respuesta en frecuencia para una banda de
frecuencias superior (generalmente de 12 a 40.000 Hz). En este caso una respuesta en frecuencia óptima debe
estar en torno a 3 dB por encima (+ 3 dB) o por abajo (- 3 dB).
! Respuesta de fase
Indica la relación en la fase entre las frecuencias medias con respecto a las altas o las bajas. Este desfase
(adelantamiento o retraso) en el espectro de audiofrecuencias (20 – 20.000 Hz) no debería ser superior a los
15º, para que no se produzca distorsión o cancelamientos de la señal.
Existen ciertos modelos de amplificador que invierte la fase en toda su banda de paso, lo que puede ocasionar
dificultades en su operatividad (sino lo tenemos presente podremos estar cancelando toda la señal).
! Ganancia
Es la relación entre la potencia de salida y la potencia de entrada de la señal. Se expresa siempre como
una relación logarítmica, y la unidad suele ser el dB, esto es, diez veces el logaritmo decimal del cociente entre
potencias (si se relaciones tensiones, sería veinte veces en lugar de diez debido a que la potencia es proporcional
al cuadrado de la tensión).
Si la potencia de salida es 40 W (vatios) y la de entrada 20 W, la ganancia es: 3dB. Si la tensión de salida es de 4
VRMS y la de entrada 2 VRMS, la ganancia es: 6 dB.
Cuando la ganancia es menor que 1, hablamos de atenuación.
En lo relativo a amplificadores, como el decibelio siempre expresa una comparación hablaremos de dBW o
dBu, lo que nos indicara cual es la referencia.
dBW: La W indica que el decibelio hace referencia a vatios. Es decir, se toma como referencia 1 W (vatio). Así,
a un watio le corresponden 0 dBw.
dBm: Cuando el valor expresado en vatios es muy elevado, se usa el milivatio (mW). Así, a un mW le
corresponden 0 dBm.

Luis Torres • ltorresmancilla@gmail.com • Conservatorio Superior de Música de Málaga 22


Grabación y Edición Sonora - Luis Alfonso Torres Mancilla

dBu: El dBu expresa el nivel de señal en decibelios y referido a 0,7746 VRMS . 0,7746 VRMS es la tensión
aproximada que aplicada a una impedancia de 600 Ω, disipa una potencia de 1mW. Se emplea la referencia de
una impedancia de 600 Ω por razones históricas1.
En un circuito en el que intervienen varios amplificadores, las ganancias individuales expresadas en
decibelios ( en cualquiera de sus fórmulas tanto dB, dBw, dBm o dBu) se suman (restan si son negativas y es
atenuación).
! Sensibilidad
Indica la cantidad de flujo eléctrico necesario de entrada para producir la máxima potencia de salida.
 
La sensibilidad viene indicada por dBu a una determinada impedancia. El dBu expresa el nivel de señal
en decibelios y referido a 0,7746 VRMS. (Al hacer referencia a voltios, en muchos manuales, principalmente
norteamericanos, en lugar de dBu usan dBV). Así, 774,6 mVRMS equivaldrán a 0 dBu.
Si se supera el valor especificado por la sensibilidad la señal de salida sufrirá un recorte (tanto por arriba como
por abajo), como ocurre en los limitadores, y quedara distorsionada de tal modo que puede causar daño en
ciertos equipos como en los tweeter.
Para evitar este gran problema, la mayoría de equipos profesionales cuentan con un control de nivel de la
entrada, que nos permiten atenuar la señal si resulta excesiva.
! Distorsión
La distorsión (distorsión armónica) describe la variación de la forma de onda a la salida del equipo, con
respecto a la señal que entró y se debe a que los equipos de audio, no sólo los amplificadores, introducen
armónicos en la señal.
Las causas de esta distorsión pueden ser múltiples. En el caso de los amplificadores, la más usual es la
sobrecarga a la entrada, es decir, sobrepasar la potencia recomendada por el fabricante, lo que produce a la salida
un recorte de la señal, queda el sonido "roto".
La distorsión armónica total, debe ser, como máximo de 0,1 % THD(total harmonic distortion) en todo el
espectro de frecuencias (las frecuencias altas – agudos, distorsionan más que la bajas – graves).
La distorsión también puede expresarse en dB en relación a una frecuencia. Es lo que se conoce como
distorsión por intermodulación de transistores. Para medir esta distorsión lo que se hace calcular la distorsión
del amplificador para dos ondas senoidales diferentes (generalmente, 19 y 20 kHz) y ver cuál es la diferencia
entre estas señales expresada en dB. Los amplificadores de calidad deben estar en los 70 dB de diferencia en ese
tono diferencial de 1 Khz.
! Diafonía
La diafonía indica que en un sistema estéreo, un canal de audio, afecta al otro.
La diafonía depende de la frecuencia. Así hablaremos de que la diafonía es soportable cuando este en torno a
50 dB para graves y agudos y 70 dB para los tonos medios.
Para eliminar problemas de diafonía, los amplificadores cuentan con rectificadores, condensadores de filtro.
Además, muchos fabricantes introducen fuentes de alimentación independientes para cada canal, lo que resulta
muy efectivo.
Tipos de Amplificadores de Potencia
Entre las diferentes tipologías de etapas de potencia encontramos:
• Clase A
• Clase B
• Clase AB
• Clase C
• Clase D
• Clase G
• MOSFET

Luis Torres • ltorresmancilla@gmail.com • Conservatorio Superior de Música de Málaga 23


Grabación y Edición Sonora - Luis Alfonso Torres Mancilla

La Cadena de Audio IV
El Audio Digital

¿Qué es el audio digital?

! Podríamos definir audio digital como la representación de una señal de audio mediante números, en
general codificados en forma binaria (es decir con ceros y unos, el lenguaje interno de los ordenadores).
Entendemos como señal de audio cualquier objeto sonoro audible. Cualquier sonido puede representarse en
números, al igual que cualquier imagen o gráfico.
! En términos menos genéricos, también podemos llamar audio digital a la tecnología que permite
grabar, editar, mezclar y masterizar una señal de audio completamente en el dominio digital. Para ello existe un
amplio surtido de aparatos y equipos que procesan la señal de audio en el dominio digital, dominio que ofrece
muchas más ventajas ya que es totalmente "tratable" por un ordenador, es decir, permite un grado de
manipulación sin precedentes.
●! Introducción
! Para la gran industria de la música, el audio digital nació de una necesidad muy concreta; ahorrar
tiempo de producción. Antes del audio digital, el método de grabación era lo que hoy en día se conoce como
grabación analógica, los impulsos del sonido se registraban en una bobina o cinta. La edición de esa bobina era
un proceso muy largo y tedioso, en el que la precisión y paciencia eran algo obligado. Por otro lado, obtener un
buen equipo analógico era algo realmente caro. Hablando de creatividad de mezclas y producción de audio, los
procesos que podían aplicarse eran muy limitados comparados con los de hoy en día. Por poner un ejemplo, si se
requería una reverberación concreta el músico debía registrar su interpretación en la sala que producía esa
reverberación.
! La introducción del audio digital ha revolucionado, sin duda alguna, toda la industria de la música, las
empresas que construyen instrumentos, los creadores o músicos, los procedimientos de edición y mezcla, y
desde luego el soporte; es decir lo que nosotros oímos en casa: un CD de audio o los tan famosos MP3. La
tecnología del audio digital ha dado lugar a toda una nueva legión de instrumentos musicales que prometen un
grado de libertad de creación de sonidos sin precedentes (solo superada por al síntesis virtual). Estos nuevos
instrumentos han propiciado la existencia d nuevos estilos musicales que dependen en gran parte de esa
tecnología.
! El músico tradicional ha tenido que adaptarse a esos cambios. Cuando nacieron los primeros
instrumentos digitales los músicos eran reacios a utilizarlos (el sintetizador el instrumento musical con más
rechazo de toda la historia). Muchos pensaban que eran máquinas malditas que pretendían sustituir o imitar
instrumentos tradicionales. No les faltaba parte de razón. El audio digital son fotografías digitales de sonido, por
lo que no hacia falta tratar de imitar un piano, ya que tenemos la foto del sonido de un piano. La primera
consecuencia fue la drástica reducción de costes de grabación. Para grabar un piano hacen falta micrófonos. Los
micrófonos deben situarse correctamente según el ambiente y color que pretendemos dar a ese piano. Eso
representa horas de pruebas y corrección de pequeñas imperfecciones producidas por el solapamiento de las
señales de los micros. Si utilizamos un instrumento digital con un buen sonido de piano, sólo requerimos dos
cables, izquierdo y derecho y siempre sonará igual de bien sea cual sea el entorno acústico. Aunque los primeros
instrumentos digitales eran muy caros, hoy en cualquier ordenador incluye un instrumento digital, la tarjeta de
sonido, que es muy limitada en comparación con los grandes sintetizadores de la industria , pero
extremadamente más avanzada que los primeros instrumentos digitales.
! En el entorno del estudio de grabación, el audio digital también ha supuesto un importante avance. Ya
no hace falta guardar celosamente las bobinas master (para que el paso del tiempo no las merme) el audio digital
es indestructible, sólo puede destruirse deteriorando el medio en el que se almacena; un CD, un disco duro,
Luis Torres • ltorresmancilla@gmail.com • Conservatorio Superior de Música de Málaga 24
Grabación y Edición Sonora - Luis Alfonso Torres Mancilla

etc.... También han desaparecido los tediosos procesos de cortar y pegar (hechos literalmente con tijeras y cola).
Ahora existe la edición no lineal que como veremos más adelante puede ser destructiva o no. La ambientación de
la mezcla ha pasado a ser una realidad palpable. Donde antes existían habitaciones enormes con paredes móviles
para recrear reverberaciones, ahora existen pequeños equipos de no más de 5kg que incluyen ambientes de salas
y halls famosos; podríamos cantar con el ambiente de en la opera de Sydney, aunque eso sólo existirá en nuestro
cerebro, ya que en realidad estaríamos solos delante de un ordenador. Existen otros detalles menores, como el
hecho de que por primera vez el músico puede grabar parte de su música en casa y luego seguir en un estudio,
transfiriendo digitalmente las pistas. Esto ofrece una libertad de mezclas y producción de audio increíbles: un
usuario sin recursos puede acudir a un estudio y seguir editando sin perder la calidad original.
! Por último, tenemos el soporte digital, es decir el medio en el que recibimos el producto musical
acabado. Donde ante teníamos los discos de vinilo o las cintas de cassette, ahora tenemos el CD /DVD y el
minidisc. Desde el punto de vista de fiabilidad, estos soportes no fallan (¿cuantas veces se nos ha enganchado
una cinta en el cabezal?) y físicamente son más duros y compactos, para que dejen de funcionar hay que destruir
el medio, no basta con una rayada.

! Soporte digital y analógico

! Veamos con detenimiento las diferencias más importantes entre el soporte analógico y el digital:

! Soporte Analógico

! ! Degradable: Cuantas más veces se usa,


mayor degradación se obtiene. Los datos se almacenan físicamente
sobre un sustrato que es mucho más alterable con el paso del
tiempo.
! ! Lineal: El audio se graba secuencialmente
en el tiempo y con el mismo orden de ejecución, de principio a fin.
! ! Calidad de audio: La calidad de un sistema
de grabación analógico resulta inferior a la mínima calidad de audio
ofrecida por un sistema digital. En la práctica, un sistema analógico
rara vez supera los 70dB de relación señal ruido (SNR). Un
grabador profesional analógico puede alcanzar los 85dB SNR.
! Por otro lado, deberíamos evitar una sensación de
triunfalismo absoluto del audio digital frente al analógico. Un buen
técnico de sonido puede lograr que una canción suene
increíblemente bien en sistemas analógicos, de hecho tenemos toda la industria de la música para demostrarlo.
Aunque el medio analógico sufre muchos problemas de calidad e inestabilidad, los grandes profesionales de
producción saben como solucionar estos problemas. ¿Qué problemas?
! Por ejemplo, la diafonía e imperfecciones de la mecánica. Los distintos canales de una grabadora
analógica suelen mezclarse, es decir, parte de la señal de un canal también se percibe en otro canal. El propio
medio analógico provoca que parte de la señal de un canal se "cuele" en el otro canal. Un método para evitar
este problema consiste en utilizar cintas más anchas, en las que las pistas ocupan más espacio físico. Por otro
lado, las imperfecciones de la mecánica empleada para la reproducción sonora dan lugar a problemas de wow,
flutter, tremolo, etc. Otras notables diferencias son la separación entre los canales izquierdo y derecho, la
relación entre la señal y el ruido de fondo, la linealidad de la respuesta en frecuencias y de fase, la relación entre
el nivel más bajo y el más alto.
! ! Edición destructiva: La edición de las grabaciones de audio en el mundo analógico es
totalmente destructiva. La edición en el mundo analógico es siempre destructiva e incluso a veces se destruye
parte del propio medio en el que reside la grabación, la cinta o bobina (en operaciones de copia en las que se
requiere cortar físicamente la cinta). Por otro lado, el tiempo invertido en la edición es extremadamente elevado
así como los costes en términos el precio en términos de pruebas fallidas y errores humanos.

Luis Torres • ltorresmancilla@gmail.com • Conservatorio Superior de Música de Málaga 25


Grabación y Edición Sonora - Luis Alfonso Torres Mancilla
!
Soporte Digital

! ! No degradable: Una grabación de audio digital es una cadena gigante de 0 y 1 perfectamente


ordenados. Es imposible que "el paso del tiempo" convierte un 0 a un 1, es decir que pueda alterar esa cadena.
Como mucho, es posible que una mala manipulación del soporte (por ejemplo el CD) provoque que durante un
instante aparezcan artefactos o ruidos que originalmente no estaban. Lo que nunca ocurrirá es que el audio de
ese soporte digital vaya apagándose , perdiendo brillo con el paso del tiempo. La durabilidad de los datos es
eterna, puesto que pueden ser almacenados en cualquier dispositivo de almacenamiento, como puede ser un
disco duro, una memoria, etc., y recuperados en cualquier momento
! ! Lineal / No-lineal (acceso aleatorio): Si en el mundo analógico el tiempo es algo fijo e
invariable (una obra se registra de principio a fin) en el mundo digital no tiene porque ser así. Existe un soporte
digital llamado DAT que está basado en cinta analógica aunque en ella se registran 0 y 1 como un en CD pero
con una calidad superior a éste. En este caso, la grabación y reproducción es lineal. Considerando el disco duro
de nuestro ordenador como soporte digital (archivos wav, aiff o MP3) llegamos a la inequívoca conclusión de que
es un soporte no lineal. Los 0 y 1 de las canciones que registramos se almacenan por todo el disco duro sin orden
alguno. El acceso a cualquier parte de esta canción (una vez grabada) es instantáneo, no hay tiempo de espera,
dicho de otra forma, se tarda tanto en reproducir desde el inicio de la obra como, en mitad de ella: apenas unos
milisegundos.
! ! Calidad de audio: La calidad de audio del soporte digital, es mayor que la del analógico. La
respuesta de frecuencias, es decir el espectro de frecuencias que el grabador digital es capaz de grabar es mucho
mayor que el analógico, aunque en el caso del mundo digital la teoría y la práctica siguen caminos que pueden ser
muy distintos, es decir, la calidad teórica de un sistema de audio a 24 bits es superior a la calidad que ofrece en la
realidad, aunque esta realidad mermada es muy superior a la analógica; sea como sea, el audio digital siempre
puede tener más calidad que el analógico.
! ! Diafonía imperceptible o casi nula: En los grabadores de audio digital, nunca ocurrirá que
monitorizando una pista aislada podamos oír parte de la señal de sus pistas adyacentes. Cada pista de ese
grabador digital registra y reproduce sus propias cadenas gigantes de 0 y 1. Es imposible que el ordenador se
equivoque y sume 0 y 1 de distintas pistas.
! ! Edición no destructiva: El último aspecto es quizás el mas interesante dentro de la vertiente
creativa del sonido. Por primera vez es posible crear audio. La música siempre ha tenido efectos como
reverberación, retardos, distorsiones y ecualización, pero por primera vez estamos ante el nacimiento de nuevos
efectos de indescriptibles resultados. El procesado de estos efectos puede ser destructivo, es decir alterando la
grabación original (los 0 y 1) son manipulados y alterados o bien no destructiva en el que los cálculos se realizan a
tiempo real, es decir, "mientras el audio suena". En este caso el archivo original se mantiene intacto.

! Introducción a los formatos digitales: imágenes y sonidos

! Debes saber que no hay límites, ni siquiera pienses que la calidad de tus composiciones tiene que ser
inferior a la que obtendrían unos músicos profesionales. Pero para todo esto es necesario conocer bien las
herramientas de las que vas a disponer y saber cómo aplicarlas en cada momento, y en esto se centrará éste y los
próximos artículos.
! Presentamos el MIDI y el audio digital, dos de las tecnologías más utilizadas para hacer música por
ordenador y vemos su funcionamiento básico y algunas diferencias entre ambas.
! Existe una curiosa analogía entre el mundo del sonido y el de la imagen por ordenador. Un ordenador
es capaz de trabajar, básicamente, con dos tipos de gráficos: gráficos vectoriales, como los generados por
CorelDraw o FreeHand y gráficos rasterizados o de mapa de bits, como las fotografías generadas con
AdobePhotoshop. Para simplificar la explicación, supondremos que trabajamos de imágenes en rojo y negro
(sólo dos colores).
! El funcionamiento del gráfico vectorial se basa en definir puntos en el plano mediante coordenadas y
acciones. Para dibujar un triángulo, bastaría con definir las coordenadas de los tres vértices y aplicar la acción de
unirlos por una línea.

Luis Torres • ltorresmancilla@gmail.com • Conservatorio Superior de Música de Málaga 26


Grabación y Edición Sonora - Luis Alfonso Torres Mancilla

! En el caso de el gráfico de mapa de bits se tiene una matriz o rejilla de píxels y se indica, para cada uno
de ellos, si está coloreado o no.

! Comparemos ahora el espacio de cada imagen. La vectorial necesitará unos pocos bytes, los suficientes
para almacenar tres coordenadas y tres líneas. En cambio la de mapa de bits tendrá que almacenar todos y cada
uno de los pixels o huecos de la rejilla que conforman el triángulo. Como este gráfico es de unas dimensiones de
9x5 píxels tendrá que almacenar 45 píxels. Si queremos doblar el tamaño del tiangulo, el gráfico sería de 18x10 y
tendría que almacenar 180 bytes. En cambio, en el caso del gráfico vectorial, el tamaño siempre será constante
(sólo cambiará el valor de las coordenadas).
¡Ya sé que las imágenes no suenan! así que volvamos a nuestro mundo musical.

El MIDI es al gráfico vectorial lo que el audio al gráfico de mapa de bits.


La representación gráfica necesita dimensiones en el espacio y la representación sonora, dimensiones en
el tiempo.

! El gráfico vectorial define puntos y acciones como dibujar línea; el MIDI define instantes de tiempo y
eventos, como tocar una nota o cambiar instrumento. De este modo, podría crear un evento Toca_nota Do en el
segundo 1 y Toca_nota Re y Sol dos segundos después y cada uno de estos eventos es independiente del resto.
¡Tranquilo, que no es así como se compone! Después veremos que hay varias formas de representar esta
información.
! En cambio, el audio digitalizado define (va “dibujando”) una señal dentro de una rejilla conforme
avanza el tiempo. Por ejemplo, un solo segundo de una señal digitalizada con calidad de CD (44KHz, 16bits/
muestra) sería una rejilla de 44.000 columnas y 65536 (216) filas, y por cada columna sólo una casilla puede estar
coloreada, ya que una señal debe tener un valor único a cada instante de tiempo. Basta este ejemplo para darse
cuenta de que trabajar con audio digitalizado va a requerir un equipo más potente y con más espacio, a priori,
que trabajar con ficheros MIDI. Profundizaré en este tema más adelante, en la sección dedicada al audio digital.

! Bien, continuemos en nuestro mundo de imágenes y sonidos. Imagina ahora que queremos modificar
uno de los vértices del triángulo del ejemplo anterior y estirarlo hacia arriba, por ejemplo. ¡Qué sencillo será
hacer esto con el gráfico vectorial! No tendremos más que modificar las coordenadas del vertice deseado y listo.
Veamos ahora que pasaría con la imagen de mapa de bits. Tendríamos que borrar todas las líneas afectadas y
redibujarlas de nuevo con los nuevos datos. Como puedes ver, este método es menos flexible a la hora de editar
los datos.
! Una vez más, en el sonido ocurre lo mismo. El MIDI permite, por ejemplo, definir el valor de una nota
y el instante en el que empieza. Cambiar estos valores no repercute en absoluto en el resto de la canción,
mientras que si nosotros grabamos con un micrófono una melodía mezclada con otro sonido va a ser mucho más
costoso cambiar una de sus notas a otra y, en algunos casos, puede ser tarea imposible.

Luis Torres • ltorresmancilla@gmail.com • Conservatorio Superior de Música de Málaga 27


Grabación y Edición Sonora - Luis Alfonso Torres Mancilla

! Es posible que te estés preguntando “entonces, ¿es mejor el MIDI que el audio digitalizado?” Pues no
exactamente. Veremos cuando conviene usar cada una de estas tecnologías y que cada una de ellas tiene sus
ventajas e inconvenientes. Y ahora, un último experimento con imágenes.
! Tenemos un triángulo en una imagen vectorial y en una imagen de mapa de bits. Proporcionamos los
datos de la imagen vectorial a varias personas para que lo dibujen. ¿Qué va a ocurrir? Ocurrirá que aquellas
personas con más destreza o con mejor mano para el dibujo harán una representación de los datos mejor que las
otras, aunque seguramente en todos los dibujos reconoceremos el triángulo que les hemos entregado.

! ! ! ! ! !
! Ahora repetimos el experimento, pero en vez de darles las coordenadas les entregamos una cuadrícula
en el que está indicado qué rectángulos han de colorearse y cuáles no. Parece evidente que en este caso todos los
dibujos serán (casi) exactamente iguales, ya que lo único que han de hacer es colorear o no por completo cierto
número de cuadraditos. Una vez más, veamos qué sentido tiene esto en el MIDI y en el audio digitalizado.
! El MIDI, como ya hemos dicho, permite definir eventos como “Toca nota” o “Cambia instrumento”.
Pero, cuando el MIDI dice “Toca nota DO con instrumento Piano”, ¿quién interpreta ésta orden? Pues bien,
esta órden la recibirá una tarjeta de sonido, un teclado MIDI o cualquier otro dispositivo MIDI y usará su propio
banco de instrumentos. Esto quiere decir que la misma obra MIDI interpretada por dos tarjetas de sonido
diferentes no tiene por qué usar los mismos sonidos. De este modo, si componemos una obra a piano con
nuestro ordenador es posible que cuando se la enseñemos a un amigo en su ordenador no suene exactamente
igual, aunque sí identificaremos la melodía de nuestra composición (tal como ocurría con los triángulos.) El
hecho de que una obra MIDI no lleve implícitos los instrumentos que hemos usado al componerla ¿debe
entenderse como una ventaja o como un inconveniente? La respuesta no es, en absoluto, evidente. En el
próximo apartado dedicado al MIDI veremos cómo aprovechar esta característica y como solucionar los posibles
problemas que puedan surgir.
! En cuanto al audio digitalizado, podemos entenderlo como una representación digital de una señal de
audio. Para reproducir una señal de audio digital (por ejemplo un CD de audio o un fichero WAV o AIFF) es
necesario lo que se conoce como un “Convertidor Digital-Analógico” o DAC, presente en tarjetas de sonido,
lectores de CD, etc. Este DAC convierte una señal digitalizada en ondas analógicas que, una vez amplificadas,
serán capaces de hacer vibrar la membrana de un altavoz. Existen DACs que hacen esta conversión con mejor o
peor calidad. No voy a decir que todos los DACs suenan igual, de hecho ¿nunca te has preguntado por qué valen
muchisimo más unos reproductores de CD que otros? A parte de otros factores como el juego de lentes, la
marca, etc., la calidad del DAC es un punto decisivo en la bondad de la reproducción final. Aunque esta
diferencia de calidades sólo se percibirá si tanto la grabación como el equipo completo (amplificador,
ecualizador y altavoces) es tan exigente como el propio DAC.
! Todo esto viene para concluir que el audio digitalizado tiene implícita la información del sonido y que
no depende en ningún modo de los instrumentos del aparato reproductor (ejem, reproductor de sonido, se
sobreentiende) como ocurría en el MIDI. De hecho, ni siquiera diferenciará si la información que tiene es de una
guitarra, un piano, una voz humana o todo junto a la vez. Simplemente convertirá una señal digital a analógica. Y
cuando grabes tu primer MP3 o tu primer CD esperarás que las obras suenen lo más parecido a como tú los
compusiste, tanto si el que los escucha lo está haciendo desde un CD portátil o desde un Bang & Olufsen. Y para
esto, sin duda, deberás recurrir a esta técnica. En el apartado dedicado al audio digital veremos en qué ocasiones
conviene usar esta tecnología para hacer tus composiciones y hablaremos de ese gran aliado que tiene, que son
los filtros y efectos.

! Frecuencia de muestreo

! El proceso de captura de audio a soporte digital se conoce como "muestreo" (sampling, en el ámbito
de los DJ). Esta operación de codificación del audio analógico a 0, 1 tiene lugar a tiempo real, es decir mientras la
señal de audio analógico (audio "real") se reproduce. En los grabadores de audio digital, tanto en sistemas
Luis Torres • ltorresmancilla@gmail.com • Conservatorio Superior de Música de Málaga 28
Grabación y Edición Sonora - Luis Alfonso Torres Mancilla

dedicados como en las tarjetas de sonido populares, existe un componente llamado conversor AD (analógico-
digital, es decir el componente que se encarga de convertir señales eléctricas a cadenas binarias). El proceso
inverso, es decir la reproducción utiliza un conversor DA (digital-analógico). El conversor aplica una "rejilla" de
tiempo al audio y captura el audio comprendido en las casillas de la rejilla. Podemos utilizar un ejemplo muy
sencillo. Si queremos grabar un atleta que corre durante" x" metros en una pista olímpica, necesitamos una
cámara que corra junto a éste (imagina la clásica cámara montada en raíles). Esta cámara capturará 25 fotos
(frames, en el argot) por segundo. ¿25 y no 98 o 4.7? 25 fotos por segundo es más que suficiente para engañar al
ojo humano y hacerle creer que esta sucesión de fotos es un movimiento real de un señor corriendo. Para
capturar el audio de ese corredor necesitamos un micrófono y un grabador de audio que "fotografíe" el sonido.
Para engañar al oído, necesitamos más de 25 fotos por segundo, bastantes más...44.100 fotos por segundo, para
ser exactos.
! En el mundo del audio no se utiliza la expresión fotos por segundo, sino que se habla de la Frecuencia
de Muestreo. Una frecuencia de muestreo de 44.100 se conoce como 44.1 kHz (Kilo Hercios). Esta frecuencia
de muestreo permitiría no diferenciar la fuente un sonido que se produce en la habitación de al lado, oiríamos a
un señor hablando y no sabríamos si es real o una grabación que se está reproduciendo. Si la frecuencia de
muestreo fuera menor, por ejemplo 22.050 kHz, ese señor tendría una voz muy opaca, como si hablase con una
mano tapándose la boca. Nos parecería muy raro, no seria una voz natural. ¡No podrían engañarnos!
! Existe una relación matemática que relaciona la frecuencia máxima registrable (es decir, hasta qué
frecuencia podremos grabar) en función de la frecuencia de muestreo. Estamos hablando del teorema de Nyquist
y básicamente nos dice que si queremos grabar una señal de audio que llega hasta "x" frecuencia, debemos
utilizar una frecuencia de muestreo mínima de "2x", es decir el doble de la frecuencia más alta originada en la
señal que deseamos grabar. Por ejemplo, si queremos grabar una señal de audio que llega hasta los 20 KHz,
Nyquist nos dice que necesitamos una frecuencia de muestreo mayor o igual a 40kHz. Todos los CD del
mercado reproducen audio con una frecuencia de muestreo de 44.1kHz, es decir, pueden reproducir
perfectamente señales de audio con frecuencias de hasta 22050Hz (que es justamente el límite de frecuencias
teórico que podemos oír los humanos; los elefantes poseen un limite inferior por debajo de los 10Hz y las
hormigas mayor a 22kHz). La radio digital emplea una frecuencia de muestreo de 32kHz (hasta los 16000Hz)
frente a los 96kHz del estándar DVD (hasta los 48000Hz). Por lo tanto...

Según Nyquist, es posible repetir con exactitud una señal de audio si la frecuencia de muestreo es como
mínimo el doble de la frecuencia de la componente de mayor frecuencia.

! Resolución de Bits
! Ya sabemos que necesitamos tomar 44100 "fotos" del sonido por segundo, pero ¿estas fotos cómo se
almacenan?. En forma de bits, cadenas de 0 y 1 totalmente manejables por el ordenador. La cantidad de bits que
se utilizan para representar la muestra del audio es la resolución de la muestra. Una resolución de 8 bits (1 byte)
permite manejar valores de entre 0 a 255 (256 valores). Dicho de otra forma, para representar una señal máxima
de 255 necesitaré 8 dígitos binarios (0 o 1) y en este ejemplo, 255 es 1111111 en binario (8 dígitos 1). Una palabra
de 16 bits (2 bytes) maneja un valor máximo de 65535 (65536 si contamos el 0 como valor),
1111111111111111=65535.
! De esta forma, cada uno de las 44100 capturas realizadas contienen un valor codificado en "x" bits.
Cuanto mayor sea la resolución, más calidad tendrá la grabación. Tanto la frecuencia de muestreo como la
resolución tienen incidencia directa en la calidad de la grabación y reproducción de audio digital. La resolución,
por su parte, también tiene incidencia directa en el rango dinámico o relación señal-ruido de la grabación
(abreviada S/R o S/N en inglés y se mide en dB o decibelios). Existe una relación que indica que esta relación S/
N es igual al resultado de multiplicar la resolución de bits por 6. Una grabación a 8 bits posee una relación S/N
de 54dB, una de 16 bits 96dB y 144dB a 24 bits. Tengamos en cuenta que estos dB son valores teóricos y que en la
práctica bajan sustancialmente debido a los componentes analógicos de los grabadores tarjetas de sondo, etc...
Lo normal es que un grabador a 16 bits alcance los 90-92dB y lo extraordinario es que efectivamente nos
entregue una S/N de 96dB. Para nosotros, los humanos, un rango dinámico de entre 90 y 100dB es suficiente.
Estas cifras salen del propio rango dinámico humano, la diferencia entre el umbral de dolor y el umbral de
audición...

Existe una relación matemática entre los bits y la relación señal-ruido o rango dinámico: S/N = 6x
(resolución de bits)

Luis Torres • ltorresmancilla@gmail.com • Conservatorio Superior de Música de Málaga 29


Grabación y Edición Sonora - Luis Alfonso Torres Mancilla

! Rango dinámico/Relación señal-ruido

! La relación señal ruido (S/N) es la diferencia entre el nivel de señal útil (música, sonido, etc...) y el
nivel de ruido (ruido provocado por señales eléctricas en el interior de un equipo electrónico). El ruido se mide
sin ninguna señal a la entrada del equipo. Para calcular este valor se toman mediciones del nivel de señal cuando
se captura o se reproduce audio y se restan de las mediciones al mismo nivel sin señal alguna en las que puede
apreciarse el ruido inherente del propio aparato. Dicho de otra forma, es la diferencia entre el nivel de la señal
nominal y el nivel de la señal residual, al mismo nivel de trabajo. Una prueba muy sencilla, al escuchar música en
tu mini-cadena hi-fi, sube el volumen al máximo (en modo stop) y comprobarás como el ruido residual aumenta
¿te gusta?. Si con el volumen máximo pulsases el "play", el audio se reproduciría a su máximo volumen, la
diferencia de volumen entre ese audio "a tope" y ese ruido residual es la S/N. Cuanto mayor sea la diferencia de
volumen entre la señal útil y el ruido, mayor calidad tendrá el mismo. Técnicamente la señal se mide en voltios y
para pasar a dB se calcula el 20∙log(S/N) donde S es el valor de la "Señal" y N el valor del "Ruido" o "Noise",
en inglés. Cuanto mayor sea el valor de S/N mayor calidad tendrá el audio.
! Ahora planteémonos un problema muy interesante. El hombre, como especie animal, tiene una
limitación en su oído; no podemos oír toda la gran gama de frecuencias generadas en la naturaleza (o por medios
artificiales, como esos antiguos mandos a distancia por ultra-sonidos). A partir de las frecuencias cercanas a los
20.000Hz, el silencio penetra en nuestro oídos. ¿Qué puede ocurrir si registro una señal de audio con un
sonido que va más allá del umbral humano?
! Imaginemos que estamos grabando audio con una frecuencia de muestreo de 44.1kHz y en ese audio se
reproducen frecuencias cercanas a los 29.000Hz (que naturalmente no podemos oír). Nuestra grabación
registrará todas las frecuencias hasta los 22.050Hz pero aparecerá un ruido de 15.1Hz (44.1kHz-29kHz), algo
totalmente audible que en el original no existía. Estas frecuencias fantasma se llaman "alias", dando nombre a
una distorsión conocida como "aliasing". Para prevenir esto, tanto los sistemas de grabación de audio como las
tarjetas de sido incluyen un filtro "anti-alisasing" que no permite la entrada de frecuencias superiores a la mitad
de la frecuencia de muestro; estamos hablando otra vez de Nyquist.

Editor de audio digital (Editor Wave)

! En este grupo englobaremos todas las aplicaciones que permiten grabar, importar / exportar y
manipular audio digital de forma muy extensa sin incluir funciones de mezcla y producción musical. Esto
significa que el programa no posee la capacidad de reproducción de múltiples pistas de forma simultánea con un
mezclador asociado en el que poder realizar la mezcla y ecualización de dichas pistas.

Luis Torres • ltorresmancilla@gmail.com • Conservatorio Superior de Música de Málaga 30


Grabación y Edición Sonora - Luis Alfonso Torres Mancilla

! Un buen editor de audio debe poder abrir muchos formatos de archivo. Aunque en el mundo del PC se
utilizan, básicamente, los formatos "wav" y "AIFF" y en Mac "snd II" y también "AIFF", existen muchos otros
formatos dedicados a la multimedia en general (audio para Internet, juegos, codificación, compresión, etc..) y
sobretodo formatos de audio de hardware externo al ordenador como grabadores de audio digital autónomos o
samplers (sintetizadores que utilizan muestras de audio digital como ondas para sus osciladores). Los samplers
suelen incluir una unidad de discos, conector SCSI e incluso unidades ZIP. Las muestras utilizadas por éstos
pueden ser cargadas y abiertas por un editor de audio que posea la habilidad de leer esos datos. Esto amplia
enormemente las posibilidades del sampler ya que podemos suplir las carencias de éste (por ejemplo, si nuestro
sampler es barato y posee una pobre edición de audio) con la ayuda de un editor de audio. El sampler es un
instrumento electrónico ampliamente utilizado, el porcentaje de usuarios de un editor de audio que poseen un
sampler es muy elevado. Es normal que los editores de audio tengan en cuenta este dato. Existen muchos
samplers que no poseen unidad de discos y para éstos se ofrecen opciones de importación de archivos mediante
volcados MIDI (una técnica extremadamente lenta) o transferencias vía SCSI.

! En cuando a la edición del audio, la gran mayoría de las funciones son destructivas, es decir alteran los
datos originalmente grabados, eso sí, ofrecen historial de procesos "Undo" (Deshacer) con lo que recuperar las
distintas versiones del audio. Gran parte de la edición de los editores de audio se basa en procesos utilizados en
el proceso de masterización, es decir la creación del archivo master final. Estas herramientas son procesos de
ecualización, dinámica y dithering mayoritariamente. El dither es un sistema de reducción del ruido y distorsión
producido por el truncamiento de bits (al pasar de 24 a 16 bits) o incluso en pasajes de música en que se utilizan
menos bits para representar la señal (música clásica con baja dinámica por ejemplo). El dither añade un tipo de
ruido que elimina el ruido "aliasing" automáticamente. Se incluyen, naturalmente, otros procesos no tan
comunes en la masterización, como pueden ser: efectos de amplitud, timbre, tiempo-tono, delay y reducción de
la calidad (distorsión y reducción de bits). Cabe destacar que los algoritmos de los procesos destructivos (no a
tiempo real) deben tener más calidad que los procesos a tiempo real ya que no existe una exigencia de rapidez de
proceso pues el resultado no debe entregarse a tiempo real. Por otro lado, al ser procesos destructivos, los
editores de audio suelen incluir utilidades de proceso y conversión por lotes, es decir, poder listar "x" archivos
de audio, seleccionar los procesos a aplicar y que el programa se encargue del resto mientras nos vamos a
cenar...Otro aspecto importante son las funciones de medición, análisis y estadísticas del audio. A parte de
mostrar espectrogramas del audio (representaciones del audio dependiendo de la amplitud y frecuencias).

Horizontal Vertical Color


W a v e f o r m Tiempo Intensidad -
Display
S p e c t r a l Tiempo Frecuencia Intensidad (de
Frecuency colores fríos a
calientes)
Spectral Pan Tiempo Posición en % del Colores claros-
Pan más intensidad
Spectral Phase Tiempo La fase en grados
F r e c u e n c y Frecuencia Intensidad Hasta 4
Analysis instantaneas
Phase Analysis Canales estéreo -Mitad superior -Bola roja-fuera
-Izq-positivo en fase de fase
-Derec-negativo -Mitad inferior -Bola amarilla-en
defasado el límite
-Bola verde-en
fase
-Blanco-ancho de
la imagen estereo
-Azul-más dentro
de la fase
-rojo-más fuera
de la fase

Luis Torres • ltorresmancilla@gmail.com • Conservatorio Superior de Música de Málaga 31


Grabación y Edición Sonora - Luis Alfonso Torres Mancilla
A m p l i t u d e Amplitud en dB P r e v a l e n c i a Azul-Izquierda /
Statistics usando Fórmula Rojo-Derecha
RMS

! Las estadísticas de audio nos indican el volumen máximo y mínimo del audio, volumen medio,
duración, picos máximos, desviaciones del eje 0 (DC-Offset), etc.
! Existen funcionalidades extra que pueden ayudar en el mundo del video. Por ejemplo, extraer el audio
de una película digital, procesarlo (o sustituirlo) y volver a montar la película final. Otra funcionalidad extra
(aunque anteriormente muy utilizada, antes de la aparición de los secuenciadores MIDI / audio) son las listas de
reproducción. Creando regiones (marcando fragmentos del audio y dándoles un nombre) para posteriormente
situar su orden de reproducción en una lista virtual. Esta función se combina con la capacidad del programa para
sincronizarse a código de tiempo SMPTE, lo cual es imprescindible para sincronizar el audio a video externo.
! También resaltar las funciones de exportación del audio. El resultado obtenido con éstos es superior a
los codificadores mp3 shareware que se encuentran en Internet, como por ejemplo el popular algoritmo
Fraunhofer IIS.
! La última funcionalidad propia de estas aplicaciones es también el último proceso en el largo camino
de creación de un disco; la creación del CD. Aunque existen varias aplicaciones shareware que permiten crear un
CD de audio, los editores incluyen edición de las pistas del CD gráfica utilizando formas de onda en las que
podemos crear fundidos de volumen de entrada y salida entre otras avanzadas funciones.

Multipistas de audio digital

! Los multipistas de audio son aquellas aplicaciones que permiten grabar, manipular y mezclar audio
digital. Estos programas pueden reproducir varios archivos de audio de forma simultánea, es decir, al mismo
tiempo en forma de pistas. Por esta razón, los archivos de audio de la obra deben poseer el mismo formato
(mismos kHz y bits) aunque existe un grupo de programas muy selecto que realiza una conversión de archivo a
tiempo real en el caso de que los archivos posean un formato distinto.
! En las pistas el audio se dispone en forma de regiones o clips de audio, que son una representación
virtual de un fragmento del audio del disco duro. Es posible repetir de forma muy sencilla y rápida estos
fragmentos, aplicarles curvas de volumen y construir, en general, un nuevo "arreglo" de la obra mediante la
reestructuración de los fragmentos. Las pistas están asociadas a un mezclador que permite la producción de
audio y mezclas. Cada pista posee un canal en dicho mezclador en el que se puede ajustar el volumen, panorama,
ecualización, insertar efectos (plug-ins en distintos formatos) etc... La mezcla se realiza a tiempo real lo cual
supone que son aplicaciones muy exigentes con el ordenador, consumen muchos más recursos que un editor de
audio. Un multipistas de audio requiere una tarjeta de audio profesional que aparte de una buena calidad de
audio posea un chip DSP que acelere la gestión y trasmisión del audio liberando al ordenador de esta tarea. Estas
tarjetas suelen incluir un tipo de drivers (controladores por software del hardware) muy especial con tiempos de
latencia (tiempo de respuesta de las ordenes de audio) muy bajos. Existen drivers tipo ASIO (de Steinberg,
código abierto), EASI (de Emagic, muy similar a ASIO), DAE (de Digidesign, un "super-driver" que incluye
todo el manejo del motor DSP de Pro Tools) y E-WDM (de Ego-Sys, un formato que mejora el nuevo WDM o
Windows Model Driver de Microsoft. Este formato es muy nuevo y todavía no ha cuajado en la comunidad de
programadores). Estos drivers deben ser proporcionados por los fabricantes de las tarjetas de audio
profesionales, siendo el mas común, sin duda alguna y con diferencia el formato ASIO (ASIO 2.0 en la
actualidad). Los drivers multimedia normales (insuficientes en el mundo de los multipistas y secuenciadores
MIDI) son los llamados MME o Microsoft Multimedia Extensions y Direct X.
! Las funciones de procesado de volumen, dinámica y efectos se calculan de forma independiente por
cada pista aunque la mesa virtual suele incluir sub-buses, envíos y retornos de efectos tanto internos (por
software) como externos (utilizando las entradas y salidas de la tarjeta, para lo cual ésta debe poseer múltiples
entradas y salidas de audio). El proceso de los efectos puede ser de dos tipos (que pueden combinarse entre sí).
Proceso por DSP físico: Los efectos son procesados por chips DSP ubicados en tarjetas PCI especificas, el
ejemplo clásico es Pro Tools, un excelente software acompañado de una potente tarjeta con 6, 12 o 18 chips DSP
ampliable. En este caso el ordenador solamente gestiona los gráficos del programa y realiza un control
exhaustivo de todos los procesos, pero en ningún caso requiere una ingente cantidad de recursos (léase Mhz de
velocidad de proceso). Los efectos DSP existen porqué un mismo fabricante desarrolla el hardware (la tarjeta

Luis Torres • ltorresmancilla@gmail.com • Conservatorio Superior de Música de Málaga 32


Grabación y Edición Sonora - Luis Alfonso Torres Mancilla

DSP) y el software, lo cual supone una dependencia hacia ese fabricante. No obstante esta es la solución más
profesional, sin duda alguna.
Proceso nativo: Los efectos nativos son los más comunes y no requieren una tarjeta PCI con chips DSP
especifica. Utilizan la CPU del ordenador, para calcular los efectos a tiempo real. En este caso, el ordenador
debe realizar lo mismo que antes (gráficos y control de las funciones) y todos los cálculos del audio (mezcla,
efectos) lo cual requiere una gran cantidad de recursos, pero evita depender de un único fabricante. Existen
varios formatos de plug-ins nativos. El más utilizado es el VST.
! En la actualidad, las mesas virtuales de estos programas son tan sofisticadas y complejas que en muchos
casos requieren el uso de una superficie de control hardware par poder aprovechar todas sus ventajas (como la
automatización, la capacidad de grabar cada control manipulado en el tiempo para su posterior reproducción).
Para ello, están apareciendo una gran cantidad de mesas "de control" que no mezclan el audio, sino que
controlan la mezcla del programa.
! Un buen multipista de audio debería poseer capacidad de mezcla Surround (otra cosa es que pueda
codificar en Surround). La mezcla Surround incluye la posibilidad de manejar los envíos a efectos Surround (o
efectos por software con varias entradas y salidas de audio). Para la simulación del Surround los programas
utilizan las múltiples salidas de audio de la tarjeta si ésta no posee varias salidas no podrás conectar más de 2
altavoces.

Secuenciador MIDI/Audio Digital

! Si un software multipistas de audio es una aplicación exigente con la potencia del ordenador, el
secuenciador es un devorador de recursos todavía más implacable. Esto es en parte porque un secuenciador
MIDI / audio debe poseer la funcionalidad de un multipistas de audio más la funcionalidad de todo un
secuenciador MIDI, que no es poco. Los datos MIDI son mucho más pequeños que los datos de audio, es decir,
es mucho más exigente el cálculo de una reverberación a tiempo real que no una cuantización o transposición
MIDI a tiempo real por ejemplo. El problema real es la estabilidad de la sincronización entre el audio digital y el
MIDI, dos mundos muy distintos. Baste con decir que un segundo de audio se divide en 44.100 "casillas"
mientras que la resolución de un secuenciador es mucho menor. Un secuenciador requiere una buena tarjeta de
audio, al igual que el multipista de audio digital, pero además requiere un buen interface MIDI que ayude al
ordenador en la gestión y transmisión de datos MIDI. Se utilizan los mismos tipos de drivers que en los
multipistas de audio ya que la exigencia de rendimiento es la misma o superior.
! Los secuenciadores incluyen una sencilla edición de audio, es decir que también participan de la
funcionalidad de un editor de audio aunque sin ofrecer ese grado de profundidad. Como siempre, la edición de
estos editores es destructiva. Las pistas de audio están asociadas a un mezclador virtual DSP del mismo modo
que en los multipistas de audio y toda la mezcla se realiza a tiempo real.

Luis Torres • ltorresmancilla@gmail.com • Conservatorio Superior de Música de Málaga 33


Grabación y Edición Sonora - Luis Alfonso Torres Mancilla

La Cadena de Audio V
Edición Sonora

INTRODUCCIÓN

Sin duda alguna, la mayor influencia en los estilos grabados ha sido la introducción de las unidades de
efectos digitales. Cuando comencé, sólo habían disponibles cuatro efectos: el "tape delay" (retardo por cinta), la
sala de reverberación, reverberación por placas y reverberación por muelles.
Puedo recordar perfectamente cuando la pista Itchycoo Park de The Small Faces (¡creo!) vio la luz con
su phaser de cinta. Recuerdo intentar desesperadamente imaginar cómo lo lograron. No fue hasta que me uní a
los Estudios Armstrong en Melbourne con Roger Savage que supe cómo lograrlo y lo usé en la clásica pista
australiana "The Real Thing" de Russell Morris. Ahora puedes marcarlo como una opción en casi cualquier
unidad de efecto y hasta encontrarlo en un pedal tipo "Somp"... aunque no es lo mismo.
! El efecto "Tape delay" (retardo mediante cinta) estaba limitado a cuanto rápido podía correr la
máquina de la cinta, por lo que habitualmente estaba limitado a retardos basándose en negras o corcheas con dos
velocidades de 7-1/2 (que generaba retardos a semi-corcheas alrededor de los 120bpm) y velocidades de 3-3/4
(que conseguían retardos de corcheas). Estas eran las velocidades estándar en las máquinas basadas en cinta. No
fue hasta la introducción del retardo digital, cuando apareció toda una gama entera de efectos que trabajaban en
milisegundos y nos trajo efectos como el flanger y el chorus.
Luego vinieron las reverberaciones digitales y se abrió un nuevo mundo. De repente, era posible
cambiar el campo reverberante alrededor del instrumento de forma fácil y rápida. Para explicar cómo funcionan
los efectos y cómo debes usarlos lo expondremos desde la perspectiva de cómo estos efectos fueron
desarrollados, porque muchos términos nacen en aquellos días. Por ejemplo el término "flanging" viene de la
técnica que permitía reducir la velocidad de una cinta analógica para crear efectos de "phasing" en fases
sosteniendo el reborde de la bobina.

REVERBERACIÓN

Imagina alguien cantando en una sala grande con suelo, paredes y techo de hormigón pintado. ¿Dónde va el
sonido y qué oye el micrófono?

Luis Torres • ltorresmancilla@gmail.com • Conservatorio Superior de Música de Málaga 34


Grabación y Edición Sonora - Luis Alfonso Torres Mancilla

! Cada sonido que emite el cantante se refleja en las paredes, suelo y techo. Inicialmente, el sonido del
cantante alcanzará primero el micrófono, seguido de las primeras reflexiones. En este caso, la primera reflexión
provendría del suelo, seguida de la del techo ya que éstas superficies son las más cercanas, y seguidamente por
las reflexiones de las paredes de ambos lados y, finalmente seguidas de las reflexiones de las paredes situadas en
frente y detrás del cantante. Estas reflexiones no se detendrían en este punto, seguirían sin cesar. Entonces
vendrían las reflexiones más largas, en las que el sonido se ha mezclado con el del techo, ha golpeado una pared y
luego el suelo, y ha regresado al micrófono. El tiempo que tardan las primeras reflexiones a retornar al micrófono
es proporcional al tamaño de la sala. El sonido viaja a 30cm por milisegundo (1 pie), por lo que si el cantante fue
equidistante desde las paredes laterales y éstas estaban separadas por uno 20 pies, la primera reflexión de estas
paredes se retardará unos 20ms (milisegundos). Si el cantante se situó 20 pies desde la pared final, esas
reflexiones llegarán al micrófono 40ms más tarde. Luego, las últimas reflexiones comenzarán a llegar, pero
gracias a ellas mismas, seguirán generando reflexiones hasta establecer un campo reverberante en la que ninguna
de estas reflexiones será distinguible y ocurrirá la verdadera reverberación.
Como esta sala es de cemento pintado, existirá una buena reverberación de unos 2.21 segundos (según
la calculadora de reverberación). Si las paredes de esta sala son planas y reflexivas y no hay nada en su superficie
(o en el techo o suelo) se dispersaría el sonido por el igual que las piedras al arrojarlas a un río. Estas reflexiones
en la propia reverberación se irían mezclado y decayendo lentamente. Si las paredes fueran de rocas, las
reflexiones irían por todas partes y habría una masa de reflexiones distintas. Las reflexiones serían más densas o
difusas y diríamos que existe "más difusión".

a) ¿qué es lo que escucha el micrófono?

Un cantante seguido por la reverberación creada en la sala de cierto tamaño (no un hall) y creada por las
primeras reflexiones seguidas por las reflexiones tempranas y posteriores y finalmente el campo reverberante
que llegaría después del pre-retardo y que poseería una baja difusión pero crearía un tiempo de reverberación de
2.21 segundos.

! Pero todavía hay más. Con la calculadora de reverberaciones puedes calcular el tiempo de
reverberación para distintas frecuencias. La sala anteriormente citada sería como esta:

Luis Torres • ltorresmancilla@gmail.com • Conservatorio Superior de Música de Málaga 35


Grabación y Edición Sonora - Luis Alfonso Torres Mancilla

! El tiempo de reverberación de 2.21 segundos citado anteriormente, se producía con frecuencias de


1000Hz mientras que con frecuencias de 250Hz sería de 3.09 segundos. En otras palabras el decaimiento en los
250Hz es más largo que el decaimiento en los 1000Hz. Algunas unidades de reverberación y programas ofrecen
cierto control individual del tiempo reverberación para las frecuencias agudas y las graves. Otras reverberaciones
permite aplicar una EQ para incrementar / reducir las frecuencias agudas o graves.
! Para concluir, un comentario más... y estarás listo para estar en manos de los programadores que crean
reverberaciones, salas, salas de baño o...
A 120 bmp, un compás dura 2 segundos, las semi-corcheas duran 125ms, las corcheas 250ms y las
negras duran 500ms. Para mí, estos números suenan a buenos tiempos de pre-retardo y tiempos de reflexiones
tempranas. Ajusta la reverberación al tiempo de 1 segundo y obtendrás medio compás de reverberación.
Finalmente, podrás obtener una reverberación a tiempo (como término rítmico).
Antes de que existieran términos como halls, rooms, etc, existían las salas de reverberación. Se trataba
de salas especialmente construidas para la reverberación. Se construían debajo de estudios como Abbey Road,
en Londres y Capitol Studios en los LA. Eran salas de grandes dimensiones diseñadas para crear un campo
reverberante uniforme. En las mismas, se ubicaba un altavoz (o dos) junto con un micrófono (o dos) y se ajustaba
todo para "recoger" el sonido. Se usaban de forma parecida al modo de uso de una unidad de reverberación
moderna. Se alimentaba el altavoz y se mezclaba el retorno con la pista. Pero cualquier zona puede actuar como
sala de reverberación, un hueco de una escalera, un garaje, un hall, un tanque de agua, por ejemplo, puede dar
una bonita reverberación, una tubería con un altavoz en un extremo y un micrófono en otro, etc. Si quieres
experimentar, hay muchos modos de crear reverberación, y actualmente, hay muchos equipos de grabación
portátiles.

GRABANDO CON RETARDO

Tape Delay

El primer retardo fue creado usando un grabador de cinta. Esto que sigue es el diagrama a de la ruta de
la cinta en una grabadora típica.

! Primero, la cinta pasa por el cabezal borrador. Luego pasa por el cabezal de grabación en la que la señal
se registra en la cinta. Finalmente, pasa por el cabezal de reproducción en la que se reproduce la misma. El
tiempo que tarda la cinta en pasar desde el cabezal de grabación al cabezal de reproducción determina el retardo.
Si la grabadora va rápida, el tiempo de retardo será corto y si va lenta, el tiempo de retardo será largo. La
velocidad de la cinta se determina por el propio motor de arrastre que gira. A principios de los años setenta, los
fabricantes de grabadores de cinta añadieron velocidades variables a sus motores con un control llamado
"Varispeed". Usando esto, podías ajusta el retardo, mediante el oído, a la velocidad apropiada. Si tomabas la
salida del cabezal de reproducción y la volvías a pasar por la entrada de la grabadora obtenías las repeticiones
cíclicas. Como tan sólo se enviaba una pequeña cantidad de la señal del primer retardo, las repeticiones cíclicas
iban cayendo en volumen, creando el clásico efecto de retardo. Este control se llamaba
"Feebback" (realimentación).

Luis Torres • ltorresmancilla@gmail.com • Conservatorio Superior de Música de Málaga 36


Grabación y Edición Sonora - Luis Alfonso Torres Mancilla

Si estás usando un magnetófono estéreo, podrías obtener en retardo estéreo. Si usabas una señal
monofónica, obtenías un retardo monofónica ya que cada canal del retardo era el mismo. De este modo:

¡Sonaba tal y como estás viendo!

! Como los dos canales tienen la mismas señal, el retardo sonará en mono en el centro. Introducción de
la unidad de retardo digital.

Retardo digital

El retardo digital lo ha cambiado todo. Puedes introducir el tiempo de retardo deseado, pero lo más
importante es que puedes variar el retardo de los canales izquierdo y derecho de forma independiente. Por lo
tanto, si introduces una señal mono y ajustas el canal izquierdo a 500ms y el derecho a 250ms, y aplicas algo de
feedback (re-alimentación), obtendrás un retardo en el que el canal izquierdo será distinto del derecho: un
verdadero retardo estéreo.

Luis Torres • ltorresmancilla@gmail.com • Conservatorio Superior de Música de Málaga 37


Grabación y Edición Sonora - Luis Alfonso Torres Mancilla

! Espero que me hayas seguido hasta aquí, lo que estoy tratando es que te hagas tu propia imagen mental
de los retardos que se oirán. En la parte izquierda, tenemos un retardo de 500ms mientras que en la derecha uno
de 250ms, Cada 500ms, los retardos izquierdo y derecho serán iguales, el mismo y el sonido vendrá del centro.
Lo que crees que es estéreo, realmente no lo es, lo que estás buscando es algo como esto:

O esto:

O ¡esto!:

Luis Torres • ltorresmancilla@gmail.com • Conservatorio Superior de Música de Málaga 38


Grabación y Edición Sonora - Luis Alfonso Torres Mancilla

Este aquí donde la comprensión de lo que provoca el estéreo y lo que es monofónico es


extremadamente importante. Lo que hace que un sonido venga de la izquierda puede ser que simplemente sea
una señal monofónica que viene de la izquierda. Puede ser una señal estéreo, en la que el canal izquierdo es
diferente del derecho. Si ajustásemos el retardo para que el retardo izquierdo fuera de 510ms y el derecho de
490ms, los retardos estarían 2ms aparte, ¿me sigues?
Si dos sonidos están separados por 20ms o más, sonarán como dos señales distintas, izquierda y
derecha, por lo que si los dos retardos están 20ms aparte, sonarán como si vinieran desde la izquierda y la
derecha. Así que:

El retardo izquierdo será 20ms posterior a cada retardo, pero en 4 retardos esto sólo da 80ms de 510ms
y recuerda que en relación al primer tiempo, el retardo comienza 10ms más allá mientras que el otro está 20ms
por detrás. Pruébalo en una pista y comprenderás lo que quiero decir.
Otro modo de lograr canales distintos es cambiar el tono de un canal o de los dos. He creado el ejemplo
3 con esta técnica, he cambiado el tono de un de los canales y aunque están a tiempo, parecen estéreo ya que son
distintos.
He creado este sonido de retardo usando un retardo Multi-Tap. En vez de usar el feedback para crear
repeticiones como en la cinta analógica o el retardo estrictamente digital, en un retardo Multi-Tap, puedes
controlar cada retardo. Si imaginas que cada retardo es un "tap", puedes ajustar qué retardo será cada "tap" e
incluso aplicar panorama. Esto ofrece un control mucho más extenso de los retardos, comparado con un retardo
con feedback en el que cada retardo es una repetición de si mismo.
Puedes ver como he usado esta visualización auditiva y esto es lo que hacen estos tipos que logran estos
programas de retardo increíbles todos los días. La próxima vez uses un retardo, prueba a visualizar el imagen de
lo que ocurre en vez de simplemente escuchar. El sonido tiene profundidad, altura, y anchura

Ajustando el tiempo de retardo

El ajuste del tiempo de retardo depende del tempo de la pista que estás grabando. Si el tempo es de 120
pulsos por minuto, habrán 120 pulsos en cada 60 segundos o 120 pulsos por 60.000 milisegundos lo cual da un
pulso cada 500 milisegundos. Por lo que en un compás de 4 pulsos (tiempos), los tiempos son cada 500ms,
corcheas cada 250ms y semi-corcheas cada 125ms, etc. ¿Cómo podemos saber los retardos si conocemos el
tiempo? Hay algunos programas como Beat Calc que los calculará automáticamente para ti. Algunas de las
nuevas unidades de retardo y programas poseen la función "tap" que te permite pulsar o introducir el tempo en
el dispositivo, pudiendo conseguir tablas con la información impresa. Dichas tablas no sólo te indicarán los
pulsos de 1/2, 1/4, y 1/8 de compás, etc. Sino que también permiten usar notas con puntillo o retardos basados
en tresillos.

Cálculo rápido del retardo

Existe un modo rápido para calcular los retardos de una pista usando un cronómetro que pueda leer
centésimas de un segundo.

Luis Torres • ltorresmancilla@gmail.com • Conservatorio Superior de Música de Málaga 39


Grabación y Edición Sonora - Luis Alfonso Torres Mancilla

Reproduce la pista y comienza a contar los tiempos. Luego inicia el cronómetro a tiempo y cuente 10
tiempos y páralo en el tiempo 11. Conseguirás una lectura como:

Así, un tiempo de negra serán 460ms, una corchea serán 230ms y una semi-corchea serán 115ms, etc.
Esta es una técnica práctica ideal si eres un técnica de directo y deseas procesar las voces con un retardo y
necesitas moverte rápido mientras la banda está tocando.

Introducción a los moduladores

Phaser/Flanger

Cuando un avión a reacción vuela, puedes oír su llegada, y su sonido va subiendo de tono y luego, al
alejarse, su tono vuelve a caer. Este efecto se conoce como Efecto Doppler. Imagina que tienes un retardo muy
"estrecho" de 10ms, pero que puede ser variado usando un modulador desde 0ms a 10ms y de nuevo a 0ms, etc,
barriendo adelante y hacia atrás respecto a la señal original. Cuando el retardo se incrementa, el desplazamiento
de fase se incrementa y el efecto doppler provocará que el sonido suene con un tono más bajo, de forma parecida
a un avión a reacción volando alejándose de ti, y cuando la modulación decrezca con tiempos de retardo más
cortos, el desplazamiento de fase provocará que el tono suba, de forma parecida al mismo avión volviendo hacia ti
Este es el clásico sonido de phaser. El efecto fue originalmente creado con ondas cortas de radios,
donde un receptor recogía una señal que venia de otro lugar y otra señal cuyo recorrido era más largo, y cuando
las dos se sumaban de forma conjunta en el receptor, se sumaban y se sustraían mutuamente causando un
desplazamiento de fase o el efecto conocido como los "Comb Filter", que crea un efecto de barrido de tono que
ahora asociamos al phaser, y por esta razón así se llama este efecto. Los phasers cambian las relaciones de fase en
el sonido, usando circuitos de desplazamiento de fase. Los flangers son la misma clase de efectos, salvo que los
flangers usan circuitos de desplazamiento de tiempo para obtener el efecto. Los moduladores tienen estos
controles:

Delay: Que ajusta el retardo que deseas.


Depth: Que ajusta la cantidad de control del modulador sobre el retardo.
Rate: Que ajusta la velocidad de oscilación del modulador.
Feedback: Que es muy parecido al control "feedback" de los retardos de cinta, enviando la señal de nuevo al
proceso.
Shape: Que ajusta la onda aplicada por el modulador, por ejemplo, sinusoidal, triangular, etc.

Las unidades de chorus

Si incrementas los retardos de la zona de 0 a 10ms hasta los 60-80ms y sigues modulando los retardos,
obtendrás el efecto de chorus.
La guitarra de esta pista tiene el sonido clásica de guitarra con chorus y fue creada usando el clásico
Roland Dimension D; en verdad, usamos dos unidades. Las frecuencias de modulación son usualmente más
rápidas que el phaser, pero la profundidad es mucho menor así sólo hay un sutil cambio que continúa. Si hechas
un vistazo a los controles de una unidad de chorus verás los mismos controles que el efecto de phaser: Delay -
Depth - Rate - Feedback - Shape. El retardo de un chorus puede ajustarse en el tiempo de la pisa, por lo que si el
tempo es de 120bpm, las semi-corcheas se encuentran a 125ms, y puedes probar subdivisiones de 62.5ms y
31.25ms. Realmente marcan la diferencia.

ECUALIZACIÓN

Mientras que la compresión afecta al rango dinámico, la ecualización (EQ) controla el rango de
frecuencias. El rango de frecuencias de un sonido se muestra en la tabla inferior y se divide en cuatro bandas.

Luis Torres • ltorresmancilla@gmail.com • Conservatorio Superior de Música de Málaga 40


Grabación y Edición Sonora - Luis Alfonso Torres Mancilla

! La escala inferior de la tabla muestras las frecuencias desde los 16Hz a los 16kHz (16.000Hz). Cuando
los ingenieros hablan de los medios-altos, se refieren al rango de frecuencias de 1kHz a 8Khz, aproximadamente.
El siguiente dibujo muestra la típica curva de picos de la EQ, alrededor de una frecuencia central.

! La frecuencia central está alrededor de los 750Hz y el aumento de ganancia o "Gain Boost" (aumento
o corte) está alrededor 18db. El "factor Q" es el ancho de las frecuencias afectadas por el aumento y se mide en
octavas. Una "Q" alta es ofrece una curva estrecha y una "Q" baja una curva amplia.
El siguiente dibujo representa una curva de ecualización tipo "Shelf" en la que las frecuencias
superiores o inferiores a la frecuencia central son aumentadas o cortadas.

Hay dos clases de ecualizadores: Paramétricos y Gráficos y cada uno puede controlar varias bandas.

a)! El ecualizador gráfico

Luis Torres • ltorresmancilla@gmail.com • Conservatorio Superior de Música de Málaga 41


Grabación y Edición Sonora - Luis Alfonso Torres Mancilla

Este es un dibujo de un ecualizador de 10 bandas típico.

Observa que hay tantos deslizadores como bandas de frecuencias y que están dispuestos encima de una
escala que muestra las frecuencias. La escala superior indica los dB de ganancia o corte aplicados (puede ser
positivo o negativo, es decir, aumento o reducción). Un ecualizador gráfico típico no tiene ningún control del
"factor Q", normalmente está predeterminado.

b)! El ecualizador paramétrico

Para que un ecualizador pueda ser llamado ecualizador paramétrico, debe tener un factor "Q" variable
y también el centro de frecuencias variable. Debajo tienes un ejemplo de un ecualizador paramétrico:

! El gráfico de la izquierda representa el


ecualizador analógico de una consola de mezclas de alto
rendimiento y el gráfico de la derecha muestra el
ecualizador digital típico. El de la izquierda, en las
frecuencias agudas (High), hay un control conmutable
que permite seleccionar el tipo de ecualizador
"peak" / "shelf high". También hay dos bandas
medias con "Q" variable y una banda grave que puede
conmutarse a modos "peak" / "shelf low". La versión
informática de la derecha posee 4 bandas, cada una con
su propio centro de frecuencias, factor "Q" y ganancia.
La curva resultante final se visualiza para una operación
más cómoda. Las bandas medias de la versión analógica
se dividen, usualmente, en dos bandas, una que cubre
desde los 100Hz a los 4Khz y otra desde los 600Hz a
15Khz (típicamente, pero varia dependiendo de la
consola de mezclas). Date cuenta que en la versión
digital, todas las bandas permite seleccionar rangos de
frecuencias de 20Hz a 20KHz

COMPRESORES/EXPANDERS, LIMITADORES y PUERTAS

a)! El rango dinámico

Antes de operar con compresores y limitadores debemos comprender qué significa el término rango
dinámico. El rango dinámico de un sonido es el rango entre su sección más silenciosa y su sección con más
volumen. En el caso de una grabadora, se trata del rango entre su ruido residual y el nivel cercano a la distorsión.
Ya sabes que una orquestra sinfónica puede interpretar de forma muy suave o de forma muy enérgica... una
orquesta tiene un rango dinámico muy ancho (amplio).

Luis Torres • ltorresmancilla@gmail.com • Conservatorio Superior de Música de Málaga 42


Grabación y Edición Sonora - Luis Alfonso Torres Mancilla
Los medidores superiores muestran un rango dinámico de
72dB. En una grabadora casera de cassette, la sección
silenciosa estaría por debajo del ruido de la grabadora de
cinta, y todo lo que oirías en este pasaje tranquilo sería el
"hiss" de la grabadora de cinta. La distancia entre la sección
más fuerte al punto de distorsión se llama
"headroom" ("espacio libre"). Si la distorsión alcanza los
+6dB, tendremos actualmente un headroom de 4dB. Para
reducir el rango dinámico podríamos controlar toda la pista
con un fader y subirlo cuando el volumen fuera demasiado
bajo y bajarlo cuando fuera demasiado alto o... ¡usar un
compresor!

b)! Compresores

Un Compresor puede cambiar la señal de entrada a la proporción (ratio) de la señal de salida.

! En este diagrama, la "Unity gain"


indica el nivel que estás introduciendo y el
nivel que está saliendo. Con un ratio o
proporción de 2:1, cuando la señal está por
encima del umbral, la señal saliente se
reducirá con esta proporción: 2dB en de
entrada que san 1dB de salida, por lo que te
has ahorrado 1dB en la parte superior del
rango dinámico y ya puedes subir un 1dB el
volumen sin afectar el headroom actual. En
casos más severos como 20:1, lo cual se
conoce como limitación, para cada 20dB de
ganancia sólo sale 1dB de señal. El compresor
y limitador pueden usarse conjuntamente en
una sola unidad, en la que el compresor
trabaja con un rango de 2 - 20: 1 mientras que el limitador detiene los picos de transientes extremos en la señal,
con ratios de 15 - 20:1 lo cual se conoce como Peak Limiter (limitador de picos).

Luis Torres • ltorresmancilla@gmail.com • Conservatorio Superior de Música de Málaga 43


Grabación y Edición Sonora - Luis Alfonso Torres Mancilla

! En este gráfico, el umbral del


limitador ha sido elevado para que el
material de audio será comprimido por
encima del umbral de compresión con un
ratio de 2:1 y por encima del umbral de
limitación con un ratio de 20:1. Un
compresor es un dispositivo de reducción
de ganancia, por lo tanto todos los
compresores tienen un control de ajuste de
ganancia de modo que si estableces una
reducción de la ganancia de 3db, podrás
ajustar la salida en la misma cantidad y
retener, todavía, el mismo headroom.

! En este diagrama, la transición de la


ganancia de unidad ("Unity gain") a la compresión en el
umbral de compresión/limitación es gradual, en vez de
una línea recta. Esto se llama "Soft Knee", y da una
compresión más suave.
El medidor de un compresor puede, normalmente,
conmutarse para mostrar el nivel entrante, el nivel
saliente y la cantidad de reducción de ganancia. Es
aconsejable comprobar que el nivel de entrada es
correcto, antes de comenzar a ajustar el umbral y
establecer la relación de compresión, etc.
El tiempo de ataque determina la velocidad o rapidez
con la que el compresor reacciona a señales superiores
al umbral. Las señales tienen picos agudos cortos llamados transientes que pueden provocar fácilmente que el
compresor actúe. El tiempo de ataque determina qué ancho deberían tener estos picos para que estuvieran por
encima del umbral, antes de que la compresión tenga lugar. Estos transientes cortos son importantes en la
claridad de un sonido, pero afectan a la fuerza del sonido. El objetivo de compresión es hacer que el instrumento
parezca más fuerte, estrechar el rango dinámico, por lo tanto puedes desear alargar el tiempo de ataque y dejar
pasar a los transientes (para ser tratados por un limitador si es necesario) y el compresor trabajará entonces en
niveles sostenidos por encima del umbral.
El tiempo de liberación determina la velocidad o rapidez con la que el compresor deja de actuar,
restaurando la ganancia original. Si la liberación es demasiado rápida para la cantidad de la reducción de
ganancia aplicada, la "vuelta" a la ganancia normal se va produciendo repetidas veces, ya que la señal se mueve
por encima y debajo del umbral. Esto puede causar algo conocido como "pumping", provocado por la
estructura de ganancia que cambia rápidamente. Es aconsejable pedir al interprete tocar notas sostenidas y
ajustar la liberación para que el cambio de ganancia sea suave. Los instrumentos que tienen notas largas
sostenidas como los bajos, deberían usar unos tiempos de liberación más lentos que los instrumentos percusivos
como la percusión. La mayor parte de los compresores de nueva generación, tienen un botón "Automático" que
permite que el compresor trabaje sólo, y realmente lo hacen bien.

Veamos los controles de un típico compresor:

Luis Torres • ltorresmancilla@gmail.com • Conservatorio Superior de Música de Málaga 44


Grabación y Edición Sonora - Luis Alfonso Torres Mancilla

! La sección izquierda es la sección de Puerta de ruido ("Noise Gate"). Posee controles para el umbral
en el cual la puerta se abre, el tiempo de liberación variable y un control que conmuta el ataque a rápido / lento.
La sección central es la sección de compresión con los controles estándar de umbral, ratio (proporción), ataque y
liberación. El interruptor "Peak/RMS" determina como el compresor rastreará la señal es decir mediante su
contenido de picos o contenido RMS. El botón "Auto" es, a menudo, una opción con la que el compresor
calcula los tiempos de liberación y ataque, analizando el material de audio. El conmutador "hard/soft"
determina el ajuste del codo de compresión ("Knee"). El medidor puede mostrar la lectura de la entrada o salida
y además la cantidad de reducción de ganancia. Finalmente hay control de ganancia (llamado habitualmente
"Output Level"). El botón "Link" existe en el caso de que hayan dos compresores en la misma unidad. Las
compresores estéreo tiene la funcionalidad "Link" (enlazar) que provoca que uno de los dos compresores sea el
master, habitualmente el compresor izquierdo. Todos los controles efectuados en el compresor master afectan
también al compresor esclavo, por lo que operan de forma conjunta. Si los compresores no estuvieran enlazados,
cualquier señal súbita en el compresor derecho provocaría una reducción de ganancia y la imagen estéreo se
movería ya que los instrumentos situados en el centro del campo panorámico variarían su balance izquierda /
derecha, por lo que al comprimir una señal estéreo, asegúrate que los compresores estén enlazados.
De forma similar, observa esta imagen de un plug-in de compresión de Waves. Los controles están ahí.

! Las opciones "Electro" y "Warm" son añadidos que no existen en las versiones analógicas. Como
puedes ver, el umbral está por debajo de la señal de picos, por lo que la reducción está actuando tal y como indica
el medidor de atenuación. El ratio está ajustado a 2.90:1 y no se ha aplicado corrección de ganancia.
El tiempo de ataque está ajustado a 3.66ms y la liberación a 214ms y el control está en manual (no automático).

c)! Expanders

El expander es un compresor al revés. Hay dos tipos de expanders. En uno, las señales por encima del
umbral permanecen en la ganancia de unidad, mientras que las señales por debajo del umbral son reducidas en
cuanto a ganancia. En el otro tipo, la señal por encima del umbral también hace aumentar la ganancia. Por lo
tanto, puedes usar un expander como una unidad de reducción del ruido. Ajusta el umbral para estar por debajo
del nivel del interprete cuando esté tocando. Cuando el interprete se detiene, la señal caerá debajo de este
umbral y se reducirá la ganancia de la señal y por lo tanto, el ruido.

Luis Torres • ltorresmancilla@gmail.com • Conservatorio Superior de Música de Málaga 45


Grabación y Edición Sonora - Luis Alfonso Torres Mancilla

El dibujo inferir muestra la distinta acción de un compresor y un expander. El expander en el dibujo


está incrementando la ganancia por encima del umbral y reduciendo la ganancia por debajo del umbral.
La mayor parte de las grabaciones de la música de hoy en día ha sufrido una buena compresión. ¡La
grabación suena fuerte y además suena en tu cara!. Así como la mayor parte de los componentes de las pistas se
han comprimido individualmente, la mezcla entera general ha sido comprimida y limitadas antes de pasarla al
CD. No creo que esto sea malo...

d)! Limitadores

Un limitador es, simplemente, un compresor severo en el que las relaciones de compresión son
elevadas. En algunas unidades como DBX 160 y los compresores de Alesis, se proporciona un control de
limitación de picos adicional con un indicador LED que parpadea, pero en unidades como Aphex Dominator,
son puros limitadores y son extremadamente sofisticados en cuanto a cómo atacan y controlan los picos y puedes
lograr mezclas tipo "brick wall" usándolos.

e)! De-Esser

El De-esser es compresor/limitador selectivo que comprime sólo en una frecuencia predeterminada.


Si se ajusta a las frecuencias alrededor del área sibilancias de una voz (4kHz - 8Khz, aunque varía de hombres a
mujeres,) las voces serán comprimidas sólo en aquellas frecuencias en las que se reducirán las sibilancias. Las
sibilancias son los picos de altas frecuencias creadas por las letras S, T, C, etc.

f)! La nueva generación

La nueva generación de compresores, puertas, expandir, etc. en forma de programas de ordenador


merecen una mención. Estos compresores tienen una ventaja excepcional respecto al compresor independiente.

Luis Torres • ltorresmancilla@gmail.com • Conservatorio Superior de Música de Málaga 46


Grabación y Edición Sonora - Luis Alfonso Torres Mancilla

Pueden leer la señal con adelanto, extrayendo la señal del disco duro de forma adelantada en el tiempo,
analizándolo y luego procesándolo a tiempo real (técnica "lookahead"). "Saben" lo que va a pasar después de la
reproducción actual y esto representa una gran ventaja en el mantenimiento de un control suave de la señal.

g)! Puertas de ruido

Las puertas de ruido son unidades que permiten pasar si está por encima de cierto nivel de volumen o
cortarlo si está por debajo de ese umbral.

El diagrama superior muestra como trabaja una puerta. Cuando la señal cae debajo del umbral, la
puerta reduce el nivel, al nivel de reducción especificado. El tiempo de ataque determina como rápidamente se
abrirá la puerta, y el tiempo de liberación determina a qué velocidad se cerrará. Algunas puertas tienen una
función llamada "Hold" que te permite indicar a la puerta que se mantenga abierta durante un tiempo específico
y el tiempo de liberación tendrá lugar y cerrará la puerta. Esta facilidad puede ayudar a detener la apertura y
cierre de la puerta de forma rápida debido a los picos de señal. También puede ser usada como un efecto, sobre
todo si es situada en el retorno de una unidad de reverberación. Si tienes alguna reverberación en, por ejemplo,
una caja y sitúas la puerta en el retorno de la señal de la reverberación, puedes usar la función "Hold" para
mantener la reverberación abierta durante un periodo de tiempo establecido por la función "Hold" y luego
cerrar rápidamente la puerta usando una rápida liberación. Este efecto se conoce como "Gated Reverb" y ahora
es un programa estándar en la mayoría de unidades de reverberación.
Una puerta también puede ser ajustada para que la dispare cualquier otro audio vía un "sidechain". Por
ejemplo, si sitúas una puerta en la señal de un micrófono de ambiente de sala, puedes usar este micrófono para
disparar y abrir cuando la caja de la batería es golpeada y cerrar cuando la caja detiene su vibración. Esto se llama
"Gated Ambience". Otro efecto es situar los platos hihat en la "sidechain" y modular la puerta para abrirse y
cerrase con el sonido de un sintetizador. El efecto es un sintetizador que modula la puerta con su ataque y
liberación.
Las puertas pueden también enlazadas de modo que una controle la otra y cuando una abre la otra
también (como el compresor). Esto se usa en situaciones con puertas estero, por ejemplo al grabar en estéreo los
toms.

Luis Torres • ltorresmancilla@gmail.com • Conservatorio Superior de Música de Málaga 47