You are on page 1of 5

El audio analógico se almacena, como es de esperar, en soportes analógicos.

La cinta, por ejemplo, convierte las variaciones eléctricas de la señal de audio en variaciones
magnéticas que orientan las partículas ferromagnéticas en la cinta durante la grabación.

Durante la reproducción el proceso es inverso, las partículas ferromagnéticas en la cinta


provocan variaciones magnéticas que son traducidas por el cabezal de reproducción en
variaciones eléctricas.

Observe, por ejemplo, en esta máquina de cintas Ampex al descubierto, la innumerable


cantidad de elementos mecánicos y los tres cabezales de grabación, reproducción y borrado.

El sistema más simple de audio analógico está compuesto por un micrófono, un dispositivo de
grabación y un monitor o altavoz para reproducirlo.

Este es el diagrama de un estudio de audio analógico típico.

Observe que, en la grabación de música, a menudo es necesario mezclar y procesar el audio de


varios instrumentos simultáneamente.

Si conectamos un osciloscopio en cualquier punto de los circuitos de estos dispositivos


podríamos ver y monitorizar la señal de audio en ese punto.

Los estudios analógicos tienen la peculiaridad que son más vulnerables al ruido.

El ruido es amplificado por todas las etapas.

La cinta también introduce un tipo de ruido particular llamado hiss.

Este es el diagrama de un estudio de audio digital típico.

El audio digital se obtiene a partir del audio analógico.

El audio digital es el resultado de convertir el audio analógico, continuo, en audio discreto,


discontinuo.

Dicho de otra manera, el audio digital es una representación, en números, del audio analógico.

Se denomina digital porque estos números son producidos, almacenados, transmitidos,


procesados, etc., en formato binario.

En este sistema es necesario un Conversor Analógico Digital que convierte la señal eléctrica de
audio en una ristra de números y un Conversor Digital Analógico que realiza el proceso inverso;
es decir, convierte la ristra de números en una señal eléctrica continua en el tiempo.
La magia de “lo digital” consiste en que podemos convertir el sonido en una secuencia de
números almacenables, copiables, transformables, transmisibles, etc. y devolver estos
números a sonido sin pérdida de información.

Dicho de otra manera, la transcodificación analógica-digital, digital-analógica es


“transparente”.

Eso significa que la distorsión que introduce el proceso completo es absolutamente


despreciable para el sistema perceptual auditivo pero tiene una gran ventaja y es la economía
y la precisión del nuevo medio.

Todos los procesos y transformaciones aplicados al audio son mucho más económicos en el
dominio discreto y son, además, equivalentes a sus homólogos en el dominio analógico.

La digitalización se basa en dos procesos de discretización: muestreo y cuantificación.

El primero está relacionado con la asignación de muestras por unidad de tiempo, es decir: con
la discretización temporal, y el segundo con la asignación de un número determinado de bits a
cada muestra, es decir, con la discretización de la amplitud.

Una muestra es simplemente un “fotograma” del audio en un instante determinado de


tiempo; lo que equivale a un valor de amplitud.

El muestreo o discretización temporal es análogo a la toma de escenas en el cine.

El cine está formado por una serie de fotografías expuestas secuencialemente y lo que
percibimos como movimiento es, en realidad, una ilusión.

Por debajo de 24 cuadros o fotogramas por segundo la percepción del movimiento no es


continua.

El cine exige un muestreo mayor o igual que 24 fotogramas por segundo.

Observe que el muestreo corresponde a un valor de frecuencia: cuadros por segundo.

En el audio pasa lo mismo.

El problema es determinar cuántos fotogramas de amplitud son necesarios para que el cambio
de la señal se perciba continuo y no a saltos.
El intervalo de muestreo Ts es el tiempo entre dos muestras sucesivas.

En el audio digital no existe ninguna muestra intermedia; sólo valores de amplitud tomados en
los instantes de muestreo; es decir cada Ts segundos.

Al igual que como se definió con el período de un sonido, al período de muestreo le


corresponde una frecuencia de muestreo.

La frecuencia de muestreo es el inverso del período de muestreo y se define como el número


de muestras en un intervalo de un segundo.

La frecuencia, como el cine, debe ser lo suficientemente alta para que la señal obtenida sea lo
más parecida a la señal original.

¿Cuál es este límite?

Claude Shannon definió que, para poder tener una imagen fiel de la señal, es necesario que la
frecuencia de muestreo sea de al menos el doble del valor de la máxima frecuencia que
compone la señal.

Esta sentencia se conoce como teorema de Nyquist, teorema de muestreo o teorema de


Shannon-Nyquist.

Por ejemplo, si la frecuencia máxima que contiene la señal son 100 Hz, la frecuencia de
muestreo tiene que ser mayor o igual que 200 Hz.

¿Qué ocurre si no?

El fenómeno que ocurre se denomina aliasing.

El aliasing es una distorsión que produce un señal de más baja frecuencia (en líneas
discontinuas) que en realidad no existe sino que es producto de un muestreo incorrecto.

Este fenómeno es el mismo que vemos cuando rota el aspa de un ventilador o el tapacubos de
una rueda.

Si la velocidad de rotación hace que el aspa (o tapacubos de la rueda) coincida en la misma


posición en las sucesivas imágenes fijas, dará la sensación de que no se mueve.

Pero si el intervalo entre la llegada de las aspas no coincide con el intervalo de la cámara —o
con un múltiplo de él— dará la impresión de giro hacia adelante o hacia atrás.

La ilusión de movimiento hacia atrás se produce cuando la velocidad de rotación es tal que,
entre el intervalo que media entre cada toma, cada aspa se mueve hasta casi la misma
posición que ocupó en la toma anterior.
De manera tal que, en cada imagen fija, muestra una posición más retrasada que en la
anterior, dando la sensación de que la rotación se produce en sentido inverso.

Lo que vemos en este vídeo es el efecto del aliasing

En audio se suelen emplear diferentes frecuencias de muestreo en dependencia de la calidad


que se quiera obtener.

En un CD la frecuencia de muestreo es de 44100 Hz.

Recordando que el rango audible del sistema perceptual auditivo humano alcanza los 20 kHz,
la frecuencia del CD cumple con el teorema de muestreo porque es mayor que la máxima
frecuencia que se quiere capturar.

El DAT utiliza 48 kHz.

La cuantificación es el proceso mediante el cual se decide qué valor debe tomar cada muestra
de amplitud y este depende del número de bits por muestra.

En este ejemplo sólo se utilizan 3 bits por muestra lo que da un conjunto de 8 posibles valores.

El número de bits determina la resolución mientras que la distancia mínima entre estos niveles
de cuantificación se denomina intervalo de cuantificación.

Observe que cuanto mayor sea la resolución menor será el intervalo de cuantificación y mayor
la fidelidad de la señal obtenida o, lo que es lo mismo, el error de cuantificación será menor.

Veamos el efecto de cuantificación con una imagen.

Suponga que se quiere cuantificar una imagen que varía suavemente del negro al blanco con 2
bits.

En este caso sólo es posible dos niveles de cuantificación: o negro o blanco.

Todo lo que esté por debajo de la mitad de amplitud será negro y todo lo que esté por encima
blanco.

Ahora suponga que tenemos 4 bits.

Con 4 bits de resolución es posible tener 16 estados posibles o niveles de cuantificación.


Sigue siendo insuficiente pero ahora la imagen se parece más a la original.

Por último suponga que tenemos 16 bits.

Esto supone 65536 niveles de cuantificación posibles; es decir 2 elevado a 16.

Con esta resolución el error de cuantificación es tan bajo que da la ilusión que la imagen
cuantificada es igual a la imagen origen.

En un CD la resolución es de 16 bits lo que supone un rango dinámico de 96 dB FS (cada bit


aporta 6 dBs aproximadamente); un valor muy por encima de los 60 dB de una grabación de
casete y de los 65 dB de un vinilo pero inferior al rango dinámico de actuación en directo de
una orquesta sinfónica en torno a 120 dBs (la diferencia entre un pianísimo y un fortísimo).

La grabación/reproducción de una obra orquestal con un rango dinámico mayor de 96 dB


supone un proceso de compresión del rango dinámico para evitar la saturación del medio.

Súper Audio CD utiliza 24 bits, lo que supone 144 dB FS, un valor incluso superior al umbral del
dolor de 140 dB.

Esto permite grabar con un margen amplio para que no se produzca distorsión por saturación.

You might also like