You are on page 1of 37

Cursillo de Introduccin a la Informtica Musical

Parte 2: Audio Digital Comentarios: Hisham Mansour / Vokimon Crear nuevos sonidos a partir de sonidos. Este doctorial recoge informacin de como obtener, tratar y almacenar muestras digitales de sonido con el objetivo de construir con ellas composiciones musicales. Otros Doctoriales / MoDDeR's / Can Vokimon ndice

0. Como esta organizado el manual 1. Audio Digital


o o o o o o o

Analgico vs. Digital Introduccin al audio digital Frecuencia de muestreo Bits de profundidad Pasos de cuantificacin no lineales Codificacin diferencial Canales: Monotona, Estereofona y Quadrofonia

2. Enemigos del audio digital


o o o o o o o

Aliasing Infrasampleado Saturacion o Clipping Error de cuantificacion Interferencias Paquetizacion Entornos multitarea y sistemas orientados a interrupciones

3. Sampling, obtencion de muestras

o o o o o o o o o

Concepto e historia Fuentes de los sonidos Aspectos legales Soportes digitales Formatos de archivos con sonido digital Cableado y conectores Actualizado 15-May-1999 Microfonia y toma al aire Extraccion de audio digital de CD's Volcado a HD En preparacion

4. Edicion basica Nuevo 15-May-1999 5. Efectos y mejora de calidad


o

Efectos basados en retardo


Eco Reverberacion Flanging y Phasing Chorus

Procesado de dominio dinamico


Distorsion Compresion y Limitadores Expansion y noise gating

Filtrado frecuencial En preparacion

Preparacion
o

Reduccion del espacio


Recorte y eliminacion de silencios Resampleado Compresion espacial

o o

Afinacion (Tuning) Nuevo 15-May-1999 Bucles (Loops) En preparacion Ver en Trackers Doc

6.3.1. Concepto Nuevo 22-Mar-2000 6.3.2. Ajuste del bucle Nuevo 22-Mar-2000 6.3.3. Direccion En preparacion 6.3.4. Pulsacion y postpulsacion En preparacion 6.3.5. Otras consideraciones En preparacion

o o

Envolventes y ADSR En preparacion Ver en Trackers Doc Multisamples.


Introduccion Actualizado 15-May-1999 Regiones Distribucion en capas (Layering) Conmutado por velocidad Fundidos progresivos Consejos para instrumentos multisample Nou 15-May-1999

Trucos y consejos Apendice A: Conceptos basicos


o o o

Forma de onda Espectro frecuencial y respuesta en frecuencia Codificacin binaria

Bibliografa, Links y Referencias Agradecimientos

0. Como esta organizado el manual Como la mayora de los doctoriales de los MoDDeRs este manual esta hecho de tal forma que el lector pueda ir directamente a los captulos que le sean tiles obviando el resto. Algunos conceptos muy bsicos se dan por sabidos en el resto del manual: Formas de onda, componentes en frecuencia de un sonido, respuesta en frecuencia, transformada de Fourier, diagrama de Bode y codificacin binaria y

hexadecimal. Son conceptos que supongo que la mayora tendrn por la mano, pero, si no es as, puedes visitar el Apndice A 1. Audio Digital 1.1. Analgico vs. Digital Si a alguien que preguntase la pendiente de nuestra calle le respondiramos inclinando el brazo, le estamos dando informacin analgica, pero si le decimos que mas o menos 15 grados le estamos dando informacin digital. Es decir, en el primer caso damos una analoga con la realidad y en el segundo hacemos una abstraccin numrica. Electrnicamente hablando, una seal analgica es aquella que vara su nivel segn aquello que quiere representar. Una seal digital es aquella que lo codifica numricamente. Se utiliza para ello un formato binario, por lo general. Al asignar un valor (cuantificar) estamos discretizando el conjunto de valores pero hacemos mas fcil su procesado. Es decir, con la inclinacin del brazo, quizs puedas indicar precisamente una inclinacin del 15.123423424....% y nuestro amigo lo entender pero le ser muy difcil operar con ello si antes no lo cuantifica. 1.2. Introduccin al sonido digital La seal de audio que obtiene un micrfono es analgica. El proceso para digitalizar la onda analgica es tomar muestras peridicas de la misma. A estas muestras se le asignan valores numricos que son convertidos al formato binario. Los unos y ceros son fcilmente almacenables segn la presencia o la ausencia de algo: Carga elctrica (memorias RAM), magnetismo (discos duros) o agujeros (CD). 1.3. Frecuencia de muestreo La frecuencia de muestreo o sampling rate son las muestras que se recogen cada segundo en Hertzios. Si cogemos muestras mas a menudo, la calidad del sonido ser mayor, pero, tambin aumenta el espacio que ocupa la toma en bits. Esta frecuencia de muestreo limita la frecuencia mxima que podremos recoger de la seal. La frecuencia de muestreo debe ser algo mas del doble de la frecuencia mxima que queremos registrar. Asi, si el oido humano, genericamente, puede escuchar sonidos de hasta 20 KHz, la frecuencia de muestreo que se puso a los CD-audio es de 44'1 KHz, algo mas del doble que son 40KHz.

NOTA: El oido humano tambien tiene un umbral inferior de frecuencia. La gama de sonidos audibles va de los 20Hz a los 20KHz. Aqui teneis algunas de las frecuencias de grabacion mas tipicas. DAT CD-audio Telefonia 1.4. Bits de profundidad Los bits de profundidad son el numero de bits con los que se codifica una muestra. Dado que la electronica digital esta desarrollada para grupos de bits potencias de dos, las profundidades mas extendidas son 8 bits y 16 bits. Una profundidad de 8 bits da 28=256 niveles de amplitud y 16 bits dan 216=65536 nuveles. La profundidad de 16 bits se ha popularizado en las targetas de sonido y en los samplers actuales debido a que es la utilizada en los CD-audio, y ofrece una calidad muy buena. Pero es obvio que una muestra grabada a 16 bits ocupara el doble de una muestra a 8 bits. El error de cuantificacion es el que se produce al redondear a un valor continuo un valor discreto. Si la senyan analogica tiene un valor que esta entre el 4 y el 5 tenemos que elegir cual de los dos es el mas cercano. El espacio que hay entre dos cuantificaciones contiguas se llama paso de cuantificacion. El maximo error de cuantificacion posible es la mitad de dicho paso.. 1.5. Pasos de cuantificacion no liniales A pesar de que podemos calcular el error de cuantificacion, lo que es perceptible al oido es la proporcion de error respecto al nivel de la seal: Es mas perceptible el error de quantificacion cuando la senyal tiene un nivel bajo. El mismo error, cuando la senyal tenga un nivel alto, puede ser imperceptible. Por ello es util una codificacion no linial, es decir, en vez de utilizar un paso fijo, en los valores mas pequeos se utilizan pasos mas pequeos para reducir el error y en los valores mas altos da lo mismo si utilizamos una quantificacion mas relajada pues el error no es tan perceptible. Exiten las leyes de cuantificacion -law y a-law que definen dos formas distintas de cuantificar la seal de una forma no linial. 48.000 Hz 44.100 Hz 8.000 Hz

Trackers Tradicionales 8.363 Hz

Con la cuantificacion no linial es posible obtener la misma calidad de sonido con menos bits de profundidad. 1.6. Codificacion diferencial La codificacion diferencial es otra forma de reducir los bits de profundidad. Se trata de codificar la diferencia entre dos muestras en vez de el valor de las mismas. Por ejemplo, si codificamos el nivel con 8 bits (valores de 0 a 255), podriamos suponer que la diferencia maxima entre dos samples contiguos es de 64-1 pasos de cuantificacion y codificarlos con solo 6 bits. Esta claro que esta codificacion no se puede adaptar con suficiente rapidez a los cambios bruscos de la seal y filtra las altas frecuencias. Pero, si no se busca calidad o si la seal lo permite, tambien es una alternativa valida. 1.7. Canales: Monofonia, stereofonia y cuadrofonia Segun el numero de canales una senyal puede ser monofonica, stereofonica o incluso cuadrofonica. Usar mas de un canal da profundidad al sonido y permite dar la sensacion de que procede de un sitio o otro. En este sentido hay tecnicas como el Dobly-Surround o de sonido 3D que permiten mas control sobre esta localizacion del sonido sin incrementar el numero de canales. A pesar de que la estereofonia y la cuadrofonia son muy deseables de cara al resultado final de nuestro trabajo, no lo es en los productos intermedios, como, por ejemplo, los samples, pues a parte de que cada canal replica el tamao, complica mucho el procesado por eso se tiende a hacer la separacion en canales en las ultimas fases del proceso creativo. 2. Enemigos del audio digital 2.1. Aliasing El aliasing se produce cuando la frecuencia de muestreo no es suficientemente alta para reproducir con fidelidad todos los aspectos de la forma de onda, es decir, las variaciones de alta frecuencia no quedan registradas pero si que afectan al valor muestreado introduciendo en la seal frecuencias fantasma que no existian en la seal original. Tambien se produce cuando, por razones de espacio, decidimos resamplear una muestra, ya digitalizada, a una frecuencia inferior. Solucion: Aplicar un filtro anti-aliasing antes de muestrear. La mision de un filtro anti-aliasing es la de filtrar las frecuencias de la seal que despues no podran ser registradas a la frecuencia de muestreo deseada.

Por ejemplo: Con una frecuencia de muestreo de 22,1KHz, solo quedan registradas las frecuencias menores 11'05KHz (la mitad). Para que no aparezca aliasing al muestrear habra que filtrar primero aquellas frecuencias mayores que 11'05KHz. 2.2. Infrasampleado El infrasampleado se produce cuando la frecuencia de reproduccion no es suficientemente alta para reproducir la onda sin que el oido note los escalones de la digitalizacion. Este problema se da muy a menudo cuando los samples se bajan de frecuencia de reproduccion para generar las notas mas graves. Solucion: Utilizar, al reproducir, interpolacion. La interpolacion sirve para obtener mas puntos entre sample y sample suponiendo que siguen una funcion matematica. La funcion mas simple es la de una linia que une los dos puntos pero suelen dar mejores resultados aunque son mas costosas de calcular las curbas (cuadraticas, cubicas, splines...) 2.3. Saturacion o clipping Este otro efecto no deseado se produce cuando el nivel del sonido se va mas alla del limite de cuantificacion. Es decir, si tenemos 8 bits para codificar, si una onda pasa del nivel assingado a 255 que valor le ponemos? Generalmente se le da ese valor maximo, lo que da a la forma de la onda un aspecto recortado y auditivamente, produce un molesto click. Para gravaciones en las que no hay grandes variaciones de sonido la solucion perfecta es la amplificacion adaptativa o compresion . La hacen servir la mayoria de equipos (menos la SoundBlaster) y consiste en amplificar mas o menos segun el nivel de volumen que previamente haya llegado, para conseguir un nivel de seal casi constante. Estos compresores, el que mas o el que menos, deja que el operador ajuste unos ciertos controles que determinan la forma en la que se producira la adaptacion. A falta de compresion, se puede controlar el clipping controlando el volumen de grabacion, pero, en tiempo real es muy dificil de hacer para el operador. A falta de practica, lo mejor es grabar muestra en un soporte analogico de calidad y digitalizar controlando el volumen tal ke se maximize el nivel de la seal sin producir clipping. Para controlar cuando se produce el clipping algunos samplers tienen un detector de pico que indica cuando la entrada sobrepasa el valor maximo. 2.4. Error de cuantizacion

El error de cuantizacion se produce al discretizar los niveles a los que se puede associar una muestra. Se evita augmentando la profundidad en bits del sonido y utilizando pasos de cuantificacion mas detallados para los valores de menos intensidad y mas amplios en valores de gran amplitud. Todo ello fue explicaco mas detalladamente en las secciones ??? y ??? 2.5. Interferencias Las interferencias es un fenomeno que se debe principalmente al hecho de que dos seales electricas proximas tienden a hacer los mismos cambios. Aunque tratando con informacion digital las interferencias no son mucho problema, si que afectan a la seal analogica que entra o sale de nuestro sistema digital. Incluso, a veces, tambien afectan a la seal que aun no ha salido de la tarjeta de sonido los otros componentes dentro del PC. Para evitar interferencias lo mejor es alejar cables, tarjetas y equipos de las posibles fuentes de interferencias y apantallarlos , esto es rodearlos con una cubierta metalica que se lleva las interferencias He aqui una pequea guia:

Alejar la targeta de sonido de los componentes del PC que veas que provocan ruido al grabar o reproducir, (Discos duros, Modems, CPU...) Si no se pueden evitar, colocar una tarjeta pantalla entre la tarjeta de sonido y la que produce interferencias. Si no tienes una tarjeta pantalla (Todo el cobre conectado a masa) a veces sirve una menos ruidosa. Evitar que los cables de audio analogicos pasen cerca de monitores, televisores y similares. No enchufar ni desenchufar aparatos ni abrir ni cerrar luces mientras se graba. No utilizar cerca taladros, ventiladores, motosierras ;-) o otra cosa que pueda tener motores o bobinas Utilizar cables lo mas cortos posibles (Ojo! No sirve enrollar el cable, hasta es peor!) Utilizar cables de audio apantallados, si te lo puedes costear o sino pasarlos por dentro de un tubo metalico.

2.6. Paquetizacion Por naturaleza la informacion en el ordenador esta dispuesta de forma discontinua. En el disco duro esta dividida en bloques (habeis usado el Defrag?), la memoria la divide en paginas, la tranferencia entre el ordenador y los perifericos, como la targeta de sonido, se realiza en paquetes (Bloques DMA)...

En ordenadores no muy rapidos, cuando hay un cambio de un bloque de disco a otro o de pagina de memoria a otra... son momentos criticos para la grabacion, si el cambio no se produce con la suficiente rapidez, el sample puede quedar afectado. El tipo de paquetizacion que afecta mas, debido a su lentitud, es la del disco duro, por lo que es aconsejable utilizar memoria si es posible, al menos como soporte intermedio. 2.7. Entornos multitarea y sistemas orientados a interrupciones Dentro del mismo PC, existe otro problema es un entorno basado en interrupciones y, ademas, con Windows o similares, es multitarea. Los entornos basados en interrupciones (que son la mayoria de sobremesa) son aquellos en los que la accion de un periferico (teclado, raton, disquetera...) hace que la CPU deje momentaneamente de hacer lo que estaba haciendo para atender al periferico. Si hay demasiados perifericos (la tarjeta de sonido es uno) compitiendo por la atencion de la CPU, a veces la CPU no siempre llega a tiempo de digitalizar y se pierden samples. El resultado de esta perdida de samples, suele ser un pequeo salto con su correspondiente clic. Lo mismo pasara en un entorno multitarea en que los propios programas tambien compiten por la CPU. Puede haber samples que no sean atendidos por el digitalizador. Ambos problemas se solucionan eliminando competidores al programa de digitalizacion, y trabajando en memoria (fisica no virtual), cuando ello sea posible, para hacer mas agil el almacenamiento. Otra solucion es el uso de buffers. Un buffer es una cola en memoria donde se van almacenando los datos enviados por el periferico sin que este tenga que esperar al procesador. Tambien existen buffers de salida para reproduccion. El buffer se llena antes de empezar a reproducir y sirve de reserva para cuando el procesador tiene que atender a otras tareas. Un buffer tendria que tener una capacidad igual o mayor al numero de bytes que se pierden de golpe. Para un sistema que da saltos grandes, el buffer tendria que ser tambien grande. Sin embargo conviene tener cuidado con hacer buffers demasiado grandes en sistemas que pretendan responder en tiempo real, pues el buffer provoca algo de retardo. 0

Precisamente, el problema de Windows en algunas aplicaciones de audio en tiempo real es que su sistema interno de audio y MIDI, utiliza buffers en todas partes, lo que hace necesario un ordenador muy potente para reducir la latencia. 3. Sampling, obtencion de muestras 3.1. Concepto e historia La tecnica del sampling consiste en obtener sonidos musicales a partir de copias digitales de un sonido original. Esa copia o sample se reproduce con mayor o menor rapidez para obtener toda la gama de notas. Esta forma de obtener las notas se llama desplazamiento de tono (en ingles, Pitch shifting). Classicamente, un sampler podia venir en dos apariencias: La caja (rack) o el teclado. La caja es un aparato con un complejo panel de control que permite seleccionar y editar las muestras que tiene en memoria. Un sampler en rack suele permitir ser controlado por un teclado MIDI aunque tambien hay quien lo usa directamente, pero no suele ser el caso de musicos sino de DJ que solo necesitan lanzar sonidos en un momento dado i no crear melodias. El sampler en teclado simplemente es la fusion de el rack con el teclado controlador. La nueva y revolucionaria apariencia que ha surgido en los ultimos tiempos es el ordenador. Ahora con poco mas que una simple Sound Blaster 16, los programas y un modesto PC se pueden obtener la mayoria de funcionalidades que antes solo estaban en carisimos equipos. El sampler surgio de la necesidad de obtener sonidos realistas que los sintetizadores clasicos no obtenian. La tecnica precursora de los samplers fue la sintesis digital basada en formas de onda que consistia en generar los sonidos, no a partir de ondas simples, como el resto de sintetizadores que hacen servir ondas cuadradas, triangulares o sinosoidales, sino que permitia construir el periodo base de la forma de onda de forma digital. Los sintetizadores de tabla de onda no se consideran propiamente samplers. El primer sampler promiamente dicho fue el Fairlight CMI (Computer Musical Instrument), a partir de ahi los samplers han ido evolucionando a lo largo de su corta historia aadiendo: Mas capacidad de almacenamiento Mas mecanismos para acercarse a los instrumentos reales Mas capacidad de edicion Interficie mas intuitiva

3.2. Fuentes de los sonidos. De donde obtenemos los sonidos?

Lo mas casero es obtener los samples con un microfono y grabar sonidos reales. Si tienes un buen interprete a mano no lo dejes escapar sin que te grabe un par de samples. La ciudad es a veces un hervidero de ruidos, algunos muy espectaculares. Pero a veces para obtener una buena calidad se necesitan buenos microfonos. Si no quieres meterte a caza sonidos tambien es facil digitalizar los sonidos directamente de una fuente electronica tal como una cadena de musica, la tele, un teclado o una guitarra electrica. Nada mas necesitas el cable adecuado y un poco de ojo con las impedancias. Por lo general una salida de un aparato que puedas escuchar con cascos la puedes conectar a la entrada de linia de la tarjeta de sonido sin problemas de quemar nada. Mejor quemar unos cascos cutres que una tarjeta de sonido cutre asi que prueba siempre primero con los cascos. Otra fuente de samples son los CD's de audio. Hay programas especiales para rippear CD's. Esto es, obtener la informacion digital que hay en el CD de audio tal cual, sin que la targeta de sonido tenga que volver a digitalizarla con la consiguiente perdida de calidad. Estos programas se comentan mas adelante. Tambien puedes crear tu los samples con programas de sintesis, o hacer un volcado MIDI de los samples de tu sintetizador . Tambien hay CD's muy majos con colecciones de samples ya hechos... 3.3. Aspectos legales Venga de donde venga el sonido (sonidos reales, fuente electronica, CD's de Audio, colecciones de samples...) seguro que te puedes encontrar trabas legales. Como premisa hay que tener en cuenta lo siguiente: No se puede VENDER algo con samples de otro sin pagar derechos de copyright. Esto no quiere decir que si lo distribuyes gratuitamente estes fuera de peligro pero como que no hay dinero de por medio tampoco iran a por ti. Eso si, una cosa es utilizar samples y otra plagiar. Ahora bien, el control samples minimalistas secuencia de notas y procesada y arreglada descarado. es muy dificil y siempre es posible usar simplemente o disfrazarlos un poco . Es del todo iluso samplear una pretender que cuele pero una nota de un instrumento para montar una melodia diferente pues ya es menos

Ten cuidado si has firmado con una compaia pues normalmente hay una clausula que dice que no se hacen responsables de aquellos samples que no les comuniques. Si ellos los quieren colar, pues adelante, pero como demuestras tu que le has comunicado el uso de dichos samples? En todo caso siempre es

mejor un trato amistoso con la otra parte, que un costoso juicio o tener que retirar tu disco del mercado. Ademas, siempre hay gente dispuesta a ceder derechos si no son muy peseteros lo que haces les gusta. Y si no hay trato, seguro que encuentras otro sample que te valga. Todo antes de un caro y costoso proceso de limpieza (sample clearing). Existen organismos como la MCPS (Mechanical Copyrigth Protection Society) que, entre otras cosas, se encargan de facilitar el contacto entre sampleadores y sampleados. Mantienen una lista de autores a los cuales no les importa que les sampleen sin pagar nada. En Espaa un organismo equivalente es la SGAE. En cada pais, hay un plazo legal a partir de la muerte del autor a partir del cual su obra pasa a ser de dominio publico: 50 en Inglaterra, 76 en USAlandia, entre 70 y 80 en Espaa... Asi que si quieres samplear a la Juanita Reina pues de aqui a un par de aos, ya se podra. Con los CD's de samples no te fies mucho de la etiqueta y mira el Legal Disclaimer. A veces aunque sean Copyright Free, no incluye el uso comercial. Un mito muy falso es que se puede samplear de la television lo que sea. Nada mas lejos de la realidad: Tendras ke pagar al lokutor, al propietario del producto y a la kadena que lo distribuye. Y si se trata de una pelcula, te puedes encontrar hasta 5 o 6 copyrigth que satisfacer. Mas informacion en el manual LegalDOC. 3.4. Soportes digitales. Si estamos trabajando con un ordenador el soporte de trabajo esta claro que sera un disco duro pues podemos editar facilmente los samples sobre el. Pero si vamos a grabar fuera del estudio, no nos podemos llevar el ordenador con nosotros y necesitamos un soporte intermedio para transportar los samples. Este soporte puede ser analogico (una cinta) que, segun la calidad, puede introducir ruido adicional, y que ademas despues hay que hacer una conversion a digital para traspasarlo a disco duro. A menudo se prefiere registrar directamente en un soporte digital. De esta forma, se muestrea directamente la senyal grabada sin ningun otro soporte intermedio y no es necesario digitalizarla posteriormente. Tambien esta el problema de almacenar los samples en un soporte duradero que no pierda calidad con el tiempo. En el disco duro tendremos los samples con los que trabajamos pero, el resto, como ocupan mucho, mejor tenerlos en un soporte extraible a parte. Lo mismo para los masters finales.

Los soportes digitales mas comunes son los siguientes: A) A-DAT El A-DAT es un sistema ideado por Alexis que se empezo a usar en 1981. Permite grabar 8 pistas de audio digital sobre una misma cinta magnetica. El soporte es, normalmente, una cinta de video VHS que se encuentran a precio de consumo. Permite grabar 8 pistas a 24 bits y frecuencias de muestreo de 32 KHz, 44'1 KHz y 48KHz. Se usa mucho en estudios profesionales y algunos estudios caseros pues el coste es relativamente bajo. Es un sistema bastante escalable, pues, se diseo de forma modular y permite agrupar y sincronizar varias unidades, lo que multiplicar el numero de canales. Al ser la reproduccion y grabacion mediante el contacto de una cabeza magnetica con la cinta, se produce desgaste de la cinta como en las platinas analogicas de los Music Cassettes. La diferencia es que al estar grabado digitalmente, el desgaste no tiene el mismo efecto en la calidad que en los MusicCassettes aunque si en la vida de la cinta. El acceso es sequencial y por lo tanto, lento y aparatoso, pues tenemos que rebobinar la cinta para encontrar un punto en concreto. Por suerte, se nos permite situar puntos de referencia o 'cues' que permite al aparato localizar el punto de forma automatizada (aunque igual de lenta). En un principio, las unidades A-DAT se controlaban sincronamente con un modulo de llamado BRC que implementaba funcionalidades de transporte: Play, Pause, Stop, Rewind, Fordward, Marcar un punto de referencia, Posicionarse en un punto de referencia... Tambien tiene la pega de que las cintas de video son muy voluminosas . Cuando utilizamos varias unidades para incrementar el numero de canales, necesitamos una cinta por cada 8 canales. Si ademas conservas cada toma y el master final, como hacen la mayoria de estudios, al final acabas teniendo una pared inmensa dedicada a almacenar cintas de A-DAT. La herencia mas valiosa de este formato es el protocolo que utilizaban estas unidades para enviar audio digital del que se habla en el apartado de Conectores digitales. B) Compact Disc El CD es un sistema digital de almacenamiento que utiliza lectura optica desarrollado por Philips y Sony, principalmente. La lectura optica significa que se realiza mediante la reflexion de un laser en el soporte y por lo tanto no hay contacto con ningun cabezal ni desgaste. Permite almacenar aproximadamente 75 minutos de audio digital a 16 bits stereo muestreado a 44'1 KHz. Ademas de las letras y los creditos en canales auxiliares (Caracteristica, esta, no muy utilizada, cabe destacar). Se divide en pistas (canciones) que pueden llegar a ser hasta 99.

Tiene un codigo de proteccion y correccion de errores que lo hace tolerante a ralladas, sobretodo las que van en sentido radial. Las rayadas transversales son mas dainas por lo que se recomienda limpiarlos siempre radialmente. En el mismo soporte pueden convivir Audio y datos de ordenador. El formato de los datos de ordenador es comun a varias plataformas (PC, Amiga, Mac...) lo que le convierte en un medio ideal de traspasar informacion entre sistemas diferentes. Los CD generalmente se fabrican por estampado y son medios de solo lectura pero se pueden grabar con unas unidades grabadores especiales. Aun asi, la poca flexibilidad del proceso de grabacion, asi como la imposibilidad de modificar lo ya grabado, los hacen utiles solo para hacer copias de seguridad (de samples y de masters realizados), y para distribuir maquetas. El futuro del CD esta en el DVD, un soporte pensado para video pero que, en audio supone tener en un solo soporte hasta 30 horas de musica. Una revolucion que provoca al mismo tiempo la reticencia de las discograficas a promocionarlo. C) Mini Disc El Mini Disc es un soporte desarrollado en 1992 por Philips y Sony y comercializado por Sony. Se desarrollo con la pretension de ocupar el espacio de las cintas de Music Cassette con un soporte digital. Por lo tanto es un soporte que no ofrece tanta calidad como el CD pero que, en cambio, permite grabacion. La tecnologia en la que se basa el MD es magneto-optica. Utiliza un material que solo genera magnetismo cuando le llega un haz de laser. La grabacion se realiza estableciendo un campo magnetico mientras se calienta con el laser una pequea zona que quedara magnetizada (tecnologia termo magneto optica). Utiliza la compresion ATRAC. Una compresion perceptual 5:1 basado en el analisis por enmascaramiento frecuencial (Ver Compresion Temporal) en tres bandas de frecuencia diferentes. Contiene un buffer de 12 segundos que permite a los circuitos estabilizarse en caso de golpe brusco sin que se corte la reproduccion o grabacion. Esto lo hace perfecto para obtener grabaciones en sitios comprometidos como un concierto o un arbol. D) Digital Compact Cassette Este soporte lo empezo a desarrollar Philips en solitario en 1993 cuando penso que para substituir al Music Cassette hacia falta un soporte que fuera compatible con el. Asi, si te comprabas un reproductor de DCC podias seguir usando tus cintas de siempre.

El DCC es un soporte con el mismo formato que una cinta normal pero que graba digitalmente. Los lectores de DCC pueden leer sin problemas una cinta analogica aunque una platina analogica no pueda reproducir un DCC. Permite grabar 8 pistas de audio simultaneas mas un canal auxiliar. La informacion que contiene la lee el reproductor a 786Kbits/s. Es poca la informacion para 8 canales pero es que utiliza una compresion mas sofisticada que el MD: la compresion PASC que se basa en un analisis por enmascaramiento frecuencial y temporal en 32 bandas frecuenciales. Ademas tambien elimina los sonidos por debajo de umbral de pression que nos son perceptibles. 3.5. Formatos de archivos de sonido. Existen infinidad de formatos de archivos de audio digital. Cabe destacar dos: el WAVE RIFF (extension .WAV) usado en Windows y el AIFF usado en Machintosh. En todo caso, entre los diversos formatos, la gran diferencia es la cabezera que identifica algunos datos utiles como la longitud, la frecuencia de muestreo, los puntos de referencia... y, sobretodo, la codificacion. Si, a un archivo, le quitamos la cabezera y los bytes auxiliares, nos queda una tira de bytes que representan la onda, lo que se le llama formato RAW, crudo o sin cabecera. Ahora bien, la manera en que la tira de bytes cruda representa la onda es la codificacion. La codificacion mas simple es la PCM, en la cual, cada sample se representa por un numero proporcional a la amplitud. A pesar de ser la mas simple y la mas estandard, tenemos varias formas posibles de leerla y almacenarla segun:

Bits de profundidad: Los bits que representan un solo sample. Orden de los bytes del sample: En sonidos con mas de 8 bits de profundidad (16,24,32...) un solo sample ocupa varios bytes, la codificacion determina qual de esos bytes se almacena primero: el de mas peso, el de menos... Intercalado de canales: En sonidos estereo (o con varios canales) hay que definir como se intercalan los bytes de los distintos canales: byte a byte, sample a sample (lo normal) o en tiras de samples. Signo de los valores: En cualquier tipo de muestra, hay que definir si los valores del sample tienen signo o no. En un sample con signo el 0 es el valor medio y los picos (VALORS_POSIBLES/2)-1 y (VALORS_POSIBLES/2). En un sample sin signo el valor medio es (VALORS_POSIBLES/2) y los picos son 0 y VALORS_POSIBLES-1.

En resumen, Formato: indica como se han de interpretar los bits de cabecera. Codificacion: indica como se interpreta la tira de bytes restante.

Como se determina el formato y la codificacion El formato viene indicado por la extension del archivo o por alguna marca o etiqueta interna en el contenido. La codificacion esta indicada explicitamente en la cabecera o es implicita al formato. Un fichero crudo no tiene cabecera para indicar la codificacion. Esta la ha de conocer el programa o el usuario. NOTA: A veces, forzando la lectura de un sample segun un tipo de codificacion que no le corresponde, se pueden obtener efectos de robotizacion y distorsiones muy estraas que le pueden ser utiles a un musico. 3.6. Fuentes Electronicas: Cableado y conectores. Para poder intercomunicar los distintos elementos de audio disponemos de varios conectores. Los conectores digitales permiten que, si los dos extremos trabajan en digital, no haya perdidas en una inutil conversion a analogico y despues a digital, o, en la propia comunicacion, sean como sean los extremos, pues la senyal digital es menos sensible a errores e interferencias. Aqui teneis una lista de los conectores analogicos y digitales mas comunes y sus caracteristicas: Conectores analogicos Jack 6mm: Suele usarse en la toma de ariculares de equipos HIFI. Tambien es el que se usa para conectar una guitarra electrica al amplificador. Como tiene mas zona de contacto suele dar mayor calidad que el de 3.5mm. Jack 3.5mm: Es el conector al que la mayoria de usuarios de a pie esta acostumbrado. El tipico conector para los auriculares de los equipos portatiles (walkmans). Jack 2mm: No se suele utilizar para audio aunque, si donde sus pequenyas dimensiones lo recomiendan. RCA: Tiene un conector independiente por cada canal. El conector rojo es para el canal derecho y el blanco, para el izquierdo. DIN: Es el cable mas usado en microfonia profesional. Conectores digitales

A-DAT

Se utilizaba para conectar digitalmente unidades de A-DAT. El conector y el cable de fibra de vidrio siguen el estandard Toslink. Tienen un mecanismo interno de sincronismo a nivel de byte. Traspasa 8 canales de audio por cable. Se pueden juntar varios canales para obtener uno de calidad superior. SP-DIF Pendiente Desarrolado por Sony y Phillips. Puede utilizar cables opticos de fibra de vidrio o bien cable coaxial. El conector y el cable de fibra de vidrio siguen el estandard Toslink. T-DIF Pendiente Desarrolado por Tascam. AES-EBU Estandard europeo de transmision de audio digital. (EBU-IEC958) Esta pensado para comunicar los elementos digitales de un equipo de HIFI cuando no hay necesidad de pasar el audio a formato analogico. Presente en la mayoria de unidades de CD-ROM, DVD y targetas de sonido, de calidad media, fabricadas en los ultimos aos. USB Es un nuevo estandard de comunicacion serie en el PC. Permite conectar multiples elementos en un solo conector del PC. Como es nuevo aun no existen demasiados perifericos de audio que lo soporten (en 1998). SCSI Bus paralelo para conectar perifericos a un ordenador (Discos duros, scanners, ZIP's...) Algunos samplers lo utilizan para hacer transferencias de samples hacia el PC a alta velocidad. Falta colocar fotos de cada conector. 3.7. Microfonia y toma al aire. Microfonos Dinamicos Los microfonos dinamicos tienen una respuesta frecuencial tal que es plana para la mayoria de frecuencias audibles y en las frecuencias mas elevadas, en torno a los 5KHz, tiene un pico de respuesta y decrece de golpe. Este tipo de microfono tiene varias ventajas. :) Es mas barato. :) Aguanta altas presiones -> Lo puedes usar para baterias y demas. :) Augmenta los agudos, lo cual es ideal para resaltar la voz solista.

Por supuesto no es un microfono muy sensible, ni tampoco tiene una respuesta frecuencial totalmente plana. Asi que para aplicaciones muy puristas utilizaremos casi siempre un microfono de condensador. Microfonos de Condensador Los microfonos de condensador tienen una repuesta frecuencial totalmente plana lo cual les da una fidelidad casi absoluta. Lo malo que tienen es que son muy caros y que no soportan presiones por encima de los 120 dB. Hay que utilizarlos en entornos en los que los picos y las saturaciones esten controlados. Otros microfonos, mas informacion sobre microfonia Tambien existen otras tecnologias de microfono mas especificas: piezoelectricos, de carbon... pero estan fuera del alcance de este manual. Se puede encontrar mucha mas informacion sobre microfonia en la web http://www.salleurl.edu/~is04069/Modders/Docs/www.recording.hostway.com 3.8. Extraccion digital de CD-Audio. La mayoria de unidades CD-ROM disponen de un modo de extraccion directa de audio digital. Este modo permite traspasar al ordenador el audio digital como si fueran bytes de CD-ROM de datos. Este modo lo soportan la mayoria de unidades, excepto algunas Mitsumi antiguas, ya que esta marca, al principio no quiso habilitar este modo de funcionamiento para evitar la posible pirateria. De todas formas, este modo de extraccion tiene un pequeo inconveniente. Los bytes de un CD-Audio se direccionan mediante un codigo SMPTE de 24 frames por segundo. Si haces las divisiones correspondientes veras que cada frame, agrupa a la vez un monton de bytes. Esto implica que no podemos saber, exactamente, qual es nuestra posicion, por lo que a veces se pierde la sincronia y como resultado la grabacion hace un pequeo salto hacia adelante o hacia atras. Los programas de extraccion digital, implementan varios algorismos para corregir estos errores. La calidad de los programas de extraccion se basa principalmente en la eficiencia de dichos algorismos de correccion. Algunos de estos programas son: CD-Copy, Digital Audio Copy, Exact Audio Copy... Los CD comerciales que contienen samples ya realizados, suelen estar pensados para utilizarse un reproductor de CD-Audio convencional conectado analogicamente al sampler. Si no estuvieran pensados de esta forma podrian venir directamente en formato WAV o AIFF que para trabajar en el ordenador es mucho mas practico y no haria falta utilizar un extractor digital. Ademas tenemos un problema aadido en estos CD's: Los samples grabados en un CD-Audio estan agrupados juntos en tracks, con una separacion de uno o dos

segundos entre sample y sample. Es tediosa la tarea de separar los samples una vez extraida una pista a WAV o de extraer sample a sample directamente. Existe software que se dedica a identificar los intervalos en blanco y particionar el WAV resultante en varios. Problemas con los drivers: los drivers ASPI para WIN95 ya no dan tantos problemas CD de musica 4. Edicion basica Todos los programas de edicion de ondas, desde los mas simples que suelen venir con la targeta de audio, a los mas sofisticados, permiten una serie de operaciones de edicion: Copy: Guarda la porcion de audio seleccionada para un pegado posterior, sin eliminarla. Cut: Corta la porcion de audio seleccionada para un pegado posterior. Paste: Inserta, en la posicion indicada, la porcion de la onda anteriormente cortada o copiada. Delete: Elimina la porcion de audio seleccionada Insert Silence: Inserta espacio en blanco en un punto indicado Trim: Elimina la parte de audio no seleccionada 5. Efectos y mejora de calidad 5.1. Efectos basados en retardo Los efectos utilizan se basan en aplicar un cierto retardo (delay en ingles) a una porcion de la seal que despues mezclan con la original de una manera determinada. La mayoria de estos tambien permiten hacer que parte de la salida vuelva a entrar parcialmente en el proceso produciendo lo que se denomina realimentacion (feedback en ingles) . Segun el grado de realimentacion, la salida puede llegar a saturarse por lo que no conviene incrementarla mucho. 5.1.1. Eco El eco es un efecto sonoro que se produce cuando un sonido rebota contra una superficie lejana y llega por duplicado al receptor con un cierto retardo. Este efecto se puede reproducir artificialmente, mezclando el sonido original consigo mismo pero retardado y levemente atenuado. Se modela facilmente, configurando para cada repeticion, el retardo y la atenuacion.

Ojo con este y otros efectos de retardo, a menudo conviene, tener un poco de silencio al final del sonido original para que el efecto no quede interrumpido de forma brusca pues el sample resultante suele ser mas largo que el original. No todos los editores te aaden el espacio que falta. 5.1.2. Reverberacion Una reverberacion no es mas que un eco con un retardo tan pequeo que hace que las distintas repeticiones sean apenas perceptibles. Las reverberaciones se dan de forma natural en los sitios cerrados por la reflexion en las paredes. Cada recinto tiene una reverberacion caracteristica dependiendo de su geometria y de la absorcion de los materiales que hay en el. La reverberacion es un recurso muy valioso para dar entidad a un sonido. Lo utilizan la mayoria de equipos en las fases finales de procesado. Es normal el uso de equipos reverberantes en los estudios de grabacion pues generalmente son pequeos y no tienen la reverberacion que se desearia. Para el eco y la reverberacion, los parametros son similares, pero para hacer una reverberacion realista habria que configurar muchos otros parametros a parte del retardo y de las atenuaciones, pues generalmente, las superficies no absorben todas las frecuencias por igual y se tiene que hacer una atenuacion segun la frecuencia. Al ser tantos los parametros, frecuentemente los programas de edicion ya tienen algunas configuraciones hechas de entrada para simular la reverberacion de una catedral, un pabellon... 5.1.3. Flanging y Phasing El Flanging consiste en mezclar la seal con una copia retardada levemente pero con un retardo variable en el tiempo. Los parmetros a configurar son como mnimo el porcentaje de seal retardada, el margen de variacin del retardo (entre varios unidades y varias decenas de milisegundos) , la frecuencia de variacin de este retardo (normalmente entre algunas dcimas y varios hertzios), y el porcentaje de realimentacin. Si el porcentaje de realimentacion es muy bajo, el efecto conseguido es mas discreto y se suele llamar phasing que se utiliza a menudo en los pedales de guitarra. El sonido obtenido es bastante electronico, parecido al que obtenian de forma casera los musicos de la psicodelia, retardando de forma variable un magnetofono respecto a otro.

5.1.4. Chorus El Chorus es un efecto que pretende hacer que un solo intrumento suene como varios a la vez. Se consigue mezclando la onda con ella misma varias veces pero retardada y desafinada levemente. Se usa mucho para dar presencia a las voces de los cantantes. Se puede configurar el numero de instancias y el retardo, atenuacion y afinacion relativa de cada una, aunque generalmente los editores ya tienen configurados estos parametros para que suene bien. Este efecto suena mas bien discreto por lo que se suele ampliar con realimentacion y modulacion en amplitud de las voces. 5.2. Procesado de dominio dinamico 5.2.1. Distorsion en el dominio dinamico El dominio dinamico de una seal equivale a la serie de valores que adopta esta. Por ejemplo, en una seal digital de 8 bits el dominio dinamico maximo podria ser de 127 a -126 pero un sonido en concreto podria ir simplemente de 20 a -20. Una amplificacion, por ejemplo, implica un cambio en el dominio de la seal, si amplificamos la seal anterior con un factor de dos, pasariamos a un dominio dinamico de 40 a -40. Lo que pasa en la amplificacion es que para cada valor, de la entrada tenemos un valor de salida que es siempre proporcional sigue la siguiente relacion entrada/salida:

Cuando la relacion entre valor de entrada y valor de salida no es constante para todos los niveles de la seal diremos que se esta produciendo una distorsion en el dominio dinamico.

La mayoria de amplificadores (y aparatos de digitalizacion) distorsionan cuando llegan a su saturacion (no dan mas de si) y se considera generalmente un elemento nocivo para el sonido. Aun asi, a veces se utiliza como elemento creativo, como la distorsion que producen los amplificadores para guitarra electrica.

Algunas herramientas informaticas, como el CoolEdit y el GoldWave permiten practicar distorsiones mediante la especificacion grafica de su funcion de transferencia. Lo que se explica mas adelante son diversos tipos de distorsion en el dominio dinamico (Compresores, expansores, puertas de ruido..) que se utilizan para algunos casos concretos. Debido a su uso frecuente, los programas de edicion suelen permitir aplicarlas directamente, especificando los parametros que las definen. 5.2.2. Compresores y limitadores La compresion es un control de nivel automatizado. Basicamente lo que hace es reducir el nivel de sonido cuando este es muy alto y amplificarlo cuando es muy bajo. Normalmente lo hace siguiendo una relacion entrada salida como sigue:

Mediante la compresion se consigue un nivel de grabacion uniforme, ademas de evitar las distorsiones debidas a saturacion. Manejado correctamente, da a la grabacion un aire de profesionalidad. Es del todo aconsejable trabajando con voz pues le da una candencia muy maja, asi, se utiliza mucho en radiodifusion y en estudios de grabacion cuando trabajan con cantantes. Pero, como se maneja un compresor? Veamos primero los controles que suelen llevar los compresores analogicos y despues lo aplicaremos al audio digita.

Threshold: Es el nivel de sonido donde empieza la compresion. Mas abajo de este nivel, el sonido no se modifica. Ratio: La relacion entre los dB's que sobrepasan el threshold y los que lo sobrepasaran en la salida. Una relacion de 4:1 significa que para cada 4 dB que se sobrepase el threshold en la salida solo se subira un dB. Una relacion de 1:1 elimina la compresion y una relacion infinita convierte el compresor en limitador. Esto es: recorta la seal a partir de el nivel dado. Output: Debido a la compresion, se reduce el dominio dinamico de la seal (Gama de niveles que se adoptan). Este control permite amplificar la salida del compresor para aprovechar el dominio completo que se puede adoptar.

Este ultimo control se ve mas claramente si tenemos en cuenta el caso del audio digital. Supongamos que la senyal se codifica con 8 bits lo que da niveles de 127 a -126 la senyal es simetrica asi que en lo que sigue tendremos solo en cuenta la parte positiva de 0 a 127. Imaginemos que ponemos el threshold a 107 y una relacion 1:2 (no en dB sino en niveles de cuantizacion). El nivel maximo que adoptaria la salida del compresor seria 117 lo que nos deja 10 niveles por arriba y 10 por abajo sin utilizar. La amplificacion ha de ser tal que maximize el nivel 117 a 127 para aprovechar mejor el dominio dinamico. Frecuentemente existen otros controles que permiten hacer ajustes mas sutiles de la forma en que se aplica la compresion.

Ataque: Es un retardo que se le puede poner a la compresion para que los ataques de las notas sigan pareciendo ataques. Relajacion: Es un retardo en la desactivacion de la compresion una vez se ha bajado del nivel de threshold. Sirve para reducir el Breathing que hace que se oiga ruido de fondo en las pausas si el threshold esta muy bajo y la ratio muy alta. Codo suave: El codo es la parte de la funcion de transferencia que separa la zona de compresion de la zona sin compresion que normalmente tiene forma de arista. Si activamos el codo suave, el cambio de ratio entrada/salida a partir del threshold sera progresivo y no inmediato, de forma que la compresion no suena tan abrupta. Compresion RMS: Un compresor en modo RMS ira adaptando automaticamente sus parametros segun varien las caracteristicas de la entrada. Da una salida mucho mas uniforme pero puede ser sensible a picos, por lo que solo es aconsejable para masterizacion o situaciones en la que los picos de senyal estan controlados.

6.2.3. Expansion y Noise Gating Un expansor tiene la fuhcion inversa a un compresor. Amplifica los niveles altos y disminuye los niveles bajos.

Es un efecto que se suele utilizar para hacer sonar una guitarra, bajo o bateria de forma mas seca y contundente. La mayoria de parametros que se configuraban en la compresion se pueden apliar en la expansion, solo que, en vez, de reducir el nivel de los valores por encima del threshold, como hace el compresor, reduce el nivel de los valores por debajo, y por tanto el ratio se refiere a la parte por debajo del threshold. Las puertas de ruido son expansores en los que la disminucion de nivel por debajo del threshold es total. Sirven para reducir el ruido que se produce en los intervalos de silencio.

El principal inconveniente de esta funcion de transferencia es que un desvanecimiento gradual de una nota al pasar por una puerta de sonido acabaria bruscamente cuando llegara por debajo del nivel de threshold. Esto se puede arreglar ajustando diversos parametros:

Release: Controla el retardo que se produce cuando se pasa debajo del valor de threshold antes de activar la puerta. Histieresis: Es un nivel de tolerancia por encima y por debajo del threshold dentro del cual se retarda la activacion o la desactivacion de la puerta.

Se dice que esta funcion de transferencia elimina el ruido pues se encarga de enmudecer las seales pequeas que son las que contienen mayor relacion seal ruido (Ver secciones anteriores) En las seales de nivel alto el ruido es en proporcion mas pequeo y en consequencia, menos percebible. Las puertas de ruido se suelen utilizar con niveles de threshold mas bien bajos pero tambien se usan como efecto con niveles altos. 5.3. Filtrado frecuencial Pendiente 6. Preparacion

Una vez obtenidos y tratados los samples, no se suelen utilizar tal cual, para hacer musica. Todos los procesos anteriores eran aplicables a cualquier aplicacion de audio como, por ejemplo, . Los procesos que se explican a continuacion van dirigidos mas concretamente a la programacion de instrumentos musicales: Optimizar el espacio en memoria, afinar, crear bucles y envolventes, montar instrumentos complejos con mas de un sample... Parte de estas tecnicas ya se ven por encima en el tutorial de Trackers. Aqui se pretende detallar mas dichas tecnicas y ampliar horizontes mas alla de los trackers. 6.1. Optimizar el uso de la memoria Uno de las principales limitaciones de la tecnica del sampling es la del espacio que albergan los samples en la memoria, en el disco duro o donde sea que se almacenen. Frecuentemente es necesario limitar ese espacio para lo cual se pueden aplicar diversos procedimientos. 6.1.1. Recorte, y eliminacion de silencios Frecuentemente, cuando grabamos un sample, grabamos gran cantidad de silencio, por delante y por detras, es conveniente recortar este silencio. La funcion del editor que hace esto es Trim. Tambien podemos recortar algo del sonido, cuando se desvanece la nota. Esta opcion ya quita algo de calidad al sample pero en muchos casos es mas que aceptable. A veces, ya sea por recorte o por que estaba grabado asi, queda un corte brusco indeseado al inicio o al final del sample. Para eliminarlo lo mejor es hacer un fade out al final o un fade in al inicio, aunque sean muy cortos, eliminan el click. 6.1.2. Resampleado Otra opcion es rebajar la calidad del sample. Resamplear a una frecuencia de muestreo inferior eliminara algunas frecuencias y podra dar problemas a la hora de hacer el pitch shifting pero el resultado puede ser muy aceptable sobretodo en bajos, bombos e instrumentos con pocos armonicos agudos. Si estas muy limitado tambien puedes considerar bajar los bits de profundidad o otro parametro de calidad. Hace falta un poco de criterio para ver en que sitios bajar la calidad tendra menos consecuencias. 6.1.3. Compresion espacial

La compresion espacial es la solucion perfecta pero necesita ser soportada por el soft o el hard con el que trabajamos. La compresion sin perdidas es la ideal para obtener mayor calidad, pero si nos sigue premiando el espacio a veces vale la pena utilizar compresion con perdida. Vamos a clasificar los metodos de compresion en cuatro grandes grupos desde el punto de vista del audio.

Compresion sin perdidas de uso general: Frecuentes en entornos informaticos pero no siempre acertadas debido a que no aprovecha las cualidades del audio. Compresion sin perdidas orientadas a audio Se basan en las caracteristicas de la seales de audio. Un ejemplo es la codificacion diferencial de la que ya se hablo, que se basa en la continuidad de la seal de audio. Compresion perceptual: Es la que se utilizan MPEG y el YamahaVQ system. Eliminan aquellas partes del sonido que el oido realmente no percibe. Compresion de voz: Se basa en propiedades del tracto vocal. Puede obtener relaciones de compresion impresionantes pero solo obtiene calidad aceptable trabajando con voz.

6.2. Afinacion (Tunning) Los samplers tienen la capacidad de variar el tono de las muestras para obtener diversas notas a partir de una sola nota grabada. Esto lo hacen reproducciendo la muestra mas rapida para tonos agudos o mas lenta para tonos graves. Tambien hay algunos algoritmos mas o menos sofisticados para hacer time streeching que consiguen variar el tono de la muestra sin variar su duracion. Sea cual sea la tecnica, el sampler necesita tener una referencia que ligue una nota y una frecuencia de reproduccion para la muestra, para calcular el resto de notas. Afinar un sample es controlar esta referencia. Razones por las que variar la afinacion de un sample: Afinado funcional (asociacion a nota, o igualar frecuencia de grabacion y reproduccion) Afinado creativo (desnaturalizar el sonido) Afinado para sincronizar (ajustar a los BPM's el tiempo que dura una secuencia) A continuacion, comentamos como afinar diversos tipos de samples: Manten siempre los samples melodicos afinados de forma que cuando toques un C4 suene un C4 o como minimo un C de otra octava. Aunque, en un principio,

usar un sample desafinado pueda sonarte bien como un elemento de discordancia, a la que aades canales, el resultado da mas sensacion de mala calidad que de otra cosa. Es util saber que de octava a octava la frecuencia de reproduccion se dobla, y que, para cada semitono, como hay doce en una octava, se multiplica o divide por log12(2)=1,059463094359 Los samples obtenidos de instrumentos melodicos, por lo general, los ajustes de tono necesarios son de semitonos enteros, pues los instrumentos que grabamos suelen estar afinados solo que al igual tocamos una nota diferente a la que tomamos de referencia. Los sonidos realistas y efectos que tengan que sonar como en un principio se grabo, afinalos para que todos suenen en su tono original para una misma nota. Por ejemplo que suenen todos naturales en C4. Con esto te evitas ir buscando cual es la nota que suena tal cual se grabo, siempre la C4 es la natural. Depende del uso ke le des a los samples de percusion, los afinaras como los samples melodicos o lo haras como los sonidos realistas. Las secuencias de bateria, es bueno afinarlos para que suenen a un tempo determinado con una determinada nota. De forma que, si juntas varios y los tocas con la misma nota, suenen sincronizados. Hay gente que prefiere trabajar con varios tempos normalizados y afina los loops al tempo normalizado que mas se acerque, para no desnaturalizar demasiado los sonidos. De todas formas, conviene tener en algun sitio apuntado, tanto el tempo al cual esta afinado el loop como el tempo original para hacerte una idea de hasta que punto se desnaturalizara el sample. Cuando lo vayas a usar solo tienes que variar otra vez la frecuencia Como ajustar el tempo de un loop de bateria ajustando su frecuencia de reproduccion?

Si tienes el tempo original:

TempoFinal SampleRateFinal = SampleRateOriginal * ------------- TempoOriginal

Si no lo tienes solo tiene que saber:

SampleRateOriginal TempoOriginal = 60 * ------------------

SamplesPorBeat

Para reformular la primera formula de la siguiente forma:

SamplesPorBeat * TempoFinal SampleRateFinal = --------------------------- 60

Los samples por beat se pueden averiguar restando la posicion de los localizadores de un programa de edicion de ondas.

6.3. Bucles (Loops) Pendiente: Redactar y completar (Ver el documento sobre Trackers) 6.3.1. Concepto La longitud de la nota suele controlarse controlando el tiempo que el sample est sonando. Si se intentan hacer notas demasiado largas, el sample se acabar antes de tiempo. Es ms, si se opta por agotar el tiempo del sample, tendremos que, para tonos ms agudos, la duracin de ste ser menor que para tonos muy graves pues en los agudos se reproducira ms rpido. Cuando uno no se puede permitir grabar un sample indeterminadamente largo se recurre a los loops. Un loop es la reproduccin repetitiva de una regin de la muestra que permite hacerla durar el tiempo que se desee. De esta forma obtenemos ms plasticidad en la duracin de la nota ahorrando espacio. Un loop tiene sentido en los intrumentos en los que se llega a una regin estable en que el sonido se vuelve muy similar de forma que no se note la repeticion. Los organos y las cuerdas son instrumentos tpicos que se benefician a menudo de esta tcnica. 6.3.2. Ajuste del bucle Para establecer un loop, hay que determinar los puntos de inicio y final de este. Ello ha de hacerse de forma muy cuidada para evitar los clicks mantener una sensacin de continuidad. Para evitar los clicks hay que hacer que los samples en los puntos de loop sean continuos y tengan la misma pendiente.

TODO: Grafiqueta condiciones loop En el tutorial sobre Trackers, puedes seguir un ejemplo de ajuste de loops. A parte de los clicks, tambin iteresa mantener una sensacin de continuidad que queda rota si hay alguna caracterstica del sonido que varia o oscila con el tiempo. Estas caractersticas pueden ser la amplificacin, la distribucin de frecuencias, el timbre del sonido... La clave esta en localizar las oscilaciones y hacerlas coincidir con el loop, y en compensar las variaciones progresivas con un editor de sonido. De todas formas, es comun que haya varios parmetros que oscilen y no sea posible encontrar un ciclo valido. Es lo que suele pasar con los acordes: la superposicion de frecuencias crea oscilaciones irregulares en el sample que cuesta mucho adaptar a un loop. 6.3.3. Direccion Los bucles, al principio, siempre se reproducan para adelante. Es decir, cuando se llegaba al final de la regin definida como bucle, se volva al inicio de dicha regin y otra vez a empezar. Muchos samplers actuales permiten controlar la direccin en la que se reproduce el loop de forma que podemos configurar el loop para que valla siempre para adelante o que valla alternativamente para adelante y para atras. Este otro tipo de bucle (llamado Ping pong loop en contraposicin al Forward Loop) permite que en el cambio de direccin est asegurada de por s la continuidad al ser la onda simtrica a la que se acaba de reproducir. Para evitar totalmente el click, solo hay que hacer que en los puntos de loop, la pendiente sea plana para que sea la misma tanto a la ida como a la vuelta. TODO: Grafiqueta condiciones loop ping pong Cabe decir que al reproducir la onda hacia atrs no siempre se obtiene un sonido similar y, a menudo, suena bastante raro. Esto a veces puede ser un recurso creativo ms para el msico, as que algunos samplers permiten tambin el backward loop, que, a nivel de implementacin en la mquina, no cuesta mucho ms. 6.3.4. Pulsacin y postpulsacin 6.3.5. Otras consideraciones Loops: - Loop detuning (debido a loops cortos) - Durante cuanto tiempo

- Tecnikas de autoloop: Buscar zeros, timbres, pendientes... Suffle - Forzado de loop 6.4. Envolventes y ADSR's Pendiente (Ver el documento sobre Trackers) 6.5. Multisamples. Regiones 6.5.1. Limitaciones con un unico sample por instrumento. Pendiente: Colocar las graficas de desplazamiento de tono La tecnica del desplazamiento de tono que se usa en sampling (para obtener todos los tonos de un instrumento a partir de una sola grabacion), pierde en veracidad por una serie de inconvenientes:

Los sonidos, a medida que vamos subiendo el tono, se hacen mas cortos. A veces, se puede controlar con envolventes actuando sobre un bucle, pero esto no es siempre posible si no se puede hacer un bucle aceptable en el instrumento. En general se desnaturaliza el sonido por perdida de harmonicos por arriba o por abajo. Dichos armonicos, se pierden debido a que solo se samplean una gama de frecuencias, si subimos el tono, faltan las frecuencias que llenarian la parte de abajo; si lo bajamos, faltan las frecuencias que llenarian la parte alta.

Con tonos muy graves aparecen frecuencias fantasma (aliasing) debido a que, al distanciar las muestras contiguas, no se sabe que muestras insertar en medio. Por lo general, se interpola segun una funcion matematica (linial, cuadratica, cubica o spline) con lo que se reduce el efecto pero no se anula. Dichas frecuencias fantasma serian las que llenarian la parte de frecuencias altas que queda vacia al bajar el tono y no tendrian mucho que ver con las del instrumento original.

Hay instrumentos que generan una componente del sonido percusiva y otra melodica. Si desplazamos de tono la componente percusiva, a la vez que la melodica, el instrumento pierde naturalidad. Seria el caso del ruido que hacen las teclas de un piano al subir o bajar, o la baqueta de un xilofono. Concretamente en el xilofono y en otros instrumentos de la seccion de percusion melodica, este efecto se hace muy molesto. El desplazamiento de tono tambien pierde naturalidad en otros aspectos, mas sutiles pero que en conjunto se hacen notar.

La solucion a estos problemas pasa por no abusar del desplazamiento de tono y repartir, a lo largo de las octavas del instrumento, diversas grabaciones del instrumento con tonos diferentes. Para obtener la maxima calidad, se deberia utilizar una grabacion por tono, pero ello requeriria mucho espacio por lo que, en la mayoria de casos basta con menos. 6.5.2. Regiones. La forma mas sencilla de combinar distintos samples para formar un instrumento complejo es definir lo que se suele llamar regiones. Es decir, una gama de notas consecutivas, en las que se toca un mismo sample.

Casi siempre interesa definir para cada region, en que tono se empieza a tocar el sample. Si es un sample melodico, los siguientes tonos de la region seran los consecutivos y la mayoria de samplers asi lo configuran. Pero existen otras aplicaciones muy practicas de las regiones. Aquellas que precisan lanzar agilmente, sin tener que cambiar de instrumento, un grupo de sonidos diferentes que no requieren desplazamiento de tono. Por ejemplo:

Los instrumentos percusivos de una bateria (kit de percusion) Una serie de efectos o sonidos naturales Sequencias musicales pregrabadas Estrofas de voz de una cancion

En estos casos, nos interesa definir las regiones con un solo tono, que sera el tono natural, para cualquier nota dentro de la region. La utilidad de esta tecnica reside

en el hecho de que podemos lanzar uno o otro sample simplemente cambiando de nota. 6.5.3. Capas (Layering). Volviendo a los instrumentos melodicos, la definicion de regiones aun tiene algunos defectos que a veces hacen que los instrumentos no suenen veridicos. Si tocamos una progresion de notas, en el momento que acaba una region y empieza otra, a menudo se nota demasiado el cambio de sample. Una solucion algo costosa (en cuanto a memoria de nuestro sampler) es insertar mas regiones en medio. Si no disponemos de sonidos grabados para ello, una buena solucion suele ser generarlos nosotros a partir de mezclas progresivas de ambos sonidos. Es lo que se llama un fundido progresivo de samples. Creamos una serie de regiones intermedias y, a cada nueva region, le asignamos un nuevo sample resultado de mezclar los dos samples originales, con mas carga de uno o otro segun lo cerca que este de cada region original. Como siempre, el usar mas sonidos grabados por instrumento ocupa mucha mas memoria. Por suerte, algunos samplers, utilizan otra tecnica, que, entre otras cosas nos soluciona esto. Dicha tecnica se llama layering y se basa en definir para cada instrumento una serie de capas. Por cada capa, puede sonar simultaneamente un sample para la misma nota. Si tenemos 3 capas definidas, quiere decir que cuando apretemos una tecla, sonaran hasta 3 samples a la vez. Cada capa define sus propias regiones, cada region su sample. Como dentro de las regiones se nos permite definir los volumenes de cada nota, podemos hacer el fundido de forma automatica sin usar samples adicionales. (Pitch CrossFadding) Claro que esta tecnica tambien tiene sus costes. Si nuestro sampler tiene, por ejemplo, una polifonia de 18 notas, (permite hacer sonar 18 notas a la vez), por cada nota que toquemos simultaneamente de un instrumento de 3 capas, se consumiran 3 notas de polifonia. En vez de 18 notas podremos tocar solo 6. Otras aplicaciones del layering, a parte del fundido de samples por tono, es la simulacion de instrumentos con una parte melodica que usa desplazamiento de tono y otra percusiva que no lo usa. Era una de las cosas que, como ya comentamos, hacian que algunos instrumentos de percusion melodica, como el xilofono, sonasen irreales cuando desplazabamos el tono de ambas componentes a la vez. 6.5.3. Conmutado y fundido por velocidad. A pesar de todos estos artificios, los instrumentos reales, tienen mucho mas juego del que puedan dar todas estas tecnicas. Segun como y donde pulses una cuerda

de una guitarra sonara muy distinta, un instrumento de viento abarca miles de timbres segun la forma de soplar del instrumentista. Todos estos timbres diferentes, se pueden dar para una misma nota, y, con las tecnicas que conocemos hasta ahora, solo podiamos diferenciar sonidos entre notas diferentes. Como podemos simular los cambios de timbre segun la forma de tocar? Una forma sencilla de diferenciar distintos timbres es la velocidad, es decir, la fuerza con la que se toca la nota. A menudo los samplers traducen la velocidad al volumen con el que se reproduce el sonido. Pero, si tienes a mano cualquier instrumento no electronico y lo haces sonar flojo y fuerte, comprovaras que no solo varia el volumen, sino tambien el propio sonido. Esto se puede simular creando una capa para cada sonido diferente y activando una o otra para cada gama de valores de velocidad. Es lo que se denomina Conmutado por velocidad. (Velocity Switching) Por ejemplo, queremos hacer un saxo, que cuando pase de una cierta velocidad suene como roto, como hacen los saxos de verdad cuando das un soplido repentino. Para ello, haremos una capa con un saxo 'normal' que sonara solo para velocidades MIDI del 1 al 50. Despues definiremos otra capa para velocidades 51 a 63 que contendra un sondido de saxo 'roto'. A veces, el conmutado de samples por velocidad es demasiado brusco, y tenemos que buscar soluciones, para hacer el cambio mas sutil, muy parecidas a las que teneniamos en la division en regiones: Podemos insertar capas con mezclas de los dos samples, o podemos hacer un fundido progresivo de dos capas segun la velocidad (Velocity CrossFadding). Tambien nos surgen los mismos inconvenientes: Insertar capas con samples mezclados ocupa mas espacio y las tecnicas de fundido nos quitan polifonia. En principio, se utiliza la velocidad, pues es un parametro que la mayoria de instrumentos MIDI profesionales envian de por si. Para hacer cosas mas realistas, se hacen servir otros parametros. Pero piensa que solo los samplers mas caros consiguen llegar a un punto de similitud aceptable, y con instrumentos que requieren horas y horas de programacion que dificilmente podra dedicar el musico comun para crear los suyos propios. Aunque hay quien se los curra aunque solo sea para hacer demos de los samplers que vende. Siempre es un compromiso entre la calidad que queremos obtener y los recursos de tiempo y de maquina que tengamos (memoria, polifonia...). 6.5.4. Consejos para instrumentos multisample. Aqui teneis algunos consejos a la hora de hacer multila

Aplicar diferentes efectos y filtros a las capas para que no se emborronen Asignar diferentes capas a cada momento de la nota (attack, sustain, release...) 7. Trucos y consejos - Reordena y conoce tu coleccion de samples. Aunque sean tuyos cuando tienes muchos... - Haz backups. Seguro que has oido a gente quejarse de haver perdido su libreria de samples. - Montate plantillas vacias de instrumento multisample para ahorrar tiempo. - Si vas a loopear, no utilizes nunca samples en estereo, son imposibles. - Un sample de 'mala calidad' o poko realista no tiene por ke no ser creativo. - Utiliza equalizacion diferente para cada sample para que no se empotinguen en la mezcla. - Mezcla con la percusion un instrumento melodico. - Gana profundidad duplicando un sample, desafinando uno un poko, y repartiendolos en el panoramico - Da la vuelta a los samples. Se consiguen efectos sorprendentes. - Voces: Juntalas, tapando los espacios de cojer aire para crear desasosiego - Loops de bateria: Retarda, avanza, redispara, invierte, offsetea, mezcla... - Parte las secuencias de percusion y reordenalas aplicandoles diferentes filtros, efectos... - Simular grooves's: Intentar imitar loops de bateria que tengas en tu coleccion con programacion y ves aprendiendo de las diferencias. Apendice A: Conceptos basicos Este apendice contiene conceptos que, en el resto del libro se dan por sabidos y que se incluyen aunque sea en un apendice para que ningun lector, del nivel que sea, se quede perdido. A.1 Formas de onda Una forma de onda (wave form) es una representacion de la evolucion a lo largo del tiempo de un sonido, o mejor dicho, de las variaciones en la presion del aire que producen el sonido. La grafica siguiente es un ejemplo.

La misin de un microfono es generar una senyal elctrica con la misma forma de onda que las variaciones de presion que le llegan. La funcion del altavoz es la inversa: convertir la seal electrica en variaciones de presion moviendo su membrana. A.2 Espectro frecuencial y respuesta en frecuencia Cualquier sonido se puede descomponer como suma de infinidad de senyales sinosoidales de diferentes frecuencias. La distribucion de la intensidad segun las frecuencias se llama espectro frecuencial. En muchos programas informaticos se refieren a esto mismo con el termino analisis o transformada de Fourier La transformada de Fourier es la herramientas matematica que se utiliza para calcular el espectro a partir de la senyal en el tiempo. Todas las frecuencias de un sonido no se propagan de la misma forma por el medio, ni las reproduce igual un altavoz, ni las percibe igual un micro o el oido, ni las almacena igual un soporte. La respuesta frecuencial de algo se puede representar en un diagrama de Bode, que indica el grado de atenuacion, amplificacion o retraso de cada frecuencia. Seguro que lo has visto en la parte de atras de alguna cinta virgen de audio o en las especificaciones de un altavoz. A.3 Codificacion binaria La numeracion binaria es una forma de codificar los numeros segun una secuencia de unos y zeros. La numeracion convencional o decimal (de base 10) usa 10 digitos: del 0 al 9. Para contar contamos del 0 al 9 y, entonces, tenemos que usar un segundo digito para escribir el 10 i seguimos: 11 12... 99, 100, 101.... 999, 1000.... El sistema binario utiliza solo 2 digitos el 0 y el 1, asi que vamos a contar con ellos: 0, 1... i ahora? pues aadimos un uno al lado y empezamos de nuevo: 10, 11... otro uno 100, 101, 110, 111, 1000... Parece facil no? Para pasar de una base a otra, tenemos que tener en cuenta que cada digito tiene un peso asociado: En el sistema decimal que nosotros usamos, como la base es 10 el primer digito vale 100=1, el segundo 101=10, el tercero 102=100... Con las bases 2 i 16 funciona igual. Para tener una referencia las potencias de dos valen: 1, 2, 4, 8, 16, 32, 64, 128, 256, 512, 1024,,.

La ventaja de la codificacion binaria es que los unos y ceros son facilmente almacenables segun la presencia o la ausencia de algo: Carga electrica (memorias RAM), magnetismo (discos duros) o agujeros (CD). Bibliografia, Links y Referencias Gua Monogfica JORDA, Sergi del Audio digital y MIDI Editorial Anaya

Alesis Nanocompressor Tutorial Audio efects Mike Currington mailto:curring@ferndown.ate.slb.com SampleNet Richard Wentk Agradecimientos A Sergi Jorda por cederme desinteresadamente varios capitulos de su libro. A Jordi Alemany de Adagio S.A. por refrescarme algunos aspectos de la historia de la produccion musical y por poner tanto interes en nuestro curso. Manual realizado por Vokimon Otros Doctoriales / MoDDeR's / Els BoCHoS del SHaRe / Can Vokimon version FAQ online